语料数据库(数据集)是什么?

妙笔生花 语料处理 2年前浏览量:136

通俗的讲,语料数据库是人工智能训练一个模型所需要学习的物料,物料包括有文本,语音,图片,视频等物料。每个模型所需要的语料不一样,看代码功能情况而定。

例如妙笔生花文章生成器,最终的效果为自动生成原创文本文章,那我们所需的语料就是文本。那我们就需要人为的去搜索引擎或者其他平台进行文本的收集,然后这些所收集的文本就统称为语料库。