当前位置:资讯 > 社会 > 正文
焦点信息:国内的专业语料库相较国外实在太少,像arXiv这样的论文资源库,我们真的比较缺乏
2023-04-08 19:40:56 来源: guan_16239358472394


【资料图】

【本文来自《谷歌前CEO施密特反对暂停高级AI研发,“这只会让中国受益”》评论区,标题为小编添加】

雨蓝之伤大语言模型是需要天量需要资料去训练,但想更进一步,那就需要更多高质量的语言资料去喂食,同时需要更多的人工去标注引导纠错。在高质量语言资料方面,西方也不是足够的,甚至需要人工编辑提供。我们也不是一点机会都没有。

现在的强化学习确实支持AI根据自己生成的文本/信息进行学习,但这也得建立在AI能够生成较高质量文本的基础上。国内的专业语料库相较国外实在太少(两者去除糟粕以后),像国外的arXiv等论文资源库我们真的比较缺乏,本来知网能够对标这些学术搜索平台的,但现在的状况大家都清楚。

关键词:
责任编辑:zN_0854