课外天地 李树青学习天地信息检索原理课件 → 哈工大讯飞联合实验室发布中文阅读理解数据集


  共有20063人关注过本帖树形打印复制链接

主题:哈工大讯飞联合实验室发布中文阅读理解数据集

帅哥哟,离线,有人找我吗?
admin
  1楼 博客 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信 管理员
等级:管理员 帖子:1942 积分:26670 威望:0 精华:34 注册:2003/12/30 16:34:32
哈工大讯飞联合实验室发布中文阅读理解数据集  发帖心情 Post By:2016/7/19 15:27:40 [只看该作者]

2016年7月18日,哈工大讯飞联合实验室(HFL)发布填空型中文阅读理解数据集,其中包括《人民日报》新闻数据集和“儿童读物”数据集(HFL-RC: People Daily and CFT dataset)。
 
在英文阅读理解方面,已有Google DeepMind CNN/Daily Mail数据集,Facebook CBTest数据集,但一直缺少中文阅读理解数据集。此次,HFL发布的数据集不但填补了中文阅读理解的空白,而且与上述两个英文数据集不同,在HFL发布的“儿童读物”数据集中还包含了人工问题,人工问题比自动构造的问题更难回答,这为阅读理解的研究提出了新的挑战。
 
此外,他们还设计了一种简单有效的神经网络来解决填空型阅读理解问题,并获得了良好的效果。
哈工大讯飞联合实验室(HFL)发力研究“阅读理解”这个备受业界关注的人工智能难题,相关成果将陆续发布。


论文已发布在arXiv:网页链接
数据集地址:网页链接

 

[此贴子已经被作者于2016-07-19 15:28:06编辑过]

 回到顶部