文章标题
作者姓名
关键词
单位名称
检索
AI智能检索
学术期刊
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
按期刊分类
医药卫生
(24)
工程技术
(42)
数学与物理
(12)
经济与管理
(12)
人文社科
(44)
化学与材料
(9)
信息通讯
(10)
地球与环境
(25)
生命科学
(2)
首页
>
面向非任务型对话系统的人工标注中文数据集
DOI
:
,
PDF
下载:
37
浏览: 370
作者
:
李菁
;
张海松
;
宋彦
;
作者单位
:
腾讯AI
;
Lab
;
关键词
:
对话系统
;
人工标注
;
中文数据集
;
摘要:
该文针对非任务导向型对话的回复质量构建了一个大规模的人工标注中文数据集,该数据集包含了从社交媒体收集到的超过27 000个对话问题以及超过82 000个对话问题的回复①。为了产生高质量的标注数据,邀请了专业人员根据对话回复的相关性、连贯性、信息性、趣味性,以及是否潜在地具有让对话继续延续的特性进行标注,在标注中定义了一个五级评分方法,分别是:极差的、较差的、一般的、较好的、极好的。为了测试标注产生的数据集是否具有有效性和实用性,以对话回复选择为任务,在标注数据集上测试了多种无监督和有监督模型。实验结果表明,该数据集对于提升对话回复选择的质量有显著效果。
投稿
相关文章
自粘接流动树脂的研究进展
中医药治疗胃癌的分子机制及重塑免疫微环境的研究进展
智能化消防技术在老旧建筑安全保障中的应用
易经对数学的启示
一种预警性医用输液贴的设计与效果评价
学术共建
清华大学出版社
北大中文系
国家工程技术数字图书馆
维普网
万方数据库
版权所有 © 2025 世纪中文出版社
京ICP备2024086036号-2