【软考达人-回忆版】
随着深度学习的广泛应用,现代聊天机器人系统需要大规模的训练数据集才能达到其最佳 性能,而手动收集如此庞大的数据集需要耗费巨大的人力和时间成本。现欲开发一众包信息系统来辅助收集训练数据集,其主要功能是:
(1)用户管理。众包工作者提供角色和标识,并存储在用户表中。
(2)添加问题。在不同情况下接收来自众包工作者和管理员输入的问题:众包工作者输入问题 建议,管理员负责添加初始问题。将问题和问题类别分别进行存储。问题类别说明问题是由众包工作者还是管理员提供的。
(3)答复问题。众包工作者回答或拒绝系统随机展示的5个问题。答复流程是,如果回答问 题则提供答案,如果拒绝问题则提供拒绝原因,如果回答问题数不足5个,继续展示问题, 否则众包工作者提供问题建议。无论是回答还是拒绝,数据都存储在带有不同状态标记的答复表中。
(4)数据服务。根据其它训练平台的请求,为其提供问题、问题类别、回复的数据集。
现采用结构化方法对众包信息系统进行分析与设计,获得如图1所示的上下文数据流图和 图2所示的0层数据流图。
【问题3】 ( 4 分)
根 据 说 明 和 图 中 术 语 , 补 充 图 2 中 缺 失 的 数 据 流 及 其 起 点 和 终 点 。