首页 > 资讯 > 统一建立数据标注集,避免AI企业重复标注浪费资源

统一建立数据标注集,避免AI企业重复标注浪费资源

导语:“各家公司花了大量精力采集数据,甚至花很多钱做标注,大量公司做了同样的事情,浪费大量资源。” 2018年11月14日,火箭办公创始人韩铮在第二届“风向标——中国创新创业先锋论坛”上表示,医疗领域出现很多公司重复标注,标注标准也不一样,BAT开放的有...

“各家公司花了大量精力采集数据,甚至花很多钱做标注,大量公司做了同样的事情,浪费大量资源。”

2018年11月14日,火箭办公创始人韩铮在第二届“风向标——中国创新创业先锋论坛”上表示,医疗领域出现很多公司重复标注,标注标准也不一样,BAT开放的有限数据集都是重复的。

现实中,解决一些具体问题,如低速无人驾驶、无人零售商店,数据量和数据标注并不够多,很多AI企业除了雇人以外,大部分钱都花在数据标注上。

韩铮建议,由国家牵头,基金扶持,重点大学和实验室来做国家更广阔范围的高质量数据标注集。数据集标注工作量大,大学实验室资金有限,单个实验室很难承担,国内政府牵头可能性更高一些,也会造福国内大量AI创业公司。

国内科研公司可以申请上传数据集,得到资金的补偿支持。自己标注好的数据不涉及敏感信息自愿上传,上传后有人使用可以获得分成。使用数据集的公司报备申请使用数据。不去重复美国数据集,而是建立更广阔多样、大型的、国家牵头的数据集。

这一建议得到现场科协副主席、书记处书记孟庆海的认同,他表示数据标注在双创平台可以做成众创众包模式,共建共享,避免大家重复劳动。

据悉,第二届“风向标——中国创新创业先锋论坛”由中国科协主办,中国科协科技传播中心承办,创头条、优客工场协办。

来源:创头条 查看原文
点赞0
收藏6
水草
水草
用户评论
游客
发布
©2021 版权所有 ICP许可证号 京ICP备15013664号-1
登录 注册
登录
完成注册

快捷登录

请激活账号

为了能正常使用网站的评论、编辑功能及以后陆续为用户提供的其他产品,请激活账号。

您的注册邮箱: 修改

重新发送激活邮件 进入我的邮箱

如果您没有收到激活邮件,请注意检查垃圾箱。