人民网
人民网>>经济·科技

人民网发布“语料社区” 助力构建高质量中文AI数据生态

2025年11月19日16:29 | 来源:人民网222
小字号

点击播报本文,约

人民网广州11月19日电 (陈键、李源)2025年是推进数字中国建设10周年。11月18日,人民网以“数智深融 共启新程”为主题,在广州市南沙区国际会展中心成功举办第二十届中国经济论坛平行论坛——2025数字经济大会。会上,人民网正式发布全新产品——人民网“语料社区”,旨在破解高质量中文语料不足与共享难等问题,为人工智能产业发展构建安全、开放的数据基石。

人民网“语料社区”上线发布。人民网记者 任峰涛摄

人民网“语料社区”上线发布。人民网记者 任峰涛摄

随着DeepSeek等技术创新推动智能体能力跃升,高质量知识语料已成为驱动AI产业发展的核心生产要素。越来越多的企业将自身知识库外挂至智能体,实现从“交付工具”到“交付结果”的跨越,极大提升了生产与运营效能。

然而,当前中文语料生态仍面临诸多挑战:垂直领域、地方特色等语料匮乏,形成“数据荒漠”;大量有价值的数据散落各方,成为“信息孤岛”;网络信息噪声与偏见充斥,带来内容安全风险。

人民网“语料社区”。(点击图片进入)

人民网“语料社区”。(点击图片进入)

作为党和国家在互联网领域的重要阵地,人民网依托“传播内容认知全国重点实验室”,构建了人工智能大模型内容安全测评体系,并基于党报党网权威内容与党和国家重要文献资源,建设了规模超过300T的“主流价值语料库”。该语料库涵盖3000多万篇基础语料、32万对问答语料及500多万对图文语料,已于今年8月入选国家数据局高质量数据集典型案例。

在此基础上,人民网以“开放协同、共建生态”为战略,正式推出人民网“语料社区”。语料“社区”有两个特点,首先它是语料的“厨房”,是一个共创的语料制作平台,其次它也是语料的“超市”,是一个共享的语料生态服务平台,从而实现语料的共创共享、开源协作与安全流转。

据悉,人民网将开放部分主流价值、主流文化、新闻事实等基础语料,免费提供语料制作“样板间”,并为政府、学术机构、企业高校提供定制开发与语料审核服务,助力构建专属、高质量的AI数据集。

“独行快,众行远”,人民网呼吁广大企业、研究者与开发者携手推进语料生态体系建设,共同筑牢人工智能未来发展的数据基石。

扫码咨询

扫码咨询

(责编:李源、吕骞)
关注公众号:人民网财经关注公众号:人民网财经

分享让更多人看到

推荐阅读
返回顶部