“AI核心数据集生态联盟”在上海成立-新华网
2025 11/29 09:29:37
来源:新华网

“AI核心数据集生态联盟”在上海成立

字体:

  新华网上海11月29日电(记者潘清)伴随人工智能大潮愈演愈烈,数据集作为大模型训练、推理和验证关键基础的重要性日益凸显。近日在上海举行的“2025全球数商大会”上,“AI核心数据集生态联盟”正式成立。

  “全链路数据治理赋能高质量数据集建设”主题论坛26日举行。此次论坛由领先的企业级AI数智基座平台提供商普元信息技术股份有限公司与中国信息通信研究院华东分院联合主办,邀请政、产、学、研、用各领域专家解构顶层设计、探究技术基石。

  今年9月,中国信息通信研究院人工智能研究所联合清华大学计算社会科学与国家治理实验室、中国人工智能产业发展联盟数据委员会发布了《人工智能高质量数据集建设指南》。论坛上,中国信通院人工智能研究所平台与工程化部副主任、中国人工智能产业发展联盟数据委员会主任李荪对这一行业指导文件进行了解读,并表示其出台旨在为人工智能领域高质量数据集建设提供实践参考。

  针对企业结构化、非结构化、半结构化数据混杂的情况,普元信息技术领军人焦烈焱表示,数据治理不再只是简单清洗数据的IT项目,而是一项知识工程工作,需要把存有散乱数据“原矿”的混沌数据集,通过主数据等减熵方式变成知识工程的基础资产,系统性地“炼制”知识放到数据集中,从而形成能够驱动AI、赋能决策的高质量数据集。

  
“全链路数据治理赋能高质量数据集建设”主题论坛上,普元信息技术领军人焦烈焱分享以“全链路治理”炼制高价值数据资产。(主办方供图)

    焦烈焱表示,高质量数据集的构建是一项系统工程,而普元的核心优势正是提供“全链路”治理能力,从战略咨询、平台工具到数据开发治理运营一体化。

  论坛现场,普元发布“易数”AI原生数据资产平台最新版本。产品深度融合AI能力支持双向赋能的智能飞轮建设,可以通过智能化数据发现、自动化数据治理、一体化数据服务,帮助企业构建AI的数据工厂,提供敏捷的数据洞察,大幅提升构建和管理高质量数据集的效率。

  普元信息数据产品线总经理李书超透露,普元“易数”还将通过三层能力支撑企业数据智能体的进化:数据进项,将企业所有业务都以数字化方式呈现;增强决策,通过数据构建预测,支持对未来的业务分析与决策判断;自主智能,融合平台和AI能力推进数字员工、智能网络、知识学习、自进化升级等。

  着眼推动产业协同,普元信息在论坛上宣布成立“AI核心数据集生态联盟”,联合产、学、研、用多方力量共同制定高标准的数据规范,以联盟力量攻克高质量数据集建设的共性难题,并促进高质量数据集的流通与共享。

  同步启动的“灯塔计划”,旨在深度挖掘能源、制造、金融等垂直领域的数字化转型标杆案例,总结成功经验,为全行业的数据治理提供可复制、可推广的实践范本。

  与会专家纷纷表示,高质量数据集成为AI时代的竞争关键,而从战略咨询、平台工具到落地运营的全链路数据治理,是实现竞争力提升目标的重要路径。

【纠错】 【责任编辑:史依灵】