首页 家电百科 实时讯息 常识
当前位置: 首页 > 实时讯息 >

数字中文建设在行动

0次浏览     发布时间:2025-04-01 02:59:00    

为落实《教育强国建设规划纲要(2024—2035年)》,教育部、国家语委、中央网信办近日共同印发《关于加强数字中文建设 推进语言文字信息化发展的意见》(以下简称《意见》),部署应用关键新技术,构建资源数据新体系,实施赋能全局新行动,全力服务教育强国、科技强国和文化强国建设。

3月31日,教育部召开新闻发布会,介绍推进语言文字信息化发展情况。

明确两步发展阶段

《意见》提出,加强数字中文建设的理念、政策、行动和项目,将数字中文建设作为服务数字中国建设的重要任务和全面推进语言文字信息化发展的突出重点,全方位释放语言文字在经济社会发展中的数据要素价值,着力推进中文数字化与数据中文化,着力推进创新应用与规范安全,着力推进新型中文服务体系构建与语言文字治理体系完善。

《意见》明确两步发展阶段:第一步到2027年,是以数字中文建设为重点的强基示范阶段,形成语言文字信息化推进机制,推动语言文字信息化规范标准、前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强;第二步面向2035年,是全面推进语言文字信息化发展的深化赋能阶段,推动承载中华文化的中文在全球数字空间、网络空间以及生成式人工智能等关键场景中的使用占比和价值引领作用显著提高,实现我国语言文字信息化整体水平位居世界前列。

教育部语言文字信息管理司司长刘培俊介绍,重点加强数字中文建设主要有以下考虑:一是中文使命任务重大——今后一个时期,中文服务数字中国建设,加大国家通用语言文字推广力度,深化中华优秀语言文化传承,增进语言文明国际交流互鉴等多项重大任务,更加需要中文数字化赋能。二是中文文化内涵丰富——中文承载着中华民族数千年的文明智慧,是中国贡献给世界的重要公共文化产品,更加需要中文数字化传播。三是中文使用范围广泛——中文是世界上使用人数最多的语言,是联合国六种工作语言之一,190多个国家和地区开展中文教学,85个国家将中文纳入国家的教育体系,更加需要中文数字化学习。四是中文数据价值突出——大规模、高质量的中文数据有利于推动中国特色大语言模型创新发展,更加需要中文数字化支撑。

从“信息载体”向“生产要素”转型

当前,大语言模型技术对大规模高质量语料提出前所未有的需求,赋予了数据中文化新的历史内涵和使命任务。北京大学王选计算机研究所所长汤帜认为,加强数字中文建设将从三个维度推动中文信息处理技术发展进入新阶段。

一是从重要资源转化为数据要素价值。语言文字将从“静态符号”向“动态数字资产”、从“信息载体”向“生产要素”转型,要重点推动语料库、数据标注与评价等标准的研制,支持文本生成与理解、语言翻译、情感分析等。

二是从广泛存在聚焦到关键领域应用。语言文字“日学而不察、日用而不觉”,广泛存在于社会生产各个方面。新形势下,语言文字将实现从符号存储到智能建模的质变,要聚焦关键垂直领域建设语料基础设施,构建支持大模型训练的高质量中文数据集。

三是从基础支撑提高到赋能全局发展。语言文字信息处理技术创新应用正经历从“GB2312字符集”到“万亿参数大语言模型”的范式变革。语言文字将实现与信息技术的深度融合,要形成“技术突破—场景落地—生态繁荣”的良性循环,打造数字化引领品牌,有力服务教育发展、助力科技创新、赋能文化传承、推动产业升级、促进社会进步。

建设高质量的语言文化语料资源

语料库是加强数字中文建设、推进语言文字信息化发展、推动语言文字高质量发展的基础支撑,也是经济社会信息化建设、数字化赋能和智能化发展的基础要素。

然而当前,在语言的教育教学和研究领域,虽然有多个语料库,但很多语料库还处于单一文本模式和领域应用阶段,在建设的理念、技术和方法、规模,以及数据多样性、时效性尤其是与人工智能相结合的大规模应用方面还存在不足,难以满足多元化、动态化尤其是智能化的语言数据需求。

对此,《意见》提出,到2027年初步建成国家关键语料库。刘培俊介绍,启动实施国家关键领域语料库建设计划,在关键学科、重点行业、战略区域、民生期待和社会急需领域,分批建设规范、安全、优质的国家关键语料库。目前,教育部、国家语委已经支持建设了30余项关键领域的语料库。

据介绍,国家关键领域语料库建设立足人工智能时代大背景,突破传统语料库单一文本模式和领域应用壁垒,以大模型训练及性能评测、智能计算为核心,以新质态、多模态、多语言、大规模、全域性为突出特性,为通用领域和细分领域多场景应用及创新发展提供规范、可信、高质量的语言文化语料资源。

(本报北京3月31日电 本报记者 柴如瑾)

相关文章
深度丨“打补丁”易,建规则难,银行数据治理7年仍在破局

深度丨“打补丁”易,建规则难,银行数据治理7年仍在破局

霍莉 从小微客户信用评估、零售客户精准画像再到供应链金融等业务创新,近年来,数据作为生产要素,正加速融入银行运营各环节,成为拓展营收的重要引擎。券商中国记者观察到,一方面,近年来有关银行数据报送与治理违规的罚单频现;另一方面,越来越多的银行将数据管理部从信息科技部门独立出来,并抬升至与后者地位相同的

丝博会首设文旅消费馆 陕文投展示AI大模型赋能智慧旅游新实践

丝博会首设文旅消费馆 陕文投展示AI大模型赋能智慧旅游新实践

丝博会文旅消费馆陕文投集团展区记者在本届丝博会首次设立的文旅消费馆看到,陕文投集团通过对文旅智能科技、文旅融合科技、文旅数娱科技三大板块的全方位展示,以科技赋能文旅深度融合,为陕西文旅产业高质量发展注入新动能。丝博会文旅消费馆陕文投集团展区科技创新赋能文旅升级“全国旅游资源交易平台可以理解为旅游行业

由手机成为“新农具”说开去

由手机成为“新农具”说开去

近段时间,岫岩“00后”小伙张新雨用手机拍摄的菌菇系列短视频火出圈了,不仅在抖音平台收获百万流量,也吸引大批消费者和收购商关注。张新雨在成功为自家农场打开销路的同时,还牵头成立菌菇合作社,带动周边村民共同增收致富。他的故事,是“互联网+农业”融合发展的生动写照。张新雨之所以能脱颖而出,关键在于他敏锐

喜报!赛罕区政数局荣获全国政务服务增值改革典范案例单位!

喜报!赛罕区政数局荣获全国政务服务增值改革典范案例单位!

日前,在2025数字政务博览会暨优化提升营商环境交流会上,赛罕区行政审批政务服务与数据管理局选送的“党建领航创新‘1+3+3+2’助企服务模式 驱动政务增值服务升级”案例,荣获“全国政务服务增值改革”典范案例。2025数字政务博览会暨优化提升营商环境交流会,汇聚了来自全国各地的226家政务服务机构,

共襄盛举 共享机遇 西洽会让世界了解西部投资西部

共襄盛举 共享机遇 西洽会让世界了解西部投资西部

山城小满,绿意盎然。5月22日,第七届中国西部国际投资贸易洽谈会(以下简称西洽会)将在重庆国际博览中心、悦来国际会议中心隆重开幕。本届西洽会以“新西部、新制造、新服务”为主题,将吸引来自全球多个国家和地区的嘉宾、展商齐聚山城,共商发展大计,共享合作机遇。作为西部地区对外开放的重要平台,西洽会已成功举

@济南企业 2025年专精特新“小巨人”企业认定和复核工作开始啦!

@济南企业 2025年专精特新“小巨人”企业认定和复核工作开始啦!

5月19日,山东省工业和信息化厅发布通知,根据《优质中小企业梯度培育管理暂行办法》《山东省优质中小企业梯度培育管理实施细则》(以下简称《实施细则》)和工业和信息化部近期通知有关要求,启动2025年专精特新“小巨人”企业认定和复核的推荐工作。记者了解到,山东省(不含青岛市)有效期内(或今年已申报)的专

AI时代,OceanBase如何打造新时代数据底座?

AI时代,OceanBase如何打造新时代数据底座?

(文/陈济深 编辑/张广凯) 随着AI时代的不断发展进化,卷算力、拼算法已经让大模型厂家拼得头破血流。然而,想要让AI变得更强,算法,算力和数据三要素上,数据反而更容易是成为短板的要素。 蚂蚁旗下的OceanBase,找到了自己在AI时代的用武之地。 相比过去传统标量数据库,AI时代尤其是多模态大模

江西万载:工程建设审批当日办结 数据多跑腿企业得便利

江西万载:工程建设审批当日办结 数据多跑腿企业得便利

针对工程建设项目审批环节多、材料杂的痛点,江西省万载县行政审批局创新推出“容缺受理+告知承诺”制度。在严格把控审批核心要件的前提下,对非关键性材料实施“容缺清单制”,实现一站式办理、限时办结。目前万载县已梳理出工程建设领域高频发生的15个容缺事项,两年间,在工程建设领域累计办理容缺审批事项56件,审