教育部等三部门发文推进语言文字信息化发展
部署三项重大任务
近日,教育部、国家语委、中央网信办共同印发 《关于加强数字中文建设 推进语言文字信息化发展的意见》。3月31日,在教育部召开的发布会上,教育部语言文字信息管理司司长刘培俊介绍了 《意见》 的相关情况。
“《意见》 部署应用关键新技术,构建资源数据新体系,实施赋能全局新行动,全力服务教育强国、科技强国和文化强国建设,为以中国式现代化全面推进强国建设、民族复兴伟业贡献力量。”刘培俊表示。
《意见》 明确两步发展阶段:有序实现2027和2035年语言文字信息化发展目标。到2027年,国家数字中文建设行动取得重要成效,语言文字数据要素价值有效释放。基本形成“政府主导、部门协同、社会参与、共建共享”的语言文字信息化工作机制;基本建成国家语言文字大数据中心,初步建成国家关键语料库和国家战略语言资源信息库;语言文字信息化标准、前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强。到2035年,中文在全球数字空间、网络空间以及生成式人工智能等关键应用场景中的使用占比显著提高;语言文字信息化有力支撑国家语言能力建设、语言文字事业和经济社会高质量发展,整体水平位居世界前列。
《意见》 还部署了三项重大任务,统筹推动技术创新、体系保障和关键赋能落地见效。创新应用自然语言处理、大语言模型、多模态信息处理、知识图谱、语料加工等五项前沿技术,重点服务大语言模型等人工智能技术创新应用“制高点”,夯实国家关键语料基础设施“新基建”。系统建设语言文字规范标准、资源服务、人才培养、协同创新和安全治理五大保障体系,重点提升语言文字信息化的基础能力。统筹实施数字中文服务教育发展、助力科技创新、赋能文化传承、推动产业升级、促进社会进步等五大赋能行动,重点推进语言技术与关键领域需求深度融合应用。
来源:中国教育报
______________________________________________
延伸阅读
全球中文学习平台用户超1600万人覆盖190多个国家和地区
教育部3月31日召开新闻发布会,介绍深入贯彻落实 《教育强国建设规划纲要(2024—2035年)》,推进语言文字信息化发展情况。教育部语言文字信息管理司司长刘培俊介绍,目前已建成集成化、智能化、国际化的全球中文学习平台,用户超1600万人,覆盖190多个国家和地区,深度化合作建立联盟,中文学习联盟云服务平台提供3万门在线课程,与中外1600多家机构合作,推动实现中文人人、时时、处处可学可用、易学易用。经过多年努力,语言文字信息化以应用为导向、以服务为主线,形成了多语种资源广泛开发、多方面技术创新应用、多类型主体共同推进、多维度赋能发挥作用的良好局面,有效服务经济社会高质量发展。
高校要创新中文专业人才培养机制
随着人工智能的发展,高校如何高质量建好中文专业? 广东省委教育工委委员,省教育厅党组成员、副厅长朱建华表示,要重新定位中文人才培养目标。以强化科技教育和人文教育协同为关键措施,重构中文专业人才能力构成,重视创新能力培养,造就有人文情怀、数字素养和科学精神的复合型创新人才。
同时,开展新文科研究与实践,大力推进学科交叉融合发展,以社会实际需求为导向,试点推进数字赋能中文专业建设,推动中文专业与计算机、心理等学科专业交叉融合。
此外,要利用大语言模型等人工智能技术实现个性化学习路径规划,构建人机协同教学范式,提供智能辅导。研究制定涉及交叉学科的大学语文课程体系,支持增设“语言文字+人工智能”核心课程,等等。
北京师范大学党委常委、副校长康震表示,北京师范大学目前正着力推进学科的深度交叉融合。今年北师大结合国家重大战略需求和人才发展的需要,推进文学院与人工智能学院、国际中文教育学院、外国语言文学学院共同合作,推出了“汉语言文学+人工智能”双学士学位培养项目,该计划今年将启动招生。
同时,康震表示,北师大将实施“人工智能+高等教育”的教育教学改革专项“1228计划”,促进10个专业人才培养与人工智能的深度融合,打造20个人工智能赋能教育教学的重点团队,推动20本数字化的教材建设,建设80门深度融合人工智能的智慧课程。未来,将持续重视抓好新文科建设,优化人才自主培养体系,加大科教融汇力度,深化产学研用一体化合作,加快培养适应新技术、新产业、新业态、新模式的复合型人才。
立足AI大模型,建设“新型国家语料库”
“当前以深度求索(DeepSeek)等为代表的人工智能技术创新不断取得突破性的进展,在这个大背景下,国家提出这样一个战略部署,建设新型国家语料库,凸显了其重要性、必要性和紧要性。”发布会上,教育部语言文字应用管理司副司长王晖表示。
他提到,当前很多语料库还处于单一文本模式和领域应用阶段,在建设的理念、技术和方法、规模,以及数据多样性、时效性尤其是与人工智能相结合的大规模应用方面还存在不足,难以满足多元化、动态化尤其是智能化的语言数据需求。
“要立足人工智能时代大背景,突破传统语料库单一文本模式和领域应用壁垒,以大模型训练及性能评测、智能计算为核心,以新质态、多模态、多语言、大规模、全域性为突出特性,为通用领域和细分领域多场景应用及创新发展提供规范、可信、高质量的语言文化语料资源。”王晖说。
《教育强国建设规划纲要》提出,要建设“新型国家语料库”。近日,教育部、国家语委、中央网信办共同印发的 《关于加强数字中文建设 推进语言文字信息化发展的意见》也提出,到2027年初步建成国家关键语料库。
教育部语言文字信息管理司司长刘培俊表示,新型国家语料库建设,首先要聚焦“需求”这一关键。在关键学科、重点行业、战略区域、民生期待和社会急需领域,分批建设规范、安全、优质的国家关键语料库。目前,教育部、国家语委已经支持建设了30余项关键领域的语料库。
此外,要以建设语料基础设施为新基建,服务大语言模型以及生成式人工智能等技术前沿创新应用的制高点。目前,教育部、国家语委已经支持布局了五个领域的自主安全可控大语言模型建设项目,下一步将根据需求稳步扩大建设范围,提升建设成效。
来源:中新网