微博 微博
微信 微信公众号
简体版|繁体版
支持IPv6
无障碍
当前位置: 首页 > 数字广西 > 数字经济

深耕东盟语料库 畅通数字合作路

2026-02-05 15:39     来源: 广西云-广西日报
收藏 我要收藏 公共资源调用站点 文章分享
分享 微信
头条
微博 空间 qq
【字体: 打印

新闻眼:今年自治区两会上,政府工作报告指出,在人工智能快速发展的关键节点,广西抓得早、动作快,推动人工智能发展纳入国家布局,取得了宝贵的先发优势。与会代表委员立足一线实践,发出务实之声,为推动广西人工智能这张名片享誉全国、唱响东盟积极建言献策,助力激活高质量发展新引擎。

马骏     自治区政协委员、南宁学院创新创业教育学院院长

唐平秋  自治区人大代表、广西民族大学党委书记

政府工作报告提到,打造高质量数据集和东盟语料库。这一部署精准切中广西与东盟数字合作的核心痛点。

“广西作为中国与东盟唯一陆海相连的省区,在东盟语料库建设上具有天然优势。”马骏委员表示,广西与东盟国家地缘相近、人文相亲、民心相通,长期积累了海量多语言原生语料,为获取鲜活语言资源提供了便利。

广西民族大学语料库加工团队正在工作。广西民族大学 供图

语料库是推动信息化建设、赋能数字化转型、助力智能化升级的关键基础要素。因此,区内多所高校已前瞻布局东南亚语言与人工智能交叉学科,校企协同育人机制日益完善,初步形成专业化人才储备与实践梯队。依托中国—东盟信息港平台支撑,叠加“语料券”等政策工具赋能,以及“人工智能+跨境电商”等场景的持续拓展,进一步催生了东盟语料库建设的迫切需求,为产业落地筑牢了基础。

“东盟非通用语种语料库建设是广西人工智能领域的‘一号工程’,不仅赋能千行百业数字化转型,筑牢人工智能伦理与安全防线,更为‘北上广研发+广西集成+东盟应用’的人工智能发展路径服务打通关键环节,铺就一条数字合作高速通道。”唐平秋代表表示,当前广西东盟语料库建设已完成初步框架搭建,语种覆盖虽初具规模,但高质量细粒度标注语料稀缺,尤其在口语对话、专业术语等领域缺口明显,多数行业缺乏高质量垂类语料库;语料采集渠道多元但标准不一,数据复用率偏低,跨境支付与数据流通不畅等问题制约建设进程;越南语、泰语等核心东盟语种的标注人才需求和标注数据缺口较为突出。

针对这些问题,唐平秋代表建议,要加快搭建高水平语料库科研平台,整合高校、企业、科研机构资源,集中攻关面向东盟非通用语种语料精准标注等核心技术。健全跨境数据治理机制,积极推动中国—东盟数字规则互认,打通数据流通壁垒,为语料合法合规使用提供制度保障。

文件下载:

关联文件:

翻译中

翻译中

小语种翻译服务免责声明

  • 1. 本网站提供多语种互译功能,旨在提升政务信息传播效能,为东盟用户提供多语言支持服务。
  • 2. 本网站翻译服务是采用“人工智能+机器翻译”的技术实现,所有翻译结果仅供辅助参考。如遇语义理解偏差、专业术语误译或内容遗漏等情况,请以本网站的中文原文为准。
  • 3. 本网站对翻译结果的准确性、完整性和适用性不承担法律责任,用户因使用翻译服务产生的任何后果需自行承担。
  • 4. 本声明最终解释权归本网站主办单位所有。
简体  |  繁体
智能问答
微博
微信

深耕东盟语料库 畅通数字合作路

2026-02-05 15:39     来源: 广西云-广西日报
收藏 我要收藏 公共资源调用站点 文章分享
分享 微信
头条
微博 空间 qq
【字体: 打印

新闻眼:今年自治区两会上,政府工作报告指出,在人工智能快速发展的关键节点,广西抓得早、动作快,推动人工智能发展纳入国家布局,取得了宝贵的先发优势。与会代表委员立足一线实践,发出务实之声,为推动广西人工智能这张名片享誉全国、唱响东盟积极建言献策,助力激活高质量发展新引擎。

马骏     自治区政协委员、南宁学院创新创业教育学院院长

唐平秋  自治区人大代表、广西民族大学党委书记

政府工作报告提到,打造高质量数据集和东盟语料库。这一部署精准切中广西与东盟数字合作的核心痛点。

“广西作为中国与东盟唯一陆海相连的省区,在东盟语料库建设上具有天然优势。”马骏委员表示,广西与东盟国家地缘相近、人文相亲、民心相通,长期积累了海量多语言原生语料,为获取鲜活语言资源提供了便利。

广西民族大学语料库加工团队正在工作。广西民族大学 供图

语料库是推动信息化建设、赋能数字化转型、助力智能化升级的关键基础要素。因此,区内多所高校已前瞻布局东南亚语言与人工智能交叉学科,校企协同育人机制日益完善,初步形成专业化人才储备与实践梯队。依托中国—东盟信息港平台支撑,叠加“语料券”等政策工具赋能,以及“人工智能+跨境电商”等场景的持续拓展,进一步催生了东盟语料库建设的迫切需求,为产业落地筑牢了基础。

“东盟非通用语种语料库建设是广西人工智能领域的‘一号工程’,不仅赋能千行百业数字化转型,筑牢人工智能伦理与安全防线,更为‘北上广研发+广西集成+东盟应用’的人工智能发展路径服务打通关键环节,铺就一条数字合作高速通道。”唐平秋代表表示,当前广西东盟语料库建设已完成初步框架搭建,语种覆盖虽初具规模,但高质量细粒度标注语料稀缺,尤其在口语对话、专业术语等领域缺口明显,多数行业缺乏高质量垂类语料库;语料采集渠道多元但标准不一,数据复用率偏低,跨境支付与数据流通不畅等问题制约建设进程;越南语、泰语等核心东盟语种的标注人才需求和标注数据缺口较为突出。

针对这些问题,唐平秋代表建议,要加快搭建高水平语料库科研平台,整合高校、企业、科研机构资源,集中攻关面向东盟非通用语种语料精准标注等核心技术。健全跨境数据治理机制,积极推动中国—东盟数字规则互认,打通数据流通壁垒,为语料合法合规使用提供制度保障。

文件下载:

关联文件:

翻译中

翻译中

小语种翻译服务免责声明

  • 1. 本网站提供多语种互译功能,旨在提升政务信息传播效能,为东盟用户提供多语言支持服务。
  • 2. 本网站翻译服务是采用“人工智能+机器翻译”的技术实现,所有翻译结果仅供辅助参考。如遇语义理解偏差、专业术语误译或内容遗漏等情况,请以本网站的中文原文为准。
  • 3. 本网站对翻译结果的准确性、完整性和适用性不承担法律责任,用户因使用翻译服务产生的任何后果需自行承担。
  • 4. 本声明最终解释权归本网站主办单位所有。