在各个方面释放数据和文本数据元素的数量
◎我们的记者张·盖伦(Zhang Gailun)是“我们每天都在学习而不关注它,并在没有意识到它的情况下使用它。”实际上,语言和写作是重要的教育,科学和技术,文化,经济,安全和战略资源。最近,为了占据升级大型语言模型的新机会,教育部,国家语言委员会和中央网络空间事务办公室发布了“有关加强中国数字建设并促进信息和性格的发展的意见”(之后,它被指定为“意见”)。 3月31日,教育部举行了一次会议大会,以对“意见”提供全面的解释。语言信息管理部和教育部特征的主任刘·佩管(Liu Peijun提供数字中国建设以及全面建立语言发展和性格信息的重点,并在各个方面释放语言和特征在经济和社会发展中的价值。实际上,有必要将中国资源信息转换为智能数据,以一种标准的,有效的批处理方法,同时也可以促进大规模的生产,质量整合,标准管理和重复使用中国数据,以通过数字方式实现新的中国服务系统,并领导并鼓励全面的语言发展和文本开发。为什么要给数字中文?刘·佩管(Liu Peijun)说,中国任务很重要,还有许多基本活动,例如发展数字中国,增加民族语言和写作的进步,加深对中国良好语言和文化的继承,并加强国际交流D对语言文明的教育,所有这些都需要赋予中文的数字能力。中国文化富含内容,是为世界上中国做出贡献的重要公共文化产品。它还需要数字中文数字的分散。中国人被广泛使用,需要更多地研究数字中文。此外,中国数据具有剩余价值。大规模和高质量的中国数据令人愉快,可以促进具有中国特性的大型语言模型的创新发展,并需要中文的更多数字支持。 Liu Peijun提出,将来就现代技术和应用而言,我们应该在自然语言处理技术的关键作用方面提供全面发挥作用,以支持人工智能的发展,加速该领域的大型语言模型,确保标准和安全,并显示应用程序;发展语言资源的建设,人人工智能的材料和应用标准,尤其是数据质量和数据质量评估标准。在数据资源的构建中,我们将全面发挥语言作用和写作在提供民族语言能力,实施国家关键语料库建设计划并制定大型中国语料库方面的战略作用。通过强调主要领域,我们将全面发挥信息技术在增强Thattional语言服务系统的能力,为读写大型语言模型(教师 - 学生版本)的能力和技能的框架,促进甲骨文骨骨铭文的数字共享以及实施多语言数字通信计划以高效的中国文化。 Wangxuan计算机研究所的主任Tang Zhi指出,在1980年代,激光照明技术的发明允许中文在全球互联网领域中将中国文化重生。目前,大型语言模型技术指出,对大型高质量语料库的未经启发性要求。中国信息处理技术的发展由于解决了过去的重大投入问题和汉字的输出而丢失了,而不是在发布数据和文本元素的价值中获得的当前综合成功。唐·齐(Tang Zhi)表示,加强中国数字中国人的建设将在新阶段重新开发这种模式,并促进中国信息处理技术的发展。语言和角色将实现从“静态符号”到“动态数字资产”,再到“信息载体”到“劳动因素”的转变。我们应该专注于制定标准的发展,例如语料库,注释和数据分析,并支持各种活动,例如文本生成和理解,语言翻译以及情感分析。语言和文本也可以通过从存储符号到智能建模的更改来实现。因此,有必要专注于主要领域,以生产基础架构并开发支持大型模型培训的中国数据的高质量集。唐·齐(Tang Zhi)强调,语言和写作也将在增强一般发展的能力中发挥作用。在新情况下,语言和文本信息处理技术的创新应用会从“万亿参数大型语言模型”中的“ GB2312字符集”中进行范式变化。语言和文本将与信息技术实现深入的整合,从而产生了良好的“技术成功 - 情境繁荣的实施”,教育发展的实施,帮助科学和技术变革,赋予文化遗产,升级行业和促进社会发展。 (科学和技术日常,北京,3月31日)