世界首个藏语大语言模型DeepZang在拉萨发布

发布时间： 1773654316517 来源：南美侨报网综合评论：0 发布时间： 1773654316517

世界首个藏语大语言模型DeepZang15日在拉萨发布。DeepZang由西藏觉罗数字产业管理有限公司自主攻关研发，是中国首个完成国家生成式人工智能备案的藏语大语言模型，填补了全球该领域技术空白。

综合中新社报道，当天举行的“深溯藏源·智启未来”DeepZang藏语大语言模型及智能应用发布会上，DeepZang创始人旦增罗布说，该开源大模型平台是中国首个面向多语种、多模态的民族语言AI开放平台，支持80余种语言服务，实现“听、说、译、看、思”功能。目前，DeepZang App同步推出，在多个行业将要落地，形成“智慧+”解决方案矩阵。

旦增罗布说，觉罗数字自2018年起，便确定了“藏汉双语+人工智能”的发展规划。历时四年，构建了近7000万条高质量藏汉平行精准语料库。同时，完成三大藏语方言区大规模语音采集：卫藏10500小时、康巴10000小时、安多10000小时，是目前中国规模最大、标注较为精准的藏语语音数据库。

世界纪录认证机构（WRCA）在发布会上颁发了“世界首个藏语大语言模型”认证证书。

据此前报道，去年11月，千亿参数级藏语基座大模型“阳光清言”V1.0研发成果在西藏拉萨发布。该模型的训练数据使用了约288亿token高质量藏语数据，包括藏语单语数据、汉藏及藏英平行语料、汉藏双语辞典条目等，内容涵盖新闻、法律、医学、哲学、教育、文化和科学技术等多个领域。

据悉，该款模型能够处理复杂的语言结构和多领域知识，具备深度的藏语语义理解与生成能力，问答自然流畅、生成明晰准确，在藏语智能问答、文本生成、机器翻译等领域有着优异的表现。可广泛应用于边疆治理、文旅、绿色能源、农牧科研、教育、文化、藏医药与高原健康等领域相关大模型研发，将为边疆数智治理、民生服务、产业赋能等关键技术突破提供支撑。

“西藏在藏语大模型研发领域取得了重要进展，标志着西藏AI发展将从场景应用走向系统性研发阶段。”中国工程院院士、西藏大学教授尼玛扎西彼时受访时表示。

据观察了解，无论在政务领域、社区治理，抑或公共服务、生态科考，人工智能在西藏已有普遍应用。在拉萨，像社区、机场已经接入AI技术，为人们生活带来便捷。

责任编辑：李点

网友评论

10 条评论

所有评论

显示更多评论