世界首个藏语大语言模型DeepZang在拉萨发布
发布时间: 1773654316517 来源:南美侨报网综合 评论:0 发布时间: 1773654316517

世界首个藏语大语言模型DeepZang15日在拉萨发布。DeepZang由西藏觉罗数字产业管理有限公司自主攻关研发,是中国首个完成国家生成式人工智能备案的藏语大语言模型,填补了全球该领域技术空白。

综合中新社报道,当天举行的“深溯藏源·智启未来”DeepZang藏语大语言模型及智能应用发布会上,DeepZang创始人旦增罗布说,该开源大模型平台是中国首个面向多语种、多模态的民族语言AI开放平台,支持80余种语言服务,实现“听、说、译、看、思”功能。目前,DeepZang App同步推出,在多个行业将要落地,形成“智慧+”解决方案矩阵。

旦增罗布说,觉罗数字自2018年起,便确定了“藏汉双语+人工智能”的发展规划。历时四年,构建了近7000万条高质量藏汉平行精准语料库。同时,完成三大藏语方言区大规模语音采集:卫藏10500小时、康巴10000小时、安多10000小时,是目前中国规模最大、标注较为精准的藏语语音数据库。

世界纪录认证机构(WRCA)在发布会上颁发了“世界首个藏语大语言模型”认证证书。

据此前报道,去年11月,千亿参数级藏语基座大模型“阳光清言”V1.0研发成果在西藏拉萨发布。该模型的训练数据使用了约288亿token高质量藏语数据,包括藏语单语数据、汉藏及藏英平行语料、汉藏双语辞典条目等,内容涵盖新闻、法律、医学、哲学、教育、文化和科学技术等多个领域。

据悉,该款模型能够处理复杂的语言结构和多领域知识,具备深度的藏语语义理解与生成能力,问答自然流畅、生成明晰准确,在藏语智能问答、文本生成、机器翻译等领域有着优异的表现。可广泛应用于边疆治理、文旅、绿色能源、农牧科研、教育、文化、藏医药与高原健康等领域相关大模型研发,将为边疆数智治理、民生服务、产业赋能等关键技术突破提供支撑。

“西藏在藏语大模型研发领域取得了重要进展,标志着西藏AI发展将从场景应用走向系统性研发阶段。”中国工程院院士、西藏大学教授尼玛扎西彼时受访时表示。

据观察了解,无论在政务领域、社区治理,抑或公共服务、生态科考,人工智能在西藏已有普遍应用。在拉萨,像社区、机场已经接入AI技术,为人们生活带来便捷。

责任编辑:李点
网友评论

10 条评论

所有评论
显示更多评论