俄罗斯莫斯科,2025年12月9日——诺尼可正式发布其自主研发的冶金与采矿行业专用的大语言模型MetalGPT-1。该模型是诺尼可公司旗下大语言模型体系中的首个开源模型。与基于通用互联网数据训练的通用模型不同, MetalGPT-1从设计之初即面向专业应用,能够准确处理行业术语、缩写以及复杂的工艺技术链条,从而有效降低模型“幻觉”的发生率并提升基于人工智能建议的决策质量。

该模型构建了一个覆盖工程、技术、生产及企业管理的统一语言层。诺尼可正基于该模型开发个人AI助手和自主智能体,并逐步将其整合到公司的运营流程中。
MetalGPT-1 拥有 320 亿参数,训练数据规模约 10GB,全部来自冶金与采矿领域的专业文本,其体量相当于英文维基百科内容的一半。该模型的核心优势在于高质量、独有的数据来源——训练过程中使用了超过 100 万份未在公开渠道发布的文档。这些数据涵盖工艺技术规程、企业内部管理制度与操作指引、设计与工程建设文件、专利资料、研发报告以及科技文献等内容。所有数据均经过多阶段清洗和匿名化处理,在保障商业机密安全的同时,实现了行业知识的有效应用。此外,项目团队还基于真实生产和科研场景构建了约 50 万组问答与指令样本,帮助模型更好地理解技术流程中的因果关系,从而提升其在复杂应用场景下的稳定性和抗错误能力。
“冶金是工业领域中最为复杂的行业之一,拥有自身独特的工艺语言、缩写体系和专业术语。基于通用网络语料训练的通用模型在处理此类专业语言时往往精度不足,而超大规模模型又需要极其庞大的算力资源。MetalGPT-1 改变了这一局面——它是全球首个专门针对冶金行业优化、参数规模达 320 亿的行业大模型。在工业基准测试中,MetalGPT-1通过可实际应用的工业资源,展现出业内领先的冶金语言理解能力。如今,每一家企业都可以根据自身需求对该模型进行定制化应用。” 诺尼可人工智能研发部负责人丹尼尔·伊瓦舍奇金(Danil Ivashechkin)强调道。
MetalGPT-1 的研发历时约一年:其中,数据收集与整理耗时六个月,基础模型训练历时两个月,随后又用了两个月进行行业适配与精细化调优。为实现对模型性能的客观评估,诺尼可团队还专门构建了一套面向冶金行业的工业基准测试体系,涵盖采矿与冶金行业多类工艺流程的问答样本。在该测试体系下,MetalGPT-1的表现持续优于开放的通用大模型。
诺尼可已将MetalGPT-1模型及工业基准发布于Hugging Face平台,为行业提供开发专业化解决方案的工具,并基于领域特定语言模型拓展工业应用生态系统。