2025-01-08
英伟达近日宣布推出了一系列全新开源 AI 模型——Llama Nemotron 和 Cosmos Nemotron,旨在帮助企业加速数字化转型。这些模型基于英伟达自主研发的NeMo 平台,经过精调、压缩和优化处理,在保证高精度的同时体积小巧,可以在各种计算平台上运行。
Jeremy Barnes,ServiceNow 公司平台 AI 副总裁表示:“英伟达开源的 Llama Nemotron 模型为企业数字化转型树立了新的标准。这些模型能够帮助企业构建更强大的 AI 代理服务,解决跨多个部门和行业复杂问题。”
Llama Nemotron 模型家族涵盖 Nano、Super 和 Ultra 三个规模等级,可满足不同应用场景的需求。Nano 型号最为经济实惠,专为实时应用和低延迟需求设计,适合部署在 PC 和边缘设备上;Super 型号精度高,单 GPU 上性能优异;Ultra 型号精度最高,适用于数据中心级应用和高性能需求。
企业还可以利用 Nvidia NeMo 微服务来定制模型,针对特定用例和领域进行优化。NeMo 还提供数据管理、模型训练和评估工具,以及安全措施,确保 AI 应用的可靠性和安全性。此外,Nvidia NeMo Retriever 能够集成检索增强生成 (RAG) 功能,连接模型与企业数据源。
英伟达还推出了基于 Llama Nemotron 和 Cosmos Nemotron 的 Nvidia Blueprint,简化了视频搜索和总结等应用开发过程。所有这些工具均可通过 Nvidia AI Enterprise 软件平台获得。
英伟达表示,Llama Nemotron 和 Cosmos Nemotron 模型将以托管 API 和下载形式提供,并且对于 Nvidia 开发者计划成员免费开放。企业可以通过 Nvidia AI Enterprise 平台在加速数据中心和云基础设施上运行这些模型。