英伟达开源AI模型助企业数字化转型

2025-01-08

英伟达发布全新AI模型，助力企业数字化转型

英伟达近日宣布推出了一系列全新开源 AI 模型——Llama Nemotron 和 Cosmos Nemotron，旨在帮助企业加速数字化转型。这些模型基于英伟达自主研发的NeMo 平台，经过精调、压缩和优化处理，在保证高精度的同时体积小巧，可以在各种计算平台上运行。

Jeremy Barnes，ServiceNow 公司平台 AI 副总裁表示：“英伟达开源的 Llama Nemotron 模型为企业数字化转型树立了新的标准。这些模型能够帮助企业构建更强大的 AI 代理服务，解决跨多个部门和行业复杂问题。”

Llama Nemotron 模型家族涵盖 Nano、Super 和 Ultra 三个规模等级，可满足不同应用场景的需求。Nano 型号最为经济实惠，专为实时应用和低延迟需求设计，适合部署在 PC 和边缘设备上；Super 型号精度高，单 GPU 上性能优异；Ultra 型号精度最高，适用于数据中心级应用和高性能需求。

企业还可以利用 Nvidia NeMo 微服务来定制模型，针对特定用例和领域进行优化。NeMo 还提供数据管理、模型训练和评估工具，以及安全措施，确保 AI 应用的可靠性和安全性。此外，Nvidia NeMo Retriever 能够集成检索增强生成 (RAG) 功能，连接模型与企业数据源。

英伟达还推出了基于 Llama Nemotron 和 Cosmos Nemotron 的 Nvidia Blueprint，简化了视频搜索和总结等应用开发过程。所有这些工具均可通过 Nvidia AI Enterprise 软件平台获得。

英伟达表示，Llama Nemotron 和 Cosmos Nemotron 模型将以托管 API 和下载形式提供，并且对于 Nvidia 开发者计划成员免费开放。企业可以通过 Nvidia AI Enterprise 平台在加速数据中心和云基础设施上运行这些模型。