NVIDIA Llama Nemotron

使用先进的开放式推理基础模型构建 AI 智能体平台。

概述

什么是 Llama Nemotron?

NVIDIA Llama Nemotron 是一套先进的模型,在推理和多种代理式 AI 任务方面表现出色。这些模型针对从数据中心到个人电脑等各类平台进行了优化,在研究生水平的科学推理、高等数学运算、编程、指令执行以及工具调用等方面表现卓越。

这些模型能够打开和关闭推理功能,从而在任务不需要深度思考时降低推理成本。

NVIDIA 推出用于构建 AI Agent 平台的开放式推理模型系列

内置推理模型系列的新 Llama Nemotron 经过 NVIDIA 的后训练,为代理式 AI 做好业务准备。

使用开放式 NVIDIA Llama Nemotron 模型为企业构建先进的 AI 推理 Agents

了解 NVIDIA 是如何基于 Llama 开源模型开发出具备推理能力的 Llama Nemotron 模型家族的,以及又是如何利用 DeepSeek-R1 的推理专业技术对其进行后期训练的。

优势

Llama Nemotron 为代理式 AI 带来了什么?

高准确率

Llama Nemotron 开放模型系列基于 Llama,利用 Llama 卓越的知识和经 NVIDIA 审查的 DeepSeek-R1 推理能力进行后训练,在领先基准测试中实现了最高准确性。

高计算效率

该系列已针对低延迟和最高吞吐量进行了优化,降低了生产中运行模型的成本,并且提供了打开或关闭推理的选项,进一步缩短了查询计算时间。

具备商业可行性

NVIDIA 的后训练数据和优化技术可确保为开发者和企业提供强大、透明、灵活的模型。

透明、安全

这些模型保留了 Llama 的互联网级知识,可部署在用户的安全 GPU 加速平台上。

模型

适用于不同工作负载的推理模型

从轻量级推理到复杂决策涉及的长期思考,Llama Nemotron 系列可满足企业 AI 智能体的多样化需求。

Nano

为 PC 和边缘设备提供出色的准确性

Super

利用最强推理能力处理棘手的任务,并且针对数据中心的规模进行优化

Ultra

为复杂系统提供最高的代理准确性,并且针对多 GPU 数据中心规模进行优化

技术

代理式 AI 的基础模组

开始使用 NVIDIA NeMo™ 构建 AI 代理,以实现自定义代理式 AI,使用 NVIDIA NIM™ 实现快速的企业级部署,并使用 NVIDIA Blueprints 加速开发自定义参考工作流。

NVIDIA NIM

  • 加快部署性能经优化的生成式 AI 模型。
  • 利用稳定而安全的 API 运行业务应用,并享受企业级支持。

NVIDIA Blueprints

  • 快速开始使用生成式 AI 用例的参考应用,例如数字人和多模态检索增强生成 (RAG)。
  • 借助 Blueprints 中包含的合作伙伴微服务、一个或多个 AI 智能体、参考代码、定制文档,以及用于部署的 Helm 图表加速开发。

NVIDIA NeMo

  • 构建、定制并部署生成式 AI 和代理式 AI。
  • 交付企业就绪大语言模型 (LLM),提供精确的数据管护、前沿定制、可扩展的数据采集、RAG 和加速性能。
  • 轻松构建数据飞轮,并利用最新信息持续优化 AI 智能体。

启动选项

Llama Nemotron 入门方法

开始免费原型设计

开始使用由 NVIDIA DGX Cloud 提供支持的、简单易用的 NIM API 端点。

  • 访问全面加速的 AI 基础设施。
  • 确保数据不用于模型训练。
  • 无预付,仅需简单的构建、测试和部署路径。

联系我们

与 NVIDIA AI 专家交流,了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持,将试运行的生成式 AI 投入生产。

  • 了解您的生成式 AI 用例。
  • 讨论您的技术要求。
  • 根据您的目标和要求调整 NVIDIA AI 解决方案。

采用者

使用 Llama Nemotron 的企业

资源

了解 Llama Nemotron 的最新信息

NVIDIA 推出用于构建 AI Agent 平台的开放式推理模型系列

该系列经过 NVIDIA 的后训练,在 Llama 的基础上开发而成,并通过 DeepSeek-R1 进行模型蒸馏,探索这个系列并了解这些模型如何满足部署就绪型 AI 智能体的业务需求。

使用开放式 NVIDIA Llama Nemotron 模型构建先进的 AI 推理 Agents

了解 NVIDIA 是如何基于 Llama 开源模型开发出具备推理能力的 Llama Nemotron 模型家族的,以及又是如何利用 DeepSeek-R1 的推理专业技术对其进行后期训练的。

构建定制推理模型,实现高级代理式 AI 自主性

了解如何利用各种技术构建或定制推理模型,包括蒸馏和强化学习。

后续步骤

准备好开始了吗?

使用合适的工具和技术,将 Llama Nemotron 模型从开发阶段向生产阶段推进。

联系我们

与 NVIDIA 产品专家交流,了解如何借助 NVIDIA AI Enterprise 提供的安全性、API 稳定性和支持从试运行阶段向生产阶段推进。

及时了解 NVIDIA 代理式 AI 新闻

获取最新的代理式 AI 新闻、技术、突破等信息,直接发送到您的收件箱。

OSZAR »