智东西拉斯维加斯1月6日报道,今日,在年度“科技风向标”国际消费电子展(CES 2025)开幕前夕,英伟达创始人兼CEO黄仁勋发表主题演讲,智东西作为受邀媒体从现场发来报道。
“皮衣老黄”不愧是科技圈顶流,演讲火爆程度堪比热门明星演唱会,开场前2个半小时门外已经排起长队。
18:42,热场音乐戛然而止,会场霎时从人声鼎沸转为屏息凝神,一段开场视频后,黄仁勋穿了件闪亮的新皮衣,意气风发地走上演讲台,与现场观众寒暄。
皮衣开光追是假,但新显卡GeForce RTX 50系列的光追是实打实的强。黄仁勋称Blackwell融合了AI驱动的神经网络渲染和光线年前推出可编程着色技术以来最重要的计算机图形创新。
光是在硬件上,黄仁勋就接连整活儿,先搬出一个由72块Blackwell GPU组成的NVLink72巨型“盾牌”,并现场cosplay起美国队长,引起现场观众的欢呼。
在最后的One More Thing环节,黄仁勋发布单手可持的全球最小AI超级计算机Project DIGITS,搭载全新GB10超级芯片,小到能塞进口袋里,堪称“掌上超算”。如果将两台相连,能跑4050亿个参数的AI模型,3000美元起售。
此外,黄仁勋连珠炮般亮出一全新基础模型,以及面向AI agents、物理AI、人形机器人、无人驾驶的多款新品。
作为科技圈知名“预言家”,黄仁勋对AI的前瞻性判断,对接下来科技产业走向极具参考价值。
他判断在感知AI、生成式AI后,AI浪潮的下一站是代理型AI(Agentic AI),再之后是物理AI(Physical AI)。黄仁勋相信,机器人的ChatGPT时刻马上就要来临,而世界基础模型对于推进机器人和无人驾驶汽车的开发至关重要。
黄仁勋还现场公布了一些人形机器人、无人驾驶汽车合作厂商。其国内人形机器人合作伙伴有星动纪元、智元、傅里叶、银河通用、宇树科技、小鹏等,国内无人驾驶合作伙伴有比亚迪、理想、蔚来、小米、极氪等。
英伟达GeForce RTX 50系列是第一款支持FP4精度的消费类GPU,将FLUX等模型的AI图像生成性能提高到上一代硬件的2倍,并能在更小的内存占用中本地运行。
该系列GPU还内置第九代NVIDIA编码器,用于高级视频编辑,支持4:2:2专业级色彩格式,并配备DLSS 4和32GB VRAM,以解决大规模的3D项目。
RTX 50系列采用Blackwell架构、第五代Tensor Cores、第四代RT Cores,在AI渲染领域,包括神经网络着色器、数字人技术、几何图形和光照等方面取得突破。
DLSS 4首次推出多帧生成技术,借助AI可为每个渲染帧生成多达3帧,从而进一步提升帧率。该技术可与全套DLSS技术协同运行,相比传统渲染技术相比,性能提升高达8倍,同时通过NVIDIA Reflex技术保证响应速度。
DLSS 4还引入了图形行业第一个实时应用的Transformer模型架构。基于Transformer的DLSS超分辨率和光纤重建模型有2倍的参数量和4倍以上的计算量,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。
此外,NVIDIA Reflex 2引入了Frame Warp创新技术,可在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,以此来降低游戏延迟,相比原生渲染最高可减少75%的延迟,提高游戏响应速度。
英伟达还推出了RTX神经网络着色器(RTX Neural Shaders),将小型AI网络融入可编程着色器,为实时游戏带来电影级的材质、光照等。
RTX Neural Faces只需使用简单的光栅化面孔和3D面部姿态数据作为输入,就可以使用生成式AI实时渲染具有时间稳定性的逼真面孔,配备了全新的支持光线追踪毛发和皮肤的 RTX技术。全新RTX Mega Geometry可将场景中的光线追踪三角形数量至多增加100倍,提升游戏角色及环境线系列的出色AI算力能够在游戏渲染的同时为自主游戏角色提供动力。英伟达推出了一套
,使游戏角色能够像人类玩家一样感知、计划和行动。由ACE驱动的自主角色被整合到《绝地求生》和即将推出的生活模拟游戏《InZOI》,以及Wemade Next的《MIR5》中。NVIDIA Broadcast应用为主播带来两项AI驱动功能:可升级麦克风音频质量的
,可对面部重新打光的虚拟补光 (Virtual Key Light)。Streamlabs推出由NVIDIA ACE和Inworld驱动的智能直播助手,担任助播、制作和技术助手的角色以增强直播效果。
本地运行的基础模型。这些模型作为NIM微服务提供,由RTX 50系列GPU加速。适配RTX AI PC的AI基础模型涵盖大语言模型、视觉语言模型、图像生成模型、语音模型、检索增强生成(RAG)的嵌入模型、PDF提取和计算机视觉模型等。
NIM微服务及PC上运行AI的所有必要组件均已针对所有英伟达GPU的部署进行了优化。
黄仁勋提到英伟达想将AI放到PC上,希望让Windows PC成为世界级的AI PC,而一个方法是Windows WSL 2(Windows Subsystem for Linux 2),它有两个操作系统,针对云原生应用程序进行了优化,开箱即用。
。它能够让信息触手可及,协助用户使用桌面应用、视频电话会议、阅读和总结文档等。R2X将在数月内向RTX50系列和笔记本电脑用户开放下载。
英伟达判断代理型AI代表了生成式AI进化的下一波浪潮,使AI能解决复杂的多步骤问题、复杂推理和规划。
:最具成本效益的模型,针对低延迟的实时应用程序进行了优化,很适合部署在PC和边缘设备上;
:精度最高的型号,专为要求最高性能的数据中心规模应用而设计。这些模型基于Llama构建,可帮助研发人员在一系列应用程序中创建和部署AI agent,包括客户支持、欺诈检测、产品供应链和库存管理优化。
Llama Nemotron模型使用英伟达最新技术和高质量数据集进行蒸馏、修剪和训练,使模型足够小,能在各种计算平台上运行,同时提供高精度和增加的模型吞吐量,增强了agent能力,擅长指令遵循、聊天、函数调用、编程和数学。
”,目标使全球2500万名软件研发人员能轻松将AI集成到各行业的应用程序中,为超10亿的知识工作者构建agents。AI Blueprint提供NVIDIA NIM微服务、NeMo和代理型AI框架,可实现AI agents的编排、管理与可追溯性。只需点击一下,研发人员就能构建和运行新的代理型AI Blueprint。
有了AI Blueprint,研发人员可以构建和部署能做推理、规划的自定义AI agent并采取行动,并采取行动快速分析大量数据,从视频、PDF及图像中总结和提取实时见解。
要管理、监控、协调多个AI agents一起工作,对编排系统提出很高要求。英伟达与CrewAI、Daily、LangChain、LlamaIndex、Weights & Biases五家代理型AI编排和管理工具供应商合作构建AI Blueprint,用于软件开发、实时语音对话、结构化报告生成、博客创建、AI虚拟助手等。
,将复杂PDF文件轻松转换成好理解的、用自然声音叙述的对话式播客。另一个用于
,涉及公共部门招聘、电信代理协助联络中心、保险理赔承保、银行遗留现代化、消费品和服务的收入增长管理、生命科学临床试验伙伴、工业资产故障排除和B2B营销等。
物理AI将改变价值50万亿美元的产业,涉及1000亿的工厂、20万的仓库、未来数十亿计的人形机器人和15亿的汽车及卡车。
用于在数据中心训练基于AI的堆栈;2)在OVX系统上运行Omniverse用于模拟和合成数据生成;3)AGX车载计算机用于处理实时传感器数据以确保安全。这三款计算机同样被用来构建物理AI,在此基础上,英伟达今日发布了又一新组成部分——
,还有先进的视频tokenizer、护栏和加速数据处理流程,专为开发机器人和自动驾驶而设计,旨在加速先进物理AI开发。这些模型接受了18000万亿次tokens的训练,包括2000万小时的真实世界自动驾驶、机器人、无人机镜头和合成数据。模型也有3款:
:用于高性能基线B):以获得最大的质量和保真度,最适合用于提取定制模型。
开发人员可使用这些开放模型,从文本、图像、视频等输入以及机器人传感器或运动数据的组合中生成基于物理的视频,也可以用其生成合成数据以增强训练数据集,还可以通过微调这些世界基础模型来构建定制模型。
护栏模型,确保可靠、安全地使用。相比最先进的方法,Cosmos的tokenizers提供8倍的总压缩和12倍的处理速度,在训练和推理方面提供了更出色的质量和更低的计算成本。
Isaac GR00T合成运动生成Blueprint,用于帮助开发人员从少量人类演示中生成指数级大的合成数据集,以使用模仿学习训练人形机器人。
波士顿动力、Figure等人形机器人公司已经开始采用并展示Isaac GR00T的结果。
Mega工业机器人队列数字孪生:由Omniverse Sensor RTX API提供支持,用于在部署到现实世界的设施之前,在数字孪生中大规模开发、测试和优化物理AI和机器人队列。
2)自动驾驶汽车仿真:由Omniverse Sensor RTX API提供支持,使自动驾驶汽车开发人能回放驾驶数据,生成新的地面真实数据并执行闭环测试,以加速其开发管道。
3)面向苹果Vision Pro的Omniverse空间流播:帮助研发人员创建面向苹果Vision Pro大规模工业数字孪生沉浸式流播的应用程序。
4)面向计算机辅助工程(CAE)的实时数字孪生:基于NVIDIA CUDA-X加速、物理AI和Omniverse库构建的参考工作流,可实现实时物理可视化。
其中Mega为公司可以提供包含NVIDIA加速计算、AI、Isaac和Omniverse技术的参考架构,用于开发和测试数字孪生,用于测试驱动机器人、视频分析AI agents、设备等的AI驱动机器人大脑,以处理巨大的复杂性和规模。
按照英伟达的划分,计算范式已从手搓代码+“检索+CPU+软件1.0”时代的转变向由机器学习主导的“生成+GPU+软件2.0”时代。RTX AI PC已经让访问部署最新生成式AI模型慢慢的变随手可得。接下来企业级AI agents将成为AI工厂的核心,通过生成tokens,在各行各业创造前所未有的智能和生产力。