
发布日期:2025-01-09 10:24 点击次数:62
作家:张雅琦汉服 足交
开头:硬 AI
机器东说念主行将迎来" ChatGPT 时刻"?英伟达在 CES 2025 重磅发布 Cosmos 天下基础模子平台,或掀翻"物理 AI "蜕变。
这个平台被称为加快"物理 AI "发展的要津一步,指标是鼓动自动驾驶汽车和机器东说念主范围迈向更高水平。
物理 AI 赋予机器东说念主更强的环境感知、泄露和交互智商。物理 AI 的跨越将极地面鼓动自动驾驶和机器东说念主等对物理场景条件较高的产业发展。黄仁勋在 CES 大会上示意,物理 AI 将绝对改变价值 50 万亿好意思元的制造业和物流业,从汽车、卡车到工场、仓库,通盘转移的事物都将收场机器东说念主化,并由 AI 运行。
据英伟达官网先容,物理 AI 体系包含以 Omniverse、Cosmos、Isaac Sim 等要津构成部分。其中 Cosmos 平台愚弄了越过 2000 万小时的视频进修数据,旨在"训导 AI 泄露物理天下"。
什么是物理 AI?
物理 AI,也称为生成式物理 AI,是一种使自主机器(如机器东说念主、自动驾驶汽车等)梗概在确切物理天下中感知、泄露和扩充复杂操作的时间。
它扩张了传统的生成式 AI,使其梗概泄露 3D 天下的空间磋议和物理行径。平庸地泄露,即是东说念主工智能反馈的履行要稳健物理律例。
举例,文生图或者文生视频模子,如若不接头物理,那生成的履行就穷乏了重力、光学等细节,在加入物理学问后,生成的履行将愈加传神。
黄仁勋早在本年早些时候就强调过," AI 的新一波海潮是物理 AI "。
物理 AI 将赋予机器东说念主更强的环境感知、泄露和交互智商。传统的机器东说念主只可按照预设步调扩充当务,而搭载物理 AI 的机器东说念主则梗概更好地泄露周围环境,并字据物理律例作念出相应的反映。它们不错更好地识别物体、斟酌设备轨迹、并在复杂环境中进行导航和操作。
"物理 AI 将绝对改变价值 50 万亿好意思元的制造业和物流业,"黄仁勋在本次 CES 海外破钞电子展上示意:
"从汽车、卡车到工场、仓库,通盘转移的事物都将收场机器东说念主化,并由 AI 运行。英伟达的 Omniverse 数字孪生操作系统和 Cosmos 物理 AI 是鼓动众人实体产业数字化的基石。"
英伟达构建了一个圆善的物理 AI 生态系统。据英伟达官网先容,物理 AI 体系包含以 Omniverse、Cosmos、Isaac Sim 等要津构成部分。
Omniverse:加快 3D 履行创作和物理仿真
Omniverse 是一个盛开平台,用于构建和皆集 3D 天下。它提供了一系列器具、API 和 SDK,使建立者梗概粗略地创建高保真、基于物理的捏造环境,用于进修和测试 AI 模子。
Omniverse 的中枢是通用场景形色(OpenUSD),它允许不同 3D 器具之间的数据互操作性。Omniverse 在这次发布中也得到了进一步的扩张,举例通过 NVIDIA Edify SimReady 生成式 AI 模子,不错自动为现存 3D 钞票添加物理后果或材质等属性,大大加快了 3D 履行的创建和准备历程。
申万宏源示意,英伟达的畴前设念念中,机器东说念主时间的发展依赖于三台中枢规划机。
一台用于进修 AI,一台用于摈弃物理仿真环境中的测试 AI,以及一台装置在机器东说念主或智能汽车里面的模拟环境规划机,撑捏物理 AI 算法。
现在正在应用的场景之一在于仿真环境中考据步调逻辑的可靠性;第二个即是获取难以从确切天下取得的数据以捏续进修 AI 模子,现在很多大厂都在选择这种神色,从软件角度,仿真范围的上风企业 Ansys,其仿真居品也不错通过英伟达的 Omniverse 进行探望,凭借 Ansys 面向录像头、激光雷达和雷达传感器的物理求解器,增强 NVIDIA DRIVE 的高保真和可扩张的 3D 环境,这关于自动驾驶系统的建立至关进军。
通过这种神色,畴前行驶历程中的所非凡据都不错及时反馈,用于决策制定,同期生成更多雷同数据以模拟更多场景,加快进修后果的普及,打破了数据获取的瓶颈。
申万宏源觉得,英伟达对 Omniverse 的多半插足预示着其算力畴前的场合主要鸠合在大模子 AI 生成、机器东说念主和智能驾驶范围。
Cosmos WFMs:让 AI 泄露物理天下的要津一步
物理 AI 的建立极为复杂,需要海量真实切天下数据和遥远间的测试,建立资本奋斗。
而英伟达的 Cosmos 平台恰是为了顾问这一痛点,通过其生成式天下基础模子提供物理仿真数据生成智商。Cosmos WFMs 让建立者梗概快速生成基于确切物理律例的高仿真数据,缩短依赖腾贵现实数据的需求。
黄仁勋在主题演讲中指出,Cosmos 平台愚弄了越过 2000 万小时的视频进修数据,旨在"训导 AI 泄露物理天下"。
这些模子通过将文本、图像、视频以及机器东说念主传感器数据勾通,生成各种化的物理环境场景,比如雪地驾驶、拥堵仓库等,从而为自动驾驶和机器东说念主建立提供要津撑捏。
Cosmos 使用了英伟达的 NeMo Curator 框架以及 CUDA 加快数据处理活水线,在 14 天内即可完成对 2000 万小时视频的处理职责,而这一任务在传统 CPU 环境下需要 3.4 年。
Cosmos Tokenizer 算作一种首先进的视觉记号器,梗概将图像和视频转动为高效的视觉记号,处理速率普及 12 倍,压缩效用普及 8 倍。
黄仁勋示意:"机器东说念主范围的‘ ChatGPT 时刻’行将到来。"和谎言语模子(LLMs)鼓动当然话语处理同样,Cosmos WFMs 被觉得是机器东说念主和自动驾驶发展的基础性器具:
"咱们创建 Cosmos 是为了让物理 AI 民主化,让每个建立东说念主员都能战斗到通用机器东说念主时间。"
不错说,Cosmos 的发布,补全了英伟达物理 AI 体系中"泄露天下"的进军一环。
多家行业巨头拥抱 Cosmos
多家早先企业仍是成为 Cosmos 的首批用户,包括 1X、Agile Robots、Waabi、Uber 等。这些企业正在愚弄 Cosmos 平台鼓动机器东说念主与自动驾驶时间的跨越。
黑丝诱惑以 Uber 为例,通过整合其丰富的驾驶数据与 Cosmos 平台和 NVIDIA DGX Cloud 的功能,Uber 正与英伟达相助加快建立安全且可扩张的自动驾驶顾问决策。
Uber 首席扩充官 Dara Khosrowshahi 示意:
"生成式东说念主工智能将为畴前的出行提供能源,这需要丰富的数据和至极雄伟的规划智商。通过与英伟达相助,咱们敬佩咱们梗概匡助加快行业安全且可扩张的自动驾驶顾问决策的建立。"
Agility 首席时间官 Pras Velagapudi 在一份声明中示意:
"数据稀缺性和多变性是机器东说念主环境中得胜学习的要津挑战。Cosmos 的文本、图像和视频到天下功能使咱们梗概在各式任务中生成和增强传神的场景,咱们不错使用这些场景来进修模子,而无需破耗多半腾贵真实切天下数据拿获。"
现在,Cosmos WFMs 已通过英伟达 NGC 和 Hugging Face 平台盛开下载,建立者可使用这些模子过火微调框架。此外汉服 足交,Cosmos 还将通过英伟达的 DGX Cloud 收场快速部署,并为企业用户提供全面撑捏。