황仁勋 최신 CES 연설: AI 에이전트가 다음 로봇 산업이 될 것으로 기대되며, 규모는 수조 달러에 이를 것으로 보인다
整理:새로운 소식
오늘 오전 개막한 CES 2025에서 엔비디아 창립자이자 CEO인 젠슨 황이 AI와 컴퓨팅의 미래를 밝히는 이정표적인 기조연설을 진행했습니다. 생성 AI의 핵심 토큰 개념부터 새로운 블랙웰 아키텍처 GPU의 발표, AI 주도의 디지털 미래에 이르기까지, 이 연설은 다양한 분야의 시각으로 전체 산업에 깊은 영향을 미칠 것입니다.
1) 생성 AI에서 에이전틱 AI로: 새로운 시대의 서막
토큰의 탄생: 생성 AI의 핵심 동력으로서, 토큰은 글자를 지식으로 변환하고, 이미지에 생명을 불어넣어 새로운 디지털 표현 방식을 열었습니다.
AI 진화 경로: 감지 AI, 생성 AI에서 추론, 계획, 행동이 가능한 에이전틱 AI로, AI 기술은 끊임없이 새로운 고도를 넘어가고 있습니다.
트랜스포머의 혁명: 2018년 출시 이후, 이 기술은 계산 방식을 재정의하고 전통 기술 스택을 완전히 뒤엎었습니다.
2) 블랙웰 GPU: 성능 한계 돌파
차세대 지포스 RTX 50 시리즈: 블랙웰 아키텍처를 기반으로 920억 개의 트랜지스터, 4000 TOPS AI 성능 및 4 페타플롭스의 연산력을 갖추고 있으며, 이전 세대 성능의 세 배에 달합니다.
AI와 그래픽의 융합: 프로그래머블 셰이더와 신경망의 결합을 최초로 실현하여 신경 텍스처 압축 및 재질 셰이딩 기술을 도입, 놀라운 렌더링 효과를 제공합니다.
보편적 고성능: RTX 5070 노트북은 $1299의 가격으로 RTX 4090 성능을 실현하여 고성능 컴퓨팅의 보급을 촉진합니다.
3) AI 응용의 다분야 확장
기업급 AI 에이전트: NVIDIA는 네모(Nemo)와 라마 네모트론(Llama Nemotron)과 같은 도구를 제공하여 기업이 자율 추론 디지털 직원을 구축하고 스마트한 관리 및 서비스를 실현하도록 돕습니다.
물리 AI: 옴니버스(Omniverse)와 코스모스(Cosmos) 플랫폼을 통해 AI는 산업, 자율주행 및 로봇 분야에 통합되어 글로벌 제조 및 물류를 재정의합니다.
미래 컴퓨팅 시나리오: NVIDIA는 AI를 클라우드에서 개인 장치 및 기업 내부로 가져오고, 개발자부터 일반 사용자까지 모든 컴퓨팅 요구를 충족시키고 있습니다.
다음은 젠슨 황의 이번 연설의 주요 내용입니다:
이곳은 지혜의 탄생지, 새로운 공장------ 생성 토큰의 발전기입니다. 그것은 AI의 구성 모듈로서 새로운 분야를 열고 비범한 세계로 나아가는 첫걸음을 내딛게 합니다. 토큰은 글자를 지식으로 변환하고, 이미지에 생명을 불어넣습니다; 그것들은 창의력을 비디오로 변환하여 우리가 어떤 환경에서도 안전하게 탐색할 수 있도록 돕습니다; 로봇이 대가처럼 움직이는 법을 가르치고, 우리가 새로운 방식으로 승리를 축하하도록 자극합니다. 우리가 가장 필요로 할 때, 토큰은 내면의 평화를 가져다줄 수 있습니다. 그것들은 디지털 의미를 부여하고, 우리가 세상을 더 잘 이해하고 잠재적인 위험을 예측하며 내면의 위협을 치료할 방법을 찾도록 돕습니다. 그것은 우리의 비전을 실현하고, 우리가 잃어버린 모든 것을 복구할 수 있게 합니다.
AI의 모든 것은 1993년 엔비디아가 첫 번째 제품인 NV1을 출시하면서 시작되었습니다. 우리는 일반 컴퓨터가 할 수 없는 일을 수행할 수 있는 컴퓨터를 만들고자 했고, 이는 PC에서 게임기를 소유할 수 있게 만들었습니다. 이후 1999년, 엔비디아는 프로그래머블 GPU를 발명하여 20년 이상의 기술 발전을 열어 현대 컴퓨터 그래픽을 가능하게 했습니다. 6년 후, 우리는 CUDA를 출시하여 풍부한 알고리즘으로 GPU의 프로그래머블성을 표현했습니다. 이 기술은 처음에는 설명하기 어려웠지만, 2012년 AlexNet의 성공은 CUDA의 잠재력을 검증하며 AI의 혁신적인 발전을 촉진했습니다.
그 이후로 AI는 놀라운 속도로 발전해왔습니다. 감지 AI에서 생성 AI로, 그리고 감지, 추론, 계획 및 행동이 가능한 에이전틱 AI로, AI의 능력은 계속해서 향상되고 있습니다. 2018년 구글이 트랜스포머를 출시하면서 AI의 세계는 진정으로 비상했습니다. 트랜스포머는 AI의 패러다임을 완전히 변화시켰을 뿐만 아니라 전체 컴퓨팅 분야를 재정의했습니다. 우리는 머신러닝이 단순한 새로운 응용 프로그램이나 비즈니스 기회가 아니라, 컴퓨팅 방식에 대한 근본적인 혁신임을 깨달았습니다. 수동으로 명령을 작성하는 것에서 머신러닝을 통해 신경망을 최적화하는 것으로, 기술 스택의 모든 층에서 거대한 변화가 일어났습니다.
현재 AI의 응용은 어디에나 존재합니다. 글자, 이미지, 소리 이해는 물론 아미노산과 물리학 번역까지 모두 수행할 수 있습니다. 거의 모든 AI 응용은 세 가지 질문으로 요약될 수 있습니다: 그것은 어떤 모달리티의 정보를 학습했는가? 어떤 모달리티의 정보를 번역했는가? 어떤 모달리티의 정보를 생성했는가? 이러한 기본 개념은 AI 주도의 모든 응용을 추진하고 있습니다.
이 모든 성과는 GeForce의 지원 없이는 불가능했습니다. GeForce는 AI를 대중화했으며, 이제 AI는 GeForce로 돌아오고 있습니다. 실시간 레이 트레이싱 기술 덕분에 우리는 놀라운 효과로 그래픽을 렌더링할 수 있습니다. DLSS를 통해 AI는 프레임 생성을 넘어 미래의 장면을 예측할 수 있습니다. 3300만 화소 중 200만 화소만이 계산된 것이고, 나머지는 AI가 예측하여 생성한 것입니다. 이러한 기적 같은 기술은 AI의 강력한 능력을 보여주며, 계산을 더욱 효율적으로 만들고 미래의 무한한 가능성을 보여줍니다.
이것이 지금 이렇게 많은 놀라운 일이 일어나는 이유입니다. 우리는 GeForce를 통해 AI의 발전을 촉진했으며, 이제 AI는 GeForce를 완전히 혁신하고 있습니다. 오늘 우리는 차세대 제품인 RTX 블랙웰 가족을 발표합니다. 함께 살펴보겠습니다.
이것은 블랙웰 아키텍처를 기반으로 한 새로운 GeForce RTX 50 시리즈입니다. 이 GPU는 920억 개의 트랜지스터, 4000 TOPS의 AI 성능 및 4 페타플롭스의 AI 연산력을 갖춘 성능 괴물로, 이전 세대 아다 아키텍처보다 세 배 높은 성능을 자랑합니다. 이 모든 것은 제가 방금 보여준 놀라운 픽셀을 생성하기 위해서입니다. 또한 380 레이 트레이싱 테라플롭스를 제공하여 계산이 필요한 픽셀에 가능한 한 아름다운 화질을 제공하며, 125 셰이딩 테라플롭스도 갖추고 있습니다. 이 그래픽 카드는 마이크론의 G7 비디오 메모리를 사용하여 속도가 초당 1.8TB에 달하며, 이전 세대의 두 배 성능을 자랑합니다.
우리는 이제 AI 작업 부하와 컴퓨터 그래픽 작업 부하를 결합할 수 있습니다. 이 세대 제품의 비범한 특징 중 하나는 프로그래머블 셰이더가 신경망을 처리할 수 있다는 것입니다. 이를 통해 우리는 신경 텍스처 압축 및 신경 재질 셰이딩을 발명했습니다. 이러한 기술은 AI가 텍스처와 압축 알고리즘을 학습하여 최종적으로 AI만이 실현할 수 있는 놀라운 이미지 효과를 생성합니다.
기계 설계 측면에서도 이 그래픽 카드는 기적입니다. 이 카드는 이중 팬 디자인을 채택하여 전체 그래픽 카드가 거대한 팬처럼 보이며, 내부 전압 조절 모듈은 최첨단입니다. 이러한 뛰어난 디자인은 전적으로 엔지니어 팀의 노력 덕분입니다.
다음은 성능 비교입니다. 여러분이 잘 아는 RTX 4090은 $1599로 가정용 PC 엔터테인먼트 센터의 핵심 투자입니다. 이제 RTX 50 시리즈는 더 높은 성능을 제공하면서 시작 가격이 단 $549에 불과하며, RTX 5070에서 RTX 5090까지 성능은 RTX 4090의 두 배입니다.
더욱 놀라운 것은 이러한 고성능 GPU를 노트북에 탑재했다는 점입니다. RTX 5070 노트북은 $1299에 판매되지만 RTX 4090의 성능을 갖추고 있습니다. 이 디자인은 AI와 컴퓨터 그래픽 기술을 결합하여 높은 효율성과 고성능을 실현합니다.
미래의 컴퓨터 그래픽은 신경 렌더링------ AI와 컴퓨터 그래픽의 융합이 될 것입니다. 블랙웰 시리즈는 두께가 단 14.9mm인 노트북에서도 구현할 수 있으며, RTX 5070에서 RTX 5090까지의 전체 제품군이 초슬림 노트북에 적합합니다.
GeForce는 AI의 보급을 촉진했으며, 이제 AI는 GeForce를 완전히 혁신하고 있습니다. 이는 기술과 지능의 상호 촉진으로, 우리는 더 높은 경지로 나아가고 있습니다.
AI의 세 가지 스케일링 법칙
다음으로 AI의 발전 방향에 대해 이야기해 보겠습니다.
1) 사전 훈련 스케일링 법칙
AI 산업은 가속화되고 있으며, 이 과정을 추진하는 것은 '스케일링 법칙'이라는 강력한 모델입니다. 이 경험 법칙은 연구자와 산업계에서 반복적으로 검증되어, 훈련 데이터의 규모가 클수록, 모델의 규모가 클수록, 계산 능력의 투입이 많을수록 모델의 능력도 강해진다는 것을 보여줍니다.
데이터의 증가 속도는 기하급수적으로 빨라지고 있습니다. 향후 몇 년 동안 인류가 매년 생산하는 데이터 양은 인류 역사상 생산된 총량을 초과할 것으로 추정됩니다. 이러한 데이터는 비디오, 이미지 및 소리와 같은 형태로 다중 모달화되고 있습니다. 이러한 방대한 데이터는 AI의 기초 지식 체계를 훈련하는 데 사용되어 AI의 견고한 지식 기반을 구축합니다.
2) 후 훈련 스케일링 법칙
그 외에도 두 가지 스케일링 법칙이 떠오르고 있습니다.
두 번째 스케일링 법칙은 '후 훈련 스케일링 법칙'으로, 강화 학습 및 인간 피드백과 같은 기술을 포함합니다. 이러한 방식으로 AI는 인간의 질의에 따라 답변을 생성하고, 인간의 피드백을 통해 지속적으로 개선됩니다. 이 강화 학습 시스템은 고품질의 프롬프트를 통해 AI가 특정 분야의 기술을 연마하도록 돕습니다. 예를 들어, 수학 문제 해결이나 복잡한 추론을 더 잘 수행할 수 있도록 합니다.
AI의 미래는 단순히 감지와 생성이 아니라, 지속적으로 자기 개선하고 경계를 넘는 과정입니다. 이는 마치 멘토나 코치가 되어, 작업을 완료한 후 피드백을 제공하는 것과 같습니다. 테스트, 피드백 및 자기 개선을 통해 AI는 유사한 강화 학습 및 피드백 메커니즘을 통해 발전할 수 있습니다. 이러한 후 훈련 단계의 강화 학습은 합성 데이터 생성 기술과 결합되어 자기 연습의 과정과 유사합니다. AI는 정리 정리와 같은 복잡하고 검증 가능한 문제에 직면하여, 정리 정리를 증명하거나 기하학 문제를 해결하는 등의 작업을 통해 자신의 답변을 지속적으로 최적화합니다. 이러한 후 훈련은 막대한 계산 능력을 필요로 하지만, 궁극적으로 비범한 모델을 창출할 수 있습니다.
3) 테스트 시간 스케일링 법칙
테스트 시간 스케일링 법칙도 점차 부각되고 있습니다. 이 법칙은 AI가 실제로 사용될 때 독특한 잠재력을 보여줍니다. AI는 추론 시 동적으로 자원을 할당할 수 있으며, 더 이상 매개변수 최적화에 국한되지 않고, 고품질의 답변을 생성하기 위해 계산 할당에 집중합니다.
이 과정은 직접적인 추론이나 일회성 답변이 아닌, 추론적 사고와 유사합니다. AI는 문제를 여러 단계로 나누고, 여러 해결책을 생성하여 평가한 후 최적의 해결책을 선택할 수 있습니다. 이러한 장기적인 추론은 모델 능력을 향상시키는 데 효과적입니다.
우리는 ChatGPT에서 GPT-4, 그리고 현재의 Gemini Pro에 이르기까지 이러한 기술의 진화를 목격했습니다. 모든 시스템은 사전 훈련, 후 훈련 및 테스트 시간 확장의 점진적인 발전을 겪고 있습니다. 이러한 돌파구를 실현하기 위해서는 막대한 계산 능력이 필요하며, 이것이 바로 엔비디아 블랙웰 아키텍처의 핵심 가치입니다.
블랙웰 아키텍처 최신 소개
블랙웰 시스템은 전면 생산 중이며, 그 성능은 놀랍습니다. 현재 모든 클라우드 서비스 제공업체가 이러한 시스템을 배포하고 있으며, 이들은 전 세계 45개 공장에서 생산되고 있으며, 액체 냉각, 공기 냉각, x86 아키텍처 및 엔비디아 그레이스 CPU 버전 등 최대 200종의 구성을 지원합니다.
그 핵심 구성 요소인 NVLink 시스템 자체는 무게가 1.5톤에 달하며, 60만 개의 부품을 가지고 있어 20대 자동차의 복잡성에 해당하며, 2마일의 구리선과 5000개의 케이블이 연결되어 있습니다. 전체 제조 과정은 극히 복잡하지만, 목표는 계산 수요의 지속적인 확대에 부응하는 것입니다.
이전 세대 아키텍처와 비교하여 블랙웰은 와트당 성능을 4배 향상시켰고, 달러당 성능을 3배 향상시켰습니다. 이는 동일한 비용으로 모델 훈련 규모를 3배 늘릴 수 있음을 의미하며, 이러한 개선의 핵심은 생성 AI 토큰입니다. 이러한 토큰은 ChatGPT, Gemini 및 다양한 AI 서비스에서 광범위하게 사용되며, 미래 컴퓨팅의 기초가 됩니다.
이러한 기반 위에 엔비디아는 AI와 컴퓨터 그래픽을 완벽하게 융합한 새로운 컴퓨팅 모델인 신경 렌더링을 추진하고 있습니다. 블랙웰 아키텍처 하의 72개 GPU는 세계에서 가장 큰 단일 칩 시스템을 구성하여 최대 1.4 ExaFLOPS의 AI 부동 소수점 성능을 제공하며, 메모리 대역폭은 놀라운 1.2 PB/s에 달합니다. 이는 전 세계 모든 인터넷 트래픽의 총합에 해당합니다. 이러한 슈퍼 컴퓨팅 능력은 AI가 더 복잡한 추론 작업을 처리할 수 있게 하며, 동시에 비용을 크게 줄여 더 효율적인 컴퓨팅의 기초를 마련합니다.
AI 에이전트 시스템과 생태계
미래를 바라보면, AI의 추론 과정은 더 이상 단순한 단일 단계 응답이 아니라 '내부 대화'에 더 가까워질 것입니다. 미래의 AI는 단순히 답변을 생성하는 것이 아니라, 반성하고 추론하며 지속적으로 최적화할 것입니다. AI 토큰 생성 속도가 증가하고 비용이 감소함에 따라 AI의 서비스 품질은 크게 향상되어 더 넓은 응용 요구를 충족할 것입니다.
기업이 자율 추론 능력을 갖춘 AI 시스템을 구축할 수 있도록 엔비디아는 세 가지 핵심 도구를 제공합니다: 엔비디아 네모(NeMo), AI 마이크로서비스 및 가속 라이브러리. 복잡한 CUDA 소프트웨어와 딥러닝 모델을 컨테이너화된 서비스로 패키징하여 기업은 이러한 AI 모델을 어떤 클라우드 플랫폼에서든 배포하고, 특정 분야에 맞춘 AI 에이전트를 신속하게 개발할 수 있습니다. 예를 들어, 기업 관리 지원 서비스 도구나 사용자 상호작용을 위한 디지털 직원 등이 있습니다.
이러한 모델은 기업에 새로운 가능성을 열어줄 뿐만 아니라, AI 응용 개발의 장벽을 낮추고, 전체 산업이 에이전틱 AI(자율 AI) 방향으로 나아가는 데 중요한 발걸음을 내딛게 합니다. 미래의 AI는 디지털 직원이 되어 SAP, ServiceNow 등 기업 도구에 쉽게 통합되어 다양한 환경에서 고객에게 스마트 서비스를 제공할 것입니다. 이는 AI 확장의 다음 이정표이자 엔비디아 기술 생태계의 핵심 비전입니다.
훈련 평가 시스템. 미래의 이러한 AI 에이전트는 본질적으로 직원과 함께 일하며, 여러분의 작업을 수행하는 디지털 노동력입니다. 따라서 이러한 전문화된 에이전트를 여러분의 회사에 도입하는 것은 새로운 직원의 입사를 처리하는 것과 같습니다. 우리는 이러한 AI 에이전트가 회사의 고유한 언어, 어휘, 비즈니스 프로세스 및 작업 방식을 배우도록 돕는 다양한 도구 라이브러리를 제공합니다. 여러분은 그들에게 작업 결과의 예시를 제공해야 하며, 그들은 이를 생성하려고 시도할 것입니다. 그 후 여러분은 피드백을 제공하고 평가하는 등의 작업을 수행할 수 있습니다. 동시에 여러분은 그들이 수행할 수 없는 작업이나 말할 수 없는 내용을 명확히 하고, 그들이 접근할 수 있는 정보를 제어하는 등의 제한을 설정할 것입니다. 이 전체 디지털 직원 프로세스는 네모(Nemo)라고 불립니다. 어느 정도까지는 각 회사의 IT 부서가 AI 에이전트의 HR 부서가 될 것입니다.
현재 IT 부서는 많은 소프트웨어를 관리하고 유지하고 있습니다. 미래에는 그들이 많은 디지털 에이전트를 관리하고 육성하며, 입사시키고 개선하여 회사에 서비스를 제공할 것입니다. 따라서 IT 부서는 점차 AI 에이전트의 HR 부서로 발전할 것입니다.
또한 우리는 생태계에서 사용할 수 있는 많은 오픈 소스 청사진을 제공합니다. 사용자는 이러한 청사진을 자유롭게 수정할 수 있습니다. 우리는 다양한 유형의 에이전트를 위한 청사진을 제공합니다. 오늘 우리는 매우 멋지고 똑똑한 것을 발표합니다: 우리는 라마(Llama)를 기반으로 한 새로운 모델 가족인 엔비디아 라마 네모 트론(Nemo Tron) 언어 기반 모델 시리즈를 출시했습니다.
라마 3.1은 현상적인 모델입니다. 메타의 라마 3.1 다운로드 수는 약 350,650,000회에 달하며, 약 60,000종의 다른 모델이 파생되었습니다. 이는 거의 모든 기업과 산업이 AI 연구를 시작하게 된 핵심 이유 중 하나입니다. 우리는 라마 모델이 기업 사용 사례에 대해 더 나은 미세 조정을 할 수 있다는 것을 깨달았습니다. 우리의 전문 지식과 능력을 활용하여 이를 라마 네모트론 개방 모델 키트로 미세 조정했습니다.
이 모델들은 다양한 크기로 나뉩니다: 소형 모델은 빠른 응답을 제공하며; 주류의 슈퍼 모델인 슈퍼 라마 네모트론은 일반 용도의 모델입니다; 초대형 모델인 울트라 모델은 다른 모델을 평가하고 답변을 생성하며 그 품질을 결정하는 교사 모델로 사용되거나 지식 증류 모델로 사용될 수 있습니다. 이 모든 모델은 현재 온라인에 있습니다.
이 모델들은 뛰어난 성능을 발휘하며, 대화, 지시 및 정보 검색 등 분야의 순위에서 상위에 위치하여 전 세계적으로 AI 에이전트 기능에 매우 적합합니다.
우리는 생태계와의 협력도 매우 긴밀하게 진행하고 있습니다. 예를 들어, ServiceNow, SAP, Siemens와의 산업 AI 협력입니다. Cadence와 Perplexity와 같은 회사도 훌륭한 프로젝트를 진행하고 있습니다. Perplexity는 검색 분야를 혁신하고, Codium은 전 세계 3,000만 소프트웨어 엔지니어를 지원합니다. AI 어시스턴트는 소프트웨어 개발자의 생산성을 크게 향상시킬 것이며, 이는 AI 서비스의 다음 거대한 응용 분야입니다. 전 세계에는 10억 명의 지식 근로자가 있으며, AI 에이전트는 다음 로봇 산업이 될 수 있으며, 잠재력은 수조 달러에 달합니다.
AI 에이전트 청사진
다음은 파트너와 함께 완료한 AI 에이전트 청사진 몇 가지를 보여드립니다.
AI 에이전트는 새로운 디지털 노동력으로, 인간의 작업을 지원하거나 대체할 수 있습니다. 엔비디아의 에이전틱 AI 구축 모듈, NEM 사전 훈련 모델 및 네모(Nemo) 프레임워크는 조직이 AI 에이전트를 쉽게 개발하고 배포할 수 있도록 돕습니다. 이러한 에이전트는 특정 분야의 작업 전문가로 훈련될 수 있습니다.
다음은 네 가지 예시입니다:
연구 보조 에이전트: 복잡한 문서(강의, 저널, 재무 보고서 등)를 읽고, 학습을 용이하게 하는 대화형 팟캐스트를 생성할 수 있습니다;
소프트웨어 보안 AI 에이전트: 개발자가 소프트웨어 취약점을 지속적으로 스캔하고, 적절한 조치를 취하도록 알림을 제공합니다;
가상 실험실 AI 에이전트: 화합물 설계 및 선별을 가속화하여 잠재적인 약물 후보를 신속하게 찾습니다;
비디오 분석 AI 에이전트: 엔비디아 메트로폴리스 청사진을 기반으로 수십억 개의 카메라에서 데이터를 분석하고, 대화형 검색, 요약 및 보고서를 생성합니다. 예를 들어, 교통 흐름 모니터링, 시설 프로세스 개선 제안 등을 제공합니다;
물리 AI 시대의 도래
우리는 AI를 클라우드에서 각 구석으로 가져오고자 하며, 기업 내부와 개인 PC를 포함합니다. 엔비디아는 윈도우 WSL 2(윈도우 서브시스템)를 AI 지원 플랫폼으로 전환하기 위해 노력하고 있습니다. 이를 통해 개발자와 엔지니어는 엔비디아의 AI 기술 스택(언어 모델, 이미지 모델, 애니메이션 모델 등)을 보다 쉽게 활용할 수 있습니다.
또한 엔비디아는 물리 세계의 동적 특성을 이해하는 데 중점을 둔 최초의 물리 세계 기반 모델 개발 플랫폼인 코스모스를 출시했습니다. 이는 물리 법칙에 부합하는 비디오 및 장면을 생성하여 로봇, 산업 AI 및 다중 모달 언어 모델의 훈련 및 검증에 광범위하게 사용됩니다.
코스모스는 엔비디아 옴니버스와 연결하여 물리 시뮬레이션을 제공하고, 신뢰할 수 있는 시뮬레이션 결과를 생성합니다. 이러한 결합은 로봇 및 산업 응용 개발의 핵심 기술입니다.
엔비디아의 산업 전략은 세 가지 컴퓨팅 시스템에 기반합니다:
AI 훈련을 위한 DGX 시스템;
AI 배포를 위한 AGX 시스템;
강화 학습 및 AI 최적화를 위한 디지털 트윈 시스템;
이 세 가지 시스템의 협력 작업을 통해 엔비디아는 로봇 및 산업 AI의 발전을 촉진하고, 미래의 디지털 세계를 구축하고 있습니다. 이는 삼체 문제라기보다는 '삼 컴퓨터' 해결책입니다.
엔비디아의 로봇 비전을 통해 세 가지 예시를 보여드리겠습니다.
1) 산업 시각화의 응용
현재 전 세계에는 수백만 개의 공장과 수십만 개의 창고가 있으며, 이들은 50조 달러 규모의 제조업의 중추를 형성하고 있습니다. 미래에는 이 모든 것이 소프트웨어 정의 및 자동화를 실현하고 로봇 기술을 통합해야 합니다. 우리는 세계 최고의 창고 자동화 솔루션 제공업체인 Keon과 세계 최대의 전문 서비스 제공업체인 Accenture와 협력하여 디지털 제조에 집중하고, 매우 특별한 솔루션을 공동으로 창출하고 있습니다. 우리의 시장 접근 방식은 다른 소프트웨어 및 기술 플랫폼과 유사하며, 개발자 및 생태계 파트너를 통해 이루어지며, 점점 더 많은 생태계 파트너가 옴니버스 플랫폼에 접속하고 있습니다. 이는 모든 사람이 산업의 미래를 시각화하고 싶어하기 때문입니다. 이 50조 달러의 글로벌 GDP에서 많은 낭비와 자동화 기회가 존재합니다.
Keon과 Accenture가 우리와 협력한 이 예시를 살펴보겠습니다:
Keon(공급망 솔루션 회사), Accenture(글로벌 전문 서비스 선도 기업) 및 엔비디아는 물리 AI를 가치가 수조 달러에 달하는 창고 및 물류 센터 시장에 도입하고 있습니다. 효율적인 창고 물류 관리는 복잡한 의사 결정 네트워크를 처리해야 하며, 이러한 결정은 매일 및 계절적 수요 변화, 공간 제약, 노동력 공급, 다양한 로봇 및 자동화 시스템의 통합과 같은 끊임없이 변화하는 변수의 영향을 받습니다. 현재 물리 창고의 운영 핵심 성과 지표(KPI)를 예측하는 것은 거의 불가능합니다.
이러한 문제를 해결하기 위해 Keon은 메가(엔비디아 옴니버스 청사진)를 사용하여 산업 디지털 트윈을 구축하고 로봇 차량대를 테스트하고 최적화하고 있습니다. 먼저, Keon의 창고 관리 솔루션은 디지털 트윈의 산업 AI 두뇌에 작업을 할당합니다. 예를 들어, 화물을 완충 구역에서 셔틀 저장 솔루션으로 이동시키는 것입니다. 로봇 차량대는 옴니버스의 물리 창고 시뮬레이션 환경에서 감지 및 추론을 통해 작업을 수행하고, 다음 동작을 계획하고 실행합니다. 디지털 트윈 환경은 센서 시뮬레이션을 사용하여 로봇 두뇌가 작업 수행 후 상태를 볼 수 있게 하고, 다음 동작을 결정합니다. 메가의 정밀 추적 아래, 전체 사이클은 지속적으로 진행되며, 물리 창고에 대한 변경이 이루어지기 전에 처리량, 효율성 및 활용률과 같은 운영 KPI를 측정합니다.
엔비디아와의 협력을 통해 Keon과 Accenture는 산업 자율의 미래를 재정의하고 있습니다.
미래의 모든 공장은 실제 공장과 완전히 동기화된 디지털 트윈을 가질 것입니다. 여러분은 옴니버스와 코스모스를 활용하여 미래의 다양한 시나리오를 생성할 수 있으며, AI는 최적의 KPI 시나리오를 결정하고 이를 실제 공장 배포의 제약 조건 및 AI 프로그래밍 논리로 삼을 것입니다.
2) 자율주행차
자율주행 혁명이 도래했습니다. 수년간의 발전 끝에, 웨이모와 테슬라의 성공은 자율주행 기술의 성숙을 증명했습니다. 우리의 솔루션은 이 산업에 세 가지 컴퓨터 시스템을 제공합니다: AI 훈련을 위한 시스템(DGX 시스템), 시뮬레이션 테스트 및 합성 데이터 생성을 위한 시스템(옴니버스 및 코스모스), 그리고 차량 내 컴퓨터 시스템(AGX 시스템)입니다. 전 세계 거의 모든 주요 자동차 회사가 웨이모, 주크스, 테슬라, 세계 최대 전기차 회사인 BYD와 협력하고 있습니다. 또한 혁신적인 모델을 곧 출시할 메르세데스, 루시드, 리비안, 샤오미 및 볼보와 같은 회사도 있습니다. 오로라는 엔비디아 기술을 사용하여 자율주행 트럭을 개발하고 있습니다.
매년 1억 대의 자동차가 제조되고, 전 세계 도로에는 10억 대의 자동차가 운행되며, 매년 총 주행 거리는 조 단위에 달합니다. 이러한 차량들은 점차 고도 자동화 또는 완전 자동화를 실현할 것입니다. 이 산업은 수조 달러 규모의 로봇 산업이 될 것으로 예상됩니다.
오늘 우리는 차세대 차량 내 컴퓨터인 토르(Thor)를 발표합니다. 이는 카메라, 고해상도 레이더, 라이다 등 센서의 대량 데이터를 처리할 수 있는 범용 로봇 컴퓨터입니다. 토르는 현재 업계 표준인 오린(Orin)의 20배의 계산 능력을 갖춘 업그레이드 버전으로, 현재 전면 생산 중입니다. 또한 엔비디아의 드라이브 OS는 기능 안전 최고 기준(ISO 26262 ASIL D)을 충족하는 최초의 AI 컴퓨터 운영 체제입니다.
자율주행 데이터 공장
엔비디아는 옴니버스 AI 모델과 코스모스 플랫폼을 활용하여 자율주행 데이터 공장을 생성하고, 합성 주행 장면을 통해 훈련 데이터를 대폭 확장합니다. 여기에는 다음이 포함됩니다:
옴니맵: 지도와 지리 공간 데이터를 융합하여 주행 가능한 3D 환경을 구축합니다;
신경 재구성 엔진: 센서 로그를 활용하여 고충실도의 4D 시뮬레이션 환경을 생성하고, 훈련 데이터에 대한 장면 변형을 생성합니다;
에디파이 3DS: 자산 라이브러리에서 새로운 자산을 검색하거나 생성하여 시뮬레이션을 위한 장면을 만듭니다.
이러한 기술을 통해 우리는 수천 번의 주행 장면을 수십억 마일의 데이터로 확장하여 더 안전하고 진보된 자율주행 시스템 개발에 기여하고 있습니다.
3) 범용 로봇
범용 로봇의 시대가 다가오고 있습니다. 이 분야의 돌파구를 이끄는 핵심은 훈련입니다. 인간형 로봇의 경우 모방 데이터 수집이 상대적으로 어렵지만, 엔비디아의 아이작 그루트(Isaac Groot)는 해결책을 제공합니다. 이는 시뮬레이션을 통해 방대한 데이터 세트를 생성하고, 옴니버스와 코스모스의 다중 우주 시뮬레이션 엔진을 결합하여 정책 훈련, 검증 및 배포를 수행합니다.
예를 들어, 개발자는 애플 비전 프로를 통해 로봇을 원격으로 조작하고, 실제 로봇 없이 데이터를 수집하며, 위험 없는 환경에서 작업 동작을 교육할 수 있습니다. 옴니버스의 영역 무작위화 및 3D에서 실제 장면으로 확장 기능을 통해 데이터 세트를 기하급수적으로 증가시켜 로봇 학습을 위한 방대한 자원을 제공합니다.
결론적으로, 산업 시각화, 자율주행, 범용 로봇 등 모든 분야에서 엔비디아의 기술은 물리 AI와 로봇 분야의 미래 혁신을 이끌고 있습니다.
마지막으로, 제가 보여드리고 싶은 중요한 내용이 있습니다. 이 모든 것은 10년 전 회사 내부에서 시작된 프로젝트인 Project Digits(딥 러닝 GPU 인텔리전스 훈련 시스템)의 덕분입니다.
정식 출시 전에 우리는 DGX를 조정하여 회사 내부의 RTX, AGX, OVX 및 기타 시리즈 제품과 조화를 이루도록 했습니다. DGX1의 출현은 AI 발전의 방향을 실제로 바꾸었으며, 이는 엔비디아의 AI 발전에 있어 이정표가 되었습니다.
DGX1의 혁신
DGX1의 초기 목표는 연구자와 스타트업에 즉시 사용할 수 있는 AI 슈퍼컴퓨터를 제공하는 것이었습니다. 과거의 슈퍼컴퓨터는 사용자가 전용 시설을 구축하고 복잡한 인프라를 설계 및 제작해야만 존재할 수 있었습니다. 그러나 DGX1은 AI 개발을 위해 특별히 설계된 슈퍼컴퓨터로, 복잡한 작업 없이 개봉 즉시 사용할 수 있습니다.
2016년, 저는 첫 번째 DGX1을 스타트업인 오픈AI(OpenAI)에 전달했던 기억이 납니다. 그때 일론 머스크(Elon Musk), 일리야 수츠케버(Ilya Sutskever) 및 엔비디아의 많은 엔지니어들이 함께 있었고, 우리는 DGX1의 도착을 축하했습니다. 이 장치는 AI 계산의 발전을 크게 촉진했습니다.
현재 AI는 어디에나 존재합니다. 연구 기관과 스타트업 실험실에 국한되지 않고, 제가 처음 언급한 것처럼 AI는 새로운 계산 방식과 소프트웨어 개발 방식이 되었습니다. 모든 소프트웨어 엔지니어, 창의적인 예술가, 심지어 컴퓨터 도구를 사용하는 일반 사용자도 AI 슈퍼컴퓨터가 필요합니다. 하지만 저는 항상 DGX1이 좀 더 작았으면 좋겠다고 생각했습니다.
최신 AI 슈퍼컴퓨터
다음은 엔비디아의 최신 AI 슈퍼컴퓨터입니다. 이는 여전히 Project Digits에 속하며, 현재 우리는 더 나은 이름을 찾고 있으며, 여러분의 제안을 환영합니다. 이는 정말 놀라운 장비입니다.
이 슈퍼컴퓨터는 엔비디아의 전체 AI 소프트웨어 스택을 실행할 수 있으며, DGX 클라우드를 포함합니다. 이는 클라우드 슈퍼컴퓨터로 사용될 수 있을 뿐만 아니라, 고성능 워크스테이션으로도 사용될 수 있으며, 심지어 책상 위의 분석 워크스테이션으로도 사용될 수 있습니다. 가장 중요한 것은, 이는 우리가 비밀리에 개발한 새로운 칩, 코드명 GB110을 기반으로 하며, 이는 우리가 제조한 가장 소형의 그레이스 블랙웰입니다.
저는 여러분에게 이 칩의 내부 설계를 보여드리겠습니다. 이 칩은 세계 최고의 SoC 회사인 미디어텍(MediaTek)과 협력하여 개발되었습니다. 이 CPU SoC는 엔비디아를 위해 맞춤 제작되었으며, NVLink 칩 간 연결 기술을 통해 블랙웰 GPU와 연결됩니다. 이 소형 칩은 현재 전면 생산 중입니다. 우리는 이 슈퍼컴퓨터가 5월경에 공식 출시될 것으로 예상하고 있습니다.
우리는 심지어 '두 배의 계산 능력' 구성을 제공하여 이러한 장비를 ConnectX를 통해 연결하고, GPU 직접 통과(GPUDirect) 기술을 지원합니다. 이는 AI 개발, 분석 작업 및 산업 응용의 다양한 요구를 충족할 수 있는 완전한 슈퍼 컴퓨팅 솔루션입니다.
또한 우리는 세 가지 새로운 블랙웰 시스템의 칩 양산, 세계 최초의 물리 AI 기반 모델 및 세 가지 로봇 분야의 돌파구인 자율 AI 에이전트 로봇, 인간형 로봇 및 자율주행차를 발표했습니다.