가격 폭락 70%: AI 컴퓨팅 파워 임대 거품은 어떻게 터졌는가?

2024-10-22 17:39:51

수집

지금 새로운 H100 GPU를 구매하는 데 투자하면 대체로 손해를 볼 가능성이 높습니다. 그러나 특별한 경우, 예를 들어 프로젝트가 할인된 H100을 구매할 수 있거나 저렴한 전력 비용이 있을 때, 또는 AI 제품이 시장에서 충분한 경쟁력을 갖추었을 때 투자하는 것이 합리적일 수 있습니다.

위챗으로 스캔하기

출처: Eugene Cheah Substack 계정

저자: Eugene Cheah

편집: J1N, Techub News

AI 연산 비용이 감소함에 따라 스타트업들이 저비용 자원을 활용하여 혁신을 추구하는 열풍이 일어날 것입니다.

작년 AI 연산 공급이 부족하여 H100의 임대료가 시간당 8달러에 달했으나, 현재 시장에서는 연산 공급이 과잉되어 가격이 시간당 2달러 이하로 떨어졌습니다. 이는 일부 기업들이 초기 단계에서 연산 임대 계약을 체결했기 때문이며, 과잉된 연산 자원이 낭비되지 않도록 예약한 계산 자원을 재판매하기 시작했습니다. 시장의 대부분은 오픈 소스 모델을 사용하기로 선택하여 새로운 모델에 대한 수요가 감소했습니다. 현재 H100의 공급량은 수요를 훨씬 초과하므로 H100을 임대하는 것이 구매하는 것보다 더 경제적이며, 새로운 H100을 구매하는 것은 더 이상 수익성이 없습니다.

AI 경쟁의 간략한 역사

GPU 연산 시장의 가격은 급등하였고, H100의 초기 임대료는 시간당 약 4.70달러에서 최고 8달러를 초과했습니다. 이는 프로젝트 창립자들이 다음 라운드 자금을 확보하고 투자자를 설득하기 위해 AI 모델을 신속히 훈련해야 했기 때문입니다.

ChatGPT는 2022년 11월에 출시되었으며, A100 시리즈 GPU를 사용했습니다. 2023년 3월, NVIDIA는 새로운 H100 시리즈 GPU를 출시하였고, H100의 성능이 A100보다 3배 강력하다고 홍보했지만 가격은 A100보다 2배 높을 뿐이었습니다.

이는 AI 스타트업들에게 큰 매력으로 작용했습니다. GPU의 성능은 그들이 개발할 수 있는 AI 모델의 속도와 규모를 직접적으로 결정하기 때문입니다. H100의 강력한 성능은 이러한 기업들이 이전보다 더 빠르고, 더 크고, 더 효율적인 AI 모델을 개발할 수 있게 하였으며, OpenAI와 같은 업계 리더를 추격하거나 초과할 가능성도 있었습니다. 물론, 이는 그들이 대량의 H100을 구매하거나 임대할 수 있는 충분한 자본을 보유하고 있어야만 가능합니다.

H100의 성능이 크게 향상되었고 AI 분야의 치열한 경쟁 덕분에 많은 스타트업들이 H100을 사들이기 위해 막대한 자금을 투입하여 모델 훈련을 가속화하고자 했습니다. 이러한 수요의 급증은 H100의 임대료를 폭등시켰고, 초기에는 시간당 4.70달러였으나 나중에는 8달러를 초과했습니다.

이러한 스타트업들이 높은 임대료를 기꺼이 지불하는 이유는 그들이 모델을 신속히 훈련하여 다음 라운드 자금 조달에서 투자자의 주목을 끌고 수억 달러의 자금을 확보하여 비즈니스를 계속 확장하고자 하기 때문입니다.

H100 GPU를 대량으로 보유한 연산 센터(팜)에게는 GPU 임대 수요가 매우 높습니다. 이는 마치 "문 앞에 돈이 오는 것"과 같습니다. 이유는 이러한 AI 스타트업들이 H100을 임대하여 모델을 훈련하고자 급하게 임대하려 하며, 심지어 임대료를 선불로 지불할 의향이 있기 때문입니다. 이는 GPU 농장이 장기적으로 시간당 4.70달러(또는 그 이상)로 GPU를 임대할 수 있음을 의미합니다.

계산에 따르면, 만약 그들이 이러한 가격으로 GPU를 지속적으로 임대할 수 있다면, H100 구매에 대한 투자 수익 회수 기간(즉, 구매 비용을 회수하는 시간)은 1.5년 이하가 될 것입니다. 회수 기간이 끝난 후, 이후 각 GPU는 매년 10만 달러 이상의 순현금 흐름을 가져올 수 있습니다.

H100 및 기타 고성능 GPU에 대한 수요가 지속적으로 증가함에 따라 GPU 농장의 투자자들은 막대한 이익을 기대하게 되었고, 그들은 이러한 비즈니스 모델에 동의할 뿐만 아니라 더 많은 GPU를 구매하여 더 많은 이익을 얻기 위해 추가 투자를 하였습니다.

《튤립의 어리석음》: 기록된 역사상 첫 번째 투기 거품 이후, 튤립 가격은 1634년에 지속적으로 상승하였고, 1637년 2월에 붕괴되었습니다

인공지능과 빅데이터 처리 수요의 증가로 기업들은 고성능 GPU(특히 NVIDIA의 H100)에 대한 수요가 급증하였고, 이러한 계산 집약적인 작업을 지원하기 위해 전 세계 기업들은 하드웨어와 인프라에 초기 약 6000억 달러를 투자하여 GPU 구매, 데이터 센터 구축 등을 통해 계산 능력을 향상시켰습니다. 그러나 공급망 지연으로 인해 H100의 가격은 2023년 대부분의 시간 동안 높은 수준을 유지하였고, 심지어 시간당 4.70달러를 초과하였으며, 구매자가 대규모 보증금을 선불로 지불할 의향이 없으면 가격이 하락하지 않았습니다. 2024년 초에는 더 많은 공급자가 시장에 진입하면서 H100의 임대료가 약 2.85달러로 떨어졌지만, 나는 다양한 판매 이메일을 받기 시작하였고, 이는 시장 공급 증가 후 경쟁이 심화된 상황을 반영합니다.

초기 H100 GPU의 임대료가 시간당 8달러에서 16달러 사이였지만, 2024년 8월에는 경매식 임대료가 시간당 1달러에서 2달러로 하락하였습니다. 시장 가격은 매년 40% 이상 하락할 것으로 예상되며, 이는 NVIDIA가 예측한 4년 내에 시간당 4달러를 유지할 것이라는 기대를 훨씬 초과합니다. 이러한 급격한 가격 하락은 고가의 새로운 GPU를 방금 구매한 사람들에게 재정적 위험을 안겨주고 있습니다. 그들은 임대를 통해 비용을 회수하지 못할 수 있습니다.

5만 달러를 투자하여 H100을 구매했을 때의 자본 수익률은 얼마인가?

전력 및 냉각 비용을 고려하지 않을 경우, H100의 구매 비용은 약 5만 달러이며, 예상 사용 수명은 5년입니다. 임대는 일반적으로 두 가지 모델이 있습니다: 단기 필요 임대와 장기 예약. 단기 임대는 가격이 비싸지만 유연성이 뛰어나고, 장기 예약은 가격이 저렴하지만 안정적입니다. 다음으로, 이 두 가지 모델의 수익을 분석하여 투자자가 5년 내에 비용을 회수하고 수익을 얻을 수 있는지 계산할 것입니다.

단기 필요 임대

임대 가격 및 해당 수익:

>$2.85 : 주식 시장 IRR을 초과하여 수익을 실현합니다.

\<$2.85 : 수익이 주식 시장 수익률에 미치지 못합니다.

\<$1.65 : 예상 투자 손실입니다.

"혼합 가격" 모델을 통해 예측할 때, 향후 5년 내에 임대료가 현재 가격의 50%로 하락할 가능성이 있습니다. 만약 임대료가 시간당 4.50달러로 유지된다면, 투자 수익률(IRR)은 20%를 초과하여 수익성이 있을 것입니다. 그러나 가격이 2.85달러로 하락하면 IRR은 10%에 불과하여 수익이 크게 감소합니다. 가격이 2.85달러 이하로 떨어지면 투자 수익률은 주식 시장 수익률보다 낮아질 수 있으며, 가격이 1.65달러 이하로 떨어지면 투자자는 심각한 손실 위험에 직면하게 됩니다. 특히 최근 H100 서버를 구매한 사람들에게는 더욱 그렇습니다.

주: "혼합 가격"은 H100의 임대 가격이 향후 5년 내에 현재 가격의 절반으로 점진적으로 하락할 것이라는 가정입니다. 이 추정치는 현재 시장 가격이 매년 40% 이상 하락하고 있기 때문에 가격 하락을 고려하는 것이 합리적이라고 여겨집니다.

장기 예약 임대 계약(3년 이상)

AI 열풍 기간 동안, 많은 전통적인 인프라 제공업체들은 과거의 경험을 바탕으로, 특히 암호화폐 초기 이더리움 PoW 시대에 GPU 임대 가격이 급등과 급락을 겪었던 주기를 고려하여, 2023년에 3-5년의 고가 선불 임대 계약을 출시하여 이익을 확보하고자 하였습니다. 이러한 계약은 일반적으로 고객이 시간당 4달러 이상의 가격을 지불하도록 요구하며, 심지어 임대료의 50%에서 100%를 선불로 지불하도록 요구합니다. AI 수요가 급증함에 따라, 특히 이미지 생성 분야의 기본 모델 회사들은 시장 선점을 위해 최신 GPU 클러스터를 먼저 사용하고자 하였고, 이러한 계약 가격이 비쌌음에도 불구하고, 그들은 목표 모델을 신속히 완성하고 경쟁력을 높이기 위해 계약을 체결해야 했습니다. 그러나 모델 훈련이 완료된 후, 이러한 회사들은 더 이상 이러한 GPU 자원이 필요하지 않게 되었지만, 계약의 제약으로 인해 쉽게 탈퇴할 수 없었습니다. 손실을 줄이기 위해 그들은 이러한 임대 GPU 자원을 재판매하여 일부 비용을 회수하기로 선택했습니다. 이로 인해 시장에는 대량의 재판매 GPU 자원이 등장하게 되었고, 공급이 증가하여 시장의 임대 가격과 수급 관계에 영향을 미쳤습니다.

현재 H100 가치 사슬

주: 가치 사슬(Value chain)은 가치 사슬 분석, 가치 사슬 모델 등으로도 알려져 있으며, 마이클 포터가 1985년 《경쟁 우위》라는 책에서 제안한 것입니다. 포터는 기업이 독특한 경쟁 우위를 발전시키기 위해서는 상품 및 서비스에 더 높은 부가 가치를 창출해야 하며, 비즈니스 전략은 기업의 운영 모델을 구조화하여 일련의 부가 가치 프로세스를 형성한다고 지적했습니다. 이 일련의 부가 가치 프로세스가 바로 "가치 사슬"입니다.

H100 가치 사슬은 하드웨어에서 AI 추론 모델까지 이어지며, 그 참여 부분은 대략 다음과 같이 분류할 수 있습니다.

NVIDIA와 협력하는 하드웨어 공급업체
데이터 센터 인프라 제공업체 및 파트너
벤처 캐피탈, 대기업 및 스타트업: 기본 모델을 구축할 계획(또는 이미 모델 구축 완료)
용량 유통업체: Runpod, SFCompute, Together.ai, Vast.ai, GPUlist.ai 등.

현재 H100 가치 사슬은 하드웨어 공급업체에서 데이터 센터 제공업체, AI 모델 개발 회사, 용량 유통업체 및 AI 추론 서비스 제공업체 등 여러 단계를 포함합니다. 시장의 주요 압력은 사용되지 않는 H100 용량 유통업체가 지속적으로 유휴 자원을 재판매하거나 임대하고 있으며, "충분히 좋은" 오픈 소스 모델(예: Llama 3)의 광범위한 사용으로 인해 H100에 대한 수요가 감소하고 있습니다. 이 두 가지 요인은 H100 공급 과잉을 초래하여 시장 가격에 하방 압력을 가하고 있습니다.

시장 동향: 오픈 소스 가중치 모델의 부상

오픈 소스 가중치 모델은 공식적인 오픈 소스 라이선스는 없지만 그 가중치가 공개적으로 무료로 배포되고 상업 분야에서 널리 사용되는 모델을 의미합니다.

이러한 모델의 사용 수요는 두 가지 주요 요인에 의해 촉진됩니다: 첫째, GPT-4 규모의 대형 오픈 소스 모델(예: LLaMA3 및 DeepSeek-v2)의 출현, 둘째, 소형(80억 매개변수) 및 중형(700억 매개변수) 미세 조정 모델의 성숙과 광범위한 채택입니다.

이러한 오픈 소스 모델의 성숙도가 높아짐에 따라 기업들은 이를 쉽게 확보하고 사용하여 대부분의 AI 애플리케이션의 요구를 충족할 수 있게 되었습니다. 특히 추론 및 미세 조정 측면에서 그렇습니다. 이러한 모델이 특정 기준 테스트에서 독점 모델보다 약간 뒤처질 수 있지만, 그 성능은 대부분의 상업적 사용 사례를 처리하기에 충분히 좋습니다. 따라서 오픈 소스 가중치 모델의 보급과 함께 추론 및 미세 조정에 대한 수요가 빠르게 증가하고 있습니다.

오픈 소스 가중치 모델의 세 가지 주요 장점:

첫째, 오픈 소스 모델은 매우 높은 유연성을 제공하여 사용자가 특정 분야나 작업에 따라 모델을 미세 조정할 수 있게 하여 다양한 애플리케이션에 더 잘 적응할 수 있도록 합니다. 둘째, 오픈 소스 모델은 신뢰성을 제공합니다. 모델 가중치가 일부 독점 모델처럼 사전 통지 없이 업데이트되지 않기 때문에 업데이트로 인한 개발 문제를 피할 수 있으며, 이는 사용자가 모델에 대한 신뢰를 높입니다. 마지막으로, 이는 보안성과 개인 정보를 보장합니다. 기업은 자신의 프롬프트와 고객 데이터가 제3자 API 엔드포인트를 통해 유출되지 않도록 보장할 수 있으며, 데이터 개인 정보 위험을 줄일 수 있습니다. 이러한 장점들이 오픈 소스 모델의 지속적인 성장과 광범위한 채택을 촉진하고 있으며, 특히 추론 및 미세 조정 측면에서 그렇습니다.

중소형 모델 제작자의 수요 전환

중소형 모델 제작자는 대형 기본 모델(예: 70B 매개변수)을 처음부터 훈련할 능력이나 계획이 없는 기업이나 스타트업을 의미합니다. 오픈 소스 모델의 부상으로 인해 많은 기업들은 기존 오픈 소스 모델을 미세 조정하는 것이 새 모델을 처음부터 훈련하는 것보다 경제적이라는 것을 깨닫게 되었습니다. 따라서 점점 더 많은 기업들이 모델을 직접 훈련하기보다는 미세 조정을 선택하고 있습니다. 이는 H100과 같은 계산 자원에 대한 수요를 크게 줄였습니다.

미세 조정은 처음부터 훈련하는 것보다 훨씬 저렴합니다. 기존 모델을 미세 조정하는 데 필요한 계산 자원은 처음부터 기본 모델을 훈련하는 데 필요한 것보다 훨씬 적습니다. 대형 기본 모델의 훈련은 일반적으로 16개 이상의 H100 노드를 필요로 하지만, 미세 조정은 일반적으로 1개에서 4개 노드만 필요합니다. 이러한 산업의 변화는 중소형 기업들이 대규모 클러스터에 대한 수요를 줄이고, H100 계산 능력에 대한 의존도를 직접적으로 감소시켰습니다.

또한, 기본 모델 생성에 대한 투자가 줄어들었습니다. 2023년, 많은 중소형 기업들이 새로운 기본 모델을 만들기 위해 시도했지만, 이제는 혁신(예: 더 나은 아키텍처 또는 수백 가지 언어 지원)을 가져오지 않는 한 새로운 기본 모델 생성 프로젝트는 거의 없을 것입니다. 이는 시장에 이미 충분히 강력한 오픈 소스 모델(예: Llama 3)이 존재하기 때문에 소형 기업들이 새로운 모델을 만드는 타당성을 입증하기 어렵기 때문입니다. 투자자들의 관심과 자금도 처음부터 훈련하는 모델보다 미세 조정으로 전환되어 H100 자원에 대한 수요를 더욱 줄였습니다.

마지막으로, 예약된 노드의 과잉 용량도 문제입니다. 많은 기업들이 2023년 정점기에 H100 자원을 장기 예약했지만, 미세 조정으로 전환하면서 이 예약된 노드가 더 이상 필요하지 않게 되었고, 일부 하드웨어는 도착할 때 이미 구식이 되었습니다. 이러한 사용되지 않는 H100 노드는 현재 재판매되거나 임대되어 시장 공급을 더욱 증가시키고 H100 자원 공급 과잉을 초래하고 있습니다.

전반적으로 모델 미세 조정의 보급, 중소형 기본 모델 생성의 감소, 예약된 노드의 과잉으로 인해 H100 시장 수요가明显하게 감소하고 공급 과잉 상황이 심화되고 있습니다.

GPU 연산 공급 증가와 수요 감소를 초래하는 기타 요인

대형 모델 제작자의 오픈 소스 클라우드 플랫폼 탈퇴

대형 AI 모델 제작자들인 Facebook, X.AI 및 OpenAI는 점차 공공 클라우드 플랫폼에서 자체 구축한 개인 계산 클러스터로 전환하고 있습니다. 첫째, 기존의 공공 클라우드 자원(예: 1000개 노드 클러스터)은 그들이 더 큰 모델을 훈련하는 데 필요한 요구를 충족할 수 없습니다. 둘째, 재정적 관점에서 볼 때, 자체 구축 클러스터가 더 유리합니다. 데이터 센터, 서버 등의 자산을 구매하면 회사의 가치를 증가시킬 수 있지만, 공공 클라우드를 임대하는 것은 비용 지출에 불과하여 자산을 증가시키지 못합니다. 또한, 이러한 회사들은 충분한 자원과 전문 팀을 보유하고 있으며, 심지어 소형 데이터 센터 회사를 인수하여 이러한 시스템을 구축하고 관리하는 데 도움을 줄 수 있습니다. 따라서 그들은 더 이상 공공 클라우드에 의존하지 않게 되었습니다. 이러한 회사들이 공공 클라우드 플랫폼에서 탈퇴함에 따라, 계산 자원에 대한 수요가 감소하고 사용되지 않는 자원이 시장에 재진입하여 공급이 증가할 수 있습니다.

Vast.ai는 본질적으로 자유 시장 시스템으로, 전 세계의 공급자들이 서로 가격 경쟁을 합니다.

유휴 및 지연 출하된 H100의 동시 출시

유휴 및 지연 출하된 H100 GPU가 동시에 출시되면서 시장 공급량이 증가하여 가격이 하락하게 되었습니다. Vast.ai와 같은 플랫폼은 자유 시장 모델을 채택하여 전 세계 공급자들이 가격을 서로 경쟁하고 있습니다. 2023년, H100 출하 지연으로 인해 많은 자원이 제때 출시되지 못했으나, 이제 이러한 지연된 H100 자원이 시장에 진입하고 있으며, 새로운 H200 및 B200 장치와 함께 스타트업 및 기업의 유휴 계산 자원이 공급되고 있습니다. 소형 및 중형 클러스터의 소유자들은 일반적으로 8개에서 64개 노드를 보유하고 있지만, 낮은 활용도와 자금 고갈로 인해 자원을 저렴한 가격에 임대하여 비용을 조속히 회수하려고 합니다. 이를 위해 그들은 고정 요금, 경매 시스템 또는 자유 시장 가격 책정 방식을 통해 고객과 경쟁하기로 선택하며, 특히 경매 및 자유 시장 모델은 공급자가 자원이 임대되도록 보장하기 위해 가격을 인하하도록 경쟁하게 하여 전체 시장 가격이 크게 하락하게 됩니다.

더 저렴한 GPU 대체품

또 다른 주요 요인은 연산 비용이 예산을 초과하면 AI 추론 인프라에 많은 대체 옵션이 있다는 것입니다. 특히 작은 모델을 실행하는 경우 H100을 사용하는 데 추가 비용을 지불할 필요가 없습니다.

Nvidia 시장 세분화

H100 GPU의 AI 추론 작업에서 더 저렴한 대체품의 출현은 시장에서 H100에 대한 수요에 직접적인 영향을 미칩니다. 첫째, H100이 AI 모델의 훈련 및 미세 조정에 매우 뛰어난 성능을 보이지만, 추론(즉, 모델 실행) 분야에서는 많은 더 저렴한 GPU가 수요를 충족할 수 있습니다. 특히 작은 모델에 대해 그렇습니다. 추론 작업은 H100의 고급 기능(예: Infiniband 네트워크)을 필요로 하지 않기 때문에 사용자는 더 경제적인 대체 솔루션을 선택하여 비용을 절감할 수 있습니다.

Nvidia는 추론 시장에서도 대체 제품을 제공하고 있으며, L40S는 추론 전용 GPU로 H100의 성능이 약 1/3에 불과하지만 가격은 1/5에 불과합니다. L40S는 다중 노드 훈련에서는 H100보다 성능이 떨어지지만, 단일 노드 추론 및 소형 클러스터의 미세 조정에는 충분히 강력하여 사용자에게 더 나은 비용 효율성을 제공합니다.

H100 Infiniband 클러스터 성능 구성표(2024년 8월)

AMD 및 Intel 대체 공급업체

또한, AMD와 Intel도 가격이 더 저렴한 GPU를 출시하였습니다. 예를 들어, AMD의 MX300 및 Intel의 Gaudi 3입니다. 이러한 GPU는 추론 및 단일 노드 작업에서 우수한 성능을 보이며, 가격이 H100보다 저렴하고 더 많은 메모리와 계산 능력을 갖추고 있습니다. 비록 이들이 대형 다중 노드 클러스터 훈련에서 완전히 검증되지 않았지만, 추론 작업에서는 이미 충분히 성숙하여 H100의 강력한 대체품이 되고 있습니다.

이러한 더 저렴한 GPU는 대부분의 추론 작업을 처리할 수 있는 것으로 입증되었으며, 특히 일반적인 모델 아키텍처(예: LLaMA 3)에서의 추론 및 미세 조정 작업에 적합합니다. 따라서 사용자는 호환성 문제를 해결한 후 이러한 대체 GPU를 선택하여 비용을 절감할 수 있습니다. 요약하자면, 추론 분야의 이러한 대체품은 H100을 점차 대체하고 있으며, 특히 소규모 추론 및 미세 조정 작업에서 H100에 대한 수요를 더욱 줄이고 있습니다.

Web3 분야 GPU 사용률 감소

암호화폐 시장의 변화로 인해 GPU의 암호화 채굴에서의 사용률이 감소하였고, 많은 GPU가 클라우드 시장으로 유입되었습니다. 비록 이러한 GPU가 하드웨어 제한으로 인해 복잡한 AI 훈련 작업을 수행할 수는 없지만, 간단한 AI 추론 작업에서는 좋은 성능을 보이며, 특히 예산이 제한된 사용자에게는 10B 매개변수 이하의 작은 모델을 처리하는 데 매우 경제적인 선택이 됩니다. 최적화를 통해 이러한 GPU는 대형 모델도 실행할 수 있으며, H100 노드를 사용하는 것보다 비용이 더 저렴합니다.

AI 연산 임대 거품 이후 현재 시장은 어떤가?

현재 진입 시 직면하는 문제: 새로운 공공 클라우드 H100 클러스터가 시장에 늦게 진입하여 수익을 내기 어려울 수 있으며, 일부 투자자들은 큰 손실을 입을 수 있습니다.

새로 시장에 진입한 H100 공공 클라우드 클러스터는 수익성 도전에 직면하고 있습니다. 임대 가격이 너무 낮게 설정되면(2.25달러 이하) 운영 비용을 충당할 수 없어 손실이 발생할 수 있으며, 가격이 너무 높게 설정되면(3달러 이상) 고객을 잃어 생산 능력이 유휴 상태가 될 수 있습니다. 또한, 시장에 늦게 진입한 클러스터는 초기 높은 가격(4달러/시간)을 놓쳤기 때문에 비용을 회수하기 어려워 투자자들은 수익을 내지 못할 위험에 처하게 됩니다. 이는 클러스터 투자를 매우 어렵게 만들며, 심지어 투자자들이 큰 손실을 입을 수 있는 상황을 초래합니다.

초기 진입자의 수익 상황: 초기 장기 임대 계약을 체결한 중형 또는 대형 모델 제작자들은 이미 비용을 회수하고 수익을 실현하였습니다.

중형 및 대형 모델 제작자들은 H100 계산 자원을 장기 임대하여 가치를 얻었으며, 이러한 자원의 비용은 자금 조달 시 이미 포함되었습니다. 일부 계산 자원이 완전히 활용되지 않았지만, 이러한 회사들은 자금 조달 시장을 통해 현재 및 미래의 모델 훈련에 이러한 클러스터를 사용하고 있으며, 그로부터 가치를 추출하였습니다. 사용되지 않는 자원이 있더라도, 그들은 재판매 또는 임대를 통해 추가 수익을 얻을 수 있어 시장 가격을 낮추고 부정적인 영향을 줄이며, 전체적으로 생태계에 긍정적인 영향을 미치고 있습니다.

거품 붕괴 이후: 저렴한 H100이 오픈 소스 AI 채택의 물결을 가속화할 수 있다

저렴한 H100 GPU의 출현은 오픈 소스 AI의 발전을 촉진할 것입니다. H100 가격이 하락함에 따라 AI 개발자와 아마추어들은 오픈 소스 가중치 모델을 더 저렴하게 실행하고 미세 조정할 수 있어 이러한 모델의 채택이 더 널리 퍼질 것입니다. 만약 미래에 폐쇄형 모델(예: GPT5++)가 중대한 기술 혁신을 이루지 못한다면, 오픈 소스 모델과 폐쇄형 모델 간의 격차는 줄어들 것이며, AI 애플리케이션의 발전을 촉진할 것입니다. AI 추론 및 미세 조정 비용이 감소함에 따라 새로운 AI 애플리케이션의 물결이 일어날 수 있으며, 시장의 전반적인 발전을 가속화할 수 있습니다.

결론: 새로운 H100을 구매하지 마십시오

현재 새로운 H100 GPU에 투자하는 것은 대개 손실을 초래할 가능성이 높습니다. 그러나 특별한 경우, 예를 들어 프로젝트가 할인된 H100을 구매할 수 있거나 저렴한 전력 비용이 있거나 AI 제품이 시장에서 충분한 경쟁력을 갖추고 있을 때 투자하는 것이 합리적일 수 있습니다. 만약 투자를 고려하고 있다면, 자금을 다른 분야나 주식 시장에 투자하여 더 나은 수익률을 얻는 것을 권장합니다.