대규모 GPU 부족 사태

in AVLE 일상2 days ago

H100 렌탈 가격 40% 상승, GPU 렌탈 가격 대시보드 출시, 컴퓨트 렌탈 시장 구조, 렌탈 가격은 계속 오를까?

  1. 폭발적인 수요의 기폭제: 클로드 코드(Claude Code)
    현재의 GPU 부족 사태는 단순히 모델 학습 때문이 아닙니다. 에이전트형 워크플로우(Agentic Workflows)의 등장이 수요 곡선을 수직으로 세웠습니다.

특히 Anthropic의 'Claude 4.6 Opus'와 'Claude Code'에 대한 수요가 폭발적으로 증가했습니다. Anthropic의 연간 반복 매출(ARR)은 지난 분기 말 90억 달러 수준에서 불과 한 분기 만에 250억 달러(약 33조 원) 이상으로 거의 3배 가까이 뛰어올랐습니다. 이는 기업들이 단순한 챗봇을 넘어, 실제 코딩과 복잡한 업무를 대행하는 AI 에이전트에 막대한 투자를 하고 있음을 시사합니다.

SemiAnalysis는 2026년 말까지 전 세계 모든 코드 커밋(Commit)의 20% 이상을 Claude Code가 점유할 것이라고 예측하고 있습니다. 이미 수십억 개의 토큰이 소비되고 있으며, 토큰당 평균 비용이 약 5달러 수준임에도 불구하고 이를 통해 절약되는 시간과 생산성 향상이 비용을 압도하고 있습니다. 이제 AI는 소프트웨어 개발 시장 자체를 집어삼키고 있습니다.

  1. GPU 렌탈 가격의 비현실적인 급등
    GPU를 구하는 일은 이제 마치 "마약 거래"나 "매진된 비행기 좌석을 구하는 것"에 비유될 정도로 험난해졌습니다.

-H100 렌탈 지수의 수직 상승: 2025년 10월, H100의 1년 계약 가격은 시간당 1.70달러로 저점을 찍었습니다. 그러나 2026년 3월 현재 이 가격은 2.35달러로 약 40% 폭등했습니다.

-온디맨드 용량의 증발: 현재 모든 유형의 GPU에 대해 '온디맨드' 용량은 사실상 완전 매진(Sold Out) 상태입니다. 이미 온디맨드 인스턴스를 확보한 사용자들은 가격이 올랐음에도 불구하고 이를 시장에 다시 내놓으려 하지 않습니다.

-서브렛(Subletting)의 등장: 마치 모나코 그랑프리 기간에 아파트를 전대하는 것처럼, 일부 사용자들은 자신들이 계약한 클러스터를 세분화하여 다른 기업에 다시 임대하는 '슬럼로드(Slumlord)'식의 기형적인 거래까지 나타나고 있습니다.

  1. 공급망의 아포칼립스: 메모리와 서버 가격의 폭주
    GPU 부족은 단순히 반도체 칩만의 문제가 아닙니다. 공급망 전반에 걸친 가격 상승이 임대료를 더욱 끌어올리고 있습니다.

2026년 1분기, 메모리 시장은 그야말로 '파라볼릭(Parabolic, 포물선형)'하게 폭등했습니다. LPDDR5 메모리 가격은 전년 대비 약 4배, DDR5 가격은 무려 6배나 올랐습니다. 이러한 부품 원가의 급증으로 인해 서버 제조사(OEM)들은 마진을 지키기 위해 원가 상승분보다 훨씬 높은 가격으로 AI 서버를 재책정했습니다.

이른바 'AI 서버 가격 아포칼립스'로 인해 클러스터 투자 비용이 급증했고, 이는 프로젝트 수익성을 악화시켜 새로운 서버 공급이 시장에 나오는 것을 억제하는 결과를 초래했습니다. 결국 공급은 줄어들고 임대 시장의 긴장감은 더욱 고조되었습니다.

  1. GPU 렌탈 시장의 3대 세그먼트 구조
    현재 시장은 크게 세 가지 층위로 나뉘어 작동하고 있습니다.

첫 번째는 단기 렌탈(Short-term Rental) 시장입니다. 여기에는 온디맨드, 스팟(Spot), 그리고 3개월 미만의 초단기 계약이 포함됩니다. 이 시장은 가격보다는 '가동률(Utilization)'이 핵심 지표입니다. 공급업체들은 가동률이 낮으면 가격을 내리고, 가동률이 꽉 차면 가격을 올리는 방식으로 대응하는데, 현재는 거의 모든 공급업체의 가동률이 한계치에 도달해 있습니다.

두 번째는 중기 계약(Mid-term Contracts) 시장으로, 3개월에서 3년 사이의 계약이 이루어집니다. 1년 단위 계약 지수가 가장 민감하게 반응하는 곳이며, 비(非) AI 연구소 형태의 기업 고객들이나 대형 구매자들로부터 밀려난 수요가 집중되는 곳입니다. 최근에는 4년 이상의 장기 계약을 체결하면서 20% 이상의 높은 선불금을 지불하는 이례적인 사례도 늘고 있습니다.

세 번째는 장기 오프테이크(Long-term Offtakes) 시장입니다. 주로 4~5년 단위의 대형 계약이 주를 이루며, 대형 AI 연구소들이 수만 개의 GPU로 구성된 거대 클러스터를 선점하는 곳입니다. 네오클라우드(Neocloud) 업체들은 이러한 장기 계약을 담보로 유리한 조건의 대출을 받아 사업을 확장하며, 때로는 대형 하이퍼스케일러들이 보증을 서기도 합니다.

  1. 블랙웰의 등장과 향후 전망: "이번에는 다를까?"
    엔비디아의 차세대 칩인 블랙웰(Blackwell, B200/B300)이 본격적으로 투입되고 있음에도 불구하고, 시장의 갈증은 전혀 해소되지 않고 있습니다.

-블랙웰 대기 시간: 최신 블랙웰 클러스터의 리드 타임(주문 후 인도 시간)은 이미 2026년 6~7월까지 밀려났으며, 8~9월 이전에 가동될 수 있는 모든 용량은 이미 예약이 완료된 상태입니다.

-실리콘 부족의 지속: TSMC의 N3 공정 웨이퍼 가용성과 HBM 메모리 공급은 여전히 매우 타이트합니다. 제조 공정상의 아주 작은 결함만 발생해도 현재의 공급 부족은 더욱 심화될 수 있습니다.

-네오클라우드의 ROIC 상승: GPU 임대 가격이 상승하고 기존 H100의 경제적 수명이 연장되면서, CoreWeave나 Nebius 같은 네오클라우드 기업들의 자본 효율성(ROIC)은 오히려 개선되고 있습니다.

결론적으로, GPU 렌탈 가격은 당분간 하락보다는 추가 상승 가능성이 훨씬 높습니다. AI 도구를 통한 투자 대비 수익(ROI)이 비용보다 월등히 높기 때문입니다. 공급이 늘어나면 수요가 그보다 더 빠르게 늘어나는 '자기 강화적 사이클'이 작동하고 있으며, 이는 2026년 내내 컴퓨팅 자원을 확보하기 위한 치열한 전쟁이 계속될 것임을 예고합니다.

https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity

Sort:  

High-Yield Curation by @steem-seven

Your content has been supported!


Maximize your passive income!
Delegate your SP to us and earn up to 0.45 STEEM / 1000 SP.

Click here to see our Tiered Reward System

Vote Proposal 100Vote Witness @seven.witMeet Speak on Steem

We are the hope!

S7VEN Banner

This post has been upvoted by @italygame witness curation trail


If you like our work and want to support us, please consider to approve our witness




CLICK HERE 👇

Come and visit Italy Community



Coin Marketplace

STEEM 0.06
TRX 0.32
JST 0.060
BTC 67016.42
ETH 2053.33
USDT 1.00
SBD 0.49