구글, 8세대 TPU AI 칩 공개.. 추론•학습 특화

 

구글, 8세대 TPU AI 칩 공개.. 추론•학습 특화

구글이 8세대 TPU 칩인 TPU 8t와 TPU 8i를 공개. TPU 8t는 초대형 학습에, TPU 8i는 추론 성능에 특화.

이미지 출처: 구글

22일(현지시간) 구글이 ‘클라우드 넥스트 2026’ 행사에서 8세대 텐서 프로세싱 유닛(TPU) 신제품인 TPU 8t와 TPU 8i를 공개했다.

이번 세대의 핵심은 ‘단일 칩 범용 구조’에서 벗어나, 용도에 따라 칩을 분리한 점이다. 구글은 대규모 모델 학습에 최적화된 ‘TPU 8t’와, 저지연 추론 및 AI 에이전트 실행에 특화된 ‘TPU 8i’를 별도로 설계해 효율과 성능을 동시에 끌어올렸다.

TPU 8t는 초대형 학습 워크로드를 겨냥한 제품으로, 슈퍼포드 기준 최대 9,600개의 칩을 연결할 수 있는 확장성을 제공한다. 이를 통해 이전 세대인 ‘아이언우드(Ironwood)’ 대비 달러당 성능을 최대 2.7배 향상시켰다. 

반면 TPU 8i는 추론 성능에 초점을 맞춰, 3배 확대된 SRAM 캐시를 기반으로 대규모 언어 모델(LLM) 처리 효율을 크게 개선했다. 구글은 이를 통해 가격 대비 성능을 약 80% 끌어올리는 동시에, 지연 시간을 사실상 제로에 가깝게 줄였다고 강조했다.

전력 효율 역시 주요 개선 포인트다. 두 칩 모두 실시간 워크로드에 맞춰 전력 소비를 동적으로 조절하는 통합 전력 관리 시스템을 탑재해, 이전 세대 대비 와트당 성능을 2배 수준으로 향상시켰다.

이번 TPU 8 시리즈는 학습과 추론을 물리적으로 분리하는 ‘이원화 전략’을 통해, 급증하는 AI 수요에 보다 정밀하게 대응하려는 구글의 방향성을 보여준다. 

두 칩 모두 올해 말 일반에 출시될 예정이다.

댓글

이 블로그의 인기 게시물

삼성, 3번 접는 폰 ‘트라이폴드’ 스마트폰 드디어 공개... 韓·中 판매 가격은?

엔비디아 루빈 CPX 렌더 공개, 차세대 지포스 RTX 6090 디자인과 연관?

소니 차기 플래그쉽 무선 이어폰 'WF-1000XM6' 초기 정보 유출