구글 클라우드, 8세대 TPU·제미나이 엔터프라이즈 에이전트 공개(종합)

이은서 기자

입력 2026.04.23 09:44

수정 2026.04.23 09:48

펼치기/접기

01분 22초 소요

숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

8세대 TPU 2종·기업용 AI 에이전트 플랫폼 공개
"모든 기업의 AI 에이전트 도입 지원"

구글 클라우드가 기업의 AI(인공지능) 에이전트(비서) 도입 효율성을 끌어올릴 수 있는 8세대 텐서처리장치(TPU)와 이를 기반으로 한 기업용 AI 에이전트 플랫폼을 공개했다.

TPU 8세대 모습. TPU 8t(왼쪽)와 TPU 8i(오른쪽). 구글클라우드.

구글 클라우드는 22일(현지시간) 미국 라스베이거스에서 개최한 '구글 클라우드 넥스트 2026'를 통해 8세대 TPU 2종을 선보였다. 학습용 TPU 8t와 추론용 TPU 8i로, 고성능 AI 모델 구축부터 여러 AI를 하나의 팀처럼 묶어 쓰는 에이전트 군집 운영과 복잡한 추론 과제 해결 등을 돕는다.

8세대 TPU는 전작인 7세대 '아이언 우드'보다 달러당 성능을 80% 향상했으며, 기업은 동일한 비용으로 두배에 달하는 고객 수요를 처리할 수 있다.

TPU 8t는 높은 연산 처리량과 공유 고대역폭메모리(HBM) 등을 활용해 전작 대비 처리 능력을 3배로 끌어올렸다. 이 칩을 활용하면 최첨단 모델의 개발 기간을 몇 개월에서 몇 주로 단축할 수 있다. TPU 8i는 HBM 288GB에 속도가 빠른 S램 384MB를 함께 탑재해 모델의 활성 작업 세트 전체를 칩 내부에서 처리한다. 이를 통해 칩 간 데이터 이동 경로를 절반 이상 단축해 AI의 답변이나 결과물을 즉각 제공한다.

8세대 TPU 2종은 구글이 자체 설계한 중앙처리장치(CPU)인 액시온, 엔비디아의 그래픽처리장치(GPU)와 함께 구글의 AI 하이퍼컴퓨터의 기반이 된다.

토마스 쿠리안 구글 클라우드 CEO는 "생성형 AI가 폭넓게 확산했을 때 사람들이 학습 및 추론에 최적화한 시스템을 원할 것으로 판단했다"며 "AI 인프라 확장에서 전력이 제약 요인이 될 것을 예상하고 설계 단계부터 에너지 효율을 극대화하는 데 중점을 뒀다"고 설명했다.

22일(현지시간) 미국에서 열린 '구글 클라우드 넥스트 2026'에서 기조연설 중인 토마스 쿠리안 구글 클라우드 CEO. 구글 클라우드.

"AI 에이전트 시대로 본격 도약"

구글 클라우드는 AI 하이퍼컴퓨터 기반의 기업용 AI 에이전트 플랫폼 '제미나이 엔터프라이즈 에이전트 플랫폼'도 새롭게 공개했다. 기존의 AI 개발 플랫폼인 '버텍스 AI'에서 진화한 것으로, 모델 선택·구축 기능, 에이전트 생성 및 통합, 보안을 위한 신규 기능 등을 통합했다. 제미나이 엔터프라이즈 앱을 통해 배포된 에이전트들은 정보기술(IT) 운영체계와 긴밀하게 연동돼 서비스 확장 시에도 보안 유지가 가능하다.

플랫폼 내에서 200개 이상의 모델을 활용할 수 있다. 제미나이 3.1 프로, 나노 바나나 2, 리리아 3 등 구글의 최신 모델과 앤스로픽의 클로드 오퍼스 4.7 등을 포함한 타사 모델도 지원한다.

구글 클라우드는 AI 기반 클라우드 기술을 활용해 기업의 AI 전환 가속을 목표로 삼고 있다. 전 세계 구글 클라우드 고객의 75%는 비즈니스 동력 확보를 위해 AI 제품군을 사용하고 있다. 지난 12개월 동안 구글 클라우드 고객사 330개는 1조 토큰 이상의 데이터를 처리했고, 35개 기업은 구글 모델을 통해 10조 토큰을 처리했다.