타이틀을 '검색' 하시면 원문 기사 확인이 가능 합니다.
2025년 1월 16일(목) 주요 IT 뉴스
"GPU만으론 안된다"…구글, AI칩 '트릴리움' 내세운 이유
"그래픽처리장치(GPU)는 그래픽 처리를 위해 설계된 프로세서이지만 텐서처리장치(TPU)는 인공지능(AI)을 위해 태어났습니다."
구글에 따르면 최신 TPU인 트릴리움은 이전 세대 대비 추론 처리량이 최대 3배 증가했고, 달러당 학습 성능은 2.5배, 추론 성능은 1.4배 향상됐다. 고밀도 AI 모델뿐 아니라 전문가 혼합(MoE) 아키텍처를 활용한 AI 모델 학습에서도 이전 세대보다 3.8배 빠른 성능을 보인다.
TPU와 GPU의 차이 및 구글 TPU 트릴리움의 강점
- TPU와 GPU의 차이:
- GPU: 그래픽 처리를 위해 설계된 병렬 처리 구조로 AI 연산에도 활용 가능.
- TPU: AI 모델의 신경망 연산을 위해 설계된 전용 칩으로, 행렬 곱셈 연산과 인터커넥트 기술 등 AI 학습과 추론에 최적화된 구조.
- 개발 배경:
- 구글은 2013년 음성검색 도입 시 데이터센터 용량 문제를 해결하기 위해 AI 연산 특화 하드웨어 필요성을 인식하고 개발 시작.
- TPU 트릴리움 성능:
- 이전 세대 대비 추론 처리량 3배 증가.
- 달러당 학습 성능 2.5배, 추론 성능 1.4배 향상.
- 전문가 혼합(MoE) 아키텍처 학습 시 3.8배 빠른 성능.
- 주요 활용 사례:
- 구글의 최신 AI 모델 '제미나이 2.0' 학습.
- 노벨상을 받은 단백질 구조 예측 프로그램 '알파폴드2'.
- 바이엘의 신약 개발과 딥제노믹스의 RNA 치료제 개발.
- 카카오의 통합 AI 브랜드 '카나나' 개발로 한국어 대응 모델 확보.
- 전력 효율 및 친환경:
- 전력 효율이 이전 세대 대비 67% 개선.
- 지속 가능한 친환경 AI 인프라 구축.
- 시장 영향:
- 생성형 AI 유니콘 기업 90%가 구글 TPU 사용.
- TPU는 GPU를 대체하며 AI 모델 학습 및 서비스의 핵심 기술로 자리 잡음.
버전
|
출시 연도
|
추론 처리량
|
특징
|
TPU v1
|
2015
|
-
|
최초의 TPU로 딥러닝 워크로드를 처리하기 위한 전용 칩셋.
|
TPU v2
|
2017
|
180 TFLOPS
|
64GB HBM 메모리와 구글 데이터센터에서 대규모 워크로드를 처리하기 위한 설계.
|
TPU v3
|
2018
|
420 TFLOPS
|
v2 대비 연산 성능 2배 증가, 냉각 효율성을 위한 액체 냉각 시스템 도입.
|
TPU v4
|
2021
|
-
|
AI 모델 학습 및 추론을 위한 더 높은 성능 제공.
|
TPU v5e
|
2022
|
-
|
고밀도 모델과 다양한 AI 응용 프로그램을 처리하기 위해 성능 개선.
|
TPU 트릴리움
|
2023
|
최대 3배(v5e 대비)
|
전문가 혼합(MoE) 아키텍처에서 3.8배 빠른 학습, 전력 효율성과 지속 가능성을 강조.
|
"양자컴퓨팅 멀었다고? 천만에"...MS, 퀀텀 레디 선언
마이크로소프트는 2025년을 '양자 준비의 해'로 선언하며, 기업들이 다가오는 양자컴퓨팅 시대에 대비할 것을 촉구했다
마이크로소프트의 '양자 준비의 해' 선언 및 대응 전략
- 퀀텀 레디(Quantum Ready) 프로그램
- 기업이 양자 컴퓨팅 기술을 이해하고 활용하도록 지원.
- 화학, 재료 공학, 물류, 금융 등 다양한 산업에 양자 컴퓨팅 적용 방안 제시.
- 기술 교육, 워크숍, 맞춤형 전략 설계 지원.
- 애저 퀀텀(Azure Quantum) 플랫폼을 활용해 알고리즘 실험과 하이브리드 작업 가능.
- 퀀텀 세이프(Quantum Safe) 프로그램
- 양자 내성 암호화(Post-Quantum Cryptography) 알고리즘 도입 및 시스템 전환 지원.
- 애저 퀀텀 리소스 추정기를 통해 보안 전략 강화.
- 오픈 퀀텀 세이프(Open Quantum Safe) 프로젝트 지원으로 글로벌 보안 환경 개선.
- 마이크로소프트의 입장
- 양자 컴퓨팅 대비는 필수적이며 장기적 준비가 중요.
- 글로벌 기업 및 정부의 막대한 투자로 양자 기술 혁신 가속화.
- 경쟁력을 위해 조기 대비 강조.
- 산업 반응
- 엔비디아 CEO의 양자 컴퓨팅 상용화 20년 지연 전망으로 일부 기업 주가 급락.
- 마이크로소프트는 장기적인 대비 중요성을 설파하며 기업의 적극적 참여 권장.
'Daily IT 현황' 카테고리의 다른 글
[1월21일]금융권 AI·SaaS도입 증가,양자컴퓨팅 위협?비트코인 대안마련,GPUaaS (0) | 2025.01.21 |
---|---|
[1월20일]트럼프 2기 네트워크 우선,EU-AI법 최대 매출 7%벌금, 디지털유산 인정? (1) | 2025.01.20 |
[1월15일] 美 AI 칩 수출 통제, AI 대응 법제화 속도내는 저작권법·퍼블리시티권법 (0) | 2025.01.15 |
[1월14일]AI 엔진! 합성데이터,AI리스크 관리시스템,스타링크 3월개통,크리덴셜 스터핑 (0) | 2025.01.14 |
[1월13일]양자 상용화 먼 길?, 개인정보위 2025년 정책, 뉴럴링크 3번째 칩 삽입 (0) | 2025.01.13 |