엔비디아(NVIDIA)는 인공지능(AI) 분야에서 세계적으로 선도적인 반도체 제조업체입니다. 서버·데이터센터용 고성능 AI GPU부터 개인용 PC, 엣지 디바이스, 임베디드 시스템까지 다양한 라인업을 보유하고 있습니다. 아래에서 대표적인 엔비디아 AI 반도체들을 제품군별로 정리해 설명합니다.
데이터센터·서버용 AI GPU
제품명아키텍처연산 성능 (최대)메모리/대역폭특징 및 용도
Blackwell
Blackwell
2080억 트랜지스터, 2배 AI FLOPS (전세대 대비)
2개 다이, 10TB/s 인터커넥트
차세대 LLM, 초대형 AI 모델 학습/추론, 4비트 FP4 지원1 3
Blackwell Ultra
Blackwell
기존 Blackwell 대비 1.5배 AI 연산, 2배 어텐션 가속
-
2025년 하반기 출시, 초대형 AI/생성형 AI 특화3
H100
Hopper
FP8: 3,958 TFLOPS, FP16: 1,979 TFLOPS, TF32: 989 TFLOPS
80~94GB, 3.35~3.9TB/s
딥러닝 학습/추론, 대규모 데이터센터, MIG 지원5 6
A100
Ampere
FP32: 312 TFLOPS, TF32: 624 TFLOPS
40~80GB, 2TB/s
AI, HPC, 클라우드, 3세대 NVLink, MIG 지원4
개인용 PC/소형 서버용 AI GPU
제품명아키텍처쿠다 코어텐서 코어메모리특징 및 용도
RTX 4080 SUPER
Ada Lovelace
10,240
320
16GB GDDR6X
생성형 AI, 게이밍, 크리에이터용2
RTX 4070 Ti SUPER
Ada Lovelace
8,448
264
16GB GDDR6X
고성능 PC, AI 애플리케이션
RTX 4060 SUPER
Ada Lovelace
5,120
160
8GB GDDR6
보급형 AI, 일반 게이밍/사무용
특징 : 최신 RTX 40 시리즈는 텐서 코어로 AI 연산을 가속화하며, 메모리 입출력 속도도 강화되어 PC에서 직접 생성형 AI를 구동할 수 있습니다2 .
엣지/임베디드 AI 시스템
제품명아키텍처GPU 코어AI 연산 성능메모리특징 및 용도
Jetson Nano
Maxwell
128
472 GFLOPS
4GB
소형 로봇, IoT, 엣지 AI7
특징 : 저전력, 소형 폼팩터로 드론, 로봇, 스마트 카메라 등 엣지 디바이스에 적합합니다7 .
차세대·미래형 AI 반도체
제품명출시(예정)특징 및 사양 요약
Vera Rubin
2026년
엔비디아 최초 커스텀 CPU, Rubin GPU와 결합 시 50 PFLOPS 추론 성능, 288GB 고속 메모리 지원3
Rubin Next
2027년
4개 다이 통합, Rubin 대비 2배 성능, 4 GPU로 분류3
요약
데이터센터/AI 팩토리 : Blackwell, H100, A100 등은 초대형 AI 모델 학습과 추론에 최적화되어 있으며, 세대가 거듭될수록 더 높은 연산 성능과 대용량 메모리를 제공합니다.
개인용/소형 서버 : RTX 40 시리즈는 AI 가속을 위한 텐서 코어와 빠른 메모리로 PC에서도 생성형 AI를 실행할 수 있습니다.
엣지/임베디드 : Jetson Nano는 소형화·저전력으로 엣지 AI에 적합합니다7 .
차세대: Vera Rubin, Rubin Next 등은 CPU와 GPU를 통합하거나 다이 수를 늘려 AI 처리 효율을 극대화할 예정입니다.