A100 40GB 是一款旗舰级的 datacenter GPU。 凭借 40GB 的超大高速显存,它在处理大规模模型微调 (Fine-tuning)、超大规模语言模型 (LLM) 以及超高维度数据吞吐时表现卓越。
推荐训练/使用场景
深度学习
模型推理
视频编解码
核心架构
Ampere
显存容量
40GB
显存带宽
1.5 TB/s
CUDA 核心数
6912
FP16 半精度算力
312 TFLOPS
最大功耗 (TDP)
250W