Tensor Cores
Специализированные ядра NVIDIA для операций матричного умножения (mixed-precision matrix multiply-accumulate). Появились в Volta (2017, V100 для дата-центров, 640 Tensor Cores), улучшены в Turing (RTX 20-серия, INT8/INT4 для инференса), Ampere (sparsity support — пропуск нулевых весов, ускорение в 2 раза), Ada Lovelace (FP8 формат, Transformer Engine). Производительность: RTX 4090 — 1321 TFLOPS FP8 (vs 83 TFLOPS FP32 для CUDA ядер). Применение: обучение нейросетей (ускорение в 5-20 раз для операций типа dense layers, convolutions), DLSS (AI upscaling изображений в реальном времени 60-120 FPS)
📖6 мин чтения📊Уровень 7📅19 февраля 2026 г.
🗺️ Mind Map
Загрузка карты...
❓Часто задаваемые вопросы
Tensor Cores — это тема о правилах, механизмах и практиках в своей области. Она помогает понять, как принимаются решения и к каким последствиям они приводят.