Nvidia Tesla
Tesla — название семейства вычислительных систем NVIDIA на основе графических процессоров с архитектурой CUDA, которые могут быть использованы для научных и технических вычислений общего назначения. Tesla не может полностью заменить обычный универсальный процесcор, но позволяет использовать вычислительный ресурс множества своих ядер для решения определенного круга ресурсоемких задач, которые позволяют независимую параллельную обработку данных (примерами таких задач могут служить: симуляция свёртывания молекул белка, секвенирование ДНК, моделирование погоды, анализ финансового риска и т. п.).
Системы Tesla впервые появились на рынке с выходом графического чипа NVIDIA восьмого поколения — G80. Tesla строится на базе обычных графических процессоров, но, в отличие от видеоускорителей, не имеет средств вывода изображения на дисплей. Являясь своего рода сопроцессором, Tesla может использоваться для создания вычислительных систем на базе персональных компьютеров, а также в составе серверов и вычислительных кластеров.
Предлагая свой продукт для рынка высокопроизводительных кластеров, NVIDIA заявляет, что преимуществом гетерогенных вычислительных систем с Tesla является большая энергоэффективность и меньшая стоимость (как недостаток можно рассматривать меньшую универсальность).
Спецификации и конфигурации[1]
В настоящее время существует 3 модели Tesla:
- Tesla C870 — карта для рабочих станции (1 GPU)
- Tesla D870 — приставной суперкомпьютер (2 GPU)
- Tesla S870 — сервер (4 GPU)
и модели с одинарной и двойной точностью операций с плавающей запятой:
- Tesla C1060 — карта для рабочих станции (1 GPU)
- Tesla S1070 — сервер (4 GPU)
- Tesla C2050 — карта для рабочих станции (1 GPU)
- Tesla C2070 — карта для рабочих станции (1 GPU)
- Tesla S2050 — сервер (4 GPU)
Описание | Модель | количество GPU | Частота ядра (МГц) | Шейдерный процессоры | Память | Теоретическая производительность (Гигафлопс) [2] |
Вычислительная совместимость (возможность) [3] | TDP (Вт) | Заметки/Формфактор | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Количество | Частота (МГц) | Пропускная способность (Гб/с) | Стандарт видеопамяти | Шина видеопамяти (бит) | Объём видеопамяти, (Мб) | Частота(эффективная) (МГц) | Одинарная точность всего(MUL+ADD+SF) | Одинарная точность MAD(MUL+ADD) | Двойная точность FMA | |||||||
GPU вычислительный процессор1 |
C870 | 1 | 600 | 128 | 1350 | 76.8 | GDDR3 | 384 | 1536 | 1600 | 518.4 | 345.6 | 0 | 1.0 | 170.9 | АТХ видеокарта |
Приставной суперкомпьютер1 | D870 | 2 | 600 | 2 x 128 (256) | 1350 | 153.6 | GDDR3 | 384 | 3072 | 1600 | 1036.8 | 691.2 | 0 | 1.0 | Приставная система или в стойку | |
GPU Вычислительный сервер1 |
S870 | 4 | 600 | 4 x 128 (512) | 1350 | 307.2 | GDDR3 | 384 | 6144 | 1600 | 2073.6 | 1382.4 | 0 | 1.0 | 1U Rack | |
2 поколение Tesla процессор² |
C1060 | 1 | 602 | 240 | 1300 | 102.4 | GDDR3 | 512 | 4096 | 1600 | 933.12 | 622.08 | 77.76 | 1.3 | 187.8 | ATX видеокарта IEEE 754r двойная точность |
2 поколение GPU Вычислительный сервер |
S1070 | 4 | 602 | 4 x 240 (960) | 1440 | 409.6 | GDDR3 | 512 | 16384 | 1600 | 4147.2 | 2764.8 | 345.6 | 1.3 | 1U Стойка IEEE 754r двойная точность | |
2 поколение GPU Вычислительный сервер [4] |
S1070 | 4 | 602 | 4 x 240 (960) | 1440 | 409.6 | GDDR3 | 512 | 16384 | 1600 | 4147.2 | 2764.8 | 345.6 | 1.3 | 1U Стойка IEEE 754r двойная точность | |
3 поколение Tesla процессор³ |
C2050 | 1 | 575 | 448 | 1150 | 144 | GDDR5 | 384 | 30724 | 3000 | 1288 | 1030.45 | 515.2 | 2.0 | 238 | Full-height video card IEEE 754-2008 FMA capabilities |
3 поколение Tesla процессор³ |
C2070 | 1 | 575 | 448 | 1150 | 144 | GDDR5 | 384 | 61444 | 3000 | 1288 | 1030.45 | 515.2 | 2.0 | 247 | Full-height video card IEEE 754-2008 FMA capabilities |
M2050 GPU Computing Module |
M2050 | 1 | 575 | 448 | 1150 | 148.4 | GDDR5 | 384 | 30725 | 3092 | 1288 | 1030.46 | 515.2 | 2.0 | 225 | Computing Module IEEE 754-2008 FMA capabilities |
M2070/M2070Q[5] GPU Computing Module |
M2070/M2070Q | 1 | 575 | 448 | 1150 | 150.336 | GDDR5 | 384 | 61445 | 3132 | 1288 | 1030.46 | 515.2 | 2.0 | 225 | Computing Module IEEE 754-2008 FMA capabilities |
S2050 1U GPU Computing System |
S2050 | 4 | 575 | 4 × 448 (1792) | 1150 | 4 × 148.4 (593.6) | GDDR5 | 384 | 122885 | 3092 | 5152 | 4121.66 | 2060.8 | 2.0 | 900 | 1U Rack IEEE 754-2008 FMA capabilities |
- 1Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 8800GTX.
- ²Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce GTX280
- ³Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 400 Series
- 4С активированным ECC, доступная для пользователя память, составит 2.625 Гбайта на GPU для C2050, S2050 и 5.25 Гбайт на GPU для C2070.
- 5 GF100 выполняет новую соединенную инструкцию умножения-сложения FMA(D)(Fused Multiply-Add) для обоих 32 битных чисел одинарной точности с плавающей запятой и 64 битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница мужду инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A*B+C, заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.
См. также
Ссылки
Информация на сайте Nvidia на английском:
Информация на русском (не полная):
Применение для решения промышленных задач