Nvidia Tesla
Tesla — название семейства вычислительных систем NVIDIA на основе графических процессоров с архитектурой CUDA, которые могут быть использованы для научных и технических вычислений общего назначения. Tesla не может полностью заменить обычный универсальный процесcор, но позволяет использовать вычислительный ресурс множества своих ядер (вести независимую параллельную обработку данных) для решения определенного круга ресурсоемких задач. Примерами таких задач могут служить симуляция свёртывания молекул белка, секвенирование ДНК, моделирование погоды, анализ финансового риска и т. п.
Системы Tesla впервые появились на рынке с выходом графического чипа NVIDIA восьмого поколения — G80. Tesla строится на базе обычных графических процессоров, но, в отличие от видеоускорителей, не имеет средств вывода изображения на дисплей. Являясь своего рода сопроцессором, Tesla может использоваться для создания вычислительных систем на базе персональных компьютеров, а также в составе серверов и вычислительных кластеров.
Предлагая свой продукт для рынка высокопроизводительных кластеров, NVIDIA заявляет, что преимуществом гетерогенных вычислительных систем с Tesla является большая энергоэффективность и меньшая стоимость (как недостаток можно рассматривать меньшую универсальность).
Спецификации и конфигурации[1]
В настоящее время существует модели Tesla:
- Tesla C870 — карта для рабочих станции (1 GPU);
- Tesla D870 — приставной суперкомпьютер (2 GPU);
- Tesla S870 — сервер (4 GPU).
Также имеются модели с одинарной и двойной точностью операций с плавающей запятой:
- Tesla C1060 — карта для рабочих станции (1 GPU);
- Tesla S1070 — сервер (4 GPU);
- Tesla C2050 — карта для рабочих станции (1 GPU);
- Tesla C2070 — карта для рабочих станции (1 GPU);
- Tesla S2050 — сервер (4 GPU).
На базе архитектуры Kepler предлагаются модели:[2]
- Tesla K40
- Tesla K20x
- Tesla K20
- Tesla K10
Описание | Модель | Количество GPU | Частота ядра, МГц | Шейдерные процессоры | Память | Теоретическая производительность, гигафлопс[3] | Вычислительная совместимость (возможность)[4] | TDP, Вт | Примечания/формфактор | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Количество | Частота, МГц | Пропускная способность, ГБ/с | Стандарт видеопамяти | Шина видеопамяти, бит | Объём видеопамяти, МБ | Частота (эффективная), МГц | Одинарная точность, всего (MUL+ADD+SF) | Одинарная точность, MAD (MUL+ADD) | Двойная точность, FMA | |||||||
Вычислительный модуль на основе GPU[5] | C870 | 1 | 600 | 128 | 1350 | 76,8 | GDDR3 | 384 | 1536 | 1600 | 518,4 | 345,6 | 0 | 1,0 | 170,9 | АТХ видеокарта |
Приставной суперкомпьютер[5] | D870 | 2 | 600 | 2×128 (256) | 1350 | 153,6 | GDDR3 | 384 | 3072 | 1600 | 1036,8 | 691,2 | 0 | 1,0 | Приставная система или в стойку | |
Вычислительный модуль на основе GPU[5] | S870 | 4 | 600 | 4×128 (512) | 1350 | 307,2 | GDDR3 | 384 | 6144 | 1600 | 2073,6 | 1382,4 | 0 | 1,0 | 1U Rack | |
2-е поколение Tesla-процессоров[6] | C1060 | 1 | 602 | 240 | 1300 | 102,4 | GDDR3 | 512 | 4096 | 1600 | 933,12 | 622,08 | 77,76 | 1,3 | 187,8 | ATX видеокарта IEEE 754-2008 FMA |
2-е поколение Вычислительный модуль на основе GPU[7] |
S1070 | 4 | 602 | 4×240 (960) | 1440 | 409,6 | GDDR3 | 512 | 16384 | 1600 | 4147,2 | 2764,8 | 345,6 | 1,3 | Одноюнитовая стойка IEEE 754—2008 FMA | |
3-е поколение Tesla-процессор[8] |
C2050 | 1 | 575 | 448 | 1150 | 144 | GDDR5 | 384 | 3072[9] | 3000 | 1288 | 1030,4[10] | 515,2 | 2,0 | 238 | Полноразмерная видеокарта IEEE 754-2008 FMA |
3-е поколение Tesla-процессор[8] |
C2070 | 1 | 575 | 448 | 1150 | 144 | GDDR5 | 384 | 6144[9] | 3000 | 1288 | 1030,4[10] | 515,2 | 2,0 | 247 | Полноразмерная видеокарта IEEE 754-2008 FMA |
M2050 Вычислительный модуль на основе GPU |
M2050 | 1 | 575 | 448 | 1150 | 148,4 | GDDR5 | 384 | 3072[10] | 3092 | 1288 | 1030,4[10] | 515,2 | 2,0 | 225 | Вычислительный модуль IEEE 754-2008 FMA |
M2070/M2070Q[11] Вычислительный модуль на основе GPU |
M2070/M2070Q | 1 | 575 | 448 | 1150 | 150,336 | GDDR5 | 384 | 6144[10] | 3132 | 1288 | 1030,4[10] | 515,2 | 2,0 | 225 | Вычислительный модуль IEEE 754-2008 FMA |
S2050 1U Вычислительная система на основе GPU |
S2050 | 4 | 575 | 4×448 (1792) | 1150 | 4×148,4 (593,6) | GDDR5 | 384 | 12288[10] | 3092 | 5152 | 4121,6[10] | 2060,8 | 2,0 | 900 | 1U Rack IEEE 754-2008 FMA |
См. также
Примечания
- ↑ NVIDIA Product Overview and Technical Brief
- ↑ http://www.nvidia.com/content/PDF/kepler/Tesla-KSeries-Overview-LR.pdf
- ↑ Nvidia Announces Tesla 20 Series
- ↑ Какие оборудование и программное обеспечение требуются для PhysX?
- ↑ 1 2 3 Нет официальных данных; предполагается, что основаны на GeForce 8800 GTX.
- ↑ Нет официальных данных; предполагается, что основаны на GeForce GTX 280.
- ↑ Difference between Tesla S1070 and S1075
- ↑ 1 2 Нет официальных данных; предполагается, что основаны на GeForce 400 Series.
- ↑ 1 2 С активированным ECC доступная для пользователя память составит 2,625 ГБ на GPU для C2050, S2050 и 5,25 ГБ на GPU для C2070.
- ↑ 1 2 3 4 5 6 7 8 GF100 выполняет новую соединенную инструкцию умножения-сложения FMA(D) (Fused Multiply-Add) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница между инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A×B+C заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.
- ↑ NVidia Tesla M2050 & M2070/M2070Q Specs Online