Nvidia Tesla

Tesla — название семейства вычислительных систем NVIDIA на основе графических процессоров с архитектурой CUDA, которые могут быть использованы для научных и технических вычислений общего назначения. Tesla не может полностью заменить обычный универсальный процесcор, но позволяет использовать вычислительный ресурс множества своих ядер для решения определенного круга ресурсоемких задач, которые позволяют независимую параллельную обработку данных (примерами таких задач могут служить: симуляция свёртывания молекул белка, секвенирование ДНК, моделирование погоды, анализ финансового риска и т. п.).

Системы Tesla впервые появились на рынке с выходом графического чипа NVIDIA восьмого поколения — G80. Tesla строится на базе обычных графических процессоров, но, в отличие от видеоускорителей, не имеет средств вывода изображения на дисплей. Являясь своего рода сопроцессором, Tesla может использоваться для создания вычислительных систем на базе персональных компьютеров, а также в составе серверов и вычислительных кластеров.

Предлагая свой продукт для рынка высокопроизводительных кластеров, NVIDIA заявляет, что преимуществом гетерогенных вычислительных систем с Tesla является большая энергоэффективность и меньшая стоимость (как недостаток можно рассматривать меньшую универсальность).

Спецификации и конфигурации^[1]

В настоящее время существует 3 модели Tesla:

Tesla C870 — карта для рабочих станции (1 GPU)
Tesla D870 — приставной суперкомпьютер (2 GPU)
Tesla S870 — сервер (4 GPU)

и модели с одинарной и двойной точностью операций с плавающей запятой:

Tesla C1060 — карта для рабочих станции (1 GPU)
Tesla S1070 — сервер (4 GPU)
Tesla C2050 — карта для рабочих станции (1 GPU)
Tesla C2070 — карта для рабочих станции (1 GPU)
Tesla S2050 — сервер (4 GPU)

Описание	Модель	количество GPU	Частота ядра (МГц)	Шейдерный процессоры		Память					Теоретическая производительность (Гигафлопс) ^[2]			Вычислительная совместимость (возможность) ^[3]	TDP (Вт)	Заметки/Формфактор
Описание	Модель	количество GPU	Частота ядра (МГц)	Количество	Частота (МГц)	Пропускная способность (Гб/с)	Стандарт видеопамяти	Шина видеопамяти (бит)	Объём видеопамяти, (Мб)	Частота(эффективная) (МГц)	Одинарная точность всего(MUL+ADD+SF)	Одинарная точность MAD(MUL+ADD)	Двойная точность FMA	Вычислительная совместимость (возможность) ^[3]	TDP (Вт)	Заметки/Формфактор
GPU вычислительный процессор¹	C870	1	600	128	1350	76.8	GDDR3	384	1536	1600	518.4	345.6	0	1.0	170.9	АТХ видеокарта
Приставной суперкомпьютер¹	D870	2	600	2 x 128 (256)	1350	153.6	GDDR3	384	3072	1600	1036.8	691.2	0	1.0		Приставная система или в стойку
GPU Вычислительный сервер¹	S870	4	600	4 x 128 (512)	1350	307.2	GDDR3	384	6144	1600	2073.6	1382.4	0	1.0		1U Rack
2 поколение Tesla процессор²	C1060	1	602	240	1300	102.4	GDDR3	512	4096	1600	933.12	622.08	77.76	1.3	187.8	ATX видеокарта IEEE 754r двойная точность
2 поколение GPU Вычислительный сервер	S1070	4	602	4 x 240 (960)	1440	409.6	GDDR3	512	16384	1600	4147.2	2764.8	345.6	1.3		1U Стойка IEEE 754r двойная точность
2 поколение GPU Вычислительный сервер ^[4]	S1070	4	602	4 x 240 (960)	1440	409.6	GDDR3	512	16384	1600	4147.2	2764.8	345.6	1.3		1U Стойка IEEE 754r двойная точность
3 поколение Tesla процессор³	C2050	1	575	448	1150	144	GDDR5	384	3072⁴	3000	1288	1030.4⁵	515.2	2.0	238	Full-height video card IEEE 754-2008 FMA capabilities
3 поколение Tesla процессор³	C2070	1	575	448	1150	144	GDDR5	384	6144⁴	3000	1288	1030.4⁵	515.2	2.0	247	Full-height video card IEEE 754-2008 FMA capabilities
M2050 GPU Computing Module	M2050	1	575	448	1150	148.4	GDDR5	384	3072⁵	3092	1288	1030.4⁶	515.2	2.0	225	Computing Module IEEE 754-2008 FMA capabilities
M2070/M2070Q^[5] GPU Computing Module	M2070/M2070Q	1	575	448	1150	150.336	GDDR5	384	6144⁵	3132	1288	1030.4⁶	515.2	2.0	225	Computing Module IEEE 754-2008 FMA capabilities
S2050 1U GPU Computing System	S2050	4	575	4 × 448 (1792)	1150	4 × 148.4 (593.6)	GDDR5	384	12288⁵	3092	5152	4121.6⁶	2060.8	2.0	900	1U Rack IEEE 754-2008 FMA capabilities

¹Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 8800GTX.
²Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce GTX280
³Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 400 Series
⁴С активированным ECC, доступная для пользователя память, составит 2.625 Гбайта на GPU для C2050, S2050 и 5.25 Гбайт на GPU для C2070.
⁵ GF100 выполняет новую соединенную инструкцию умножения-сложения FMA(D)(Fused Multiply-Add) для обоих 32 битных чисел одинарной точности с плавающей запятой и 64 битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница мужду инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A*B+C, заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.

См. также

Ссылки

Информация на сайте Nvidia на английском:

Информация на русском (не полная):

Tesla
CUDA

Применение для решения промышленных задач

CompMechLab® - "КАДФЕМ Си-Ай-Эс" - Форсайт: отчет о результатах исследования ускорения расчетов в ANSYS 12.1 и 13.0 при использовании SolidStateDisk и NVIDIA Tesla (апрель 2011 г.)

Примечания

[1] NVIDIA Product Overview and Technical Brief

[2] Nvidia Announces Tesla 20 Series

[3] МИР NVIDIA / FAQ / Какие оборудование и программное обеспечение требуются для PhysX?

[4] Difference between Tesla S1070 and S1075

[5] NVidia Tesla M2050 & M2070/M2070Q Specs Online

[1]

[2]

[3]

[4]

[5]

Nvidia Tesla

Содержание

Спецификации и конфигурации^[1]

См. также

Ссылки

Примечания

Навигация

Nvidia Tesla

Спецификации и конфигурации[1]

См. также

Ссылки

Примечания

Навигация

Поиск

Спецификации и конфигурации^[1]