Nvidia Tesla: различия между версиями
[непроверенная версия] | [отпатрулированная версия] |
Нет описания правки |
|||
(не показано 40 промежуточных версий 30 участников) | |||
Строка 1: | Строка 1: | ||
{{другие значения|Тесла}} |
|||
'''Tesla''' — название семейства вычислительных систем [[NVIDIA]] на основе [[Графический процессор|графических процессоров]] с архитектурой [[CUDA]], которые могут быть использованы для научных и технических вычислений общего назначения. Tesla не может полностью заменить обычный [[центральный процессор|универсальный процесcор]], но позволяет использовать вычислительный ресурс множества своих ядер для решения определенного круга ресурсоемких задач, которые позволяют независимую параллельную обработку данных (примерами таких задач могут служить: симуляция свёртывания молекул белка, [[секвенирование]] ДНК, моделирование погоды, анализ финансового риска и т. п.). |
|||
[[Файл:Nvidia Tesla A100.png|мини|Графический процессор Nvidia Tesla A100]] |
|||
'''Nvidia Tesla''' — название семейства вычислительных систем [[NVIDIA]] на основе [[Графический процессор|графических процессоров]] с архитектурой [[CUDA]], которые могут быть использованы для научных и технических вычислений общего назначения. Tesla не может полностью заменить обычный [[центральный процессор|универсальный процессор]], но позволяет использовать вычислительный ресурс [[Многоядерный процессор|множества своих ядер]] для решения определенного круга ресурсоёмких задач (вести [[Параллельные вычисления|параллельную]] обработку данных). Примерами таких задач могут служить симуляция свёртывания молекул белка, [[секвенирование]] ДНК, [[Прогноз погоды|моделирование погоды]], анализ финансового риска и т. п. |
|||
Системы Tesla впервые появились на рынке с выходом |
Системы Tesla впервые появились на рынке с выходом графического чипа NVIDIA восьмого поколения — [[GeForce 8|G80]]. Tesla строится на базе обычных графических процессоров, но, в отличие от [[Видеокарта|видеоускорителей]], не имеет средств вывода изображения на дисплей. Являясь своего рода [[сопроцессор]]ом, Tesla может использоваться для создания вычислительных систем на базе [[Персональный компьютер|персональных компьютеров]], а также в составе [[Сервер (аппаратное обеспечение)|серверов]] и [[Кластер (группа компьютеров)|вычислительных кластеров]]. |
||
Предлагая свой продукт для рынка высокопроизводительных кластеров, NVIDIA заявляет, что преимуществом [[Гетерогенность|гетерогенных]] вычислительных систем с Tesla является большая энергоэффективность и меньшая стоимость (как недостаток можно рассматривать меньшую универсальность). |
Предлагая свой продукт для рынка высокопроизводительных кластеров, NVIDIA заявляет, что преимуществом [[Гетерогенность|гетерогенных]] вычислительных систем с Tesla является большая [[энергоэффективность]] и меньшая стоимость (как недостаток можно рассматривать меньшую универсальность). |
||
== Спецификации и конфигурации |
== Спецификации и конфигурации == |
||
Модели Tesla 2007 года на базе GPU G80 (единственная группа карт без поддержки операций над 64-битными [[Число с плавающей запятой|числами с плавающей точкой]]): |
|||
В настоящее время существует 3 модели Tesla: |
|||
* Tesla C870 — карта для рабочих станции (1 GPU) |
* Tesla C870 — карта для рабочих станции (1 GPU) |
||
* Tesla D870 — приставной суперкомпьютер (2 GPU) |
* Tesla D870 — приставной суперкомпьютер (2 GPU) |
||
* Tesla S870 — сервер (4 GPU) |
* Tesla S870 — сервер (4 GPU) |
||
Модели Tesla на базе GT200 (2008—2009 год): |
|||
и модели с одинарной и '''двойной''' точностью операций с плавающей запятой: |
|||
* Tesla C1060 — карта для рабочих станции (1 GPU) |
* Tesla C1060 — карта для рабочих станции (1 GPU) |
||
* Tesla S1070 — сервер (4 GPU) |
* Tesla S1070 — сервер (4 GPU) |
||
* Tesla |
* Tesla S1075 — сервер (4 GPU) |
||
* Quadro Plex 2200 D2 (2 GPU) |
|||
* Tesla C2070 — карта для рабочих станции (1 GPU) |
|||
* |
* Quadro Plex 2200 S4 (4 GPU) |
||
Модели Tesla на базе GF100 и GF110 (2011 год): |
|||
* Tesla C2050, M2050 — карта для рабочих станции (1 GPU) |
|||
* Tesla C2070, C2075, M2070 — карта для рабочих станции (1 GPU) |
|||
* Tesla M2090 — карта на основе GF110 |
|||
* Tesla S2050, S2070 — сервер (4 GPU) |
|||
На базе архитектуры [[Кеплер (микроархитектура)|Kepler]] предлагаются модели<ref>{{Cite web |url=http://www.nvidia.com/content/PDF/kepler/Tesla-KSeries-Overview-LR.pdf |title=Источник |access-date=2012-11-14 |archive-date=2013-01-27 |archive-url=https://web.archive.org/web/20130127010127/http://www.nvidia.com/content/PDF/kepler/Tesla-KSeries-Overview-LR.pdf |deadlink=no }}</ref> 2012—2014 годов: |
|||
* Tesla K10 (2× GK104) |
|||
* Tesla K20, K20x (1× GK110) |
|||
* Tesla K40 (1× GK110B) |
|||
* Tesla K80 (2× GK210) |
|||
В 2015 году были представлены модели на базе [[Maxwell (микроархитектура)|микроархитектуры Maxwell]]: |
|||
* M4 (1× GM206) |
|||
* M6 (1× GM204) |
|||
* M10 (4× GM107) |
|||
* M40 (1× GM200) |
|||
* M60 (2× GM204) |
|||
Чипы [[Pascal (микроархитектура)|Pascal]] служили основой для карт 2016—2017 годов<ref name="автоссылка1">{{Cite web |url=http://www.nvidia.com/object/tesla_product_literature.html |title=NVIDIA Product Overview and Technical Brief |access-date=2008-04-02 |archive-date=2015-03-18 |archive-url=https://web.archive.org/web/20150318194608/http://www.nvidia.com/object/tesla_product_literature.html |deadlink=no }}</ref>: |
|||
* P4 (1× GP104), PCIe |
|||
* P6 (1× GP104), MXM |
|||
* P40 (1× GP102), PCIe |
|||
* P100 (1× GP100), NVLink |
|||
* P100 (1× GP100, 16 или 12 ГБ ОЗУ), PCIe |
|||
В 2017 году появилась модель на базе [[Volta (микроархитектура)|Volta]] — Tesla V100, в виде PCIe и NVLink карт<ref name="автоссылка1" />. |
|||
В 2018 году представлена карта Tesla T4 на базе [[Turing (микроархитектура)|Turing]]<ref name="автоссылка1" />. |
|||
{| class="wikitable" style="font-size: 85% |
{| class="wikitable" style="font-size: 85%;" |
||
|- |
|- |
||
! rowspan=2 |
! rowspan=2 | Описание |
||
! rowspan=2 | Модель |
! rowspan=2 | Модель |
||
! rowspan=2 | |
! rowspan=2 | Количество GPU |
||
! rowspan=2 | Частота ядра |
! rowspan=2 | Частота ядра, [[Мегагерц|МГц]] |
||
! colspan=2 |
! colspan=2 | Шейдерные процессоры |
||
! colspan=5 |
! colspan=5 | Память |
||
! colspan=3 |
! colspan=3 | Теоретическая производительность, гигафлопс<ref>{{Cite web |url=http://www.siliconmadness.com/2009/11/nvidia-announces-tesla-20-series.html |title=Nvidia Announces Tesla 20 Series |access-date=2010-04-21 |archive-date=2010-05-21 |archive-url=https://web.archive.org/web/20100521042812/http://www.siliconmadness.com/2009/11/nvidia-announces-tesla-20-series.html |deadlink=yes }}</ref> |
||
! rowspan=2 | |
! rowspan=2 | Вычислительные способности <ref>{{Cite web |url=http://nvworld.ru/faq/physx-hardware-software-requirements/ |title=Какие оборудование и программное обеспечение требуются для PhysX? |access-date=2010-04-21 |archive-date=2010-03-30 |archive-url=https://web.archive.org/web/20100330124113/http://nvworld.ru/faq/physx-hardware-software-requirements/ |deadlink=no }}</ref> |
||
! rowspan=2 | |
! rowspan=2 | [[TDP]], [[Ватт|Вт]] |
||
! rowspan=2 | |
! rowspan=2 | Примечания/формфактор |
||
|- |
|- |
||
! Количество |
! Количество |
||
! Частота |
! Частота, МГц |
||
! Пропускная способность |
! Пропускная способность, [[Гигабайт|ГБ]]/[[Секунда|с]] |
||
! Стандарт видеопамяти |
! Стандарт видеопамяти |
||
! Шина видеопамяти |
! Шина видеопамяти, [[бит]] |
||
! Объём видеопамяти, |
! Объём видеопамяти, МБ |
||
! Частота(эффективная) |
! Частота (эффективная), МГц |
||
! Одинарная точность всего(MUL+ADD+SF) |
! Одинарная точность, всего (MUL+ADD+SF) |
||
! Одинарная точность MAD(MUL+ADD) |
! Одинарная точность, MAD (MUL+ADD) |
||
! Двойная точность |
! Двойная точность, [[FMA]] |
||
|- valign="top" |
|- valign="top" |
||
! Вычислительный модуль на основе GPU<ref name="gtx">Нет официальных данных; предполагается, что основаны на GeForce 8800 GTX.</ref> |
|||
! style="text-align:left;" | GPU вычислительный <br />процессор<sup>1</sup> |
|||
| C870 |
| C870 |
||
| 1 |
| 1 |
||
Строка 50: | Строка 80: | ||
| 128 |
| 128 |
||
| 1350 |
| 1350 |
||
| 76 |
| 76,8 |
||
| GDDR3 |
| GDDR3 |
||
| 384 |
| 384 |
||
| 1536 |
| 1536 |
||
| 1600 |
| 1600 |
||
| 518 |
| 518,4 |
||
| 345 |
| 345,6 |
||
| 0 |
| 0 |
||
| 1 |
| 1,0 |
||
| 170 |
| 170,9 |
||
| АТХ [[видеокарта]] |
| АТХ [[видеокарта]] |
||
|- valign="top" |
|- valign="top" |
||
! Приставной суперкомпьютер<ref name="gtx" /> |
|||
! style="text-align:left;" | Приставной суперкомпьютер<sup>1</sup> |
|||
| D870 |
| D870 |
||
| 2 |
| 2 |
||
| 600 |
| 600 |
||
| |
| 2×128 (256) |
||
| 1350 |
| 1350 |
||
| 153 |
| 153,6 |
||
| GDDR3 |
| GDDR3 |
||
| 384 |
| 384 |
||
| 3072 |
| 3072 |
||
| 1600 |
| 1600 |
||
| 1036 |
| 1036,8 |
||
| 691 |
| 691,2 |
||
| 0 |
| 0 |
||
| 1 |
| 1,0 |
||
| |
| |
||
| [[NVIDIA Quadro Plex|Приставная система]] или [[в стойку]] |
| [[NVIDIA Quadro Plex|Приставная система]] или [[в стойку]] |
||
|- valign="top" |
|- valign="top" |
||
! Вычислительный модуль на основе GPU<ref name="gtx" /> |
|||
! style="text-align:left;" | GPU Вычислительный <br /> сервер<sup>1</sup> |
|||
| S870 |
| S870 |
||
| 4 |
| 4 |
||
| 600 |
| 600 |
||
| |
| 4×128 (512) |
||
| 1350 |
| 1350 |
||
| 307 |
| 307,2 |
||
| GDDR3 |
| GDDR3 |
||
| 384 |
| 384 |
||
| 6144 |
| 6144 |
||
| 1600 |
| 1600 |
||
| 2073 |
| 2073,6 |
||
| 1382 |
| 1382,4 |
||
| 0 |
| 0 |
||
| 1 |
| 1,0 |
||
| |
| |
||
| [[19-inch rack|1U Rack]] |
| [[19-inch rack|1U Rack]] |
||
|- valign="top" |
|- valign="top" |
||
! 2-е поколение Tesla-процессоров<ref>Нет официальных данных; предполагается, что основаны на GeForce GTX 280.</ref> |
|||
! style="text-align:left;" | 2 поколение <br />Tesla процессор² |
|||
| C1060 |
| C1060 |
||
| 1 |
| 1 |
||
Строка 104: | Строка 134: | ||
| 240 |
| 240 |
||
| 1300 |
| 1300 |
||
| 102 |
| 102,4 |
||
| GDDR3 |
| GDDR3 |
||
| 512 |
| 512 |
||
| 4096 |
| 4096 |
||
| 1600 |
| 1600 |
||
| 933 |
| 933,12 |
||
| 622 |
| 622,08 |
||
| 77 |
| 77,76 |
||
| 1 |
| 1,3 |
||
| 187 |
| 187,8 |
||
| ATX [[видеокарта]]<br |
| ATX [[видеокарта]]<br>[[IEEE 754-2008]] FMA |
||
|- valign="top" |
|- valign="top" |
||
! 2-е поколение<br>Вычислительный модуль на основе GPU<ref>{{Cite web |url=http://forums.nvidia.com/index.php?showtopic=80850 |title=Difference between Tesla S1070 and S1075 |access-date=2010-04-21 |archive-date=2012-02-26 |archive-url=https://web.archive.org/web/20120226001759/http://forums.nvidia.com/index.php?showtopic=80850 |deadlink=no }}</ref> |
|||
! style="text-align:left;" | 2 поколение <br />GPU Вычислительный <br />сервер |
|||
| S1070 |
| S1070 |
||
| 4 |
| 4 |
||
| 602 |
| 602 |
||
| |
| 4×240 (960) |
||
| 1440 |
| 1440 |
||
| 409 |
| 409,6 |
||
| GDDR3 |
| GDDR3 |
||
| 512 |
| 512 |
||
| 16384 |
| 16384 |
||
| 1600 |
| 1600 |
||
| 4147 |
| 4147,2 |
||
| 2764 |
| 2764,8 |
||
| 345 |
| 345,6 |
||
| 1 |
| 1,3 |
||
| |
| |
||
| [[Юнит (единица измерения)|Одноюнитовая стойка]]<br>IEEE 754—2008 FMA |
|||
| [[19-inch rack|1U Стойка]]<br />[[IEEE 754r]] двойная точность |
|||
|- valign="top" |
|- valign="top" |
||
! 3-е поколение<br>Tesla-процессор<ref name="four">Нет официальных данных; предполагается, что основаны на GeForce 400 Series.</ref> |
|||
! style="text-align:left;" | 2 поколение <br />GPU Вычислительный <br />сервер <ref>[http://forums.nvidia.com/index.php?showtopic=80850 Difference between Tesla S1070 and S1075]</ref> |
|||
| S1070 |
|||
| 4 |
|||
| 602 |
|||
| 4 x 240 (960) |
|||
| 1440 |
|||
| 409.6 |
|||
| GDDR3 |
|||
| 512 |
|||
| 16384 |
|||
| 1600 |
|||
| 4147.2 |
|||
| 2764.8 |
|||
| 345.6 |
|||
| 1.3 |
|||
| |
|||
| [[19-inch rack|1U Стойка]]<br />[[IEEE 754r]] двойная точность |
|||
|- valign="top" |
|||
! style="text-align:left;" | 3 поколение <br />Tesla процессор³ |
|||
| C2050 |
| C2050 |
||
| 1 |
| 1 |
||
Строка 161: | Строка 173: | ||
| GDDR5 |
| GDDR5 |
||
| 384 |
| 384 |
||
| 3072<ref name="ReferenceA">С активированным ECC доступная для пользователя память составит 2,625 ГБ на GPU для C2050, S2050 и 5,25 ГБ на GPU для C2070.</ref> |
|||
| 3072<sup>4</sup> |
|||
| 3000 |
| 3000 |
||
| 1288 |
| 1288 |
||
| 1030,4<ref name="fmad">GF100 выполняет новую соединенную инструкцию умножения-сложения FMA(D) (Fused Multiply-Add) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница между инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A×B+C заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.</ref> |
|||
| 1030.4<sup>5</sup> |
|||
| 515 |
| 515,2 |
||
| 2 |
| 2,0 |
||
| 238 |
| 238 |
||
| Полноразмерная видеокарта<br>IEEE 754—2008 FMA |
|||
| Full-height [[video card]]<br />[[IEEE 754-2008]] [[Multiply-accumulate|FMA]] capabilities |
|||
|- valign="top" |
|- valign="top" |
||
! |
! 3-е поколение<br>Tesla-процессор<ref name="four" /> |
||
| C2070 |
| C2070 |
||
| 1 |
| 1 |
||
Строка 179: | Строка 191: | ||
| GDDR5 |
| GDDR5 |
||
| 384 |
| 384 |
||
| 6144< |
| 6144<ref name="ReferenceA"/> |
||
| 3000 |
| 3000 |
||
| 1288 |
| 1288 |
||
| 1030 |
| 1030,4<ref name="fmad" /> |
||
| 515 |
| 515,2 |
||
| 2 |
| 2,0 |
||
| 247 |
| 247 |
||
| Полноразмерная видеокарта<br>IEEE 754—2008 FMA |
|||
| Full-height [[video card]]<br />[[IEEE 754-2008]] [[Multiply-accumulate|FMA]] capabilities |
|||
|- valign="top" |
|- valign="top" |
||
! |
! M2050<br>Вычислительный модуль на основе GPU |
||
| M2050 |
| M2050 |
||
| 1 |
| 1 |
||
Строка 194: | Строка 206: | ||
| 448 |
| 448 |
||
| 1150 |
| 1150 |
||
| 148 |
| 148,4 |
||
| GDDR5 |
| GDDR5 |
||
| 384 |
| 384 |
||
| 3072< |
| 3072<ref name="fmad" /> |
||
| 3092 |
| 3092 |
||
| 1288 |
| 1288 |
||
| 1030 |
| 1030,4<ref name="fmad" /> |
||
| 515 |
| 515,2 |
||
| 2 |
| 2,0 |
||
| 225 |
| 225 |
||
| Вычислительный модуль<br |
| Вычислительный модуль<br>IEEE 754—2008 FMA |
||
|- valign="top" |
|- valign="top" |
||
! M2070/M2070Q<ref>{{Cite web |url=http://www.vizworld.com/2010/08/nvidia-tesla-m2050-m2070m2070q-specs-online/ |title=NVidia Tesla M2050 & M2070/M2070Q Specs Online |access-date=2010-10-31 |archive-date=2020-08-17 |archive-url=https://web.archive.org/web/20200817185337/https://vizworld.com/2010/08/nvidia-tesla-m2050-m2070m2070q-specs-online/ |deadlink=no }}</ref><br>Вычислительный модуль на основе GPU |
|||
! style="text-align:left;" | 3 поколение <br />Tesla Вычислительный модуль³ |
|||
| M2070 |
| M2070/M2070Q |
||
| 1 |
| 1 |
||
| 575 |
| 575 |
||
| 448 |
| 448 |
||
| 1150 |
| 1150 |
||
| |
| 150,336 |
||
| GDDR5 |
| GDDR5 |
||
| 384 |
| 384 |
||
| 6144< |
| 6144<ref name="fmad" /> |
||
| |
| 3132 |
||
| 1288 |
| 1288 |
||
| 1030 |
| 1030,4<ref name="fmad" /> |
||
| 515 |
| 515,2 |
||
| 2 |
| 2,0 |
||
| 225 |
| 225 |
||
| Вычислительный модуль<br |
| Вычислительный модуль<br>IEEE 754—2008 FMA |
||
|- valign="top" |
|- valign="top" |
||
! S2050 1U<br>Вычислительная система на основе GPU |
|||
! style="text-align:left;" | 3 поколение <br />GPU Вычислительный <br />сервер |
|||
| S2050 |
| S2050 |
||
| 4 |
| 4 |
||
| 575 |
| 575 |
||
| |
| 4×448 (1792) |
||
| 1150 |
| 1150 |
||
| 593 |
| 4×148,4 (593,6) |
||
| GDDR5 |
| GDDR5 |
||
| 384 |
| 384 |
||
| 12288< |
| 12288<ref name="fmad" /> |
||
| 3092 |
| 3092 |
||
| 5152 |
| 5152 |
||
| 4121 |
| 4121,6<ref name="fmad" /> |
||
| 2060 |
| 2060,8 |
||
| 2 |
| 2,0 |
||
| 900 |
| 900 |
||
| [[19-inch rack|1U Rack]]<br |
| [[19-inch rack|1U Rack]]<br>IEEE 754—2008 FMA |
||
|} |
|} |
||
* <sup>1</sup>Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 8800GTX. |
|||
* ²Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce GTX280 |
|||
* ³Спецификации, не определенные NVIDIA, как предполагается, основаны на GeForce 400 Series |
|||
* <sup>4</sup>С активированным ECC, доступная для пользователя память, составит 2.625 Гбайта на GPU для C2050, S2050 и 5.25 Гбайт на GPU для C2070. |
|||
* <sup>5</sup> GF100 выполняет новую соединенную инструкцию умножения-сложения FMA(D)(Fused Multiply-Add) для обоих 32 битных чисел одинарной точности с плавающей запятой и 64 битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница мужду инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A*B+C, заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.<br /> |
|||
== См. также == |
== См. также == |
||
* [[CUDA]] |
* [[CUDA]] |
||
* [[GPGPU]] |
|||
* [[Stream Processing]] |
|||
* [[AMD FireStream]] |
* [[AMD FireStream]] |
||
* [[Folding@Home]] |
* [[Folding@Home]] |
||
== Примечания == |
|||
{{примечания|2}} |
|||
== Ссылки == |
== Ссылки == |
||
{{Навигация}} |
|||
Информация на сайте Nvidia на английском: |
|||
* [http://www.nvidia.com/object/tesla_product_literature.html Tesla] |
* [http://www.nvidia.com/object/tesla_product_literature.html Tesla]{{ref-en}} |
||
* [http://www.nvidia.com/object/cuda_home.html CUDA Zone] |
|||
* [http://www.pny-europe.com/showpromotion.php?promotionid=17 PNY Technologies — партнер Nvidia] |
|||
Информация на русском (не полная): |
|||
* [http://www.nvidia.ru/page/tesla_computing_solutions.html Tesla] |
* [http://www.nvidia.ru/page/tesla_computing_solutions.html Tesla] |
||
* [http://www.nvidia.ru/object/cuda_learn_ru.html CUDA] |
* [http://www.nvidia.ru/object/cuda_learn_ru.html CUDA] |
||
* [http://www.FEA.ru/FEA_news_2019.html отчет о результатах исследования ускорения расчетов в ANSYS 12.1 и 13.0 при использовании SSD и NVIDIA Tesla (апрель 2011 г.)] |
|||
== Примечания == |
|||
{{примечания}} |
|||
{{Nvidia}} |
{{Nvidia}} |
||
{{Нет иллюстраций}} |
|||
[[Категория:Видеокарты NVIDIA|T]] |
[[Категория:Видеокарты NVIDIA|T]] |
||
[[Категория: |
[[Категория:Микросхемы видеоконтроллеров]] |
||
[[Категория:GPGPU]] |
[[Категория:GPGPU]] |
||
[[de:Nvidia Tesla]] |
|||
[[en:Nvidia Tesla]] |
|||
[[fr:Tesla (NVIDIA)]] |
|||
[[it:NVidia Tesla]] |
|||
[[ja:NVIDIA Tesla]] |
|||
[[ko:엔비디아 테슬라]] |
|||
[[pl:Nvidia Tesla]] |
|||
[[pt:NVIDIA Tesla]] |
|||
[[zh:NVIDIA Tesla]] |
Текущая версия от 16:15, 5 ноября 2024
Nvidia Tesla — название семейства вычислительных систем NVIDIA на основе графических процессоров с архитектурой CUDA, которые могут быть использованы для научных и технических вычислений общего назначения. Tesla не может полностью заменить обычный универсальный процессор, но позволяет использовать вычислительный ресурс множества своих ядер для решения определенного круга ресурсоёмких задач (вести параллельную обработку данных). Примерами таких задач могут служить симуляция свёртывания молекул белка, секвенирование ДНК, моделирование погоды, анализ финансового риска и т. п.
Системы Tesla впервые появились на рынке с выходом графического чипа NVIDIA восьмого поколения — G80. Tesla строится на базе обычных графических процессоров, но, в отличие от видеоускорителей, не имеет средств вывода изображения на дисплей. Являясь своего рода сопроцессором, Tesla может использоваться для создания вычислительных систем на базе персональных компьютеров, а также в составе серверов и вычислительных кластеров.
Предлагая свой продукт для рынка высокопроизводительных кластеров, NVIDIA заявляет, что преимуществом гетерогенных вычислительных систем с Tesla является большая энергоэффективность и меньшая стоимость (как недостаток можно рассматривать меньшую универсальность).
Спецификации и конфигурации
[править | править код]Модели Tesla 2007 года на базе GPU G80 (единственная группа карт без поддержки операций над 64-битными числами с плавающей точкой):
- Tesla C870 — карта для рабочих станции (1 GPU)
- Tesla D870 — приставной суперкомпьютер (2 GPU)
- Tesla S870 — сервер (4 GPU)
Модели Tesla на базе GT200 (2008—2009 год):
- Tesla C1060 — карта для рабочих станции (1 GPU)
- Tesla S1070 — сервер (4 GPU)
- Tesla S1075 — сервер (4 GPU)
- Quadro Plex 2200 D2 (2 GPU)
- Quadro Plex 2200 S4 (4 GPU)
Модели Tesla на базе GF100 и GF110 (2011 год):
- Tesla C2050, M2050 — карта для рабочих станции (1 GPU)
- Tesla C2070, C2075, M2070 — карта для рабочих станции (1 GPU)
- Tesla M2090 — карта на основе GF110
- Tesla S2050, S2070 — сервер (4 GPU)
На базе архитектуры Kepler предлагаются модели[1] 2012—2014 годов:
- Tesla K10 (2× GK104)
- Tesla K20, K20x (1× GK110)
- Tesla K40 (1× GK110B)
- Tesla K80 (2× GK210)
В 2015 году были представлены модели на базе микроархитектуры Maxwell:
- M4 (1× GM206)
- M6 (1× GM204)
- M10 (4× GM107)
- M40 (1× GM200)
- M60 (2× GM204)
Чипы Pascal служили основой для карт 2016—2017 годов[2]:
- P4 (1× GP104), PCIe
- P6 (1× GP104), MXM
- P40 (1× GP102), PCIe
- P100 (1× GP100), NVLink
- P100 (1× GP100, 16 или 12 ГБ ОЗУ), PCIe
В 2017 году появилась модель на базе Volta — Tesla V100, в виде PCIe и NVLink карт[2].
В 2018 году представлена карта Tesla T4 на базе Turing[2].
Описание | Модель | Количество GPU | Частота ядра, МГц | Шейдерные процессоры | Память | Теоретическая производительность, гигафлопс[3] | Вычислительные способности [4] | TDP, Вт | Примечания/формфактор | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Количество | Частота, МГц | Пропускная способность, ГБ/с | Стандарт видеопамяти | Шина видеопамяти, бит | Объём видеопамяти, МБ | Частота (эффективная), МГц | Одинарная точность, всего (MUL+ADD+SF) | Одинарная точность, MAD (MUL+ADD) | Двойная точность, FMA | |||||||
Вычислительный модуль на основе GPU[5] | C870 | 1 | 600 | 128 | 1350 | 76,8 | GDDR3 | 384 | 1536 | 1600 | 518,4 | 345,6 | 0 | 1,0 | 170,9 | АТХ видеокарта |
Приставной суперкомпьютер[5] | D870 | 2 | 600 | 2×128 (256) | 1350 | 153,6 | GDDR3 | 384 | 3072 | 1600 | 1036,8 | 691,2 | 0 | 1,0 | Приставная система или в стойку | |
Вычислительный модуль на основе GPU[5] | S870 | 4 | 600 | 4×128 (512) | 1350 | 307,2 | GDDR3 | 384 | 6144 | 1600 | 2073,6 | 1382,4 | 0 | 1,0 | 1U Rack | |
2-е поколение Tesla-процессоров[6] | C1060 | 1 | 602 | 240 | 1300 | 102,4 | GDDR3 | 512 | 4096 | 1600 | 933,12 | 622,08 | 77,76 | 1,3 | 187,8 | ATX видеокарта IEEE 754-2008 FMA |
2-е поколение Вычислительный модуль на основе GPU[7] |
S1070 | 4 | 602 | 4×240 (960) | 1440 | 409,6 | GDDR3 | 512 | 16384 | 1600 | 4147,2 | 2764,8 | 345,6 | 1,3 | Одноюнитовая стойка IEEE 754—2008 FMA | |
3-е поколение Tesla-процессор[8] |
C2050 | 1 | 575 | 448 | 1150 | 144 | GDDR5 | 384 | 3072[9] | 3000 | 1288 | 1030,4[10] | 515,2 | 2,0 | 238 | Полноразмерная видеокарта IEEE 754—2008 FMA |
3-е поколение Tesla-процессор[8] |
C2070 | 1 | 575 | 448 | 1150 | 144 | GDDR5 | 384 | 6144[9] | 3000 | 1288 | 1030,4[10] | 515,2 | 2,0 | 247 | Полноразмерная видеокарта IEEE 754—2008 FMA |
M2050 Вычислительный модуль на основе GPU |
M2050 | 1 | 575 | 448 | 1150 | 148,4 | GDDR5 | 384 | 3072[10] | 3092 | 1288 | 1030,4[10] | 515,2 | 2,0 | 225 | Вычислительный модуль IEEE 754—2008 FMA |
M2070/M2070Q[11] Вычислительный модуль на основе GPU |
M2070/M2070Q | 1 | 575 | 448 | 1150 | 150,336 | GDDR5 | 384 | 6144[10] | 3132 | 1288 | 1030,4[10] | 515,2 | 2,0 | 225 | Вычислительный модуль IEEE 754—2008 FMA |
S2050 1U Вычислительная система на основе GPU |
S2050 | 4 | 575 | 4×448 (1792) | 1150 | 4×148,4 (593,6) | GDDR5 | 384 | 12288[10] | 3092 | 5152 | 4121,6[10] | 2060,8 | 2,0 | 900 | 1U Rack IEEE 754—2008 FMA |
См. также
[править | править код]Примечания
[править | править код]- ↑ Источник . Дата обращения: 14 ноября 2012. Архивировано 27 января 2013 года.
- ↑ 1 2 3 NVIDIA Product Overview and Technical Brief . Дата обращения: 2 апреля 2008. Архивировано 18 марта 2015 года.
- ↑ Nvidia Announces Tesla 20 Series . Дата обращения: 21 апреля 2010. Архивировано из оригинала 21 мая 2010 года.
- ↑ Какие оборудование и программное обеспечение требуются для PhysX? Дата обращения: 21 апреля 2010. Архивировано 30 марта 2010 года.
- ↑ 1 2 3 Нет официальных данных; предполагается, что основаны на GeForce 8800 GTX.
- ↑ Нет официальных данных; предполагается, что основаны на GeForce GTX 280.
- ↑ Difference between Tesla S1070 and S1075 . Дата обращения: 21 апреля 2010. Архивировано 26 февраля 2012 года.
- ↑ 1 2 Нет официальных данных; предполагается, что основаны на GeForce 400 Series.
- ↑ 1 2 С активированным ECC доступная для пользователя память составит 2,625 ГБ на GPU для C2050, S2050 и 5,25 ГБ на GPU для C2070.
- ↑ 1 2 3 4 5 6 7 8 GF100 выполняет новую соединенную инструкцию умножения-сложения FMA(D) (Fused Multiply-Add) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница между инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A×B+C заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.
- ↑ NVidia Tesla M2050 & M2070/M2070Q Specs Online . Дата обращения: 31 октября 2010. Архивировано 17 августа 2020 года.