Вычислительная мощность компьютера
Вычислительная мощность компьютера (производительность компьютера) — это количественная характеристика скорости выполнения определённых операций на компьютере. Чаще всего вычислительная мощность измеряется во флопсах (количество операций с плавающей запятой в секунду), а также производными от неё. На данный момент принято причислять к суперкомпьютерам системы с вычислительной мощностью более 10 терафлопсов (10*1012 или десять триллионов флопсов; для сравнения среднестатистический современный настольный компьютер имеет производительность порядка 0.1 терафлопса). Одна из наиболее мощных на тесте HPL компьютерных систем — китайский Tianhe-2 — имеет производительность, превышающую 33,8 петафлопсов[1].
Неоднозначность определения
Существует несколько сложностей при определении вычислительной мощности суперкомпьютера. Во-первых, следует иметь в виду, что производительность системы может сильно зависеть от типа выполняемой задачи. В частности, отрицательно сказывается на вычислительной мощности необходимость частого обмена данных между составляющими компьютерной системы, а также частое обращение к памяти. В связи с этим выделяют пиковую вычислительную мощность — гипотетически максимально возможное количество операций над числами с плавающей запятой в секунду, которое способен произвести данный суперкомпьютер.
Важную роль играет также разрядность значений, обрабатываемых программой (обычно имеется в виду формат чисел с плавающей запятой). Так, например, у графических процессоров NVIDIA Tesla первых двух поколений максимальная производительность в режиме одинарной точности (32 бит) составляет порядка 1 терафлопса, однако при проведении вычислений с двойной точностью (64 бит) она в 10 раз ниже. (Так, в микросхемах серии GF200 в 10 раз меньше блоков с поддержкой вычислений с двойной точностью[2]).
Измерение производительности
Оценка реальной вычислительной мощности производится путём прохождения специальных тестов (бенчмарков) — набора программ, специально предназначенных для проведения вычислений и измерения времени их выполнения. Обычно оценивается скорость решения системой большой системы линейных алгебраических уравнений, что обусловливается, в первую очередь, хорошей масштабируемостью этой задачи.
Наиболее популярным тестом производительности является Linpack benchmark. В частности, HPL (высокопараллельная реализация Linpack с применением MPI)[3] используется при составлении списка TOP500 суперкомпьютеров в мире[4].
Другими популярными программами для проведения тестирования являются NAMD[5] (решение задач молекулярной динамики), HPCC (HPC Challenge Benchmark), NAS Parallel Benchmarks[3].
Наиболее мощные суперкомпьютеры
По состоянию на июнь 2011 года наиболее мощными суперкомпьютерами являются[1]:
- JUGENE — располагается в Германии в Исследовательском центре Юлиха. Разработан в рамках проекта Blue Gene компанией IBM.
- Kraken XT5 — располагается в США в университете Теннесси. Создан компанией Cray Inc.
- Roadrunner — располагается в США в Лос-Аламосской национальной лаборатории. Первый суперкомпьютер, пиковая производительность которого превысила уровень 1 петафлопса[6]. Создан компанией IBM. Особенностью является использование гибридной архитектуры, в которой основная вычислительная мощность обеспечивается процессорами Cell.
- Jaguar — располагается в США в национальной лаборатории Оук-Ридж, основан на серверных процессорах AMD Opteron. Создан компанией Cray Inc.
- Тяньхэ-1А — первый китайский суперкомпьютер петафлопсного класса[7]. Создан Национальным университетом оборонных технологией Китая. Особенностью архитектуры является наличие графических карт ATI Radeon HD 4870, сравнительно недавно предложенных для использования в сверхпроизводительных решениях.
- K computer — располагается в Японии в Институте физико-химических исследований. Разработан компанией Fujitsu.
Наивысшее место, занятое Россией — 12-е в ноябре 2009 года, с суперкомпьютером Ломоносов. На июнь 2014 года после обновления суперкомпьютер Ломоносов занимает 42-е место[8].
См. также
Примечания
- ↑ 1 2 Топ 500 лист суперкомпьютеров, июнь 2013 (англ.)
- ↑ http://www.ixbt.com/video3/cuda-1.shtml "для поддержки FP64 вычислений в NVIDIA решили сделать выделенные вычислительные блоки. И в GT200 их в десять раз меньше, чем блоков FP32 (по одному блоку двойной точности на каждый мультипроцессор)."
- ↑ 1 2 Обзор некоторых пакетов измерения производительности кластерных систем
- ↑ TOP500. The Linpack Benchmark (англ.)
- ↑ NAMD Performance (англ.)
- ↑ Пришла пора замахнуться на экзафлоп?
- ↑ В мире обозначился новый мощнейший суперкомпьютер
- ↑ Top500 List - June 2014