IBM-Summit

TOP500

Каждые полгода на сайте https://www.top500.org/ публикуется рейтинг пятисот самых мощных суперкопьютеров планеты. Список мейнфреймов в классе HPC (High Performance Computing) и некоторых их технических характеристик любой желающий может самостоятельно загрузить в виде файла EXCEL или просмотреть на этом же сайте, используя всевозможные фильтры и связанные с ними панели графического представления. При всем обилии числового и графического материала, посвященого HPC, у посетителя сайта может возникнуть ощущение, что из года в год, как и установлено законом Мура, непрерывно растет производительность суперкомьютеров, при этом меняются только лидеры в первых десяти позициях из пятисот. В самом деле, не успели два титана HPC (американский SUMMIT и китайский SUNWAY TAIHULIGHT) померятся в пиковой производительности, как на горизонте появился новый лидер гонки — японский флагман FUGAKU, который обошел их, заняв первую строчку в рейтинге. Чтобы понять глубже картину происходящего на рынке HPC, воспользуемся двумя хорошо известными приемами (методами) статистики: кластеризацией (сегментацией) и регрессионным анализом.

Попытаемся определить, кто задает не только темп, но и общий вектор развития в этой области, опираясь на самый свежий перечень HPC мейнфреймов и их характеристик за ноябрь 2020 года. Все вычисления будем выполнять, используя язык программирования R и инструментальную среду разработки (IDE) под этот язык — RStudio. К слову сказать, мой путь к R/RStudio был извилистым и весьма поучительным: Excel/VBA, Statisica/VB, SPSS, Minitab. Несмотря на то, что сейчас Python явлется альфой и омегой ML/AI сообщества, автор остается твердым адептом R/RSudio, признавая право каждого на свой выбор инструмента исследования. В конечном счете, исследователем движет прежде всего интерес к предмету, а не сам инструмент, каким бы известным он ни был в данный момент.

Правило Парето

Правило Парето или правило 80/20 гласит: 20% усилий дают 80% результатов. Применительно к TOP500 это правило (иногда его называют законом) позволит нам определить, какие страны задают вектор или, образно говоря, делают погоду в области HPC. Для краткости изложения мы опускаем детали подготовки данных и написания кода R, которые можно найти по прилагаемым в тексте ссылкам. Сегментация первых шести стран в списке TOP500 по количеству менйфреймов и соответсвующая Парето-диаграмма приведены ниже (подробнее см. https://rpubs.com/alex-lev/694840).

Правило Парето Итак, мы делаем первый вывод: Китай, США, Япония, Франция, Германия и Нидерланды (6 стран из 29 или 20%) по количеству мейнфреймов HPC составляют 80% всего парка в списке TOP500. При этом доля Китая составляет 42.6% (213), США — 22.6% (113), Японии — 6.8% (34), Франции — 3.6% (18), Германии — 3.6% (18) и Нидерланды — 3% (15).

Заметим, что Китай лидирует не только по количеству мейнфреймов, но и по их суммарной пиковой производительности (Sum_Rpeak), значительно опережая США и давая половину всей суммарной пиковой производительности пятерки. Означает ли это, что именно Китай задает вектор развития HPC, если среднее отношение пиковой производительности к количеству вычислительных ядер RpeakCores=Sum_Rpeak/Sum_Cores у Китая составляет всего 0.04 против 0.071 Германии? Для ответа на этот вопрос обратимся к регрессионому анализу.

Регрессионный анализ

Рост пиковой производительности мейнфреймов HPC из года в год сопровождается наращиванием количества выислительных ядер (TotalCores). Для примера, FUGAKU имеет свыше семи миллионов таких ядер (TotalCores=7630848), обладая пиковой производительностью Rpeak=537212 Терафлопс (1012флопс) или 537.212 Петафлопс (1015флопс), в то время как SUMMIT США, собранный в 2018 году и занимающий вторую строчку рейтинга TOP500, имеет соответственно TotalCores=2414592 ядер и Rpeak=200794.880 Терафлопс, а китайский SUNWAY TAIHULIGHT, собранный в 2016 году и занимающий четвертую строчку в рейтинге, имеет свыше десяти миллионов ядер (TotalCores=10649600) при пиковой производительности Rpeak=125435.904 Терафлопс.

Для оценки зависимости величины пиковой производительности мейнфремов (Rpeak) от количества используемых в них вычислительных ядер (TotalCores) необходимо построить линейную регрессионную модель для каждой из пяти стран, используя логарифмическую шкалу: lm(ln(Rpeak)~ln(TotalCores)). Логарифмическое преобразование позволяет сгладить эффект отдельных сверхбольших значений переменных на фоне общего ряда числовых значений т.е придать ему большую эластичность. Ниже приводится графическое и табличное представление решения линейной регрессионной модели для каждой из пяти стран (подробнее см. https://rpubs.com/alex-lev/696179, https://rpubs.com/alex-lev/713455) вида:

\[ ln(Y_i)=B_0 + B_1ln(X_i) + E_i, \] где \(Y_i\) - \(Rpeak_i\) , \(X_i\) - \(TotalCores_i\), \(B_0\),\(B_1\) - коэффициенты, \(E_i\) - ошибка.

При этом коэффициент \(B_1\) по своему смыслу для данного вида уравнения (логарифмирования зависимой и независимой переменых) показывает на сколько процентов изменяется (увеличивается) пиковая производительность Rpeak при изменении (увеличении) количества вычислительных ядер \(TotalCores\) на 1%. Как будет показано ниже, это обстоятельство расскрывает истинную картину происходящего в гонке высокопроизводительных вычислений.

Как видно на графике и подкреплено таблицей, рост пиковой производительности, обусловленный количеством вычислительных ядер, для каждой из пяти стран в рамках принятых допущений и ограничений линейной регрессионной модели носит ярко выраженный индивидуальный характер. Эта индивидуальность проявляется в коэффициенте \(B_1\) (см. в таблице выше \(log(TotalCores)\)) уравнения линейной регрессии, величина которого характеризует отдачу материальных затрат на полученный результат.

Заметим, что для всех пяти стран коэффициент \(B_1\) является статистически значимым (см. в таблице выше \(p.value\)), что дает основания построить следующую иерархию эффективности наращивания высокопроизводительных ресурсов: США - 99.9%, Франция - 78.4%, Германия - 74.2%, Япония - 69.5%, Китай - 64.1%. Иными словами, Китай агрессивно наращивает потенциал HPC за счет количества мейнфреймов и их суммарной производительности, пытаясь стать лидером в гонке высокопроизводительных вычислений в ущерб эффективности. Выход Японии на первую позицию рейтинга TOP500 с флагманом FUGAKU обостряет гонку среди пяти лидеров и мотивирует остальных участников продолжить усилия в этой области.

Выводы

  1. Китай, США, Япония, Франция и Германия обладают суммарной долей в 80% всех суперкомпьютеров, входящих в рейтинг TOP500, при этом Китай располагает половиной всех ресурсов среди названной пятерки стран.
  2. По эффективности наращивания пиковой производительности суперкомпьютеров США лидируют среди вышеназванных стран, а Китай занимает последнее (пятое) место (см. https://rpubs.com/alex-lev/693131).
  3. Китай активно наращивает потенциал высокопроизводительных вычислений в ущерб эффективности.
  4. Выход Японии на первую позицию рейтинга TOP500 с флагманом FUGAKU обостряет гонку среди пяти лидеров и мотивирует остальных участников продолжить усилия в этой области.