IBM-Summit
Каждые полгода на сайте https://www.top500.org/ публикуется рейтинг пятисот самых мощных суперкопьютеров планеты. Список мейнфреймов в классе HPC (High Performance Computing) и некоторых их технических характеристик любой желающий может самостоятельно загрузить в виде файла EXCEL или просмотреть на этом же сайте, используя всевозможные фильтры и связанные с ними панели графического представления. При всем обилии числового и графического материала, посвященого HPC, у посетителя сайта может возникнуть ощущение, что из года в год, как и установлено законом Мура, непрерывно растет производительность суперкомьютеров, при этом меняются только лидеры в первых десяти позициях из пятисот. В самом деле, не успели два титана HPC (американский SUMMIT и китайский SUNWAY TAIHULIGHT) померятся в пиковой производительности, как на горизонте появился новый лидер гонки — японский флагман FUGAKU, который обошел их, заняв первую строчку в рейтинге. Чтобы понять глубже картину происходящего на рынке HPC, воспользуемся двумя хорошо известными приемами (методами) статистики: кластеризацией (сегментацией) и регрессионным анализом.
Попытаемся определить, кто задает не только темп, но и общий вектор развития в этой области, опираясь на самый свежий перечень HPC мейнфреймов и их характеристик за ноябрь 2020 года. Все вычисления будем выполнять, используя язык программирования R и инструментальную среду разработки (IDE) под этот язык — RStudio. К слову сказать, мой путь к R/RStudio был извилистым и весьма поучительным: Excel/VBA, Statisica/VB, SPSS, Minitab. Несмотря на то, что сейчас Python явлется альфой и омегой ML/AI сообщества, автор остается твердым адептом R/RSudio, признавая право каждого на свой выбор инструмента исследования. В конечном счете, исследователем движет прежде всего интерес к предмету, а не сам инструмент, каким бы известным он ни был в данный момент.
Правило Парето или правило 80/20 гласит: 20% усилий дают 80% результатов. Применительно к TOP500 это правило (иногда его называют законом) позволит нам определить, какие страны задают вектор или, образно говоря, делают погоду в области HPC. Для краткости изложения мы опускаем детали подготовки данных и написания кода R, которые можно найти по прилагаемым в тексте ссылкам. Сегментация первых шести стран в списке TOP500 по количеству менйфреймов и соответсвующая Парето-диаграмма приведены ниже (подробнее см. https://rpubs.com/alex-lev/694840).
Итак, мы делаем первый вывод: Китай, США, Япония, Франция, Германия и Нидерланды (6 стран из 29 или 20%) по количеству мейнфреймов HPC составляют 80% всего парка в списке TOP500. При этом доля Китая составляет 42.6% (213), США — 22.6% (113), Японии — 6.8% (34), Франции — 3.6% (18), Германии — 3.6% (18) и Нидерланды — 3% (15).
Заметим, что Китай лидирует не только по количеству мейнфреймов, но и по их суммарной пиковой производительности (Sum_Rpeak), значительно опережая США и давая половину всей суммарной пиковой производительности пятерки. Означает ли это, что именно Китай задает вектор развития HPC, если среднее отношение пиковой производительности к количеству вычислительных ядер RpeakCores=Sum_Rpeak/Sum_Cores у Китая составляет всего 0.04 против 0.071 Германии? Для ответа на этот вопрос обратимся к регрессионому анализу.
Рост пиковой производительности мейнфреймов HPC из года в год сопровождается наращиванием количества выислительных ядер (TotalCores). Для примера, FUGAKU имеет свыше семи миллионов таких ядер (TotalCores=7630848), обладая пиковой производительностью Rpeak=537212 Терафлопс (1012флопс) или 537.212 Петафлопс (1015флопс), в то время как SUMMIT США, собранный в 2018 году и занимающий вторую строчку рейтинга TOP500, имеет соответственно TotalCores=2414592 ядер и Rpeak=200794.880 Терафлопс, а китайский SUNWAY TAIHULIGHT, собранный в 2016 году и занимающий четвертую строчку в рейтинге, имеет свыше десяти миллионов ядер (TotalCores=10649600) при пиковой производительности Rpeak=125435.904 Терафлопс.
Для оценки зависимости величины пиковой производительности мейнфремов (Rpeak) от количества используемых в них вычислительных ядер (TotalCores) необходимо построить линейную регрессионную модель для каждой из пяти стран, используя логарифмическую шкалу: lm(ln(Rpeak)~ln(TotalCores)). Логарифмическое преобразование позволяет сгладить эффект отдельных сверхбольших значений переменных на фоне общего ряда числовых значений т.е придать ему большую эластичность. Ниже приводится графическое и табличное представление решения линейной регрессионной модели для каждой из пяти стран (подробнее см. https://rpubs.com/alex-lev/696179, https://rpubs.com/alex-lev/713455) вида:
\[ ln(Y_i)=B_0 + B_1ln(X_i) + E_i, \] где \(Y_i\) - \(Rpeak_i\) , \(X_i\) - \(TotalCores_i\), \(B_0\),\(B_1\) - коэффициенты, \(E_i\) - ошибка.
При этом коэффициент \(B_1\) по своему смыслу для данного вида уравнения (логарифмирования зависимой и независимой переменых) показывает на сколько процентов изменяется (увеличивается) пиковая производительность Rpeak при изменении (увеличении) количества вычислительных ядер \(TotalCores\) на 1%. Как будет показано ниже, это обстоятельство расскрывает истинную картину происходящего в гонке высокопроизводительных вычислений.
Как видно на графике и подкреплено таблицей, рост пиковой производительности, обусловленный количеством вычислительных ядер, для каждой из пяти стран в рамках принятых допущений и ограничений линейной регрессионной модели носит ярко выраженный индивидуальный характер. Эта индивидуальность проявляется в коэффициенте \(B_1\) (см. в таблице выше \(log(TotalCores)\)) уравнения линейной регрессии, величина которого характеризует отдачу материальных затрат на полученный результат.
Заметим, что для всех пяти стран коэффициент \(B_1\) является статистически значимым (см. в таблице выше \(p.value\)), что дает основания построить следующую иерархию эффективности наращивания высокопроизводительных ресурсов: США - 99.9%, Франция - 78.4%, Германия - 74.2%, Япония - 69.5%, Китай - 64.1%. Иными словами, Китай агрессивно наращивает потенциал HPC за счет количества мейнфреймов и их суммарной производительности, пытаясь стать лидером в гонке высокопроизводительных вычислений в ущерб эффективности. Выход Японии на первую позицию рейтинга TOP500 с флагманом FUGAKU обостряет гонку среди пяти лидеров и мотивирует остальных участников продолжить усилия в этой области.