Суперкомпьютеры нового поколения

Ответить

Код подтверждения
Введите код в точности так, как вы его видите. Регистр символов не имеет значения.
Смайлики
:D :) ;) :( :o :shock: :? 8-) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :!: :?: :idea: :arrow: :| :mrgreen: :geek: :ugeek:

BBCode ВКЛЮЧЁН
[img] ВКЛЮЧЁН
[url] ВКЛЮЧЁН
Смайлики ВКЛЮЧЕНЫ

Обзор темы
   

Развернуть Обзор темы: Суперкомпьютеры нового поколения

Суперкомпьютеры нового поколения

admin_ » 25 май 2025, 07:04

Экзафлопсные вычислительные системы могут обрабатывать свыше квинтиллиона операций в секунду, позволяя суперкомпьютерам выполнять сложнейшие симуляции, которые ранее были невозможны. Но как это работает?Что такое Нейронные Процессоры (NPU) и почему они важны для современных вычислений
Экзафлопсные вычисления — это последний рубеж в области передовых суперкомпьютеров — высокопроизводительных систем, способных обрабатывать вычисления со скоростями, в настоящее время недостижимыми любыми другими методами.
Экзафлопсные суперкомпьютеры — это компьютеры, работающие в экзафлопсном масштабе. Приставка «экса» означает 1 квинтиллион, то есть 1×10 в 18 степени — или единица с 18 нулями. Флопс (FLOP, Floating point operations per second) — это «операции с плавающей запятой в секунду», тип вычислений, используемый для сравнительного тестирования производительности компьютеров.
Это означает, что экзафлопсный компьютер может обрабатывать не менее 1 квинтиллиона операций с плавающей запятой в секунду.
Для сравнения большинство домашних компьютеров работают в терафлопсном диапазоне (обычно около 5 терафлопс, то есть 5×10 в 12 степеи операций с плавающей запятой в секунду), обрабатывая лишь около 5 триллионов операций с плавающей запятой в секунду.
Экзафлопс — это миллиард миллиардов операций в секунду. Вы можете решать задачи либо гораздо большего масштаба, например, симуляцию целой планеты, либо с гораздо более высокой степенью детализации.

Чем больше операций с плавающей запятой компьютер может обработать в секунду, тем он мощнее, что позволяет ему решать большее количество вычислений значительно быстрее.
Экзафлопсные вычисления обычно используются для проведения сложных симуляций, как метеорологическое прогнозирование погоды, моделирование новых типов лекарств и виртуальные испытания конструкций двигателей.
Сколько существует экзафлопсных компьютеров и для чего используются
Первый экзафлопсный компьютер под названием Frontier был запущен компанией HPE в июне 2022 года.
Его зафиксированная рабочая скорость составляет 1.102 экзафлопс. С тех пор этот показатель был превзойдён текущим лидером El Capitan, который в настоящее время работает со скоростью 1.742 экзафлопс. На момент публикации существует 2 таких компьютера.
Экзафлопсные суперкомпьютеры использовались во время пандемии COVID-19 для сбора, обработки и анализа огромных объёмов данных. Это позволило учёным понять и смоделировать генетический код вируса, в то время как эпидемиологи использовали вычислительные мощности машин для прогнозирования распространения болезни среди населения.
Эти симуляции были выполнены за гораздо более короткий промежуток времени, чем это было бы возможно с использованием высокопроизводительного офисного компьютера. Стоит также отметить, квантовые компьютеры — это не то же самое, что суперкомпьютеры.
Вместо представления информации с помощью обычных битов квантовые компьютеры используют квантовые свойства кубитов (квантовых битов, базовых единиц квантовой информации) для решения задач, слишком сложных для любого классического компьютера.

Для работы экзафлопсной вычислительной системе требуются десятки тысяч усовершенствованных центральных процессоров (CPU, Central Processing) и графических процессоров (GPU, Graphical Processing Units), размещённых в одном пространстве.

Близкое расположение CPU и GPU также крайне важно, так как это уменьшает задержку (латентность, время, необходимое для передачи данных между компонентами) внутри системы. Хотя задержка обычно измеряется в пикосекундах, при одновременной обработке миллиардов вычислений эти крошечные задержки могут суммироваться и замедлять работу всей системы.
Интерконнект (сеть соединений) связывает вычислительные узлы (состоящие из CPU, GPU и памяти) воедино. Затем программный стек (совокупность программного обеспечения) позволяет объединить вычислительную мощность узлов для решения одной вычислительной задачи.
Несмотря на то что их компоненты упакованы как можно плотнее, экзафлопсные компьютеры всё равно являются колоссальными устройствами. Суперкомпьютер Frontier, например, состоит из 74 шкафов, каждый весом примерно 3,5 тонны, и занимает более 680 кв/м — примерно половину футбольного поля.

Компьютеры требуют охлаждения для рассеивания избыточного тепла, а миллиарды вычислений, выполняемых экзафлопсными компьютерами, каждую секунду, могут нагреваться до потенциально опасных температур.
Объединить такое количество компонентов для совместной работы — это, вероятно, самый сложный путь, потому что всё должно работать идеально. Особенно трудно заставить 36 000 GPU работать синхронно.
Управление температурным режимом имеет жизненно важное значение при разработке экзафлопсных суперкомпьютеров.
Некоторые используют холодную окружающую среду, например, в Арктике, для поддержания идеальных температур; другие используют жидкостное водяное охлаждение, стойки с вентиляторами или некоторую комбинацию этих методов для поддержания низких температур.

Однако системы контроля среды также добавляют дополнительную сложность к задаче управления энергопотреблением. Экзафлопсные вычисления требуют огромного количества энергии из-за числа процессоров, которые необходимо питать.
Хотя экзафлопсные вычисления потребляют много энергии, в долгосрочной перспективе они способны обеспечить экономию энергии для проекта. Например, вместо итеративной разработки, создания и тестирования новых конструкций, компьютеры можно использовать для виртуального моделирования конструкции за сравнительно короткий промежуток времени.
Экзафлопсные компьютеры очень подвержены сбоям
Ещё одна проблема, стоящая перед экзафлопсными вычислениями, — это надёжность. Чем больше компонентов в системе, тем сложнее она становится. Например, в среднем домашний компьютер выйдет из строя в течение 3 лет, в экзафлопсных вычислениях частота отказов измеряется часами.

Эта короткая периодичность отказов обусловлена тем, что для экзафлопсных вычислений требуются десятки тысяч CPU и GPU — все они работают с высокой производительностью. Учитывая высокие требования, одновременно предъявляемые ко всем компонентам, повышается вероятность, что хотя бы один компонент выйдет из строя в течение нескольких часов.
Из-за частоты отказов экзафлопсных вычислительных систем, приложения используют метод сохранения контрольных точек (checkpointing, создание «снимков» состояния системы и данных) для сохранения прогресса при обработке вычислений на случай сбоя системы.
Чтобы снизить риск сбоя и избежать ненужных простоев, экзафлопсные компьютеры используют диагностический комплекс наряду с системами мониторинга. Эти системы обеспечивают постоянный надзор за общей надёжностью системы и выявляют компоненты, которые проявляют признаки износа, помечая их для замены до того, как они вызовут сбои в работе.
Высокие рабочие скорости в экзафлопсных вычислениях требуют специализированных операционных систем и приложений для полного использования их вычислительной мощности.

Нужно распараллеливать вычислительный алгоритм на миллионы процессорных единиц гетерогенным образом (между узлами и внутри узла между ядрами GPU или CPU. Не все вычислительные задачи поддаются этому.
Коммуникация между различными процессами и потоками должна быть тщательно организована; а эффективная реализация ввода и вывода данных является сложной задачей. Из-за сложности выполняемых симуляций проверка результатов также может быть затруднительной.
Результаты экзафлопсных компьютеров не могут быть проверены, или, по крайней мере, не за короткий промежуток времени, обычными офисными компьютерами. Вместо этого приложения используют прогнозируемые пределы погрешности, которые дают приблизительную оценку ожидаемых результатов, при этом всё, что выходит за эти пределы, отбрасывается.
За пределами экзафлопсных вычислений
Согласно Закону Мура, ожидается, что число транзисторов в интегральной схеме будет удваиваться каждые 2 года.
Если такие темпы развития сохранятся (а это большое «если», поскольку так не может продолжаться вечно), мы можем ожидать появления зеттафлопсных вычислений — единица с 21 нулём после — примерно через 10 лет.

Экзафлопсные вычисления превосходно справляются с одновременной обработкой огромного количества вычислений за очень короткий промежуток времени, в то время как квантовые вычисления начинают решать невероятно сложные проблемы, с которыми обычные вычисления справились бы с трудом.
Хотя квантовые компьютеры в настоящее время не так мощны, как экзафлопсные, прогнозируется, что со временем они их превзойдут.
Одним из возможных направлений развития может стать объединение квантовых вычислений и суперкомпьютеров. Такой гибридный квантово-классический суперкомпьютер сочетал бы вычислительную мощность квантовых компьютеров с высокоскоростной обработкой классических вычислений. Учёные уже начали осваивать этот процесс, добавив квантовый компьютер к суперкомпьютеру Fugaku в Японии.

Вернуться к началу