banner
Дом / Блог / Ажиотаж вокруг искусственного интеллекта приведет к заоблачным ценам на графические процессоры в центрах обработки данных
Блог

Ажиотаж вокруг искусственного интеллекта приведет к заоблачным ценам на графические процессоры в центрах обработки данных

Dec 20, 2023Dec 20, 2023

ОБНОВЛЕНОКак и многим разработчикам систем HPC и искусственного интеллекта, нам не терпится увидеть, как может выглядеть гибридная система CPU-GPU Antares Instinct MI300A на кристалле AMD с точки зрения производительности и цены.

А через несколько недель состоится конференция по суперкомпьютерам ISC 2023, и Бронис де Супински, технический директор Ливерморской национальной лаборатории Лоуренса, выступит на мероприятии с докладом о будущей экзафлопсной системе «Эль-Капитан», которая станет флагманской машиной. мы думаем об этом для варианта MI300A графических процессоров Antares.

Итак, просто ради развлечения, мы извлекли таблицу доверия Excel и попытались оценить, какими могут быть каналы и скорости графических процессоров MI300 и MI300A, последний из которых будет лежать в основе системы El Capitan. Да, возможно, это глупость, учитывая, что AMD, скорее всего, расскажет немного больше о серии графических процессоров MI300 на выставке ISC 2023 и далее, и в конечном итоге мы точно узнаем, как устроен этот вычислительный механизм. Но довольно много людей продолжают спрашивать нас, может ли серия MI300 быть конкурентоспособной с графическими ускорителями Nvidia «Hopper» H100 и, что, возможно, более важно, конкурентоспособной с комбинацией 72-ядерного процессора «Grace» Arm, плотно привязанного к Hopper. Графический процессор H100 создаст комбинированный гибридный комплекс CPU-GPU Grace-Hopper, который будет конкурировать с MI300A, который будет развернут в Эль-Капитане, и, как мы думаем, с другой гибридной машиной CPU-GPU, выполняющей рабочие нагрузки HPC и AI. бок о бок.

А учитывая интенсивный спрос на вычисления на графических процессорах, вызванный взрывным ростом объемов обучения ИИ для генеративных приложений ИИ на основе больших языковых моделей, а также желание AMD больше участвовать в обучении ИИ с помощью своих графических процессоров, мы считаем, что спрос превысит спрос Nvidia. Это означает, что, несмотря на огромное преимущество программного стека Nvidia AI над AMD, графические процессоры последней получат некоторые преимущества в поставках AI. Предшественники графических процессоров «Альдебаран» уже добились впечатляющих успехов AMD в разработке HPC, в частности, в экзафлопсной системе «Frontier» в Национальной лаборатории Ок-Ридж, где четыре из этих двухчиповых графических процессоров были подключены к специальному процессору «Trento» Epyc для создания более слабосвязанный гибридный вычислительный механизм. (Есть и другие.) И мы считаем, что высокий спрос на графические процессоры Nvidia для рабочих нагрузок искусственного интеллекта фактически оставит AMD возможность выиграть некоторые сделки, поскольку спрос превышает предложение.

Сегодня люди не будут более терпеливы в добавлении генеративного ИИ в свои рабочие нагрузки, чем в конце 1990-х и начале 2000-х годов, когда они добавляли веб-инфраструктуру для модернизации своих приложений и развертывания для них интерфейсов в Интернете. Разница на этот раз заключается в том, что центр обработки данных не трансформируется в вычислительную подложку общего назначения X86, а, скорее, становится все более и более экосистемой конкурирующих и взаимодополняющих архитектур, которые объединены вместе, чтобы обеспечить максимальную отдачу от затраченных средств. для более широкого спектра рабочих нагрузок.

Мы пока мало что знаем о серии MI300, но в январе AMD немного рассказала об устройствах, о которых мы здесь рассказывали. У нас есть изображение одного из устройств, и мы знаем, что одно из них будет иметь производительность искусственного интеллекта в 8 раз выше, а производительность искусственного интеллекта на ватт — в 5 раз выше, чем у существующего графического ускорителя MI250X, используемого в системе Frontier. Мы знаем, что один из девяти чипсетов серии MI300 имеет 146 миллиардов транзисторов. Мы полагаем, что большая часть этого количества транзисторов реализована в четырех 6-нанометровых плитках, которые соединяют между собой вычислительные элементы ЦП и ГП, на которых также выгравирован Infinity Cache. Трудно сказать, сколько транзисторов использует этот кэш, но мы с нетерпением ждем возможности это выяснить.

Кстати, мы думаем, что MI300A назван так, чтобы обозначить, что это версия APU (то есть комбинация ядер ЦП и графического процессора в одном корпусе) флагманского механизма параллельных вычислений AMD. Это означает, что будут версии Antares GPU без APU, только с графическим процессором, возможно, с максимум восемью чипсетами графического процессора, установленными на этих четырех микросхемах межсоединений и кэша, показанных ниже на том, что, как мы думаем, является MI300A: