Тарифы эскалации, Dell XE9680 × 8 блок H200 акции в чрезвычайных ситуациях, арифметика стала новой эрой «нефти»; место, фьючерсы добро пожаловать на связь с первым замком!

 Тарифы эскалации, Dell XE9680 × 8 блок H200 акции в чрезвычайных ситуациях, арифметика стала новой эрой «нефти»; место, фьючерсы добро пожаловать на связь с первым замком! 

2025-05-19

Генеративная большая модель волной прокатилась по миру, вычислительные мощности сразу стали новой эрой «нефти».

Сегодняшний сервер Dell PowerEdge XE9680, оснащенный 8 графическими процессорами NVIDIA HGX H200, 141 ГБ видеопамяти HBM3, позволяет отечественному производителю стоять на пике обучения искусственному интеллекту.

Но это лишь верхушка айсберга.

NVIDIA, Google, AMD и другие гиганты ведут физическую борьбу в области чипов и центров обработки данных.

Кто же станет последним королем в этой арифметической гонке?

Я попытался разобрать внутреннюю работу этого арифметического безумия ИИ с четырех точек зрения: аппаратное обеспечение, энергоэффективность, сеть и безопасность.

03(1

За сотнями миллиардов параметрических моделей

Генеративные модели ИИ могут легко содержать сотни миллиардов параметров и, по крайней мере, несколько ТБ памяти для одной сессии обучения. Если взять в качестве примера 671Б (671 млрд) параметров, то общая потребность в памяти (грубая оценка): параметры (1,34 ТБ) + градиент (1,34 ТБ) + состояние оптимизатора (2,68 ТБ) ≈ 5,36 ТБ, 5,36 ТБ / 141 ГБ ≈ 39 GPU H200, 5 XE9680 (на самом деле нужно больше, чтобы учесть накладные расходы на связь). XE9680 (на самом деле нужно больше, необходимо учитывать накладные расходы на связь и избыточность). Это уже сжигание денег, сервер Dell XE9680, опирающийся на двухсторонний процессор Intel Xeon Platinum 8558, 96 ядер и 192 потока, с 2 ТБ памяти DDR5, напрямую тянущий арифметику в полном объеме. 8 графических процессоров H200, на одну карту 141 ГБ видеопамяти, всего 1,128 ТБ видеопамяти, такая конфигурация заточена под большую модель.

Почему H200 так сильно выделяется?

Пропускная способность памяти HBM3e достигает 4,8 ТБ/с, что на 40 % быстрее, чем у H100.

Вместе с интерфейсом NVLink передача данных между графическими процессорами становится быстрой как молния, а при обучении сотен миллиардов моделей параметров узкое место в данных практически отсутствует.

По подсчетам, по сравнению с традиционным PCIe Gen5, NVLink позволяет сократить цикл обучения как минимум на 30 %.

03(2

Что касается практических сценариев?

В области медицины ИИ, занимающийся секвенированием генома, должен работать с огромными массивами данных, и твердотельный накопитель NVMe объемом 3,84 ТБ и высокоскоростная память XE9680 прекрасно справляются с высокой пропускной способностью.

ИИ видеогенерации, например мультимодальные модели, такие как Sora, опираясь на тензорную вычислительную мощь H200, могут одновременно обрабатывать текст, изображения и данные временных рядов, удваивая эффективность генерации.
Но тут возникает проблема.

С такой мощной арифметической силой счета за электричество станут для людей банкротом?

Тогда поговорим о секретах «зеленых» вычислений.

Зеленые центры обработки данных: баланс между арифметикой и энергоэффективностью
Арифметические возможности ИИ растут, а вместе с ними растут и расходы на электроэнергию.

Суперкомпьютерный кластер H100 на 100 000 блоков может легко перевалить за миллиард долларов годового счета за электричество.

Dell XE9680, однако, продвинулся в вопросе энергоэффективности.

Титановый блок питания мощностью 2800 Вт, система резервирования 3+3 и технология Intel Speed Select позволяют динамически регулировать энергопотребление в зависимости от нагрузки, а энергопотребление при выполнении одной задачи снижается на 15 %.
Система воздушного охлаждения, 6U шасси зарезервировано для интерфейса жидкостного охлаждения, эффективность охлаждения тянет на полную катушку, но и для будущих модернизаций остается.

Выступление Джен-Сунь Хуанга о будущем искусственного интеллекта на конференции GTC было полным страсти, но мне всегда казалось, что о проблеме энергоэффективности говорилось меньше.

В конце концов, соревнование арифметических мощностей, наконец, пришло к тому, что энергия убивает меня, и тогда, если не оптимизировать, гениальность ИИ может быть оттянута назад стоимостью электроэнергии.

Энергоэффективность XE9680 считается эталоном в отрасли.
Но одной экономии энергии недостаточно, необходимо, чтобы искусственный интеллект, работающий в режиме реального времени, был подкреплен сетью.

03(3

Сети со сверхнизкой задержкой: победители и проигравшие в рассуждениях ИИ
ИИ рассуждает в реальном времени, и задержка - это жизненно важный фактор.

Автономное вождение, количественная торговля - замедление на 0,1 секунды может обернуться миллионными потерями.

Сетевая конфигурация XE9680 напрямую уменьшает задержку.

Благодаря восьми сетевым картам NDR 400G OSFP с протоколом RoCEv2 задержка связи составляет менее 2 микросекунд.

Адаптер Broadcom 57608 поддерживает RDMA без потерь, и поток данных для распределенного обучения устойчив, как скоростной поезд.

Не говоря уже о сетевой карте 25GbE SFP28, которая легко справляется с потоком данных от 100+ камер, идеально приспособленной для пограничных вычислений.
Но я должен быть честен.

Такая мощная сеть не может стоить дешево.

Стоимость 400-гигабитных сетевых карт и коммутаторов достаточна для того, чтобы представители малого и среднего бизнеса выпили горшок воды.

Но ничего не поделаешь, в реальном времени AI inference track, latency - это деньги.

03(4

Предприятия хотят сесть на экспресс ИИ, арифметика - это первое препятствие.

Но просто куча аппаратного обеспечения не может, производительность, энергоэффективность, сеть, безопасность не должны быть упущены.

Dell PowerEdge XE9680, как специально созданный «универсальный воин» для эпохи ИИ.

Компоненты Технические характеристики
Процессор 2 Intel Xeon Platinum 8558, 48 ядер/96 потоков, 2,1 ГГц, 260 МБ кэша, 330 Вт
ОПЕРАТИВНАЯ ПАМЯТЬ 32 64GB RDIMM, 5600MT/s, 2TB всего
ГРАФИЧЕСКИЙ ПРОЦЕССОР 8 NVIDIA HGX H200, 141 ГБ видеопамяти HBM3, 700 Вт на карту, 1,13 ТБ общей видеопамяти
Хранилище 1 x 960GB M.2 SSD (система), 2 x 3.84TB NVMe SSD (данные)
Сеть 8 NDR 400G OSFP, 1 25GbE SFP28, 1 1GbE LOM
Блок питания 2800 Вт Titanium, резервирование 3+3, 6 x 2,5 м кабелей питания C20/C21

Почему это стоит взять на вооружение?

Этот набор конфигураций охватывает практически весь сценарий обучения и вывода данных ИИ, от моделей со 100 миллиардами параметров до принятия решений в реальном времени на границе, вдоль и поперек.

Модульная конструкция позволяет модернизировать CPU и GPU по требованию и оптимизировать совокупную стоимость владения (TCO).

Психология принятия решений: игра в арифметические инвестиции
Выбор сервера искусственного интеллекта - это рискованная инвестиция.

Если вычислительная мощность слишком велика, бюджет будет перерасходован; если вычислительная мощность слишком слаба, проект застопорится.

Гибкость XE9680 позволяет предприятиям найти «золотую середину».

Он поддерживает 4/5-е поколение Xeon, совместим с H200, H100 и любым GPU, который вы хотите заменить.

Шасси 6U также можно расширить для хранения данных, поэтому можно не бояться будущего резкого увеличения объема данных.

Более того, пакет OpenManage от Dell вместе с NVIDIA AI Enterprise позволяет одним щелчком развернуть систему с «голого металла» на приложения AI, что позволяет сэкономить не менее 50% времени работы.

Где наша точка психологической игры?

Предприятия всегда беспокоятся о том, что «покупать дорого» или «покупать неправильно».

Но я видел слишком много случаев, когда они экономили несколько миллионов на аппаратном обеспечении на ранней стадии, но тратили десятки миллионов на пополнение вычислительных мощностей на более поздней стадии.

Первоначальные инвестиции в XE9680 высоки, но жизненный цикл длителен, энергоэффективность превосходна, а соотношение цена/производительность в долгосрочной перспективе просто сокрушительно.

Будущее арифметики ИИ: дикая гонка или спокойствие?

Арифметическая гонка - это аппаратный стек на поверхности и экологическая битва в основе.

Доминирование NVIDIA на рынке GPU прочно, но TPU от Google и MI300X от AMD также набирают обороты.

Гетерогенная совместимость Dell XE9680 может стать лучшим выбором для предприятий, чтобы избежать «замкнутости».

Что насчет будущего?

Плотность арифметики будет продолжать расти, пространство 6U, заполненное восемью 700-ваттными GPU, - это только начало.

Экологичные вычисления станут стандартом, технология жидкостного охлаждения может стать популярной уже через пять лет.

Сеть и безопасность также станут умнее, нулевое доверие в сочетании с мониторингом ИИ, защита от краж и утечек.

Арифметика ИИ находится в состоянии буйства, и конец линии - это не аппаратное обеспечение, а инновации.

Главная
Продукция
О Нас
Контакты

Пожалуйста, оставьте нам сообщение

Политика конфиденциальности

Спасибо за использование этого сайта (далее — «мы», «нас» или «наш»). Мы уважаем ваши права и интересы на личную информацию, соблюдаем принципы законности, легитимности, необходимости и целостности, а также защищаем вашу информационную безопасность. Эта политика описывает, как мы обрабатываем вашу личную информацию.

1. Сбор информации
Информация, которую вы предоставляете добровольно: например, имя, номер мобильного телефона, адрес электронной почты и т.д., заполнена при регистрации. Автоматически собирается информация, такая как модель устройства, тип браузера, журналы доступа, IP-адрес и т.д., для оптимизации сервиса и безопасности.

2. Использование информации
предоставлять, поддерживать и оптимизировать услуги веб-сайтов;
верификацию счетов, защиту безопасности и предотвращение мошенничества;
Отправляйте необходимую информацию, такую как уведомления о сервисах и обновления политик;
Соблюдайте законы, нормативные акты и соответствующие нормативные требования.

3. Защита и обмен информацией
Мы используем меры безопасности, такие как шифрование и контроль доступа, чтобы защитить вашу информацию и храним её только на минимальный срок, необходимый для выполнения задачи.
Не продавайте и не сдавайте личную информацию третьим лицам без вашего согласия; Делитесь только если:
Получите своё явное разрешение;
третьим лицам, которым доверено предоставлять услуги (с учётом обязательств по конфиденциальности);
Отвечать на юридические запросы или защищать законные интересы.

4. Ваши права
Вы имеете право на доступ, исправление и дополнение вашей личной информации, а также можете подать заявление на аннулирование аккаунта (после отмены информация будет удалена или анонимизирована согласно правилам). Чтобы реализовать свои права, вы можете связаться с нами, используя контактные данные, указанные ниже.

5. Обновления политики
Любые изменения в этой политике будут уведомлены путем публикации на сайте. Ваше дальнейшее использование услуг означает ваше согласие с изменёнными правилами.