Когда вам нужен GPU H100 для обучения большой языковой модели (LLM) или дообучения Llama 3, вы не хотите тратить время на звонки с корпоративными менеджерами. Вы хотите запустить узел, зайти по SSH и начать работу.

И что более важно, вы хотите знать, во сколько это вам на самом деле обойдется.

Мы отследили цены в реальном времени у основных специализированных облачных провайдеров, чтобы ответить на простой вопрос: У кого сейчас самая дешевая аренда H100?

Обзор цен на H100

NVIDIA H100 — это золотой стандарт для задач ИИ, но цены на них сильно разнятся. Мы обнаружили разброс более чем в 40% между самыми дешевыми и самыми дорогими провайдерами за одни и те же вычислительные мощности.

Вот текущий срез цен on-demand (за один GPU в час):

Провайдер Цена (On-Demand) Наличие Примечания
Vast.ai ~$1.80 - $2.20 Переменное Комьюнити-облако; надежность варьируется.
RunPod $2.69 Высокое Отличный UX, есть опции «Secure Cloud».
Lambda Labs $2.49 Низкое Часто всё раскуплено; лучший выбор для стабильности.
CoreWeave Через запрос Низкое Ориентированы на корпоративный сектор.
Paperspace $3.09 Среднее Удобно, но дороже.

«Скрытая» стоимость дешевых GPU

Если смотреть на таблицу, Vast.ai кажется победителем. И если ваш бюджет ограничен и вы готовы к возможным прерываниям работы, то так оно и есть. Но есть нюанс.

Vast.ai агрегирует мощности потребительских и свободных корпоративных серверов. «Самый дешевый» часто означает аренду машины в дата-центре уровня Tier 3 (или в чьем-то подвале) с обычным интернет-каналом. Для обучения на нескольких узлах задержки сети могут убить всю производительность, сводя на нет экономию.

RunPod и Lambda предлагают «золотую середину»: дата-центры уровня Tier 1 с гарантированным аптаймом и быстрыми соединениями (Infiniband или быстрый Ethernet) по цене, от которой ваш финансовый директор не придет в ужас.

Spot-инстансы: Реальная экономия

Если ваша задача допускает прерывания (то есть у вас настроено сохранение чекпоинтов), спот-инстансы — это то, где скрыта настоящая выгода.

Мы видели спот-инстансы H100 на RunPod по цене всего $1.99/час. Это значительно дешевле, чем $3.50+, которые вы могли бы заплатить на AWS или Azure (если вам вообще одобрят там квоту).

Рекомендации

Наш выбор

  • Для экспериментов и отладки: Используйте RunPod Secure Cloud. Мгновенно, надежно и работа с Docker реализована бесшовно.
  • Для длительных циклов обучения: Ждите появления свободных мест в Lambda Labs или заключайте контракт на зарезервированные инстансы, если вам нужно более 8 GPU.
  • Для максимальной экономии: Vast.ai, но внимательно следите за качеством соединения.

Заключение

«Самый дешевый» H100 — это не всегда тот, у которого самый низкий ценник за час. Это тот, который позволит вам завершить обучение без сбоев, зависаний или потери данных.

Мы обновляем нашу основную таблицу каждый час. Проверьте главную страницу для получения актуальной информации о наличии.

FAQ