DVAiОбсудить проект →
Конфигуратор

Подбор оборудования для локального ИИ

Интерактивный конфигуратор: выберите задачи, нагрузку и требования — получите рекомендацию по GPU, моделям и стоимости.

39

LLM-моделей в базе

18

конфигураций GPU

H100–B200

NVIDIA, от старта до кластера

PDF

персональный отчёт на почту

— Конфигуратор

Выберите параметры

Задачи
Время отклика
Запросов в минуту
Пользователей
Контекст
Качество модели
Обучение / файнтюн
Уровень
Старт
Модель
Qwen3 32B
VRAM
~40 ГБ
Пользователи
1
Модель
GPUVRAMЦена ₽tok/sЗаметка
Mac Mini M4 Pro18 GB0.13–0.16M9Тихий, компактный
RTX 409024 GB0.18–0.28M45Игровая, нет ECC
Mac Mini M4 Max36–64 GB0.25–0.45M19До 64 ГБ единой памяти
RTX 509032 GB0.26–0.37M71Игровая, нет ECC
A3024 GB0.4–0.5M19ECC, серверная
2× RTX 509064 GB0.52–0.74M75Две карты параллельно
A6000 Ada48 GB0.6–0.7M38ECC, рабочая станция
Mac Studio M4 Ultra192 GB0.6–0.9M30192 ГБ единой памяти
L40S48 GB1.04M41ECC, пассивное охлаждение
A100 80GB80 GB1.2–1.9M60ECC, быстрая память
2× A100 80GB160 GB2.4–3.8M64Две карты, быстрая связь
H100 SXM80 GB2.5–4M90Макс. производительность
H200141 GB4–5M105141 ГБ быстрой памяти
4× H100 SXM320 GB10–16M98Кластер 4 карты
8× H100 (DGX)640 GB20–32M98Полный сервер
8× H2001 128 GB32–40M113Топовый сервер
2× DGX H2002 256 GB65–80M1132 сервера
8× B200 (GB200)1 440 GB50–65M150Blackwell
Подходящие модели
Qwen3 8B8 млрд

Лёгкая для edge-деплоя.

128K контекст~10 ГБ
GigaChat 3.1 Lightning10 млрд (MoE)

Лучшая русская модель.

32K контекст~10 ГБ
Gemma 4 9B9 млрд

Google. Текст и изображения.

128K контекст~12 ГБ
Mistral Small 4119 млрд (MoE)

Качество большой модели при минимуме памяти.

128K контекст~16 ГБ
Codestral 22B22 млрд

Mistral. Специализация — код.

32K контекст~28 ГБ
Qwen3 32B32 млрд

Alibaba. Сильный русский.

128K контекст~40 ГБ
Llama 3.3 70B70 млрд

Meta. Универсальная.

128K контекст~80 ГБ
Qwen3 72B72 млрд

Лучшая мультиязычная. 128 языков.

128K контекст~88 ГБ
Qwen2.5-VL 72B72 млрд

Лучшая для изображений и видео.

128K контекст~88 ГБ
Llama 4 Scout109 млрд (MoE)

Meta. Контекст 1M.

1M контекст~110 ГБ
Qwen3 235B-A22B235 млрд (MoE)

Флагман Alibaba.

256K контекст~264 ГБ
DeepSeek V3.2671 млрд (MoE)

Топ в программировании.

160K контекст~700 ГБ
Квантизация: Q4_K_M — -3% качества, 75% экономия памяти (дефолт) · Q8 — почти без потерь · FP16 — полная точность, 2× память
форма обратной связи

Получить персональный отчёт

PDF с рекомендацией по оборудованию и моделям под ваши параметры.

Согласен на обработку персональных данных