Конфигуратор

Подбор оборудования для локального ИИ

Интерактивный конфигуратор: выберите задачи, нагрузку и требования — получите рекомендацию по GPU, моделям и стоимости.

LLM-моделей в базе

конфигураций GPU

H100–B200

NVIDIA, от старта до кластера

PDF

персональный отчёт на почту

— Конфигуратор

Выберите параметры

Задачи

Время отклика

Запросов в минуту

Пользователей

Контекст

Качество модели

Обучение / файнтюн

Уровень

Старт

Модель

Qwen3 32B

VRAM

~40 ГБ

Пользователи

Модель

GPU	VRAM	Цена ₽	tok/s	Заметка
Mac Mini M4 Pro	18 GB	0.13–0.16M	9	Тихий, компактный
RTX 4090	24 GB	0.18–0.28M	45	Игровая, нет ECC
Mac Mini M4 Max	36–64 GB	0.25–0.45M	19	До 64 ГБ единой памяти
RTX 5090	32 GB	0.26–0.37M	71	Игровая, нет ECC
A30	24 GB	0.4–0.5M	19	ECC, серверная
2× RTX 5090	64 GB	0.52–0.74M	75	Две карты параллельно
A6000 Ada	48 GB	0.6–0.7M	38	ECC, рабочая станция
Mac Studio M4 Ultra	192 GB	0.6–0.9M	30	192 ГБ единой памяти
L40S	48 GB	1.04M	41	ECC, пассивное охлаждение
A100 80GB	80 GB	1.2–1.9M	60	ECC, быстрая память
2× A100 80GB	160 GB	2.4–3.8M	64	Две карты, быстрая связь
H100 SXM	80 GB	2.5–4M	90	Макс. производительность
H200	141 GB	4–5M	105	141 ГБ быстрой памяти
4× H100 SXM	320 GB	10–16M	98	Кластер 4 карты
8× H100 (DGX)	640 GB	20–32M	98	Полный сервер
8× H200	1 128 GB	32–40M	113	Топовый сервер
2× DGX H200	2 256 GB	65–80M	113	2 сервера
8× B200 (GB200)	1 440 GB	50–65M	150	Blackwell

Подходящие модели

Qwen3 8B8 млрд

Лёгкая для edge-деплоя.

128K контекст~10 ГБ

GigaChat 3.1 Lightning10 млрд (MoE)

Лучшая русская модель.

32K контекст~10 ГБ

Gemma 4 9B9 млрд

Google. Текст и изображения.

128K контекст~12 ГБ

Mistral Small 4119 млрд (MoE)

Качество большой модели при минимуме памяти.

128K контекст~16 ГБ

Codestral 22B22 млрд

Mistral. Специализация — код.

32K контекст~28 ГБ

Qwen3 32B32 млрд

Alibaba. Сильный русский.

128K контекст~40 ГБ

Llama 3.3 70B70 млрд

Meta. Универсальная.

128K контекст~80 ГБ

Qwen3 72B72 млрд

Лучшая мультиязычная. 128 языков.

128K контекст~88 ГБ

Qwen2.5-VL 72B72 млрд

Лучшая для изображений и видео.

128K контекст~88 ГБ

Llama 4 Scout109 млрд (MoE)

Meta. Контекст 1M.

1M контекст~110 ГБ

Qwen3 235B-A22B235 млрд (MoE)

Флагман Alibaba.

256K контекст~264 ГБ

DeepSeek V3.2671 млрд (MoE)

Топ в программировании.

160K контекст~700 ГБ

Квантизация: Q4_K_M — -3% качества, 75% экономия памяти (дефолт) · Q8 — почти без потерь · FP16 — полная точность, 2× память

форма обратной связи

Получить персональный отчёт

PDF с рекомендацией по оборудованию и моделям под ваши параметры.