🧠 Gemma 4 12B vs 26B-A4B — тест на реальной физике.
Google заявила, что Gemma 4 12B бьёт модели уровня 26B. Ребята проверили это на одной RTX 4090: обе модели писали HTML5 Canvas-анимацию без библиотек — доска Гальтона, столкновение блоков, тройной маятник.
Результаты:
— 26B-A4B: 15 ГБ VRAM, 6.9k токенов, 138 tok/s
— 12B: 9 ГБ VRAM, 8.9k токенов, 80 tok/s
26B-A4B выиграла во всех трёх сценах и работала в 1.7× быстрее — при том что активных параметров у неё всего 4B (MoE-архитектура).
12B отстала совсем ненамного, потребляя вдвое меньше VRAM. Для ноутбуков с 16 ГБ — один из лучших вариантов для локального запуска.
GGUF: Gemma 4 12B GGUF | 26B GGUF
MUSIN PRO | MUSIN PRO MAX | Gemma 4
#Gemma4 #LLM #ИИ #локальныеМодели #ComfyUI #musinpro