Как считались лидеры
HuggingFace публикует downloads последних 30 дней для каждой модели. Брались данные на май 2026, фильтр по категориям: text-generation, embeddings, speech, vision.
Топ 10 по категориям
Text Generation
| Модель | Downloads/30d | Лицензия | Для чего |
|---|---|---|---|
| meta-llama/Llama-3.1-8B-Instruct | 18M | Llama | General purpose |
| Qwen/Qwen2.5-7B-Instruct | 12M | Apache 2.0 | Multilingual, код |
| mistralai/Mistral-7B-Instruct-v0.3 | 9M | Apache 2.0 | Код, инструкции |
| deepseek-ai/DeepSeek-V3 | 7M | MIT | Сложные задачи |
Embeddings
| Модель | Downloads/30d | Размер | MTEB Score |
|---|---|---|---|
| sentence-transformers/all-MiniLM-L6-v2 | 45M | 22MB | 56.3 |
| BAAI/bge-m3 | 22M | 570MB | 66.2 |
| nomic-ai/nomic-embed-text-v1.5 | 8M | 137MB | 62.4 |
Speech (Whisper)
openai/whisper-large-v3 — 31M загрузок за 30 дней. Лучшее распознавание речи open-source включая русский язык. WER 5.1% на CommonVoice Russian. Whisper.cpp позволяет запускать на CPU в реальном времени.
Vision
openai/clip-vit-large-patch14 — 28M загрузок, стандарт для image-text matching. google/vit-base-patch16-224 — 19M загрузок, классификация изображений.
Как загрузить любую модель
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
model_name = "meta-llama/Llama-3.1-8B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype=torch.float16,
device_map="auto" # автоматически распределяет по GPU/CPU
)
FAQ
Нужен ли HuggingFace Pro для загрузки моделей?
Большинство моделей бесплатны. Llama 3 требует принять лицензионное соглашение на сайте Meta. Gemma 2 — аналогично через Google. Регистрации достаточно.
Как выбрать модель для русского языка?
Qwen 2.5 7B — лучший выбор для русского среди моделей до 10B. Из больших: Llama 3.1 70B и DeepSeek V3 поддерживают русский на хорошем уровне.