0) The spelled-out intro to neural networks and backpropagation: building micrograd16просмотров3 месяца назад
Интуитивное объяснение проксимальной оптимизации политики (PPO) для больших языковых моделей9просмотров3 месяца назад
GRPO (групповая относительная оптимизация политики) от DeepSeek | Обучение с подкреплением для LLM9просмотров3 месяца назад
Объяснение Llama 4: Архитектура, длинный контекст и встроенная мультимодальность8просмотров3 месяца назад
Как большие языковые модели выживают при низкой точности | Основы квантования4просмотра3 месяца назад
Единственное условие успеха в эпоху искусственного интеллекта — как его создать8просмотров4 месяца назад