🎲AlphaGo и AlphaZero
DeepMind. AlphaGo (2016): победа над Ли Седолем 4:1. Monte Carlo Tree Search + CNN + RL. AlphaGo Zero (2017): обучение с нуля (self-play), без человеческих партий. AlphaZero (2018): шахматы, сёги, го одной архитектурой. MuZero (2019): без знания правил игры. Применение: оптимизация, дизайн молекул.
📖6 мин чтения📊Уровень 7🗺️2 подтем📅19 февраля 2026 г.
🗺️ Mind Map
Загрузка карты...
❓Часто задаваемые вопросы
AlphaGo и AlphaZero — это тема о правилах, механизмах и практиках в своей области. Она помогает понять, как принимаются решения и к каким последствиям они приводят.