♟️Self-play in AlphaZero

Training from scratch: knows only the rules of the game. 9 hours of training (5000 TPUs) → surpassed Stockfish in chess, AlphaGo in Go, Elmo in shogi. No human data.

Article body and graph labels may still appear in Russian where English translations have not been added yet.
📖6 min read📊Level 9📅April 16, 2026

Loading map...

Self-play в AlphaZero

Часто задаваемые вопросы

Self-play в AlphaZero — это тема о правилах, механизмах и практиках в своей области. Она помогает понять, как принимаются решения и к каким последствиям они приводят.