Что такое DQN на Atari?

👾DQN on Atari

DeepMind (2013, Nature 2015). Input: 4 consecutive frames 84×84. CNN → Q-values for each action. Experience replay buffer (1M transitions). Target network (updated every 10K steps). Superhuman on Breakout, Pong. Issues: Montezuma's Revenge (sparse rewards)

Article body and graph labels may still appear in Russian where English translations have not been added yet.

📖1 min read📊Level 8🗺️2 subtopics📅April 16, 2026

Author: Бессмертный А.П.

Loading map...

DQN на Atari — DeepMind (2013, Nature 2015).

Вход: 4 последовательных кадра 84×84. CNN → Q-values для каждого действия.

Предпосылки и причины

Experience replay buffer (1M переходов). Target network (обновление каждые 10K шагов).

Ход событий

Superhuman на Breakout, Pong. Проблемы: Montezuma's Revenge (sparse rewards)..

Последствия и значение

Результаты оказали влияние на дальнейшее развитие событий.

1
2013
Начало
2
2015
Ключевой момент

2 ключевых событий

❓Часто задаваемые вопросы

DeepMind (2013, Nature 2015). Вход: 4 последовательных кадра 84×84. CNN → Q-values для каждого действия. Experience replay buffer (1M переходов). Targ

🔗Learn more

YouTube

What is DQN on Atari?DQN on Atari: lecture DQN on Atari: overview

👾DQN on Atari

Map outline

Предпосылки и причины

Ход событий

Последствия и значение

📅Хроника событий

Начало

Ключевой момент

❓Часто задаваемые вопросы

🔗Learn more