1

Step 1

Глава 1. Введение в обучение с подкреплением

2

Step 2

Глава 2. Знакомство с OpenAI и TensorFlow

3

Step 3

Глава 3. Марковский процесс принятия решений и динамическое программирование

4

Step 4

Глава 4. Методы Монте-Карло в играх

5

Step 5

Глава 5. Обучение на основе временных различий

6

Step 6

Глава 6. Задача о многоруком бандите

7

Step 7

Глава 7. Основы глубокого обучения

8

Step 8

Глава 8. Игры Atari с использованием Deep Q Network

9

Step 9

Глава 9. Игра Doom в глубокой рекуррентной Q-сети

10

Step 10

Глава 10. Асинхронная преимущественная сеть «актор-критик»

11

Step 11

Глава 11. Градиенты политик и оптимизация.

12

Step 12

Глава 12. «Автогонки» с использованием DQN

13

Step 13

Глава 13. Последние достижения и следующие шаги

1

Step 1

Глава 1. Введение в обучение с подкреплением

2

Step 2

Глава 2. Знакомство с OpenAI и TensorFlow

3

Step 3

Глава 3. Марковский процесс принятия решений и динамическое программирование

4

Step 4

Глава 4. Методы Монте-Карло в играх

5

Step 5

Глава 5. Обучение на основе временных различий

6

Step 6

Глава 6. Задача о многоруком бандите

7

Step 7

Глава 7. Основы глубокого обучения

8

Step 8

Глава 8. Игры Atari с использованием Deep Q Network

9

Step 9

Глава 9. Игра Doom в глубокой рекуррентной Q-сети

10

Step 10

Глава 10. Асинхронная преимущественная сеть «актор-критик»

11

Step 11

Глава 11. Градиенты политик и оптимизация.

12

Step 12

Глава 12. «Автогонки» с использованием DQN

13

Step 13

Глава 13. Последние достижения и следующие шаги

18 November 2020 31 January 2021
Goal completed 5 August 2021

Goal author

General

Прочитать книгу "Глубокое обучение с подкреплением на Python"

Эта книга по теме моего диплома. Ее освоение поможет мне стать хорошим специалистом данной узкой области.

Буду трекать время, затраченное на ее прочтение и разбор примеров.

 Goal Accomplishment Criteria

Все главы прочитаны, осмыслены. Выполнены все примеры программного кода.

  1. Глава 1. Введение в обучение с подкреплением

  2. Глава 2. Знакомство с OpenAI и TensorFlow

  3. Глава 3. Марковский процесс принятия решений и динамическое программирование

  4. Глава 4. Методы Монте-Карло в играх

  5. Глава 5. Обучение на основе временных различий

  6. Глава 6. Задача о многоруком бандите

  7. Глава 7. Основы глубокого обучения

  8. Глава 8. Игры Atari с использованием Deep Q Network

  9. Глава 9. Игра Doom в глубокой рекуррентной Q-сети

  10. Глава 10. Асинхронная преимущественная сеть «актор-критик»

  11. Глава 11. Градиенты политик и оптимизация.

  12. Глава 12. «Автогонки» с использованием DQN

  13. Глава 13. Последние достижения и следующие шаги

  • 562
  • 18 November 2020, 08:28
Sign up

Signup

Уже зарегистрированы?
Quick sign-up through social networks.
Sign in

Sign in.
Allowed.

Not registered yet?
 
Log in through social networks
Forgot your password?