1

Etapa 1

Глава 1. Введение в обучение с подкреплением

2

Etapa 2

Глава 2. Знакомство с OpenAI и TensorFlow

3

Etapa 3

Глава 3. Марковский процесс принятия решений и динамическое программирование

4

Etapa 4

Глава 4. Методы Монте-Карло в играх

5

Etapa 5

Глава 5. Обучение на основе временных различий

6

Etapa 6

Глава 6. Задача о многоруком бандите

7

Etapa 7

Глава 7. Основы глубокого обучения

8

Etapa 8

Глава 8. Игры Atari с использованием Deep Q Network

9

Etapa 9

Глава 9. Игра Doom в глубокой рекуррентной Q-сети

10

Etapa 10

Глава 10. Асинхронная преимущественная сеть «актор-критик»

11

Etapa 11

Глава 11. Градиенты политик и оптимизация.

12

Etapa 12

Глава 12. «Автогонки» с использованием DQN

13

Etapa 13

Глава 13. Последние достижения и следующие шаги

1

Etapa 1

Глава 1. Введение в обучение с подкреплением

2

Etapa 2

Глава 2. Знакомство с OpenAI и TensorFlow

3

Etapa 3

Глава 3. Марковский процесс принятия решений и динамическое программирование

4

Etapa 4

Глава 4. Методы Монте-Карло в играх

5

Etapa 5

Глава 5. Обучение на основе временных различий

6

Etapa 6

Глава 6. Задача о многоруком бандите

7

Etapa 7

Глава 7. Основы глубокого обучения

8

Etapa 8

Глава 8. Игры Atari с использованием Deep Q Network

9

Etapa 9

Глава 9. Игра Doom в глубокой рекуррентной Q-сети

10

Etapa 10

Глава 10. Асинхронная преимущественная сеть «актор-критик»

11

Etapa 11

Глава 11. Градиенты политик и оптимизация.

12

Etapa 12

Глава 12. «Автогонки» с использованием DQN

13

Etapa 13

Глава 13. Последние достижения и следующие шаги

18 noviembre 2020 31 enero 2021
Objetivo completado 5 agosto 2021

Autor del objetivo

General

Прочитать книгу "Глубокое обучение с подкреплением на Python"

Эта книга по теме моего диплома. Ее освоение поможет мне стать хорошим специалистом данной узкой области.

Буду трекать время, затраченное на ее прочтение и разбор примеров.

 Criterio del fin

Все главы прочитаны, осмыслены. Выполнены все примеры программного кода.

  1. Глава 1. Введение в обучение с подкреплением

  2. Глава 2. Знакомство с OpenAI и TensorFlow

  3. Глава 3. Марковский процесс принятия решений и динамическое программирование

  4. Глава 4. Методы Монте-Карло в играх

  5. Глава 5. Обучение на основе временных различий

  6. Глава 6. Задача о многоруком бандите

  7. Глава 7. Основы глубокого обучения

  8. Глава 8. Игры Atari с использованием Deep Q Network

  9. Глава 9. Игра Doom в глубокой рекуррентной Q-сети

  10. Глава 10. Асинхронная преимущественная сеть «актор-критик»

  11. Глава 11. Градиенты политик и оптимизация.

  12. Глава 12. «Автогонки» с использованием DQN

  13. Глава 13. Последние достижения и следующие шаги

  • 783
  • 18 noviembre 2020, 08:28
Registración

Las posibilidades
están ilimitadas.
Es la hora
de descubrir las suyas

Уже зарегистрированы?
Entrada al sitio

Entre.
Está abierto.

¿Aún no está registrado?
 
Conéctese a cualquiera de sus cuentas, sus datos se tomarán de la cuenta.
¿Ha olvidado la contraseña?