General

Прочитать книгу "Глубокое обучение с подкреплением на Python"

Эта книга по теме моего диплома. Ее освоение поможет мне стать хорошим специалистом данной узкой области.

Буду трекать время, затраченное на ее прочтение и разбор примеров.

Goal Accomplishment Criteria

Все главы прочитаны, осмыслены. Выполнены все примеры программного кода.

Глава 1. Введение в обучение с подкреплением
Глава 2. Знакомство с OpenAI и TensorFlow
Глава 3. Марковский процесс принятия решений и динамическое программирование
Глава 4. Методы Монте-Карло в играх
Глава 5. Обучение на основе временных различий
Глава 6. Задача о многоруком бандите
Глава 7. Основы глубокого обучения
Глава 8. Игры Atari с использованием Deep Q Network
Глава 9. Игра Doom в глубокой рекуррентной Q-сети
Глава 10. Асинхронная преимущественная сеть «актор-критик»
Глава 11. Градиенты политик и оптимизация.
Глава 12. «Автогонки» с использованием DQN
Глава 13. Последние достижения и следующие шаги

1289
18 November 2020, 08:28

The goal is in the group

Клуб программистов

558
members
798
goals

Step 1

Step 2

Step 3

Step 4

Step 5

Step 6

Step 7

Step 8

Step 9

Step 10

Step 11

Step 12

Step 13

boangri

Прочитать книгу "Глубокое обучение с подкреплением на Python"

Goal Accomplishment Criteria

Глава 1. Введение в обучение с подкреплением

Глава 2. Знакомство с OpenAI и TensorFlow

Глава 3. Марковский процесс принятия решений и динамическое программирование

Глава 4. Методы Монте-Карло в играх

Глава 5. Обучение на основе временных различий

Глава 6. Задача о многоруком бандите

Глава 7. Основы глубокого обучения

Глава 8. Игры Atari с использованием Deep Q Network

Глава 9. Игра Doom в глубокой рекуррентной Q-сети

Глава 10. Асинхронная преимущественная сеть «актор-критик»

Глава 11. Градиенты политик и оптимизация.

Глава 12. «Автогонки» с использованием DQN

Глава 13. Последние достижения и следующие шаги

Клуб программистов

Step 1

Step 2

Step 3

Step 4

Step 5

Step 6

Step 7

Step 8

Step 9

Step 10

Step 11

Step 12

Step 13

boangri

Прочитать книгу "Глубокое обучение с подкреплением на Python"

Goal Accomplishment Criteria

Глава 1. Введение в обучение с подкреплением

Глава 2. Знакомство с OpenAI и TensorFlow

Глава 3. Марковский процесс принятия решений и динамическое программирование

Глава 4. Методы Монте-Карло в играх

Глава 5. Обучение на основе временных различий

Глава 6. Задача о многоруком бандите

Глава 7. Основы глубокого обучения

Глава 8. Игры Atari с использованием Deep Q Network

Глава 9. Игра Doom в глубокой рекуррентной Q-сети

Глава 10. Асинхронная преимущественная сеть «актор-критик»

Глава 11. Градиенты политик и оптимизация.

Глава 12. «Автогонки» с использованием DQN

Глава 13. Последние достижения и следующие шаги

Don't miss new posts!

Signup

Sign in.Allowed.

Widget for your goal

Big (450×150 px)

Small (250×100 px)

For PRO only

[email protected]

Maxim Malikov

Sergey Zakharov

Sign in.
Allowed.