Общая

Прочитать книгу "Глубокое обучение с подкреплением на Python"

Эта книга по теме моего диплома. Ее освоение поможет мне стать хорошим специалистом данной узкой области.

Буду трекать время, затраченное на ее прочтение и разбор примеров.

Критерий завершения

Все главы прочитаны, осмыслены. Выполнены все примеры программного кода.

Глава 1. Введение в обучение с подкреплением
Глава 2. Знакомство с OpenAI и TensorFlow
Глава 3. Марковский процесс принятия решений и динамическое программирование
Глава 4. Методы Монте-Карло в играх
Глава 5. Обучение на основе временных различий
Глава 6. Задача о многоруком бандите
Глава 7. Основы глубокого обучения
Глава 8. Игры Atari с использованием Deep Q Network
Глава 9. Игра Doom в глубокой рекуррентной Q-сети
Глава 10. Асинхронная преимущественная сеть «актор-критик»
Глава 11. Градиенты политик и оптимизация.
Глава 12. «Автогонки» с использованием DQN
Глава 13. Последние достижения и следующие шаги

554
18 ноября 2020, 08:28

Цель состоит в группе

Клуб программистов

547
участников
784
цели

Этап 1

Этап 2

Этап 3

Этап 4

Этап 5

Этап 6

Этап 7

Этап 8

Этап 9

Этап 10

Этап 11

Этап 12

Этап 13

boangri

Прочитать книгу "Глубокое обучение с подкреплением на Python"

Критерий завершения

Глава 1. Введение в обучение с подкреплением

Глава 2. Знакомство с OpenAI и TensorFlow

Глава 3. Марковский процесс принятия решений и динамическое программирование

Глава 4. Методы Монте-Карло в играх

Глава 5. Обучение на основе временных различий

Глава 6. Задача о многоруком бандите

Глава 7. Основы глубокого обучения

Глава 8. Игры Atari с использованием Deep Q Network

Глава 9. Игра Doom в глубокой рекуррентной Q-сети

Глава 10. Асинхронная преимущественная сеть «актор-критик»

Глава 11. Градиенты политик и оптимизация.

Глава 12. «Автогонки» с использованием DQN

Глава 13. Последние достижения и следующие шаги

Клуб программистов

Этап 1

Этап 2

Этап 3

Этап 4

Этап 5

Этап 6

Этап 7

Этап 8

Этап 9

Этап 10

Этап 11

Этап 12

Этап 13

boangri

Прочитать книгу "Глубокое обучение с подкреплением на Python"

Критерий завершения

Глава 1. Введение в обучение с подкреплением

Глава 2. Знакомство с OpenAI и TensorFlow

Глава 3. Марковский процесс принятия решений и динамическое программирование

Глава 4. Методы Монте-Карло в играх

Глава 5. Обучение на основе временных различий

Глава 6. Задача о многоруком бандите

Глава 7. Основы глубокого обучения

Глава 8. Игры Atari с использованием Deep Q Network

Глава 9. Игра Doom в глубокой рекуррентной Q-сети

Глава 10. Асинхронная преимущественная сеть «актор-критик»

Глава 11. Градиенты политик и оптимизация.

Глава 12. «Автогонки» с использованием DQN

Глава 13. Последние достижения и следующие шаги

Не пропустите новые записи!

Регистрация

Входите.Открыто.

Виджет вашей цели

Большой (450×150 px)

Маленький (250×100 px)

Только для PRO

[email protected]

Максим Маликов

Сергей Захаров

Входите.
Открыто.