Глубокое обучение с подкреплением. AlphaGo и другие технологии
Описание
Эта книга - подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. В ней мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для проведения экспериментов используются различные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления на основе PyBullet и RoboSchool. Множество примеров основано на нестандартных средах, в которых мы разработаем модель окружения с нуля.
Глубокое обучение в контексте RLВ данной книге вы узнаете, какое место занимают методы RL в контексте глубокого обучения, и сможете реализовать сложные модели глубокого обучения. Вы также изучите основы RL, включая марковские процессы принятия решений.
Примеры реализации методов RLВ книге представлены примеры реализации различных методов RL, включая метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и другие. Вы узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.
Обучение играм Atari с помощью RLВы увидите, как разработать систему, способную обучаться играм Atari с использованием обучения с подкреплением. Также вы научитесь создавать собственную среду, основанную на модели OpenAI Gym, для обучения биржевого агента.
Применение метода AlphaGo Zero в игре Connect4В книге вы реализуете метод AlphaGo Zero для игры в Connect4. Этот метод позволяет достичь высокой игровой стратегии, используя глубокое обучение с подкреплением.
Обработка речи с помощью RLВы познакомитесь с применением RL в обработке речи и узнаете, как использовать обучение с подкреплением для обучения диалогового бота на фразах из кинофильмов.
Эта книга предназначена для всех, кто интересуется глубоким обучением и его применением в области искусственного интеллекта. Она предоставит вам все необходимые знания и инструменты для изучения и практического применения методов глубокого обучения с подкреплением.
ПИТЕР
Бренд ПИТЕР представлен в
Другие варианты товара
С этим товаром ищут
Продавец ООО "НОВЫЙ КНИЖНЫЙ ЦЕНТР"
- ИНН: 7710422909
- ОГРН: 1027700282763
Комментарии на Скидосиках
Комментариев нет