logo
Питер

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Цена: 2659

logo_bookvoed

4.5

В наличии
С персональной скидкой цена будет еще ниже
https://ndc.book24.ru/pim/products/images/73/05/0190786f-bc62-7c6d-af3b-03cc82207305.jpg

Описание

Глубокое обучение с подкреплением: AlphaGo и другие технологии Описание:

Эта книга - подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. В ней мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для проведения экспериментов используются различные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления на основе PyBullet и RoboSchool. Множество примеров основано на нестандартных средах, в которых мы разработаем модель окружения с нуля.

Глубокое обучение в контексте RL

В данной книге вы узнаете, какое место занимают методы RL в контексте глубокого обучения, и сможете реализовать сложные модели глубокого обучения. Вы также изучите основы RL, включая марковские процессы принятия решений.

Примеры реализации методов RL

В книге представлены примеры реализации различных методов RL, включая метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и другие. Вы узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.

Обучение играм Atari с помощью RL

Вы увидите, как разработать систему, способную обучаться играм Atari с использованием обучения с подкреплением. Также вы научитесь создавать собственную среду, основанную на модели OpenAI Gym, для обучения биржевого агента.

Применение метода AlphaGo Zero в игре Connect4

В книге вы реализуете метод AlphaGo Zero для игры в Connect4. Этот метод позволяет достичь высокой игровой стратегии, используя глубокое обучение с подкреплением.

Обработка речи с помощью RL

Вы познакомитесь с применением RL в обработке речи и узнаете, как использовать обучение с подкреплением для обучения диалогового бота на фразах из кинофильмов.

Эта книга предназначена для всех, кто интересуется глубоким обучением и его применением в области искусственного интеллекта. Она предоставит вам все необходимые знания и инструменты для изучения и практического применения методов глубокого обучения с подкреплением.

ПИТЕР

Бренд ПИТЕР представлен в
Буквоед, Детский Мир, Ozon, Лабиринт

Другие варианты товара

С этим товаром ищут

Продавец ООО "НОВЫЙ КНИЖНЫЙ ЦЕНТР"

  • ИНН: 7710422909
  • ОГРН: 1027700282763

Комментарии на Скидосиках

Комментариев нет