You are using an outdated browser. Please upgrade your browser to improve your experience.
Мы используем «куки», чтобы было удобней пользоваться нашей интернет-страницей. Используя наш сайт, вы соглашаетесь с нашей политикой приватности. Для более подробной информации ознакомьтесь с нашей политикой конфиденциал
Обучение с подкреплением для реальных задач. Инженерный подход
Description
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга – первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе.
Для аналитиков данных и специалистов по искусственному интеллекту.