Усиленное обучение
- Просмотров: 0
- Дата выхода: 11 июня 2024
- Объем: 150 стр. 1 иллюстрация
- Возраст: 12+
- Жанр: Искусство программирования, Книги о компьютерах, Обучение программированию, Программирование, Разработка программного обеспечения, Самиздат, Самоучители, Только на ЛитРес, Учебники по программированию, Языки программирования
Это руководство по обучению с подкреплением (Reinforcement Learning, RL) охватывает теоретические основы, практические применения и современные достижения этой области. В нем раскрывается определение RL, его исторический контекст и ключевые отличия от других методов машинного обучения. Примеры применения RL включают игры, робототехнику, финансовые рынки и управление ресурсами. Математические основы включают в себя марковские процессы принятия решений, состояния, действия, вознаграждения и стратегии, а также Беллмановские уравнения и итерации ценности. В книге подробно рассматриваются основные алгоритмы RL, такие как метод Монте-Карло, Q-Learning, SARSA, методы градиента стратегии, REINFORCE и Actor-Critic, а также модели на основе планирования и глубокого обучения с подкреплением (DQN, DDPG, A3C). Практическая часть включает использование OpenAI Gym и других средств, настройку и тестирование моделей, а также примеры кода на Python с использованием библиотек TensorFlow и PyTorch.