Глубокое обучение с подкреплением (Reinforcement Learning) - самое популярное и перспективное направление искусственного интеллекта. Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением. Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомьтесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что "страшные" аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать. Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL. Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта. В этой книге вы: * Познакомитесь с основами методов, алгоритмов и элементов RL * Обучите агента с помощью OpenAI Gym и Tensorflow * Освоите марковские процессы принятия решений, оптимальность Беллмана и обучение TD * Научитесь решать проблемы многоруких бандитов * Овладеете алгоритмами глубокого обучения, такими как RNN, LSTM и CNN * Создадите интеллектуальных агентов с помощью алгоритма DRQN, которые смогут играть в Doom * С помощью DDPG научите агентов играть в Lunar Lander * Отправите агента на автогонки, используя метод DQN
Glubokoe obuchenie s podkrepleniem (Reinforcement Learning) - samoe populjarnoe i perspektivnoe napravlenie iskusstvennogo intellekta. Prakticheskoe izuchenie RL na Python pomozhet osvoit ne tolko bazovye, no i peredovye algoritmy glubokogo obuchenija s podkrepleniem. Vy nachnete s osnovnykh printsipov obuchenija s podkrepleniem, OpenAI Gym i TensorFlow, poznakomtes s markovskimi tsepjami, metodom Monte-Karlo i dinamicheskim programmirovaniem, tak chto "strashnye" abbreviatury DQN, DRQN, A3C, PPO i TRPO vskore perestanut vas pugat. Vy uznaete ob agentakh, kotorye uchatsja na chelovecheskikh predpochtenijakh, DQfD, HER i mnogikh drugikh poslednikh dostizhenijakh RL. Prochitav knigu, vy priobretete znanija i opyt, neobkhodimye dlja realizatsii obuchenija s podkrepleniem i glubokogo obuchenija s podkrepleniem v realnykh proektakh, i vojdete v mir iskusstvennogo intellekta. V etoj knige vy: * Poznakomites s osnovami metodov, algoritmov i elementov RL * Obuchite agenta s pomoschju OpenAI Gym i Tensorflow * Osvoite markovskie protsessy prinjatija reshenij, optimalnost Bellmana i obuchenie TD * Nauchites reshat problemy mnogorukikh banditov * Ovladeete algoritmami glubokogo obuchenija, takimi kak RNN, LSTM i CNN * Sozdadite intellektualnykh agentov s pomoschju algoritma DRQN, kotorye smogut igrat v Doom * S pomoschju DDPG nauchite agentov igrat v Lunar Lander * Otpravite agenta na avtogonki, ispolzuja metod DQN