Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью этого практического руководства вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц. Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, эта книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта. Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике.
Izuchite metody skrapinga i kraulinga veb-sajtov, chtoby poluchit dostup k neogranichennomu obemu dannykh v ljubom ugolke Interneta v ljubom formate. S pomoschju etogo prakticheskogo rukovodstva vy uznaete, kak ispolzovat skripty Python i veb-API, chtoby odnovremenno sobrat i obrabotat dannye s tysjach ili dazhe millionov veb-stranits. Idealno podkhodjaschaja dlja programmistov, spetsialistov po bezopasnosti i veb-administratorov, znakomykh s jazykom Python, eta kniga znakomit ne tolko s osnovnymi printsipami raboty veb-skraperov, no i uglubljaetsja v bolee slozhnye temy, takie kak analiz syrykh dannykh ili ispolzovanie skraperov dlja testirovanija interfejsa veb-sajta. Primery programmnogo koda, privedennye v knige, pomogut razobratsja v etikh printsipakh na praktike.