Обработка больших массивов данных с помощью традиционных СУБД может оказаться трудным делом. Apache Hadoop - это каркас для разработки приложении, предназначенных для выполнения в распределенном кластере, без применения SQL. Такие приложения прекрасно масштабируются и могут обрабатывать гигантские массивы данных. Если вам требуется произвести анализ данных, то Hadoop как раз то, что надо. Прочитав эту книгу, вы познакомитесь с предметом и научитесь писать программы в стиле MapReduce. После нескольких простых примеров автор быстро переходит к вопросу об использовании Hadoop для решения более сложных задач анализа данных. Описываются рекомендованные приемы и паттерны проектирования, полезные при программировании для MapReduce. Для чтения книги требуется знание основ языка Java. Некоторое знакомство с математической статистикой поможет разобраться в более сложных примерах.
Obrabotka bolshikh massivov dannykh s pomoschju traditsionnykh SUBD mozhet okazatsja trudnym delom. Apache Hadoop - eto karkas dlja razrabotki prilozhenii, prednaznachennykh dlja vypolnenija v raspredelennom klastere, bez primenenija SQL. Takie prilozhenija prekrasno masshtabirujutsja i mogut obrabatyvat gigantskie massivy dannykh. Esli vam trebuetsja proizvesti analiz dannykh, to Hadoop kak raz to, chto nado. Prochitav etu knigu, vy poznakomites s predmetom i nauchites pisat programmy v stile MapReduce. Posle neskolkikh prostykh primerov avtor bystro perekhodit k voprosu ob ispolzovanii Hadoop dlja reshenija bolee slozhnykh zadach analiza dannykh. Opisyvajutsja rekomendovannye priemy i patterny proektirovanija, poleznye pri programmirovanii dlja MapReduce. Dlja chtenija knigi trebuetsja znanie osnov jazyka Java. Nekotoroe znakomstvo s matematicheskoj statistikoj pomozhet razobratsja v bolee slozhnykh primerakh.