В этой книге представлены теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. В ней рассматривается лямбда-архитектура, предназначенная для построения подобных систем, и на примере конкретного веб-приложения поясняются особенности реализации всех уровней этой архитектуры с помощью инструментальных средств вроде Hadoop, Cassandra и Storm. Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных. В крупномасштабных веб-приложениях, которые поддерживают работу социальных сетей, выполняют аналитику в реальном времени или поддерживают электронную торговлю, приходится обрабатывать большие массивы данных, объем и скорость обмена которыми превышают возможности информационных систем, основанных на традиционных базах данных. Для подобных приложений требуются архитектуры, в основе которых лежат кластеры...
V etoj knige predstavleny teoreticheskie osnovy organizatsii sistem bolshikh dannykh i pojasnjaetsja, kakim obrazom oni voploschajutsja na praktike. V nej rassmatrivaetsja ljambda-arkhitektura, prednaznachennaja dlja postroenija podobnykh sistem, i na primere konkretnogo veb-prilozhenija pojasnjajutsja osobennosti realizatsii vsekh urovnej etoj arkhitektury s pomoschju instrumentalnykh sredstv vrode Hadoop, Cassandra i Storm. Dlja chtenija etoj knigi ne trebuetsja predvaritelnoe znakomstvo s osobennostjami analiza krupnomasshtabnykh dannykh ili baz dannykh tipa NoSQL, khotja polezno znat o traditsionnykh bazakh dannykh. V krupnomasshtabnykh veb-prilozhenijakh, kotorye podderzhivajut rabotu sotsialnykh setej, vypolnjajut analitiku v realnom vremeni ili podderzhivajut elektronnuju torgovlju, prikhoditsja obrabatyvat bolshie massivy dannykh, obem i skorost obmena kotorymi prevyshajut vozmozhnosti informatsionnykh sistem, osnovannykh na traditsionnykh bazakh dannykh. Dlja podobnykh prilozhenij trebujutsja arkhitektury, v osnove kotorykh lezhat klastery...