В этой практичной книге четверо специалистов Cloudera по анализу данных описывают самодостаточные паттерны для выполнения крупномасштабного анализа данных при помощи Spark. Авторы комплексно рассматривают Spark, статистические методы и множества данных, собранные в реальных условиях, и на этих примерах демонстрируют решения распространенных аналитических проблем.
V etoj praktichnoj knige chetvero spetsialistov Cloudera po analizu dannykh opisyvajut samodostatochnye patterny dlja vypolnenija krupnomasshtabnogo analiza dannykh pri pomoschi Spark. Avtory kompleksno rassmatrivajut Spark, statisticheskie metody i mnozhestva dannykh, sobrannye v realnykh uslovijakh, i na etikh primerakh demonstrirujut reshenija rasprostranennykh analiticheskikh problem.