Для того чтобы понять мир, необходимо собрать и проанализировать данные о нем. Объединение последних технологических тенденций предоставляет новые возможности для применения анализа данных к более сложным задачам, чем когда-либо прежде.Емкость компьютерных хранилищ увеличивается экспоненциально; хранение данных сейчас стало настолько дешевым, что компьютерным системам почти невозможно ничего забыть. Сенсорные устройства все шире и шире контролируют все, за чем только можно наблюдать: потоки видео, действия в социальных сетях и местоположение всего, что перемещается. Сетевая вычислительная среда позволяет использовать огромные количества машин для манипулирования этими данными. Каждый раз, когда вы осуществляете поиск в Google, задействуются сотни компьютеров, тщательно исследующие все ваши предыдущие действия, только для того, чтобы решить, какая реклама является наилучшей для демонстрации именно вам.Результатом всего этого стало рождение науки о данных - новой области, посвященной максимизации значения обширных коллекций информации. Как дисциплина, наука о данных находится где-то на пересечении статистики, информатики и машинного обучения, но стоит она отдельно, как самостоятельный персонаж. Эта книга служит введением в науку о данных, сосредоточиваясь на навыках и принципах, необходимых для построения систем, предназначенных для анализа и интерпретации данных.Профессиональная практика автора как исследователя и преподавателя убедила его в том, что одной из главных сложностей науки о данных является то, что она значительно сложней, чем выглядит. Любой студент, когда-либо вычислявший свой средний балл успеваемости, может сказать, что выполнял элементарный статистический расчет, а рисование простого графика разброса позволит вам добавить в свое резюме упоминание о наличии опыта в визуализации данных. Однако реальный анализ и интерпретация данных требуют и технических знаний, и мудрости. Основами обладает очень много людей, но не техническими знаниями, что и вдохновило автора на написание этой книги.Об автореСтивен С. Скиена - ученый в области компьютерных наук и заслуженный профессор информатики в университете Стони Брукс. Он также является директором Института искусственного интеллекта в Стони Брук. В сферу его научного интереса входит анализ и разработка компьютерных алгоритмов и их применение в области биологии. Скиена написал несколько популярных книг в области алгоритмов, программирования и математики.
Dlja togo chtoby ponjat mir, neobkhodimo sobrat i proanalizirovat dannye o nem. Obedinenie poslednikh tekhnologicheskikh tendentsij predostavljaet novye vozmozhnosti dlja primenenija analiza dannykh k bolee slozhnym zadacham, chem kogda-libo prezhde.Emkost kompjuternykh khranilisch uvelichivaetsja eksponentsialno; khranenie dannykh sejchas stalo nastolko deshevym, chto kompjuternym sistemam pochti nevozmozhno nichego zabyt. Sensornye ustrojstva vse shire i shire kontrolirujut vse, za chem tolko mozhno nabljudat: potoki video, dejstvija v sotsialnykh setjakh i mestopolozhenie vsego, chto peremeschaetsja. Setevaja vychislitelnaja sreda pozvoljaet ispolzovat ogromnye kolichestva mashin dlja manipulirovanija etimi dannymi. Kazhdyj raz, kogda vy osuschestvljaete poisk v Google, zadejstvujutsja sotni kompjuterov, tschatelno issledujuschie vse vashi predyduschie dejstvija, tolko dlja togo, chtoby reshit, kakaja reklama javljaetsja nailuchshej dlja demonstratsii imenno vam.Rezultatom vsego etogo stalo rozhdenie nauki o dannykh - novoj oblasti, posvjaschennoj maksimizatsii znachenija obshirnykh kollektsij informatsii. Kak distsiplina, nauka o dannykh nakhoditsja gde-to na peresechenii statistiki, informatiki i mashinnogo obuchenija, no stoit ona otdelno, kak samostojatelnyj personazh. Eta kniga sluzhit vvedeniem v nauku o dannykh, sosredotochivajas na navykakh i printsipakh, neobkhodimykh dlja postroenija sistem, prednaznachennykh dlja analiza i interpretatsii dannykh.Professionalnaja praktika avtora kak issledovatelja i prepodavatelja ubedila ego v tom, chto odnoj iz glavnykh slozhnostej nauki o dannykh javljaetsja to, chto ona znachitelno slozhnej, chem vygljadit. Ljuboj student, kogda-libo vychisljavshij svoj srednij ball uspevaemosti, mozhet skazat, chto vypolnjal elementarnyj statisticheskij raschet, a risovanie prostogo grafika razbrosa pozvolit vam dobavit v svoe rezjume upominanie o nalichii opyta v vizualizatsii dannykh. Odnako realnyj analiz i interpretatsija dannykh trebujut i tekhnicheskikh znanij, i mudrosti. Osnovami obladaet ochen mnogo ljudej, no ne tekhnicheskimi znanijami, chto i vdokhnovilo avtora na napisanie etoj knigi.Ob avtoreStiven S. Skiena - uchenyj v oblasti kompjuternykh nauk i zasluzhennyj professor informatiki v universitete Stoni Bruks. On takzhe javljaetsja direktorom Instituta iskusstvennogo intellekta v Stoni Bruk. V sferu ego nauchnogo interesa vkhodit analiz i razrabotka kompjuternykh algoritmov i ikh primenenie v oblasti biologii. Skiena napisal neskolko populjarnykh knig v oblasti algoritmov, programmirovanija i matematiki.