Анализ данных - предмет, порожденный компьютерной революцией, приведшей к накоплению огромного количества конкретных данных о совокупностях объектов, таких как страны или регионы, веб-сайты, работодатели и работники, товары и продавцы. В отличие от классической математической статистики анализ данных не пытается вывести свойства окружающего мира исходя из специально собранных данных, а ориентирован на отыскание каких-либо паттернов, закономерностей, структуры в имеющихся данных. В данном учебнике, подготовленном на основе большого международного опыта исследований и преподавания, излагаются основные методы анализа данных, относящихся прежде всего к одному или двум изучаемым признакам. Подробно рассмотрены вопросы анализа и интерпретации связей между двумя количественными, двумя качественными, а также качественным и количественным признаками. Из многомерных методов рассмотрены наивный Бэйесовский классификатор и метод K-средних для кластерного анализа, включая...
Analiz dannykh - predmet, porozhdennyj kompjuternoj revoljutsiej, privedshej k nakopleniju ogromnogo kolichestva konkretnykh dannykh o sovokupnostjakh obektov, takikh kak strany ili regiony, veb-sajty, rabotodateli i rabotniki, tovary i prodavtsy. V otlichie ot klassicheskoj matematicheskoj statistiki analiz dannykh ne pytaetsja vyvesti svojstva okruzhajuschego mira iskhodja iz spetsialno sobrannykh dannykh, a orientirovan na otyskanie kakikh-libo patternov, zakonomernostej, struktury v imejuschikhsja dannykh. V dannom uchebnike, podgotovlennom na osnove bolshogo mezhdunarodnogo opyta issledovanij i prepodavanija, izlagajutsja osnovnye metody analiza dannykh, otnosjaschikhsja prezhde vsego k odnomu ili dvum izuchaemym priznakam. Podrobno rassmotreny voprosy analiza i interpretatsii svjazej mezhdu dvumja kolichestvennymi, dvumja kachestvennymi, a takzhe kachestvennym i kolichestvennym priznakami. Iz mnogomernykh metodov rassmotreny naivnyj Bejesovskij klassifikator i metod K-srednikh dlja klasternogo analiza, vkljuchaja...