В соответствии с двояким характером исследования в целом настоящий том включает две части. В части 4 дистрибутивно-статистический анализ (ДСА) проводится на материале 15 миллионов слов, непосредственно примыкающих друг к другу в текстах русской прозы 1850-1870-х гг. Тот же формальный метод прилагается к английскому корпусу (4 миллиона слов романов Диккенса). И в том, и в другом случае ДСА приводит к открытию дистрибутивных классов и некоторых грамматических конструкций. Часть 5 представляет собой частотный словарь русского корпуса, показывающий распределение слов по основным жанрам, по микрожанрам и по текстам 25 писателей. В существенно расширенном виде том 2 представлен на компакт-диске.
V sootvetstvii s dvojakim kharakterom issledovanija v tselom nastojaschij tom vkljuchaet dve chasti. V chasti 4 distributivno-statisticheskij analiz (DSA) provoditsja na materiale 15 millionov slov, neposredstvenno primykajuschikh drug k drugu v tekstakh russkoj prozy 1850-1870-kh gg. Tot zhe formalnyj metod prilagaetsja k anglijskomu korpusu (4 milliona slov romanov Dikkensa). I v tom, i v drugom sluchae DSA privodit k otkrytiju distributivnykh klassov i nekotorykh grammaticheskikh konstruktsij. Chast 5 predstavljaet soboj chastotnyj slovar russkogo korpusa, pokazyvajuschij raspredelenie slov po osnovnym zhanram, po mikrozhanram i po tekstam 25 pisatelej. V suschestvenno rasshirennom vide tom 2 predstavlen na kompakt-diske.