Русская корпусная лингвистика представлена в книге двумя направлениями. Первая часть содержит описание подходов и методов аннотации Национального корпуса русского языка, включая разметку лексико-грамматической, лексико-семантической, семантико-синтаксической и словообразовательной информации. Кроме того, описываются процедуры оценки инструментов автоматической разметки текстов (морфологических и синтаксических парсеров) и идеология создания двух частотных корпусных словарей, общего и лексико-грамматического. Во второй части представлены результаты исследований грамматики и лексики русского языка с применением квантитативных корпусных методов: изучение грамматических, конструкционных и семантических профилей языковых единиц, в том числе глаголов и глагольных приставок, имен существительных и пространственных конструкций.
Russkaja korpusnaja lingvistika predstavlena v knige dvumja napravlenijami. Pervaja chast soderzhit opisanie podkhodov i metodov annotatsii Natsionalnogo korpusa russkogo jazyka, vkljuchaja razmetku leksiko-grammaticheskoj, leksiko-semanticheskoj, semantiko-sintaksicheskoj i slovoobrazovatelnoj informatsii. Krome togo, opisyvajutsja protsedury otsenki instrumentov avtomaticheskoj razmetki tekstov (morfologicheskikh i sintaksicheskikh parserov) i ideologija sozdanija dvukh chastotnykh korpusnykh slovarej, obschego i leksiko-grammaticheskogo. Vo vtoroj chasti predstavleny rezultaty issledovanij grammatiki i leksiki russkogo jazyka s primeneniem kvantitativnykh korpusnykh metodov: izuchenie grammaticheskikh, konstruktsionnykh i semanticheskikh profilej jazykovykh edinits, v tom chisle glagolov i glagolnykh pristavok, imen suschestvitelnykh i prostranstvennykh konstruktsij.