Обработка естественного языка (Natural Language Procession - NLP) представляет собой важную область разработки прикладного ПО и, с учетом современных задач ИТ, в будущем эта важность будет только возрастать. Уже сейчас наблюдается рост потребности в приложениях, работающих с естественными языками на основе NLP-методик. В данной книге рассматриваются способы организации автоматической обработки текста с применением таких методик, как полнотекстовый поиск, правильное распознавание имен, кластеризация, классификация, извлечение информации и составление аннотаций. Концепции обработки естественного языка излагаются таким образом, что даже читатели, не обладающие знаниями об этой технологии и о методах статистического анализа, смогут понять их.
Obrabotka estestvennogo jazyka (Natural Language Procession - NLP) predstavljaet soboj vazhnuju oblast razrabotki prikladnogo PO i, s uchetom sovremennykh zadach IT, v buduschem eta vazhnost budet tolko vozrastat. Uzhe sejchas nabljudaetsja rost potrebnosti v prilozhenijakh, rabotajuschikh s estestvennymi jazykami na osnove NLP-metodik. V dannoj knige rassmatrivajutsja sposoby organizatsii avtomaticheskoj obrabotki teksta s primeneniem takikh metodik, kak polnotekstovyj poisk, pravilnoe raspoznavanie imen, klasterizatsija, klassifikatsija, izvlechenie informatsii i sostavlenie annotatsij. Kontseptsii obrabotki estestvennogo jazyka izlagajutsja takim obrazom, chto dazhe chitateli, ne obladajuschie znanijami ob etoj tekhnologii i o metodakh statisticheskogo analiza, smogut ponjat ikh.