Методы статистического анализа литературных текстов
Оформить заказ
Серия:Синергетика: от прошлого к будущему
Автор:Ю. Н. Орлов, К. П. Осминин
Издательство:Либроком
Страниц:312
Год:2017
Обложка:Твердый переплет
Размер:60x90/16
SKU:RU916466
ISBN:9785397059961
Наша цена:US $67.00
Пункты выдачи магазин ТРОЙКА
Отправка почтой: July 9th от US $12.00, бесплатно при заказе от US $100.00.
Точная стоимость доставки будет рассчитана при оформлении заказа.
В настоящей книге излагается новый подход к решению некоторых задач математической лингвистики, основанный на использовании кинетических уравнений, описывающих эволюцию выборочных функций распределения текста по буквам. Этот подход сочетает в себе методы традиционной математической статистики и статистической механики, модифицированные для применения их к нестационарным временным рядам, каковыми являются последовательности букв в тексте.Центральной задачей, решаемой в данной работе, является идентификация автора и жанра "условно неизвестного" литературного текста в библиотеке известных текстов. Построен высокоточный метод идентификации, использующий функционал близости текстов как распределений пар букв в определенной норме.Анализируются также статистические свойства распространенных европейских языков. Для них установлено полуэмпирическое распределение алфавитных символов по частоте встречаемости, которое оказалось зависящим от двух параметров --- количества букв в алфавите данного языка и их соответствия звуковому ряду. Рассмотрены конкретные примеры статистического решения некоторых спорных вопросов об авторстве того или иного текста.Книга будет полезна лингвистам и литературоведам, а также математикам, специализирующимся в области прикладной математической статистики.