Читать книгу Историческая наука и теория социальных эстафет М. А. Розова онлайн
Наибольшее распространение получило направление, связанное с атрибуцией текстов. Здесь самым перспективным представляется изучение текста с точки зрения его содержания, характеризующего такие принципы деятельности автора, как отбор фактов для фиксации в тексте, структурирование мира, степень осознания описываемого события, процесса, причинно-следственных связей и т. п. Однако и здесь встает тот же вопрос – что должно являться «единицей счета»?
Вопрос о взаимосвязи текстов и построение генеалогических стемм списков произведения также решается, как правило, на базе филологических характеристик (описки, ошибки, пропуски фрагментов текста, объем текста и т. п.). Некоторой разновидностью является анализ употребления имен собственных для определения взаимосвязи текстов, однако и они (имена) понимаются прежде всего как грамматическая форма. Например, при анализе частоты встречаемости некоего имени подсчитывается отдельно число имен, число имен и отчеств, число фамилий, а упоминания в виде местоимений или должностей вообще не учитываются, хотя относятся к тому же лицу (персонажу). Таким образом, речь не идет о частоте упоминания некоего персонажа, что позволило бы вывести анализ на содержательный уровень. Это, как представляется, существенно обедняет данный подход.
Необходимо учесть, что описки, ошибки и прочие параметры источниковедческого анализа порождаются в ходе совершенно разных процессов, и вне понимания этого факта нет корректной интерпретации. Однако, если в рамках традиционного анализа можно ограничиться утверждением сходства, близости и пр., то привнесение математических методов необходимо требует указать и их количественную меру, которую соответственно и интерпретировать. Попытки ввести в исследование «вес» признаков или характеристик, т. е. ранжировать их по значимости, заставляют обратиться к поиску доминант как в онтологическом, так и в гносеологическом аспектах.
Вообще же информационно содержательный анализ текста применяется при решении самых разных задач: для дешифровки текстов, классификации текстов по содержанию, определения типа текста. Основой такого анализа является термин или имя, частота его встречаемости, распределение на хронологической оси и т. п. Таким образом, и здесь не задействованы чисто содержательные характеристики текстов.