Головко Николай Вячеславович

Северо-Кавказский федеральный университет

кандидат филологических наук, доцент кафедры культуры русской речи

г. Ставрополь, ул. Пушкина, 1а, ауд. 414; +78652956800

nvgolovko@inbox.ru

УДК 81'322.2

 

Ассоциативный аспект интерпретации метафоры в процессе автоматизированного анализа русскоязычных текстов

 

В статье рассматриваются вопросы, связанные с преодолением смысловой неоднозначности текстов при их обработке в автоматизированных анализаторах. Осуществляется поиск возможного решения проблемы метафорического переосмысления лексических единиц посредством специализированных лексикографических баз данных. Исследуются перспективы применения ассоциативных словарей русского языка для решения указанной задачи. Выполнен обзор специфических характеристик существующих словарей данного типа, влияющих на возможности их применения в автоматизированных системах обработки текстов. Изложены принципы, в соответствии с которыми необходимо строить подходящую для решения рассматриваемой задачи лексикографическую базу данных. Намечены пути формализации упомянутой базы для включения ее в состав анализатора. Рассмотрена также возможность создания и использования специализированного прогностического алгоритма, позволяющего предсказывать эволюцию коннотативных значений лексических единиц.

Ключевые слова: лексическая многозначность, синтаксическая образность, автоматизированный анализ текста, метафоризация, ассоциативный словарь, формализация, аналитический алгоритм, денотация и коннотация, прагматика, лексикографическая база данных.

 

The article represents the analysis of problems related to neutralization of semantic ambiguity within texts in natural languages during their processing in automatic analyzers. Possible solutions are researched for the issue of metaphoric redefining of lexical units by means of special lexicographic databases. Particularly, in order to resolve the specified issue the potential efficiency of associative dictionaries is analyzed. Specific characteristics of such dictionaries already in existence, influencing the possibility of their usage in automatic text processors, are reviewed. The principles, according to which a database suitable for this purpose could be created, are presented as well. Ways of formalization of such database are also sketched in the article. In conclusion, the author speculates on possible creation and usage of a special prognostic algorithm capable of foretelling the evolution of connotative meanings for lexical units.  

Keywords: lexical polysemy, syntactical imagery, automatic text analysis, metaphorization, associative dictionary, formalization, analytical algorithm, denotation and connotation, pragmatics, lexicographic database.

 

Развитие лексической системы языка традиционно сопровождается как включением в ее состав новых знаков (неологизмов либо слов, заимствованных из других языков), так и расширением смыслового континуума, приписываемого уже существующим в языке словам и выражениям. Очевидно, что от изначального состояния однозначности лексические единицы в процессе языковой эволюции переходят к состоянию полисемантичности, развивая коннотативное значение либо совокупность таковых на основании исходного денотативного значения. То, каким именно образом происходит подобная обработка и переосмысление денотата, само по себе требует внимательного рассмотрения и изучения в целях совершенствования автоматизированных систем обработки текстов (поскольку верное понимание процессов, лежащих в основе развития новых значений лексических единиц, непосредственно связано с эффективностью работы соответствующих алгоритмов); представляется, однако, не излишне чрезмерным допущением предположить, что если не большинство, то по крайней мере множество подобных переосмыслений исходного значения осуществляется на основании метафорического переноса.

В данном случае мы не считаем необходимым конкретизировать сущность рассматриваемого процесса, разделяя коннотативные значения на обязанные своим существованием именно метафоре, метонимии, синекдохе и т.д. Для простоты изложения условимся все случаи такого переноса обобщенно называть «метафорическими», имея, однако, в виду, что в каждом конкретном случае новое значение может развиваться не только на базе скрытого сравнения или сходства явлений, но и по принципу смежности, отношения между частью и целым и т.п.

Несомненно, что метафора и все связанные с ней явления представляют собой одну из наиболее существенных проблем, которые необходимо решать при построении систем автоматизированного анализа текстов на естественных языках. Качественный анализ требует выхода на уровень содержания текста, условного «осознания» и «осмысления» значения, ассоциированного с отдельными лексическими единицами и с самим текстом в целом; в то время как моносемантичные слова и однозначные синтаксические конструкции не представляют интерпретационной сложности, полисемантичные лексические единицы и многозначные конструкции повышают информационную энтропию (т.е. меру неопределенности текста) и не позволяют анализатору корректно толковать высказывание без привлечения дополнительных средств, нацеленных на преодоление неоднозначности. «Проблема метафоры» может быть рассмотрена с двух направлений: с одной стороны, метафора является источником переосмысления денотативных значений (и, соответственно, движущей силой формирования и развития лексической многозначности), а с другой стороны, она же способствует возникновению интерпретационных помех на синтаксическом уровне (к примеру, объединяются в словосочетание такие лексические единицы, которые формально несовместимы, а их итоговое образное значение отличается от суммы значений компонентов словосочетания; в таком случае автоматизированный анализатор, не усматривая никаких связей, способных объединить слова в подобной синтаксической конструкции, может столкнуться с трудностями при извлечении смысла). Соответственно, научение автоматизированных систем обработки текстов корректной работе с метафорой является ключом к решению одновременно двух проблем: интерпретации многозначных слов и понимания образных выражений, значение которых основано на метафорическом переносе.

К примеру, Ю.Д. Апресян, говоря о проблемах лексической многозначности и интерпретации полисемантичных высказываний, отмечал, что существенной частью прагматики языкового знака, его связи с практикой употребления, являются именно коннотации, или семантические ассоциации, «которые отражают связанные со словом культурные представления или традиции, господствующую в данном обществе практику использования соответствующей вещи и многие другие внеязыковые факторы» [1, с. 67]. Исследователь указывал, что, хотя эти сопутствующие признаки не входят непосредственно в семантику языкового знака, они, тем не менее, чрезвычайно существенны для нее, поскольку часто именно на их основе слово подвергается метафоризации или участвует в иных языковых процессах. Далее Ю.Д. Апресяном была высказана мысль, которая представляется нам особенно важной с точки зрения ее последующего развития: «коннотации должны записываться в особой прагматической или коннотативной зоне соответствующей словарной статьи и служить опорой при толковании таких переносных значений слова, которые не имеют общих семантических признаков с основными значениями» [1, с. 68]. Нетрудно заметить, что фактически в данном случае мы имеем дело с почти готовым теоретическим и структурным решением, которое позволило бы обеспечить основание для успешной работы текстового анализатора с метафорой. Позднее ученый, говоря о типах лексической многозначности, предложил дополнительные пояснения: «в частности, в прагматической зоне словарной статьи молния = ‘разряд атмосферного электричества’ записываются семантические ассоциации ‘быстрота’, ‘блеск’» [1, с. 179].

Следует, однако, констатировать, что рекомендации Ю.Д. Апресяна не были в итоге полноценно реализованы: толковые словари (которые исследователь, собственно, и имел в виду, высказывая представленные выше мысли) вплоть до настоящего момента не располагают коннотативной зоной в структуре статей. В целом данный факт не вызывает удивления, преимущественно в силу того, что установление семантических коннотаций является отдельной значимой задачей, решение которой повлекло бы за собой существенное увеличение сроков подготовки любого лексикографического издания. Объем работ, связанный одновременно с описанием семантического континуума слова и с выяснением вторичных ассоциаций, вызываемых им, заставляет отказаться от идеи создания специального толкового словаря для нужд АСОТ, в состав которого входила бы прагматическая зона.

В то же время составление специализированной лексикографической базы данных, учитывающей исключительно ассоциативные коннотации лексических единиц, представляется существенно менее сложной задачей, нежели указанная выше. К настоящему моменту накоплен определенный опыт составления ассоциативных словарей русского языка, как в традиционном формате на книжных носителях (наиболее известными из таковых являются «Словарь ассоциативных норм русского языка» под редакцией А.А. Леонтьева и «Русский ассоциативный словарь» в 3-х частях, подготовленный коллективом авторов под руководством Ю.Н. Караулова), так и в виде электронных баз данных, доступных через сеть Интернет. Ассоциативный словарь фактически представляет собой обособленную совокупность прагматических зон для ряда ключевых слов языка (к примеру – наиболее часто встречающихся), и исходная идея, заложенная в лексикографическое издание подобного рода, довольно точно соответствует изначальному замыслу Ю.Д. Апресяна, который мы в данном рассуждении используем в качестве опорного.

Будучи введенной в структуру автоматизированного анализатора, база ассоциативного словаря позволит системе обработки текста устанавливать коннотативные связи между словами, входящими в состав образных выражений; это, в свою очередь, откроет путь для интерпретации смысла подобных высказываний и, в конечном счете, может обеспечить машинное понимание метафоры. Кроме того, встретив лексическую единицу в новом, пока еще не известном контексте, автоматизированный анализатор сможет предпринять попытку опереться на известные ему коннотации и таким образом встроить слово в его окружение (тем самым эвристически преодолевая смысловую неоднозначность, интерпретируя слово даже в отсутствие подходящих записей в словаре толкований или в базе данных дистрибуции соответствующей единицы).

Соответственно, на первый взгляд кажется довольно очевидной идея об использовании существующих ассоциативных словарей русского языка в качестве основы для перспективного модуля интерпретации метафор в составе автоматизированных систем обработки текстов. Данные словари обладают рядом достоинств: к примеру, готовое решение не требует издержек на составление лексикографической базы, качество их исполнения подтверждено довольно продолжительной апробацией (так, в частности, словарь под редакцией А.А. Леонтьева был издан в 1973 году, словарь школы Ю.Н. Караулова начал выходить в 1994 году), и эти базы уже были подвергнуты формализации для представления в электронном формате. Тем не менее, последующий анализ их особенностей с неизбежностью приводит к выводу о том, что существующие на данный момент ассоциативные словари не составляют удовлетворительной базы для автоматизированного анализатора по ряду нижеследующих причин.

В первую очередь необходимо отметить, что поставленным задачам изначально не соответствует сам принцип, в соответствии с которым составляются упомянутые ранее словари. Их теоретический фундамент составляют идеи не столько лингвистики, сколько психологии: они основаны на методологии бихевиоризма. В результате этого их база наполняется не семантическими коннотациями, которые вызваны метафорическим переосмыслением исходных значений лексических единиц, а подсознательными ассоциациями, которые вызваны реакцией на предлагаемый стимул. Набор стимулов при этом может быть относительно невелик: например, словарь под редакцией А.А. Леонтьева, будучи фактически первым опытом отечественных исследователей в области ассоциативной лексикографии, основан на 196 словесных стимулах, чего заведомо недостаточно для нужд автоматизированного анализатора. База словаря Ю.Н. Караулова существенно больше (7000 стимулов), однако указанный выше принцип формирования лексикографической базы остается прежним: словарь строится на результатах экспериментальной работы с испытуемыми, которые по предъявлению словесного стимула должны незамедлительно назвать первые ассоциации, возникающие в их памяти. Несомненно, что в числе названных слов будет присутствовать определенное количество семантических коннотаций, поскольку, согласно известной психолингвистической аксиоме, язык тесно связан с мышлением; однако в то же время база оказывается насыщенной посторонними словами, которые не имеют отношения к метафорическому переносу и возникают в сознании человека благодаря устойчивым сочетаниям, синонимическим либо антонимическим связям и т.д. (к примеру, в одном из рассмотренных нами Интернет-словарей ассоциаций стимулу «бабушка» соответствовала очевидная, но никоим образом не полезная для интерпретации метафорических переосмыслений реакция «дедушка»). Косвенным подтверждением излишнего объема таких словарных баз может послужить тот факт, что в словаре Ю.Н. Караулова на 1 стимул в среднем приходится 14-15 реакций.

Кроме того, в целом следует признать, что отраженные в существующих ассоциативных словарях коннотации не вполне актуальны на данный момент (заметим, впрочем, что словарь школы Ю.Н. Караулова был переиздан в 2002 году). Исследования процессов полисемантизации, проведенные нами ранее, показали, что лексические единицы способны приобретать и развивать новые значения на протяжении довольно кратких временных отрезков. Соответственно, существует также и потребность в обновлении лексикографических баз ассоциативных словарей русского языка, удовлетворение которой позволит учесть новые коннотации, возникшие в языке в течение последних десятилетий.

Таким образом, мы считаем необходимым подготовить и выпустить новый ассоциативный словарь русского языка, предназначенный в первую очередь для использования в автоматизированных анализаторах русскоязычных текстов. Для сколь возможно более полного соответствия актуальным потребностям в их развитии подобный словарь должен быть построен на лингвистическом теоретическом обеспечении, изначально исходить из необходимости отбора только тех ассоциаций, которые действительно обладают коннотативной значимостью (т.е. способны послужить основой для метафорического переноса) и учитывать современное состояние лексической системы русского языка. Представляется, что в первую очередь при составлении словаря необходимо устанавливать семантические ассоциации для субъектных и предикативных частей речи – имен существительных и глаголов, поскольку возможности метафорического переосмысления наиболее значительны именно в этих случаях, в то время как имена прилагательные, местоимения и наречия выполняют вторичную функцию по отношению к ним. Возможно также обращение к т.н. семантическим примитивам – базовому набору понятий, из которых могут быть составлены все прочие смыслы и определения; такой подход также может быть перспективен при работе с автоматизированными анализаторами, поскольку любой машинноязыковой алгоритм изначально построен на комбинировании минимальных, простейших базовых элементов.

Безусловно, во избежание отражения в словаре исключительно языковой картины мира его составителей практику работы с группами испытуемых надлежит сохранить. Тем не менее, представляется целесообразным либо изначально давать участникам эксперимента установку на воспроизведение не всех ассоциаций, а только лишь тех, которые кажутся им связанными с метафорическим переносом, либо впоследствии, по завершении сбора опытных данных, подвергнуть собранные сведения дополнительной фильтрации с целью оставить в лексикографической базе только соответствующие поставленной цели ассоциации. Такой подход мы рассматриваем как оправданный, поскольку предлагаемый словарь имеет довольно узкое назначение и предназначен для решения вполне определенных конкретных практических задач, диктующих особый подход к принципам его построения и наполнения.

Поскольку рассматриваемый словарь изначально предназначается для использования в автоматизированных анализаторах текстов, необходимо вкратце обозначить возможности его формализации и представления в виде электронной базы данных (что, впрочем, не отменяет перспективы его издания в традиционном книжном формате). Структура подобной БД довольно проста: ячейка входа словарной статьи (заголовочное слово, текстовый формат), ячейка типа (субъект / предикат, boolean-значение), ячейка набора ассоциаций (предпочтительно в виде ссылки на таблицу коннотаций), опциональная ячейка кэша (ссылка на таблицу готовых конструкций, в которую система могла бы записывать свой предыдущий успешный опыт интерпретации и не повторять аналитический цикл заново в случае повторной встречи с тем же контекстом или выражением). Соответственно, обращение к такой базе возможно как со стороны исходного слова (поиск коннотаций по заголовку), так и со стороны ассоциаций (выведение списка заголовочных слов, имеющих определенную коннотацию). Таким образом, в случае с упоминавшимся выше словом молния анализатор сможет запросить список коннотаций из базы данных ассоциативного словаря, получить субъектные указатели «быстрота» и «блеск», извлечь из базы толкований основные семы, сопряженные с этими словами, и установить связь, к примеру, между словами «молния» и «телеграмма», определив, что в числе признаков понятия «телеграмма» присутствует концепция скорости – а, следовательно, оно может быть увязано с понятием «молния» через коннотацию «быстрота».

Кроме того, следует заметить, что сбор и накопление статистических данных о роли метафорического переноса в процессах формирования новых значений лексических единиц может способствовать успешному проектированию и построению специализированного прогностического алгоритма, предназначенного для эвристического определения пути дальнейшего развития семантики тех или иных слов. В частности, если в результате соответствующих исследований будет установлено, что чаще всего новые значения развиваются именно на основе ассоциативного метафорического переосмысления денотатов, то лексикографическая база данных ассоциативного словаря сможет быть применена также и в качестве основы для работы соответствующего алгоритма.

 

Литература и источники

 

1. Апресян Ю.Д. Избранные труды. Т.1: Лексическая семантика. Синонимические средства языка. – М.: Яз. рус. культуры, 1995. – 472 с.