Новое в зарубежной лингвистике - umotnas.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Название работы Кол-во страниц Размер
«теория речевых актов» как один из вариантов теории речевой деятельности 1 243.74kb.
Доклад на заседании секции по когнитивной лингвистике, Челябинск... 1 91.43kb.
1. Понятие уровня в теоретической и прикладной лингвистике 1 20.71kb.
1. Типы экспериментальных методов в лингвистике 1 53.04kb.
«Теории познавательного развития в зарубежной психологии» 1 34.01kb.
Пояснительная записка преподавание спецкурса «История зарубежной... 1 39.33kb.
С. Д. История зарубежной литературы XVII-XVIII в в. М., 1988. 1 26.24kb.
Учебно-методический комплекс дисциплины «История западной философии»... 1 385.1kb.
Многоразовый подгузник достоинства и преимущества 1 21.66kb.
В этом деле замешан английский солод, или новое пиво по-английски 1 31.64kb.
Проблемы словесного портрета в современной лингвистике 2 555.53kb.
Рабочая программа учебной дисциплины 1 150.42kb.
Викторина для любознательных: «Занимательная биология» 1 9.92kb.

Новое в зарубежной лингвистике - страница №1/1

Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ. ст. Б. Ю. Городец­кого.—М.: Прогресс, 1989.—432 с.

Настоящий сборник посвящен лингвистическим аспектам компьютеризации, связанным прежде всего с моделированием общения на естественном языке. Рассматриваются фундаментальные коммуникативные процессы (понимание и вербализация), методы представления и использования знаний, а также особен­но актуальная для разработки реальных лингвистических процессоров проблема коммуникативных неудач. Книга представляет интерес для языковедов, фило­софов, логиков, психологов, специалистов по искусственному интеллекту, для преподавателей вузов и аспирантов, изучающих основы информатики.



© Составление, перевод на русский язык, всту­пительная статья — издательство „Прогресс", 1989

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА:

МОДЕЛИРОВАНИЕ ЯЗЫКОВОГО ОБЩЕНИЯ

Проблемы взаимосвязи науки и практики сегодня преломляются для лингвистики через призму требований глобальной компьютери­зации. Язык носит всепроникающий характер. Любая проблема информатики, искусственного интеллекта, экспертных систем и — шире — рационализации человеческой деятельности имеет языко­вой аспект. Подобно тому как советские специалисты по информа­тике ведут сейчас активную разъяснительную работу, направлен­ную на устранение «досадного непонимания существа и растущей экономической значимости проблемы формирования и промышленной эксплуатации национальных информационных ресурсов» [13, с. 8], лингвисты-прикладники озабочены все еще часто встречающимся среди представителей технических наук непониманием сущности ( и роли вклада лингвистики в компьютеризацию, а также распространенным среди многих языковедов непониманием роли компьюте­ризации как стимула перестройки лингвистической теории. Постараемся в какой-то мере прояснить эти моменты.

Корень многих недоразумений кроется в неточном определении информационной природы естественного языка. Здесь важно иметь в виду, что язык — это не столько «форма выражения» готовых мыслей, сколько способ содержательной организации и представления знаний. Этот способ первичен, универсален, возникает с самим зарождением человеческого интеллекта и служит надежным инструментом его развития. Без широкого целенаправленного моделирования информационного механизма естественного языка и процессов речевой деятельности можно обходиться лишь до поры до времени. Компьютеризация разнообразных видов интеллек­туальной деятельности (а это значит — практически любой деятельности человека) рано или поздно приводит к необходимости экспликации языковой способности пользователя ЭВМ с последую­щим созданием соответствующих банков знаний и машинных программ.

Что же конкретно заставляет уже сегодня говорить об остро­те потребности в лингвистическом обеспечении компьютеризации? (Кстати, сама разработка подобного обеспечения являет собой яркий образец конкретного взаимодействия общественных, естест­венных и технических наук).

Прежде всего укажем на гигантские объемы накопленной и постоянно создаваемой информации, которая подлежит обработке с помощью ЭВМ. Поскольку эта информация часто организована средствами естественного языка, ее реальное освоение возможно лишь при условии автоматической смысловой обработки текстов, без предварительной препарации их человеком. Лишь тогда откроется доступ в машину большим массивам организационно-управленческой, плановой, научно-технической, социально-полити­ческой, правовой, проектной, библиотечной, справочно-бытовой и прочей информации.

Эффективное использование знаний, содержащихся в текстах, требует новых стратегий обработки информации, отличных от традиционных логических подходов. Такие стратегии должны учитывать семантические законы естественного языка. Например, из высказывания Иван вернул мне книгу следует, что книга ранее была у меня (этот вывод мы делаем на основании той части толкования глагола вернуть, которая называется пресуппозицией). Или: из высказывания Он заставил мотор остановиться можно сделать заключение «Он остановил мотор нестандартным способом» (это так называемая коммуникативная импликатура, подсказываемая в данном случае именно тем способом выражения, который вы­брал говорящий).

Далее, потребность в лингвистическом обеспечении обусловле­на перспективной установкой на создание человеко-машинных сис­тем решения интеллектуальных задач. Заметим, что нередко пред­ставители и гуманитарных, и естественных наук грешат рассмотре­нием компьютера как сугубо внешней силы, абсолютно отчужденной от человека. А между тем серьезный разговор об усилении природ­ных возможностей человеческого разума должен предусматривать налаживание гибкого взаимодействия человека и машины. Оператив­ная, удобная, развивающаяся кооперация при таком взаимодействии будет опираться на естественный язык (точнее, определенный подъязык, связанный с некоторой сферой общения или классом ре­шаемых задач).

Особо следует подчеркнуть необходимость учитывать лингвис­тическую семантику при построении языков представления знаний вне системы обработки текстов в ее полном виде. Даже в этом случае естественный язык служит надежной точкой отсчета: ведь и создатели систем, и пользователи говорят, пишут и думают преимущественно на естественном языке. Учет этого факта поможет в решении таких острых проблем компьютеризации, как унификация создаваемых систем и автоматизация по возможности большего чис­ла процессов.

В социальном плане значимость лингвистических проблем компьютеризации связана с возникновением новых видов массовой деятельности, включающих построение искусственных языков и машинных словарей, разработку информационных банков, построе­ние алгоритмов обработки текстов, разработку режимов общения в системе ,,человек — компьютер — человек" и т. д. Вообще, языковой аспект немаловажен для всех основных направлений индустрии обработки знаний, таких, как сбор, создание, хранение, систематизация, распространение, интерпретация информации.

Заметим, что и с исторической точки зрения язык оказывается центральным фактором важнейших этапов развития информа­ционной технологии: вспомним возникновение письменности, изобре­тение книгопечатания, создание искусственных информационных и алгоритмических языков, являющихся производными от естествен­ного языка и формализующих некоторые из его функций. Наконец, с точки зрения науковедения, можно констатировать, что лингвисти­ка входит в ядро складывающегося в настоящее время комплекса когнитивных наук, объединяемых по их интересу к проблемам организации, представления, обработки и использования знаний.

Итак, лингвистическое обеспечение автоматизированных си­стем — это совокупность средств, позволяющих осуществлять компьютеризацию языковой деятельности, сопровождающей (в явной или скрытой форме) практически любую интеллектуальную деятель­ность человека. С технологической и системной точек зрения речь идет о создании того или иного типа автоматизированной системы обработки текста (АСОТ)—некоторого процессора, на входе и на выходе которого присутствует текстовая информация на естест­венном языке. Типы АСОТ многообразны и могут быть нацелены на моделирование различных языковых процессов, таких, например, как диалоговое взаимодействие, сжатие информации, реферирование текста, логическая обработка содержания, перевод на другой естественный язык и т. д. С собственно лингвистической точки зрения процессы, осуществляемые в машине при решении подобных задач, сводятся к перезаписи информации на тех или иных (естественных и искусственных) языках. Внешние критерии, кото­рыми руководствуются создатели АСОТ, подводятся под общую формулу «оптимизация общения человека и машины». Именно эту задачу решает такая комплексная научная дисциплина, как компью­терная (вычислительная) лингвистика и ее наиболее существенная часть — вычислительная семантика. Прикладные результаты, полу­чаемые в данной области,— это семантические алгоритмы и семантические метаязыки, то есть модели процессов (извлечения информации из текста и воплощения ее в текст) и соответствующих языков представления знаний (на которых хранится и перерабатывается информация, извлеченная из текстов).
Разумеется, прикладные модели отличаются определенным упрощением, огрублением языковой реальности, но эта их черта не имеет ничего общего с упрощенчеством, с игнорированием реальной сложности моделируемого объекта. Как нельзя при осуществлении /компьютеризации отмахнуться от языкового фактора, так нельзя I отмахнуться и от многоаспектности, многоуровневости, „открытос­ти" языкового механизма. Методология прикладного исследования должна предусматривать неуклонное повышение эффективности создаваемых моделей на основе все более полного учета реальных свойств языка.

Назовем лишь некоторые из наиболее фундаментальных качеств естественного языка: принципиальная нечеткость значения языковых выражений (эта нечеткость в полной мере относится и к деловой сфере общения, и даже к дефинируемым ее элементам — терминам [10]), динамичность языковой системы, образность номина­ции (основанная прежде всего на метафоричности), бесконечные творческие потенции в освоении новых знаний, семантическая мощь словаря (позволяющая выражать любую информацию с помощью конечного инвентаря элементов), гибкость в передаче эксплицит­ной и имплицитной информации, разнообразие функций (включаю­щее коммуникативную, когнитивную, планирующую, управляющую, обучающую, эстетическую, метаязыковую и другие функции), специ­фическая системность (под которой имеется в виду не только чле­нение языка на уровни, но и членение его на подъязыки,— относительно независимые функционально-тематические подсисте­мы). В целом по числу своих внутренних диалектических противо­речий естественный язык может быть с полным основанием оценен как сложнейший объект для моделирования. Достаточно упомянуть тот факт, что перечисленные С. Маркусом «пятьдесят две оппозиции между научным и поэтическим общением» [38] представляют, по су­ти, противоположные тенденции, присущие языку в целом (сюда входят: субъективность — объективность; переводимость — непере­водимость; отсутствие синонимии — бесконечность синонимических средств; дискретность значения — континуальность значения; информативность — избыточность; логичность — нелогичность;

алгебраичность—геометричность и т.д.). Да и сами поэтические и научные подъязыки диалектически связаны: это механизмы, служащие целям открытия, познания мира. Язык — незаменимый 'помощник в сфере рационального мышления, так ж»,- как и в сферах эмоционального общения. Язык — это фактор регулирования практически любой человеческой деятельности.

Компьютерное моделирование языка и речевой деятельности нуждается в солидной теоретической базе, и фундаментальная наука должна вплотную заняться соответствующими актуальными проблемами. Нам нужны специальные теории, которые в настоящее

время существуют в зачаточном состоянии либо отсутствуют вовсе. Думается, моделирование языков (естественных и искусственных) вписывается в проблему моделирования способностей человека. Языковая способность—это способность, делающая человека? человеком, возникающая и развивающаяся под воздействием практических потребностей. Проявления ее многообразны, но в когнитивном плане следует особо подчеркнуть ее роль в рече-мыслительной деятельности, в организации памяти, в процессах аутокоммуникации. Предстоит развить теорию моделей языкового общения, теорию подъязыков естественного языка, теорию лингвис­тической семантики в ее связи с ,,экстралингвистическими" семантиками (упомянем хотя бы логическую, психологическую, социоло­гическую, этическую, эстетическую, этнокультурную семантику). К числу более частных, но не менее важных направлений относятся, например, типология естественных и искусственных языков (заме­тим, что естественный язык все более впитывает в себя элементы ,,искусственности"), теория понимания текста, теория вербализа­ции коммуникативного замысла, теория коммуникативных неудач, теория семантической эквивалентности сообщений и другие.

Практические выводы из сказанного очевидны. Лингвистика ! должна повернуться лицом к новым задачам, выдвигаемым компьютеризацией. У нас в стране начинают предприниматься некоторые ме­ры для расширения подготовки языковедов по специальности „структурная, прикладная и математическая лингвистика", но здесь надо обратить особое внимание на овладение методами представления и обработки знаний. Очевидно, мы должны ставить вопрос и шире: компьютерная грамотность в стране в целом немыслима по большому счету без лингвистической грамотности. По-новому должно вестись и преподавание языковедческих предме­тов в школе (а у нас уже есть некоторый опыт развития у школьников творческого, самостоятельного, точного подхода к анализу фактов языка [19]). Назрела необходимость и в специальном оте­чественном журнале по компьютерной лингвистике. В свете очерчен­ных перспектив, диктуемых жизнью, естественны те усилия, кото­рые начинает наращивать издательство „Прогресс" в деле опера­тивного ознакомления советского читателя с опытом зарубежных коллег, исследующих язык в соответствии с его новым статусом в современном мире [16; 17].

Тематика настоящего сборника обозначена термином ,,компьтерная лингвистика". Именно так можно назвать ту дисциплину, кото­рая разрабатывает лингвистические проблемы компьютеризации. Этот термин все более приобретает права гражданства. Именно так называется одна из секций Научного Совета АН СССР по пробле-ие „Искусственный интеллект". Выскажем некоторые соображения о) Целесообразности использования данного термина как более

удобного (в ряде отношений), чем термин „вычислительная линг­вистика" (который, впрочем, в определенных контекстах должен сохранять все свои права, так как выделяет свои аспекты предмета).

Итак, наши соображения об этих терминах сводятся к следую­щему. Во-первых, термин ,,компьютерная лингвистика" задает ; общую ориентацию на использование компьютеров для решения разнообразных научных и практических задач, связанных с языком, никак не ограничивая способы решения этих задач. Термин же ,,вычислительная лингвистика" может пониматься более узко, ибо даже при широкой трактовке понятия ,,вычисление" за его преде­лами как бы остаются такие стороны решения лингвистических задач, как, например, представление знаний, организация банков языковых данных, психолингвистические аспекты взаимоот­ношений и взаимодействия человека и компьютера и ряд других аспектов. Тем самым можно считать, что термин ,,компьютерная лингвистика" (по своей внутренней форме) шире, чем ,,вычислитель­ная лингвистика". Во-вторых, уже сложились параллельные терми­ны типа „компьютерная грамотность", „компьютерная логика" и т. п. В-третьих, английский эквивалент computational linguis­tics содержит прилагательное computational, родственное слову computer, и оно может переводиться и как „компьютерный", и как „вычислительный". Отметим, кстати, что в русском языке термины „компьютер", „ЭВМ", „вычислительная машина" употребляются как синонимы и, естественно, используются при рассмотрении проблем компьютерной лингвистики на равных.

Поток зарубежных публикаций по вопросам компьютерной у лингвистики огромен (из последних книг упомянем, например, "й1 [32; 33; 35; 36; 37; 39; 40; 42]). Выходит много монографий, ^ ^ сборников, издаются журналы „Компьютерная лингвистика" (США), М^ „Искусственный интеллект" (Нидерланды) и ряд других. Раз в два года проводится Международная конференция по компьютерной лингвистике (сокращенно—КОЛИНГ). Десятая конференция состоялась в 1984 г. в Станфордском университете (США), Одиннад­цатая — в 1986 г. в Бонне. Кроме того, в промежутках между ними теперь проходят конференции Европейского отделения Ассоциации компьютерной лингвистики. Значительное место эти вопросы за­нимают на Международных объединенных конференциях по искусст­венному интеллекту, последняя из которых прошла в 1987 г. в Милане. Ежегодно проводится не менее десятка междуна­родных научных симпозиумов по прикладной лингвистике, по машинному переводу, по применению компьютеров в управлении, в гуманитарных науках, в словарном деле, в обучении и т. д.

Компьютерная лингвистика — важная часть прикладного языко­знания (об их соотношении см. [9, с. 5—9]). Круг ее задач, про­блем, методов широк и разнообразен; во многом он связан со спе-

10

цификой того или иного вида практической деятельности людей — деятельности, требующей сегодня применения компьютеров. Но су­ществуют, конечно, и типовые исследовательские ситуации, повто­ряющиеся от задачи к задаче. Надо, правда, признать, что и таких типовых проблем довольно много. Поэтому отразить их все в одном сборнике невозможно. Надеясь на регулярное освещение развития компьютерной лингвистики в последующих выпусках настоящей се­рии, мы отобрали для данного сборника статьи, которые по своему содержанию близки к фундаментальным теоретическим проблемам языкознания, а таковыми сегодня с полным основанием можно счи­тать проблемы процессуального описания языка, раскрытия меха­низмов его деятельности, проблемы, связанные с закономерностями речевого общения, с конструктивным моделированием коммуника­тивной функции языка. Таким образом, в центре внимания настоя­щего сборника — моделирование языкового, или речевого, общения (речевого—в широком смысле, например по М. М. Бахтину [3]). Работы, включенные в сборник, иллюстрируют тот сдвиг в подходах, который произошел за последние несколько лет по сравнению с теми методами процессуального описания языка, которые нашли отражение в сборнике «Новое в зарубежной лингвистике», вып. XII (1983). Если ряд идей и методик сохранил свою силу и на сегодня, то общий контекст прикладных разработок меняется буквально на глазах. На первый план выдвигаются модели целост­ного речевого взаимодействия (диалога), и каждый частный процесс или элемент интерпретируется в составе двустороннего коммуникативного акта. И таким образом, если выше мы подробно говорили о роли компьютерной лингвистики в современном мире, в ускорении научно-технического прогресса, то теперь мы можем констатировать существенное методологическое значение компью­терной лингвистики для самой науки о языке: компьютерное моде­лирование речевого общения представляет собой с этой точки зре­ния удобный полигон для эффективного испытания общетеорети­ческих концепций и гипотез о природе языка, о принципах его действия; сегодня это одна из важнейших форм «эксперимента в языкознании» (Л. В. Щерба)—эксперимента вычислительного, эксперимента компьютерного.



Какова же та общая понятийная парадигма, в которую вписы­вается указанный выше способ применения компьютеров? Какова та целостная теория, которая, в принципе, не зависит от компьюте­ров, но сильно выиграет от их использования,— та теория, кото­рая поможет осмыслить и оценить место и роль каждого конкретного эксперимента?..

11

Всеобщий интерес к коммуникативной природе языка и языко­вых явлений, к категории коммуникативности вызвал к жизни мно­жество направлений и методов исследования. Среди них особое место занимает та совокупность направлений, которую можно обозначить как теория моделей общения [21; 22; 23; 27]. Это наименование озна­чает, что в качестве объекта исследования берется прежде всего особая деятельность, называемая ,,общением", а в качестве основ­ного метода — общенаучный метод моделирования (в частности, моделирование может быть компьютерным, и это, конечно, чрезвы­чайно важно!). Сущность рассматриваемого метода заключается в построении некоего искусственного образования, искусственного ме­ханизма, например в виде системы правил, так, чтобы эта система отражала, объясняла, имитировала изучаемую деятельность. Разу­меется, отдельные модели сильно упрощают и огрубляют действи­тельность, но совокупность разных моделей, особенно по мере их развития и уточнения, будет давать весьма полную картину объекта. Модели бывают глобально-обобщающего уровня (и примером здесь может служить, скажем, экономическая модель капиталистического способа производства) или максимально конкретизированные (как, скажем, компьютерная модель морфологического анализа и синтеза словоформ, построенная М. Г. Мальковским [20, с. 99—122] на базе известного словаря А. А. Зализняка [15], который, кстати, сам по се­бе является образцом структурной модели в области словоизме­нения). В рассматриваемой нами сфере — сфере общения — стрем­ление ученых к моделированию велико, но результаты пока еще весь­ма скромные, хотя и сделан ряд фундаментальных открытий. Важней­шая задача при моделировании того или иного объекта — это точ­ное определение его компонентов, или составных частей, и взаимо­связей между ними. Этой стороне дела уделяется большое внимание в теории моделирования.



Хотя метод моделирования активно развивается именно в наши дни, это вовсе не означает, что, применяя подобный подход к обще­нию, мы должны начинать с нуля. Весьма точные модели социально­го взаимодействия намечались уже в рамках античной риторики. В отечественной науке обоснование необходимости серьезнейшего изучения общения, и в первую очередь его главной формы — диалога, дал Л. В. Щерба в 1915 г. в своей докторской диссертации ,,Во­сточно-лужицкое наречие". Он писал: «Все эти наблюдения лиш­ний раз показывают, что монолог является в значительной степени искусственной языковой формой и что подлинное свое бытие язык обнаруживает лишь в диалоге» (цит. по (30, с. 31]). В 1923 г. появилась удивительная по своей прозорливости и идейной насы­щенности работа Л. П. Якубинского ,,0 диалогической речи", в которой, в частности, есть мысль, предвосхищающая сегодняшние искания в области компьютерного моделирования диалога. Яку-

12

бинский пишет: «Диалогическая форма способствует протеканию речи в порядке автоматической деятельности» [30, с. 53]. Отсюда f следует, что для успешного общения человека с компьютером при ^*г организации этого общения должны быть учтены модели диалога, уже автоматизированные в человеке и заложенные в его интеллектуальных, в частности языковых, способностях.



Необходимость сознательного, активного развития теории моде­лей общения диктуется нетерпимостью дальнейшего застоя, который стал очевиден в целом ряде разделов теоретического языкознания. В частности, повторение мысли о коммуникативной природе языка, речи, предложения, высказывания, значения и т. п. стало общим местом курсов по общему языкознанию, монографий о при­роде языка и речи. Но повторение указанного тезиса в течение десятилетий ни на шаг не сдвинуло решение задачи конструктивного моделирования коммуникативной стороны языковых явлений. Более того, сама реальность, а именно деятельность общения (как в ее внешних проявлениях, так и во внутренних процессах), не стала объектом научного рассмотрения, а слова «общение», «коммуникация», «коммуникативный» обесценились, стали при­вычно бесцветными. Многие проникновения Л. П. Якубинского, сде­ланные более 60 лет назад, не были развиты ни на йоту. Но это не должно вселять в нас пессимизм. Наш долг — придать коммуни­кативной концепции языка ясный и действенный смысл. Жизнь требует точных моделей общения и для кардинального изменения положения в школьном классе (где ученик должен по-иному об­щаться с учителем), и для включения в сеть человеческого общения компьютеров (обладающих искусственным интеллектом).

Интерес к моделям общения неуклонно растет и в теоретиче­ской, и в прикладной лингвистике. Мы имеем на сегодня целый ряд специальных теорий, затрагивающих отдельные аспекты обще­ния: это прагматика в ее многочисленных толкованиях, теория речевых актов, теория речевой деятельности, теория массовой ком­муникации, теория диалоговых компьютерных систем, риторика и неориторика, теория аргументации и другие. Тем более важно развитие комплексной теории моделей общения. Ее необходимость определяется единством объекта исследования. Она поможет опре­делить предмет более частных дисциплин. Эта комплексная теория направлена на деятельностный аспект языка с полным учетом при этом психического и социального факторов. Эта теория призвана моделировать функцию языка, которая традиционно считается важ­нейшей. Прикладное значение такой теории состоит в создании единого фундамента для разнообразных приложений функциональ­но-лингвистических знаний.

Основная целостная единица речевого общения — это речевой коммуникативный акт как законченная часть языкового взаимо-

13

действия, имеющая естественные границы. Коммуникативный акт (КА) входит в состав некоторого акта совместной деятельности, включающей физическую, интеллектуальную, эмоциональную, бессознательную, а также неречевую семиотическую деятельность. Ти­повая разновидность КА — диалог, хотя в общем случае сюда может включаться и монолог. Границы КА обычно определяются достижением некоторой стратегической (для данного акта) цели. В случае, если она не достигается, акт общения квалифицируется как неудачный.



Основные компоненты КА, различающиеся по своей сущности, могут быть представлены схематично следующим образом:

1. Коммуниканты: Ki, Ка, Кз, ..., Кп- *

2. Коммуникативный текст (в случае диалога— •5. Практические диалогический текст). • цели (ПЦ).

3. Процессы вербализации и понимания. *6. Коммуникатив-

4. Обстоятельства данного КА. ные цели (КЦ).

Дадим минимальный комментарий к этой схеме.

1) Коммуниканты рассматриваются как автоматы с определен­ным внутренним устройством, с особой организацией субъективных банков информации — знаний, представлений, образов, чувств.

2) Коммуникативный текст состоит из речевых произведений (более или менее развернутых реплик), которые поочередно созда­ются коммуникантами.

3) Психолингвистические процессы общения сводятся к двум принципиально различным, но тесно взаимосвязанным видам — вербализации и пониманию (начальный этап первого из них — формирование коммуникативного замысла — мог бы, видимо, рас­сматриваться и как относительно самостоятельный процесс).

4) Обстоятельства КА — это общий деятельностный контекст КА, включающий как непосредственный акт совместной деятель­ности, так и привходящие, фоновые обстоятельства (по своей при­роде мир обстоятельств распадается на физическую сферу и психо-социосферу).

Пятый и шестой компоненты КА выделены на схеме особо, так как они являются сквозными, связующими и пронизывают все другие компоненты.

5) Практические цели вытекают из хода той практической деятельности, в которую включен КА.

6) Коммуникативные цели — это намерения, придающие осмыс­ленность обращению коммуниканта к своему партнеру.

По сути, каждое РП — это средство воздействия на окружение (на партнера и через него — на другие элементы действитель­ности, физические или ментальные). ПЦ осуществляются через посредство КЦ. И те и другие могут быть в пределах фиксиро-

14

ванного КА стратегическими или тактическими. В соответствии с приведенной схемой КА, мы можем говорить о комплексных моделях КА в целом или моделях его отдельных компонентов. За­метим, что элементарным тактом КА является вербализация или понимание некоторого речевого произведения.



С прикладной, да, пожалуй, и с теоретической точки зрения одним из важнейших принципов моделирования КА следует счи­тать принцип зависимости моделей от т и п а акта общения. Реаль­ные компьютерные системы не претендуют на безграничную универ­сальность, а моделируют определенные типы общения. Эти послед­ние тесно связаны с принятым в прикладной лингвистике поня­тием подъязыка, означающим совокупность тех языковых средств, которые необходимы и достаточны для построения и понимания текстов определенной ,,сферы общения" (термин, часто употреб­ляемый М. М. Бахтиным [3]). Именно в этом смысле и Л. Витген-штейн говорил о ,,типах языка" в соответствии с ,,формой жизни" или ,,типом языковой игры" [8]. Носители определенного подъязы­ка образуют коммуникативный социум. Его представители гораздо легче понимают друг друга, чем носители данного подъязыка и „неспециалисты". Ниже мы останавливаемся подробнее на принци­пах типологической систематизации коммуникативных актов. Здесь же остается заметить, что типология диалогов может служить базой и для типологии монологических текстов, создаваемых при так называемом „разорванном общении"; ср. приказы, инструк­ции, объявления, справочники и т. д. (все они имеют, конечно, и коммуникативно-целевые характеристики). М. М. Бахтин писал по этому поводу: «Сложные по своему построению и специализирован­ные произведения различных научных и художественных жанров при всем их отличии от реплик диалога по своей природе являются такими же единицами речевого общения... Произведение, как и реплика диалога, установлено на ответ другого (других), на его активное ответное понимание, которое может принимать разные формы... Произведение — звено в цепи речевого общения...» [3, с. 445].

Ниже представлены основные группы признаков, которые могли бы служить исходной теоретической базой при осмыслении всего диалогического пространства, а также при разработке детальной типологии КА для тех или иных ограниченных подъязыков. Если стремиться использовать термин „жанр", то его можно приравнять к нашему понятию „тип диалога", или, иначе говоря, к той сущности, которая задается выбором конкретных признаков и их значений (ниже мы приводим примерные группы таких признаков). Заметим, что М. М. Бахтин, говоря о «речевых жанрах» применительно к высказываниям, приравнивал их к «относительно устойчивым типам высказываний» (3, с. 428].

15

Подчеркнем, что нами предлагаются лишь группы признаков, а исчисление самих конкретных признаков (и тем более их зна­чений)—дело особого кропотливого исследования, причем неиз­вестно, может ли оно быть выполнено на глобальном уровне (впол­не возможно, что перечень признаков и их значений целесообразно создавать, изучая диалогическую реальность отдельно в разных подъязыках). Предлагаемые группы таковы:



1. Сфера общения. Это первый вид признаков не только по номеру, но и по важности; именно его всячески выделял Бахтин;

в признаках этой группы прямо или косвенно отражается круг потенциальных участников диалога, виды удовлетворяемых ими жизненных функций (как индивидов и как членов социума).

2. Место, в котором происходит диалог (имеется в виду со­циальный статус места, например цех завода, справочное бюро, кабинет министра, трибуна пресс-конференции и т.п.).

3. Вид практической деятельности, частью которой является данный диалог.

4. Характеристика коммуникантов и их взаимоотношений (эта группа признаков чрезвычайно богата информацией, которую можно учесть при классификации диалогов; сюда входят: социально-пси­хологический тип каждого коммуниканта, социальные соотношения между ними, степень знакомства и опыт предшествующего взаимо­действия, степень активности в данном диалоге, характер активности, эмоциональный настрой).

5. Хронологический период, к которому относится данный диалог.

6. Тип стратегической практической цели каждого коммуниканта (важно, когда эта ПЦ является общей для партнеров, например:

выполнить определенную производственную операцию, понять при­чину взрыва, выработать приемлемое для обеих сторон определение некоторого понятия, как можно больше разозлить друг друга и т. д.).

7. Тип стратегической коммуникативной цели (КЦ) каждого коммуниканта (например: информирование, разъяснение, инструк­таж, проверка знаний, уничижение, спор в поисках истины, совмест­ное вспоминание и т. д.).

8. Тематика диалога (здесь, в частности, различаются моно­тематические и политематические диалоги).

9. Характер информации, развертываемой в диалогическом тек­сте (обобщающая — конкретная; прямая — эвфемическая; каче­ственная—количественная; различная по модальности и т.д.).

10. Объемные характеристики диалогического текста в целом и отдельных составляющих его речевых произведений (измерение может быть в словах, в предложениях, в символах, во времени и др.).

11. Композиция диалога (схемы диалогического текста, отра­жающие динамику общения на уровне чередования тактических КЦ)

12. Речевой стиль. (Эта группа признаков связана с принципа-

16

ми выбора языковых средств из потенциально приемлемых для данной тематики и данной стратегической КЦ, то есть предпочте­ние одних, а не других из бесчисленных вариантов перифразирования: телеграфный стиль, педантичный стиль, цветастый стиль, мутный стиль и т. п.).



13. Степень искусственности «языковой игры» (в смысле Вит-генштейна). (Здесь учитываются различные степени неискренности в проведении диалога, а также, например, принадлежность диалога к реальности или к фантазии художника).

Эти группы признаков предварительно проверялись нами на ма­териале диалогов из художественной литературы, разговорной ре­чи, протоколов человеко-машинного общения.

Названные нами базовые понятия комплексной теории моделей общения и важнейшие признаки типологии коммуникативных актов позволяют последовательно и объективно подходить к тем или иным конкретным компьютерным моделям общения. В целом можно сказать, что интенсивный научный поиск затронул сегодня все основные участки огромного исследовательского пространства, именуемого ,,моделированием общения". Но продвижение на разных участках идет неравномерно. Во-первых, это связано с ограниченностью сил и часто случайным их распределением. Во-вторых, с разной степенью трудности тех или иных проблем. В-третьих, с многообразием типов общения (ведь решенность какой-то проб­лемы для одного типа диалога далеко не всегда означает ее ре­шенность для всех других типов). В-четвертых, с изменением прио­ритетов тех или иных задач в зависимости от сегодняшних инте­ресов общества („социальный заказ").

III


Как же отразился огромный поток литературы по компьютер­ному моделированию речевого общения в предлагаемом вниманию читателя сборнике? Из называвшихся выше основных проблем теории моделей общения более всего представлены на страницах этой книги три: проблема понимания, проблема знаний и проблема коммуникативных неудач. Это не случайно. Именно эти аспекты человеко-машинного общения привлекают в последнее время наибольшее внимание ученых и специалистов по внедрению за рубежом. Без работающих моделей этих аспектов коммуникации невозможна реальная эксплуатация никаких промышленных систем. Действительно, компьютер должен прежде всего понимать че­ловека с достаточной степенью полноты и глубины, чтобы быть сметливым, предупредительным, пунктуальным, но не обременитель­ным помощником в разнообразных видах практической деятель-

17

ности. (Высокая степень мастерства в вербализации, в выражении своих знаний на безупречном естественном языке тоже важна для нормальной эффективной коммуникации, но ее моделирование может быть отодвинуто во времени на несколько более поздний срок: на первых порах компьютер будет чаще реагировать на команды не словом, а действием, а в других случаях выражать свои знания на искусственном или полуискусственном языке.) Столь же неотложной, сколь и проблема понимания, является, конечно, задача организации и представления знаний, участвую­щих в понимании языковых сообщений и вопросов, и далее — в фор­мировании решения, в выполнении задания. Без знаний не может действовать ни человек, ни компьютер,— во всяком случае, дей­ствовать разумно и с опорой на социально отработанный опыт (а последний, как известно, откладывается в виде знаний). Прак­тика создания многочисленных лингвистических процессоров привела в самое последнее время и к осознанию того, что неизменным спутником процесса понимания являются коммуникативные неудачи и что поэтому они должны стать предметом специального исследования. Тем самым наряду с теорией понимания и теорией знаний возникает теория способности противостоять коммуника­тивным неудачам, или теория коммуникативной надеж­ности. Ясно, что без успехов в этом направлении невозможно внедрение лингвистических процессоров в промышленные системы. Все три указанных проблемы (в общеметодологическом плане давно выделенные нашими выдающимися мыслителями — об этом см. ни­же) обострились, повторяем, в самое последнее время лишь благо­даря интенсивной (и часто весьма малоутешительной по своим результатам) практической работе, внутренним двигателем которой является требование глобальной компьютеризации — требование современного этапа научно-технического прогресса. (Заметим, кста­ти, что этот этап был весьма точно предсказан как неизбежный К.Марксом, и нам уже доводилось об этом писать (9, с. 10—11].) Три названных проблемы преобладают в потоке публикаций по компьютерному моделированию общения, и они присутствуют в том или ином виде в каждой из статей, включенных в данный сборник, хотя, конечно, теоретическое и методологическое содержа­ние статей ни в коей мере этим не ограничивается.



Каждая из работ отражает комплексный подход к компьютер­ному моделированию того или иного коммуникативного явления. Хотя статьи очень разные по широте охвата соответствующих фактов и по глубине их разработки, каждая из них являет собой пример многомерного исследования, каковым и должно быть исследование сложных коммуникативных процессов. По времени своего появления это работы, опубликованные в последние пять лет, а большинство — в последние 2-3 года. Тем самым они

18

пока­зывают логику научного поиска именно на данный момент — мо­мент, являющийся в определенном смысле переломным: доказана принципиальная возможность моделирования понимания на ЭВМ, выявлена решающая роль знаний в этом процессе, установлена необходимость моделировать целостный процесс общения как вид совместной деятельности, осмыслен ,,японский вызов" (проект машин 5-го поколения), разработана стратегия развития теории и практики искусственного интеллекта, и вот теперь происходит оценка намеченных ранее путей компьютерного моделирования общения и ведется напряженный поиск ,,болевых точек" и слабых мест в существующих моделях коммуникативных процессов.



Все работы, включенные в сборник, выполнены учеными США. Как правило, это исследования, осуществляемые в рамках весьма серьезных прикладных проектов, хотя в статьях теоретические положения и работа программ иллюстрируются зачастую на ,,иг­рушечном материале". Для облегчения ориентации читателя в многоаспектном содержании сборника полезно дать сжатую ха­рактеристику идейной основы каждой из представленных статей.

Р. Шенк, один из ведущих зарубежных специалистов по линг­вистическим проблемам искусственного интеллекта, вместе со своими соавторами Л. Бирнбаумом и Дж. Меем стремится окончательно утвердить такой подход к моделированию процесса понимания, который основан на интегральном представлении и исполь­зовании знаний. Из этого подхода вытекает принципиальная невоз­можность разделения семантики и прагматики. Хотя Шенк прямо не говорит о коммуникативных неудачах, фактически именно эта опасность заставляет его выдвинуть идею обязательного исполь­зования „больших структур" знаний (типа сценариев, так назы­ваемых „конфигураций" (или пакетов) организации памяти или других крупных блоков). Именно знания „высших уровней" позво­ляют делать необходимые умозаключения для того, чтобы связать высказывания, разделенные сплошь и рядом теми или иными „логи­ческими пропусками".

Статья Дж. Карбонелла и Ф. Хейза представляет собой одну из попыток дать общую систематизацию типов коммуникативных неудач, начиная с низших уровней языка (орфографические ошибки) и кончая высшими уровнями семантического анализа. Авторы оце­нивают эффективность различных инструментов преодоления воз­никающих неудач, основываясь на опыте своей работы в универ­ситете Карнеги—Меллон, где лингвистическое обеспечение разра­батывалось ими для системы управления материально-техническим снабжением. Ученые выделяют те ситуации, когда уместен прояс­няющий диалог между компьютером и пользователем.

Далее в сборнике помещены шесть статей, посвященных ис­следованию конкретных путей моделирования понимания с одновре-

19

менным вниманием к проблеме выявления и преодоления коммуника­тивных неудач (или, другими словами, к проблеме обеспечения надежности понимания). В. Ленерт, М. Дайер, П. Джонсон, К. Янг и С. Харли знакомят с опытом создания системы понимания коротких рассказов с использованием нескольких типовых структур предста­вления знаний высшего уровня. Статья М. Селфриджа описывает ин­тегральный процесс понимания команд и указаний на естественном языке в ситуации робота, выполняющего сборку некоторого аппа­рата (в данном случае — рубильника). Более глубокое проникнове­ние в один из частных процессов в подобной ситуации демонстри­рует статья Б. Гудмана. Имеется в виду такой частный процесс, как референция (и, соответственно, идентификация референта). Здесь материалом служили реальные сложные диалоги, полученные в экспериментах с участием людей. Оказалось, что компьютерная модель процесса референции должна использовать большое разнооб­разие типов знаний, но опять же в режиме их интегральной обра­ботки. Весьма существенный источник коммуникативных неудач — неадекватные представления системы о пользователе. Типы таких неадекватностей рассматриваются в статье С. Карберри (примени­тельно к задачам экспертной системы). Стратегия и тактика при­влечения пользователя к настройке системы на его знания и зада­чи исследуется в статье Б. Балларда. Наконец, из работ, рассмат­ривающих прежде всего вопросы понимания (анализа), последняя по порядку статья — это работа Ф. Хейза, А. Гауптмана, Дж. Карбонел-ла и М. Томиты о специфике анализа устной речи. Авторы обосновы­вают соединение результатов акустического анализа с фреймовым подходом к семантической обработке сообщения. Это позволяет су­щественно повысить надежность распознавания речи.



В настоящем сборнике, к сожалению, нашлось место только для одной (правда, весьма основательной) статьи по вопросам вербализации коммуникативного замысла (или синтеза текста). Автор ее К. Маккьюин на примере экспертной системы показывает способ моделирования такого важного этапа вербализации, как выбор дискурсивной (или коммуникативно-целевой) структуры син­тезируемого текста (в качестве такого текста здесь выступает спра­вочная информация экспертной системы).

Заключает сборник обзорная статья Дж. Слокума по проблема­тике машинного перевода. Для нас здесь существен итоговый вывод автора о том, что сегодня наметилась тенденция приближения работ по машинному переводу к освоению опыта компьютерной лингвистики в широком смысле слова. И здесь, очевидно, ключевыми явятся все те же проблемы понимания, знаний, коммуникативных неудач. Прав­да, в случае машинного перевода повышается актуальность пробле­мы синтеза текста. Впрочем, как отмечает Дж. Слокум, часто машинный перевод ориентируется на активное участие человека-

20

постредактора, который берет на себя задачу окончательного оформ­ления выходного текста.



IV

В заключительных разделах нашей статьи мы считаем полезным специально остановиться на тех трех проблемах, которые, как ука­зано выше, преобладают в потоке литературы по компьютерной линг­вистике и в статьях настоящего сборника. Это проблемы коммуни­кативных неудач, коммуникативных процессов и представления зна­ний. Мы ставим на первое место коммуникативные неудачи (КН) не случайно. Эта проблема проходит сквозной нитью через все без исключения статьи сборника. Ей уделяется особое внимание во всех крупных зарубежных проектах, связанных с созданием лингвис­тических процессоров любой ориентации,— будь то интерфейсы к ба­зам данных, работающие в режиме диалога на естественном языке, или системы обработки больших массивов текстов. Техническое пре­ломление этой проблемы сводится к сознательной разработке теории надежности применительно к языковым процессорам. Настало время разобраться в причинах сбоев, которым подвержены системы первых поколений. И вот появляются обобщающие работы по проблеме КН, концентрируются мощные исследовательские усилия, чтобы разрабо­тать эффективные «противоядия» для преодоления КН [33]. В насто­ящем сборнике систематическому рассмотрению КН посвящены статьи Дж. Карбонелла и Ф. Хейза, М. Селфриджа, Б. Гудмана, Сандры Карберри.

Проблема КН носит глобальный характер: фактически все рабо­ты по составлению алгоритмов и программ для анализа и синтеза текста направлены на предупреждение, выявление или преодоление КН. Изучение этой проблемы в явном виде позволяет увидеть рель­ефно наиболее уязвимые места в моделях общения, наметить перво­очередные задачи и методы их решения.

В процессе эксплуатации экспериментальных и промышленных систем человеко-машинного общения выяснилось (а точнее, было заново осознано), что язык человека весьма и весьма далек от идеальных логических схем. Подсчеты показали, что более 25% вы­сказываний человека-пользователя, обращающегося к интерфейсу, построены неправильно. Но и в случае правильных высказываний многие свойства человеческих слов и их сочетаний, о которых мы упоминали в начале нашей статьи, создают потенциальные источ­ники для непонимания текста машиной. Каковы наиболее распрост­раненные особенности человеческого общения, заставляющие ученых и программистов форсировать решение проблемы КН? К этим особенностям прежде всего относятся: неточные высказывания, не­правильно построенные выражения, слишком сложные по структуре сообщения, разнообразные способы сокращения речи, приблизитель-

21

ность выражения информации, имплицитность многих сведений, су­щественных для понимания речи. В США работу в области компью­терной лингвистики ведут 67 университетов, и большинство из них включило в свои исследовательские программы проблему КН. Это красноречивое свидетельство в пользу актуальности данной про­блемы.



А нова ли эта проблема для отечественной теоретической лин­гвистики? Вспомним, что в том же 1923 г., когда вышла классичес­кая работа Л. П. Якубинского о диалоге [30], появилась и статья А. М. Пешковского, в которой он писал: «В литературном наречии... все всегда и везде говорят в той или иной степени непонятно. Это может показаться парадоксом, но я прошу вспомнить любое собрание, любой доклад, любой спор. Разве не обращаются всегда к докладчику с просьбой разъяснить то или иное положение (причем вопросы обличают зачастую полное непонимание вопро­шателей), разве не занимаемся мы в наших спорах преимущественно выяснением того, что мы «хотим сказать» или «хотели сказать», и разве не расходимся в результате всех этих выяснений часто глу­боко непонятыми и непонимающими? Я прошу вспомнить, сколько времени тратится в наших спорах на действительное выяснение исти­ны и сколько на устранение словесных недоразумений, на уговор о значении слов...; прошу вспомнить, сколько времени тратится юристами на выяснение смысла того или иного свидетельского показания, того или иного закона; прошу вспомнить, сколько людей в науке, в поэзии, в философии, в религии заняты исключительно толкованием чужих мыслей, выраженных подчас самими твор­цами как будто классически ясно и просто, но тем не менее всегда создающих целый ряд толков, сект, течений, направлений и т. д.;

прошу все это вспомнить — и читатель согласится со мной, что затрудненное понимание есть необходимый спутник литературно-культурного говорения» [25, с. 56—57].

И вот теперь наступает время, когда мы, наконец, должны не только «согласиться» с А. М. Пешковским, но и строить действу­ющие компьютерные модели языкового взаимодействия, несмотря на этот его постоянный спутник—«затрудненное понимание» [II].

Следует отметить, что, помимо КН в собственном смысле слова, участников общения подстерегают и различного рода недоразу­мения, шероховатости, связанные с недостаточной внимательностью, предупредительностью, кооперативностью партнеров по общению [2;12;24]. Вот пример человеко-машинного диалога, в котором, казалось бы, все в порядке с грамматической и лексико-семанти-ческой точек зрения (здесь П—пользователь, С—система):

П: Кто из студентов получил оценку «удовл.» по курсу про­граммирования весной 1979 года?

С: Никто.

22

П- Есть ли студенты, которые не сдали программирование весной 1979 года?



С: Нет.

П: Сколько студентов сдало программирование весной 1979 года?

С: Нисколько.

П: Сдавали ли программирование весной 1979 года?

С: Нет.

От теоретического и экспериментального изучения КН к созданию программных средств выявления и преодоления КН в ходе диалога — таков путь совершенствования старых и создания новых практических моделей общения.



Диалог представляет собой чередование речевых произведе­ний (РП), создаваемых коммуникантами (Ki и К2). Вспомним, что каждое РП — это средство воздействия на окружение (на партне­ра по коммуникации и через него — на другие элементы действи­тельности). Поэтому коммуникативную неудачу можно определить как такой сбой в общении, при котором определенные РП не вы­полняют своего предназначения. Иначе говоря, те или иные эле­менты РП как инструкции по преобразованию окружения не реали­зуются (в связи с их непониманием, игнорированием, ложным ис­толкованием и т.д.). Следует отличать собственно КН от фактов употребления неправильно построенных высказываний (такие выска­зывания не всегда приводят к КН), от коммуникативных трудностей и „неудобств".

Суммируем основные принципы типологии коммуникатив­ных неудач, вытекающие из обобщения существующих классифика­ций. Следует признать, что задача полного исчисления КН пока не может получить исчерпывающего решения в силу того, что данная проблема теснейшим образом связана со всей теорией моделей об­щения. А если учесть, что максимально конкретные виды КН во многом зависят от привязки к той или иной сфере человеческого общения, то всеобъемлющее описание типов КН вряд ли возможно и в обозримом будущем. Однако важнейшие типы КН ясны уже сей­час, и их планомерная систематизация поможет развитию эффек­тивных методов их преодоления. Множество возможных КН пред­ставляет собой многомерное пространство. При характеристике каж­дой КН ( в составе конкретного диалога) следует учитывать два основных критерия: последствия КН и источники КН. Конкретная КН может быть простой или сложной (по числу ее последствий и источ­ников).

Например, с точки зрения последствий КН могут быть глобаль­ными и частными. В случае глобальной КН происходит окончатель­ное прерывание развертываемого диалогического текста («Разго­вора не получилось»), или доведенный до „конца" диалог по сво-

23

им результатам неудовлетворителен (как в случае некоторых науч­ных дискуссий). Частные КН вызывают временные задержки в раз­вертывании диалога, когда коммуниканты вынуждены отклоняться от главной линии диалогического текста с целью преодоления воз­никших КН. Для классификации КН существенно различать ком­муникативные цели (КЦ) и практические цели (ПЦ), стратегические и тактические цели в диалоге. Например, выделяется класс КН, имеющих следствием невыполнение совместной стратегической ПЦ коммуникантов («Поговорили, поговорили, а воз и ныне там»). Существует и целый ряд других типов.



Разветвленная типология КН с точки зрения их источников стро­ится следующим образом. Прежде всего разграничиваются крите­рии, связанные с инструментами и процессами общения (хотя это разграничение условно, оно удобно на практике). В первом случае имеются в виду, в частности, расхождения в организации языковых тезаурусов коммуникантов в их словарном запасе, в дефинициях лексических значений, в банках знаний о мире и т. д. С точки зрения процессов КН могут быть связаны с неудачной вербализацией замысла со стороны Ki, с несовершенством ме­ханизма понимания у К2, а также с соотношением этих про­цессов: вербализация Ki недостаточно эксплицитна для тех средств, которыми пользуется при понимании К2.

Трудности, приводящие к КН, могут иметь место на разных уровнях понимания: здесь различаются морфологический анализ, синтаксический анализ (включая эллипсис, анафорические связи), разрешение полисемии, установление семантических связей, рефе-ренционная увязка, распознавание истинностных и модальных зна­чений высказываний, определение КЦ партнера, коммуникативная организация смысла высказывания, выявление пресуппозиций, ана­лиз многофакторной прагматической информации высказывания для данной ситуации общения (отношения коммуникантов, различные виды умолчаний, коммуникативные импликатуры, вероятные ПЦ, в частности выражаемые перформативами, а также вытекающие из ПЦ планы партнера). Все эти уровни дают примеры КН в аспекте понимания отдельного высказывания. Ряд уровней понимания имеет и РП в целом (ведь в общем случае РП состоит из нескольких вы­сказываний).

Что касается вербализации, то этот процесс имеет несколько иную этапность. Здесь следует особо выделить большой внут­ренне разветвленный класс КН, связанных с начальным этапом вербализации. Это КН, обусловленные неправильным выбором замы­сла, в частности КЦ и ПЦ, которые не соответствуют ситуацион­ному контексту, то есть нарушают различные условия успешности (прежде всего прагматические пресуппозиций: РП становится неу­местным).

24

Кроме упомянутых «ближайших» источников КН, необходимо указать на «отдаленные» источники КН: рассеянность коммуникан­та, предвзятость, мнительность, необычность темы и т. д.



Из огромного разнообразия источников КН в настоящем сборнике детально разбираются лишь некоторые, но особенно важные с точки зрения человеко-машинного общения. Эти источники могут быть связаны с процессом референции (см. статью Б. Гудмана) с установлением семантических связей в тексте (см. статьи М. Сел-фриджа, Б.Балларда), с представлениями о знаниях пользователя (см. статью Сандры Карберри), с нечеткостью распознавания от­дельных единиц речи (см. статью Ф. Хейза, А. Гауптмана и соавто­ров) и с рядом других причин.

V

Проблема моделирования коммуникативных процессов охватыва­ет два круга явлений, которые были обозначены выше термина­ми «понимание» и «вербализация». Хотя мы и говорили о большей прикладной актуальности первого из них, следует подчеркнуть их принципиальную взаимосвязь. Их связывает категория общения, и в то же время само общение зависит от этих двух фундаменталь­ных процессов и складывается из них. В 1940 г. С. О. Карцевский пи­сал: «Фраза есть функция диалога.» [18, с. 86], подчеркивая тем самым зависимость построения и понимания любой фразы от контекста общения. И позже столь же определенно высказался М. М. Бахтин по поводу процесса понимания: «Понимание всегда в какой-то мере диалогично» [4, с. 482]. Это значит, что, моделируя понимание, мы должны постоянно иметь в виду «историю вербали­зации» данного сообщения и, с другой стороны, часто возникает необходимость «вербализовать наше понимание», чтобы проверить его правильность. Говорение и понимание оказываются связанными через рассмотренную нами выше категорию коммуникативных не­удач: потенциальная опасность сбоев общения регулирует оптималь­ное соотношение этих процессов, которое было точно определено Е. Д. Поливановым еще в 1916 году: «В сущности все, что мы го­ворим, нуждается в слушателе, понимающем, «в чем дело». Если бы все, что мы желаем высказать, заключалось бы в формальных значениях употребленных нами слов, нам нужно было бы упот­реблять для высказывания каждой отдельной мысли гораздо более слов, чем это делается в действительности. Мы говорим только не­обходимыми намеками.» [26, с. 296]. Именно эти идеи и воплощают­ся в современных компьютерных моделях, описанных, в частности, в настоящем сборнике (см. особенно статьи М. Селфриджа; Кэтлин Маккьюин; Ф. Хейза, А. Гауптмана, Дж. Карбонелла, М. Томиты).



25

Понимание и вербализация относятся к числу базисных категорий теории моделей общения. Деятельностный подход к естественному языку обрел осязаемую реальность в связи с оформлением компью­терной семантики — дисциплины, моделирующей семантическую спо­собность человека в широком смысле: это и способность понимать текст, и способность вербализовать коммуникативную потребность, и способность осуществлять различные другие процессы речемысли-тельной деятельности, подчиненные указанным двум главным. Важнейшие практические проблемы компьютерной семантики — раз­работка семантических алгоритмов (прежде всего блоков анализа и синтеза), а также соответствующих семантических метаязыков. Понимание и вербализация связаны не только с коммуникатив­ной, но и со всеми другими функциями языка (в определенном смысле и познание можно трактовать как чередование процессов понимания и вербализации). Завершенные модели речевой деятель­ности неизбежно представляют собой описание того комплексного, но единого механизма, который осуществляет взаимосвязь воспри­ятия, мышления и языка.

Понимание и вербализация — два вида функционирования язы­кового механизма, и трудно говорить о приоритете одного из них: с одной стороны, вербализатор (говорящий или пишущий) вступает в коммуникацию для того, чтобы быть понятым; с другой стороны, понимающий (слушающий или читающий) стремится вычислить то, что хотел вербализовать его партнер по общению. Имеет место закономерное чередование этих двух элементарных тактов диалога. Опорным звеном, соединяющим эти два процесса, является катего­рия знаний: их переработка, хранение, осмысление, передача, усвое­ние и составляют сущность общения.

Несмотря на отмеченную тесную взаимосвязь понимания и вер­бализации, в разных коммуникативных ситуациях может преобла­дать один из этих процессов (особенно если мы включим в рас­смотрение внутреннюю речь и случаи разорванной коммуникации), и уж, конечно, весьма различной может быть значимость этих про­цессов для тех или иных прикладных моделей. Чрезвычайно важным и с теоретической, и с практической стороны представляется ис­следование и моделирование типов понимания и типов вербализации.



Понимание можно определить как извлечение («вычисление») из текста некоторой совокупности знаний. Исходный вопрос типо­логии понимания: какие факторы и в какой мере задействованы в данном процессе? Человек использует два основных класса когни­тивных средств: собственно языковые и прагматические. Первый класс — это знания, закрепленные в семантике языка; второй — это практические цели, направляющие использование неязыковых знаний в сочетании с языковыми. Понимание происходит на разных уровнях и характеризуется разной степенью приблизительности в

26

зависимости от целеустановки (интегральный процесс понимания управляется механизмом «интереса»). Многофакторность и актив-Мость понимания составляют его фундаментальные свойства (ср. [1; 29; 36; 41).



Вербализация (переход от коммуникативной потребности к тексту) также носит активный и многофакторный характер. Типо­логия вербализации должна учитывать генезис и характер комму­никативной потребности (ср. вербализацию прошлого опыта, про­читанного или услышанного, доказательного рассуждения, бессозна­тельных движений психики и т.д.), а также чисто языковые пути воплощения замысла в текст (см., например, [31]).

И в понимании, и в вербализации необходимо разграничивать собственно процессы и инструменты. Последние, видимо, могут быть во многом общими. В качестве моделей таких инструментов выступают, например, семантические сети, информационные теза­урусы, шаблоны умозаключений, сценарии и планы.

Рассматривая виды понимания с точки зрения их реализации, можно говорить, с одной стороны, о практически важных „режи^ мах" понимания, а с другой стороны — о типологии носителей языка по характерному для них виду понимания. Аналогичные соображения применимы и к вербализации. Они же применимы и к общению в целом.

Что касается выбора способов описания рассматриваемых про­цессов, то здесь стала ясна необходимость четко различать объ­яснительные и прикладные модели: они выполняют разные функции и поэтому должны подчиняться разным требованиям. Яркий тому пример — компьютеризованный диалог в рамках человеко-машин­ного симбиоза. Глубина понимания, полнота вербализации, степень взаимной обратимости (зеркальности) этих двух процессов определя­ются здесь эффективностью практического взаимодействия.

VI

А теперь зададимся вопросом: какая категория оказывается все-таки наиболее фундаментальной при компьютерном моделиро­вании общения? Все предшествующие наши рассуждения, думается, вполне определенно подводят нас к мысли об особой, ключевой, роли категории знаний. Ведь и понимание, и вербализация — это процессы переработки знаний [14; 27]. А коммуникативные неуда­чи — это нарушения «естественного» процесса обмена знаниями.



Значит, при создании компьютерных моделей общения, любых языковых процессоров должны решаться задачи представления, ор­ганизации, использования знаний разных типов. И это наглядно видно из материала настоящего сборника. Особенно подробно виды знаний рассматриваются в статье Б. Гудмана. Вопросы представле-

27

ния знаний на разных уровнях их обобщенности обсуждаются в статьях Венди Ленерт и др., а также Кэтлин Маккьюин. Проб­лема интеграции знаний разных типов исследуется Р. Шенком и его соавторами, а также М. Селфриджем.



Проблема знаний, выдвинутая на передний план теорией ис­кусственного интеллекта [16; 34], на самом деле тесно связана с таким традиционным лингвистическим понятием, как метаязык. Ведь задача представления знаний — это задача создания семантических метаязыков. Это актуальнейшая проблема самой лингвистики как науки. Если мы располагаем сильными метаязыками фонетического и морфологического уровней (ср. фонетические, фонологические, морфонологические транскрипции), то для семантики языка имеется пока еще очень и очень бедный арсенал средств, которые позволяли бы эксплицитно фиксировать содержательную сторону речевых про­изведений. А ведь семантический метаязык — неотъемлемый инстру­мент исследования языка в его когнитивном и коммуникативном аспектах. Он есть необходимая составная часть метода моделиро­вания, применяемого к языку.

Разновидностью семантических метаязыков можно считать и ин­формационные языки (ИЯ). Последнее понятие мы трактуем здесь в более широком смысле, чем в старой информатике. Оно вклю­чает языки, используемые для обработки информации в широком классе интеллектуальных систем. Именно широкое понимание ИЯ способствует повышению их семантической силы, то есть позволяет развивать параллельно разные варианты ИЯ с их поэтапным со­вершенствованием, усложнением семантической структуры, что в итоге определяется практическими задачами по внедрению машин в процессы языковой коммуникации.

Знаменательно при этом само включение ИЯ в класс семанти­ческих метаязыков. Это означает использование в информационной работе всего арсенала теоретических и методических средств при­кладной семантики. Можно утверждать, что главный вывод из теории и практики современных исследований по компьютерной лингвистике состоит в следующем: ключевая проблема машинного моделиро­вания языковых процессов — это проблема метаязыков [5; 6; 7;

28]. Даже такая важнейшая проблема, как автоматизация про­цесса анализа (понимания) текста должна быть поставлена, на наш взгляд, на второе место. Ибо процессы анализа сводятся к пере­записи информации на тех или иных метаязыках. Все алгоритмы анализа текста — как новейшие, так и двадцатилетней давности,— состоят из двух частей: собственно операционных правил и средств записи двоякого вида информации (константной и переменной, или текущей). Эти средства целиком и полностью определяют содержание, логику и степень сложности системы правил. Более того, наблюдается тенденция еще более тесного слияния метаязыков

28

правил: для записи языковой информации применяются метаязыки алгоритмического характера, то есть не структурные, а алгоритмические репрезентации. Описание языковой единицы на таком метаязыке читается как программа действий, которые надо со­вершить с речевым отрезком, включающим данную языковую еди­ницу (ср. программистский подход к описанию семантики в из­вестной книге Т. Винограда [7]). Однако и в таких работах проводится четкое различие между правилами и лежащими в их основе структурными репрезентациями. Иначе говоря, и в мета­языках алгоритмического характера предусматривается базовый метаязык структурной репрезентации. Например, словарная статья глагола быть может быть программой, определяющей по контексту функцию этого слова, но в основе этой программы лежит метаязык, описывающий структуры различных конструкций с глаголом быть.



Упомянутые метаязыковые средства, на которых основывается работа алгоритмов, фиксируются в машинных словарях, таблицах, машинных форматах для записи различных видов информации, в структуре так называемой базы данных.

Думается, направления научного поиска и результаты ком­пьютерных экспериментов, представленные на страницах настояще­го сборника, будут полезны для различных категорий советских читателей: лингвистов, занимающихся вопросами методологии и те­ории языкознания; лингвистов прикладного профиля, работающих в той или иной сфере практики; лингвистов, стремящихся к ком­пьютеризации своих исследований; студентов и аспирантов, изу­чающих основы информатики; представителей технических наук, все более опирающихся на данные лингвистики; философов, логи­ков, психологов, разрабатывающих комплексные модели человека с учетом «таинственного языкового фактора». Сегодня неуклонно растет число тех, кого интересует речевое общение с его неиз­менным спутником — потенциальными коммуникативными неудача­ми. Интересует как предмет познания и как предмет совершенст­вования. Кому-то материалы сборника подскажут решение конкрет­ной проблемы, кому-то дадут пищу для теоретических размышле­ний, а кого-то заставят по-новому оценить реальную сложность стоящей перед нами задачи — задачи всесторонней компьютериза­ции делового общения на естественном языке.



Б. Ю. Городецкий

29

Литература



1. А л л е н Дж. Ф., П е р р о Р. Выявление коммуникативного намерения, содер­жащегося в высказывании.— В сб.: „Новое в зарубежной лингвистике", вып. XVII (Теория речевых актов). М., 1986.

2. Арутюнова Н. Д., Падучева Е.В. Истоки, проблемы и категории праг­матики.— В сб.: „Новое в зарубежной лингвистике", вып. XVI (Лингвистическая прагматика). М., 1985.

3. Б а х т и н М. М. Проблема речевых жанров.— В кн.: Б а х т и н М. М. Литера­турно-критические статьи. М., 1986.

. 4. Бахтин М. М. Проблема текста в лингвистике, филологии и других гума­нитарных науках. Опыт философского анализа.— В кн.: Бахтин М. М. Литератур­но-критические статьи. М., 1986.

5. Белоногов Г. Г., Кузнецов Б. А. Языковые средства автоматизирован­ных информационных систем. М., 1983.

6. Белоногов Г. Г..Новоселов А. П. Автоматизация процессов накопле­ния, поиска и обобщения информации. М., 1979.

7. Виноград Т. Программа, понимающая естественный язык. М., 1976.

8. ВитгенштейнЛ. Философские исследования.— В сб.: ,,Новое в зарубеж­ной лингвистике", вып. XVI (Лингвистическая прагматика). М., 1985.

9. Городецкий Б.Ю. Актуальные проблемы прикладной лингвистики.— „Но­вое в зарубежной лингвистике", вып. XII (Прикладная лингвистика). М., 1983.

10. Г о род е ц к и и Б.Ю. Термин и его лингвистические свойства.—В сб.: „Структурная и прикладная лингвистика", вып. 3. Л., 1987.

11. Городецкий Б. Ю., Кобозева И. М., Сабурова И. Г. К типологии коммуникативных неудач.— В сб.: „Диалоговое взаимодействие и представление знаний". Новосибирск, 1985.

12. Г рай с Г. П. Логика и речевое общение.—В сб.: „Новое в зарубежной лингвистике", вып. XVI (Лингвистическая прагматика). М., 1985.

13. Г р о м о в Г. Р. Национальные информационные ресурсы: проблемы промыш­ленной эксплуатации. М., 1985.

14. „Диалоговое взаимодействие и представление знаний". Под ред. А. С. На-риньяни. Новосибирск, 1985.

15. 3 а л и з н я к А. А. Грамматический словарь русского языка. Словоизменение. М., 1977.

16. 3 в е г и н ц е в В. А. Язык как фактор компьютерной революции.— ,,Научно-техническая информация", серия 2 (Информационные процессы и системы), 1985, № 9.



^f 17.3вегинцевВ.А. Компьютерная революция: проблемы и задачи.— „Вопро­сы философии", 1987, № 4.

18. КарцевскийС.О. Введение в изучение междометий.— „Вопросы языко­знания", 1984, № 6.

у 19. „Лингвистические задачи. Книга для учащихся старших классов". Авторы-составители: В. М. Алпатов, А. Д. Венцель, Б. Ю. Городецкий, А. Н. Журинский, А А. Зализняк, А. Е. Кибрик, А. К. Поливанова. М., 1983.

„ 20.МальковскийМ.Г. Диалог с системой искусственного интеллекта. М., ' 1985.

V 21 ,,Модели диалога в системах искусственного интеллекта". („Ученые записки Тартуского гос.университета", вып. 751. „Труды по искусственному интеллекту"). Тарту, 1987.

V 22. „Модели и системы обработки информации", вып. 4. Киев, 1985. V 23. „Моделирование языковой деятельности в интеллектуальных системах". Под ред. А. Е. Кибрика и А. С. Нариньяни. М., 1987.

24. Падучева Е.В. Тема языковой коммуникации в сказках Льюиса Кэрро-ла.— В кн.: ,,Семиотика и информатика", вып. 18. М., 1982.

30

25. П е ш к о в с к и и А. М. Объективная и нормативная точка зрения на язык.—



о кн • П е ш к о в с к и и А. М. Избранные труды. М., 1959.

26. П о л и в а н о в Е. Д. По поводу звуковых жестов японского языка.— В кн.:

Поливанов Е. Д. Статьи по общему языкознанию. М., 1968.

27 „Принципиальные вопросы теории знаний" (,,Ученые записки Тартуского гос. университета", вып. 688. „Труды по искусственному интеллекту"). Тарту, 1984.

28. Шем а к и н Ю. И. Введение в информатику. М., 1985.

29 Шенк Р., Лебовиц М., Бирнбаум Л. Интегральная понимающая система._ <Новое в зарубежной лингвистике», вып. XII (Прикладная лингвистика).

М 1983.

30. Я к у би иски и Л. П. О диалогической речи.— В кн.: Якубинский Л. П. Избранные работы. Язык и его функционирование. М., 1986.



31 Ар pelt D. Е. Planning English Referring Expressions.—"Artificial Intel­ligence", 1985, vol. 26, 1.

32. "Cognitive Constraints on Communication: Representation and Processes". Ed. bv L. Vaina, J. Hintikka. Dordrecht etc., 1984.

33. "Communication Failure in Dialogue and Discourse. Detection and Repair Processes". Ed. by R. G. Reilly. Amsterdam, 1987.

34. Н а у е s - R о t h F., W a t e r m a n D. A., L e n a t D. B. (eds). Building Expert Systems. Reading (Mass.), 1983.

35. "Human-Computer Interaction, lnteract'84". Ed. by B. Shackel. Amsterdam, 1985.

36. "Inside Computer Understanding". Hillsdale (N.J.), 1981.

37. "Language and Artificial Intelligence". Ed. by M. Nagao. Amsterdam, 1987.

38. Marcus S. Fifty-two Oppositions Between Scientific and Poetic Communi­cation.— In: "Pragmatic Aspects of Human Communication". Dordrecht, 1974.

39. "Natural Language Parsing — Psychological, Computational, and Theoretical Perspectives". Ed. by D. Dowty, L. Karttunen, and A. Zwicky. Cambridge (N. Y.), 1984.

40. "Natural Language Understanding and Logic Programming". Ed. by V. Dahl and P. Saint-Dizier. Amsterdam, 1985.



41. Norton L. M. Automated Analysis of Instructional Text.—"Artificial Intel­ligence", 1983, vol. 20, № 3.

42. "Strategies For Natural Language Processing". Hillsdale (N.J.), 1982.