Исследование перемещения окна 7 Исследование границ 8 Возвращаемся к внешней форме слова 10 Моделирование нейронных сетей 12

Как мы читаем
Подборка исследований
Перевод: Владимир Никонов
b17.ru koob.ru mindmachine.ru

Наука распознавания слов 2

Введение 2

Модель № 1: внешняя форма слова 2

Модель № 2: последовательное буквенное распознавание 4

Модель № 3: параллельное буквенное распознавание 5

Исследование перемещения окна 7

Исследование границ 8

Возвращаемся к внешней форме слова 10

Моделирование нейронных сетей 12

Заключение 15

Какой шрифт разборчивее: с засечками или без? 18

Введение 18

1. Определения 18

2. Факты 20

Аргументы в пользу шрифта с засечками 20

Аргументы в пользу шрифта без засечек 22

3. Выводы 23

Как работают глаза при чтении 27

Куда смотрят глаза при чтении 29

Наука распознавания слов

Кевин Ларсон (Kevin Larson)
Advanced Reading Technology, Microsoft Corporation
microsoft.com/typography/ctfonts/wordrecognition.aspx
Июль 2004

Введение

Факты, установленные в области когнитивной психологии за последние 20 лет, указывают на то, что слово мы распознаем по буквам, из которых оно состоит. Многие печатники и другие энтузиасты текста, которых я встречал, настаивают на том, что мы узнаем слова по контуру, образуемому внешней формой слова. Некоторые использовали термин боума (bouma) как синонимичный понятию «внешняя форма слова», хотя я не был знаком с этим термином. Термин «боума» появился впервые в книге Пола Санджера (Paul Saenger) 1997 года «Пробелы между словами: истоки чтения про себя» (Space Between Words: The Origins of Silent Reading). Из нее я, к своему огорчению, узнал, что мы распознаем слова по их внешней форме и что «современные психологи называют этот образ формой Боума (Bouma shape)».

Настоящая статья отражает точку зрения психологов, занимающихся проблемами чтения. В специализированных журналах приводятся данные, полученные в результате десятков экспериментов с четкими заданиями, так что каждый желающий может воспроизвести любой эксперимент и получить те же результаты. Статья была изначально представлена в виде лекции на конференции в Ванкувере в сентябре 2003 года.

Цель данной статьи — обзор истории развития темы: почему психологи перешли от модели распознавания слова по его внешней форме к распознаванию слова по форме буквы; другая цель — помочь читателю прийти к такому же выводу самостоятельно.

Эта публикация, хоть и относительно небольшая по объему, охватывает много тем. По ходу изложения материала я буду представлять эксперименты и модели кратко, так как боюсь, что полное описание утомит читателя. Если вы хотите получить более детальную информацию, обратитесь к ссылкам в конце статьи, там также приведен список дополнительной литературы для тех, кто заинтересуется отдельными темами.

Начну с описания трех главных моделей распознавания слов: модель внешней формы слова, модели последовательного и параллельного буквенного распознавания. Я представлю здесь характерные данные, которые приводятся в поддержку той или иной модели. После разбора всех моделей я попробую оценить каждую с точки зрения ее соответствия этим данным. И наконец, я освещу новейшие исследования в области распознавания слов и опишу более точную модель, популярную в среде психологов в последнее время.

Модель № 1: внешняя форма слова

Согласно данной модели слово распознается как целостная единица. Это самая старая модель, встречающаяся в литературе по психологии, гораздо старше самой этой литературы. Основная идея такова, что мы видим слова скорее как цельные, завершенные паттерны, чем как набор отдельных букв. Некоторые утверждают, что мы распознаем слова по комбинации элементов надстрочных (имеется в виду — над верхней линией шрифта: Ё, ё, й, б и т. д. — Примеч. пер.), подстрочных (то есть выступающие за нижнюю линию: Д, Щ, Ц, р, у и т. д. — Примеч. пер.) и без выступающих частей — нейтральных. Другие предполагают, что происходит распознавание оболочки, образуемой контуром слова.

Рис. 1. Распознавание слова по комбинации надстрочных, подстрочных и нейтральных элементов

Рис. 2. Распознавание слова по его оболочке

Паттерны слова узнаваемы для нас как образ, потому что мы видели каждый из них много раз. Джеймс Кэттел (James Cattell, 1886) первым из психологов предложил эту модель распознавания слов. Кэттел признан независимым основателем такой области, как психолингвистика, которая включает в себя и научное изучение чтения.

Кэттел поддерживал модель внешней формы слова, потому что она давала самое лучшее объяснение имеющимся экспериментальным данным. Кэттел открыл замечательный эффект, который сегодня мы называем эффектом превосходства слова. Он показывал человеку букву и слово очень короткий промежуток времени (5–10 мс) и обнаружил, что испытуемый более точно узнает слова, чем буквы. Психолог сделал вывод, что единицей распознавания является слово целиком.

По современным стандартам исследование Кэттела выглядит небрежным, но тот же самый эффект был выявлен в 1969 году Райхером (Reicher). Он показывал набор букв — частично это были реальные слова, частично нет — на очень короткий промежуток времени. Испытуемого спрашивали, есть ли в этом наборе конкретная буква или две буквы, например D или K. Райхер обнаружил, что человек лучше запоминает, скажем, букву D в контексте слова WORD, чем в контексте ORWD (несуществующее слово). Этот факт поддерживает модель внешней формы слова, потому что именно слово позволяет человеку быстро узнать знакомую форму. Когда человек узнал форму, он логически приходит к выводу о существовании в этом слове конкретной буквы.

Второй базирующийся на экспериментальных данных аргумент в поддержку модели внешней формы слова — то, что текст, написанный строчными (маленькими) буквами, читается быстрее, чем тот же текст, состоящий из прописных (больших) букв. Вудворт (Woodworth, 1938) первым доложил об этом открытии в своем учебнике «Экспериментальная психология» (Experimental Psychology), написанном без постороннего влияния. Это открытие было подтверждено Смитом (Smith, 1969) и Фишером (Fisher, 1975). Участников эксперимента просили прочитать сопоставимые тексты, половина которых была написана заглавными буквами, а половина — строчными. В каждом исследовании скорость прочтения текста, набранного строчными буквами, была на 5–10 % выше, чем скорость чтения текста, написанного заглавными буквами. Этот факт также свидетельствует в пользу модели внешней формы слова, потому что в тексте, написанном строчными буквами, легче различимы комбинации надстрочных/подстрочных и нейтральных элементов. Тогда как все прописные буквы — одного размера, а это затрудняет восприятие и, соответственно, снижает скорость чтения.

Примеры ошибок, пропущенных при корректуре текста, — третий аргумент в пользу модели внешней формы слова, опирающийся на экспериментальные данные. Участникам эксперимента было предложено прочитать несколько абзацев текста и отметить грамматические ошибки. Отрывок был тщательно составлен таким образом: он содержал равное количество двух типов ошибок — ошибки, при которых сохранена внешняя форма слова, и ошибки, где эта форма изменена. Например, слово test — это правильно написанное слово, tesf — пример неверного написания, но внешняя форма слова сохранена; а tesc — неправильное написание с измененной внешней формой слова. Модель внешней формы слова предполагает, что в словах, имеющих схожую внешнюю форму, труднее заметить различие в написании, нежели в словах с различающейся формой, так как одинаковая форма скорее введет вас в заблуждение. Хабер и Шиндлер (Haber & Schindler, 1981) и Монк и Хьюлм (Monk & Hulme, 1983) обнаружили, что в словах с одинаковой внешней формой человек оставляет незамеченными в два раза больше ошибок, чем в словах с различной формой.

Слово, выбранное для эксперимента: test	Процент незамеченных ошибок
Слово со схожей внешней формой (tesf)	13
Слово с отличающейся внешней формой (tesc)	7

Рис. 3. В слове с неправильным написанием, но сходной внешней формой ошибка оставалась незамеченной гораздо чаще

Четвертый аргумент, наглядно подтверждающий правомерность модели внешней формы слова, — трудно читать текст, состоящий из букв разного размера. Например, AlTeRnAtInG — буквы меняются от прописных к строчным несколько раз. Модель внешней формы слова предполагает, что трудность обусловлена отличием комбинации надстрочных/подстрочных и нейтральных элементов в слове, написанном таким образом, от привычной внешней формы этого слова, написанного строчными буквами. Случай написания слова буквами меняющегося размера оказался даже более сложным для чтения, чем варианты написания только строчными или только заглавными буквами, что доказывает ряд исследований. Смит (Smith, 1969) установил, что такое написание значительно замедляет скорость чтения текста. Мэйсон (Mason, 1978) также демонстрировал, что в таком случае требуется больше времени, чтобы назвать слово. Поллацек, Уэлл и Шиндлер (Pollatsek, Well, & Schindler, 1975) показали, что поиск соответствия в данном случае затруднен, и Мэйер и Гутшера (Meyer & Gutschera, 1975) доказали, что распознавание такой категории форм замедлено.

Модель № 2: последовательное буквенное распознавание

Меньше остальных моделей распознавания слов просуществовала модель чтения слова буква за буквой последовательно слева направо. Гоф (Gough, 1972) предложил эту модель, потому что она проста для понимания и гораздо более проверяемая, чем модель внешней формы слова. Суть в том, что процесс распознавания слова в ментальном лексиконе считался аналогичным процессу поиска слова в словаре. Вы начинаете поиск с первой буквы, потом переходите ко второй, потом к третьей и т. д., пока не распознаете все слово.

Эта модель согласуется с открытием Шперлинга (Sperling, 1963), что одну букву можно распознавать со скоростью 10–20 мс. Шперлинг показывал участникам эксперимента случайный набор букв на очень короткие промежутки времени и спрашивал, есть ли среди них конкретная буква. Он обнаружил, что если человеку дать 10 мс времени на букву, он успешно справится с заданием. Например, если заданная буква была на четвертой позиции, а набор букв демонстрировался в течение 30 мс, участник не мог выполнить задание, но если время было увеличено до 40 мс, он успешно справлялся с заданием. Гоф заметил, что скорость 10 мс на букву соответствует стандартной скорости чтения 300 слов в минуту.

Модель последовательного буквенного распознавания также позволяет предполагать, что короткие слова распознаются быстрее длинных. То, что распознавание более длинных слов требует более длительного времени, — неоспоримый факт. Для того чтобы распознать слово из пяти букв, требуется больше времени, чем чтобы распознать слово из четырех букв; а слово из шести букв потребует больше времени для распознавания, чем слово из пяти букв. Модель последовательного буквенного распознавания подразумевает, что именно так и должно происходить, тогда как модель внешней формы слова вовсе не предполагает такого явления. В самом деле, согласно модели внешней формы словá более длинные, но обладающие уникальными паттернами, должны распознаваться легче, чем более короткие.

Модель последовательного буквенного распознавания оказалась несостоятельной потому, что она не позволяет объяснить эффект превосходства слова. Этот эффект означает, что читатель способен быстрее идентифицировать буквы в контексте слова, чем по отдельности, тогда как модель последовательного буквенного распознавания предполагает, что буква, расположенная, например, на третьей позиции в слове требует в 3 раза больше времени для распознавания, чем отдельно взятая буква.

следующая страница >>