Скачать 2.56 Mb.
|
ГЛАВА 4. Распознавание паттернов Низшая форма мышления — это простое опознание. Высшая — это глубокая интуиция человека, видящего всякую вещь как часть некоторой системы. Платон Каковы главные проблемы восприятия паттернов ? Что является конструктивным восприятием и прямым восприятием? Приведите несколько примеров иллюзий и объясните их. Что такое гештальт-психология и как она объясняет восприятие? Приведите несколько примеров канонических перспектив. Каковы главные особенности следующих идей о распознавании паттернов: сравнение с эталоном, теория геонов, подетальный анализ и прототипное сравнение? Что такое предварительная подготовка и почему она считается важной в современной когнитивной психологии? Как эксперты (например, шахматные гроссмейстеры) организовывают зрительные паттерны? Какие уже знакомые вам объекты вы сегодня видели? Если вы похожи на большинство людей, количество виденных и опознанных вами объектов огромно. А теперь ответьте на более сложный вопрос: как вы смогли быстро и точно распознать так много объектов? Удивительным свойством восприятия является его способность опознавать знакомые паттерны сенсорной информации. Благодаря этому свойству мы можем узнать старого знакомого среди моря лиц, по нескольким нотам определить всю музыкальную пьесу, можем прочитать слова, наслаждаться вкусом марочного вина или восхищаться запахом розы. Когнитивная система, как правило, отличается тем, что работает слаженно, быстро и без особых усилий. В повседневной жизни мы постоянно распознаем паттерны, однако мы лишь недавно пришли к пониманию когнитивных структур, лежащих в основе их распознавания. Как, например, вы узнаете вашу бабушку? Неужели при помощи «эталона бабушки», не совпадающе« го больше ни с какими бабушками? Или у вас есть прототип бабушки, очень схематичный, но тем не менее позволяющий вам узнать ее и когда она надевает очки, и даже когда у нее другая прическа? («А, бабуля, еле узнал тебя!») Или вы быстро сканируете ее черты и сверяете каждый элемент со списком «главных черт моей бабушки»? Хотя дальше мы будем говорить только о распознавании зрительных паттернов, другие виды «паттернов» — слуховые, тактильные и т. д. — тоже влияют на наше поведение, но они гораздо меньше изучены, чем зрительные, и данная глава отражает это неравенство. Как мы увидим, даже самое обычное распознавание паттернов включает сложное взаимодействие ощущения, восприятия, КВП, ДВП и когнитивного поиска с целью идентификации стимулов. Хотя распознавание объекта — довольно сложный процесс, оно более или менее точно осуществляется за доли секунды. На основе лабораторных исследований и здравого смысла мы имеем определенное представление о распознавании паттернов. Оно включает следующие человеческие способности: •
132 Глава 4. Распознавание паттернов Теории восприятия Психологи, изучающие восприятие, разработали две основные теории восприятия мира людьми. Согласно первой — теории конструктивного восприятия, — люди «конструируют» воспринимаемые образы, активно отбирая стимулы и объединяя ощущения с воспоминаниями. Согласно второй — теории прямого восприятия, — восприятие заключается в прямом приобретении информации из окружающей среды, Сначала рассмотрим позицию конструктивистов. Теория конструктивного восприятия основана на представлении, что в процессе восприятия мы формулируем и проверяем гипотезы о воспринимаемых объектах на основе того, что ощущаем и что уже знаем. Таким образом, восприятие — это общий результат того, что поступает через нашу сенсорную систему и что мы уже знаем о мире благодаря опыту. Когда вы издалека видите направляющегося в вашу сторону друга, вы узнаете его, потому что вы воспринимаете через зрение его внешний вид, его нос, глаза, волосы и т. д., а также потому, что вы знаете, что его обычно можно увидеть в это время в этом месте. Вы сможете узнать его, даже несмотря на то, что он, возможно, недавно отрастил усы, или изменил прическу, или надел солнечные очки. По мнению конструктивистов, эти изменения в паттерне первоначальных стимулов все же позволяют вам правильно узнать его из-за подсознательного умозаключения, процесса, посредством которого мы спонтанно объединяем информацию из нескольких источников для конструирования восприятия. По мнению конструктивистов, мы видим в равной степени благодаря мозгу с его богатым запасом знаний о мире и глазам (и другим органам чувств), которые обеспечивают нас новой сенсорной информацией. Эта теория близка к представлению о сенсорной обработке «сверху вниз» (которое рассматривается в следующем разделе) и согласуется с точкой зрения многих когнитивных психологов, работающих над проблемой распознавания зрительных паттернов, например Джерома Брунера, Ричарда Грегори и Ирвина Рока. Она ведет начало от классических исследований Германа фон Гельмгольца, проведенных им в конце ХIХ.века. Согласно теории прямого восприятия, содержащаяся в стимулах информация — важный элемент в восприятии, а научение и другие когнитивные процессы необходимы при восприятии. Ведущим сторонником этой теории был Джеймс Гибсон (Gibson, 1966, 1979) и его последователи в Корнеллском университете, включая Джеймса Каттинга (Cutting, 1986, 1993), который утверждал, что «прямое восприятие предполагает, что богатство оптической матрицы лишь отражает богатство мира». Идея, получившая поддержку среди экологически ориентированных психологов, состоит в том, что стимул содержит достаточно информации для правильного восприятия и не требует внутренних репрезентаций. Воспринимающий в процессе восприятия делает минимальную работу, потому что мир предлагает достаточно информации и ему остается лишь конструировать образы восприятия и делать умозаключения. Восприятие заключается в прямом получении информации из окружения. Рассмотрим пример, относящийся не к зрению, а к слуху. Если вы слушали пьесу, исполняемую на фортепьяно в тональности «соль», и затем ту же самую пьесу, исполняемую в тональности «до», вы, вероятно, заметите, что эти пьесы похожи, а если бы между первым и вторым исполнением прошло Теории восприятия 133 142 Глава 4. Распознавание паттернов Рис. 4.5. Канонический вид чашки и блюдца Одно из теоретических объяснений общности канонических перспектив состоит в том, что через общий опыт восприятия объектов мы создаем постоянные воспоминания наиболее репрезентативного вида объекта, сообщающего наибольшее количество информации о нем. Таким образом, исследования канонических перспектив предоставляют нам информацию о восприятии формы, но они гораздо больше говорят об обработке информации, формировании прототипа (или типичных репрезентациях объектов в памяти), структуре мышления и, в упомянутом выше примере с чашкой и блюдцем, эффективности коммуникации. Мы храним понятия об общих классах объектов и используем своего рода зрительную стенографию, чтобы рассказать другим о наших впечатлениях. Рис. 4.6. Чашка и блюдце - вид сверху Канонические перспективы 143 Экспериментальные данные подтвердили эти выводы. Палмер, Рош и Чейз (Palmer, Rosch & Chase, 1981) делали серии фотографий обычных объектов в различных ракурсах (рис. 4.7). Испытуемые оценивали типичность этих ракурсов и степень знакомства с ними. Во второй части эксперимента испытуемым показывали фотографии лошади и других объектов (например, фотоаппарата, автомобиля, фортепьяно и т. д.), которым была дана подобная оценка, и просили назвать объекты как можно быстрее. Неудивительно, что канонические виды были идентифицированы быстрее всего; при этом время реакции увеличивалось по мере увеличения степени отличия изображения от канонического. Также следует отметить, что зрительная система все же работает достаточно эффективно, даже оценивая не вполне «совершенные» фигуры. Есть несколько возможных причин того, что время реакции обычно больше для картин, отступающих от канона. 1. Меньшее количество деталей объекта попадают в поле зрения. Посмотрите на вид сзади на рис. 4.7. Сколько частей тела лошади вы можете видеть, смотря на нее сзади? Не очень много. (И кто знает, о чем бы вы подумали, если бы вам показали эту фотографию.) 2. Лучший (канонический) вид (фигура в верхнем левом углу) — тот, который мы видим наиболее часто. Мы «видим» пишущие машинки, стулья, автомобили, телефоны и лошадей в одном ракурсе чаще, чем в других, и поэтому этот вид нам более привычен. Рис. 4.7. Двенадцать видов лошади, используемых в эксперименте Палмера, Роша и Чейза (Palmer, Rosch & Chase, 1981 ), со средними оценками «хорошей фигуры» 144 Глава 4. Распознавание паттернов Теория геонов Существует альтернатива жесткой модели сравнения с эталоном, требующей бесчисленных миллионов форм для сравнения с ними повседневных образов мира. Она предполагает, что человеческая система обработки информации имеет ограниченное число простых геометрических «базисных элементов», которые могут быть применены к сложным формам. Одна из подобных теорий, также имеющая некоторое сходство с подетальным анализом (мы рассмотрим его далее в этой главе), была сформулирована Ирвингом Бидерманом из Университета Южной Калифорнии. Представления Бидермана о восприятии формы основаны на понятии геон (сокращение от «геометрические ионы»). Согласно этой концепции, все сложные формы состоят из геонов. Например, чашка составлена из двух геонов: цилиндра (емкость для воды) и эллипса (ручка). (Примеры геонов и объектов приведены на рис. 4.9.) Теория геонов, как ее сформулировал Бидерман (Biederman, 1985, 1987, 1990; Biederman & Cooper, 1991; Biederman & Gerhardstein, 1993; Cooper & Biederman, 1993), предполагает, что распознавание объекта, например телефона, Ирвинг Бидерман продвинул наше понимание распознавания объекта с помощью новаторских экспериментов и теорий, особенно теории геонов Сравнение с эталоном 149 Рис. 4.9. Геоны и объекты. Объекты представлены как конфигурации геонов, являющихся простыми зрительными объемными фигурами. Источник: Biederman, 1990 чемодана или еще более сложных форм, состоит из распознавания по компонентам, при котором в сложных формах обнаруживаются простые формы. Геоны — это 24 особые формы, и, подобно буквам алфавита, они образуют определенную систему. При объединении они формируют более сложные формы, так же как буквы, из которых составлены слова на этой странице. Число различных форм, которые могут быть получены путем объединения первичных форм, является астрономическим. Например, три геона, расположенных во всех возможных комбинациях, дают 1,4 млрд трехгеонных объектов! Однако мы используем только часть из возможного числа сложных форм. Бидерман считает, что мы используем приблизительно 30 тыс. сложных форм, из которых мы имеем названия только для 3 тыс. Теорию геонов можно проверить, например, с помощью упрощенных форм, как показано на рис. 4.10. Какую из этих фигур (а или 6) легче идентифицировать? На этой иллюстрации у простого объекта удалено 65 % контура. У чашки слева (а) удалены середины отрезков, что все же позволяет наблюдателю видеть, как связаны основные отрезки. У чашки справа (б) удалены части отрезков вершин, включая основные углы, связывающие отрезки друг с другом. Бидерман предъявлял испытуемым объекты такого типа на 100 мс. Он обнаружил, что при удалении частей соединяющих линий (я) испытуемые правильно идентифицировали объект Рис. 4.10. У чашки было удалено 65 % линий контура, относящихся либо к середине отрезков (а), либо к вершинам (б). Источник: Biederman, «Human Image Understanding: Recent Research and a Theory» in Computer Vision, Graphics and Image Processing, 1985, 32, 29-73. Copyright 1985 by Academic Press. Воспроизведено с разрешения 150 Глава 4. Распознавание паттернов 1 Хьюбель и Визель в 1981 году разделили Нобелевскую премию со Сперри. 154 Глава 4, Распознавание паттернов Рис. 4.14. Записи движений глаз испытуемого при разглядывании картины (слева вверху). Траектория 1 получена, когда испытуемый рассматривал картину произвольно. Последующие траектории получены после того, как испытуемого просили оценить экономическую состоятельность изображенных людей (траектория 2); их возраст (3); предположить, что они делали, перед тем как пришел «посетитель» (4); запомнить их одежду (5); запомнить положение людей и объектов в комнате (6) и оценить, как долго «посетитель» не видел эту «семью» (7). Источник: Yarbus, 1967 Прототипное сравнение 155 Резюме 1. Существует несколько теоретических подходов к объяснению способности человека идентифицировать и обрабатывать зрительные паттерны: гештальтпсихология, принципы обработки информации «снизу вверх» и «сверху вниз», сравнение с эталоном, подетальный анализ и прототипное сравнение. 2. Гештальт-психологи предположили, что восприятие зрительных паттернов организуется по принципам близости, сходства и спонтанной организации. 3. Опознание паттерна может начинаться с описаний его частей, которые затем суммируются (обработка «снизу вверх»), или с выдвижения наблюдателем гипотезы, позволяющей опознать паттерн в целом, а затем — его составные части (обработка «сверху вниз»). 4. Эксперименты показывают, что на восприятие объекта значительно влияют гипотезы, определяемые контекстом. 5. Идея сравнения с эталоном предполагает, что распознавание паттерна происходит в случае точного совпадения сенсорного стимула с соответствующей внутренней формой. Эта идея имеет теоретическое и практическое значение, но не может объяснить многие сложные когнитивные процессы, такие как способность правильно опознавать малознакомые формы и фигуры. 6. Принцип подетального анализа гласит, что распознавание паттернов происходит только после того, как стимулы будут проанализированы по их элементарным компонентам. Эта гипотеза подтверждается результатами неврологических и поведенческих экспериментов. 7. Гипотеза формирования прототипов утверждает, что восприятие паттерна происходит в результате сравнения стимулов с абстракциями, хранящимися в памяти и служащими в качестве идеальных форм, с которыми сравниваются стимульные паттерны. В теории прототипов предложены две модели: модель центральной тенденции, согласно которой прототип представляет собой среднее из набора образцов; и модель частоты признаков, согласно которой прототип представляет собой некую форму или результат суммирования наиболее часто встречающихся признаков. Рекомендуемая литература 167 8. Распознавание зрительных образов человеком включает зрительный анализ на входном этапе и хранение информации в долговременной памяти. Рекомендуемая литература Большая часть работ, рекомендованных к главе 3, существенны и для этой главы. Упомянем также книгу Рида «Психические процессы при распознавании паттернов» (Psychological Processes in Pattern Recognition), сборник под редакцией Хамфри «Понимающее зрение» (Understanding Vision) книгу Мерча «Зрительное и слуховое восприятие» (Visual and Auditory Perception), а также работу Макберни и Коллинза «Введение в ощущение/восприятие» (Introduction to Sensation/Perception). Книга Рока «Логика восприятия» (The Logic of Perception) является важным дополнением к литературе на данную тему. В Psychonomic Bulletin & Review ( 1995) опубликована превосходная статья Лешера по иллюзорным контурам. |
Интервью с пациентами 72 Имя панацеи скипидарные ванны 72 «Я был готов даже на эвтаназию» Москва Санкт-Петербург Нижний Новгород Воронеж Ростов-на-Дону Екатеринбург Самара Новосибирск Киев Харьков Минск |
Редактор Художник Корректоры Верстка Е. Строганова Е. Журавлева Ю.... Москва Санкт-Петербург Нижний Новгород – Воронеж Ростов-на-Дону Екатеринбург – Самара Киев Харьков Минск |
||
Москва • Санкт Петербург • Нижний Новгород ■ Воронеж Ростов-на Дону... Книга предназначена для широкого круга читателей, которых волнуют проблемы и достижения современной психологии. Материалы этой работы... |
Министерства образования РФ москва • Санкт-Петербург ■ Нижний Новгород... Учебник предназначен для студентов психологических факультетов университетов и институтов, слушателей факультетов и курсов повышения... |
||
Пошаговая инструкция визирования по Франции Компания веди тургрупп производит подачу документов в Визовых Центрах следующих городов: Москва, Санкт-Петербург, Самара, Ростов-на-Дону,... |
Новости компании Иркутск Казань Калуга Канск Кемерово Киров Комсомольск на Амуре Красноярск Курган Липецк Москва Нижний Новгород Новокузнецк Новосибирск... |
||
Пишем программы и игры для сотовых телефонов москва • Санкт-Петербург... Б93 Пишем программы и игры для сотовых телефонов. — Спб.: Питер, 2006. — 204 с: ил |
Книга в таком объеме, посвященная вепосипеду и отдельному виду туризма,... З. З. Шакиров (Казань); В. В. Моржаков (Н. Новгород); В. А. Щеголев (Нов-город); В. С. Ильин (Ростов-на-Дону); А. И. Старков (Уфа);... |
||
Тема номера М. Н. Вольф (Новосибирск), В. П. Горан (Новосибирск), Джон Диллон (Дублин), С. В. Месяц (Москва), Е. В. Орлов (Новосибирск), В. Б.... |
Тема выпуска М. Н. Вольф (Новосибирск), В. П. Горан (Новосибирск), Джон Диллон (Дублин), С. В. Месяц (Москва), Е. В. Орлов (Новосибирск), В. Б.... |
||
Философское антиковедение и классическая традиция М. Н. Вольф (Новосибирск), В. П. Горан (Новосибирск), Джон Диллон (Дублин), С. В. Месяц (Москва), Е. В. Орлов (Новосибирск), В. Б.... |
Критерии постановки диагноза преэклампсии Авторы: Шифман Е. М. (отв редактор, Москва), Беломестнов С. Р. (Екатеринбург), Вученович Ю. Д. (Москва), Дробинская А. Н.(Новосибирск),... |
||
Филолого-коммуникативные исследования Ежегодник – 2014 Москва), Е. Г. Елина (Саратов), В. В. Красных (Москва), Е. В. Осетрова (Красноярск), Л. А. Петрова (Одесса, Украина), И. Н. Розина... |
«седация пациентов в отделениях реанимации и интенсивной терапии»... Рабочая группа: Потиевская В. И. (Москва), Гридчик И. Е.(Москва), Грицан А. И.(Красноярск), Еременко А. А. (Москва), Заболотских... |
||
Том II филологические и юридические науки алматы астана баку... Молодежь и наука: реальность и будущее: Материалы III международной научно-практической конференции/Редкол.: В. А. Кузьмищев |
Автогенного сварочного оборудования и технологий Нижний Новгород 603014, г. Нижний Новгород ул. Нартова, д. 23 «А» Сормовское шоссе, д. 24, корп. 36 |
Поиск |