какое изображение видит глаз человека

Глаз человека: строение и функции

какое изображение видит глаз человека

Для многих из нас будет открытием, что глазами мы только смотрим, но не видим. Изображение формируется в коре головного мозга, которая воспринимает сигналы от зрительного нерва и преобразует в картинку, отражающую действительность. Орган зрения – совершенный анализатор, выработавшийся в процессе эволюционного развития. Ни одна современная технология не позволяет создать даже примитивный аналог человеческого глаза. Через глаза мы получаем более 80% информации, поэтому глаза необходимо беречь и периодически проходить обследование у врача-офтальмолога. Своевременное выявление заболеваний и адекватное лечение предотвратит развитие серьезных осложнений.

Как мы видим?

Обработка импульсов, поступающих в мозг от двух глаз, дает объемное изображение. Первичные сигналы от сетчаток обоих глаз передаются по зрительным нервам, которые образуют частичный перекрест (хиазму). Нервные волокна, идущие изначально от каждого глаза отдельно, перераспределяются таким образом, что в правое полушарие коры головного мозга поступает информация с правой стороны сетчатки обоих глаз, а в левое – с левой стороны. После перекреста нервный импульс попадает в подкорковые центры зрительного анализатора, где происходит анализ зрительных стимулов, оцениваются их цветовые характеристики, пространственный контраст и средняя освещенность в различных участках поля зрения. Далее нейроны подкоркового слоя через аксоны передают преобразованные сигналы в проекционную область зрительной коры, где и формируется изображение.

какое изображение видит глаз человека

Зачем нужно проверять зрение?

Глаз в этой сложнейшей системе является всего лишь «приемником», преобразующим изображение в миллионы нервных импульсов. Малейший сбой в сложнейшем механизме чреват серьезными последствиями, вплоть до полной слепоты. Диагностика с применением приборов последнего поколения позволяет выявить любую проблему на ранней стадии и принять меры к ее устранению.

Строение глаза

Глаза – не только «зеркало души», но и сложнейшие оптические приборы, принимающие и кодирующие электромагнитные волны видимой части спектра в нервные импульсы для передачи в мозг. В глазном яблоке заключены одновременно три аппарата – рефракционный, аккомодационный и сенсорный, согласованная работа которых и обеспечивает зрительное восприятие.

какое изображение видит глаз человека

какое изображение видит глаз человека

Оптик-Центр предлагает пройти комплексное обследование, по результатам которого врач-офтальмолог предложит оптимальный метод коррекции зрения – очки, контактные линзы, лазерную коррекцию или замену хрусталика. Очки и линзы совершенно бесплатно помогут подобрать в салонах «Оптик-Центр», а консультанты предложат красивую и модную оправу, которая станет отличным аксессуаром.

Источник

Глаз человека.

Автор — профессиональный репетитор, автор учебных пособий для подготовки к ЕГЭ Игорь Вячеславович Яковлев

Темы кодификатора ЕГЭ: глаз как оптическая система.

Строение глаза.

Мы ограничимся рассмотрением лишь самых основных элементов глаза. Они показаны на рис. 1 (правый глаз, вид сверху).

какое изображение видит глаз человека
Рис. 1. Строение глаза

То, что изображение является действительным, понятно: на сетчатке должны пересекаться сами лучи (а не их продолжения), концентрируя световую энергию и вызывая раздражения палочек и колбочек.

Насчёт того, что изображение является уменьшенным, тоже вопросов не возникает. А каким же ему ещё быть? Диаметр глаза равен примерно 25 мм, а поле нашего зрения попадают предметы куда большего размера. Естественно, глаз отображает их на сетчатке в уменьшенном виде.

Но вот как быть с тем, что изображение на сетчатке является перевёрнутым? Почему же тогда мы видим мир не вверх ногами? Здесь подключается корректирующее действие нашего мозга. Оказывается, кора головного мозга, обрабатывая изображение на сетчатке, переворачивает картинку обратно! Это установленный факт, проверенный экспериментами.

Аккомодация.

Представьте себе, что вы смотрите на приближающегося к вам человека. Вы всё время чётко его видите. Каким образом глазу удаётся это обеспечивать?

Чтобы лучше понять суть вопроса, давайте вспомним формулу линзы:

Например, если предмет приближается к глазу, то уменьшается, поэтому и должно
уменьшаться. Для этого глазная мышца деформирует хрусталик, делая его более выпуклым и уменьшая тем самым фокусное расстояние до нужной величины. При удалении предмета, наоборот, кривизна хрусталика уменьшается, а фокусное расстояние возрастает.

Описанный механизм самонастройки глаза называется аккомодацией. Итак, аккомодация — это способность глаза отчётливо видеть предметы на различных расстояниях. В процессе аккомодации кривизна хрусталика меняется так, что изображение предмета всегда оказывается на сетчатке.

какое изображение видит глаз человека
Рис. 2. Дальняя и ближняя точки аккомодации нормального глаза

Теперь мы переходим к простому, но очень важному понятию угла зрения. Оно является ключевым для понимания принципов работы различных оптических приборов.

Угол зрения.

Когда мы хотим получше рассмотреть предмет, мы приближаем его к глазам. Чем ближе предмет, тем больше его деталей оказываются различимыми. Почему так получается?

какое изображение видит глаз человека
Рис. 3. Предмет далеко, угол зрения мал

Угол называется углом зрения. Если предмет расположен далеко от глаза, то угол зрения мал, и размер изображения на сетчатке также оказывается малым.

какое изображение видит глаз человека
Рис. 4. Предмет близко, угол зрения велик

Расстояние наилучшего зрения.

Однако мы так не поступаем. Например, читая книгу, мы держим её на расстоянии примерно 25 см. Почему же мы останавливаемся на этом расстоянии, хотя ещё имеется ресурс дальнейшего увеличения угла зрения?

Дело в том, что при достаточно близком расположении предмета хрусталик чрезмерно деформируется. Конечно, глаз ещё способен чётко видеть предмет, но при этом быстро утомляется, и мы испытываем неприятное напряжение.

Величина см называется расстоянием наилучшего зрения для нормального глаза. При таком расстоянии достигается компромисс: угол зрения уже достаточно велик, и в то же время глаз не утомляется ввиду не слишком большой деформации хрусталика. Поэтому с расстояния наилучшего зрения мы можем полноценно созерцать предмет в течении весьма долгого времени.

Близорукость.

Напомним, что фокусное расстояние нормального глаза в расслабленном состоянии равно расстоянию от оптического центра до сетчатки. Нормальный глаз фокусирует параллельные лучи на сетчатке и поэтому может чётко видеть удалённые предметы, не испытывая напряжения.

какое изображение видит глаз человека
Рис. 5. Близорукость

Потеря чёткости изображения наступает, когда предмет находится дальше определённого расстояния. Это расстояние соответствует дальней точке аккомодации близорукого глаза. Таким образом, если у человека с нормальным зрением дальняя точка аккомодации находится на бесконечности, то у близорукого человека дальняя точка аккомодации расположена на конечном расстоянии перед ним.

Соответственно, ближняя точка аккомодации у близорукого глаза находится ближе, чем у нормального.

какое изображение видит глаз человека
Рис. 6. Коррекция близорукости с помощью очков

Таким образом, близорукий глаз, вооружённый подходящими очками, воспринимает параллельный пучок света как исходящий из дальней точки аккомодации. Вот почему близорукий человек в очках может отчётливо рассматривать удалённые предметы без напряжения в глазах. Из рис. 6 мы видим также, что фокусное расстояние подходящей линзы равно расстоянию от глаза до дальней точки аккомодации.

Дальнозоркость.

Дальнозоркий глаз фокусирует параллельные лучи за сетчаткой, отчего изображения удалённых объектов оказываются размытыми (рис. 7 ).

какое изображение видит глаз человека
Рис. 7. Дальнозоркость

На сетчатке же фокусируется сходящийся пучок лучей. Поэтому дальняя точка аккомодации дальнозоркого глаза оказывается мнимой: в ней пересекаются мысленные продолжения лучей сходящегося пучка, попадающего на глаз (мы увидим это ниже на рис. 8 ). Ближняя точка аккомодации у дальнозоркого глаза расположена дальше, чем у нормального.Расстояние наилучшего зрения для дальнозоркого человека больше 25 см.

Дальнозоркость корректируется с помощью очков с собирающими линзами. После прохождения собирающей линзы параллельный пучок света становится сходящимся и затем фокусируется на сетчатке (рис. 8 ).

какое изображение видит глаз человека
Рис. 8. Коррекция дальнозоркости с помощью очков

Источник

Обманутый глаз

2. Зрение как обработка данных

Невозможные фигуры и двойственные изображения не являются чем-то, что не может быть воспринято буквально: они возникают у нас в мозге. Так как процесс восприятия таких фигур следует странным нестандартным путем, наблюдатель приходит к пониманию, что что-то необычное происходит в его голове. Для лучшего понимая процесса, который мы называем «зрением», полезно иметь представление о том, как наши органы чувств (глаза и мозг) преобразуют световые раздражители в полезную информацию.

Глаз как оптическое устройство

Глаз (см. рис. 1) работает подобно фотокамере. Хрусталик (lens) проецирует перевернутое уменьшенное изображение из внешнего мира на сетчатку (retina) – сеть фоточувствительных клеток, расположенных напротив зрачка (pupil) и занимающих более половины площади внутренней поверхности глазного яблока. Как оптический инструмент, глаз долгое время являлся маленькой загадка. В то время как камера фокусируется движением хрусталика ближе или дальше от светочувствительного слоя, его способность к преломлению света настраивается во время аккомодации (адаптации глаза на определенное расстояние). Форма глазной линзы изменяется при помощи мерцательной мышцы (ciliary muscle). Когда мышца сжимается, хрусталик становится более круглым, при помощи чего сфокусированное изображение более близких предметов поступает на сетчатку. Диафрагма человеческого глаза настраивается также как в фотоаппарате. Зрачок управляет величиной раскрытия хрусталика, расширяясь или сжимаясь при помощи радиальных мышц, окрашивающих радужную оболочку глаза (iris) характерным для него цветом. Когда наш глаз перемещает взгляд в область, на которой он желает сфокусироваться, фокусное расстояние и размер зрачка мгновенно настраиваются под необходимые условия «автоматически».

какое изображение видит глаз человека
Рисунок 2. Сетчатка глаза в разрезе какое изображение видит глаз человека
Рисунок 3. Глаз с желтым пятном

Структура сетчатки (рис. 2), фоточувствительного слоя внутри глаза, очень сложна. Оптический нерв (вместе с кровеносными сосудами) отходит от задней стенки глаза. В этом месте нет фоточувствительных клеток, и оно известно под названием «слепое пятно». Нервные волокна разветвляются и оканчиваются клетками трех разных типов, которые улавливают поступающий на них свет. Отростки, идущие из третьего, самого внутреннего слоя клеток, – содержат молекулы, которые временно меняют свою структуру при обработке поступившего света, и тем самым испускают электрический импульс. Фоточувствительные клетки называются палочками (rods) и колбочками (cones) по форме их отростков. Колбочки чувствительны к цвету, в то время как палочки – нет. С другой стороны фоточувствительность палочек гораздо выше, чем у колбочек. Один глаз содержит порядка ста миллионов палочек и шести миллионов колбочек, распределенных по сетчатке неравномерно. Точно напротив зрачка лежит так называемое желтое пятно (рис. 3), которое состоит только из колбочек в относительно плотной концентрации. Когда мы хотим увидеть что-то в фокусе, мы располагаем глаз так, чтобы изображение падало на желтое пятно. Между клетками сетчатки много взаимосвязей, и электрические импульсы от ста миллионов фоточувствительных клеток отправляются мозгу всего по миллиону нервным волокнам. Таким образом, глаз можно поверхностно описать как фото- или теле-камеру с загруженной фоточувствительной пленкой.

какое изображение видит глаз человека
Рисунок 4. Фигура Kanizsa

От светового импульса к информации

Но как мы видим на самом деле? До недавнего времени этот вопрос едва ли был разрешимым. Лучшим ответом на данный вопрос был следующий: в мозге есть область, которая специализируется на зрении, в которой формируется изображение, полученное с сетчатки глаза, в виде клеток мозга. Чем больше света падает на клетку сетчатки, тем с большей интенсивностью работает соответствующая ей клетка мозга, то есть активность клеток мозга в нашем зрительном центре зависит от распределения света, попадающего на сетчатку. Короче говоря, процесс начинается с изображения на сетчатке и заканчивается соответствующим изображением на маленьком «экране» из клеток мозга. Естественно, это не объясняет зрение, а просто смещает проблему на более глубокий уровень. Кому предназначено видеть это внутреннее изображение? Данную ситуацию хорошо иллюстрирует рисунок 5, взятый из работы Декарта «Le traité de l’homme». В данном случае, все нервные волокна заканчиваются в некой железе, которую Декарт представлял как место души, и именно она видит внутреннее изображение. Но вопрос остается: как «зрение» работает на самом деле?

Идея мини-наблюдателя в мозге является не просто недостаточной для объяснения зрения, но она еще и игнорирует три виде деятельности, которые, очевидно, выполняются непосредственно самой зрительной системой. Например, посмотрим на фигуру на рисунке 4 (автор Kanizsa). Мы видим треугольник в трех круговых сегментах по их вырезам. Этот треугольник не был предъявлен на сетчатку, однако он является результатом домысливания нашей зрительной системы! Также, почти невозможно смотреть на рисунок 6 не видя непрерывных последовательностей круговых узоров борющихся за наше внимание, как будто мы непосредственно испытываем внутреннюю зрительную деятельность. Многие обнаруживают, что их зрительная система приходит в полное замешательство от фигуры Далленбаха (Dallenbach) (рисунок 8), так как они ищут способы интерпретировать эти черные и белые пятна в виде какой-то понятной им формы. Чтобы избавить вас от мучений, рисунок 10 предлагает интерпретацию, которую ваша зрительная система примет раз и навсегда. В противоположность предыдущему рисунку, вам не составит никакого труда реконструировать несколько штрихов туши на рисунке 7 в изображение двух беседующих людей.

какое изображение видит глаз человека
Рисунок 7. Рисунок из «Mustard Seed Garden Manual of Painting», 1679-1701

Например, совершенно другой метод видения иллюстрируют исследования Вернера Рейхарта (Werner Reichardt) из г. Тюбинген, который в течение 14 лет изучал систему зрения и управления полетом комнатной мухи. За эти исследования он был удостоен премии Heineken Prize в 1985 году. Подобно многим другим насекомым муха имеет составные глаза, состоящие из многих сотен отдельных палочек, каждая их которых является отдельным фоточувствительным элементом. Система управления полетом мухи состоит из пяти независимых подсистем, работающих чрезвычайно быстро (скорость реакции примерно в 10 раз быстрее, чем у человека) и эффективно. Например, подсистема приземления работает следующим образом. Когда область обзора мухи «взрывается» (от того, что поверхность оказывается близко), муха направляется к центру «взрыва». Если центр находится над мухой, она автоматически переворачивается вверх ногами. Как только ноги мухи касаются поверхности, «подсистема» приземления отключается. При полете муха извлекает только два вида информации из своей области видимости: точку, в которой находится движущееся пятно определенного размера (которое должно совпадать с размером мухи на расстоянии 10 сантиметров), а также направление и скорость движения этого пятна по полю видимости. Обработка этих данных помогает автоматически корректировать траекторию полета. Весьма маловероятно, что муха владеет полной картиной окружающего мира. Она не видит ни поверхностей, ни объектов. Обработанные определенным образом входные зрительные данные передаются напрямую в двигательную подсистему. Таким образом, входные зрительные данные преобразуются не во внутреннее изображение, а в форму, которая позволяет мухе адекватно реагировать на ее окружение. То же самое можно сказать и о такой бесконечно более сложной системе, как человек.

какое изображение видит глаз человека
Рисунок 8. Фигура Далленбаха

Есть много причин, почему ученые так долго воздерживались от решения фундаментального вопроса, как человек видит. Оказалось, что необходимо было сначала объяснить много других вопросов зрения – сложную структуру сетчатки, цветное видение, контрастность, остаточные изображения и т.д. Однако вопреки ожиданиям открытия в данных областях не способны пролить свет на решение основной проблемы. Еще более значительной проблемой было отсутствие какой либо общей концепции или схемы, в которой были бы перечислены все зрительные явления. Об относительной ограниченности обычных областей исследований можно почерпнуть в отличном руководстве T.N. Comsweet на тему зрительного восприятия, составленного на основе его лекций для студентов первого и второго семестров. В предисловии автор пишет: «Я стремлюсь описать фундаментальные аспекты, лежащие в основе огромного поля, которое мы небрежно называем зрительным восприятием». Однако, изучая содержание данной книги, этими «фундаментальными темами» оказываются поглощение света палочками и колбочками сетчатки, цветное зрение, способы, при помощи которых сенсорные клетки могут увеличивать или уменьшать пределы взаимного влияния друг на друга, частоту электрических сигналов, передаваемых через сенсорные клетки и т.д. Сегодня, исследования в данной области следуют совершенно новыми путями, что приводит к сбивающему с толку разнообразию в профессиональной прессе. И только специалист может сформировать общую картину развивающейся &quo;новой науки Зрения». Была всего одна попытка объединить несколько новых идей и результатов исследований в манере доступной для непрофессионала. И даже здесь вопросы «Что такое Зрение?» и «Как мы видим?» не стали главными вопросами обсуждения.

От изображения к обработке данных

Девид Марр (David Marr) из Лаборатории искусственного интеллекта при Массачусетском Технологическом Институте первым попытался приблизиться к предмету с совершенно другой стороны в своей книге «Зрение» (Vision), изданной уже после его смерти. В ней он стремился рассмотреть основную проблему и предложить возможные пути ее решения. Результаты Марра конечно не окончательны и по сей день открыты для исследований с разных направлений, но тем не менее основным достоинством его книги является ее логичность и последовательность выводов. Во всяком случае, подход Марра дает очень полезную основу, на котором можно строить исследования невозможных объектов и двойственных фигур. На следующих страницах мы попытаемся проследить ход мыслей Марра.

Марр описал недостатки традиционной теории зрительного восприятия так:

«Попытки понять зрительное восприятие, изучая лишь нейроны, подобно попытке понять полет птицы, изучая лишь ее перья. Это просто невозможно. Чтобы понять полет птицы нам необходимо понять аэродинамику, и только потом структура перьев и различные формы птичьих крыльев будут иметь для нас какое-то значение&quot. В данном контексте Марр называет Дж. Дж. Гибсона (J. J. Gobson) первым, кто коснулся важных вопросов в данной области изучения зрения. По мнению Марра, самый важный вклад Гибсона состоял в том, что «самое важное в органах чувств то, что они являются информационными каналами из внешнего мира к нашему восприятию (. ) Он поставил критически важный вопрос – Как каждый из нас получает одинаковые результаты при восприятии в повседневной жизни в постоянно изменяющихся условиях? Это очень важный вопрос, показывающий, что Гибсон правильно рассматривал проблему зрительного восприятия как восстановление из информации, полученной от сенсоров, «правильных» свойств объектов внешнего мира». И таким образом мы достигли области обработки информации.

Не должно возникать вопросов о том, что Марр хотел игнорировать другие объяснения феномена зрения. Напротив, он специально подчеркивает, что зрение не может быть удовлетворительно разъяснено только с одной точки зрения. Объяснения должны быть найдены для повседневных событий, согласующиеся с результатами экспериментальной психологии и всеми открытиями в данной области, сделанными психологами и неврологами в области анатомии нервной системы. Что касается обработки информации, то ученым компьютерных наук хотелось бы знать, как зрительная система может быть запрограммирована, какие алгоритмы наилучшим образом подходят для данной задачи. Короче, как зрение можно запрограммировать. Только всесторонняя теория может быть принята как удовлетворительное объяснение процесса видения.

Марр работал над данной проблемой с 1973 года по 1980 год. К сожалению, он не смог закончить свою работу, но он смог заложить прочный фундамент для дальнейших исследований.

От неврологии к зрительному механизму

Убеждение, что многие функции человека контролируются головным мозгом, разделяют неврологи с начала XIX века. Мнения разнились по вопросу, используются ли определенные части коры головного мозга для выполнения отдельных операций или для каждой операции задействуется весь мозг целиком. Сегодня знаменитый эксперимент французского невролога Пьера Поля Брока (Pierre Paul Broca) привел к всеобщему признанию теории специфического расположения. Брока лечил пациента, который не мог говорить 10 лет, хотя с голосовыми связками у него было все в порядке. Когда человек умер в 1861 году, вскрытие показало, что левая часть его мозга была деформирована. Брока сделал предположение, что речь контролируется этой частью коры головного мозга. Его теория была подтверждена последующими обследованиями пациентов с повреждениями головного мозга, что позволило, в конечном итоге, отметить центры жизненно важных функций человеческого мозга.

какое изображение видит глаз человека
Рисунок 9. Отклик двух разных клеток мозга на оптические возбудители разных направлений

Столетием позже, в 1950-х годах, ученые Д.Х. Хьюбел (D.H. Hubel) и Т.Н. Визель (T.N. Wiesel) провели эксперименты в мозгом живых обезьян и кошек. В зрительном центре коры головного мозга они обнаружили нервные клетки, которые особенно чувствительны к горизонтальным, вертикальным и диагональным линиям в поле зрения (рис. 9). Их сложная техника микрохирургии была впоследствии принята к применению другими учеными.

Таким образом, кора головного мозга не просто содержит в себе центры для выполнения различных функции, но и внутри каждого центра, как, например, в зрительном центре, отдельные нервные клетки активируются только при поступлении очень специфических сигналов. Эти сигналы поступающие с сетчатки глаза, коррелируют с четко определенными ситуациями внешнего мира. Сегодня предполагается, что информация о различных формах и пространственном расположении объектов содержится в зрительной памяти, и информация от активированных нервных клеток сравнивается с этой хранимой информацией.

Эта теория детекторов повлияла на направление в исследованиях зрительного восприятия в середине 1960-х годов. Тем же самым путем последовали и ученые, связанные с «искусственным интеллектом». Компьютерная симуляция процесса человеческого зрения, также называемое «машинное зрение», рассматривалась как одна из наиболее легко достижимых целей в данных исследованиях. Но все сложилось несколько иначе. Скоро стало ясно, что фактически невозможно написать программы, которые были бы способны распознавать изменения интенсивности света, тени, структуру поверхности и беспорядочные наборы сложных объектов в значащие образы. Более того, такое распознавание образов потребовало неограниченных объемов памяти, так как изображения несчетного числа объектов необходимо хранить в памяти в бессчетном количестве вариаций расположения и ситуаций освещения.

Какие-либо дальнейшие продвижения в области распознавания образов в условиях реального мира не представлялись возможными. Вызывает сомнение надежда, что когда-либо компьютер сможет симулировать человеческий мозг. В сравнении с человеческим мозгом, в котором каждая нервная клетка имеет порядка 10 000 связей с другими нервными клетками, эквивалентное компьютерное соотношение 1:1 едва ли выглядит адекватным!

какое изображение видит глаз человека
Рисунок 10. Разгадка фигуры Делленбаха

Лекция Элизабет Уоррингтон (Elizabeth Warrington)

В 1973 году Марр посетил лекцию британского невролога Элизабет Уоррингтон. Она отметила, что большое количество пациентов с париетальными повреждениями правой части мозга, которых она осмотрела, могли отлично распознавать и описывать множество объектов при условии, что эти объекты наблюдались ими в их обычном виде. Например, такие пациенты без особого труда идентифицировали ведро при виде сбоку, но не были способны распознать то же самое ведро при виде сверху. На самом деле, даже когда им говорили, что они смотрят на ведро сверху, они наотрез отказывались в это поверить! Еще более удивительным было поведение пациентов с повреждениями левой части мозга. Такие пациенты, как правило, не могут разговаривать, и, следовательно, вербально не могут назвать предмет, на который они смотрят, или описать его назначение. Тем не менее, они могут показать, что они правильно воспринимают геометрию предмета независимо от угла обзора. Это побудило Марра написать следующее: «Лекция Уоррингтон подтолкнула меня к следующим выводам. Во-первых, представление о форме объекта хранится в каком-то другом месте мозга, поэтому так сильно отличаются представления о форме предмета и его назначении. Во-вторых, зрение само может предоставить внутреннее описание формы наблюдаемого объекта, даже если этот объект не распознается обычным образом… Элизабет Уоррингтон указала на наиболее существенный факт человеческого зрения – оно говорит о форме, пространстве и взаимном расположении объектов.» Если это действительно так, то ученые, работающие в области зрительного восприятия и искусственного интеллекта (в том числе и те, кто работают в области машинного зрения) должны будут поменять теорию детекторов из экспериментов Хьюбела на совершенно новый набор тактик.

Теория модулей

Второй стартовой точкой в исследованиях Марра (после работы знакомства с работами Уоррингтон) является предположение, что наша зрительная система имеет модульную структуру. Выражаясь компьютерным языком, наша главная программа «Зрение» охватывает широкий круг подпрограмм, каждая из которых полностью независима от других, и может работать независимо от других подпрограмм. Ярким примером такой подпрограммы (или модуля) является стереоскопическое зрение, при помощи которого глубина воспринимается как результат обработки изображений, поступающих с обоих глаз, которые представляют собой немного отличающиеся друг от друга изображения. Прежде считалось, что чтобы видеть в трех измерениях, мы сначала распознаем изображения целиком, а потом решаем какие объекты находятся ближе, а какие дальше. В 1960 году Бела Жулес (Bela Julesz), который был удостоен премией Heineken в 1985 году, смог продемонстрировать, что пространственное восприятие двумя глазами происходит исключительно сравнением небольших различий между двумя изображениями, полученными с сетчаток обоих глаз. Таким образом, можно почувствовать глубину даже там, где нет и не предполагается никаких объектов. Для своих экспериментов Жулес придумал стереограммы, состоящие из случайно расположенных точек (см. рис. 11). Изображение, видимое правым глазом, идентично изображению видимому левым глазом во всем, кроме квадратной центральной области, которая обрезана и немного смещена к одному краю и снова совмещена с задним планом. Оставшийся белый промежуток затем был заполнен случайными точками. Если на два изображения (на которых не распознается никакого объекта) посмотреть сквозь стереоскоп, квадрат, который ранее был вырезан, будет выглядеть парящим над задним планом. Такие стереограммы содержат пространственные данные, которые автоматически обрабатываются нашей зрительной системой. Таким образом, стереоскопия является автономным модулем зрительной системы. Теория модулей показала себя достаточно эффективной.

От двухмерного изображения с сетчатки к трехмерной модели

Зрение – многошаговый процесс, который трансформирует двухмерные представления о внешнем мире (изображения с сетчатки) в полезную информацию для наблюдателя. Он начинается с двухмерного изображения, полученного с сетчатки глаза, которое, игнорируя пока цветное зрение, сохраняет только уровни интенсивности света. На первом шаге, при помощи только одиного модуля эти уровни интенсивности преобразуются в изменения интенсивности или, другими словами, в контуры, которые показывают резкие изменения интенсивности света. Марр точно установил, какой алгоритм задействуется в данном случае (описываемый математически, и, кстати, очень сложный), и как наше восприятие и нервные клетки исполняют этот алгоритм. Результат первого шага Марр назвал «первичным эскизом», который предлагает краткую информацию об изменениях интенсивности света, их взаимосвязях и распределении по зрительному полю (рис. 12). Это важный шаг, так как в видимом нами мире изменение интенсивности часто связано с естественными контурами объектов. Второй шаг подводит нас к тому, что Марр назвал «2,5-мерный эскиз». 2,5-мерный эскиз отражает ориентацию и глубину видимых поверхностей перед наблюдателем. Это изображение строится на основе данных не одного, а нескольких модулей. Марр придумал весьма широкое понятие «2,5-мерности», для того чтобы подчеркнуть, что мы работаем с пространственной информацией, которая видима с точки зрения наблюдателя. Для 2,5-мерный эскиза характерны искажения перспективы, и на данном этапе еще не может быть однозначно определено действительное пространственное расположение объектов. Изображение 2,5-мерного эскиза, представленного здесь (рис. 13), иллюстрирует несколько информационных участков при обработке такого наброска. Однако в нашем мозге изображения подобного вида не формируется.

какое изображение видит глаз человека
Рисунок 13. Рисунок 2,5-мерного эскиза – «отцентрированное представление глубины и ориентации видимых поверхностей»

До сих пор зрительная система работала с использованием нескольких модулей автономно, автоматически и независимо от данных о внешнем мире, сохраненных в мозге. Однако в ходе заключительной стадии процесса есть возможность сослаться на уже имеющуюся информацию. Этот последний этап обработки предоставляет трехмерную модель – четкое описание, независимое от угла зрения наблюдателя и подходящее для непосредственного сравнения со зрительной информацией, хранимой в мозге.

Согласно Марру, главную роль в построении трехмерной модели играют компоненты направляющих осей форм объектов. Те, кто не знаком с этой идей, могут счесть ее неправдоподобной, но в действительности есть доказательства, подтверждающие данную гипотезу. Во-первых, множество объектов окружающего мира (в частности, животные и растения) могут быть вполне наглядно изображены в виде трубочных (или проволочных) моделей. Действительно, мы без труда можем распознать, что изображено на репродукции в виде компонентов направляющих осей (рис. 14).

какое изображение видит глаз человека
Рисунок 14. Простые модели животных могут быть идентифицированы по их компонентам направляющих осей

Во-вторых, данная теория предлагает вероятное объяснение факта того, что мы способны визуально разобрать объект на составные части. Это отражено и в нашем языке, который дает различные имена каждой части объекта. Так, описывая тело человека, такие обозначения как «тело», «рука» и «палец» указывают на различные части тела согласно их компонентам осей (рис. 15).

какое изображение видит глаз человека
Рисунок 16. Модель одной оси (слева) разбивается на отдельные компоненты осей (справа)

В-третьих, данная теория согласуется с нашей способностью обобщать и в то же время дифференцировать формы. Мы обобщаем, группируя вместе объекты с одними и теми же главными осями, и дифференцируем, анализируя дочерние оси подобно ветвям дерева. Марр предложил алгоритмы, при помощи которых 2,5-мерная модель преобразуется в трехмерную. Этот процесс также в основном является автономным. Марр отметил, что разработанные им алгоритмы работают только в случае использования чистых осей. Например, в случае применения его к мятому листу бумаги возможные оси будет очень сложно идентифицировать, и алгоритм будет неприменим.

Связь между трехмерной моделью и зрительными образами, хранимыми в мозге, активируется в процессе распознавания объекта.

Здесь есть большой пробел в наших знаниях. Как эти зрительные образы хранятся в мозге? Как протекает процесс распознавания? Как производится сравнение между известными изображениями и только что составленным трехмерным изображением? Это последний пункт, которого успел коснуться Марр (рис. 16), но необходимо получить огромное количество научных данных, чтобы внести определенность в данном вопросе.

какое изображение видит глаз человека
Рисунок 16. Новые описания форм соотносятся с сохраненными формами сравнением, которое движется от обобщенной форме (сверху) к частной (внизу)

Хотя мы сами не осознаем различные фазы обработки зрительной информации, существует множество наглядных параллелей между фазами и различными способами, которыми мы в течение времени передавали впечатление о пространстве на двухмерной поверхности.

Так пуантилисты подчеркивают бесконтурное изображение сетчатки глаза, в то время как линейчатые изображения соответствуют стадии первичного наброска. Картины кубистов можно сопоставить с обработкой зрительных данных при подготовке к построению финальной трехмерной модели, хотя это, несомненно, и не было намерением художника.

Человек и компьютер

В своем комплексном подходе к предмету Марр стремился показать, что мы можем понять процесс зрения без необходимости привлечения знаний, которые уже доступны мозгу.

Таким образом, он открыл новую дорогу исследователям в области зрительного восприятия. Его идеи могут быть использованы для прокладки более эффективного пути к реализации зрительной машины. Когда Марр писал свою книгу, он, должно быть, знал о тех усилиях, которые его читателям предстоит приложить, чтобы следовать за его идеями и выводами. Это прослеживается по всей его работе и наиболее явно видно в заключительной главе «В защиту подхода». Это полемическое «обоснование» в размере 25 печатных страниц, на которых он использует благоприятный момент для обоснования своих целей. В данной главе он ведет беседу с воображаемым оппонентом, который нападает на Марра с аргументами, подобными следующим:

«Я все еще неудовлетворен описанием этого взаимосвязанного процесса и идеей того, что все оставшееся богатство деталей является лишь описанием. Это звучит как-то слишком примитивно. Поскольку мы продвигаемся все ближе к высказыванию, что мозг – это компьютер, должен сказать я все больше и больше опасаюсь за сохранение значения человеческих ценностей».

Марр предлагает интригующий ответ: «Утверждение, что мозг – это компьютер, корректно, но вводит в заблуждение. Мозг действительно узкоспециализированное устройство обработки информации, или скорее самое крупное из них. Рассмотрение нашего мозга как устройство обработки данных не принижает и не отрицает человеческие ценности. В любом случае, оно только поддерживает их и может, в конце концов, помочь нам понять, чем из такой информационной точки зрениями являются человеческие ценности, почему они имеют выборочное значение, и как они увязываются с социальными и общественными нормами, которыми обеспечили нас наши гены».

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *