Как мы видим то, что видим - Демидов Вячеслав Евгеньевич. Страница 42

Человек на протяжении своей жизни воспринимает массу информации, приобретает, как говорят, некоторый «алфавит» образов, с помощью которого быстро оценивает ситуации, принимает решения о своих действиях. С этими задачами лучше справляется левое полушарие. А правое способно решать такие зрительные задачи, для которых нет сложившегося «алфавита» образов, нет привычных зрительных описаний.

Левое полушарие – для привычного, правое – для нового. Так можно подвести итог.

Глава одиннадцатая. Стерео широкоэкранное для каждого

Кавказ подо мною. Один в вышине

Стою над снегами у края стремнины...

Пушкин

– Лежит ли позади пирамидки какой-нибудь большой предмет?

– Да, целых три: большой красный брусок, большой зеленый кубик и синий брусок.

– Поставьте теперь самый маленький брусок на зеленый кубик, на котором стоит пирамидка.

– Ладно.

– Теперь поставьте сверху самую маленькую пирамидку.

– Ладно.

С кем ведется диалог? С человеком, неважно различающим цвета или формы предметов, которого вводят в пространственные и цветовые соотношения вещей? Ничего подобного. Это диалог с роботом, опубликованный еще в 1970 г.

Бездушный автомат, как некогда поругивали кибернетические устройства, уже тогда вполне различал цвет, величину, форму, положение вещей в перцептивном пространстве, сформированном его «электронным мозгом». Робот оперировал машинным языком, в котором были точно определены такие понятия, как «поддерживается другим предметом», «находится впереди», «находится напротив», «затеняется другим предметом», «способен быть опорой» и так далее.

Как воспринимает машина цвет или величину, в общем, легко можно представить: цветное телевидение нам хорошо известно, измерить площадь изображения на экране и сравнить с имеющимися в памяти эталонами тоже не составит особого труда. А вот форма, взаимное расположение предметов...

Когда вещи закрывают друг друга, их контуры пересекаются. Может показаться, что это плохо: как же, глазу виден не весь предмет, а только часть. Однако именно данное обстоятельство дает зрению массу сведений, сведений очень полезных. В точках пересечений могут сходиться две, три или несколько линий. А типов таких узлов не так уж и много – всего восемь.

Как мы видим то, что видим - imgDB30.png

Рис. 63. Мы судим о пространственном расположении предметов, невольно анализируя, как они закрывают друг друга

Если узел выглядит как две линии, пересекающиеся под острым углом, то область снаружи и область внутри угла принадлежат, скорее всего, разным предметам. Когда три линии сходятся под углами, каждый из которых меньше 180° («вилка»), – это границы трех поверхностей одного и того же тела. А вот если один из этих трех углов больше 180° («стрелка»), то две области принадлежат одному предмету, а третья – другому. Очень вероятно, что это «другое» – фон, на котором развертывается действие. Узел «Т» (два смежных угла, равных в сумме 180°) обычно означает, что некая плоскость закрывает тело, которому принадлежат поверхности, образующие смежные углы узла.

Оглянитесь вокруг, и вы увидите, что узлы действительно служат важнейшими признаками глубины пространства. Каждый из них сообщает об отношениях поверхностей между собою, о том, принадлежат ли эти поверхности одному телу или нескольким, впереди или позади другой находится интересующая нас, над или под нею. Узлам присвоили наименования, сформулировали правила действия над ними и соответствующими поверхностями, чтобы робот смог ориентироваться в комнате, где разбросаны детские кубики.

Линии – узлы – зоны – поверхности – тела – общая сцена...

Правила опознания, заложенные в память ЭВМ робота, обеспечивают его ориентацию в пространстве, определяют путь расшифровки ситуации, в которой он оказался.

Для программистов стало большим открытием, что когда предметы отбрасывают тени, описать сцену и правильно распознать увиденное роботу-манипулятору куда проще,чем без теней. «Ранние исследования были более трудными из-за предположения, что тени – это всего лишь досадное усложнение», – отметил Патрик Уинстон, редактор книги «Психология машинного зрения».

Вторым открытием создателей опознающих программ было то, что для опознания формы следует анализировать не только расположение линий и теней, но и игру полутонов отраженного от предметов света. Инженеры, наконец, пришли к тому, что уже тысячелетия назад было известно людям искусства и модницам: щеки под действием темных румян кажутся более выпуклыми, делающая кожу матовой пудра придает лицу мягкость линий и нежность...

Робот, с которым велся разговор по поводу разноцветных кубиков, был одноглазым – смотрел вокруг себя объективом одной-единственной телевизионной камеры. И все-таки мир для него представлялся объемным, разделенным на передние и дальние планы. Это еще раз подтвердило известную офтальмологам истину: объемность и стереоскопичность – совсем не одно и то же, хотя такие понятия дилетантам кажутся на одно лицо.

Ну а мы с вами не хотим быть совсем уж дилетантами. В чем же разница?

Пушкин писал:

Здесь тучи смиренно идут подо мной;

Сквозь них, низвергаясь, шумят водопады;

Под ними утесов нагие громады;

Там, ниже, мох тощий, кустарник сухой;

А там уже рощи, зеленые сени.

Где птицы щебечут, где скачут олени.

Эту разворачивающуюся, многоплановую картину поэт видел обоими глазами, бинокулярно.

Но и робот своим единственным монокулярным телеглазом рассмотрел бы все именно в такой последовательности. Ведь на расстояниях свыше километра объемность пейзажа воспринимается человеком только панорамно, то есть потому, что предметы закрывают друг друга и демонстрируют взору разнообразные узлы схода контуров (помните, как в горах или в космосе, когда такого последовательного перекрытия планов нет, люди грубо ошибались в расстояниях?). Есть и другие «вторичные» признаки, по которым мы видим панорамно и отличаем близкое и далекое: различны относительные размеры деревьев, людей, домов, изменяется их окраска (происходит то, что художники называют линейной и воздушной перспективами), по-иному ложатся светотени...

Уже классическим примером стал случай со знаменитым летчиком-испытателем Сергеем Николаевичем Анохиным, который, потеряв в авиакатастрофе глаз, сумел оставшимся глазом натренироваться в определении дальности и панорамном видении. Так что особая, предельно строжайшая врачебная комиссия признала его годным к летной работе. Ведь глаза дублируют друг друга, и каждый умеет определять объемность с помощью вторичных признаков.

А первичный признак – это стереоскопичность, действующая на расстояниях меньше километра (у некоторых людей, правда, область эта более обширна, достигает полутора километров, потому что глаза у них расставлены шире обычного). Объемность тут возникает потому, что правый и левый глаз видят предметы немного по-разному: не только фасад, на который направлены и где сходятся оптические оси обоих яблок, но каждый слегка и «свою» боковую сторону (такое уклонение от центрального рассматривания называют параллаксом, от греческого параллабо – уклоняюсь).

В среднем глаза наши разнесены на шесть с половиной сантиметров, отсюда и километровая граница стереоскопического зрения, дальше мозг уже не улавливает разницу изображений. А если нужно дальше, военные берут стереотрубы и дальномеры, в этих приборах база – расстояние между объективами – измеряется десятками сантиметров, даже метрами, соответственно возрастает стереоскопическая глубина пространства. При шестиметровой базе она достигнет двух десятков километров.