Как мы видим то, что видим - Демидов Вячеслав Евгеньевич. Страница 42
Человек на протяжении своей жизни воспринимает массу информации, приобретает, как говорят, некоторый «алфавит» образов, с помощью которого быстро оценивает ситуации, принимает решения о своих действиях. С этими задачами лучше справляется левое полушарие. А правое способно решать такие зрительные задачи, для которых нет сложившегося «алфавита» образов, нет привычных зрительных описаний.
Левое полушарие – для привычного, правое – для нового. Так можно подвести итог.
Глава одиннадцатая. Стерео широкоэкранное для каждого
Кавказ подо мною. Один в вышине
Стою над снегами у края стремнины...
– Лежит ли позади пирамидки какой-нибудь большой предмет?
– Да, целых три: большой красный брусок, большой зеленый кубик и синий брусок.
– Поставьте теперь самый маленький брусок на зеленый кубик, на котором стоит пирамидка.
– Ладно.
– Теперь поставьте сверху самую маленькую пирамидку.
– Ладно.
С кем ведется диалог? С человеком, неважно различающим цвета или формы предметов, которого вводят в пространственные и цветовые соотношения вещей? Ничего подобного. Это диалог с роботом, опубликованный еще в 1970 г.
Бездушный автомат, как некогда поругивали кибернетические устройства, уже тогда вполне различал цвет, величину, форму, положение вещей в перцептивном пространстве, сформированном его «электронным мозгом». Робот оперировал машинным языком, в котором были точно определены такие понятия, как «поддерживается другим предметом», «находится впереди», «находится напротив», «затеняется другим предметом», «способен быть опорой» и так далее.
Как воспринимает машина цвет или величину, в общем, легко можно представить: цветное телевидение нам хорошо известно, измерить площадь изображения на экране и сравнить с имеющимися в памяти эталонами тоже не составит особого труда. А вот форма, взаимное расположение предметов...
Когда вещи закрывают друг друга, их контуры пересекаются. Может показаться, что это плохо: как же, глазу виден не весь предмет, а только часть. Однако именно данное обстоятельство дает зрению массу сведений, сведений очень полезных. В точках пересечений могут сходиться две, три или несколько линий. А типов таких узлов не так уж и много – всего восемь.
Рис. 63. Мы судим о пространственном расположении предметов, невольно анализируя, как они закрывают друг друга
Если узел выглядит как две линии, пересекающиеся под острым углом, то область снаружи и область внутри угла принадлежат, скорее всего, разным предметам. Когда три линии сходятся под углами, каждый из которых меньше 180° («вилка»), – это границы трех поверхностей одного и того же тела. А вот если один из этих трех углов больше 180° («стрелка»), то две области принадлежат одному предмету, а третья – другому. Очень вероятно, что это «другое» – фон, на котором развертывается действие. Узел «Т» (два смежных угла, равных в сумме 180°) обычно означает, что некая плоскость закрывает тело, которому принадлежат поверхности, образующие смежные углы узла.
Оглянитесь вокруг, и вы увидите, что узлы действительно служат важнейшими признаками глубины пространства. Каждый из них сообщает об отношениях поверхностей между собою, о том, принадлежат ли эти поверхности одному телу или нескольким, впереди или позади другой находится интересующая нас, над или под нею. Узлам присвоили наименования, сформулировали правила действия над ними и соответствующими поверхностями, чтобы робот смог ориентироваться в комнате, где разбросаны детские кубики.
Линии – узлы – зоны – поверхности – тела – общая сцена...
Правила опознания, заложенные в память ЭВМ робота, обеспечивают его ориентацию в пространстве, определяют путь расшифровки ситуации, в которой он оказался.
Для программистов стало большим открытием, что когда предметы отбрасывают тени, описать сцену и правильно распознать увиденное роботу-манипулятору куда проще,чем без теней. «Ранние исследования были более трудными из-за предположения, что тени – это всего лишь досадное усложнение», – отметил Патрик Уинстон, редактор книги «Психология машинного зрения».
Вторым открытием создателей опознающих программ было то, что для опознания формы следует анализировать не только расположение линий и теней, но и игру полутонов отраженного от предметов света. Инженеры, наконец, пришли к тому, что уже тысячелетия назад было известно людям искусства и модницам: щеки под действием темных румян кажутся более выпуклыми, делающая кожу матовой пудра придает лицу мягкость линий и нежность...
Робот, с которым велся разговор по поводу разноцветных кубиков, был одноглазым – смотрел вокруг себя объективом одной-единственной телевизионной камеры. И все-таки мир для него представлялся объемным, разделенным на передние и дальние планы. Это еще раз подтвердило известную офтальмологам истину: объемность и стереоскопичность – совсем не одно и то же, хотя такие понятия дилетантам кажутся на одно лицо.
Ну а мы с вами не хотим быть совсем уж дилетантами. В чем же разница?
Пушкин писал:
Эту разворачивающуюся, многоплановую картину поэт видел обоими глазами, бинокулярно.
Но и робот своим единственным монокулярным телеглазом рассмотрел бы все именно в такой последовательности. Ведь на расстояниях свыше километра объемность пейзажа воспринимается человеком только панорамно, то есть потому, что предметы закрывают друг друга и демонстрируют взору разнообразные узлы схода контуров (помните, как в горах или в космосе, когда такого последовательного перекрытия планов нет, люди грубо ошибались в расстояниях?). Есть и другие «вторичные» признаки, по которым мы видим панорамно и отличаем близкое и далекое: различны относительные размеры деревьев, людей, домов, изменяется их окраска (происходит то, что художники называют линейной и воздушной перспективами), по-иному ложатся светотени...
Уже классическим примером стал случай со знаменитым летчиком-испытателем Сергеем Николаевичем Анохиным, который, потеряв в авиакатастрофе глаз, сумел оставшимся глазом натренироваться в определении дальности и панорамном видении. Так что особая, предельно строжайшая врачебная комиссия признала его годным к летной работе. Ведь глаза дублируют друг друга, и каждый умеет определять объемность с помощью вторичных признаков.
А первичный признак – это стереоскопичность, действующая на расстояниях меньше километра (у некоторых людей, правда, область эта более обширна, достигает полутора километров, потому что глаза у них расставлены шире обычного). Объемность тут возникает потому, что правый и левый глаз видят предметы немного по-разному: не только фасад, на который направлены и где сходятся оптические оси обоих яблок, но каждый слегка и «свою» боковую сторону (такое уклонение от центрального рассматривания называют параллаксом, от греческого параллабо – уклоняюсь).
В среднем глаза наши разнесены на шесть с половиной сантиметров, отсюда и километровая граница стереоскопического зрения, дальше мозг уже не улавливает разницу изображений. А если нужно дальше, военные берут стереотрубы и дальномеры, в этих приборах база – расстояние между объективами – измеряется десятками сантиметров, даже метрами, соответственно возрастает стереоскопическая глубина пространства. При шестиметровой базе она достигнет двух десятков километров.