За стеной фильтров. Что Интернет скрывает от вас? - Паризер Эли. Страница 44

Также RFID дает системе управления зданием возможность отслеживать любые объекты в помещении и их местонахождение. При наличии достаточно мощного сигнала RFID может стать решением проблемы потерянных ключей. Он ставит нас, как пишет автор Forbes Рейхан Салям, перед лицом «мощной перспективы — реального мира, проиндексированного так же четко и системно, как Google проиндексировал и организовал Всемирную сеть» [394].

Это и будет «интеллектуальное окружение». Его концепция основана на простом наблюдении: те вещи, которые вам принадлежат, то, куда вы их помещаете, и то, что вы с ними делаете, отлично характеризует, что вы за человек и каковы ваши предпочтения. «В ближайшем будущем, — утверждает группа экспертов по ambient intelligence под руководством Дэвида Райта, — каждый произведенный продукт — наша одежда, деньги, бытовая техника, краска на стенах, ковры на полах, наши машины, что угодно, — будет сопровождаться встроенным интеллектом и сетями крошечных датчиков и активаторов, которые кое-кто называет "умной пылью"» [395].

А вот третий вид мощных сигналов, которые все дешевле получать и обрабатывать. В 1990 году секвестрование одной «буквы» ДНК — пары нуклеотидов — обходилось в 10 долларов. К 1999 году затраты упали до 90 центов. В 2004 году они пересекли новый порог — 1 цент, — а сейчас, когда я пишу эти строки, этот процесс стоит уже одну тысячную долю цента. К моменту, когда книга выйдет из печати, секвенирование, несомненно, станет еще дешевле. Где-нибудь лет через пять мы, должно быть, сможем секвенировать любой произвольно взятый человеческий геном по цене дешевле сэндвича в закусочной.

Все это похоже на эпизод фильма «Гаттака» [396], но стремление добавить такие данные в наши профили будет весьма сильным. Хотя мы понимаем, что ДНК определяет далеко не все — другая клеточная информация, гормоны и условия нашей среды играют большую роль, — все-таки есть множество несомненных корреляций между генетическим материалом и нашим поведением. Мы не только сможем предсказывать и предотвращать будущие проблемы со здоровьем значительно более точно — хотя и этого будет достаточно, чтобы многие из нас выстроились в очередь. Собирая вместе информацию ДНК и данные о поведении — например, данные iPhone о местоположении людей или обновления в Facebook, — предприимчивый ученый сможет провести статистический регрессионный анализ всего общества.

В этих данных кроются схемы и модели, о которых ученые даже и не мечтали. Если правильно задействовать их, они обеспечат невообразимо точную фильтрацию. В этом мире почти весь наш объективный опыт будет фиксироваться, переводиться в цифры и использоваться для корректировки нашего окружения. Возможно, главной проблемой будет придумывание вопросов, которые потребуется задавать в связи с этими огромными потоками битов. И программы все чаще будут задавать эти вопросы сами.

Конец теории

В декабре 2010 года исследователи из Гарварда, Google, «Британской энциклопедии» и «Словаря американского наследия» (American Heritage Dictionary) объявили о результатах совместного проекта продолжительностью в четыре года [397]. Команда проекта составила базу данных, охватывающую все содержание книг более чем за пять столетий. В общей сложности в нее вошли 5,2 миллиона книг на английском, французском, китайском, немецком и других языках. Теперь любой, кто зайдет на страницу Google N-Gram, может ввести запрос и посмотреть, как те или иные слова и фразы набирают и теряют популярность с течением времени: от появления их в роли неологизмов до затухания и забвения. По мнению исследователей, этот инструмент дает и еще более грандиозные возможности — «количественный подход к гуманитарным наукам», позволяющий по-научному картировать и измерять культурные изменения.

Уже первые находки показывают, насколько мощным может оказаться этот инструмент. Изучая отсылки к прошлым датам, исследователи обнаружили, что «с каждым годом человечество быстрее забывает свое прошлое». Также они утверждали, что их разработка может стать «мощным инструментом для выявления цензуры и пропаганды» [398] — благодаря выделению стран и языков, в которых наблюдается статистически ненормальное отсутствие определенных идей или фраз. Например, упоминания о Льве Троцком гораздо реже появляются в книгах на русском языке середины XX века, чем в английских или французских публикациях того же периода.

Несомненно, этот проект — колоссальное подспорье и исследователям, и просто любопытной публике. Однако едва ли единственным мотивом участия Google в нем была помощь науке. Помните слова Ларри Пейджа о том, что он хотел создать машину, «способную понять все», которую некоторые назвали бы искусственным интеллектом? Информация — ключевой элемент подхода Google к созданию интеллекта, и в пяти миллионах оцифрованных книг ее просто безумное количество. Чтобы вырастить настоящий искусственный интеллект, его нужно хорошо кормить.

Чтобы понять, как может работать этот механизм, рассмотрим сервис Google Translate, который сейчас обеспечивает сносный автоматический перевод почти с 60 языков [399]. Если вы думаете, что он создан на основе очень большой и весьма изощренной подборки словарей, то ошибаетесь. Инженеры Google решили опереться на вероятностный подход: они разработали программу, которая определяет, какие слова чаще появляются рядом с другими, а потом обработали огромные массивы доступных данных на разных языках, чтобы натренировать программу на них. Одним из самых крупных массивов были базы заявок на патенты и торговые знаки. В этом качестве они весьма уместны, поскольку во всех заявках говорится примерно одно и то же, они находятся в открытом доступе и их зачастую нужно подавать одновременно на разных языках. Translate «напустили» на сотню тысяч патентных заявок на английском и французском, и программа смогла установить, что когда в английской версии документа появляется слово word, то во французской версии с высокой вероятностью — слово mot. И по мере того как пользователи поправляют Translate, она переводит все лучше и лучше [400].

То, что Translate делает с иностранными языками, Google намеревается проделать практически со всем остальным. Соучредитель компании Сергей Брин выразил интерес к проработке генетических данных. Сервис Google Voice накапливает миллионы минут записей человеческой речи, которые инженеры надеются использовать при создании нового поколения программ для распознавания речи. Сервис Google Research собрал большую часть научных статей. И, естественно, пользователи вливают в него миллиарды поисковых запросов каждый день; это еще одна богатая жила культурной информации. Если бы у вас был секретный план-высосать данные всей цивилизации и создать с их помощью искусственный интеллект, — лучшего и пожелать нельзя.

Становясь все более изощренным, протомозг Google откроет новые, совершенно замечательные возможности. Ученые из Индонезии смогут сразу пользоваться новейшими докладами из Стэнфорда (и наоборот), не дожидаясь, пока их кто-то переведет. Не исключено, что через несколько лет мы сможем говорить с носителем другого языка с автоматическим переводом; это откроет новые каналы межкультурной коммуникации и понимания.

Но чем «интеллектуальнее» окажутся эти системы, тем труднее будет их контролировать и понимать. Не совсем верно утверждение, будто они живут своей собственной жизнью, — все-таки это программы. Но они достигают такого уровня сложности, при котором даже программисты не могут в полной мере объяснить выдаваемый результат.

вернуться

394

Reihan Salam. Why Amazon Will Win the Internet. Forbes, July 30, 2010, www.forbes.com/2010/07/30/amazon-kindle-economy-environment-opinions-columnists-reihan-salam.html.

вернуться

395

David Wright, Serge Gutwirth, Michael Friedewald, Yves Punie, and Elena Vildjiounaite. Safeguards in a World of Ambient Intelligence. Berlin/Dordrecht: Springer Science, 2008, Abstract.

вернуться

396

Фильм Эндрю Никкола, действие которого происходит в будущем, где все люди генетически запрограммированы жить определенным образом. Прим. пер.

вернуться

397

Digitized Book Project Unveils a Quantitative 'Cultural Genome', http://www.seas.harvard.edu/news-events/news-archive/2books.

вернуться

398

Digitized Book Project Unveils a Quantitative 'Cultural Genome', http://www.seas.harvard.edu/news-events/news-archive/2books.

вернуться

399

http://translate.google.com/support/?hl=en.

вернуться

400

Nikki Tait. Google to Translate European Patent Claims. Financial Times, Nov. 29, 2010, http://www.ft.com/cms/s/0/02f71b76-fbce-lldf-b79a-00144feab49a.html.