Все под контролем: Кто и как следит за тобой - Гарфинкель Симеон. Страница 85

Совершенно очевидно, что Amazon знает, что я покупал книги по определенной тематике, и хочет помочь мне купить еще!

Другие системы потенциально гораздо более сложны. Когда я был аспирантом MTI и работал в Лаборатории медиа, там было большое количество различных видов интеллектуальных агентов. Джон Оруэнт [John Orwant], научный сотрудник, разработал программу Doppelganger. [229] «Doppelganger – мистическое чудовище из германского фольклора, которое выбирало невинного человека и подглядывало за ним из тени, наблюдая за его привычками, встречами, эмоциями и особенностями, – объяснял Оруэнт. – Через некоторое время Doppelganger начинал походить на этого человека, вести себя как этот человек, и в конечном счете становился этим человеком незаметно для всех».

Созданный Оруэнтом программный Doppelganger пытался сделать то же самое. Программа наблюдала за действиями человека и пыталась построить его модель: что ему нравится и не нравится, наиболее значимые события его жизни. Чем больше информации о вас могла собрать программа, тем точнее она подстраивалась под вас. После этого Doppelganger делал свою базу данных доступной другим программам на вашем компьютере, отвечая на их запросы. Например, глядя, какие электронные издания вы читаете, Doppelganger строил модель ваших предпочтений: какие статьи вам нравятся, а какие нет. На следующий день программа для чтения электронных газет могла спросить Doppelganger, включать или нет конкретную статью в ежедневную подборку для вас. Чтобы не нарушить личную тайну пользователя, вся конфиденциальная информация при передаче ее по компьютерной сети шифровалась при помощи PGP. [p67] Другой сотрудник Лаборатории медиа, Макс Метрал [Мах Metral] разработал ассистента для электронной почты. Программа наблюдала за действиями пользователя, строила его модель, после чего пыталась ее задействовать. Например, если программа замечала, что вы читаете электронные письма от вашей матери сразу же после их получения, то программе начинала автоматически открывать их для вас сразу после их поступления в почтовый ящик, после чего складывала в отдельную папку. [230]

Нет никаких причин, по которым программа останавливалась бы на этом. Умная программа для чтения почты может делать разбор входящей корреспонденции и помещать найденную там информацию в базу данных на естественном языке. После этого вы можете задать программе вопрос, например: «Когда я последний раз получал сообщение из Франции?» или: «Как называется модель нового ноутбука, недавно анонсированная IBM?» Компьютер даст вам ответ при помощи этой базы данных.

Это вовсе не научная фантастика. В 1991–1996 годах Агентство перспективных исследований американского Министерства обороны [US Department of Defense Advanced Research Project Agency, DARPA] спонсировало конкурс «Конференция по распознаванию сообщений» [Message Understanding Conference, MUC]. Целью конкурса было создание компьютерной программы, которая извлекала бы информацию из большого количества текстовых сообщений и облекала ее в машиночитаемую форму. В рамках MUC-6 участники написали программу, которая могла сканировать газетные статьи и искать в них информацию об изменениях среди руководящего персонала. Например, MUC-6 был предоставлен следующий текст:

МсСаnn создал новую, так называемую глобальную систему сотрудничества, состоящую из всемирно известных финансовых директоров и творческих партнеров. Известно, что Питер Ким [Peter Kim] был приглашен в сентябре в WPP Group's & Walter Thompson на должность вице-президента, главного специалиста по стратегическому планированию.

В результате получились следующие данные:

«ОЧЕРЕДН_СОБЫТИЕ-940224 0133-3»:= ОЧЕРЕДН_ОРГ: «ОРГАНИЗАЦИЯ-94 022 4 0133-1» ПОСТ: «Вице-президент, главный специалист по стратегическому планированию»

ВХ_И_ВЫХ: «ВХ__И_ВЫХ-9402240133-5» ПРИЧИНА_ВАКАНСИИ: ПРОЧ_НЕИЗВ

КОММЕНТАРИЙ: «Ким стал вице-президентом… в МсСапп» «ВХ И ВЫХ-9402240133-5»:=

ВХ/ВЫХ_ЛИЧНОСТЬ: «ЛИЧНОСТЬ-94 022 40 133-5»

НОВЫЙ__СТАТУС: ВХ

В_РАБОТЕ: ДА

ПРОЧ_ОРГ: «ОРГ-9402240133-8»

ОТН_ПРОЧ_ОРГ: ВНЕШН_ОРГ

КОММЕНТАРИЙ: «Ким пришел из другой организации (должность не упомянута)» / «Точно известно, что сейчас он работает, назначен несколько месяцев назад»

«ОРГАНИЗАЦИЯ-9402240133-1»:=

ОРГ_НАЗ: «McCann-Erickson»

ОРГ_ПСЕВДОН: «МсСапп»

ОРГ ОПИСАН: «одно из крупнейших мировых агентств»

ОРГ_ТИП: КОМПАНИЯ

«ОРГ-9402240133-8»

0РГ_НАЗ: «J. Walter Thompson»

ОРГ_ТИП: КОМПАНИЯ

«ЛИЧНОСТЬ-94 022 4 0133-5»

ЛИЧН_ИМЯ: «Питер Ким»

В конечном счете вы можете использовать такую программу для создания большой машиночитаемой базы данных из неструктурированной информации, типа сообщений электронной почты или газетных статей.

Другая система была разработана в рамках проекта START в Лаборатории ИИ Массачусетского технологического института [MIT AI Lab]. [231] В отличие от MUC, START была спроектирована, чтобы отвечать на вопросы, заданные на английском языке. Например, вы могли задать START вопрос:

«WHAT DOES START STAND FOR? [Для чего предназначена START?]

И получить ответ:

START stands for the Syntactic Analysis Using Reversible Transformations.

[START [p68] предназначена для синтаксического анализа с использованием обратимых преобразований.]

Борис Кац [Boris Katz], научный сотрудник Лаборатории ИИ, дал программе прочитать информацию об институте и поместил ее на web-сервер Лаборатории. Любой человек мог задать программе типовой вопрос и получить адекватный ответ. Например, вы могли спросить: „Где находится Лаборатория ИИ?“ и получить ответ: „Лаборатория искусственного интеллекта Массачусетского технологического института находится в Кембридже. Почтовый адрес лаборатории – MIT AI Laboratory, 545, Technology Square, Cambridge, MA 02139“.

Система также знала, как получить доступ к информации на других компьютерах в Интернете. Например, вы могли напечатать запрос:

= =» SHOW ME A MAP OF CAMBRIDGE

[Покажи мне карту Кембриджа]

Система ответила:

Sorry, I don't have a map of Cambridge Massachusetts.

Click on the map of Massachusetts if you want to see it.

(Простите, но я не располагаю картой Кембриджа, штат Массачусетс.

Активируйте ссылку «карта штата Массачусетс», если желаете посмотреть на нее.)

Щелчок мышью на подчеркнутом тексте вызывал карту штата Массачусетс с сервера Time Warner Pathfinder.

Вы можете задать START вопрос о населении Иордании, и она, проконсультировавшись в «Географическом справочнике ЦРУ», даст ответ, что в июле 1999 года оно составляло 4 561 147 человек. Вы можете спросить ее о времени в Сиэтле, и она, обратившись к базе данных временных зон, а также к значению текущего времени в Кембридже, ответит на ваш вопрос.

Хотя START может показаться похожей на другие понимающие естественные языки программы, засоряющие в последние 30 лет область искусственного интеллекта, у нее есть одна важная особенность. Другие системы используют сложные выражения, написанные на загадочном компьютерном языке, чтобы получить знания, задать вопросы и посмотреть на результат; большая же часть START написана непосредственно на английском языке. Это значит, что огромное количество относительно неподготовленных людей могут вводить в нее информацию. Это также означает, что программа может самообучаться путем чтения информации, которая уже находится в Интернете.

Технология агентов-помощников существует уже сегодня и постоянно совершенствуется. Но кто контролирует агентов?

вернуться

229

J. Orwant, «For Want of a Bit the User was Lost: Cheap User Modeling», IBM Systems Journal, 35: 3 &4, 1996.

вернуться

p67

PGP (Pretty Good Privacy) – программа для шифрования и цифровой подписи сообщений, разработанная Филом Циммерманом [Phi Zimmermann].

вернуться

230

Yezdi Lashkari, Max Metral and Pattie Maes «Collaborative Interface Agents» («Агенты совместного интерфейса»), MIT Media Laboratory, 1994 (не опубликовано). Доступно для загрузки по адресу ftp://ftp.media. mit.edu/pub/agents/interface-agents/generic-agents.ps.

вернуться

231

Информационный сервер START, называемый «START Natural Language Question Answering System» находится по адресу http:// www.ai.mit.edu/projects/infolab. Упомянутый «Географический справочник ЦРУ 1999» [русское издание: Географический справочник ЦРУ'2000. Екатеринбург: У-Фактория, 2001.] доступен по адресу http://www. odci.gov/cia/publications/factbook.

вернуться

p68

Видимо, аббревиатура и создана из этого предложения: SynTactic Analysis using Reversible Transformations.