Журнал «Компьютерра» № 11 от 21 марта 2006 года - Компьютерра. Страница 13

Далее следует бурный обмен междометиями и жестами, которые должны пояснить собеседнику, какое именно «это» имеется в виду. Через минуту Волож, воспользовавшись знанием лингвистики и глубоким пониманием контекста, пожимает плечами: мол, сам решай. Сегалович решает ответить, но полезной информации в его ответе чуть больше, чем на среднестатистическом дорвее.

Сегалович: У нас на новостях справа есть колоночка, в которую выводятся имена людей, упомянутых в сюжетах. В общем, в этом направлении будем работать.

Себрант: Расскажи лучше про географию.

Журнал «Компьютерра» № 11 от 21 марта 2006 года - _631w5p2.jpg

Сегалович: Речь вот о чем. Мы в ближайшее время собираемся включить более детальный географический каталогизатор. Нынешний основан только на каталоге, а мы уже научились распознавать сайты и страницы на лету – исходя из IP-адреса, содержания страниц и других факторов. Благодаря этой технологии мы резко увеличим полноту локализованного поиска – текущий алгоритм все же сильно сужает спектр сайтов, доступных для регионального поиска. Объем информации увеличится в разы. Кроме того, география будет помогать отвечать на запрос, который, по нашим представлениям, является географически локализованным. Если человек ищет компьютер в Санкт-Петербурге…

Волож: (перебивает) …то мы будем выдачу немножко подстраивать.

Сегалович: Это тонкий вопрос, будем ли мы подстраивать выдачу. Но это качественно новый уровень продвижения в регионы. У нас, конечно, есть «Яндекс.Города», но это поверхностная локализация. А теперь вся база будет промаркирована посайтно, постранично – что к какому региону относится.

Волож: И если для заграничных сайтов регион – это Россия, то для нас регион – это, скажем, Новосибирская область.

Сегалович: Плюс работа с тематической классификацией. Более глубокое понимание, к какой теме относится сайт. И использование этого понимания при формировании выдачи. В общем, работы много. С «Картинками» работа идет, будем делать новую версию. Поправим, например, ранжирование, на «Картинках» оно пока не очень хорошее.

«КТ»: А насколько это все востребовано? Есть же масса людей, которые днюют и ночуют на одном портале, потому что на нем есть все, что им нужно для жизни.

Сегалович: У меня ощущение, что человек – исключительно требовательное существо. Лично я жутко недоволен «Яндексом». Я к нему отношусь одновременно и с любовью, и с ненавистью, и мне очень стыдно за огромное количество недоработок и недоделок.

Яндекс.Дети

Есть какие-то сервисы, которыми вы недовольны?

– Есть любимые, но больные дети, – первым отвечает Илья.

Это, например, кто?

– Ну, например, «Открытки», – печально произносит Себрант.

Илья Сегалович называет «Закладки» и «Народ».

– Но и до них дойдут руки, – философски замечает Волож.

Закладки, кстати, жалко. Идея ведь верная, что блистательно доказал несколько лет спустя del.icio.us.

– Да, любимые, – соглашается Сегалович, – да, жалко.

Аркадий Волож, еще минуту назад хладнокровно комментировавший естественный отбор, благодаря которому выживают лишь самые сильные и востребованные сервисы, неожиданно с какой-то ностальгией произносит: «2001 год. Хороший сервис».

– Модель была неправильная, как мы теперь понимаем, – говорит Сегалович. – Там нет тегов и круга друзей. Но я надеюсь, что мы сделаем revival.

– Мы потихонечку, – вступает Волож. – Руки-то у нас доходят до всего, но «только Аллах может все, и даже Аллах не может все сразу». Главный вопрос, который решается на еженедельных менеджерских встречах, – что мы НЕ делаем. Мы растем очень быстро, у нас уже работает больше трехсот человек, но все равно не успеваем.

«Поиск по блогам и форумам», по мнению присутствующих, – это любимый и здоровый ребенок. Довольно оригинальное на первый взгляд решение – объединить поиск по блогам с поиском по форумам – вызвано тем, что в «Яндексе» особых различий между блогами и форумами не делают: «Первое сообщение форума ничем не отличается от первого сообщения в комьюнити» (Сегалович); «Форумы и блоги – это почти один формат» (Волож). Еще один довод в пользу объединенной индексации – полезность форумов: «Сообщество ru_seo на порядки менее интересно форума на Search-Engines.ru» (Себрант).

– По-хорошему, нужно индексировать все, включая комментарии, что в блогах мы делать пока не умеем, – говорит Сегалович, – но при поиске следует понимать разную ценность разных частей – очевидно ведь, что первое сообщение форума важнее всех остальных. Форумы отдают RSS так, как они его отдают, и отрезать первое сообщение от остальных трудно. Но мы уже умеем искать отдельно по форумам и отдельно по блогам (это появится в ближайшей версии). Они у нас не в одной куче, это только так кажется.

Форумы и блоги отделены от «большого робота», потому что важный признак, объединяющий форумы и блоги и четко отделяющий их от всего остального, – это время. Даже выдача на запрос по умолчанию сортируется по времени.

– Вот эта временная шкала совершенно перестраивает мозги, – продолжает Илья, – это не алгоритм PageRank, а совершенно иная мера.

– Неслучайно мы по умолчанию выдаем результаты, отсортированные по времени, – замечает Андрей Себрант. – Трехлетней давности сообщение в форуме представляет скорее исторический интерес, каким бы релевантным оно ни казалось.

Несмотря на всю полезность поиска по блогам он явно не дотягивает до зарубежных аналогов и в первую очередь – до Technorati. Аркадий Волож с такой оценкой не согласен, но даже если и так, отмечает он, сервис не заброшен, работа над ним ведется очень активно. Илья Сегалович идет еще дальше.

– Technorati – лишь первый шаг в нужном направлении. Там есть задел, но нужно двигаться вперед. В блогах часто попадается ценная информация, но как ее оттуда извлечь? Мы уже решили похожую проблему с новостями, создав полностью автоматизированный сервис (руками только добавляются сами ресурсы). Ни один редактор не пострадал. Такой должности, как журналист, в «Яндексе» нет. Вот.

В голосе Ильи слышится такая неподдельная радость, что оба редактора нервно поправляют свои розовые кофточки, ожидая в следующую минуту услышать классическое «А теперь встали и вышли отсюда».

– Что касается блогов, – продолжает суровый директор по технологиям, – то есть чудовищный соблазн сделать что-то интересное. Прошлый год уже показал, что в блогосфере есть настоящие жемчужины, которые нужно доносить до внимания общественности. Они перетекают в новости в полуразмытом виде, и нужно научиться их находить и выделять. Вопрос – как это сделать. Технически это очень нетривиально.

Яндекс.Конкуренты

Место действия: большая переговорная в старом офисе «Яндекса».

Действующие лица те же.

Волож: Я против разговоров о том, что Google придет в Россию. Черная рука идет по улице, черная рука стучится в ваш подъезд…

Сегалович: (перебивает) Черный ящик на семи колесиках…

Волож: Ну хорошо. В разных лагерях рассказывали по-разному. Google приходит в Россию? Да он в 2001 году сюда пришел, как только открыл Google.ru! И посмотрите статистику – что-то принципиально изменилось? Они в прошлом году потрясающе выросли, кстати. С пяти до шести процентов. Без шуток – это 20-процентный рост.

Сегалович: Точно так же, как «Яндекс» пугают приходом Google, Google пугали Microsoft. Мол, придет страшный черный ящик на семи колесиках и всех раздавит, как клопов. MSN в прошлом году сделал свой поиск. И что? Пять лет кричали о том, что Microsoft сделает лучший в мире поиск, Microsoft перетащила себе большую команду из Китая, разработала, выпустила – и в результате доля MSN в поиске упала с пятнадцати процентов до семи.

«КТ»: А кстати, как вы «отвоевали» Mail.ru у Google?

Волож: Ничего про это не знаю. Они сами к нам пришли. И это был большой подарок судьбы. А почему? Видимо, им понравилось, сколько денег мы собираем.