Оглавление
20 марта 2007, 17:55
Интервью с Мэттом Каттсом из компании Google на тему поиска нового поколения
Записано Ричардом Макманусом
На прошлой неделе я имел удовольствие взять интервью у Мэтта Каттса, руководителя группы по сетевому спаму компании Google. Темой нашего общения стал поиск нового поколения. В данном случае для того, чтобы взять интервью у кого-либо из Google, мне пришлось рассказать им, каким образом наш сайт Read/WriteWeb отражал у себя проблему поиска нового поколения, так что было бы замечательно (и естественно) узнать, что Google думает по этому поводу!
Мэтт Каттс – очень известная личность в Google, которого, и это очевидно, постоянно атакуют фанаты на различных конференциях по оптимизации поисковых систем. Статья о Мэтте Каттсе, размещенная в Wikipedia, утверждает, что он является одним из изобретателей самых известных патентов Google , которые касались поисковых систем и спама. Я хотел бы предварить это интервью одним примечанием: Google соблюдает политику отказа от обсуждения своих конкурентов, так что некоторые из моих первоначально подготовленных вопросов были пропущены или перефразированы.
Ричард:
Когда мы пишем на своем сайте Read /WriteWeb о поиске нового поколения, уже много раз мы позиционировали этот поиск следующим образом: сможет ли этот поиск стать следующей вехой в развитии Google? Ведь очевидно, что Google усердно трудится над разработкой технологий поиска нового поколения. Вы можете дать нам краткий обзор того, над чем Google работает в настоящее время? Именно в отношении поиска следующего поколения, то есть персонализированного поиска, искусственного интеллекта и тому подобных вещей.
Мэтт:
Я думаю, что персонализация имеет очень большие шансы на то, чтобы помочь улучшить процесс поиска для обычного пользователя. Один из самых замечательных моментов здесь заключается в том, что вам в действительности не требуется совершать множество действий. Как только вы решили, что есть что-то, чем вы в особенности интересуетесь, Google после этого может позаботиться о большом количестве остальных деталей. Недавно я видел в Интернете один пост, где кто-то жаловался на метаданные и на необходимость использовать эти метаданные, и при этом одна из интересных особенностей персонализации состоит в том, что она абсолютно бесплатна для пользователя. Так что если касаться вопроса поиска следующего поколения, я думаю, что этот момент, персонализация, - это нечто такое, что является для нас очень привлекательным.
Ричард:
Вы можете привести нам пару примеров того, как Google осуществляет свою персонализацию?
Мэтт:
Я думаю, что локализация – это один из явных видов персонализации. Если вы напечатали в строке поиска, например, «футбол», в выдаче результатов вы обнаружите итоги встреч команд в США, которые будут отличаться от результатов, если вы находитесь в Великобритании. Также запрос о «банке» в Google выдаст вам в результатах новозеландские банки, если вы находитесь в Новой Зеландии, или австралийские банки, если вы находитесь в Австралии. Нужно знать, что существуют большие различия в выдаче результатов по разным территориям. Так что вот вам персонализация на уровне отдельной страны, но она уже показывает вам тот потенциал, которого вы можете достичь.
Ричард:
Также совсем недавно Google провел персонализацию среди аккаунтов Google, так что, как я это понимаю, персонализация может коснуться чего угодно, в том числе главного поиска Google?
Мэтт:
Абсолютно точно. И это очень хорошо, потому что та модель действий, которую используют пользователи, была значительно упрощена. Так что теперь, если вы вошли в систему поиска Google, мы сможем помочь вам персонализировать ваши результаты поиска. И это действительно наша великая победа, потому что эта методика облегчает для людей возможность узнавать новое. Если я не хочу получать персонализированные результаты поиска, я могу просто кликнуть справа вверху и выйти из системы. Но если я нахожусь в системе (а я могу это проверить, посмотрев на свой адрес электронной почты справа вверху), то тогда я знаю, что автоматически получаю все выгоды персонализации.
Ричард:
Что вы думаете о технологиях, связанных с семантикой (например, с такой как Hakia)? Насколько важным для поиска является понимание естественного языка, и делает ли что-нибудь Google в этом направлении?
Мэтт:
Мы действительно обращаем самое пристальное внимание на большое количество различных технологий, так что я мог бы определить подход Google как очень прагматический. Мы следим за всей технологической сферой, поэтому мы всегда готовы сказать: «Отлично, какие еще у нас есть сферы деятельности, которые могут оказаться полезными для наших пользователей?» Даже с точки зрения истории нам всегда было очень интересно следить за развитием семантических технологий. Например, в том случае, если вы проводите поиск по ключевой фразе «Сколько штатов в Америке?».
Некоторые поисковые системы, которые объявляют себя семантическими, не смогут продемонстрировать хорошую работу при выведении нужных результатов поиска, в то время как Google сможет провести очень хорошую работу, даже если вы при этом будете думать: «Интересно, и как система сможет справиться с естественным языком, и как она сможет справиться с семантикой этого поискового запроса?». И я думаю, что Google становится полезным в основном из-за того, что Интернет имеет очень большой размер и обладает большим количеством данных, что в действительности сильно помогает нам понимать значения слов и синонимов.
Так что мы действительно обладаем прагматическим подходом и не делаем все свои ставки исключительно на какой-то один способ совершения поиска. Мы одновременно исследуем огромное количество различных элементов.
Ричард:
Так вы можете утверждать, что Google уже сейчас осуществляет определенный тип семантической технологии, которые уже интегрирован в нынешний набор услуг, обеспечиваемых вами?
Мэтт:
Да, я могу сказать, что большая часть технологии на основе семантики уже сейчас встроена в структуру Google и используется в рамках поисковой системы.
Ричард:
Одним из самых популярных постов, появившихся в этом году на нашем сайте, стал пост, озаглавленный «Лучшие сто альтернативных поисковых систем». Какие из существующих альтернативных поисковых систем больше всего впечатлили вас в последнее время? Или, если вы не можете назвать конкретные названия, каковы те технологии, которые вам понравились? Список поисковых систем в феврале содержал в себе 32 изменения названий, что, как я думаю, показывает огромную скорость распространений инноваций в сфере поиска.
Мэтт:
Вы также провели по-настоящему серьезную работу, опубликовав еще один пост, где вы провели опрос и задали вопрос, какие технологии станут использоваться в поиске в будущем. Самое интересное, что 209 голосов было подано за персонализированный поиск, и они стояли сразу за искусственным интеллектом. Я думаю, что многие из перечисленных там тенденций очень интересны. Имея множество данных, мы можем попробовать очень разные элементы, начиная от визуализации и заканчивая кластеризацией или уточнением запроса. Иногда, если говорить об основе наших поисковых результатов, если мы думаем об их релевантности, мы можем взять запрос пользователя и предположить другие запросы, связанные с этим запросом.
И это именно та технология, которую Google не запускал некоторое время, потому что мы хотели проверить ее и получить наилучший результат. Не имело смысла запускать эту технологию, пока мы не нашли комбинацию, которая, как мы думаем, стала бы наилучшей для пользователя. Но я все равно думаю, что мы следим за большинством различных технологий и остаемся осведомленными о том, что люди делают в данной сфере и что они пытаются делать.
Ричард:
SearchMash – это экспериментальный сайт Google, который был представлен в октябре-ноябре 2006 года и где были реализованы некоторые новые идеи пользовательского интерфейса на основе Ajax. Можем ли мы ждать, что какие-либо особенности SearchMash в скором времени будут включены в главный пользовательский интерфейс сайта google.com?
Мэтт:
Существует возможность, но не гарантия, конечно же, что те особенности, которые вы увидели на SearchMash, будут представлены в поиске Google. Это всегда некий обмен информацией, и нам приходится учитывать такие вещи, как, например, будут ли их поддерживать различные браузеры, скольким пользователям эти особенности понравятся, а также сколько времени и сил может понадобиться, чтобы реализовать данную возможность.
Например, была такая интересная особенность на SearchMash, где вы могли начать печатать что-нибудь в строке поиска, и вам автоматически предлагались варианты подстановки различных слов в поле поиска. Но эта система не стала бы работать в случае каждого отдельного браузера. Я думаю, что самая большая ценность SearchMash заключается в том, что этот сайт позволяет нам пробовать великое множество различных пользовательских интерфейсов, то есть таких вещей, которые могли бы привлечь обычного пользователя. И мы можем попробовать действительно необычные интерфейсы и посмотреть, как люди на них реагируют.
Ричард:
В нашем списке альтернативных поисковых систем есть некоторые поисковые системы с совершенно потрясающими интерфейсами, например, в одной из них был говорящий аватар. Так что я предполагаю, что вы смогли бы в будущем поэкспериментировать с подобными видами пользовательского интерфейса на своем сайте SearchMash…
Мэтт:
Да, это забавно, потому что как только вы уходите из сферы Google, у вас появляется намного больше возможностей в том, чтобы попробовать различные вещи, в том числе появление результатов в виде изображений, результатов из новостных колонок и тому подобное, то есть любые привлекательные вещи. Так что тут довольно большой простор для забавных нововведений, и я думаю, что что-то подобное мы также введем.
Ричард:
Google Base – это в своей основе база данных структурированного контента, которая является родной для множества различных вертикальных уровней в настоящее время (например, для работы, транспортных средств, классификаций и т.д.). Также есть GData и Google Base API. Можете ли вы объяснить, как все эти элементы сочетаются вместе и какое влияние (если оно есть) они будут иметь на развитие сферы поиска? Я предполагаю, что структурированные данные в любом случае будут очень полезными для поиска Google, так что, может быть, вы поможете нашим читателям понять, что собой представляют остальные элементы…
Мэтт:
Это, конечно, соответствует действительности, что структурированные данные действительно интересны, потому что если у вас есть данные в различных полях, вы сможете предложить различные типы поиска. И GData - в особенности интересная вещь, потому что она почти обеспечивает способ включить данные в Google. Она также подбрасывает множество интересных возможностей. Например, Google обладает другими, разными типами поиска (а у нас есть поиск патентов, поиск кода, поиск книг), и все это немного отличные друг от друга вертикальные уровни поиска, которые имеют более свободную форму.
Но вы можете, конечно же, провести поиск по новой вертикали. Поэтому поиск по полям деятельности или в структурированном контенте (если вы захотите к нему обратиться) может определенно быть полезен в зависимости от того, насколько гибки условия поиска. Так что меня довольно сильно этот вопрос интересует, но всегда становится очень трудно сказать, какие элементы будут жить в будущем и в каком направлении развиваться.
Ричард:
Есть ли у вас планы относительно вертикального поиска за пределами блогов, я имею в виду главные вертикали… Например, компания Microsoft недавно купила компанию по поиску среди товаров о здоровье. А Google собирается делать что-либо подобное в таких важных вертикалях поиска?
Мэтт:
Что ж , есть два ответа на этот вопрос. Во-первых, такие вещи, как поиск патентов, поиск программного кода и поиск книг… еще большой вопрос, захотите ли вы их назвать вертикальным поиском, поскольку тут есть что обсудить. Они проводят поиск по различным типам данных. Так что, например, как в случае с системой Google Calendar, проводящей поиск по календарной дате, так и в случае с Gmail , проводящей поиск в электронной почте, это всякий раз полностью отличная от других и всегда новая возможность поиска. И это действительно очень и очень интересно. Я хотел бы дать вам возможность самим решать, можно ли называть этот сервис вертикальным поиском или нет.
Мой второй ответ заключается в том, что я думаю, что действительно очень интересно то, что Google делает некий шаг назад и рассматривает вертикальный поиск как общую проблему в целом, в результате чего наша компания ввела поисковую систему Google Custom Search Engine ( CSE). Она основана на общей системе Google, и самая замечательная вещь во всем этом заключается в том, что она позволяет любому человеку самому определить, какая поисковая система ему нужна. И это не только касается каналов получения информации, мы говорим о возможности легко и просто добавить пять тысяч URL, и не только для того, чтобы можно было их фильтровать, но и чтобы иметь возможность усилить некоторые наборы адресов URL или ослабить и убрать из результатов поиска другие наборы адресов URL.
Так что же лично для меня является во всем этом самым интересным? Если вы размышляете о новом вертикальном поиске, например, о подкастах, вы можете открыть Google и сказать себе: «Так-так-так, как же мы будем искать подкасты?» Или же вы можете войти в систему Google Custom Search Engine, где, как я думаю, уже десятки людей создали свою собственную систему поиска подкастов, используя возможности CSE. Например, на днях я обнаружил поисковую систему для «технических подкастов», так что вы можете провести поиск в Google и получить доступ ко всем подкастам, где говорится на тему техники и т.д.
Я думаю, что это действительно интересный подход. Я, конечно, мог бы сказать, что мы хотим выдать лучшие результаты пользователям, так что в некоторых случаях для Google имело бы смысл искать определенные области. Но к общей проблеме часто обращаются, когда дают возможность решить самим людям, если можно так выразиться, и дают им возможность создать свои собственные поисковые системы. Так что мне очень забавно наблюдать за тем, какое большое количество людей включаются в эту систему, и насколько большой рост испытывает сама сфера создания индивидуальной поисковой системы.
Ричард:
Ваша специфическая сфера деятельности – это борьба со спамом. Можете ли вы рассказать нам последние новости о том, каким образом Google пытается очистить свои результаты? Каковы тенденции в борьбе со спамом?
Мэтт:
За последний год мы обработали большое количество материала, чтобы выдать пользователям самые лучшие результаты поиска, в том числе в сфере борьбы с сетевым спамом. Например, у нас есть внутренняя статистика, которая показывает, что сейчас мы добиваемся гораздо большего успеха, чем даже пару лет назад, что позволяет нам говорить, что пользователь даже случайно не сможет наткнуться на спам.
Одна из крупных тенденций прошлого года, которая продолжается также и в нынешнем году, - это интернационализация. Для нас является действительно важной возможность предложить свободный от спама поиск на любом языке, в том числе на французском, итальянском, немецком, китайском или японском. Так что большая часть того, что мы делаем со своей группой, заключается в том, чтобы убедиться, что наш новый подход срабатывает одинаково хорошо и по отношению ко многим другим языкам. Так что это, вероятно, самая крупная тенденция последнего времени.
Ричард:
С приобретением в прошлом году компании YouTube, которая соединилась с системой Google Video, стало возможным искать и индексировать видео, а это, очевидно, одна из самых важных вещей, которые позволяют двигаться вперед. Мы не говорим уже о возможности вставить в видеоролик рекламу. Что именно делает Google в области видеопоиска?
Мэтт:
Видео само по себе является очень интересным и вызывающим явлением для поиска, потому что у него есть аудио- и визуальные компоненты, которые сами по себе также являются интересными и иногда более трудными для индексации, чем слова по одиночке. Хорошие новости заключаются в том, что, используя большое количество различной информации, Google часто может выдавать очень хорошие результаты поиска. Даже больше, чем просто хорошие, как вы могли бы ожидать, особенно если учесть, как трудно индексировать такой тип контента, как видео.
Но эта задача также является очень волнующей, потому что у нас есть показатель репутации, который называется PageRank, это тот показатель, который показывает, как много людей указывают ссылку на ваш сайт, а также показывает качество этих входящих ссылок. Так что бывает очень интересно подумать о чем-то наподобие репутации в сфере видеопоиска, неважно, в Google Video и YouTube , потому что у вас вовсе не обязательно появятся ссылки.
У вас могут быть вещи, которые могут оказаться чем-то наподобие ссылок, но вам при этом надо смотреть на качество пользователей и качество рейтингов. Я вспоминаю о большом количестве способов, которые дают Google замечательную способность судить об энергии людей и о силе доверия, а также о том, как эти данные можно применить в различных областях.
Заключение.
Выражаем свою благодарность Мэтту Каттсу за ослепительное интервью о Google и поиске следующего поколения! Мы хотели бы услышать комментарии людей или вопросы по этой теме, так что оставляйте свои комментарии ниже.
Перевод
http://www.readwriteweb.com/archives/interview_with_matt_cutts_next_generation_search.php
Адрес заметки: http://masterseo.org/post_1174402524.html
Обязательные для заполнения поля выделены цыплячьим цветом.
1. Не более 50 знаков.
2. При указании будет опубликован. Спам-роботам недоступен.
3. Адреса, начинающиеся с http:// преобразуются в ссылки автоматически.
Для этого отделяйте их от текста ПРОБЕЛАМИ с обеих концов.
Теги запрещены.
|