Оглавление
06 августа 2006, 21:28  

Мэтт Каттс. Часть четвертая.


День четвертый. Я могу разговаривать со стенами. Они говорят со мной голосом Мэтта Каттса. Я знаком со всеми языковыми семьями по всему миру. Моя клавиатура смеется надо мной. Добрые милосердные выходные, неужели вы никогда ко мне не придете? Не могу остановиться… не могу остановиться и продолжаю записывать слова Мэтта…

Мэтт гордо демонстрирует свою рубашку с оборотнями и единорогами, на которой изображены силуэты оборотней и единорогов, дерущихся друг с другом в полнолуние. Под изображением находится надпись "Это происходит прямо сейчас". Мэтт говорит: "У нас есть оборотни и единороги. Смертельные враги с начала времен, и эта битва происходит прямо сейчас!".

1. Поскольку все больше становится центров слежения за данными, следует ли все результаты в одном классе IP-адресов считать одинаковыми большую часть времени, за исключением моментов, когда вы вводите данные, или их следует считать различными из-за того, что вы пробуете применить к ним различные методики? И что следует делать с точки зрения здравого смысла, использовать прямые IP-адреса, когда поступают сообщения о проблемах, или использовать названия центра данных GFE?

Давайте поговорим о центрах данных. Вернемся во времена динозавров (тут Мэтт совершает некие действия, которые показывают, что он находится под впечатлением от динозавров, имитируя их визг и хватание добычи зубами, или просто он недавно посмотрел японский мультфильм и страдает сейчас от эпилептических припадков). Когда динозавры бродили по Земле, вы могли управлять поисковой системой с одного-единственного компьютера. Те времена давно прошли, поскольку теперь у вас должен быть очень и очень мощный компьютер или что-то очень и очень маленькое в качестве объекта для поиска, или у вас должна быть поисковая система Google, мог бы я предложить.

В те времена вам приходилось иметь дело с центрами данных. На заре существования центров данных вы могли придумать некую уловку с DNS, благодаря чему вы всегда могли достичь различных центров данных, и в то же время Google обеспечивал очень мощную поддержку сбалансированной загрузки, использовались некоторые очень интересные методики, благодаря которым можно было быть уверенным, что различные центры данных способны прекрасно работать.

Так что ваш главный вопрос должен быть таким: должны ли все элементы в одном и том же блоке IP быть, грубо говоря, одинаковыми? И, конечно же, они должны быть теми же самыми, потому что это обычно тот же самый центр данных, но, конечно же, не всегда. Ладно, давайте я вам приведу пару примеров. Если один центр данных потерпел неудачу или другой центр данных выпал из цикла, то даже если вы обращаетесь к одному IP-адресу, вы можете обратиться к другому центру данных.

Даже если все выглядит так, как будто вы последовательно обращаетесь к одному и тому же центру данных, причем Google негласно поддерживает сбалансированную загрузку, вы можете также обратиться и к другому центр данных. Эта ситуация довольно редка, но не так уж и редка. Так что когда вы видите людей, которые ведут спор в онлайне по поводу центров данных, что довольно часто происходит на сайте Webmaster World, они могут фактически видеть совершенно разные вещи, даже если они обращаются к одному и тому же IP-адресу.

Другая точка зрения, о которой я тоже хотел бы сказать и о чем я говорил в последний раз на конференции PubCon в Бостоне, заключается в том, что в центрах данных часто присутствует множество различных элементов. Так что всякий раз, когда происходит очередное обновление алгоритма или мы испытываем некую новую программу, мы часто пробуем сначала эту программу на каком-либо центре данных, чтобы удостовериться, что качество программы именно такое, какое мы ожидали, основываясь на предварительных оценках наподобие выше приведенной. Центры данных действительно отличаются друг от друга, поскольку являются очень сложными комплексами данных, благодаря чему мы можем испытывать различные программы в различных центрах данных. Как правило, в случае обращения к одному и тому же IP-адресу вы будете обращаться к одному и тому же центру данных, но это не обязательно.

Также на конференции PubCon в Бостоне я привел пример видов элементов, которые находятся в различных центрах данных. Это тот самый случай, когда элементы становятся гораздо более сложными, чем они были раньше. Так что Google предлагает более мощное по своей силе планирование, поэтому случайному человеку становится довольно трудно просто посмотреть на обратную сторону центров данных или даже попытаться представить, каким образом взаимодействуют элементы в них.

Если же говорить о IP-адресе и названии GFE, то, насколько я понимаю, никто не говорит на эту тему достаточно много, за исключением, может быть, сайта Webmaster World. Вы можете использовать или IP-адрес или два вида буквенного кода центра данных, потому что мы можем учитывать оба эти вида. Так что если вы скажете нам про один способ действий, мы сможем сказать вам про другой способ действий, который будет вам доступен.

Вообще же говоря, существуют, вероятно, гораздо лучшие способы проведения вашего времени, чем слежение за центрами данных. Я думаю, это время было бы нужно использовать для того, чтобы поработать над вашим контентом, это было бы гораздо лучше, потому что это влияет на продвижение вашего сайта в поисковой системе, Особенно важно это время для того, чтобы следить за обновлениями рейтинга страницы или еще чего-нибудь, поэтому не стоит так уж часто следить за различиями в центрах данных, тем более, как я уже сказал, нет смысла проверять каждый центр данных каждый день.

Вместо того, чтобы выяснять "Кто же здесь крутой, я или поисковая система", возможно, будет лучше потратить немного больше времени на то, чтобы обратить внимание на свои логи и на производительность сайта, основанную на этих логах.

2. Можно ли искать только домашние страницы? Я пробовал указывать "-inurlhtml" и "-inurlhtm" и тому подобное, РНР, ASP, но фильтрация идет недостаточная.

Это действительно хорошее предложение, Питер. Я не подумал об этом. Можно было бы быстро использовать эту возможность, и надо будет ее предложить, но я думаю, все, что люди будут делать, - это смотреть на знак тильда в URL. Я запишу этот вопрос как предложение пользователя и посмотрю, захотят ли наши специалисты дать этой идее какое-нибудь развитие и предложить ее людям. Честно говоря, предполагаю, что эта идея займет довольно низкое место в списке приоритетов, поскольку весь синтаксис, о котором вы говорите, состоит из ряда расширений, хотя эта схема, вероятно, будет работать вполне неплохо.

3. Разъяснение.

Ах да, я намереваюсь разъяснить свою позицию по поводу шрифтов, обычного, жирного, подчеркнутого и курсива. Мне кто-то задавал один из вопросов о том, что лучше, использовать жирный шрифт или использовать обычный, поскольку жирный шрифт - это то, что каждый человек использовал раньше, когда динозавры бродили по Земле, в то время как обычный шрифт - это то, что рекомендует W3C. В последний раз, когда я об этом думал, это было вчера вечером, я подумал, что мы сами слишком-слишком-слишком часто предпочитали жирный шрифт обычному, и поэтому я сказал сам себе: "Большую часть времени можно об этом совсем не волноваться".

Прекрасно, когда существуют на свете инженеры. Один из таких инженеров показал мне программный код, и я сам увидел все своими глазами, как Google оценивает жирный и обычный шрифт, а именно - придает им одинаковый вес. Так что спасибо, Пол, за эту возможность, я по-настоящему ее ценю. Кроме того, я сам видел, как этот инженер Пол обнаружил элемент программного кода, который можно было посмотреть каждому, и при этом подчеркнутый и курсивный текст также обрабатывались одинаково и одинаково оценивались. Ну вот, теперь вы все знаете. Двигайтесь вперед и делайте все так, как хочет того W3C. Пишите тексты, пишите их семантически правильно, и не волнуйтесь по поводу старых тегов, потому что Google относится к ним точно так же, как и к обычному шрифту.

4. Увидим ли мы еще ваши сообщения о котятах в будущем?

Я думаю, они еще появятся. Я уже пробовал сфотографировать своих котят и пытался сделать так, чтобы они не двигались и сидели на одном месте, но они немного испугались фотовспышки, так что надо еще будет посмотреть, смогу ли я их сфотографировать.

5. Что такое Google SSD, Google Gas, Google RS2, Google Mobile Marketplace, Google Weaver и другие сервисы, которые обнаружил Тони Раско?

Я думаю, это было очень умно - то, как Тони использовал свойства нашего сайта, чтобы обойти проверку наших сервисов, но я не собираюсь ничего говорить о том, что собой представляют эти сервисы.

6. Вы можете рассказать о каких-нибудь темах, которые обсуждались на сессии по двойному контенту, которая состоялась на конференции оптимизаторов?

Я уже показывал видеоролик в виде предпросмотра по поводу этой сессии, но я думаю, что и в дальнейшем мы будет говорить о разном закулисье. Джерри там будет, множество других людей там будет, и все мы будем говорить на закулисные темы. Что я могу сказать по существу, так это то, что Google проводит большую работу по обнаружению двойного контента во время работы поисковых пауков, это происходит практически за миллисекунду, в то время, когда пользователь еще только смотрит на экран. Мы гарантируем, что в точности устанавливаем двойной контент, и гарантируем, что анализируем данные, расположенные по соседству предполагаемого двойного контента. Мы проводим хорошую работу относительно возможных неувязок в работе нашей поисковой системы и большинство уязвимых мест закрываем.

Лучший совет, который я могу дать, состоит в том, чтобы удостовериться, что ваши страницы не похожи друг на друга, а для этого они должны выглядеть максимально непохожими друг на друга. Если они содержат действительно различный контент, множество людей побеспокоится по поводу печатной версии представленного текста, а кто-то попросит файл Word .doc, чтобы сравнить с HTML-файлом. Как правило, вас не должно это пугать. Если у вас похожий контент на различных доменах, то есть, может быть, у вас одна версия сайта на французском языке, а другая на английском, вам действительно не стоит беспокоиться по этому поводу.

Если же у вас есть совершенно одинаковый контент, например, для канадского сайта и для сайта .com, это, возможно, один из тех вариантов, когда мы решим, что один из этих сайтов кажется нам более подходящим для пользователя и именно его мы и покажем, но в этом случае вовсе не обязательно наступает какое-либо наказание или что-либо подобное. Если вы хотите этого избежать, вы можете попробовать сделать так, чтобы ваши шаблоны были очень и очень не похожими один на другой. Но в самом общем случае, если контент похож, самое лучшее - это просто позволить нам показать пользователям то, что мы посчитаем самым лучшим из контента вашего сайта.

7. Индексирует ли Google и оценивает ли рейтинг сайтов с блогами иным способом, чем обычные веб-сайты?

Не совсем так. Кто-то уже спрашивал меня по поводу ссылок, полученных с сайтов с расширением .gov and .edu, и по поводу ссылок, полученных с сайтов второго уровня наподобие .gov.pl, и о том, ценятся ли они так же, как ссылки с сайтов .gov, и факт состоит в том, что мы не имеем права говорить об этом подробно. "О, эта ссылка с ODP, или .gov или .edu, так давайте дадим ей чуть больше веса". Это происходит только потому, что у этих сайтов обычно более высокий рейтинг страницы, потому что большее количество людей обычно с ними связывается, и среди этих людей много очень респектабельных людей и сайтов.

Так вот, сайты с блогами не имеют какого-либо особенного отличия, если вы, конечно, не используете специальный поиск в блогах, который ориентирован исключительно на блоги. В теории мы могли бы присуждать им рейтинг по-другому, но в своей большей части обычный поиск вполне удовлетворяет нашим запросам и работает вполне удовлетворительно.

Перевод
http://www.seomoz.org/blogdetail.php?ID=1261
[53] [54] [55] [56] [57] [58] [59] [60] [61] [62]




июль 2006 г.
пн вт ср чт пт сб вс
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

август 2006 г.
пн вт ср чт пт сб вс
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

сентябрь 2006 г.
пн вт ср чт пт сб вс
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30




Rambler's Top100
Page created in 0.01791 seconds