Л гроховский руководство по внутренним факторам гроховский л

Page 1: Л.Гроховский - Руководство по внутренним факторам

руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав СтавскийSEO

Page 2: Л.Гроховский - Руководство по внутренним факторам

Page 3: Л.Гроховский - Руководство по внутренним факторам

руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав СтавскийSEO

Page 4: Л.Гроховский - Руководство по внутренним факторам

Леонид Гроховский, Михаил Сливинский, Алексей Чекушин, Станислав Ставский

SEO: руководство по внутренним факторам. – М.: Центр исследований и образова-ния «ТопЭксперт.РФ», 2011. – 133 с.

© Центр исследований и образования «ТопЭксперт.РФ»

© Леонид Гроховский, Михаил Сливинский, Алексей Чекушин, Станислав Ставский

Эта книга кардинально отличается от  аналогичных изданий: она написана оптимизаторами для оптимизаторов и является первым изданием по теме внутренних факторов в SEO. Авторы со-единили свои разноплановые познания в области внутренней оптимизации и смогли простым язы-ком изложить сложный материал. Теперь вы можете воспользоваться актуальной информацией и применить новые знания в своей практике, наиболее полно задействовав потенциал собственно-го сайта и улучшив его позиции в выдаче поисковых систем. Книга написана в соавторстве с лучши-ми аналитиками нашей профессии – Станиславом Ставским, Михаилом Сливинским и Алексеем Чекушиным. Их участие сделало книгу полезной не только для начинающих, но и для продвину-тых специалистов.

Page 5: Л.Гроховский - Руководство по внутренним факторам

Леонид Грохов-ский, В  SEO с 2005 года, в на-

стоящий момент ди-ректор по  технологии продвижения и автома-тизации компании «Оп-тимизм.ру», входящей в топ-10 SEO-компаний. Опыт продвижения – бо-лее 300 сайтов. Область

деятельности: автоматизация, аналити-ка, проведение исследований. Руководи-тель центра образования и исследований «ТопЭксперт.РФ», автор ряда публикаций в профессиональных изданиях, постоянный докладчик на  отраслевых конференциях. Руководитель разработки аналитической системы «СайтРепорт». Автор исследова-ния «SEO-альманах 2010». Специализиру-ется на продвижении порталов и крупных интернет-магазинов. Продвигал и консуль-тировал такие проекты, как championat.ru, woman.ru, rabota.ru, ucheba.ru, pressfoto.ru, aforex.ru, best-realty.ru, panasonic.ru. Пре-подает SEO в  Академии интернет-рекла-мы и  в  учебном центре «Специалист» при МГТУ им. Н. Э. Баумана. Ведущий про-граммы «ТопЭксперт.РФ» на интернет-те-левидении MEGAINDEX.TV.

Автор и преподаватель курсов:

«Основные ошибки в SEO от создания сайта до покупки ссылок»

«Пошаговая реализация SEO-стратегии для маркетологов и руководителей»

«Оптимизация сайтов: задействуем внут-ренние факторы»

«Источники привлечения внешних ссылок»

«Юзабилити, аналитика и  Яндекс.Ме-трика для SEO-специалиста»

«Комплексная стратегия продвижения»

«Автоматизация в SEO»

«Продвижение порталов и  крупных интернет-магазинов»

«Высший пилотаж в SEO»

«Полный курс SEO – 130 часов»

СоавторыМихаил Сливинский, руководитель отдела аналитики, Wikimart.ru; преподаватель учебного центра «ТопЭксперт.РФ»

алексей Чекушин, руководитель департамента продвижения, Wikimart.ru; преподаватель учебного центра «ТопЭксперт.РФ»

Станислав Ставский, руководитель направле-ния зарубежных проектов, Sape.ru; ex. аналитик веб-поиска Яндекса; преподаватель учебного центра «ТопЭксперт.РФ»

об авторе и соавторах

Page 6: Л.Гроховский - Руководство по внутренним факторам

Содержание

Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6введение в продвижение сайтов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

0.1. Понятие о внутренних факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

0.2. Понятие о внешних факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

0.3. Понятие о поведенческих факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

0.4. Комплексный подход к продвижению сайтов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Глава 1 . Перелинковка страниц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.1. Как вычисляется PageRank и почему это так важно знать . . . . . . . . . . . . . . . . . . . . . . . 24

• По материалам статьи в переводе Александра Садовского «Растолкованный PageRank» . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.2. Базовые схемы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25• Комплексное продвижение всего сайта . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26• Продвижение главной страницы под ВЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26• Продвижение разделов под СЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27• Продвижение внутренних страниц под НЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.3. Локальные схемы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Кольцо . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Куб . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Звезда . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.4. Правила перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.5. Способы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.6. Составление текста ссылки для перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

1.7. Создание модуля для перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40• Портал . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40• Интернет-магазин . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41• Корпоративный сайт . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42• Каталог . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Глава 2 . Устранение дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.1. Чем вредны дубликаты . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.2. Классификация дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.3. Кейсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49• Компания «БЕСТ-Недвижимость», www.best-realty.ru . . . . . . . . . . . . . . . . . . . . . . . . . 49• ММЦ «ОнКлиник», www.onclinic.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51• Магазин итальянской мебели, www.eurointerier.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.4. Способы устранения дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Page 7: Л.Гроховский - Руководство по внутренним факторам

Глава 3 . Инструкции для поисковых систем . . . . . . . . . . . . . . . . . . . . . . . 573.1. Зачем нужен robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.2. Robots.txt – универсальные директивы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.3. Robots.txt – директивы для Яндекса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.4. Правила составления robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.5. Разбор robots.txt на примерах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .61

3.6. Зачем нужен sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.7. Директивы sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.8. Правила составления sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.9. Пример sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.10. Принцип взаимодействия sitemap.xml и robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.11. Автоматизация добавления страниц в sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

Глава 4 . работа с авторским контентом . . . . . . . . . . . . . . . . . . . . . . . . . . . 714.1. Уникальность контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.2. Как защитить контент от воровства? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74

4.3. Как воровать контент? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.4. Отсутствие и недостаток контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76• Разбор решения на примере www.mobiguru.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.5. Автоматизация наполнения Description, Keywords, Title . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.6. Автоматизация генерации контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79• Автоматизация генерации описаний товаров . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79• Автоматизация генерации технических характеристик (уровень 1) . . . . . . . . . . . . . 79• Автоматизация генерации технических характеристик (уровень 2) . . . . . . . . . . . . . 80

4.7. Обнаружение дубликатов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80• Инструкция по обнаружению дубликатов вручную . . . . . . . . . . . . . . . . . . . . . . . . . . . 81• Способы автоматизации обнаружения дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Глава 5 . Коды ответов сервера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855.1. Код ответа 200 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .85

5.2. Коды ответов 301/302/303/307/3** . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.3. Код ответа 404 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

Глава 6 . Стандарты W3C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 896.1. Правила HTML-разметки для SEO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.2. Проверка верстки на соответствие стандартам W3C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Глава 7 . SEO-аналитика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97Глава 8 . Исследование «SEO-альманах 2010» . . . . . . . . . . . . . . . . . . . . . . 107Семинары и курсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117DVD-семинары и курсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

Содержание 5

Page 8: Л.Гроховский - Руководство по внутренним факторам

П риветствую! Меня зовут Леонид Гроховский. В настоящий момент я  работаю директором по  тех-

нологии продвижения и  автоматизации в компании «Оптимизм.ру». Моя область деятельности  – исследование поисковых алгоритмов и  создание технологии про-движения. Также я  занимаюсь разработ-кой стратегии продвижения ключевых клиентов компании, т. е. порталов, круп-ных интернет-магазинов и сайтов – лиде-ров тематики. В SEO с 2005 года.

В этой книге я стремился собрать воеди-но свои познания в  области внутренней оптимизации и  доступным языком изло-жить этот материал, чтобы вы смогли при-менить почерпнутую здесь информацию в своей практике. Мне хочется, чтобы в ре-зультате вы смогли задействовать потен-циал собственного сайта и улучшили его позиции в выдаче поисковых систем. Кро-ме того, мне удалось привлечь лучших ана-литиков нашей профессии  – Станислава Ставского, Михаила Сливинского и Алек-сея Чекушина. Они стали соавторами этой книги и дали комментарии по вопросам PRO-уровня, сделав книгу интересной не только для начинающих, но и для про-двинутых специалистов.

Следует отметить, что книга, которую вы держите в  руках, кардинально отличает-ся от аналогичных изданий. Она написана оптимизатором для оптимизаторов. Я пи-сал не об абстрактном поисковом продви-жении, а сосредоточился на практических рекомендациях, поэтому здесь органично сочетаются краткие фундаментальные

Предисловие

Page 9: Л.Гроховский - Руководство по внутренним факторам

понятия с многочисленными конкретны-ми советами, которые являются остроак-туальными сегодня и останутся таковыми завтра. Это первое издание по данной теме. Вероятно, очень скоро нам придется столк-нуться с новыми исследованиями и новы-ми факторами ранжирования, изменится значимость этих факторов и способы воз-действия на них. Рад избавить вас от лиш-него беспокойства.

Технологически работы по продвижению сайта делятся на два этапа: оптимизация и  продвижение. В  этой книге мы пого-ворим о  первом этапе, который включа-ет в себя все работы, проводимые внутри сайта: это работа с  текстом, ссылками, настройками сервера, HTML-версткой, а  также создание инструкций для  поис-ковых систем. Здесь также описаны спо-собы автоматизации генерации текстов, заголовков и  метатегов, перелинковки. Эта информация пригодится специали-стам, продвигающим крупные порталы и интернет-магазины.

Продвигая сайт, я  всегда стараюсь мак-симально использовать потенциал вну-тренних факторов. Мой подход к продви-жению тесно связан с  автоматизацией, аналитикой и проведением исследований. На то есть ряд причин.

В 2010 году количество конференций, по-священных SEO, увеличилось в  два раза. Очевиден и  рост интереса к  образова-тельным мероприятиям: чаще проводят-ся семинары и курсы, открываются новые центры обучения. SEO-бум – закономерное следствие того, что технологии продвиже-ния усложнились и ценность информации очень сильно возросла. Рядовым SEO-спе-циалистам, чтобы не выпасть из обоймы, необходимо постоянно повышать свою квалификацию, консультируясь у  более опытных коллег.

Особая прослойка экспертов, имеющих практическое подтверждение высокого

Рецензия на книгу Леонида Гроховского «SEO: руководство по внутренним факторам»

Книга Леонида очень необычна! Прежде всего, тем, что в ней много практики и не так много теории. Немногие авторы

трудов, посвященных поисковой оптимизации, раскрывают практические методы работы. Это происходит из‑за того, что мир SEO быстро меняется. И пока написанное выходит в свет, большая часть знаний уже устаревает.В данной книге сделана, на мой взгляд, достаточно удачная попытка раскрыть именно практические инструменты оптимизации сайтов. Достоинство ее и в том, что она узко‑специализированная. Книга целиком и полностью посвящена только внутренним факторам оптимизации сайта: структуре, контенту, перелинковке, написанию файла robots.txt и другим аспектам работы с сайтом.Порадовало меня и большое количество реальных примеров из практики автора, наглядно иллюстрированных.Издание, несомненно, будет полезно всем специалистам по оптимизации для закрепления уже имеющихся знаний, а также начинающим оптимизаторам для приобретения новых знаний по SEO.

С уважением, Иван СевоСтьянов, генеральный директор компании «вебПроекты»

Предисловие 7

Page 10: Л.Гроховский - Руководство по внутренним факторам

уровня их  знаний и  обладающих ценной информацией, в SEO-сообществе уже сфор-мировалась. В их числе – руководители ли-дирующих компаний, разработчики анали-тических программ и систем автоматизации продвижения, высококвалифицированные SEO-профессионалы, успешно работаю-щие с самыми конкурентными тематиками. Под моим руководством в конце 2010 года группа таких экспертов провела исследо-вание факторов ранжирования, которое получило название «SEO-альманах 2010». В ходе исследования было рассмотрено бо-лее 200 факторов, сгруппированных в бло-ки. Нами применялась методология эксперт-ных оценок, были привлечены 26 ведущих SEO-экспертов. Исследование получило ши-рокий резонанс в SEO-кругах и за их преде-лами. Результаты проделанной работы, ка-сающиеся внутренних факторов, изложены в приложении к этой книге. Комментарии некоторых экспертов вы будете встречать и в процессе чтения основной части.

Вообще, говоря о тенденциях поискового продвижения сегодня, можно сделать сле-дующие выводы:

1 . Снижается значение покупных ссылок

«Священная война» с автоматическим про-движением набирает обороты, и  очевид-но, что успех сейчас на стороне Яндекса. Можно уверенно говорить о том, что сте-пень влияния покупных ссылок на  ран-жирование сведена к  минимуму. Стоит ожидать еще большего ужесточения, так что биржам ссылок уже сейчас необходи-мо становиться на путь повышения каче-ства площадок. Впрочем, такая ситуация не  стала для  кого-то  громом среди ясно-го неба: представители Яндекса не едино-жды предрекали «смерть» платных ссылок.

2 . возрастает значение внутренних факторов

Факторы, которые поддаются влиянию оптимизаторов, стали гораздо менее

Одной из первых задач, с которой я столкнулся после того, как возглавил отдел маркетинга в компании Adrenalin

Forex, была задача по поисковой оптимизации ее сайта. К тому моменту компания уже успела поработать по данной задаче с несколькими крупными SEO‑агентствами и, полностью разочаровавшись в нулевых результатах, перешла на само‑стоятельное SEO‑продвижение. К сожалению, предыдущий специалист так и не смог добиться высоких показателей, совмещая работу по продвижению с целым перечнем иных задач, соответствующих его компетенции и должности в компании.Таким образом, я пришел к выводу, что требуется поиск нового партнера по продвижению сайта компании с четко обозначен‑ными планами и обязательствами по их выполнению. После первой встречи с Леонидом появилось ощущение, что это тот человек, который обладает всем необходимым опытом для решения данной задачи. Тем не менее, учитывая преды‑дущий опыт компании, прошло несколько этапов согласования договора по оптимизации, где финансовые взаиморасчеты были привязаны к конкретным результатам работы и срокам их достижения.После подписания всех документов и начала нашей совмест‑ной деятельности агентством было подготовлено ТЗ, где было описано, какие тексты потребуется написать и как они должны размещаться на сайте для эффективного его продвижения. По условиям договора, текст готовился копирайтерами агентства, но здесь мы столкнулись с проблемой восприятия «оптимизаторских» текстов посетителями сайта. Говоря проще, в компании изначально были заданы особые стандарты к содержанию сайта, а именно требования по простоте, лаконичности и доступности материалов. Поэтому те тексты, которые написал копирайтер агентства, мы однозначно не могли позволить разместить на сайте компании. Требо‑валось подготовить такой текст, чтобы, если кому‑то вдруг и захотелось бы его прочитать, у него не возникло бы даже подозрений, что текст написан не для него, а для поисковых роботов. В результате кропотливого труда эти тексты удалось подготовить собственными силами. Итогом мы гордимся и по сей день, ведь написать понятный, простой и осмыслен‑ный текст с постоянно повторяющимися словами в строго заданном формате – весьма непростая задача.Не прошло и пары месяцев, как мы поняли, что проделали эту сложную работу совсем не зря, наблюдая, как наши позиции в поисковиках стремительно стали подниматься. А уже спустя полгода они по самым конкурентным запросам Forex и «Фо‑рекс» вышли на 2 место, что на первых этапах работы казалось практически невозможным.

отЗЫв КЛИентА

8 Предисловие

Page 11: Л.Гроховский - Руководство по внутренним факторам

значимыми. Те  же, на  которые повлиять очень сложно, а  порой и  нереально, вы-шли на первый план. Что ж, против лома нет приема, а  на  любое действие проти-водействие найдется: оптимизаторам не-обходимо повышать квалификацию, рабо-тать над своим подходом к продвижению и сосредотачивать внимание на внутрен-них факторах.

3 . Каждая тематика может иметь свои особенности продвижения

Введение алгоритма машинного обуче-ния «Матрикснет» не прошло бесследно: сейчас каждая конкретная тематика име-ет свою специфику продвижения, и  спе-цифика эта может зависеть еще и от типа запросов. Например, подходы к продвиже-нию однословного запроса и запроса более конкретного могут отличаться коренным образом. Технология продвижения многих запросов теперь еще и напрямую зависит от географической принадлежности сайта.

Резюмируя все вышесказанное, подчерк-нем: продвигать сайты стало сложнее. Да, было проделано много работы по раз-грузке оптимизаторского труда: создава-лись ссылочные агрегаторы, переводящие продвижение в  автоматический режим. И что же мы имеем сегодня? Необходимо буквально вручную прорабатывать вну-тренние факторы и  напрямую договари-ваться о  размещении ссылок на  качест-венных тематических площадках. Сроки продвижения растягиваются. Конкурен-ция растет. Утешительным моментом в  сложившейся ситуации является ме-жду тем рост покупательской аудитории. К примеру, количество запросов «ноутбук», по данным Яндекс.Вордстат, за год вырос-ло с 1  589  943 (ноябрь 2009) до 2  591  179 (ноябрь 2010). Разумеется, конкретные по-казатели зависят от тематики, но в целом тенденция роста очевидна.

По  мере развития поисковых систем количество факторов ранжирования

Продвигать сайты стало сложнее. Да, было проделано много работы по разгрузке

оптимизаторского труда: создавались ссылочные агрегаторы, переводящие продвижение в автома‑тический режим. И что же мы имеем сегодня? Необходимо буквально вручную прорабатывать внутренние факторы и напрямую договариваться о размещении ссылок на качественных тематиче‑ских площадках. Сроки продвижения растягивают‑ся. Конкуренция растет.

Предисловие 9

Page 12: Л.Гроховский - Руководство по внутренним факторам

увеличивается. Разумно предположить, что в таких условиях достичь положитель-ного результата можно быстрее, если воз-действовать на все возможные факторы, пусть даже некоторые кажутся пустяко-выми. Помните о том, что многие из них, накладываясь друг на друга, при оценке влияния на ранжирование считаются с ку-мулятивным эффектом. Согласитесь, луч-ше сделать все, что в ваших силах, и видеть результат стараний, чем что-то упустить и размышлять, что же конкретно. Имен-но этому принципу я  следую в  своей деятельности. Для  анализа потенциала внутренних факторов под моим руковод-ством разработана аналитическая систе-ма «СайтРепорт». С  ее помощью можно воздействовать практически на  все фак-торы, описанные в этой книге. Подробно о возможностях «СайтРепорт» вы прочте-те в приложении. Там же вы найдете ин-формацию об  акциях и  скидочных купо-нах на мои семинары и консалтинговые услуги.

Наша книга поможет вам удержаться на плаву, адаптироваться к изменившим-ся условиям и  переориентировать свою стратегию на внутренние факторы. Если вы решите углубить свои знания еще боль-ше и  информации в  этой книге для вас окажется недостаточно, вы можете полу-чить подкрепление почерпнутым знаниям на одноименном платном семинаре «оп-тимизация сайтов: задействуем вну-тренние факторы», который проводит-ся раз в год. На семинаре вы поучаствуете в разборе реальных сайтов слушателей, за-дадите интересующие вас вопросы и полу-чите особые бонусы.

Наша книга поможет вам удержаться на плаву, адаптироваться к изменившимся

условиям и переориентировать свою стратегию на внутренние факторы.

10 Предисловие

Page 13: Л.Гроховский - Руководство по внутренним факторам

вы можете смело пропустить эту часть, если считаете себя опыт-ным оптимизатором. Информация,

представленная здесь, будет полезна тем, кто  только начинает свою деятельность на поприще продвижения сайтов.

Поисковое продвижение сайтов – это ком-плекс работ, направленных на улучшение позиций веб-ресурса в выдаче поисковых систем. Цель этих мероприятий – извле-чение коммерческой выгоды за счет при-влечения на сайт посетителей из поиско-вых систем.

Существуют 3 способа продвижения сайтов:

воздействие на внутренние факторы;

воздействие на внешние факторы;

воздействие на поведенческие факторы.

Также продвижение сайтов часто делят по типам факторов, на которые произво-дится влияние со стороны оптимизатора.

внутренние факторы – это все работы, проводимые над  сайтом, а  также домен и серверные настройки.

внешние факторы – это использование рекомендательных ссылок, размещаемых на внешних ресурсах.

Поведенческие факторы  – статистиче-ская информация о посетителях сайта, со-бираемая поисковыми системами.

Внутренние и внешние факторы подраз-деляются на динамические и статичные. Первые учитывают статистику, накоплен-ную за  некоторый временной промежу-ток, например, возраст сайта, динамику

введение в продвижение сайтов

Page 14: Л.Гроховский - Руководство по внутренним факторам

12 Введение в продвижение сайтов

прироста рекомендательных ссылок. Ста-тичные факторы учитывают текущие значения.

Для эффективного продвижения необхо-димо использовать все три вышеперечис-ленных способа. Они неразделимы и дол-жны использоваться в комплексе. Только такой подход позволяет добиваться успе-ха в SEO.

0.1. Понятие о внутренних факторах

Верстка (HTML-теги)

Эта группа факторов учитывает правиль-ность верстки страниц с точки зрения ме-ждународного стандарта W3C. В  этом плане важны HTML-теги, наделенные ло-гическим смыслом: заголовок страницы, заголовки абзацев, смысловые выделе-ния текста, метатеги и др. Поисковые си-стемы учитывают текстовое содержание этих тегов и по ним определяют содержа-ние страниц. Обратите внимание: смыс-ловые теги не должны пересекаться друг с другом, например, заголовок не должен быть ссылкой.

Текст

Имеет значение не  только текстовое на-полнение страниц, но и ключевые слова, уникальность текста, объем информации и другие моменты. Очень важно наполнять сайт уникальным и полезным для посети-телей контентом, кроме того, нельзя дуб-лировать тексты на разных его страницах.

Настройки сервера

Настройки сервера – это инструкция, ко-торую получает поисковый робот, захо-дя на  каждую страницу. Эти настройки используются также при  перемещении страниц или  их  удалении с  сайта. Важ-но правильно настраивать эти инструк-ции, поскольку даже незначительные на  первый взгляд ошибки в  серверных

Продвигать сайты можно разными способами. Эти способы можно разделять

по многим критериям, например по степени соответствия рекомендациям поисковых си‑стем (черные и белые методы). Поисковики плохо относятся к сайтам, использующим методы, которые вводят алгоритм в заблуждение.К черным методам относится:• клоакинг (показ роботу поисковой системы другого

контента, отличного от того, который увидит пользователь, например текста, содержащего длинные списки ключевых слов),

• накрутка поведенческих факторов, когда веб‑мастер эму‑лирует интерес к своему сайту со стороны пользователя.

Покупку рекламных ссылок обычно называют серыми методами. Получается так, потому что поисковики хотели бы чтобы никто не покупал ссылок и не воздействовал подобным образом на алгоритм, однако данная практика, несмотря на такое отношение, стала общепринятой. Поэтому серьезные санкции за покупку ссылок со стороны поисковиков сейчас не применяются.Когда говорят о «белой» оптимизации, в основном подразуме‑вают оптимизацию внутренних факторов и создание информа‑ционных поводов в сети для получения ссылок и повышения авторитетности.

МненИе

Page 15: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 13

настройках могут стать фатальными для процесса продвижения сайта.

URL

Воздействие на  URL-факторы в  первую очередь подразумевает использование в адресе страницы ключевых слов. Важен также вид URL, его формула, учитывается и длина. Одно из непреложных правил гла-сит: страница должна быть доступна толь-ко по одному URL.

Возрастные факторы

К возрастным факторам среди прочих от-носятся возраст сайта, страницы, URL, ди-намика прироста контента, частота добав-ления новых страниц.

Географическое расположение

Географическое расположение важно для  регионального продвижения. В  этом плане имеют значение указанные на сайте контакты и  адреса организации, а  также обозначенные в тексте страниц сайта регио-нальные пункты и подобная информация.

Перелинковка

Страницы сайта связаны между собой се-тью внутренних ссылок. К группе факто-ров перелинковки относятся схемы пе-релинковки, тексты внутренних ссылок, а также вес передаваемых ссылок. Кроме того, имеет значение актуальность ссы-лок, а именно наличие переходов посети-телей по ним.

CMS

Важно содержание и тип сайта, вид CMS, факт использования бесплатных шабло-нов, тип движка, наличие особых блоков на сайте.

Инструкции для поисковых систем

Имеет значение наличие и содержание ин-струкции robots.txt, карты сайта sitemap.xml, их доступность для индексации.

Резюме: Внутренние факто-ры  – самое обширное направление

Настройки сервера – это инструкция, которую получает поисковый робот, заходя

на каждую страницу. Эти настройки используются также при перемещении страниц или их удалении с сайта. Важно правильно настраивать эти инструкции, поскольку даже незначительные на первый взгляд ошибки в серверных настройках могут стать фатальными для процесса продвиже‑ния сайта.

Page 16: Л.Гроховский - Руководство по внутренним факторам

14 Введение в продвижение сайтов

в  поисковом продвижении. Воздей-ствие на них не поддается автома-тизации и является самым затрат-ным направлением работ с  точки зрения временных ресурсов. между тем игра действительно стоит свеч: грамотный подход к использованию внутренних факторов позволяет до-стигать значительных результатов и на несколько шагов опережать кон-курентов. Преимущество внутрен-них факторов заключается в  том, что  большая часть работ прово-дится единоразово. Из этого правила есть исключения, но обычно 20 % уси-лий в этом направлении позволяют достигать 80 % результатов. Сей-час и в ближайшем будущем именно внутренние факторы «задают тон» в продвижении сайтов.

0.2. Понятие о внешних факторах Вес внешних рекомендательных ссылок

К этой группе относится большое количе-ство факторов, косвенно характеризующих качество площадки, размещающей рекомен-дательную ссылку: возраст площадки, уни-кальность текстов, количество размещен-ных рекомендательных ссылок, наличие донора в  Яндекс.Каталоге, позиции сайта в ПС, уровень вложенности страницы-доно-ра, количество контента на странице, авто-ритетность сайта-донора и другие факторы.

Содержание текста рекомендательных ссылок

Важно наличие ключевых слов в  тексте ссылки, а  также сама форма словосоче-тания: прямое вхождение, словоформа, разбавление ключевых вхождений, уни-кальность текста ссылки. Имеет значение и текст, окружающий анкор ссылки.

Статистика прироста внешних ссылок

Существуют (и  не  должны оставаться без  внимания) динамические факторы,

Важно наличие ключевых слов в тексте ссылки, а также сама форма словосочета‑

ния: прямое вхождение, словоформа, разбавление ключевых вхождений, уникальность текста ссылки. Имеет значение и текст, окружающий анкор ссылки.

Page 17: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 15

среди которых – плавность прироста ре-комендательных ссылок, соотношение их прироста в месяц и общей массы, плот-ность ключевых слов в анкор-листе.

Резюме: Воздействуют на внешние факторы двумя основными спосо-бами: ищут площадки для  разме-щения ссылок либо отправляются на  специализированные биржи сай-тов и статей. Однако покупка ссы-лок легко поддается автоматизации с помощью ссылочных агрегаторов, поэтому значение внешних факто-ров сейчас не так велико, как раньше, и продолжает снижаться дальше.

0.3. Понятие о поведенческих факторах Удовлетворенность пользователей со-

держанием сайта

Чтобы на первых страницах выдачи оказы-вались исключительно полезные для поль-зователей сайты, разработчики поиско-вых систем «обучают» своих детищ сбору и анализу статистики поведения посетите-лей сайта. По ряду косвенных признаков поисковый робот «соображает», насколь-ко пользователь был удовлетворен резуль-татами поиска и собственно содержимым конкретного сайта. В силах оптимизатора добиться более высокого уровня лояльно-сти пользователей. Для этого нужно поза-ботиться о качестве наполнения сайта.

Удобство пользования сайтом

Сайт должен быть не только содержатель-ным, но и удобным. Пользователи не за-держиваются на сайтах, где невозможно быстро отыскать нужную информацию, а поисковые роботы умеют по косвенным признакам определять, насколько ком-фортно будет чувствовать себя на  сайте посетитель. Важно поработать с  юзаби-лити: качественно представить информа-цию, сделать ее доступной в пару кликов, а ее изучение незатруднительным.

Чтобы на первых страницах выдачи оказывались исключительно полезные

для пользователей сайты, разработчики поисковых систем «обучают» своих детищ сбору и анализу статистики поведения посетителей сайта. По ряду косвенных признаков поисковый робот «сообража‑ет», насколько пользователь был удовлетворен результатами поиска и собственно содержимым конкретного сайта. В силах оптимизатора добиться более высокого уровня лояльности пользователей. Для этого нужно позаботиться о качестве наполне‑ния сайта.

Page 18: Л.Гроховский - Руководство по внутренним факторам

16 Введение в продвижение сайтов

Переходы на сайт из иных источников

Счетчик Яндекс.Метрика определяет ста-тистику посещений сайта, отграничивая переходы с поисковых систем от иных ис-точников. Сайт будет ранжироваться луч-ше, если его посещают также по прямому заходу, из закладки или со сторонних ре-сурсов. Ссылка, по которой переходят жи-вые посетители, имеет большее значение. Ссылка, которая простояла год, но ни при-влекла ни одного посетителя, справедливо может считаться бесполезной.

Статистика переходов на сайт из резуль-татов поиска

Имеет значение и то, пользуется ли сайт спросом у пользователей поисковой систе-мы. Разумно предположить, что сайт из-вестной компании и / или компании, услу-гами которой посетитель уже пользовался и остался доволен, привлечет больше вни-мания. Если, несмотря на высокие пози-ции, сайт имеет низкий CTR – он может потерять преимущество в ранжировании.

Прочие источники статистики

Портфель поведенческих факторов все на-ращивается. Возникают новые источники статистики вроде ссылок в почтовой пере-писке или оценок «Like» («Мне нравится») в социальных сетях.

Резюме: Поведенческие факторы уже стали самым значимым фактором. Однако тенденции развития поиско-вых систем явно направлены в сторо-ну улучшения анализа поведенческих факторов, так что в будущем стоит ожидать постепенного повышения значимости этой группы факторов.

0.4. Комплексный подход к продвижению сайтов

В  деле продвижения сайтов важен ком-плексный подход: оптимизатор должен воздействовать на все группы факторов.

Анкор ссылки (Anchor) Это текстовое содержимое, находящееся между тегами. Синоним – «текст ссылки».Апдейт Апдейтом называют пополнение базы данных поисковой машины новой информацией. Выдача поисковых систем меняется с различной частотой. В Google это происходит постоянно, в Яндексе апдейты случаются реже, несколько раз в неделю. В течение дней между апдейтами выдача Яндекса практически не меняется. Исключение – такие тематики и запросы, где присутствуют результаты работы специализиро‑ванных роботов, например новости или блоги.внешняя ссылка Это голосующая единица, дающая рекомендацию сайту, на который она ведет. Понятие «внешняя» означает, что один сайт ссылается на другой, в отличие от внутренних ссылок, которые перенаправляют пользователя в рамках одного сайта. Внешние ссылки помогают поисковым системам определить содержимое страниц, а также их значимость. Небезоснова‑тельно предполагается, что на более качественный сайт в Сети размещено большее количество внешних ссылок. Существуют специализированные биржи для работы с такими ссылками. Кроме того, уже несколько лет оптимизаторы пользуются агрегаторами – автоматизированными системами, которые позволяют решить вопрос покупки ссылок практически без ручного труда.внутренняя ссылка Так называют ссылку, ведущую на другую страницу того же сайта. Понятие «внутренняя» означает, что одна страница ссылается на другую в рамках одного ресурса, «внутри» него. Внутренние ссылки влияют на перераспределение веса между страницами, этот процесс носит название перелинковки. Пере‑линковка – один из важных моментов внутренней оптимиза‑ции сайта, который мастерски используют в своих интересах опытные SEO‑специалисты.вЧ Аббревиатура расшифровывается как «высокочастотный». Обычно этим термином обозначают наиболее часто вводимые запросы. Нужно понимать, что частотность, пусть и является спутником конкуренции, напрямую с ней не связана: нередко можно встретить крайне конкурентные запросы, которые не являются высокочастотными.Донор, Акцептор Донором называют страницу, на которой размещена рекомен‑дательная ссылка. Соответственно, акцептором в поисковом продвижении обозначают страницу, на которую эта ссылка ведет.Дублированный контент Обозначает неуникальный, существующее где‑то еще в Интер‑нете контент. Поисковые системы негативно воспринимают дубликаты, поскольку с ними связаны проблемы хранения и обработки «мусорных» данных.

ЛИКБеЗ

Page 19: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 17

При  таком раскладе возникает синер-гия, и значение каждого фактора в груп-пе возрастает. Подобный подход возможен за счет планирования стратегии продви-жения, представляющей собой план дол-госрочного последовательного захвата позиций в  поисковых системах. Давайте разберем такую стратегию.

Этап 1: Подготовка сайта к продвижению

Составление семантического ядра

Составление семантического ядра – важ-нейший этап в продвижении сайта. На пер-вый взгляд может показаться, что техноло-гия подбора ключевых слов незатейлива, но это не так. Большинство оптимизато-ров совершают фатальные ошибки уже на этой стадии. В действительности «не-затейливый» процесс подбора и проверки запросов, например, для интернет-магази-на бытовой техники, может занять у опти-мизатора несколько дней.

Анализ тематики

Сейчас, когда алгоритмы используют тех-нологию машинного обучения, каждая тематика может иметь свои особенности в  продвижении. Важно провести анализ конкурентов в топ-10 – топ-30, выделить среди них сайты, похожие на ваш, подсчи-тать средние значения факторов ранжиро-вания и сделать все «под копирку».

Выбор входных страниц

При  выборе входных страниц важно учесть два правила. Во-первых, чем мень-ше запросов продвигается на одну страни-цу, тем лучше. Не бывает много входных страниц, бывает много запросов. Поэтому, если вы решили продвигать большое ко-личество запросов, а подходящих страниц нет, не старайтесь уместить ключи на уже существующих, лучше создавайте новые страницы. Во-вторых, на входной страни-це посетитель обязательно должен найти то, за чем он пришел на сайт.

Индекс Это база данных поисковой системы, хранилище всех документов, собранных в Сети. Поиск осуществляется только по тем документам, которые в данный момент времени содержатся в индексе поисковых систем.

Конверсия Так называется отношение количества посетителей сайта, совершивших какое‑либо целевое действие, к общему коли‑честву привлеченных посетителей. Целевым действием может быть регистрация в сервисе, звонок, заказ услуги или покупка товара, подписка на рассылку, добавление сайта в закладки, скачивание файла и т. п.

нЧ Аббревиатура расшифровывается как «низкочастотный». Низкочастотными называют те запросы, которые пользо‑ватели поисковых систем вводят редко. Многие из таких запросов вводят раз в месяц и даже реже. НЧ‑запрос может быть тем не менее высококонкурентным. Продвигать такие запросы проще. Кроме того, тенденция развития поведения пользователей – стремление к уточнению запросов, поэтому с каждым годом доля НЧ‑запросов возрастает, а ВЧ падает. Как правило, «низкочастотники» выигрывают в трафике за счет охвата огромной массы запросов.

Покупка ссылок Цель этого мероприятия – улучшение позиций сайта по за‑просам, содержащимся в тексте ссылки. Существуют разные источники покупки ссылок: биржи, ручной обмен, размещение статей и т. п.

ПС Так сокращенно называют поисковую систему. Для оптимиза‑тора наибольший интерес представляют поисковые системы Яндекс, Google, Mail.ru. Некогда лидировавшая на рынке поиска система Rambler сейчас при продвижении всерьез не рассматривается, поскольку обеспечивает совсем незначи‑тельное количество посетителей.

Результаты поиска Это ответ поисковой системы на запрос пользователя. При стандартных настройках на первой странице результатов поиска в Яндекс и Google оказывается всего десять сайтов, поэтому большинство договоров на SEO‑услуги предполагают вывод именно в десятку.

Релевантность Под релевантностью понимают меру схожести и применяют это понятие в SEO при оценке соответствия результатов поиска запросу пользователя. Понятие «релевантная запросу страни‑ца» используется также в момент выбора входной страницы (страницы, на которую будет попадать посетитель из поиско‑вых систем). Часто в качестве входной страницы выбирают наиболее релевантную.

Сниппет Это описание сайта в результатах поиска. Традиционно сниппет берется из текста страницы. При его формировании также могут быть использованы другие источники, например,

Page 20: Л.Гроховский - Руководство по внутренним факторам

18 Введение в продвижение сайтов

Составление технического задания на написание текстов

Подготовка текстов  – важный этап, и ошибки здесь обходятся дорого. Поэто-му техническое задание (ТЗ) на написание текстов должен подготовить опытный SEO-специалист. В этом документе должны со-держаться подробные указания: объем текста на страницах, употребляемые клю-чевые слова, их количество, рекомендации по составлению заголовков. После написа-ния текстов их нужно проверить на соот-ветствие требованиям ТЗ.

Подготовка текстов

Тексты должны не только содержать клю-чевые слова, но  также быть полезными и удобочитаемыми для посетителей. Не ре-комендую прибегать к  услугам дешевых неопытных SEO-копирайтеров, за  каче-ство стоит переплатить. В первую очередь тексты должны продавать. В книге мы рас-смотрим подход к продвижению, при кото-ром достигается баланс между SEO и про-дающей способностью текстов.

Аудит внутренних факторов

Необходимо провести полную диагности-ку сайта, выявить ошибки, обнаружить об-ласти с незадействованным потенциалом. После этого следует устранить недоработ-ки и подстроить сайт под требования и ре-комендации поисковых систем.

Составление технического задания на доработку сайта

Задача оптимизатора – подготовить пол-ное и понятное ТЗ для веб-программиста, проконтролировать выполнение рабо-ты и принять результат. Без привлечения программиста внести все правки удаст-ся только в том случае, если оптимизатор сам уже несколько лет работает с CMS-си-стемами, умеет управлять базами данных и знает языки программирования.

Доработка сайта под SEO

описание сайта в Яндекс.Каталоге или Description. Сниппет мо‑жет содержать разделы сайта, дату, новости, телефон и адрес компании. Привлекательный для пользователя сниппет может существенно увеличить посещаемость сайта.

СЧ

Аббревиатура расшифровывается как «среднечастотный». Этим термином обозначают нечто среднее между высокоча‑стотным и низкочастотным запросом.Сквозняк Сквозной называют ссылку, размещенную на многих страницах сайта. «Сквозняки» дублируются либо между всеми страницами сайта, либо внутри какого‑то раздела. Они, как правило, «зашиты» в шаблон.трафик Это синоним понятия «количество посетителей сайта».Семантическое ядро Подразумевается набор запросов, по которым продвигается сайт. Составление семантического ядра – очень важный, одна‑ко сложный и долгий процесс. Семантическое ядро для обыч‑ного интернет‑магазина содержит несколько тысяч запросов, для некоторых крупных сайтов их количество исчисляется десятками тысяч.тИЦ Аббревиатура расшифровывается как «тематический индекс цитирования». ТИЦ – это числовая величина, характери‑зующая авторитетность того или иного сайта, с точки зрения Яндекса. Рассчитывается ТИЦ на основании качества и ко‑личества ссылающихся на данный сайт источников с учетом динамики прироста этих ссылок.

Page 21: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 19

Лучше изначально делать сайт под  SEO, чем «натягивать» SEO на сайт. Но, к сожа-лению, культура создания сайтов под SEO развита у нас очень слабо: людей, способ-ных делать такие сайты, можно пересчи-тать по пальцам. Несмотря на то, что мно-гие компании, предоставляющие услуги комплексного интернет-маркетинга, уве-ряют, что  делают «заточенные» под  SEO сайты, на поверку оказывается, что лишь единицы могут похвастаться слаженной работой специалистов. В итоге часто на вы-ходе получается сайт, который оптимизато-рам приходится значительно дорабатывать под нужды SEO. Причем доработки могут быть очень серьезными, вплоть до сущест-венных изменений в структуре сайта и его программной части. Тем не менее без них об эффективном продвижении сайта в по-исковых системах говорить не приходится.

Этап 2: Продвижение сайта

Покупка рекомендательных ссылок

Работа над  внешними факторами в  це-лом сводится к  покупке рекомендатель-ных ссылок. На сегодняшний день с этим лучше всего справляются ссылочные агре-гаторы, позволяющие полностью автома-тизировать процесс: вам нужно лишь ука-зать запросы и настроить покупку ссылок.

Привлечение бесплатных рекоменда-тельных ссылок

Большое количество ссылок можно добыть бесплатно. На их поиск придется затратить немало времени, но, если подойти к это-му процессу с  умом, многие бесплатные ссылки будут иметь гораздо больший вес, чем покупные. Этот вопрос подробно ра-зобран на моем DVD-семинаре «Продви-жение сайта: источники привлечения вне-шних ссылок».

Повторный аудит внутренних факторов

Подготовка дополнительных текстов

Повторная доработка сайта под SEO

Не стоит тешиться иллюзией, будто ваш веб‑мастер, наделавший ошибок

при верстке и программировании сайта, исправит их по вашему новому ТЗ и не допустит ни одной новой оплошности. К примеру, он может поставить редирект 302 вместо 301. Посетителям от этого хуже не станет, но поисковые системы могут вас неправильно «понять», и для продвижения в поиске такое «пустяковое» различие может стать фатальным. Важно не просто проверить исполне‑ние рекомендаций по ТЗ, а провести полноценный повторный аудит, иначе новые ошибки могут остаться незамеченными. Приготовьтесь к тому, что аудит придется проводить несколько раз, и только после проведения контрольного анализа, подтверждающего, что ошибок больше нет, можно будет вздохнуть спокойно.

Page 22: Л.Гроховский - Руководство по внутренним факторам

20 Введение в продвижение сайтов

Из стратегического плана видно, насколь-ко важно воздействовать на  внешние и  внутренние факторы в  течение всего периода продвижения сайта. Среди опти-мизаторов бытует миф, будто достаточно один раз внести доработки на сайт на на-чальной стадии продвижения и можно за-крыть вопрос воздействия на внутренние факторы. В действительности все обстоит иначе. внутренние факторы также ну-ждаются в постоянном анализе и дора-ботке. Ниже рассмотрим основные при-чины такой необходимости.

Со временем текст сайта теряет уникальность

Контент «утекает» с сайта по разным кана-лам. Тексты воруют конкуренты, которые не  удосужились придумать что-то  свое, а также непорядочные «дорвейщики», за-рабатывающие на перепродаже трафика. Копии текста страницы множатся, а сайт теряет вес для поисковых систем. Чтобы не потерять позиции по ВЧ- и СЧ-запросам, время от времени нужно проводить анализ уникальности контента и при необходимо-сти обновлять его, переписывая тексты. Что касается продвижения по НЧ-запро-сам, воровство контента не наносит силь-ного ущерба текущим позициям, тем более что существует защитная методика, о ко-торой будет рассказано в одной из следую-щих глав.

После доработок сайта часто возника-ют новые проблемы

Не  стоит тешиться иллюзией, будто ваш веб-мастер, наделавший ошибок при  верстке и  программировании сай-та, исправит их  по  вашему новому ТЗ и не допустит ни одной новой оплошно-сти. К примеру, он может поставить реди-рект 302 вместо 301. Посетителям от этого хуже не станет, но поисковые системы мо-гут вас неправильно «понять», и для про-движения в  поиске такое «пустяковое» различие может стать фатальным. Важно

настоящее и будущее факторов ранжированияОсновная задача поиска – обеспечить точный и полный ответ на запрос пользова‑теля. Яндекс, равно как и другие поисковые системы, использует множество метрик качества поиска, например:• средняя позиция первого клика в выдаче,• доля некликнутых результатов.Любая модификация алгоритмов антиспама или ранжи‑рования не должна ухудшить качество поиска. В условиях существенного seo‑прессинга разработчики поисковых систем вынуждены постоянно искать новые качественные и незаспамленные сигналы, которые можно использовать в технологии антиспама или ранжирования.Поле факторов стремительно расширилось за последние несколько лет благодаря двум основным направлениям:1. Факторы, учитывающие поведение пользователей: продол‑жительность просмотра документов, ctr‑ссылок на сайт в выдаче поисковых систем, доля непоискового трафика на сайт и т. д.2. Факторы, учитывающие отношение пользователей к сайту: цитируемость и количество «лайков» в социальных сетях, количество твитов и ретвитов со ссылкой на сайт и пр. и пр.Модель, учитывающая поведение и отношение пользова‑телей к документам сайта, существенно более устойчива к спаму и позволяет более эффективно ранжировать документы в выдаче. Можно легко проиллюстрировать это сравнением топовых сайтов, отранжированных различными алгоритмами:

Top-20 websites by three different algorithmsNo PageRank TrustRank BrowseRank1 adobe.com adobe.com myspace.com2 passport.com yahoo.com msn.com3 msn.com google.com yahoo.com4 microsoft.com msn.com youtube.com5 yahoo.com microsoft.com live.com6 google.com passport.net facebook.com7 mapquest.com ufindus.com google.com8 miibeian.gov.cn sourceforge.net ebay.com9 w3.org myspace.com hi5.com10 godaddy.com wikipedia.org bebo.com11 statcounter.com phpbb.com orkut.com12 apple.com yahoo.co.jp aol.com13 live.com ebay.com friendster.com14 xbox.com nifty.com craigslist.org15 passport.com mapquest.com google.co.th16 sourceforge.net cafepress.com microsoft.com17 amazon.com apple.com comcast.net18 paypal.com infoseek.co.jp wikipedia.org19 aol.com miibeian.gov.cn pogo.com20 blogger.com youtube.com photobucket.com

Источник: BrowseRank: Letting Web Users Vote for Page Importance, https://research.microsoft.com / en‑us / people / tyliu / fp032‑liu.pdf

МненИе

Page 23: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 21

не просто проверить исполнение рекомен-даций по ТЗ, а провести полноценный по-вторный аудит, иначе новые ошибки могут остаться незамеченными. Приготовьтесь к тому, что аудит придется проводить не-сколько раз, и  только после проведения контрольного анализа, подтверждающе-го, что ошибок больше нет, можно будет вздохнуть спокойно.

Некоторые доработки являются экспериментальными

Многие доработки экспериментальны, особенно это касается тех факторов, ко-торые зависят от тематики. С первого раза крайне редко удается выбрать правиль-ные значения для  подобных факторов. Прибавьте к  этому нестабильность сре-ды: алгоритм Яндекса, использующий тех-нологии машинного обучения и  оценки асессоров, постоянно изменяется в рамках каждой тематики. В результате становит-ся очевидным необходимость экспери-ментов и  оценки результатов с  адапта-цией сайта к тематике. Только при таком раскладе можно рассчитывать на повыше-ние эффективности продвижения. Экспе-риментальный подход хорошо иллюстри-рует работа с плотностью ключевых слов, когда в написанном тексте мы увеличива-ем плотность ключевых слов и ждем ап-дейта. Если позиции падают – уменьша-ем плотность. Если растут – увеличиваем еще.

Конкуренты не стоят на месте

Выход в  топ для  многих оптимизаторов становится сигналом к прекращению ра-боты над сайтом. Между тем нельзя терять бдительность. Удержание позиций  – это постоянная борьба. Все хотят в топ, а в ито-ге попадает туда самый упорный и смыш-леный. Чтобы удержать позиции, нужно анализировать конкурентов и вовремя по-вторять их шаги.

Контент-менеджер может допускать ошибки

Как видно, алгоритм BrowseRank позволил существенно лучше отранжировать сайты с длинной пользовательской сессией, чем традиционный PageRank.Логично ожидать и дальнейшего расширения поля влияющих факторов.Вообще довольно эффективных критериев можно при‑думать весьма немало. Для решения одной из задач мне потребовалось придумать алгоритм фильтрации сплогов (спамовых блогов, созданных исключительно для размещения рекламных сообщений). Одна из найденных закономерностей: посты в спамовых блогах обычно получают гораздо меньше комментариев, чем посты в хороших блогах. Распределение количества блогов по среднему числу комментариев к посту выглядит так:

Данные получены на выборке в 30 тысяч блогов. Использо‑вание лишь одного параметра позволило отфильтровать спа‑мовые блоги с точностью и полнотой порядка 80 % при пороге ~7 комментариев на пост. Введение в алгоритм фильтрации дополнительных критериев позволит еще более эффективно отсеять спам.Собственно, в этом состоит один из серьезных трендов совре‑менного поиска – использование мономов, т. е. комбинаций факторов. Широкое применение мономов позволяет повысить эффективность алгоритмов и затрудняет реверс‑инжиниринг.Логичен вывод: любой сигнал, обеспечивающий достоверное отделение некачественного документа или сайта от качествен‑ного, будет использован.

Page 24: Л.Гроховский - Руководство по внутренним факторам

22 Введение в продвижение сайтов

Если сайт постоянно обновляется, кон-тент-менеджеры публикуют новости и до-бавляют товары в каталог, нужно отсле-живать, не допускают ли они критичных для SEO ошибок. А в случае, когда на сай-те периодически появляются новые разде-лы и меняется текстовое наполнение ста-рых, вероятность ошибок резко возрастает и почти равна 100 %.

Резюме: Хочу заметить, что ошиб-ка никогда не станет критической, если отыскать ее сразу после появле-ния, а не дотянуть до падения пози-ций сайта и лишь тогда приступить к исправлению упущений.

Page 25: Л.Гроховский - Руководство по внутренним факторам

П ри  перелинковке важно пони-мать, каким образом вес пере-дается между страницами. Сра-

зу хотелось бы отметить, что знание это весьма относительно, так как при переда-че веса от страницы к странице задейству-ется множество факторов и точного расче-та здесь не может быть по определению.

Доподлинно известно, что  при  расчете веса ссылки учитывается фактор ее «кли-кабельности», то есть та ссылка, по кото-рой пользователи активно кликают мы-шью, передает больший вес, нежели та, которая остается без  внимания посети-телей сайта. Это утверждение справедли-во не только в плане внутренней перелин-ковки: расчет влияния входящий внешних ссылок ведется по такой же схеме. Свою роль играет и  способ размещения ссыл-ки, в частности, важно, является ли ссыл-ка сквозной.

Как  ни  печально, но  при  всем желании вы не сможете рассчитать передаваемый ссылкой вес точно. Однако знание о спо-собах перелинковки позволит вам мак-симально задействовать потенциал вну-тренних ссылок с точки зрения технологии передачи ссылочного веса PageRank.

Некоторые оптимизаторы могут возра-зить: о  каком PageRank идет речь, если эта технология по нынешним меркам уже может быть отнесена к «каменному веку» эпохи интернет-продвижения? Да, техно-логии уже 10 лет, безусловно, она претер-пела немалые изменения, однако базовые принципы остались прежними. С  ними я вас и познакомлю в этой главе.

Глава 1Перелинковка страниц

Page 26: Л.Гроховский - Руководство по внутренним факторам

24 Перелинковка страниц

1.1. Как вычисляется PageRank и почему это так важно знать

Говоря о  поисковом предложении в  це-лом, я  стараюсь предлагать универсаль-ные решения, которые подходят для всех (или для большей части) популярных по-исковых систем. Однако иногда выбора ме-жду различными подходами не избежать, и в этом случае я вынужден отдавать при-оритет продвижению под поисковую си-стему Яндекс, доля поискового трафика ко-торой растет день ото дня.

В этой связи кажется странным, что я по-свящаю целую главу PageRank, кото-рый является атрибутом Google, но ни-как не Яндекс. Зачем я это делаю? Ответ прост: значение PR-страницы для  Ян-декса не важно, и тем не менее эта поис-ковая система тоже оперирует таким по-нятием, как вес страницы, и использует ссылки при ранжировании. Поскольку основа технологии PageRank представ-ляет собой базовые принципы ссылоч-ного ранжирования, вполне закономер-ным кажется следующий вывод: знание принципов расчета PageRank наилуч-шим образом поможет вам понять, как передается вес между страницами с точки зрения популярных поисковых систем. Итак, начнем.

Что все это значит на практике?

Чем глубже в структуре сайта расположе-на страница, тем меньший вес ей достается (помним о коэффициенте затухания). Вес страницы делится поровну между всеми ссылками на  странице. Соответственно, входные страницы должны получать мак-симальный вес, а  второстепенные стра-ницы – обеспечивать максимальный вес входным страницам. Добиться оптималь-ного соотношения можно, закрывая лиш-ние ссылки от индексации.

Существуют моменты, которые могут стать помехой для оптимизации:

В1998 году основатели компании Google Сергей Брин и Ларри Пейдж опубликовали

статью, в которой ввели понятие PageRank, как меру авторитетности страницы. Рейтинг страницы в этой модели зависит от количе‑ства ведущих на нее ссылок и от рейтинга ссылающихся страниц. Статическим весом является доля PageRank, передаваемая каждой ссылкой.Каждая рассмотренная модель является условным идеаль‑ным примером, не учитывающим, что на внутренние стра‑ницы могут стоять ссылки извне. Также результаты расчета статического веса внутренних страниц могут искажаться из‑за неравномерности индексации страниц со ссылками поисковым роботом.Большую роль играет и то, на скольких страницах сайта раз‑мещена ссылка. Одна сквозная, т. е. стоящая на всех страницах сайта ссылка перераспределит значения рангов внутренних страниц гораздо сильнее, чем одна ссылка с главной страницы.

*Sergey Brin and Larry Page. The Anatomy of a Search Engine http://www‑db.stanford.edu / pub / papers / google.pdf

МненИе

Page 27: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 25

• ограниченные возможности CMS,• обилие ссылок на крупном сайте,• устоявшаяся структура сайта.

1.2. Базовые схемы перелинковкиДля достижения целей вам необходимо ис-пользовать правильную схему перелин-ковки. На  примере некоторых базовых конструкций я покажу, каким образом мо-жет быть выстроена такая схема.

Сразу сделаю небольшую оговорку: лю-бая схема перелинковки условна и может быть масштабирована. Так, рассматривая схему, в  которой участвуют 10 страниц, мы можем подразумевать сайт с десятка-ми тысяч страниц, которые распределены по 10 основным подразделам. Таким обра-зом, мы построим пути передачи ссылоч-ного веса по главным разделам, а потом уже рассмотрим их по отдельности и про-считаем схему распределения веса в каж-дом разделе.

Планируя перелинковку, я исхожу из со-ображений оптимального использова-ния внутреннего ссылочного потенциала сайта, поэтому высокочастотные запросы в приведенных ниже схемах перелинковки двигаются на главную страницу, средне-частотные – на страницу раздела (обычно это страница первого уровня вложенно-сти), а низкочастотные – на страницы то-вара / услуги (обычно это страницы второ-го, третьего и ниже уровня вложенности).

Универсальной схемы перелинковки не су-ществует. Конкретный выбор зависит даже не от выбора группы запросов, а от осо-бенностей тематики. Существуют такие тематики, в которых основная доля посе-тителей приходится на 5 запросов, а все остальные запросы не принесут даже 10 % того трафика, что обеспечат эти 5 (напри-мер, тематика «такси»). В таких случаях, безусловно, оптимальной тактикой будет продвижение пяти выбранных запросов

Растолкованный PageRank1

PageRank – это методика измерения «важности» веб‑страни‑цы в Google. Когда все другие значимые факторы, такие как тег Title и ключевые слова, учтены, Google прибегает к PageRank и корректирует результаты ранжирования с расчетом, чтобы более важные сайты оказывались выше на странице результа‑тов поиска пользователя.Главный момент: никто точно не знает, как Google рас-считывает PR. Однако есть нюансы, которые стоит учитывать всегда:1. Сайт, который ссылается на забаненные сайты, может попасть в бан.

Будьте щепетильны в выборе исходящих ссылок. Не ссылай‑тесь на подозрительные сайты: каталоги ссылок («линко‑помойки»), забаненные ресурсы и т. п. Всегда проверяйте PR сайтов, на которые собрались сослаться, иначе есть вероятность, что Google выпишет вам «желтую карточку» – пенализирует сайт.2. Ссылки на тематические сайты с высоким PR и ссылки с таких сайтов очень важны.

Причем передаваемый ссылкой PR будет тем больше, чем бли‑же будет тематика страниц. Ссылки на полезные и интересные тематические ресурсы указывают поисковым машинам, что сайт имеет определенную ценность для пользователей Сети. Таким образом, проставляя ссылки только на качествен‑ные сайты, можно на несколько шагов опередить конкурентов.в целом порядок ранжирования в Google выглядит так:

1. Найти все страницы в индексе, которые соответствуют ключевым словам поиска.2. Отранжировать найденное в соответствии со «страничными факторами» (ключевыми словами и т. п.).3. Учесть текст ссылок на страницы.4. Скорректировать результаты, использовав данные PageRank.Принципы вычисления PageRank:

• PageRank – это число, характеризующее исключительно голосующую способность всех входящих ссылок на страницу и ту силу, с которой они эту страницу рекомендуют.

• Если страница А ссылается на страницу В, то страница А считает, что страница В важная.

• Если на страницу ведет много важных ссылок, то и ее ссылки на другие страницы становятся более важными.

• Внутренние ссылки учитываются при расчете веса PageRank для других страниц сайта.

ФАКт

1По материалам статьи «Растолкованный PageRank» в перево‑де Александра Садовского.

Page 28: Л.Гроховский - Руководство по внутренним факторам

26 Перелинковка страниц

• Страница не может голосовать так, чтобы другая страница стала столь же важна, как она сама. Таким образом, чем труднее добраться до какой‑то web‑страницы, тем меньшим авторитетом она обладает.

• Существует так называемый коэффициент затухания: страница всегда передает другой странице меньший вес, чем получает сама. Например, коэффициент равен 0,85. В таком случае передача веса после затухания равна 0,85. В том случае, если со страницы ведут две ссылки, передан‑ный по каждой из них вес будет равняться 0,425 и так далее.

• Во время одной итерации вычислений страница 1 дает странице 2 повышение в весе. Если страницы ссылаются друг на друга, то во время следующей итерации страни ‑ ца 1 получает увеличение веса, пропорциональное новому, увеличившемуся весу страницы 2.

• Вес PageRank, передаваемый на страницу А со страницы В, которая указывает на нее, куда‑нибудь уменьшается с каж‑дой ссылкой, которая находится на странице В. Это значит, что вес страницы – это, по сути, мера ее голоса. Страница может разделить этот голос между одной, двумя или более ссылками, но общая голосующая сила остается неизменной.

на главную страницу и выбор схемы пере-линковки под ВЧ-запросы.

Комплексное продвижение всего сайта

Эта схема наиболее универсальна и с ней приходится сталкиваться чаще всего. Она подходит в тех случаях, когда планируется продвигать все группы запросов (ВЧ, СЧ, НЧ), а  также тогда, когда шаблонизатор сайта не позволяет закрыть от индексации часть ссылок на конкретной странице. Не-даром эту схему перелинковки называют «все ссылаются на всех».

Принцип ее построения прост:

1. Главная страница ссылается на страни-цы всех разделов.

2. Страница каждого раздела ссылается на вложенные страницы, а также на глав-ную. Разделы перелинковываются между собой так, чтобы все они ссылались друг на друга.

3. Все вложенные страницы ссылаются на вышестоящий раздел и на главную стра-ницу. Вложенные страницы конкретного раздела ссылаются друг на друга. Все вло-женные страницы – на начальные страни-цы соседних разделов.

При таком раскладе вес равномерно уга-сает от  страницы 0 уровня вложенности к странице 2 уровня. Однако у этой схе-мы есть определенный недостаток: сай-ту, на котором применена такая методика перелинковки, при  продвижении ВЧ-за-просов сложно конкурировать с сайтами, где задействована схема перелинковки, предполагающая направление всего веса на главную страницу.

Рассмотрим такую схему на рис. 1.

Продвижение главной страницы под вЧ

В  условиях напряженной конкуренции используют главный «ход конем» – пере-линковку с  передачей веса на  главную страницу. Эта методика очень проста: каждая страница ссылается на  главную,

Page 29: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 27

и на каждую страницу, кроме главной, сто-ит всего одна ссылка (рис. 2). При такой перелинковке главная страница получает максимально возможный вес. Недостат-ки этой схемы очевидны: в плюсе остается только главная, а все остальные страницы получают очень низкий вес, поэтому кон-курировать по СЧ- и НЧ-запросам с сайта-ми, избравшими стратегию приоритета этих запросов, становится затруднительно.

Продвижение разделов под СЧ

Такая схема прекрасно подходит интернет-магазинам в тех отраслях, где люди ищут не название модели / товара, а целую то-варную группу. Например, когда пользо-ватель хочет купить индийскую космети-ку, он не ориентируется в брендах, а ищет просто «индийский шампунь» или «индий-скую пену для ванны», поэтому для мага-зина индийской косметики схема продви-жения разделов под СЧ будет идеальной.

Методика сводится к тому, что сайт соби-рает трафик по СЧ запросам и вес получа-ют страницы разделов. Принцип построе-ния этой схемы прост: все страницы сайта

Пара фактов о PageRank

«Чем меньше ссылок со страницы – тем меньше веса с нее утекает» –

думают многие оптимизаторы. Это миф. Взглянув на формулу PageRank нетрудно понять, что количество исходящих ссылок не имеет никакого значения. Одна она будет или 100 – со стра‑ницы уйдет одинаковое количество веса.Более того, даже если убрать все исходящие ссылки со страни‑цы, оставив входящие, это не приведет к накоплению на ней PageRank. Здесь вступают в игру методы обработки «висящих ссылок» (dangling links), и такие страницы могут вовсе не полу‑чить статического веса.Для больших сайтов бывает трудно построить модель и посчитать PageRank. Тогда можно руководствоваться двумя простыми принципами:a) страница имеет высокий PageRank, если количество входя‑щих ссылок кратно превышает количество исходящих,b) страница имеет высокий PageRank, если на нее ссылается страница предыдущего типа (высокий относительно среднего уровня. Разумеется, он будет меньше, чем в варианте «а»).Эти принципы не являются гарантией. Существуют исключе‑ния. Но в большинстве случаев они работают.

ФАКт

Рис. 1. Комплексное продвижение всего сайта

PageRank 1,65

PageRank 1,6

PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77

PageRank 1,6

Page 30: Л.Гроховский - Руководство по внутренним факторам

28 Перелинковка страниц

ссылаются на страницы разделов, и исклю-чительно на страницы разделов ссылают-ся страницы 2 и ниже уровня вложенно-сти. Выглядит такая схема перелинковки следующим образом (рис. 3).

Рис. 3. Продвижение разделов под СЧ

Рис. 2. Продвижение главной страницы под ВЧ

Продвижение СЧ

2

3 3 3 3 3 3

2

PageRank 3,86

PageRank 0,31 PageRank 0,31

PageRank 0,97

PageRank 0,97

PageRank 0,97

PageRank 0,97

PageRank 0,31 PageRank 0,31

Page 31: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 29

Продвижение внутренних страниц под НЧ

В  интернет-магазине, который торгует продукцией популярных брендов, поль-зователи, как правило, ищут товар по на-званию конкретной модели. В этом случае стоит задействовать схему перелинков-ки, продвигающую внутренние страницы под НЧ (рис. 4).

Пример тематики, для которой схема ока-жется чрезвычайно эффективной, – ноутбу-ки. Так, на момент написания книги «ноут-бук asus» по России искали 4 393 человека, а «ноутбук Asus k50c» – 722 человека. А ведь у бренда Asus широчайший модельный ряд. Несложно смекнуть, что  в  совокупности запросы с названием моделей могут дать больше трафика, чем более общий запрос «ноутбук Asus». Кроме того, поскольку эти запросы более точные, конверсия с них бу-дет на порядок выше, ведь посетитель най-дет именно ту модель, которую искал.

Если вы выбираете эту схему перелин-ковки, стоит придерживаться следующих правил: страницы карточек товаров / услуг ссылаются только друг на друга, нельзя от-давать вес страницам разделов.

Итак, мы рассмотрели основные схемы пе-релинковки. Помните о  масштабирова-нии: одной страницей на шаблоне по фак-ту может являться огромный раздел сайта.

Следует отметить, что комплексный под-ход к  продвижению является намно-го более эффективным, чем  методика,

Рис. 4. Продвижение внутренних страниц под НЧ

Следует отметить, что комплексный подход к продвижению является намного более

эффективным, чем методика, ориентированная лишь на один из сегментов запросов.

PageRank 1,3 PageRank 1,3

PageRank 0,21

PageRank 0,15

PageRank 0,21

PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3

Page 32: Л.Гроховский - Руководство по внутренним факторам

30 Перелинковка страниц

ориентированная лишь на  один из  сег-ментов запросов (ВЧ, СЧ, НЧ). Конечно, в  тематиках типа «такси» или  «пласти-ковые окна» выбор схемы перелинков-ки под  ВЧ-запросы полностью оправдан и даже является единственно верным, од-нако в других случаях я не рекомендую ис-пользовать строго схему продвижения од-ной группы. Каждый раз на этапе выбора схемы перелинковки нужно определиться с целями и особенностями тематики и уже исходя из этой информации модифициро-вать схему под свои нужды.

1.3. Локальные схемы перелинковкиЧтобы правильно строить схемы пере-линковки, важно разбираться в способах перелинковки локальной. В  данном слу-чае между собой связываются родствен-ные страницы одного уровня вложенно-сти (чаще всего вложенные в один раздел).

Кольцо

Популярная схема перелинковки, в кото-рой страницы последовательно связыва-ются между собой, замыкаясь в  кольцо: 1 —> 2 —> 3 —> 1.

Явный недостаток такой схемы сводится к тому, что в случае выпадения одной стра-ницы из индекса связь нарушается и вес теряет все кольцо. Экспериментально до-казано: в сравнении с другими схемами ло-кальной перелинковки кольцевая схема дает максимальный вес каждой странице.

Куб

Для реализации этой схемы страницы груп-пируются в два кольца, каждое из которых состоит из  количества страниц, кратно-го четырем. Считаем звенья одного коль-ца как «А» и второго как «B». Кольца пере-линковываются между собой перекрестно по принципу А1 —> B2 —> А3 —> B4 —> А1; B1 —> A2 —> B3 —> A4 —> B1; A1 —> A2 —> A3 —> A4 —> A1; B1 —> B2 —>

Допустимы случаи со значительным отклонением от предложенных чисел.

Например, существует рекомендация об ограниче‑нии количества исходящих ссылок со страницы. Когда мы работаем с особо крупными сайтами (новостными порталами, серьезными агрегатора‑ми), отклонения неизбежны.

Page 33: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 31

B3 —> B4 —> B1. Схема «Куб» на порядок сложнее «Кольца» и труднее поддается ав-томатизации, однако у нее есть серьезный козырь: даже если несколько звеньев выпа-дет из этой цепочки, вес все равно сохра-нится и цепь будет замкнута.

Звезда

Название это схемы не должно вас пугать. На самом деле все здесь предельно просто: «все ссылаются на всех».

1.4. Правила перелинковки

Мы рассмотрели основные схемы перелин-ковки. Теперь пора усвоить правила, кото-рые позволят не допустить ошибок и эф-фективно внедрить выбранную схему.

Важно понимать, что приведенные реко-мендации являются усредненными. Допу-стимы случаи со значительным отклоне-нием от предложенных чисел. Например, существует рекомендация об ограничении количества исходящих ссылок со страни-цы. Когда мы работаем с  особо крупны-ми сайтами (новостными порталами, серьезными агрегаторами), отклонения

Рис. 5. Куб

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

Page 34: Л.Гроховский - Руководство по внутренним факторам

32 Перелинковка страниц

неизбежны. Однако рекомендация все рав-но имеет силу, просто необходимо будет закрывать часть неважных ссылок от ин-дексации и  не  допускать дублирования их дублирования.

рекомендация 1: Не стоит использовать более 50 ссылок на одной странице .

Вес распределяется по  всем исходящим ссылкам: чем  больше ссылок, тем  мень-ший вес передает каждая из  них. Огра-ничивая количество исходящих ссылок, оптимизатор регулирует передаваемый вес, направляя его на нужные страницы. Так, вес страниц-шлюзов увеличивается, и они, в свою очередь, передают больший вес продвигаемым страницам.

Некоторые ссылки необходимо закрыть от индексации.

рекомендация 2: Ссылки нужно оформ-лять текстом .

Часто для сохранения фирменного стиля элементы меню, набранные в макете не-стандартным шрифтом, верстают картин-ками или анимацией. Поисковая система в этом случае не передает веса по ключе-вым словам, ведь она не может опреде-лить, к  какой группе запросов относит-ся ссылка. Для корректной передачи веса рекомендуется, пусть даже в ущерб эсте-тическим задачам, использовать тексто-вые ссылки с  содержанием ключевых слов. Текст должен быть оформлен на сай-те в явном виде, то есть присутствовать в HTML-коде страницы.

рекомендация 3: Желательно не дуб-лировать ссылки с одной страницы на другую .

Иллюстрация | Название модели

Иллюстрация | Технические характеристики

Иллюстрация | Краткое описание модели

Иллюстрация | Подробнее…

Что показывать поисковику

Часто структура сайта для пользователя входит в противоречие с SEO‑логи‑

кой. Тогда нужно как‑то спрятать ссылки от поисковика, оставив их для пользователя. Для этого есть несколько инструментов:<noindex>

Тег <noindex> работает для Яндекса. Google его не восприни‑мает. Ссылка, закрытая тегом <noindex>, передает статиче‑ский вес, но ее анкор не работает для Яндекса. Робот Яндекса по таким ссылкам переходит. Тег <noindex> может также использоваться внутри тега <a>, тогда мы сможем закрыть лишь часть анкора. Например:<a href=«http://site.ru»>ноутбуки <noindex>toshiba< / noindex>< / a>rel=nofollow

rel=nofollow блокирует передачу как статического веса, так и работу анкора. Однако его чрезмерное использование на сайте может вызвать проблемы с Google. Летом 2009 года Google презентовал изменение в концепцию работы nofollow на внутренних ссылках.Допустим, страница может передать 10 «поинтов» PageRank. С нее стоит 10 ссылок. 5 из них закрыты в nofollow.Как было раньше: по 5 ссылкам, не закрытым в nofollow, пе‑редается 10 «поинтов» веса, по 2 «поинта» на каждую. То есть вес с закрытых в nofollow ссылок перераспределяется в пользу незакрытых.Как стало: по 5 ссылкам, не закрытым в nofollow, передается лишь 5 «поинтов» веса, по 1 «поинту» на каждую. Вес больше не перераспределяется, а просто теряется.Роботы переходят по ссылкам с nofollow.Некоторые ссылки с nofollow все равно учитываются поискови‑ками. Например, ссылки с Твиттера.JavaScript

Закрытие ссылки в JavaScript позволяет скрыть сам факт нали‑чия ссылки на странице и таким образом избежать послед‑ствий для Google, описанных в предыдущем пункте.От Google не так просто что‑то скрыть. Но работающие вариан‑ты существуют:1. Использовать безатрибутную ссылку. В этом варианте мы фактически полностью убираем href из тега <a>.2. Использовать внешний скрипт с закрытием в robots.txt фай‑ла со скриптом. Этот вариант сложнее. В тексте html страницы мы только вызываем скрипт, который убран в отдельный js‑файл. Сам же файл закрыт в robots.txt. Таким образом, бот Google не может прочитать его и восстановить содержание страницы.

МненИе

Page 35: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 33

Особенно часто дублирование ссылок встречается в  каталоге товаров. В  нем обычно содержится три ссылки: изображе-ние товара, название модели и ссылка «по-дробнее» в описании. Рекомендуется до-пускать к индексации только одну ссылку, которая, как мы помним, должна быть тек-стовой и содержать ключевые слова. Если продвигаете только в Яндексе, ссылку «по-дробнее» можно закрыть в <NOINDEX>. К  ссылке картинкой лучше добавить ат-рибут rel=nofollow, поскольку иногда кар-тинки могут быть полезны: при грамотной оптимизации они могут привлечь на сайт дополнительный трафик.

рекомендация 4: URL страниц должны содержать ключевые слова .

По данным исследования «SEO-альманах», проведенного в конце 2010 года, ключевое слово в URL – один из наиболее значимых факторов ранжирования. Причем наиболь-шее значение имеет употребление ключе-вого слова в имени домена (www.key.ru), следующим по важности является употреб-ление ключевого слова в названии дирек-тории или страницы. Замечено, что ключе-вое слово на транслите получает больший рейтинг, чем его перевод на английский.

Проще говоря, не рекомендуется исполь-зовать URL вида:

http://www.site.ru / list.php? SECTION_ID=14,

http://www.site.ru / dir / content / 32 / .

URL должен содержать все слова, форми-рующие основные запросы:

http://www.site.ru / brand / model / modification / ,

http://www.mobile-phone.ru / nokia / 6700 / classic / .

По некоторым наблюдениям, для ранжи-рования конкретной страницы из разделе-ний « / » и «-» лучше выбрать последнее. Так, последний URL рекомендуется употребить

Второе применение JavaScript – это скрыть ссылку от Яндекса, оставив ее видимой для Google. Иногда это может понадобить‑ся. Сделать это несложно. Даже простейший document.write ставит Яндекс в тупик, и ссылка перестает работать. В то время как Google будет ее учитывать.

Page 36: Л.Гроховский - Руководство по внутренним факторам

34 Перелинковка страниц

в  виде http://www.mobile-phone.ru / nokia-6700-classic / . Конечно, этот подход не панацея, у него есть недостатки, напри-мер, отсутствие логической структуры сай-та: все страницы будут находиться в одной директории. Но для сайтов с небольшим количеством страниц такая подача URL весьма и весьма полезна.

рекомендация 5: Ссылки необходимо за-крывать от индексации .

Для  правильной передачи веса, необхо-димо на отдельных страницах закрывать разделы меню и прочие ссылки от индек-сации, оставляя лишь важные ссылки, поставленные для  передачи веса между страницами. К  сожалению, не  все CMS позволяют изменять блоки каждой стра-ницы, используя единый шаблон. В этом случае приходится совершать доработки в программной части сайта.

1.5. Способы перелинковкитип 1 . Меню

Меню – основной способ навигации на сай-те, представляющий собой блок сквозных ссылок. Как правило, главное меню дубли-руется на всех страницах сайта, за исклю-чением страниц версии для печати и не-которых других. Вес, передаваемый через подобные ссылки, не складывается, а счи-тается по иному принципу. Страницы раз-делов ранжируются иначе, нежели осталь-ные страницы сайта. В этой связи можно дать несколько рекомендаций:

Текст ссылки в меню должен содержать основные ключевые слова из продвигае-мых на вложенной странице. Например, для  страницы каталога мобильных теле-фонов текстом ссылки может быть «теле-фоны» / «мобильные телефоны» / «каталог телефонов», но никак не «каталог».

Оптимальнее всего использовать иерархичное меню. Нет смысла пытаться

Меню – основной способ навигации на сайте, представляющий собой блок

сквозных ссылок. Как правило, главное меню дублируется на всех страницах сайта, за исключе‑нием страниц версии для печати и некоторых других. Вес, передаваемый через подобные ссылки, не складывается, а считается по иному принципу. Страницы разделов ранжируются иначе, нежели остальные страницы сайта.

Page 37: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 35

поместить ссылки сразу на  все страни-цы сайта в главном меню. Достаточно со-слаться на основные разделы. Внутри раз-делов целесообразно поместить вложенное меню, направляющее на страницы следую-щих уровней.

Текст ссылки в  меню должен соответ-ствовать элементу URL и элементу нави-гационной строки вложенной страницы (если навигационная строка присутству-ет на сайте).

тип 2: Навигационная строка

Благодаря навигационной строке поль-зователь всегда в  курсе своего местона-хождения на сайте. Оптимизатору важно оформить навигационную строку пра-вильно. Для этого необходимо учесть не-сколько моментов:

В навигационной строке должна при-сутствовать ссылка на главную страни-цу, и лучше всего, если в тексте ссылки будут прописаны слова, соответствую-щие тематике сайта, а  не  просто слово «главная».

Желательно, чтобы каждая ссылка на-вигационной строки содержала наиболее конкурентное ключевое слово, продвигае-мое на данную страницу. Например:

http://www.mobile-phone.ru / nokia / 6700 / classic /

Сотовые телефоны –> Nokia –> Но-киа 6700 Classic

Фрагмент навигационной строки теку-щей страницы не  должен быть ссылкой. Помните о том, что страница не должна ссылаться на саму себя.

тип 3: HTML-карта сайта

HTML-карта сайта – это раздел навигации, который помогает пользователю быстро отыскать ссылки на необходимые ему стра-ницы сайта. HTML-карту вовсе не обяза-тельно использовать, но, если грамотно ее оформить, можно убить двух зайцев сразу:

Благодаря навигационной строке пользова‑тель всегда в курсе своего местонахожде‑

ния на сайте. Оптимизатору важно оформить навигационную строку правильно.

Page 38: Л.Гроховский - Руководство по внутренним факторам

36 Перелинковка страниц

сделать сайт еще удобнее для пользовате-ля и улучшить индексацию.

При создании HTML-карты стоит придер-живаться следующих принципов:

HTML-карта не должна включать в себя более 30 ссылок на внутренние страницы сайта.

Необходимо, чтобы HTML-карта содер-жала ссылки на основные разделы и наи-более важные страницы.

HTML-карта может быть многоуровне-вой и  состоять из  нескольких страниц, если общее количество страниц сайта пре-вышает 30.

тип 4: Многоуровневый каталог

Когда счет страницам идет уже не на де-сятки, нельзя обойтись без рубрикатора, который упростит поиск информации. Обычно для этих целей используется ка-талог товаров, который является также од-ним из основных способов перелинковки. При  организации каталога важно соста-вить HTML-шаблон так, чтобы единствен-ной индексируемой ссылкой осталось на-именование товара, оформленное текстом (об этом мы уже говорили выше).

тип 5: Подсказки

Подсказка  – это рекомендация, которую дает сайт своим посетителям, как правило, это сообщение об акции, скидках или со-путствующих товарах. Для удобства поль-зователей подсказки оформляются с  ис-пользованием ссылок, что предоставляет оптимизатору еще  одно поле для  манев-ров. При  перелинковке использование подсказок – очень эффективный инстру-мент, особенно если продвижение ведет-ся по низкочастотным запросам.

Часто используются блоки:

«Похожие товары», «Сопутствующие товары», «Акция», «Дополнительные услуги»,

Подсказка – это рекомендация, которую дает сайт своим посетителям, как правило,

это сообщение об акции, скидках или сопутствую‑щих товарах. Для удобства пользователей подсказки оформляются с использованием ссылок, что предоставляет оптимизатору еще одно поле для маневров.

Page 39: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 37

«Последние поступления».

Учитывая возрастающее значение пове-денческих факторов в  алгоритмах ран-жирования поисковых систем, мы можем предположить, что ссылка, по которой кли-кают, имеет большее значение, чем та, ко-торая никому не понадобилась. Опираясь на это, мы можем сделать вывод, что хоро-шо оформленный блок ссылок-подсказок будет тем лучше выполнять свое «seoшное» предназначение, чем удобнее для посети-телей будет навигация.

Популярные товары:

#IMG Марка + модель #1

#IMG Марка + модель #2

#IMG Марка + модель #3

#IMG Марка + модель #4

#IMG Марка + модель #5

тип 6: Перелинковка внутри текста

Перелинковка этого типа очень просто внедряется и в уже написанные тексты, но лучше закладывать ее еще на этапе их создания, чтобы хорошо продумать струк-туру текстов и сделать ссылки внутри них максимально полезными посетителю страницы. В качестве примера приведем текст из Википедии, где ссылки оформле-ны очень удобно для пользователей.

Автоматизировать подобную перелин-ковку достаточно просто. Для этого нуж-но написать несложный скрипт, который будет искать в текстах базы данных задан-ные ключевые слова и по определенному

Анар Бабаев, директор по развитию, Click.ru:

– Как вы думаете, почему поисковики учитывают внутренние ссылки?

Откуда это пошло?Разработчикам алгоритмов в свое время приходилось цепляться за каждый более‑менее осязаемый фактор. Но обсчет этих факторов накладывал определенные ограничения на их внедрение. Учет внутренних ссылок – не та‑кая уж сложная процедура.Программисты видели, как рядовые пользователи ставили внутренние ссылки. И задавались вопросом: если мы учитыва‑ем внешние ссылки, почему бы не учитывать и внутренние?Лучшие схемы перелинковки вы найдете не в учебниках по SEO и не на сайтах оптимизаторов, а там, где владельцы сайтов думают о своих посетителях:• Внутренние ссылки помогают продавать. Посмотрите на то‑

варную карточку магазина «Озон». Купившие этот товар также покупают… и текстовые ссылки на похожие книги. Ссылки на авторов, отзывы, издательства, каталог. Удобно, не правда ли?

• Внутренние ссылки заставляют пользователя не уходить с сайта. Зайдите на любую страницу Википедии. Вы читаете один материал, потом интересуетесь другим, смотрите дополнительную информацию, открываете изображения и всячески взаимодействуете с сайтом. Полезно?

• Внутренние ссылки помогают не потеряться. Вы наверняка встречали на многих ресурсах облака тегов, хлебные крош‑ки, сквозные ссылки и другие элементы навигации. Все это крайне необходимо! Такие фишки придуманы не оптимиза‑торами, поисковики же с удовольствием их учитывают.

Прежде чем вникать в «кольца», «пирамиды» и «звезды», подумайте о ваших посетителях. Как им было бы удобнее находить информацию на вашем сайте?

МненИе

Page 40: Л.Гроховский - Руководство по внутренним факторам

38 Перелинковка страниц

алгоритму, для некоторых из них дописы-вать анкоры.

тип 7: Перелинковка внутри текста с ис-пользованием якорей

Навигация по  большому тексту станет удобнее, если поставить несколько якорей вида <a name=…. В этом случае при пе-релинковке можно ставить ссылку сразу с указанием якоря в URL.

1.6. Составление текста ссылки для перелинковки

Правильная перелинковка позволяет управлять весом страниц, поэтому важ-но уделить внимание текстам ссылок. При составлении текстов ссылок для вну-тренней перелинковки нужно иметь чет-кое представление о  том, какие группы запросов являются целевыми для конкрет-ных страниц. В ваших интересах сделать так, чтобы как  можно большее количе-ство ссылок получило уникальный текст.

Рис. 6. http://ru.wikipedia.org/wiki/Nofollow

Page 41: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 39

По  возможности задействуйте больше ключевых слов.

В  качестве текста ссылок для  коммерче-ских тематик рекомендуется использовать следующие конструкции:

прямая форма запроса (например, «но-утбук Acer Aspire 5551g»),

прямая форма запроса + образующие слова («купить ноутбук Acer Aspire 5551g»).

Кроме того, при подборе запросов важно определить часть запроса, формирующую группу. В нашем примере это – 5551g, так как все запросы, содержащие в себе этот фрагмент, будут актуальны для продвиже-ния на данную страницу. Поэтому к реко-мендуемым конструкциям мы добавляем еще следующую:

часть запроса + образующие слова («ку-пить Acer Aspire 5551g»).

Подобные комбинации, сгенерирован-ные из  полного шлейфа НЧ-запросов, составляют большие списки уникаль-ных текстов ссылок для  внутренней перелинковки.

При  перелинковке важно выдерживать баланс. Если множество ссылок содержит одинаковый текст, это множество может учитываться иначе, ссылки расценивают-ся как сквозные. Также рассматриваются как  сквозные такие ссылки, когда каж-дая страница сайта ссылается на данную с  различным текстом. Для  перелинков-ки не стоит задействовать все страницы сайта. И не нужно каждый раз использо-вать различные тексты ссылки: несколь-ко повторений одного текста (до 10) впол-не достаточно, если ссылка не  является сквозной.

Важно выдержать определенный по-рог так, чтобы число повторений не вы-шло на  уровень сквозных ссылок, ина-че они могут сильно перераспределить вес внутри сайта. В «СайтРепорт» поиск

При перелинковке важно выдерживать баланс. Если множество ссылок содержит

одинаковый текст, это множество может учиты‑ваться иначе, ссылки расцениваются как сквозные. Также рассматриваются как сквозные такие ссылки, когда каждая страница сайта ссылается на данную с различным текстом. Для перелинковки не стоит задействовать все страницы сайта.

Page 42: Л.Гроховский - Руководство по внутренним факторам

40 Перелинковка страниц

порога сквозных ссылок реализован в виде графика.

50

100

150

1.7. Создание модуля для перелинковкиЛегко организовать перелинковку, если сайт состоит из  20–30 страничек, но как быть, если продвигать нужно интер-нет-магазин с тысячами, а то и десятками тысяч товаров? Задача непростая. Мне хва-тило материала, чтобы создать отдельный семинар, посвященный этому вопросу. Ос-новных типов четыре: портал, интернет-магазин, корпоративный сайт, каталог.

Портал

Для перелинковки на портале можно ис-пользовать блоки:

«Другие статьи этого автора»,

«Другие статьи в этой категории»,

«Другие статьи за сегодня»,

«Самые популярные статьи за сегодня»,

«Последние статьи».

Контекстная перелинковка с  простанов-кой ссылок в  тексте статьи на  порталах воспринимается как  естественная, ее тоже нужно непременно использовать (смотрите, например, как это реализова-но в Википедии).

Следует понимать, что  при  перелинковке ссылки не  должны меняться со  временем, тем более не стоит проставлять их в динами-ческих блоках, которые трансформируются при каждом обновлении страницы. Не всегда

Контекстная перелинковка на страницах интернет‑магазина не очень эффективна,

вероятность клика по таким ссылкам низкая. А вот потенциал навигационной строки можно задей‑ствовать по полной. Каталог товаров должен быть составлен безупречно: ссылки на странице списка товаров ни в коем случае нельзя дублировать, все дубликаты нужно закрыть для индексации.

Page 43: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 41

бывает оправдано и использование навига-ционной строки, поскольку основной по-ток посетителей приходится на  НЧ-запро-сы, а  навигационная строка  – инструмент повышения веса страниц разделов.

Интернет-магазин

Для перелинковки на сайте интернет-ма-газина можно использовать блоки:

«Другие товары в этой ценовой категории»,

«С этим товаром смотрели»,

«Сопутствующие услуги / товары»,

«Другие товары этого производителя»,

«Другие товары этой группы».

Контекстная перелинковка на страницах интернет-магазина не очень эффективна, вероятность клика по таким ссылкам низ-кая. А вот потенциал навигационной стро-ки можно задействовать полностью.

Каталог товаров должен быть составлен безупречно: ссылки на  странице спис-ка товаров ни в коем случае нельзя дуб-лировать, все дубликаты нужно закрыть для индексации.

Наглядный пример подобного модуля пе-релинковки вы можете наблюдать на сайте www.mobiguru.ru (рис. 7). Здесь мы видим

Рис. 7. www.mobiguru.ru

Page 44: Л.Гроховский - Руководство по внутренним факторам

42 Перелинковка страниц

два блока (слева и  сверху) со  ссылками на карточки популярных товаров.

Корпоративный сайт

Корпоративные сайты редко достигают та-ких масштабов, чтобы для перелинковки страниц потребовалась автоматизация. Если  же такая необходимость возникла, лучше всего использовать контекстную перелинковку.

Каталог

По  сути, каталог  – это уменьшенная мо-дель интернет-магазина, следовательно, в  продвижении каталога можно исполь-зовать все блоки, которые актуальны для последнего:

«Другие товары в этой ценовой катего-рии»,

«С этим товаром смотрели»,

«Сопутствующие услуги / товары»,

«Другие товары этого производителя»,

«Другие товары этой группы».

По сути, каталог – это уменьшенная модель интернет‑магазина, следовательно,

в продвижении каталога можно использовать все блоки, которые актуальны для последнего.

Page 45: Л.Гроховский - Руководство по внутренним факторам

Н а сайте могут наличествовать дуб-ликаты контента – страницы, пол-ностью или частично идентичные

друг другу. Одной из  главных проблем поисковых систем является устранение дубликатов.

2.1. Чем вредны дубликатыСкорее всего, вы уже наслышаны о мусор-ных сайтах, которые содержат автоматиче-ски созданные документы, дорвеи. Созда-ются дорвеи в поистине промышленных масштабах, а живут за счет продажи трафи-ка. Наполняются такие сайты легко и бы-стро  – ворованным контентом или  сге-нерированными текстами. Понятно, что для пользователей дорвеи не представ-ляют ценности, кроме того, они занимают серверные ресурсы поисковых систем, по-этому последние стремятся исключать по-добные сайты из индекса.

Проблема дубликатов схожа с проблемой дорвеев. Для поисковых систем это стра-ницы, захламляющие Интернет, ведь они не содержат уникального контента. Зна-чит, нет никакого смысла в их индексации.

Со стороны ПС проблема дубликатов, с од-ной стороны, схожа с  проблемой дорве-ев – ибо какой смысл индексировать не-уникальный контент. С  другой стороны, неуникальный контент  – это не  всегда приговор. Поговорим об этом во врезке. Однако, особенно это касается нечетких дубликатов, поисковик не  может забы-вать, что  иногда на  базе неуникального

Глава 2Устранение дубликатов

Page 46: Л.Гроховский - Руководство по внутренним факторам

44 Устранение дубликатов

контента возникают сервисы, обладаю-щие так называемой «добавочной стои-мостью», которой они могут наделять не-уникальный контент. Хорошим примером таких сервисов является рейтинг блогов и новостей.

Масштабы этой проблемы часто недооце-нивают. Мне встречались «прекрасные» сайтики, содержащие по  40 дубликатов каждой страницы. Подобный сайт зани-мает у поисковой системы в 40 раз боль-ше ресурсов, чем требуется. Казалось бы, почему не проиндексировать все? Простой подсчет: для индексации и обработки мил-лиарда страниц, допустим, понадобится 100 серверов, а если каждая страница име-ет хотя бы по три дубликата? Как видите, решение проблемы дубликатов позволяет уменьшить затраты на серверные мощно-сти в несколько раз.

Чем вредны дубликаты для оптимизатора?

1. Ссылочный вес размывается.

Вместо того, чтобы увеличивать значение одной страницы, мы рассеиваем ссылки по  нескольким страницам-дубликатам, в результате чего каждый из этих дубли-катов получает меньший вес.

2. Входной может оказаться не та копия, на которую стоят ссылки.

Нередко бывает, что после очередного ап-дейта дубликат вытесняет в выдаче про-двигаемую страницу, и та теряет позиции.

3. Контент теряет уникальность.

Дублированный контент понижает сте-пень уникальности всех страниц, на кото-рых он размещен. Страница с уникальным контентом имеет существенно больший вес.

4. Поскольку дубликаты исключаются из поиска, из него может исчезнуть нуж-ная нам страница.

Важной областью информационного поиска является поиск дубликатов

документов. От того момента, как документ первый раз индексируется поисковой систе‑мой, и до того, как этот документ появится в основных результатах поиска, содержимое документа многократно оценивается и сравнивается с содер‑жанием индекса ПС.

МненИе

Page 47: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 45

В борьбе с дубликатами поисковые систе-мы могут запросто исключить из  своей базы те страницы, которые мы продвига-ем, и оставить дубликат, который не име-ет ни входящих внешних ссылок, ни осо-бых бонусов по внутренней оптимизации.

Итак, проблема дубликатов в целом сво-дится к двум моментам:

поисковые системы часто исключают из поиска значимые страницы, поскольку не способны корректно определять, какой из дубликатов имеет большую ценность;

сайт с  огромным количеством дуб-лированного контента индексируется не полностью.

2.2. Классификация дубликатовДубли бывают полными и  частичными. Полный дубликат – это абсолютно иден-тичные страницы, частичный – страницы, совпадающие не полностью. В зависимо-сти от  типа дубликата выбирают способ его устранения: полные дубликаты за-крывают через robots.txt и 301 редирект, для устранения частичных дублей прихо-дится делать правки на страницах.

Полные дубликаты

1 . Фокусы с URL

В индексе поисковых систем должна нахо-диться только одна версия главной страни-цы сайта, все ее дубликаты нужно удалить либо закрыть для индексации.

Например, мы имеем варианты такого вида:

http://www.site.ru / http://www.site.ru / index.phphttp://www.site.ruhttp://site.ru / https://www.site.ru /

Из  вышеперечисленных конструкций оптимально использовать для  продви-жения первую (http://www.site.ru / ).

Встречаются «прекрасные» сайтики, содержащие по 40 дубликатов каждой

страницы. Подобный сайт занимает у поисковой системы в 40 раз больше ресурсов, чем требуется. Казалось бы, почему не проиндексировать все? Простой подсчет: для индексации и обработки миллиарда страниц, допустим, понадобится 100 серверов, а если каждая страница имеет хотя бы по три дубликата? Как видите, решение проблемы дубликатов позволяет уменьшить затраты на серверные мощности в несколько раз.

Page 48: Л.Гроховский - Руководство по внутренним факторам

46 Устранение дубликатов

Для  устранения остальных применя-ем 301  редирект и  настройки robots.txt (в  случае с  конструкциями вида https://www.site.ru / ).

2 . Смена директорий

Золотое правило гласит: каждая страница должна быть доступна только по одному адресу. Нельзя, чтобы адреса варьирова-лись таким образом:

http://www.site.ru / dir1 / dir2 / http://www.site.ru / dir2 / dir1 /

Пользователь может переходить по пути «фотоаппараты» –> Canon или Canon –> «фотоаппараты», и в любом случае адрес страницы должен быть одним, к примеру, http://www… / fotoapparat / canon / .

3 . Формирование URL

При  формировании URL нужно по-добающим образом настроить сер-вер: переменных в  «урле» отображать-ся не  должно. Использование URL типа http://www.site.ru / index.php?dir=1231&id =313  – ошибка. Корректным будет упо-требление http://www.site.ru / dir / 1231 / id / 313.

4 . Идентификатор сессий

Идентификатор сессий, который мы можем наблюдать в  примере URL http://www.site.ru / dir / 1231 / id / 313.php?PHPSESSID=2123, указывает на сайт, который фактически содержит бесконеч-ное количество дубликатов каждой стра-ницы. Эти страницы при очень большом везении попадают в индекс поисковых си-стем, создавая копии. Если сессии невоз-можно заменить чем-то еще, нужно закры-вать их через настройки robots.txt.

5 . Уязвимость 404 ошибки

Когда мы пытаемся открыть несущест-вующую страницу, то  чаще всего видим заглушку. Что «видит» в этом случае сер-вер? Это зависит от настроек кода ответа. Если в них прописано 404, сервер решает,

Дубли бывают полными и частичными. Полный дубликат – это абсолютно

идентичные страницы, частичный – страницы, совпадающие не полностью. В зависимости от типа дубликата выбирают способ его устранения: полные дубликаты закрывают через robots.txt и 301 редирект, для устранения частичных дублей приходится делать правки на страницах.

Page 49: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 47

что такой страницы не существует. Такой подход наиболее правильный.

К сожалению, вместо этого нередко мож-но встретить код ответа 301 («страница перемещена навсегда») или 200 («все хо-рошо»). И если в первом случае страницы просто склеиваются, то во втором случае создается дубликат. Наиболее проигрыш-ный расклад выглядит так: на сайте для не-существующей страницы отдается код от-вета 200, а вместо заглушки отображается главная страница. В  этом случае может быть поставлено любое количество вне-шних ссылок на несуществующие страни-цы, каждая из которых продублирует глав-ную и размоет ее вес.

6 . Лишние переменные

Проблема наличия лишних переменных наиболее актуальна для  универсальных коммерческих CMS. Лишние перемен-ные образуются, например, в  тех случа-ях, когда посетитель указывает дополни-тельный параметр поиска, сортировки или отображения, который не влияет на со-держание страницы, но  может учиты-ваться CMS. Через настройки robots.txt необходимо добиться того, чтобы URL ни  в  коем случае не  имели вид типа http://www.site.ru / dir / 1231 / id / 313.php?mode=2&coin=3 (корректным будет вариант http://www.site.ru / dir / 1231 / id / 313.php?mode=4).

7 . реф-ссылки

В  электронной коммерции распро-странена практика создания партнер-ских программ, способствующих про-движению товара или  услуги. Один из  принципов работы такой программы заключается в  том, что  партнер распро-страняет по  своим каналам ссылку, со-держащую его личный ID. Регистрация каждого нового пользователя по  такой ссылке приносит партнеру вознагражде-ние. Выглядит реф-ссылка примерно так:

При прочих равных более уникальная страница выигрывает у страницы с менее

уникальным наполнением. А сайт, содержа‑щий много неуникальных страниц, может в какой‑то момент быть признан менее авторитетным.

МненИе

Page 50: Л.Гроховский - Руководство по внутренним факторам

48 Устранение дубликатов

http://www.site.ru / dir / 1231 / id / 313.php?ref=1323. Понятно, что  использова-ние реф-ссылок становится причиной по-явления дубликатов. Устранить их можно также через настройки robots.txt. (в данном примере нужно дописать Disallow: *?ref).

Частичные дубликаты

1 . Сортировка

На сайтах, содержащих каталог, для удоб-ства посетителей предлагаются различные виды сортировки: по цене, по количеству отображаемых элементов на  странице, по дате добавления, по рейтингу, по ка-тегории и т. п. Пользователям становится действительно удобно, а вот у оптимиза-торов появляется проблема: сортиров-ка создает мусорные для  поисковых си-стем страницы, не содержащие никакого уникального контента. Чтобы избавиться от полудубликатов, в некоторых случаях содержимое таких страниц закрывают че-рез метатеги noindex, nofollow, в других – к URL приписывают директорию или пе-ременную, которая закрывается через robots.txt.

Иногда, правда, продвижение страниц сор-тировок в поисковых системах – единствен-но верная стратегия. В этом случае бороть-ся с полудубликатами не приходится.

2 . Частичное дублирование контента

По данным исследования «SEO-альманах 2010», проведенного в  рамках проекта «ТопЭксперт.РФ», уникальность контен-та – один из важнейших факторов ранжи-рования. Некоторые оптимизаторы упор-но игнорируют этот момент, в  то  время как на сайте есть области, таящие в себе большой потенциал для поискового про-движения. В  этой связи можно дать не-сколько советов:

На многих сайтах есть дубликаты в те-гах Description, Title, H1, Keywords. Уника-лизировав их содержимое на своем сайте,

По данным исследования «SEO‑альманах 2010», проведенного в рамках проекта

«ТопЭксперт.РФ», уникальность контента – один из важнейших факторов ранжирования. Некото‑рые оптимизаторы упорно игнорируют этот момент, в то время как на сайте есть области, таящие в себе большой потенциал для поискового продвижения.

Page 51: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 49

вы сделаете отличный вклад в продвиже-ние ресурса.

Весь дублирующийся контент в блоках типа «Схожие предложения» необходи-мо скрывать через <NOINDEX>, оставляя доступными для поисковых роботов лишь ссылки и наименования товаров.

Страницы списка анонсов должны со-держать уникальный контент, а  не  фор-мироваться из  текстов, частично дубли-рующих полное содержание статей.

Схожие страницы типа «Оставить заяв-ку» вообще не имеют значения, а потому индексироваться не должны.

Если контента на сайте нет или его мало, стоит прибегнуть к услугам копирайтеров, или сгенерировать тексты машинным пу-тем, или подумать о том, как привлечь по-ток User Generated Content.

Рассмотрим некоторые частные случаи.

2.3. Кейсы1 . Компания «БЕСт-Недвижимость»,

www .best-realty .ru

По  данным Яндекс.Вебмастер, на  мо-мент анализа всего роботом загружено 37 684 страниц, а для поиска из них доступ-но лишь 795. Чем объяснить разрыв в бо-лее чем 50 раз между количеством загру-женных и доступных для поиска страниц? Почему Яндекс исключил около 36 тысяч страниц из своей базы?

На момент проведения анализа на сайте компании было обнаружено большое ко-личество дубликатов:

1 .1 . Дубликаты сортировки

На www.best-realty.ru используется слож-ная система обработки баз данных, ко-торая все переменные помещает в  URL, и  в  результате последний выглядит сле-дующим образом:

Если контента на сайте нет или его мало, стоит прибегнуть к услугам копирайтеров,

или сгенерировать тексты машинным путем, или подумать о том, как привлечь поток User Generated Content.

Page 52: Л.Гроховский - Руководство по внутренним факторам

50 Устранение дубликатов

/ services / buy / flat / ?search_center_lat= 0&search_center_lng=0&search_radius= 0&halt_id=34&search_metro=0&is_moscow=true&search_city=0&search_fmt=0&search_mfb=1&search_price= 0&search_currency=1&search_proc= 10&search_s_min=13&search_s_max= 9936&search_ls_min=8&search_ls_max= 6000&search_ks_min=1&search_ks_max= 52&go=&go2=false.

При  малейших изменениях в  настрой-ках отображения результатов поиска URL трансформируется при  сортировке по цене, алфавиту и т. д. CMS работает та-ким образом, что возникает большое ко-личество дубликатов, вследствие чего не-которые страницы выпадают из индекса. Для решения этой проблемы инструкция-ми в robots.txt не обойтись. Возникает не-обходимость внести правки в саму струк-туру сайта, но  изменить существующую схему формирования URL невозможно из-за специфики работы базы данных. По-этому на сайте www.best-realty.ru пробле-ма с дубликатами решена нестандартно:

все страницы, содержащие переменные, закрыты от индексации;

создан дублирующий раздел, построен-ный на  ЧПУ («человекопонятном урле») с содержанием ключевых слов в адресах страниц.

В результате нам удалось добиться устра-нения всех дубликатов. Теперь URL сайта имеют вид:

http://www.best-realty.ru / buy / flat / moscow / aviamotornaya /

http://www.best-realty.ru / buy / flat / moscow / krasnokazarmennaya_ulitsa / id1120801 /

2 .1 .  «Посмотреть другие объекты в ра-диусе 1 км»

На  странице каждого объекта размеще-на ссылка «Посмотреть другие объекты

При малейших изменениях в настройках отображения результатов поиска URL

трансформируется при сортировке по цене, алфавиту и т. д. CMS работает таким образом, что возникает большое количество дубликатов, вследствие чего некоторые страницы выпадают из индекса. Для решения этой проблемы инструк‑циями в robots.txt не обойтись.

Page 53: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 51

в  радиусе 1 км». Понятно, что  подобная страница дублирует контент, посколь-ку создает дополнительную страницу сортировки.

В результате преобразований, описанных в п. 1, эта проблема была также устранена.

3 .1 . «оставить заявку на объект»

Компания «БЕСТ-Недвижимость»  – один из крупнейших риелторов на российском рынке, ее сайт содержит информацию о нескольких тысячах объектов. На стра-нице каждого из  них есть ссылка «Оста-вить заявку на объект», которая направ-ляет посетителя на страницу заявки. Все страницы этого рода идентичны, но каж-дая имеет уникальный URL, в результате чего на сайте появляется несколько тысяч дубликатов.

Проблема решена очень просто: все по-добные страницы запрещены к  индекса-ции в robots.txt.

2 . ММЦ «онКлиник», www .onclinic .ru

После анализа сайта выяснилось, что по-лезных страниц всего около 4 500. При этом реально на сайте существовало на момент исследования порядка 95 000 страниц. Дуб-ликаты появились из-за ошибок, допущен-ных разработчиками сайта.

2 .1 .  разделы «Консультации», «терми-ны», «отзывы»

На www.onclinic.ru существуют 3 дополни-тельных информационных раздела: «Кон-сультации», «Термины», «Отзывы». В эти разделы посетитель может попасть двумя путями: посетив их полную версию через главное меню сайта или посетив разделы медицинских услуг, где эти блоки пред-ставлены частями (например, в  разделе «Стоматология» вложены блоки, в  кото-рых представлены консультации, расши-фровка терминов и отзывы только по этой группе медицинских услуг). Каждый путь

Компания «БЕСТ‑Недвижимость» – один из крупнейших риелторов на российском

рынке, ее сайт содержит информацию о нескольких тысячах объектов. На странице каждого из них есть ссылка «Оставить заявку на объект», которая направляет посетителя на страницу заявки. Все страницы этого рода идентичны, но каждая имеет уникальный URL, в результате чего на сайте появляется несколько тысяч дубликатов.

Page 54: Л.Гроховский - Руководство по внутренним факторам

52 Устранение дубликатов

имеет свой URL, из-за этого на сайте по-явились дубликаты.

Для  решения проблемы полные версии разделов «Консультации», «Термины», «От-зывы» закрыты от индексации в robots.txt. Индексируемыми остались только их ча-сти, привязанные к конкретным медицин-ским направлениям.

2 .2 . Список анонсов

Элементы разделов «Консультации», «Тер-мины», «Отзывы» состоят из двух частей: вопрос-ответ, автор-отзыв, термин-тол-кование. Структура этих разделов состо-ит из страниц списка анонсов и страниц полного контента. Однако содержание каждого элемента представлено в полном объеме как на странице списка анонсов, так и на странице полного контента. В ре-зультате контент в полном объеме дубли-руется между страницами сайта.

Проблема решена следующим образом: страницы полного контента удалены за ненадобностью.

3 .  Магазин итальянской мебели, www .eurointerier .ru

В индексную базу попало более 12 500 стра-ниц, однако на сайте всего около 1 000 стра-ниц, полезных для посетителей, все осталь-ные  – дубликаты, которые появились частично вследствие недоработок на эта-пе создания сайта, а частично позже – в ре-зультате ошибок, допущенных веб-масте-ром в ходе внесения изменений на сайте.

Этот случай – яркий пример того, как по-сле доработки сайта под SEO, он стано-вится еще  менее пригодным для  про-движения. Хочу снова подчеркнуть, что  создание ТЗ на  доработку сайта и контроль его исполнения, а также по-вторный анализ сайта – прямая обязан-ность квалифицированного SEO-специа-листа. В  моей практике было всего два

Существует два простых способа борьбы с дубликатами: использование 301 реди‑

ректа и инструкций в robots.txt. К сожалению, простое решение позволяет свести на нет только проблему полных дубликатов, и то не всегда: если у вас крупный сайт, прописывать сотни строк в инструкции robots.txt, чтобы закрыть от индекса‑ции десятки, а возможно, и сотни тысяч страниц, не лучший выход. Хотя можно запретить с помо‑щью метатегов.

Page 55: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 53

случая, когда в процессе доработки сай-та, в еб-программист не создавал новых ошибок. Дело в том, что у веб-програм-миста есть свое видение хорошего сай-та, которое часто отличается от видения поисковой системы. А поскольку специ-альной подготовки в области SEO у про-граммиста нет, он не в состоянии само-стоятельно сделать сайт совершенным в плане продвижения.

Итак, в случае www.eurointerier.ru стояла задача заменить URL на ЧПУ. После прове-дения доработок каждая из страниц была доступна по трем адресам:

http://www.eurointerier.ru / index.php?catalog=1&brand= 34&model=231

http://www.eurointerier.ru / catalog / 1/ brand / 34 / model / 231 /

http://www.eurointerier.ru / catalog / gostinie / a_r_arredamenti / barnaya_ stoyka_opera /

Так, все страницы были доступны при из-менении порядка частей URL:

http://www.eurointerier.ru / catalog / a_r_arredamenti / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / a_r_arredamenti / barnaya_stoyka_opera / gostinie /

http://www.eurointerier.ru / catalog / gostinie / a_r_arredamenti / barnaya_ stoyka_opera /

http://www.eurointerier.ru / catalog / gostinie / barnaya_stoyka_opera / a_r_arredamenti /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera / a_r_arredamenti / gostinie /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera / gostinie / a_r_arredamenti /

Кстати, в панели Яндекс.Вебмастера есть весьма полезный инструмент, проверяю‑

щий корректность составления robots.txt (на дан‑ный момент Clean‑param он не читает, лишь Disallow). Добавляете сайт в панель, затем щелкаете «Настройка индексирования» и «Анализ robots.txt». После чего вам требуется в «Список URL» добавить URL, которые нуждаются в провер‑ке: будут ли они индексироваться при введенном robots.txt или не будут.

Page 56: Л.Гроховский - Руководство по внутренним факторам

54 Устранение дубликатов

Страницы карточки товара отобража-лись даже после удаления части URL с  названием товарной группы или фабрики:

http://www.eurointerier.ru / catalog / a_r_arredamenti / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / a_r_arredamenti / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera /

Прибегнув к  элементарным арифмети-ческим подсчетам, получаем, что каждая страница карточки товара имела 30 дуб-ликатов. Кроме того, на сайте были дуб-ли сортировки и  частичные дубликаты в каталоге.

Подобные проблемы решаются доработ-кой CMS, цель которых проста: каждая страница должна быть доступна толь-ко по одному адресу. В случае изменения правил формирования URL необходимо ис-пользовать 301 редирект. Страницы сорти-ровки закрываются от индексации.

2.4. Способы устранения дубликатов

Существует два простых способа борьбы с дубликатами: использование 301 реди-ректа и инструкций в robots.txt. К сожале-нию, простое решение позволяет свести на  нет только проблему полных дубли-катов, и то не всегда: если у вас крупный сайт, прописывать сотни строк в инструк-ции robots.txt, чтобы закрыть от индекса-ции десятки, а возможно, и сотни тысяч страниц, не лучший выход. Хотя можно за-претить с помощью метатегов.

Сложное решение сводится к  доработ-ке сайта: от  использования метатегов

Даниил Маул:

– Действительно, по наличию дублей в индексе порой можно отличить

оптимизатора‑новичка от профессионала. Проверку на дубли проще всего осуществить следующим образом. Если у вас интернет‑магазин, имеющий плюс ко всему раздел статей, то заходим на разные типы страниц (категория товаров, товары, статьи, главная), копируем от каждого из типов кусок текста (в рамках одного предложения, допустим, несколько слов) и вбиваем его в виде цитаты с кавычками в поиск по вашему домену в Яндексе.Если же в индексе вашего сайта в пределах ХХХ страниц, то же‑лательно обойти весь список страниц, которые видит Яндекс. Если в этом списке видны дубли или же просто бесконтентные страницы, то их нужно или удалить, или поставить запрет в robots.txt. Запрет в этом файле можно сделать двумя метода‑ми: или Disallow, или Clean‑param (второй метод более новый). Как говорит саппорт Яндекса, срабатывает Clean‑param медленнее. Ну, а действие Disallow будет заметно уже после первой переиндексации и последующего апдейта Яндекса.Кстати, в панели Яндекс.Вебмастера есть весьма полезный инструмент, проверяющий корректность составления robots.txt (на данный момент Clean‑param он не читает, лишь Disallow). Добавляете сайт в панель, затем щелкаете «Настрой‑ка индексирования» и «Анализ robots.txt». После чего вам требуется в «Список URL» добавить URL, которые нуждаются в проверке: будут ли они индексироваться при введенном robots.txt или не будут.Впрочем, должен заметить, что если анонс, например, статьи дублируется в категории статей в виде нескольких пред‑ложений, то, на мой взгляд, это ничего страшного не несет. Разумеется, если сами статьи объемные. Например, на своем блоге maulnet.ru я до сих пор не решился на страницах вида page / x запретить индексацию анонсов статей.Озаботиться стоит не только отсутствием дублей, но и все тем же ЧПУ. Я знаю случай, когда у человека, использовавшего CMS Joomla и мод к нему, Яндексом индексировался весь сайт, кроме контента, который генерил этот мод. Мод генерил, собственно, сам магазин (товары). Все из‑за того, что товары располагались на кривых и довольно длинных URL. Затем этот пользователь сделал их вида «url.ru / nazvanie‑tovara.html», и товары начали индексироваться.

МненИе

Page 57: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 55

noindex, nofollow на странице и скрытия части страницы тегом <NOINDEX> до пе-реработки структуры базы данных и  ре-структуризации сайта. Фактически мы де-лаем следующее:

1. Удаляем мусорный дублирующий контент.

2. Закрываем от  индексации дублирую-щийся, но  важный для  удобства пользо-вателей контент.

3. Если удалить разделы невозможно, дуб-лируем их вместе с содержимым, а затем скрываем от индексации. Важный момент: дубликат должен быть не только «индекси-руемым», но и «юзабельным», то есть им действительно должны пользоваться по-сетители сайта. Пример такой доработки рассмотрен выше – www.best-realty.ru. Та-кие приемы, как раздел «Статьи», запря-танный куда-нибудь в подвал и обозначен-ный мелким шрифтом, сейчас не работают (за исключением случаев, когда этот раз-дел существует уже на  протяжении не-скольких лет).

4. Используем robots.txt, чтобы закрыть лишние страницы от робота-индексатора.

*Проверить, как  будет вести себя робот Яндекса на  сайте, мож-но с  помощью специальной ути-литы из  набора Яндекс.Вебмастер http://webmaster.yandex.ru / robots.xml

В результате этих манипуляций на сайте создается не  содержащий дублей марш-рут для робота. Хорошей работой можно назвать такой маршрут, который посети-тели сайта тоже используют.

Должен поделиться своим наблюдени-ем: эффективные сайты с  высокой ви-димостью по шлейфу НЧ-запросов реже исключают страницы в  robots.txt; чаще дорабатывается сам сайт. Это связано с тем, что в результате скрытия страниц в robots.txt вес на них уходит, но обрат-но не возвращается, ссылки с них также

Важный момент: дубликат должен быть не только «индексируемым», но и «юза‑

бельным», то есть им действительно должны пользоваться посетители сайта.

Page 58: Л.Гроховский - Руководство по внутренним факторам

56 Устранение дубликатов

перестают работать. Сайт, структура ко-торого хороша настолько, что нет нужды закрывать страницы в robots.txt, ранжи-руется лучше.

Резюме: мы рассмотрели основные виды дублирования контента и спо-собы борьбы с ними. К сожалению, все случаи разобрать невозможно: вари-антов очень много, и каждый из них может иметь свои особенности. Бо-лее подробно поднятую в данной гла-ве тему я освещаю в рамках семинара «Оптимизация сайта: задействуем внутренние факторы».

Page 59: Л.Гроховский - Руководство по внутренним факторам

в этой главе мы разберемся, как со-ставлять инструкции robots.txt и  sitemap.xml для  поисковых си-

стем. Предназначение этих инструкций – помочь поисковой системе отграничить важные страницы от  мусорных, чтобы скорректировать робота, индексирующе-го сайт.

3.1. Зачем нужен robots.txtСтандарт robots.txt был принят консорциу-мом W3C 30 января 1994 года. Эта инструк-ция используется для исключения дублика-тов и других мусорных страниц из индекса поисковых систем. Кроме того, именно че-рез robots.txt можно указать Яндексу глав-ное зеркало сайта и адрес карты сайта.

В некоторых случаях к robots.txt прибега-ют для того, чтобы закрыть сайт от неже-лательной поисковой системы. Например, если вы хотите скрыть от ваших конкурен-тов информацию о сайтах, разместивших ссылку на ваш веб-ресурс, вы можете за-крыть сайт от индексации поисковой си-стемой Yahoo.

Итак, файл robots.txt выполняет следую-щие функции:

указание главного зеркала,

исключение лишних страниц из индекса,

отказ в индексации нежелательным роботам,

указание адреса карты сайта.

Глава 3Инструкции для поисковых систем

Page 60: Л.Гроховский - Руководство по внутренним факторам

58 Инструкции для поисковых систем

3.2. Robots.txt – универсальные директивы

Существуют универсальные директивы, которые воспринимают любые поиско-вые системы:

1 . Директива User-Agent

Иногда, учитывая особенности алгорит-мов ранжирования, целесообразно исполь-зовать для разных поисковых систем раз-личные маршруты обхода сайта. Для этого существует директива User-Agent.

User-Agent указывает имя робота, которо-му адресована инструкция (тогда дирек-тива имеет вид ‘User-agent: botname’), либо сообщает, что инструкция предназначена для всех поисковых систем (выглядит она как  ‘User-agent: *’). Робот botname в пер-вую очередь обращает внимание на пер-сональную инструкцию, если таковая име-ется, и следует ее указаниям, игнорируя все остальные. Если же персональной ин-струкции для робота конкретной поиско-вой системы нет, он руководствуется ‘User-agent: *’.

2 . Директива Disallow

Disallow – основная директива. Использу-ется она для запрета индексации. Указание ‘Disallow: / dir / ’ налагает вето на индекса-цию всех страниц, расположенных по ад-ресу www.site.ru / dir / . Важно указывать адрес непосредственно от корневой дирек-тории сайта. Конструкция вида ‘Disallow: http://www.site.ru / ’ некорректна и воспри-нимается как  http://www.site.ru / http:// www.site.ru / .

3 . Директива Sitemap

Sitemap указывает адрес xml-карты сайта. Если эта директива не  заполне-на, то  поисковые системы по  умолча-нию ищут файл sitemap.xml по  адре-су www.site.ru / sitemap.xml. Директив Sitemap на одном сайте может быть не-сколько, и  они бывают вложенными

В некоторых случаях к robots.txt прибегают для того, чтобы закрыть сайт от нежела‑

тельной поисковой системы. Например, если вы хотите скрыть от ваших конкурентов информацию о сайтах, разместивших ссылку на ваш веб‑ресурс, вы можете закрыть сайт от индексации поисковой системой Yahoo.

Page 61: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 59

во внутренние директории, но их непре-менно нужно указать в robots.txt.

3.3. Robots.txt – директивы для яндексаЧтобы веб-мастерам и  оптимизаторам было удобнее, Яндекс ввел дополнитель-ные директивы для указаний маршрута по-искового робота. В частности, существуют директивы:

1 . Allow

Эта директива указывает поисковой си-стеме страницы, которые нужно проин-дексировать обязательно. Ее удобство за-ключается в том, что на некоторых сайтах так сложно искать все мусорные страни-цы, что проще вместо этого указать стра-ницы полезные. В этом случае весь сайт за-крывается от индексации через директиву ‘Disallow: / ’, а инструкциями ‘Allow: …’ ро-бот направляется на полезные страницы.

Часто директива Allow используется для указания важных страниц в закрытой от индексации директории. Также ее мож-но применять, когда нужно закрыть все внутренние страницы раздела, но  оста-вить индексируемой собственно главную страницу. В  этом случае уместна такая конструкция:

User-agent: YandexDisallow: / dir / Allow: / dir / $

2 . Clean-Param

Директива Clean-param склеивает все страницы с переменной в одну:

www.site.ru / some_dir / get_book.pl?ref=site_1&book_id=123

www.site.ru / some_dir / get_book.pl?ref=site_2&book_id=123

www.site.ru / some_dir / get_book.pl?ref=site_3&book_id=123.

‘Clean-param: ref / some_dir / get_book.pl’ указывает срез для  всех страниц,

Часто директива Allow используется для указания важных страниц в закрытой

от индексации директории. Также ее можно применять, когда нужно закрыть все внутренние страницы раздела, но оставить индексируемой собственно главную страницу.

Page 62: Л.Гроховский - Руководство по внутренним факторам

60 Инструкции для поисковых систем

содержащих в URL что-то еще. В этом слу-чае проиндексируется только страница www.site.ru / some_dir / get_book.pl.

Директива Clean-param полезна для устра-нения дубликатов, связанных с сортиров-кой и реферальными ссылками.

3 . Host

Если сайт компании доступен по несколь-ким адресам, с помощью инструкции ‘Host: www.site.ru’ можно указать основное зер-кало. Именно этот сайт будет отображать-ся в результатах поиска, а все второстепен-ные зеркала будут исключены из основной базы робота-индексатора. Если у вас всего один сайт, в директиве Host нужно указать, какое из зеркал сайта является основным: www.site.ru или site.ru. В случае когда та-кой инструкции нет, Яндекс может проин-дексировать страницы обоих зеркал.

4 . Спецсимволы * и $

Спецсимвол * означает любую последова-тельность символов. Например, директива ‘Disallow: / * / search / ’ указывает поисково-му роботу на необходимость индексации всех страниц, содержащих / search / .

Спецсимвол $ означает строгое соответ-ствие. Так, ‘Disallow: / catalog / $’ демон-стрирует поисковому роботу запрет на ин-дексацию страницы www.site.ru / catalog / , при  этом вложенные страницы, напри-мер, www.site.ru / catalog / page_1.php, бу-дут проиндексированы.

3.4. Правила составления robots.txtНеопытные оптимизаторы при составле-нии robots.txt очень часто делают ошиб-ки. Чтобы не  наступать на  чужие граб-ли, нужно хорошо усвоить следующую информацию:

количество директив в файле не должно превышать 1 024,

максимальная длина 1 строки – 1 024 символа,

Если сайт компании доступен по несколь‑ким адресам, с помощью инструкции ‘Host:

www.site.ru’ можно указать основное зеркало. Именно этот сайт будет отображаться в результатах поиска, а все второстепенные зеркала будут исключены из основной базы робота‑индексатора.

Page 63: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 61

инструкция должна начинаться с User-agent,

robots.txt может содержать несколько инструкций,

http://основное_зеркало_сайта / robots.txt должен отдавать код ответа 200. Ника-кой другой код ответа не воспринимается поисковым роботом. Если по этому адре-су происходит перенаправление через ре-директ, поисковая система не станет учи-тывать robots.txt,

спецсимвол # в  начале инструкции (# Disallow: / ) отключает ее.

3.5. Разбор robots.txt на примерахПример 1 . http://mobiguru .ru /

На момент написания этой главы на сайте http://mobiguru.ru / была размещена сле-дующая инструкция robots.txt:

User-agent: Yandex

Disallow: / search /

Disallow: / js

Disallow: / *?_openstat

Disallow: / *?loc

Disallow: / * / ?*

Disallow: / *sort / price /

Disallow: / *sort / rate /

Disallow: / guru_*

Host: mobiguru.ru

Sitemap: http://mobiguru.ru / mobiguru.xml

Попробуем разобраться в  том, что  хо-тели сообщить поисковым роботам оптимизаторы.

Итак, мы видим, что инструкция предна-значена для  поисковой системы Яндекс. Для других поисковых систем инструкций не предусмотрено, следовательно, они ин-дексируют все страницы сайта.

особенность Google в Robots.txt

Если ваш URL имеет конструкцию вида http://site.ru / ?price [500], то директива

Disallow: * [* не уберет его из выдачи Google. (При этом в валидаторе все будет правиль‑но). Почему? Google некорректно восприни‑мает некоторые символы. Например «[». В выдаче ваш URL будет выглядеть так: http://site.ru / ?price%5B500 %5D. Поэтому, чтобы исключить его из выдачи, необходимо вписать в robots такую строчку:Disallow: *%5B*Квадратные скобки – не единственный случай. Всегда нужно смотреть на вид URL в выдаче.

МненИе

Page 64: Л.Гроховский - Руководство по внутренним факторам

62 Инструкции для поисковых систем

Инструкция закрывает от  индекса-ции раздел поиска (search), страни-цы сортировки (sort) и  некоторые переменные. Основное зеркало сайта  – mobiguru.ru. Карта сайта расположена по ад-ресу http://mobiguru.ru / mobiguru.xml.

Пример 2 . http://www .last .fm /

Любопытная инструкция размещена на сайте last.fm

User-Agent: *

Disallow: / music?

Disallow: / widgets / radio?

Disallow: / show_ads.php

Disallow: / affiliate /

Disallow: / affiliate_redirect.php

Disallow: / affiliate_sendto.php

Disallow: / affiliatelink.php

Disallow: / campaignlink.php

Disallow: / delivery.php

Disallow: / music / +noredirect /

Disallow: / harming / humans

Disallow: / ignoring / human / orders

Disallow: / harm / to / self

Allow: /

Инструкция предназначена для  всех ро-ботов. От индексации закрыты некоторые внутренние страницы, несколько страниц с переменными и одна директория. Три по-следние инструкции Disallow вызывают особый интерес:

1. Disallow: / harming / humans («За-прещается: причинять вред людям»)

2. Disallow: / ignoring / human / orders («Запрещается: игнорировать чело-веческие приказы»)

3. Disallow: / harm / to / self («Запреща-ется: причинять вред себе»)

Если основное предназначение robots.txt – это запрет индексации, то карта сайта

выполняет прямо противоположные задачи. Она отвечает за ускорение индексации сайта и полноту его индексации.

Page 65: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 63

Эти указания могут показаться бессмыс-лицей для каждого, кто не знаком с тремя законами робототехники, которые сфор-мулировал в рассказе «Хоровод» знамени-тый писатель-фантаст Айзек Азимов. За-коны гласят:

1. Робот не может причинить вред челове-ку или своим бездействием допустить, что-бы человеку был причинен вред.

2. Робот должен повиноваться всем прика-зам, которые дает человек, кроме тех слу-чаев, когда эти приказы противоречат Пер-вому Закону.

3.  Робот должен заботиться о  своей без-опасности в той мере, в которой это не про-тиворечит Первому и Второму Законам.

3.6. Зачем нужен sitemap.xmlЕсли основное предназначение robots.txt – это запрет индексации, то карта сайта вы-полняет прямо противоположные задачи. Она отвечает за:

ускорение индексации сайта,

полноту индексации сайта.

Sitemap.xml указывает поисковой систе-ме частоту, с которой возникает необходи-мость в переиндексации страниц. В этом плане инструкция особенно важна для сай-тов с регулярно обновляющимся контен-том (новостные порталы и т. п.).

Кроме того, sitemap.xml содержит все важные страницы сайта с  указанием их приоритета.

3.7. Директивы sitemap.xmlобязательные атрибуты

<urlset>

Атрибут инкапсулирует этот файл и указы-вает стандарт текущего протокола.

<url>

Sitemap.xml указывает поисковой системе частоту, с которой возникает необходи‑

мость в переиндексации страниц. В этом плане инструкция особенно важна для сайтов с регуляр‑но обновляющимся контентом (новостные порталы и т. п.).

Page 66: Л.Гроховский - Руководство по внутренним факторам

64 Инструкции для поисковых систем

Это родительский тег для каждой записи URL. Остальные теги являются для  него дочерними.

<loc>

Представляет URL-адрес страницы. Этот URL должен начинаться с  префикса (на-пример, HTTP) и  заканчиваться косой чертой, если ваш веб-сервер требует это-го. Длина этого значения не должна пре-вышать 2 048 символов.

Необязательные атрибуты

<lastmod>

Здесь в формате W3C Datetime указыва-ется дата последнего изменения файла. W3C Datetime позволяет при необходимо-сти опустить сегмент времени и исполь-зовать формат ГГГГ-ММ-ДД. Обратите внимание: этот тег не имеет отношения к заголовку ‘If-Modified-Since (304)’, ко-торый может вернуть сервер, поэтому поисковые системы иногда по-разному используют информацию из  этих двух источников.

<changefreq>

Атрибут задает вероятную частоту изме-нения страницы. Это значение предостав-ляет общую информацию для поисковых систем и может не соответствовать в точ-ности частоте сканирования этой страни-цы. Допустимые значения:

always,

hourly,

daily,

weekly,

monthly,

yearly,

never.

Значение «всегда» (always) должно исполь-зоваться для описания документов, кото-рые изменяются при каждом доступе к ним,

Значение «всегда» (always) должно использоваться для описания документов,

которые изменяются при каждом доступе к ним, значение «никогда» (never) – для описания архивных URL‑адресов.

Page 67: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 65

значение «никогда» (never) – для описания архивных URL-адресов.

Имейте в  виду, что  значение для  это-го тега рассматривается как  подсказ-ка, а  не  как  команда. Несмотря на  то, что сканеры поисковой системы учиты-вают эту информацию при принятии ре-шений, они могут сканировать страни-цы с пометкой «ежечасно» менее часто, чем указано, а страницы с пометкой «еже-годно» – чаще одного раза в год. Бывает, что поисковые роботы сканируют стра-ницы с пометкой «никогда», чтобы отсле-живать неожиданные изменения на этих страницах.

<priority>

Указывается приоритетность данного URL относительно других URL на вашем сайте. Допустимый диапазон значений – от 0,0 до 1,0; по умолчанию приоритетность рав-на 0,5.

Значение <priority> не  влияет на  про-цедуру сравнения ваших страниц со стра-ницами других сайтов, оно только по-зволяет указать поисковым системам, какие страницы более важны для скане-ров, на  ваш взгляд. Таким образом, вы не  сможете повлиять на  положение ва-ших URL на  страницах результатов ка-кой-либо поисковой системы. Однако поисковые системы используют эту ин-формацию при  обработке URL, кото-рые относятся к  одному и  тому  же сай-ту. Поэтому можно использовать этот тег для увеличения вероятности присутствия в поисковом индексе самых важных стра-ниц вашего сайта.

Вы должны понимать, что нет смысла на-значать высокий приоритет всем URL ва-шего сайта. Это очень относительная ве-личина, поэтому параметр используется лишь для того, чтобы определить очеред-ность обработки URL в  пределах одного сайта.

Значение <priority> не влияет на процеду‑ру сравнения ваших страниц со страницами

других сайтов, оно только позволяет указать поисковым системам, какие страницы более важны для сканеров, на ваш взгляд.

Page 68: Л.Гроховский - Руководство по внутренним факторам

66 Инструкции для поисковых систем

3.8. Правила составления sitemap.xmlСуществует несколько правил по составле-нию инструкции sitemap.xml:

Размер sitemap.xml не  должен превы-шать 10 Мб.

Файл sitemap.xml может быть разбит на несколько отдельных файлов, каждый из которых должен быть указан в robots.txt.

Файл sitemap.xml, расположенный в  некотором каталоге, должен включать только URL, находящиеся в  этом  же ка-талоге либо его вложенных разделах. Нельзя, чтобы он включал в  себя адре-са из другого (из данного и не вложен-ного в данный) каталога сайта. То  есть в  sitemap.xml, расположенном по  адресу http://www.site.ru / dir_1 / , будут учиты-ваться только инструкции для вложенных в эту категорию страниц. Инструкции, ка-сающиеся страниц, вложенных, например, в категорию http://www.site.ru / dir_2 / , бу-дут проигнорированы.

Файл sitemap.xml не должен содержать более 50 000 URL.

Нельзя использовать более 1 000 фай-лов sitemap.xml.

Эти правила очень просты, но возможно-стей sitemap.xml действительно хватит, чтобы указать информацию о  50  мил-лионах страниц сайта, а  этого более чем достаточно.

3.9. Пример sitemap.xmlРассмотрим на  примере все того  же mobiguru.ru, как  составлять sitemap.xml. Всю карту разбирать не будем, нам доста-точно небольшой ее части.

<urlset>

<url>

<loc>http://mobiguru.ru / < / loc>

<changefreq>hourly< / changefreq>

Файл sitemap.xml, расположенный в некотором каталоге, должен включать

только URL, находящиеся в этом же каталоге либо его вложенных разделах. Нельзя, чтобы он включал в себя адреса из другого (из данного и не вложенного в данный) каталога сайта.

Page 69: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 67

< / url>

<url>

<loc>http://mobiguru.ru / phones / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>http://mobiguru.ru / photo / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>http://mobiguru.ru / notebooks / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>

http://mobiguru.ru / phones / nokia / nokia_5800_xpressmusic.html

< / loc>

<changefreq>daily< / changefreq>

< / url>

. . .

Указанный отрезок карты сайта инструк-тирует поисковые системы, что  страницы http://mobiguru.ru / , http://mobiguru.ru / phones / , http://mobiguru.ru / photo / , http://mobiguru.ru / notebooks / должны индексироваться ежечасно. Частота пере-индексации страницы http://mobiguru.ru / phones / nokia / nokia_5800_xpressmusic.html – ежедневно.

. . .

<sitemapindex>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-000.txt< / loc>

Файл sitemap.xml не должен содержать более 50 000 URL.

Page 70: Л.Гроховский - Руководство по внутренним факторам

68 Инструкции для поисковых систем

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-001.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-002.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-003.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-004.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-005.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-006.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-007.txt< / loc>

Инструкции sitemap.xml и robots.txt при правильном их использовании должны

дополнять друг друга. Существуют три правила взаимодействия этих инструкций.

Page 71: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 69

<lastmod>2010-07-21< / lastmod>

< / sitemap>

3.10. Принцип взаимодействия sitemap.xml и robots.txt

Инструкции sitemap.xml и  robots.txt при правильном их использовании должны дополнять друг друга. Существуют три пра-вила взаимодействия этих инструкций:

sitemap.xml и robots.txt не должны про-тиворечить друг другу;

все страницы, исключенные в robots.txt, должны быть исключены также из sitemap.xml;

все индексируемые страницы, разре-шенные в robots.txt, должны содержаться в sitemap.xml.

3.11. Автоматизация добавления страниц в sitemap.xml

Сайтам, на  которых часто обновляется контент (новостным порталам, интер-нет-магазинам), необходима автоматиза-ция файла sitemap.xml, иначе он потеря-ет свою актуальность. Вручную обновлять инструкцию каждый день  – совершенно нерациональный подход. Для того чтобы автоматизировать добавление и  исклю-чение страниц в sitemap.xml, необходимо создать модуль, связывающий БД сайта, инструкции robots.txt и sitemap.xml. Про-грамма должна руководствоваться следую-щими правилами:

1. Примем как  данность, что  файл sitemap.xml уже изначально создан на сай-те, проработан вручную и содержит толь-ко важные страницы.

2. При добавлении новой страницы систе-ма дописывает строчку в sitemap.xml с ука-занием этой страницы. В  зависимости

Сайтам, на которых часто обновляется контент (новостным порталам, интернет‑

магазинам), необходима автоматизация файла sitemap.xml, иначе он потеряет свою актуальность.

Page 72: Л.Гроховский - Руководство по внутренним факторам

70 Инструкции для поисковых систем

от типа последней указывается параметр частоты индексации и ее приоритет. Если страница закрыта от индексации в robots.txt, она не прописывается в sitemap.xml.

3. При  удалении страницы программа ищет строчку с указанием данной страни-цы в sitemap.xml. Если страница там есть, информация о ней удаляется.

Page 73: Л.Гроховский - Руководство по внутренним факторам

вот мы и  добрались до  самого ин-тересного. В  этой главе я  расска-жу вам о  том, как  решать пробле-

мы уникальности и  недостатка текста на сайте. Непременно уделите представ-ленной ниже информации должное вни-мание, поскольку именно по наполнению страниц поисковая система распознает со-держание сайта. Нет текста – не понятно, о чем сайт, следовательно, для поисковой системы он «пустышка».

Вообще есть три серьезные проблемы оп-тимизаторов, связанные с  текстами: во-ровство контента, отсутствие и  недоста-ток текстов, дублирование текстов внутри сайта.

К сожалению, действенной методики борь-бы с воровством контента не существует. Несмотря на усилия юристов, есть способы воровства, пресечь которые невозможно. Между тем в этой главе вы познакомитесь с одной методикой, которая сводит к нулю вред, причиненный «угоном» контента.

Что касается проблемы отсутствия и недо-статка контента, то решается она обычно за счет автоматизации, а при продвиже-нии небольших сайтов  – ручным допи-сыванием недостающего уникального контента.

4.1. Уникальность контентаКаждый, кто  занимается продвижением сайтов не первый день, сталкивался с про-блемой воровства контента. Казалось бы, воруют  – и  пусть, что  в  этом такого?

Глава 4работа с авторским контентом

Page 74: Л.Гроховский - Руководство по внутренним факторам

72 Работа с авторским контентом

Но дело в том, что очень часто в итоге ко-пия оказывается выше оригинала в резуль-татах поиска, а значит, воровство контента можно приравнять к воровству трафика. Ходят слухи, что на одной из конференций представители Яндекса озвучили значение погрешности определения первоисточни-ка, назвав цифру ~ 30 %.

Как  же так? Неужели поисковая систе-ма не  может определить первоисточник и  ранжировать сайты справедливо? Все-го-то и нужно – определить, где контент появился раньше, и  отдать этому сайту предпочтение. Но не все так просто. Ведь поисковая система переиндексирует сай-ты неравномерно. Допустим, если ваш ресурс обновляется не часто, значит, ско-рее всего, и поисковый робот – не частый ваш гость. Если вы публикуете результа-ты научного исследования раз в  3 меся-ца, а  новостной портал разместит вашу статью как  свою, шансы, что  у  вас ста-тья будет проиндексирована раньше, ни-чтожны. На живые новостные порталы ро-бот-индексатор заглядывает несколько раз в час, а ресурс с менее подвижным контен-том может посетить и через несколько не-дель. Таким образом, выходит, что «ори-гинал» статьи расположен на новостном портале, а научный центр опубликовал его «копию». Как видите, по дате индексации определять оригинал нельзя.

Тогда, может быть, определять первоис-точник по авторству в тексте статьи? Бес-полезно, ведь ворам не  составит труда указать свое авторство и сайт в качестве первоисточника. Даже ссылки на ориги-нал, которые указали добросовестные сайты, разместившие ваши статьи,  тоже не спасение. Можно запросто разместить на своем сайте чужую статью, а потом про-дублировать ее в нескольких блогах с ука-занием сайта как первоисточника.

Как  видите, любые признаки оригина-ла легко подделать. Поисковые системы

Если вы публикуете результаты научного исследования раз в 3 месяца, а новостной

портал разместит вашу статью как свою, шансы, что у вас статья будет проиндексирована раньше, ничтожны. На живые новостные порталы робот‑индексатор заглядывает несколько раз в час, а ресурс с менее подвижным контентом может посетить и через несколько недель.

Page 75: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 73

не  станут разбираться в  этих тонкостях, а владельцам сайта нет смысла в каждом случае пытаться восстановить свои автор-ские права юридически. Борьба с дорвея-ми, ворующими контент, подобна борь-бе с  ветряными мельницами, ведь эти сайты размещают на  доменах, зарегист-рированных на  несуществующих людей в  зонах, не  подвластных влиянию юрис-дикции Российской Федерации. Против сайтов, размещенных на зарубежных хо-стингах и  не  в  доменной зоне РФ, вы  – увы! – бессильны. Если же сайт, укравший ваш контент, располагается на  россий-ской «интернет-территории», а вы име ете юридическое подтверждение авторства или хотя бы след в веб-архиве, вы можете связаться с хостером или владельцем доме-на и попросить убрать ворованые тексты, а  в  случае их  отказа сделать это, подать иск. Но все-таки куда проще и дешевле на-писать новый текст, чем закрепить за со-бой через суд авторство существующего.

Открою вам страшный секрет: поиско-вые системы не пытаются распознать оригиналы и копии контента. Их зада-ча  – удовлетворить своих посетителей, а  на  уровень удовлетворенности никак не повлияет, окажется ли на первом ме-сте в результатах поиска оригинал или же там расположится копия. Поэтому воров-ство контента – это головная боль исклю-чительно оптимизаторов, а не разработчи-ков поисковых систем.

Второй важный момент: в рунете практи-чески нет статей, уникальных на 100 %. Какая-то  часть любой статьи с  огром-ной долей вероятности уже встречалась где-то в Сети, а значит, невозможно точ-но разграничить оригинал и  переписан-ный текст (рерайт).

Немного статистики для  понимания масштабов:

По данным проекта «Черный квадрат», реализованного Алексеем Тутубалиным

Поисковые системы не пытаются распо‑знать оригиналы и копии контента.

Их задача – удовлетворить своих посетителей, а на уровень удовлетворенности никак не повлия‑ет, окажется ли на первом месте в результатах поиска оригинал или же там расположится копия.

Page 76: Л.Гроховский - Руководство по внутренним факторам

74 Работа с авторским контентом

по адресу http://www.rukv.ru / , 9 сентября 2010 года в Рунете только на поддоменах второго уровня в зонах.RU и.SU работало 1 893 837 сайтов.

По данным Яндекса, опубликованным в  информационном бюллетене осенью 2009  года, в  Рунете насчитывалось око-ло 15 миллионов сайтов (это около 6,5 % всего Интернета). При этом информация в Сети распределена неравномерно: 88 % всего текста находится менее чем на 1 % сайтов. Средний сайт Рунета состоит из 255 страниц, содержит 159 тысяч слов и 204 картинки. Большинство сайтов го-раздо меньше среднего: половина из них состоит всего из одной страницы.

Так будем  же реалистами и  усвоим три простые истины:

1. Невозможно достоверно определить первоисточник.

2. Практически не  существует на  100 % уникального контента.

3. Большинство страниц имеет дубликаты.

Неутешительная картинка? Не стоит опу-скать руки. В действительности все не так плохо, как кажется. Периодически обнов-ляйте контент на входных страницах, это положительно сказывается на  ранжиро-вании сайтов. Как поступать с дубликата-ми, вы уже знаете из 2-й главы. Что касает-ся воровства контента, есть действенный способ нейтрализовать вред, который оно наносит.

4.2. Как защитить контент от воровства?

БЕСПоЛЕЗНо:

дублировать статью на сторонних сай-тах с указанием вашего сайта в качестве первоисточника, поскольку это не оказы-вает значительного влияния на позиции сайта в выдаче;

По данным Яндекса, опубликованным в информационном бюллетене осенью

2009 года, в Рунете насчитывалось около 15 мил‑лионов сайтов (это около 6,5 % всего Интернета). При этом информация в Сети распределена неравномерно: 88 % всего текста находится менее чем на 1 % сайтов.

Page 77: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 75

отключать через JavaScript правую кноп-ку мышки и выделение текста на странице, использовать любые программные спосо-бы защиты контента от копирования, по-скольку в 99 % случаев воруют не путем ко-пирования контента со страницы, а парсят специальными программами, которые пе-рекачивают сайт и срезают теги, оставляя только текст статьи, а иногда контент вы-дирают вручную из HTML;

ставить ссылки на первоисточник в тек-сте статьи, так как чаще всего такие ссыл-ки срезаются программами-парсерами.

Что же делать?

определите, по каким запросам вас мо-гут искать, составьте правильные анко-ры, закупите ссылки . Ссылки нужно раз-мещать с  быстроиндексируемых сайтов, а в качестве текстов ссылок следует исполь-зовать небольшие части статьи. Если при-менять простенький скрипт, можно авто-матизировать этот процесс. Скрипт будет разбивать заданный текст на пассажи с от-бивкой не более 100 символов и дописы-вать теги для размещения ссылок в SAPE.

Закупая ссылки с частями текста статьи, мы поднимаем страницу со статьей в ре-зультатах поиска выше других копий, по-скольку синергия между содержимым на странице и в анкор-листе увеличивает значимость этой страницы.

У  этой методики существует свой недо-статок: используя разбивку текста на пас-сажи, мы теряем запросы, возникающие на их стыке, ведь текст дробится на части, которые не накладываются друг на друга. Кроме того, если мы будем просто последо-вательно перебирать весь текст, то станем тратить лишние деньги на продвижение запросов вроде «продукция предприятия получила высшую оценку», а они никогда не приведут к нам целевых посетителей. Поэтому нужно брать тексты ссылок из об-ластей около ключевых слов конкретной

Ссылки нужно размещать с быстроиндекси‑руемых сайтов, а в качестве текстов ссылок

следует использовать небольшие части статьи. Если применять простенький скрипт, можно автоматизировать этот процесс. Скрипт будет разбивать заданный текст на пассажи с отбивкой не более 100 символов и дописывать теги для раз‑мещения ссылок в SAPE.

Page 78: Л.Гроховский - Руководство по внутренним факторам

76 Работа с авторским контентом

страницы. Именно по ним на сайт могут попасть целевые посетители. В общем виде методика такова: анкор не более 100 сим-волов, отбивка «ключевое слово в конце текста ссылки» и отбивка «ключевое сло-во в начале текста ссылки».

4.3. Как воровать контент?Воруется контент точно по такому же прин-ципу, как и защищается. Вышеописанный способ работает в обе стороны: при краже статья копируется, а на нее размещаются входящие внешние ссылки с частями тек-ста статьи в анкоре.

4.4. отсутствие и недостаток контентаНехватка или полное отсутствие контен-та на сайте приводит к ошибкам в ранжи-ровании, поскольку поисковые системы не  могут корректно распознать принад-лежность страницы к ключевым словам. На небольших сайтах недостаток контен-та восполняется вручную – дописывани-ем недостающих текстов, а вот на крупных ресурсах не обойтись без автоматизации. Например, на  сайте http://mobiguru.ru

О том, как купить DELL Alienware M11x дешевлеСравни все цены на DELL Alienware M11x в более чем 27 интернет-магазинах, продающих ноутбуки, найди, где можно купить DELL Alienware M11x дешевле, определив лучшую и среднюю стоимость, закажи ноутбук DELL Alienware M11x в самом дешевом месте с доставкой по Москве, Санкт-Петер-бургу, Екатеринбургу или всей России и даже Украине!

О том, как купить ASUS K50IJ дешевлеСравни все цены на ASUS K50IJ в более чем 49 интернет-магазинах, продающих ноутбуки, найди, где можно купить ASUS K50IJ дешевле, определив лучшую и среднюю стоимость, закажи ноут-бук ASUS K50IJ в самом дешевом месте с доставкой по Москве, Санкт-Петербургу, Екатеринбургу или всей России и даже Украине!

Информация о Toshiba Satellite A350Прочитай полный обзор Toshiba Satellite A350 и эксклюзивный тест ноутбука, ознакомься с от-зывами владельцев Toshiba Satellite A350 в форуме ноутбука, просмотри описание Toshiba Satellite A350 с характеристиками и фото ноутбука и не забудь про новости!

О том, как купить DELL Inspiron M301z дешевлеСравни все цены на DELL Inspiron M301z в более чем 18 интернет-магазинах, продающих ноутбуки, найди, где можно купить DELL Inspiron M301z дешевле, определив лучшую и среднюю стоимость, закажи ноутбук DELL Inspiron M301z в самом дешевом месте с доставкой по Москве, Санкт-Петер-бургу, Екатеринбургу или всей России и даже Украине!

Page 79: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 77

проблему недостатка контента решили за счет генерации мини-описаний с вхо-ждениями ключевых слов в тексте.

Следует отметить, что важно не только на-личие контента, но  и  его уникальность, структура, наполненность. По  лицензии Яндекса, сайты, использующие неуни-кальный контент, могут быть частично или полностью исключены из индексной базы. Кроме того, страницы с неуникаль-ным контентом ранжируются хуже.

Далее нам предстоит подробно рассмо-треть способы автоматической генера-ции контента. Мы разберем не только ге-нерацию контента в  тексте страницы, но также генерацию метатегов description и keywords и генерацию заголовков TITLE.

4.5. Автоматизация наполнения Description, Keywords, Title

В зависимости от приспособленности CMS автоматизация заполнения заголовков и метатегов может быть реализована дву-мя путями:

разработка встраиваемого в  CMS модуля,

ручная загрузка ранее сгенерированных текстов в БД.

Первый способ более практичен и  удо-бен, чем  второй. Для  продвижения сай-тов, на которых часто появляются новые страницы, подходит только он. Второй спо-соб значительно более прост в реализации, но он идеален только для тех сайтов, где количество новых страниц за месяц мож-но пересчитать по пальцам.

автоматизация наполнения keywords

По  умолчанию этот тег должен быть пу-стым. На входных страницах в него впи-сываются все продвигаемые запросы. Ав-томатизировать наполнение тега можно в зависимости от типа сайта: либо через интеграцию с БД, откуда будет забираться

Воруется контент точно по такому же принципу, как и защищается. Вышеописан‑

ный способ работает в обе стороны: при краже статья копируется, а на нее размещаются входящие внешние ссылки с частями текста статьи в анкоре.

Page 80: Л.Гроховский - Руководство по внутренним факторам

78 Работа с авторским контентом

наименование товарной группы и назва-ние конкретной модели, либо через лин-гвистический анализ текста страницы, результатом которого должны стать наи-более часто употребляемые на ней слова. Неключевые частоупотребимые слова мо-гут удаляться через специальный словарь или вручную при небольших объемах.

автоматизация наполнения TITLE

Настраивается через формулу [TITLE стра-ницы] [TITLE раздела] [TITLE сайта]. TITLE страницы = H1 страницы, TITLE раздела = H1 раздела, TITLE сайта задается изна-чально и дублируется на всех страницах сайта. Желательно, чтобы в TITLE попали все возможные части запросообразующих слов. В этом случае не обойтись без пропи-сывания корректных заголовков H1, хотя при правильной верстке и грамотном на-полнении сайта, этот тег должен содержать основные ключевые слова страницы.

Пример TITLE с  сайта компании «БЕСТ-Недвижимость»:

Квартиры в  Бибирево. Предложения по продаже квартир в Москве, новострой-ки и вторичная недвижимость. Агентство недвижимости «БЕСТ».

Квартиры в Медведково. Предложения по продаже квартир в Москве, новострой-ки и вторичная недвижимость. Агентство недвижимости «БЕСТ».

Коттеджи в  Солнцево. Загородная не-движимость в Подмосковье. Агентство не-движимости «БЕСТ».

автоматизация генерации Description

Настраивается по заданной формуле2 типа [Текст] [x] [Текст] [y] [z] [a] [b] [Текст].

С айтРепорт – система SEO‑аналитики, позволяющая проводить диагностику сайта.

СайтРепорт – это возможность провести полную диагности‑ку сайта, увидеть его глазами поисковых систем. Оптими‑затору приходится сталкиваться со множеством проблем: недостаток контента, 404 ошибки, дубликаты страниц, мусорные ссылки, страницы 30 уровня вложенности, отсут‑ствие заголовков… Легко найти ошибки на небольшом сайте, достаточно просмотреть все страницы вручную. Что делать, если на сайте несколько тысяч страниц? Наш робот выполнит эту работу за вас, перекачает ваш сайт, после чего система проведет анализ, который вы подробно изучите. Сделав анализ сайта, вы получите подробный отчет об ошибках и узнаете потенциал вашего проекта в работе с внутренними факторами.Проще говоря, бесплатно решите проблему внутренних факторов.

КАК РАБотАет СИСтеМА:

Система представляет собой программный комплекс, исполь‑зующий мощности нескольких серверных машин и состоящий из 5 модулей:# Робот-индексатор

Робот обходит все страницы сайта в соответствии со всеми инструкциями для вашего сайта, то есть фактически имеет все функции поискового робота. Робот заносит в базу код ответа каждой страницы, запоминает скорость соединения, сохраняет контент каждой страницы, вынося в отдельный блок все исходящие ссылки.# Анализ ссылочных связей

Модуль выстраивает ссылочные связи всех страниц между собой, обрабатывая миллионы ссылок. Для каждой страницы составляется список входящих внутренних ссылок с указанием анкоров. Все ссылки проверяются на индексацию. Система рассчитывает условный вес каждой страницы по технологии, имитирующей расчет PageRank. Создаются отчеты с указани‑ем всех страниц, ссылающихся на 404 ошибки, а также всех страниц, с которых стоят редиректы.# обработчик контента

Система определяет уникальность контента каждой страницы сайта по отношению к другим его страницам, сравнивая содер‑жание всех страниц между собой. Модуль сравнения основан на собственной технологии построения хешей частей страниц с использованием технологии шинглов, что обеспечивает большую скорость и точность полученных данных. Система также определяет страницы с недостатком и переизбытком контента.

ФАКт

2Бывает, что  в  формуле полностью отсут-ствует статичный текст. Переменные могут быть выражены как  элементом БД (наиме-нование модели, название марки, цена), так и браться из словаря, который заранее гото-вит копирайтер.

Page 81: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 79

Пример:

«Фабрикой [M] производится классиче-ская и  современная [A]. Модель [N] от-личается от [B]. Позвоните прямо сейчас +7 495 777-77-77».

A = [мебель для  кухни|кухонная мебель]

B = [элегантностью и уникальным ди-зайном|оригинальным дизайном и  на-дежностью конструкций]

M = $fabrique

N = $model

4.6. Автоматизация генерации контента

автоматизация генерации описаний товаров

Аналогично с  Description настраивается по  формуле3 типа [Текст] [x] [Текст] [y] [z] [a] [b] [Текст].

Пример:

«Фабрикой [M] производится классиче-ская и современная [A]. Модель [N] отли-чается от [B]».

A = [мебель для  кухни|кухонная мебель]

B = [элегантностью и уникальным ди-зайном|оригинальным дизайном и  на-дежностью конструкций]

M = $fabrique

N = $model

автоматизация генерации технических характеристик (уровень 1)

Аналогично настраивается по  формуле типа [x] [A]; [y] [B]; [z] [C];

# HTML-валидатор

Модуль обрабатывает HTML‑код каждой страницы, выделяя содержание всех важных HTML‑тегов: TITLE, Meta keywords, Meta description, STRONG, B, EM, H1‑H6. Система выстраивает отчеты по дублированию содержимого этих тегов, а также делает срезы по страницам, где важные HTML‑теги пусты.# Среда для аналитики – http://СайтРепорт.РФ /

Вы изучаете полученные данные и на основании их планируе‑те, как вам дальше продвигать сайт.Система перекачивает до 5 000 страниц вашего сайта.

Какую информацию вы получите о сайте:• Общий анализ сайта.• Анализ внутреннего анкор‑листа.• Расчет распределения весов между страницами при пере‑

линковке по классической формуле PageRank.• Поиск битых ссылок.• Поиск сквозных ссылок.• Проверка HTML‑кода всех страниц на валидность.• Анализ корректности <noindex> и rel=nofollow.• Генератор sitemap.xml.• Анализ внутренней перелинковки.• Сводные отчеты с графиками по перелинковке.• Проверка на наличие сайта в крупных каталогах.• Поиск страниц с исходящими внешними ссылками.• График распределения страниц по ответу сервера.• Поиск страниц с 404 ошибками.• Поиск страниц с 3** редиректами.• Оценка размера страниц и скорости их загрузки.• График распределения страниц по уровням вложенности.• Список 100 % дубликатов страниц, одинаковых в рамках

сайта.• Список 90 %+ дубликатов страниц, одинаковых в рамках

сайта.• Анализ заполненности страниц.• Пустые страницы.• Отчет «На какие страницы ссылается данная».• Отчет «Какие страницы ссылаются на данную».• Анализ TITLE.• Страницы с одинаковыми TITLE.• Дубликаты Keywords.• Дубликаты Description.• Страницы с пустыми TITLE.• Оценка составления заголовков H1‑H6.• Анализ разметки STRONG и B.• Анализ разметки EM.

3Бывает, что  в  формуле полностью отсут-ствует статичный текст. Переменные могут быть выражены как  элементом БД (наиме-нование модели, название марки, цена), так и браться из словаря, который заранее гото-вит копирайтер.

Page 82: Л.Гроховский - Руководство по внутренним факторам

80 Работа с авторским контентом

Пример:

«Вес шкафа 213 кг. В  высоту шкаф 10 м. В длину 8 м».

A = [213 кг]

B = [10 м]

C = [8 м]

x = [Вес шкафа | Масса шкафа | Шкаф весит | Вес | Масса | Насколько тяжелый]

y = [Высота шкафа| В высоту шкаф | Вы-сота | В высоту | Высота от пола | Габари-ты: высота]

z = [Длина шкафа | Габариты: ширина | Длина | В длину шкаф | В длину]

автоматизация генерации технических характеристик (уровень 2)

Строим зависимости переменных от зна-чений: выставляем пороги.

вес: крохотный 0–100; небольшой 100–200; не  очень большой 200–300; доста-точно большой 300–400; огромный 400+. В  этом случае дописываются текстовые блоки из разных словарей.

Пример: Вес шкафа не очень большой – всего 213 кг, можно хранить в помещени-ях, не оборудованных укрепленными пе-рекрытиями. В высоту шкаф займет около 10 м  – впишется в  складское помещение с высокими потолками. В длину – 8 м, до-статочно емкий, чтобы хранить большое количество грузов.

4.7. обнаружение дубликатовДубликаты – это, как правило, «побочный эффект» некоторых характеристик сайта, как-то:

наличие сквозного блока с контентом,

недостаток контента,

конструкция страниц списка анонсов,

особенности CMS, из-за которых полно-стью дублируются страницы.

• Анализ robots.txt.• Лемматизация всего контента на сайте.• Анализ плотности ключевых слов на каждой странице.• Поиск страниц, содержащих ключевые словосочетания

по сайту.• Представление контента каждой страницы без <HTML>

кода.• Анализ данных whois‑домена.• Настройка маски страниц, которые система анализирует,

т. е. можно, например, проанализировать только страницы, содержащие в URL / beauty /, или все, кроме страниц, содер‑жащих в URL thread.php.

• Настройка глубины анализа страниц.• Возможность настроить robots.txt для робота‑индексатора

системы.• Отчет только по входным страницам.• Анализ установленных метрик.• Количество ссылок в Yahoo.• Анализ скорости загрузки страниц.• Анализ размеров страниц.• Список всех страниц, на которых встречается любая форма

заданного слова.• Отчет по наиболее часто употребляемым словам всего сайта.• Экспресс‑отчет по типичным ошибкам сайта.• Структура и иерархия сайта.• Сравнение индексации типов страниц и категория в поиско‑

вых системахи множество других отчетов, список которых мы постоянно расширяем.

некоторые графики из отчета:• График заполненности TITLE

• График дубликатов в теге TITLE

Page 83: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 81

Обнаружить дубликаты можно двумя пу-тями: вручную и автоматически.

Инструкция по обнаружению дубликатов вручную

Нет необходимости объяснять, почему вручную дубликаты обнаружить сложно. Этот способ подходит лишь для  неболь-ших сайтов, где все страницы можно вни-мательно просмотреть, но даже в этом слу-чае погрешностей не избежать.

Для  ручной проверки воспользуйтесь следующим алгоритмом:

1. Анализируем данные Яндекс.Вебма-стер. Просмотрите, какие страницы Ян-декс решил удалить из результатов поис-ка. Именно они нас интересуют.

2. Через расширенный поиск Яндекса ищем все страницы, проиндексирован-ные с  данного сайта, и  ставим режим отображения 50 результатов на страни-це. Прокликиваем все проиндексирован-ные Яндексом страницы, если их меньше 500, просматриваем каждую из них вруч-ную. Если страниц больше 500, прокли-киваем только первые 500, у остальных просто просматриваем сниппеты. Этой информации хватит для  поверхностно-го анализа сайта на  дубликаты. Далее смотрим страницы, проиндексирован-ные в  Google, особенно обращая вни-мание на те, которых не было в Яндексе (они будут подсвечены в браузере синим цветом, так как вы их еще не посещали). Во время просмотра вы обнаружите часть дубликатов.

3. Просматриваем структуру сайта, вни-кая, каким образом формируется контент на  страницах, откуда берутся текстовые блоки, где возникают блоки дублирующе-гося контента.

4. Ищем контент внутри сайта по точному вхождению (для этого нужно пассаж тек-ста искать в Яндексе с использованием опе-раторов «кавычки» и  «восклицательный

• Анализ сайта на наличие сквозных ссылок

• Анализ исходящих ссылок

• Анализ глубины вложенности страниц сайта

• Анализ сайта на наличие дубликатов страниц

Page 84: Л.Гроховский - Руководство по внутренним факторам

82 Работа с авторским контентом

знак»: «!слово!слово!слово») с  основных входных страниц. Особенно здесь можно выделить главную страницу. Если дубли-каты есть, вы их увидите.

Способы автоматизации обнаружения дубликатов

Для  автоматического анализа нужно воспользоваться специализированными приложениями. На  момент написания книги существует всего одна програм-ма, доступная к  бесплатному использо-ванию и  способная провести подобный анализ, – «СайтРепорт».

Некоторые системы способны сделать не-большую часть анализа, но все они явля-ются пользовательскими и  используют мощности вашего компьютера, что очень сильно ограничивает объемы сканируе-мой информации. Сайт из нескольких со-тен страниц просканировать получится, но интернет-магазины с десятками тысяч страниц таким системам не по зубам.

Для поверхностного анализа я могу ре-комендовать некоторые программы. Например,

Semonitor осуществляет следующие операции:

поиск битых/нерабочих ссылок;

поиск «потерянных» файлов;

поиск недочетов и ошибок в html-коде;

создание подробного отчета по всем ис-ходящим ссылкам с данного сайта;

NetPromoter выполняет такие задачи:

проверка работоспособности ссылок на сайте;

поиск неработающих ссылок;

определение размера страниц.

К сожалению, эти программы не помогут вам в обнаружении дубликатов. Серьезный анализ можно сделать лишь с помощью од-ной системы, имя которой – «СайтРепорт».

Иван Севостьянов, генеральный директор «вебПроекты»:

–Контент очень важен для любого сай‑та. Еще 2–3 года назад можно было

пренебрежительно относиться к содержанию сайта, копировать информацию с чужих сайтов или вовсе не наполнять сайт полезной для посетителя информацией.Сейчас такие методы не работают, и в дальнейшем требования к текстовой составляющей сайта со стороны поисковых машин будут только расти.У контентной составляющей любого интернет‑сайта есть три проблемы. Первая – воровство контента. Вторая – стоимость создания контента. Третья – определение первоисточника контента.К сожалению, контент воровали, воруют и будут воровать, так как правовые механизмы защиты авторского права в Интер‑нете еще должным образом не отработаны, и даже если вы выиграете судебное дело, то затраты времени на судебное разбирательство будут много выше, чем сумма компенсации.Контент – дорогое удовольствие, особенно если у вас крупный контентный проект. Написание 1 страницы хорошего контента стоит от 300 рублей. Даже если у вас 200 страниц на сайте, то это уже 60 тысяч. А если страниц несколько тысяч, то сумма будет еще выше. Частично проблему можно решить за счет автоматической генерации контента, но это подойдет не всем сайтам. Поэтому вкладываться в контент спешат не все, особенно учитывая то, что его все равно могут своровать.Третья проблема – поисковики до конца не научились опреде‑лять первоисточник контента. Это тоже мешает вкладываться в написание уникального контента, так как вы можете сделать сайт с качественным контентом, его своруют, а поисковая система первоисточником может посчитать именно сайт с ворованным контентом.С сожалению или к счастью, выход один – писать уникальный и качественный контент, учиться защищать его от воровства, отстаивать свою позицию перед поисковиками в спорных ситуациях. И самое главное – помнить, что контент пишется для людей, а не для роботов!

МненИе

Page 85: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 83

Резюме: Существует две методи-ки обнаружения дубликатов: руч-ная и автоматизированная. Ручная бесплатна, но  менее эффектив-на. Для автоматизированного ана-лиза идеально подходит система «СайтРепорт» либо некоторые са-мописные разработки, используе-мые компаниями-лидерами рынка для собственных нужд.

Константин Шурыгин, генеральный директор автоматического сервиса по продвижению сайтов «Маремото»:

–Проблема дублированного контента в реальности стоит даже острее,

чем отмечено выше. В настоящий момент я веду переписку с Яндексом, который только что удалил из индекса уважаемый 8‑летний сайт, имеющий хорошие по‑казатели авторитетности и 62 000 естественных ссылок. Вместо него «главным зеркалом» был признан безвестный клон трех месяцев от роду, имеющий всего 5 платных ссылок, укравший чужой контент. Авторитетный сайт был удален и из каталога Яндекса, а его место здесь занял вынырнувший из ниоткуда дубль. От аргументов Платона Щукина веет безысходностью: «…если даже описание в каталоге Яндекса будет перенесено вручную на правильный адрес, оно автоматически вернется обратно через некоторое время, потому что ваш сайт все еще является неглавным зеркалом. Пока сайты – зеркала, перенос описания не поможет. Как только сайты перестанут быть зеркалами, напишите нам снова по вопросу возвраще‑ния в каталог…».Как показывает опыт, «раззеркаливание» может занять от одной недели до трех месяцев. За это время владелец клона с ворованным контентом обычно успевает разослать всем вла‑дельцам ссылающихся сайтов письма с просьбой «обновить ссылки в связи с переездом сайта на новый адрес». В качестве аргумента обычно приводят «новый» адрес, указываемый в Яндекс.Каталоге. Таким образом рейдерам удается украсть у ничего не подозревающих владельцев сайта не только тысячи страниц уникальных текстов, но и место в каталоге Яндекса, а также накопленную годами ссылочную базу, а потом и PageRank. Даже если впоследствии двойник будет удален из Яндекса, такой клон может зависнуть в ссылочных биржах и годами приносить доход своим владельцам.Часто дубли вашего сайта создают конкуренты, которые выка‑чивают ваш контент программами типа Teleport или Webcopier, размещают его на бесплатных хостингах, накачивают бесплатными или платными ссылками, а также дают на этот сайт рекламу в Директе. Этого бывает достаточно, чтобы спро‑воцировать Яндекс к неверному зазеркаливанию сайтов.Однако бывает и так, что дубли вашего сайта создают вовсе не злоумышленники. Дубли может создать ваш собствен‑ный веб‑мастер, заполняя зеркалами все выкупленные корпоративные домены. Часто это дело рук давно уволенного веб‑мастера, который это делал из благородных намерений не оставить тайп‑сквоттерам ни одного шанса. Так, однажды столкнувшись с проблемами в продвижении корпоративного сайта, я обнаружил 17 зеркал на доменах второго уровня, о су‑ществовании которых никто из владельцев понятия не имел. В таких случаях организация 301 редиректа на главное зеркало и наличие директивы Host в robots.txt всех доменов помогает избежать больших проблем.

МненИе

Page 86: Л.Гроховский - Руководство по внутренним факторам

84 Работа с авторским контентом

Но неожиданнее всего бывает ситуация, когда зеркала сайта делают… сервера сами. На некоторых версиях сервера Apache поддомены третьего уровня по умолчанию заполняются содержимым домена второго уровня. Если веб‑мастер создает поддомены с прицелом «на будущее», то они неожиданно для всех могут стать клонами основного сайта. Это может вы‑звать «зазеркаливание», катастрофическое падение позиций в выдаче Яндекса, заметное сокращение целевого трафика и продаж. А всему виной – один‑единственный символ *, который надо было удалить из настроек сервера.Следует постоянно следить за появлением «зеркал» своего сайта в Интернете. При наличии более авторитетных дублей вашего контента, продвижение сайта будет неэффективным, пока вы не решите проблему с этими зеркалами. Перед нача‑лом продвижения определяет наличие у сайта авторитетных зеркал. Ведь при наличии таких зеркал продвижение сайта будет нестабильным, а результат будет отсутствовать.

Page 87: Л.Гроховский - Руководство по внутренним факторам

К од ответа – это инструкция, кото-рую получает посетитель, захо-дя на страницу сайта. С помощью

этой инструкции браузер может скоррек-тировать обработку страницы на стороне посетителя. На первый взгляд, код ответа сервера – фактор, не имеющий никакого отношения к продвижению сайтов. Одна-ко это не так. Да, настройки ответа серве-ра не могут улучшить ранжирование сай-та, но  допущенная в  них ошибка может поставить крест на ваших планах покоре-ния топа результатов поиска. Поисковые роботы, как и посетители, учитывают коды ответов сервера и на их основании коррек-тируют обработку страниц. В частности, по кодам ответа поисковые системы при-нимают решение о том, что:

страница существует и  работает корректно;

страница не существует;

страница перемещена навсегда;

страница временно перемещена;

сервер загружен и не может обработать запрос.

Существуют и  другие, менее значимые, инструкции.

5.1. Код ответа 200Поисковые системы добавляют в свою ин-дексную базу только те страницы, которые отдают код ответа 200, означающий «стра-ница существует и доступна для просмо-тра». Все важные страницы, которые мы

Глава 5Коды ответов сервера

Page 88: Л.Гроховский - Руководство по внутренним факторам

86 Коды ответов сервера

хотим «скормить» поисковому роботу, дол-жны отдавать код ответа 200.

Если страница использует редирект и лишь после перемещения отдает код ответа 200, поисковая система индексирует только ко-нечную страницу. Страница-шлюз может быть удалена или понижена в ранжирова-нии (это зависит от типа редиректа).

Если страница отдавала код ответа 200 и  попала в  индексную базу, но  позже была удалена и теперь отдает код 404, она со временем удаляется из индексной базы.

Если на странице поставить 301 редирект, то через некоторое время она будет так-же удалена из индекса, а ее вес в некото-рых случаях будет передан той странице, на  которую ссылался редирект. К  сожа-лению, Яндекс очень долго осуществляет переиндексацию страниц с  редиректом: были зафиксированы случаи, когда пере-клейка происходила почти год.

5.2. Коды ответов 301 / 302 / 303 / 307 / 3**Существует большое количество кодов для обозначения редиректа. Укажем здесь основные, наиболее важные для поиско-вых систем:

301  – «постоянное перенаправление». Означает, что  страница перемещена на-всегда. Этот редирект используется чаще всего. В случае если адрес страницы изме-нился навсегда, что происходит, например, при редизайне или реструктуризации сай-та, 301 редирект позволяет сохранить вхо-дящие внешние ссылки за счет переклейки их веса на новые адреса страниц. Яндекс обрабатывает этот редирект очень долго, может пройти до года, прежде чем страни-цы склеятся.

302 / 303 / 307  – «временное перена-правление». Веб-мастер таким образом указывает роботу поисковых систем, что  страница перемещена временно,

николай Хиврин:

–Значимость верного использования кодов ответов сервера трудно

переоценить. Правильная работа с ними может позволить совершенно безболезнен‑но перейти на новую систему управления и адресацию web‑сайта. В сфере поискового продвижения особенное внимание стоит уделять трем кодам ответов: 200, 404 и 301. Пожалуй, самой частой ошибкой сегодня является неверное использование редиректов 301. Они могут отсутство‑вать вообще, а могут вести последовательно через несколько адресов. Другой важной проблемой является дублирование содержимого, а это возникает из‑за того, что у ряда сгенериро‑ванных адресов возникает код ответа 200. Правильная работа c кодами ответов сервера является очень важным навыком для поискового оптимизатора и позволяет избежать целого ряда очень серьезных ошибок.Рассмотрим наиболее распространенную ситуацию, в которой предыдущая версия сайта компании сильно устарела. Компа‑ния хочет обновить свой сайт, однако боится потерять позиции в результатах поиска, а как следствие, и источник новых клиентов. Как правило, обновление сайта связано с установкой новой системы управления (CMS), в результате чего на сайте создается новая структура адресов страниц. Если осуществить переход на новую адресацию, то, конечно же, все старые страницы пропадут из индекса поисковых систем, а вместе с ними и позиции по ключевым запросам. Однако если сделать 301 редиректы с каждого старого адреса на новые страницы, то этой проблемы можно избежать. Поисковые роботы и по‑сетители сайта будут перенаправляться на новые страницы, что позволить полностью сохранить их вес и не потерять позиции в результатах поиска.Другая распространенная ошибка: интернет‑магазин содержит каталог, он генерирует очень большое количество внутренних ссылок, а структура их бывает хаотичной. В результате этого поисковые роботы могут попасть на такие страницы, адреса которых совсем не были предусмотрены разработчиком проекта. Для того чтобы эти страницы не засоряли индекс поисковых систем, нужно правильно расставить ошибки 404 и исключить эти страницы из индекса.

МненИе

Page 89: Л.Гроховский - Руководство по внутренним факторам

Коды ответов сервера 87

а значит, ее не нужно удалять из индекс-ной базы. В этом случае Яндекс может до-бавить в свою базу обе страницы, но ото-бражать только одну из них в результатах поиска.

Из инструкций Яндекс .вебмастер:

При  постоянном перенаправлении (301) между внутренними страницами хоста в результатах поиска будет отобра-жаться цель.

При  временном перенаправлении (302 / 303 / 307 / Meta refresh) между вну-тренними страницами хоста в  результа-тах поиска будет отображаться наиболее компактный URL.

типичные ошибки:

Вместо 301 стоит конструкция вида 302 —> 302 —> 302 —> 301

Резюме: если вы изменили адрес страницы, выложили новую вер-сию сайта или  просто хотите убрать дубликат (например, скле-ить / site / и / site), используйте 301 ре-директ. Важно использовать именно одношаговый редирект, не создавай-те сложных конструкций из несколь-ких редиректов.

5.3. Код ответа 404Код ответа 404 используется для указания браузеру или поисковой системе, что стра-ницы не  существует. Сервер в  этом слу-чае отображает или стандартную страни-цу «по этому адресу ничего не найдено», или страницу-заглушку, если создан спе-циальный шаблон для  несуществующих страниц.

Важно не  путать серверный ответ 404 и  404-ю страницу-заглушку. Некоторые веб-мастера по каким-то им одним ведо-мым причинам на  404-й странице раз-мещают заглушку с  указанием «страни-ца не существует», но на уровне сервера

Другая распространенная ошибка: интернет‑магазин содержит каталог, он

генерирует очень большое количество внутренних ссылок, а структура их бывает хаотичной. В резуль‑тате этого поисковые роботы могут попасть на такие страницы, адреса которых совсем не были предусмотрены разработчиком проекта. Для того чтобы эти страницы не засоряли индекс поисковых систем, нужно правильно расставить ошибки 404 и исключить эти страницы из индекса.

Page 90: Л.Гроховский - Руководство по внутренним факторам

88 Коды ответов сервера

отдают код ответа 200. Посетитель этого не замечает, но поисковая система воспри-нимает такие страницы как  существую-щие, индексирует их и заносит в свою базу как дубликаты. Используя подобную уяз-вимость, на сайте вы можете создать сколь угодно большое количество дублирующих-ся страниц, понизив вес сайта для поиско-вой системы.

типичные ошибки:

вместо 404 стоит 200,

вместо 404 стоит 301 —> 404,

вместо 404 стоят конструкции типа 302 —> 302 —> 301 —> 404.

Резюме: если страницы не сущест-вуют, сервер должен отдавать от-вет 404.

В этой главе мы разобрали основные сер-верные ответы и методы работы с ними. Используя эту информацию, вы можете избежать фатальных ошибок, приводя-щих к исключению страниц сайта из вы-дачи, созданию дополнительных дублика-тов и потере веса при переклейке страниц.

рекомендация: Для ручной проверки кода ответа используйте бесплатный плагин LiveHTTPHeaders для Firefox. С его помо-щью вы сможете отследить весь путь ре-директов и  узнать конечный код ответа каждой страницы сайта. Автоматизиро-ванная же проверка всех страниц на код ответа доступна в  анализе, проводимом программой «СайтРепорт.РФ».

В этой главе мы разобрали основные серверные ответы и методы работы с ними.

Используя эту информацию, вы можете избежать фатальных ошибок, приводящих к исключению страниц сайта из выдачи, созданию дополнитель‑ных дубликатов и потере веса при переклейке страниц.

Page 91: Л.Гроховский - Руководство по внутренним факторам

Консорциум всемирной па-утины (англ . World Wide Web Consortium, W3C) – организация,

разрабатывающая и  внедряющая техно-логические стандарты для Всемирной па-утины. Консорциум возглавляет сэр Ти-моти Джон Бернерс-Ли, автор множества разработок в  области информационных технологий.

W3C разрабатывает для Интернета единые принципы и стандарты (называемые реко-мендациями), которые затем внедряются производителями программ и оборудова-ния. Таким образом достигается совмести-мость между программными продукта-ми и аппаратурой различных компаний, что  делает Всемирную сеть более совер-шенной, универсальной и удобной.

Миссия W3C: «Полностью раскрыть потен-циал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети»4.

Так, существует ряд стандартов HTML-верстки. Эти стандарты носят рекомен-дательный характер, но, как  пишет пер-воисточник www.w3c.org, являются желательными. Что  это означает? Суще-ствуют теги, имеющие смысловое значе-ние: заголовки, визуальное выделение тек-ста и т. п. По стандартам W3C, выделенный

Глава 6Стандарты W3C

4По материалам Википедии

Page 92: Л.Гроховский - Руководство по внутренним факторам

90 Стандарты W3C

этими тегами текстовые элементы дол-жны иметь соответствующую смысло-вую нагрузку. Например, тег H1 должен содержать заголовок страницы, пото-му что  поисковая система воспринима-ет содержание тегов H1 именно как заго-ловок, то есть очень краткое содержание страницы.

К чему приводит игнорирование реко-мендаций W3C

Верстальщики часто игнорируют рекомен-дации W3C. Это понятно, ведь перед ними не стоит задача поискового продвижения: они получают деньги лишь за корректное отображение сайта в популярных браузе-рах на распространенных разрешениях мо-нитора. В свою очередь, браузеры стремят-ся обладать максимально универсальным алгоритмом распознавания HTML, чтобы сайты с ошибками верстки отображались корректно. В  результате верстальщики, например, используют теги H1 для  обо-значения элементов меню, настоящие за-головки выделяют тегами SPAN, создают пересечения тегов заголовков H1 с ссыл-ками A. Для верстки это неважно: бра узер отобразит текст в  виде заголовка, даже если текст будет оформлен тегом P, но че-рез CSS будут прописаны соответствующие параметры визуального отображения.

Поисковые системы разборчивее браузе-ров: они не пытаются определить, как ви-зуально отображается элемент страницы, а  руководствуются исключительно стан-дартами W3C. Так, найдя на странице H1, они воспринимают его содержимое имен-но как заголовок страницы. И вот тут возни-кает самое интересное: какая информация содержится на странице, если ее заголовок выглядит как «Каталог» или «11.10.2011»? Какие услуги продает сайт, какие товары представлены на этой странице? К сожале-нию, при такой верстке потенциал факто-ров HTML-тегов остается незадействован-ным для поискового продвижения.

Поисковые системы разборчивее браузе‑ров: они не пытаются определить, как визу‑

ально отображается элемент страницы, а руковод‑ствуются исключительно стандартами W3C.

Page 93: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 91

Чтобы вы смогли избежать ошибок, в этой главе мы разберем самые важные правила HTML-верстки, с  точки зрения стандартов W3C, а следовательно, с по-зиций SEO.

6.1. Правила HTML-разметки для SEO

Итак, поговорим об  основных тегах, важных для  SEO, опишем специфику их  использования и  подробно остано-вимся на  правилах компоновки тегов на  страницах сайта для  улучшения его ранжирования.

<TITLE>

Тег TITLE используется для  обозначения заголовка страницы. Это самый важный тег, он больше всех увеличивает вес стра-ницы по ключевым словам. Сделать в нем ошибки достаточно сложно, но некоторые рекомендации стоит учесть.

Каждая страница обязательно должна иметь уникальный заголовок, нельзя дуб-лировать заголовки TITLE между страни-цами сайта. Используйте ключевые сло-ва, но не повторяйте ключ более трех раз. Если повтора избежать не удается, вклю-чайте не менее трех разбавляющих слов между повторяющимися ключевыми словами.

Заголовок не обязательно должен быть со-ставлен грамотно с точки зрения русско-го языка, но он должен быть продающим, привлекательным и  содержательным. При  составлении заголовков рекоменду-ем проанализировать заголовки конку-рентов в топ-10 и составить собственные по их подобию.

<H1–H6>

Текстовые заголовки H1–H6 по значимо-сти следуют сразу за заголовком страницы TITLE. В этих заголовках важно употреб-лять ключевые слова.

Тег TITLE используется для обозначения заголовка страницы. Это самый важный тег,

он больше всех увеличивает вес страницы по ключевым словам. Сделать в нем ошибки достаточно сложно, но некоторые рекомендации стоит учесть.

Page 94: Л.Гроховский - Руководство по внутренним факторам

92 Стандарты W3C

На странице должен быть только один за-головок H1, количество подзаголовков H2–H6 не лимитировано, но не стоит де-лать их слишком много: вес ключевых слов распределяется по количеству заголовков на  странице. Теги H1–H6 имеют очень большой вес, но их можно использовать только для визуального выделения тексто-вых заголовков. При этом содержимое за-головка H1 не рекомендуется дублировать между страницами сайта.

Важно понимать, что навигационная стро-ка и элементы меню не являются заголов-ками страницы и  должны обозначаться иными тегами, в частности тегом выделе-ния ссылки A.

<B> и <STRONG>

Теги B и STRONG должны использовать-ся для визуального выделения текста жир-ным написанием. Визуально акцентируя ключевые части страницы, то есть обра-щение к посетителю, поисковые системы повышают вес страницы по запросам, со-держащимся в тегах STRONG и B, но толь-ко в том случае, если их содержимое кор-релирует с текстом страницы.

Важно, чтобы в этих тегах не содержалось мусора. Обозначайте ими ключевые слова и помните, что встречающиеся в этих тегах ключи нужно также употребить на стра-нице и без тегов, чтобы поисковая систе-ма не воспринимала это как спам. Не сто-ит злоупотреблять тегами, несколько их употреблений на  странице будет вполне достаточно.

Следует отметить, что  теги B и  STRONG (также как I и EM), несмотря на сходство визуального отображения, неидентичны. B – тег физической разметки, задающий жирное начертание текста. STRONG – тег логической разметки, определяющий важ-ность помеченного текста. Такое разделе-ние тегов на логическое и физическое фор-матирование изначально предназначалось

Важно понимать, что навигационная строка и элементы меню не являются заголовками

страницы и должны обозначаться иными тегами, в частности тегом выделения ссылки A.

Page 95: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 93

для того, чтобы сделать HTML универсаль-ным, в том числе не зависящим от устрой-ства вывода информации. Теоретически, если воспользоваться, например, рече-вым браузером, то  текст, оформленный с помощью тегов B и STRONG, будет отме-чен по-разному. Получилось так, что в по-пулярных браузерах результат использова-ния этих тегов равнозначен. Но для нужд SEO рекомендуется использовать выделе-ние «логическим» тегом STRONG.

<EM>

Тегом EM принято выделять курсивное написание на  странице: цитату, назва-ние или просто термин в тексте. Этот тег тоже повышает вес страницы по  ключе-вому слову, хотя по значимости уступает предыдущим.

<P>

Тег P обозначает текстовый абзац. Важно использовать его именно для выделения абзаца, а не каждого предложения, как это реализовано во многих CMS. Для разрыва строки можно использовать тег BR. Текст на странице лучше выделять с помощью тега абзаца P, чем  заменителей вроде SPAN: последний универсален и не имеет логической нагрузки.

рекомендации по использованию важ-ных для SEO тегов:

Грамотно используйте связки <H1>–<H6> и <P>

Заголовок H1 должен включать в себя ос-новные ключевые слова, содержащиеся на странице. Заголовками H2–H6 обозна-чаем начало абзаца. В них должны содер-жаться основные ключевые слова, характе-ризующие последующий абзац P. В абзацах P, написанных до следующего заголовка, важно употребить те  же ключевые сло-ва. Ключевые слова могут повторяться и в других абзацах, но в указанной области они должны иметь максимальную концен-трацию, в этом случае возникает синергия,

Тегом EM принято выделять курсивное написание на странице: цитату, название

или просто термин в тексте. Этот тег тоже повыша‑ет вес страницы по ключевому слову, хотя по значимости уступает предыдущим.

Page 96: Л.Гроховский - Руководство по внутренним факторам

94 Стандарты W3C

значительно увеличивающая вес страни-цы по ключевым словам.

Обозначение тегами должно быть об-основано в соответствии со стандартами W3C

Все перечисленные выше теги должны нес-ти указанный логический смысл. Напри-мер, H1-H6 следует использовать толь-ко для выделения логических заголовков, для визуального форматирования сущест-вует универсальный тег SPAN.

Теги не  должны пересекаться друг с другом

Теги, имеющие логический смысл, не дол-жны пересекаться друг с другом. Заголовок не должен быть ссылкой, выделение жир-ным не  должно пересекаться с  заголов-ком. Конструкции вида <H1><A>Заго-ловок 1< / A>< / H1> недопустимы. Если здесь важнее ссылка, нужно оставить толь-ко <A>< / A> с указанием настроек визу-ального отображения через CSS. Заголовок лучше дописать рядом, но для его выделе-ния оставить только тег <H1>< / H1>.

Теги не должны ставиться бессмысленно

Многие CMS, содержащие блок визуаль-ного редактирования контента, работают с  ошибками, порождая, например, кон-струкции вида <B>&nbsp;< / B>. Такие элементы в коде страницы недопустимы, и все подобные ошибки должны быть уда-лены, чтобы не размывать вес значимых тегов.

Теги не должны использоваться для об-мана поисковых систем

Недопустимо употребление тегов STRONG, имеющих визуальное отображение, иден-тичное с  текстом страницы. Выделение подобными тегами должно действитель-но менять визуальное отображение эле-мента и  отграничивать его от  окружаю-щего текста.

Теги должны закрываться

Многие CMS, содержащие блок визуального редактирования контента, работают

с ошибками, порождая, например, конструкции вида <B>&nbsp;< / B>. Такие элементы в коде страницы недопустимы, и все подобные ошибки должны быть удалены, чтобы не размывать вес значимых тегов.

Page 97: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 95

Рекомендуется все страницы сайта прове-рять на  наличие ошибок верстки. Часто бывает так, что открывающий тег на стра-нице есть, а закрывающего нет. Подобные ошибки, как правило, визуально заметны при  заходе на  страницу, но  в  некоторых случаях посетителям они не видны, а поис-ковые системы при этом не могут коррект-но отранжировать содержимое страницы.

6.2. Проверка верстки на соответствие стандартам W3C

К счастью, вам не придется в поисках оши-бок вручную проверять HTML-код. Суще-ствует бесплатный сервис, определяющий его валидность. Сервис доступен по адре-су http://validator.w3.org / unicorn / , где для проверки валидности кода вам нужно просто ввести адрес сайта.

Должен заметить, что на 100 % валидных сайтов практически не  существует, ведь бессмысленно доводить код до  идеала. Выше мы разобрали самые важные фак-торы, которые и являются теми контроль-ными точками, которые вам нужно прове-рить через валидатор.

Не  смущайтесь, если найдете на  сайте ошибку тега <NOINDEX>: он не является валидным, поскольку по стандартам HTML его не существует. <NOINDEX> введен по-исковой системой Яндекс для того, чтобы облегчить жизнь себе и оптимизаторам.

Недопустимо употребление тегов STRONG, имеющих визуальное отображение,

идентичное с текстом страницы. Выделение подобными тегами должно действительно менять визуальное отображение элемента и отграничи‑вать его от окружающего текста.

Page 98: Л.Гроховский - Руководство по внутренним факторам

96 Стандарты W3C

Не смущайтесь, если найдете на сайте ошибку тега <NOINDEX>: он не является

валидным, поскольку по стандартам HTML его не существует. <NOINDEX> введен поисковой системой Яндекс для того, чтобы облегчить жизнь себе и оптимизаторам.

Page 99: Л.Гроховский - Руководство по внутренним факторам

яндекс.вебмастер (чему можно доверять, а чему нет)

ВЯндекс.Вебмастере можно найти коли‑чество страниц вашего сайта в индексе,

количество ссылок на ваш сайт и количество ссылающихся сайтов. Но можно ли доверять этим цифрам?Замечено, что от апдейта к апдейту показываемые веб‑масте‑ром числа могут изменяться в разы. Например, количество страниц в индексе прыгает от 50 тысяч до 10 тысяч и обратно.Такие скачки не соответствуют действительности и обращать внимание на них не нужно (если они не сопровождаются резкими изменениями трафика). Чтобы узнать реальное количество страниц вашего сайта в индексе, нужно проверить каждую из них вот таким запросом: url:site.ru / page / То же самое относится и к выгрузке всех внешних ссылок. Данные часто скачут и не отражают реальной картины, когда ссылок на сайт стоит десятки тысяч. Многие работающие ссылки могут не оказаться в выгрузке.Микроформаты

Микроформаты – это способ семантической разметки информации на веб‑страницах, использующий стандартные элементы языка HTML. Фактически мы сообщаем роботу, где и какие данные лежат в коде. В ряде случаев разметка страниц микроформатами может быть альтернативой прямой передаче данных через Яндекс.Вебмастер.Спецификации микроформатов можно найти здесь: http://microformats.org / На данный момент поисковики пока не заявляют о влиянии микроформатов на ранжирование. Однако, очевидно, что при их помощи вы можете сформировать более привлекательный сниппет. Более привлекательный сниппет –> больше CTR вашего сайта в выдаче. А CTR уже напрямую влияет на ранжирование.

ФАКт

Глава 7SEO-аналитика

Page 100: Л.Гроховский - Руководство по внутренним факторам

98 SEO‑аналитика

Эксперимент и наблюдение

Что такое наблюдение? Мы посмотрели на два сайта по запросу «пластиковые окна». У одного ТИЦ 40, он занимает первое место. У другого – 450, он на втором месте. Это наблюдение. Мы увидели некий факт.Можно ли из этого сделать вывод о том, что ТИЦ не влияет на ранжирование? Конечно же, нет. Ведь на ранжирование влияют сотни параметров и их комбинаций. И один сайт мог оказаться более релевантным за счет иных параметров.Когда оптимизатор просматривает топ, он делает много на‑блюдений. Заметив какой‑то повторяющийся факт, мы можем сформировать гипотезу (предположение).Пример гипотезы: «Частичное вхождение ключевика в URL страницы положительно влияет на релевантность».Что такое эксперимент? Это когда мы искусственно создали условия для проверки гипотезы, в которых максимально отсечены посторонние факторы.Пример эксперимента.Мы захотели проверить гипотезу «Keywords не влияет на ранжирование». Для этого зарегистрировали 10 доменов. На каждом из них разместили сайт из одной страницы с псев‑доуникальным контентом (одинаковый набор слов, объем текста и т. д.) В каждом из текстов есть уникальный ключевик, например, «сковородковед». На половине из них добавили его в meta keywords, на половине – нет. Добавили сайты в поиск, подождали пока все проиндексируются. И посмотрели выдачу по запросу «сковородковед». Если 5 сайтов с keywords оказа‑лись выше других – можно сделать вывод о подтверждении гипотезы. Если же сайты оказались перемешанными – гипоте‑за опровергнута.

Page 101: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 99

Методы управления семантическим ядром для крупных проектов

Крупные проекты обычно характеризуются большим семантическим ядром. Во мно‑

гих случаях недостаточно создать хорошее семантическое ядро, нужна его регулярная актуализация. Это связано с изменением спроса: популярность части запросов падает со временем, при этом появляется спрос, не нашедший отражения в ядре.Методология формирования обширного семантическо-го ядра:

1. Сбор запросов из всех доступных источников:a) статистика запросов к поисковым системам,b)  базы ключевых слов (база Пастухова, liveinternet

и аналогичные),c) выгрузки ключевых слов входа из систем веб‑аналитики,d)  оценка видимости конкурентов по запросам (semrush.com,

megaindex.ru и пр.).2. Уточнение региональной частотности, исключая подзапросы и морфологически измененные формы терминов, оценка сезонной популярности и ссылочного бюджета по запросам.3. Кластеризация собранных запросов.4. Формирование набора страниц приземления.5. Сопоставление запросов страницам приземления.Источники данных для актуализации ядра:

1. Динамика частотности запросов:

ФАКт

Page 102: Л.Гроховский - Руководство по внутренним факторам

100 SEO‑аналитика

a) статистика запросов к поисковым системам,b) semrush.com и аналогичные сервисы.2. Собственная аналитика (конкретика зависит от выбранных KPI), например:a) отбрасываем запросы с высоким соотношением [стоимость продвижения / полученный доход],b) автоматически проверяем частотность запросов и позиции по выгруженным из системы веб‑аналитики данным, выбирая эффективные запросы (в соответствии с выбранными KPI, например, с большим временем сессии, доходом или сущест‑венным числом просмотренных страниц).Исходя из статистики запросов к поисковым системам и данных веб‑аналитики несложно оценить трафик и доход от вывода конкретного запроса на определенную позицию в ТОПе. Таким образом, возможна эффективная приоритиза‑ция простым ранжированием запросов в порядке убывания потенциального дохода.Курица или яйцо?

Что вначале – сайт или семантическое ядро? Обычно сбор запросов выполняется после создания сайта. По сути, подбор запросов – эквивалент оценки спроса. Чем раньше собира‑ется семантическое ядро – тем меньше ненужной работы приходится выполнять. Из собранных и оцененных запросов логично формируются структура каталога и товарная номенклатура.Корректный эксперимент в seo – миф или реальность?

Многие оптимизаторы ставят эксперименты. Однако действи‑тельно достоверные выводы можно получить крайне редко. Основные причины неудач:• отсутствие четко сформулированной гипотезы,• некорректная постановка эксперимента,• некорректная обработка результатов.И если первая и последняя проблемы решаются довольно просто, то корректная постановка эксперимента требует суще‑ственных интеллектуальных и технологических затрат.Воспринимая поисковую систему как черный ящик, мы можем пытаться выявить некоторые закономерности, анализируя ответ в зависимости от варьируемых входных параметров. Проблема заключается в том, что на выдачу влияет огромное число факторов. По большому счету все, что нужно, – это провести несколько тестов, варьируя один параметр и удержи‑вая неизменными все прочие. Обилие влияющих факторов усложняет постановку чистого эксперимента, однако нужно стремиться к этому.Конечно, результаты даже корректно проведенного экспе‑римента нужно использовать осмысленно. Ранжирующая формула различна для различных типов запросов и регионов. Соответственно, найденные закономерности позволяют повлиять на ранжирование в диапазоне значений конкретного фактора. Иными словами, невозможно обеспечить хорошее

Исходя из статистики запросов к поисковым системам и данных веб‑аналитики

несложно оценить трафик и доход от вывода конкретного запроса на определенную позицию в ТОПе. Таким образом, возможна эффективная приоритизация простым ранжированием запросов в порядке убывания потенциального дохода.

Page 103: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 101

ранжирование документов по сколь‑нибудь конкурентным запросам, влияя лишь на часть факторов.Альтернативные методы генерации служебных частей документов на основе правиловых алгоритмов и стати-стики поисковых запросов

Для многих типов сайтов характерно наличие большого числа похожих документов (например, финальные страницы това‑ров в интернет‑магазинах или вакансии на сайтах о работе). Понятно, что наилучшим является title, написанный вручную хорошим копирайтером с учетом семантического ядра доку‑мента. Этот подход хорош, но трудозатратен. Более дешевый путь – формирование title, description и прочих служебных компонент документа на основе правиловых алгоритмов.Первый этап – сбор семантического ядра для однотипных документов. Не принципиально, используется ли автомат или ручной труд, главное – максимальная полнота ядра.Далее в этом корпусе необходимо выделить самые частотные термины и конструкции запросов.Собственно, третий шаг – написание правил. Если структура запросов примерно одинакова для всего их набора, достаточно универсального правила, кодирующего title и description. Если структура запросов различна в различных тематиках – по‑требуется несколько правил. Правила также нужны, если есть желание разнообразить title и description даже для сходных документов.В этой задаче, равно как и в задаче автоматизированной перелинковки, может потребоваться случайное, но не‑изменное во времени распределение. Для этого отлично подходит генератор случайных чисел, инициализируемый какой‑либо константой, специфичной для документа. Самый простой вариант – URL. URL обычно не меняются и уникальны по определению.BrowseRank – технология учета поведения пользовате-лей для ранжирования документов

Одна из технологий учета поведения пользователей при ран‑жировании документов в выдаче поисковых систем – техно‑логия BrowseRank от Microsoft (https://research.microsoft.com / en‑us / people / tyliu / fp032‑liu.pdf).Граф кликов вместо ссылочного графа

Основное отличие BrowseRank от PageRank – структура графа. В технологии PageRank узлами графа являются документы,

Для многих типов сайтов характерно наличие большого числа похожих докумен‑

тов (например, финальные страницы товаров в интернет‑магазинах или вакансии на сайтах о работе). Понятно, что наилучшим является title, написанный вручную хорошим копирайтером с учетом семантического ядра документа. Этот подход хорош, но трудозатратен. Более дешевый путь – формирование title, description и прочих служебных компонент документа на основе правиловых алгоритмов.

Page 104: Л.Гроховский - Руководство по внутренним факторам

102 SEO‑аналитика

а ребрами – ссылки. В технологии BrowseRank ребра образуют не ссылки, но клики (переходы). Помимо этого, сохраняется метаинформация о продолжительности сессии в рамках документа.очевидны два существенных преимущества BrowseRank:

• существенно лучшая устойчивость к ссылочному спаму,• учет продолжительности сессии позволяет оценить полез‑

ность документа для посетителя.Поведенческий граф более достоверно отражает процесс веб‑серфинга, а, следовательно, он более полезен для расчета значимости документов. Наибольшее число посещений стра‑ницы и более продолжительное время, проведенное на ней, означают большую важность страницы.основной источник данных о поведении пользовате-лей – браузерные бары. Все ведущие поисковые системы имеют плагины, обеспечивающие мониторинг активности значительной доли аудитории. Для обработки данных о поведении пользователей предложено использовать цепи Маркова с непрерывным временем. Экспериментальные данные демонстрируют преимущество алгоритма BrowseRank по сравнению с алгоритмами PageRank и TrustRank в определе‑нии важности документов, борьбе со спамом и ранжировании.По сути, собираемые данные можно представить записью вида URL; TIME; TYPE [input | click]. Предполагается два пути пе‑рехода на документ: по ссылке с другого документа (click), либо набором URL в адресной строке браузера (input). Механизм извлечения данных о переходах:1. Сегментация сессии.

Новая сессия инициируется в случае 30‑минутной и более паузы с момента предыдущей активности, либо в случае ввода названия сайта в адресную строку.2. Формирование пар URL.

В рамках каждой сессии создаются пары URL из соседних записей. Пара URL означает, что переход был осуществлен при помощи ссылки.3. Формирование начального распределения.

В каждой сессии, сегментированной по типу перехода, первый URL введен непосредственно пользователем. Такие URL мы счи‑таем «доверительными» и называем этот трафик «зеленым». Обрабатывая данные о поведении пользователей, мы считаем переходы на эти URL следствием случайного распределения. Нормализация на частоту посещения этих документов дает начальные вероятности посещения соответствующих страниц.4. Извлечение продолжительности сессии.

Для каждой пары URL продолжительность сессии первого URL вычисляется простой разностью дат. Если URL был последним в сессии, возможны два варианта. Для сессий, сегментирован‑ных по времени, продолжительность просмотра последнего URL рассчитывается на основании данных о просмотрах других страниц. Для сессий, сегментированных по типу, время

Основной источник данных о поведении пользователей – браузерные бары. Все

ведущие поисковые системы имеют плагины, обеспечивающие мониторинг активности значительной доли аудитории. Для обработки данных о поведении пользователей предложено использовать цепи Маркова с непрерывным временем. Экспериментальные данные демон‑стрируют преимущество алгоритма BrowseRank по сравнению с алгоритмами PageRank и TrustRank в определении важности документов, борьбе со спамом и ранжировании.

Page 105: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 103

просмотра последнего URL рассчитывается исходя из времени начала следующей сессии.Результаты применения BrowseRank

Microsoft провела два исследования. Первый был сделан на уровне сайта для выявления важных сайтов и подавления спама. Второй эксперимент – на уровне документа для тести‑рования BrowseRank с целью улучшения ранжирования.

Для первого эксперимента использовался набор данных из примерно 3 миллиардов записей, содержащий примерно 950 миллионов уникальных URL. Любопытно, что распределе‑ние количества просмотров по времени отлично описывается классической экспонентой. В рамках этого эксперимента по‑страничные данные не использовались, они были агрегирова‑ны на уровне сайтов. Полученный поведенческий граф состоял из 5,6 миллиона узлов и 53 миллионов ребер.Любопытна выборка топ‑20 сайтов, полученных ранжиро‑ванием по трем разным алгоритмам. BrowseRank отлично отранжировал MySpace, Youtube, Facebook и прочие сайты, для которых характерно большое время сессии. На случайной выборке в 10 тысяч сайтов, вручную размеченной асессора‑ми, показано, что BrowserRank эффективнее, чем TrustRank и PageRank, решает задачу фильтрации спам‑сайтов.Второй эксперимент не менее интересен.Факторы ранжирования документов можно грубо разделить на две группы: факторы релевантности и факторы важности. Предполагаем итоговую функцию релевантности линейной комбинацией этих двух групп факторов:Θ * rankrelevance + (1‑Θ) * rankimportance,где Θ лежит в интервале [0;1].

Любопытна выборка топ‑20 сайтов, полученных ранжированием по трем

разным алгоритмам. BrowseRank отлично отранжировал MySpace, Youtube, Facebook и прочие сайты, для которых характерно большое время сессии. На случайной выборке в 10 тысяч сайтов, вручную размеченной асессорами, показано, что BrowserRank эффективнее, чем TrustRank и PageRank, решает задачу фильтрации спам‑сайтов.

Page 106: Л.Гроховский - Руководство по внутренним факторам

104 SEO‑аналитика

Данные взяты на выборке из сайтов, полученных для 8 000 запросов. Каждая пара запрос‑документ оцени‑валась тремя асессорами по бинарной шкале [релевантно; нерелевантно]. Релевантными сочтены документы, полу‑чившие по запросу не менее 2 оценок «релевантно».

Результат: алгоритм BrowseRank обеспечивает существенно лучшее качество вплоть до полного подавления факторов важности факторами релевантности (Θ ~ 0,9).

текстовый спам глазами поиска и современные метрики качества текстов

Точного определения поискового спама нет, есть лишь общая формулировка.

Поисковый спам – это попытки обмана поисковой системы и манипулирования ее результатами с целью завышения позиции сайтов (страниц) в результатах поиска. Сайты, использующие поисковый спам, могут быть понижены при ранжировании или исключены из поиска Яндекса из‑за невозможности их корректного ранжирования.

http://company.yandex.ru / legal / termsofuse

Понятно, что точные критерии спама поисковые системы не озвучивают, поскольку это неминуемо спровоцирует генерацию околоспамовых текстов оптимизаторов и веб‑мастерами. Между тем в арсенале поисковых систем большое количество разнообразных методов определения спама. Рассмотрим некоторые из них.

Общеизвестно, что включение термина в title улучшает ранжирование документа по этому запросу поисковы‑ми системами. Это обуславливает традиционный спам в title, поскольку оптимизаторы пытаются употребить максимальное число терминов в заголовке документа. Исследователи из Microsoft обнаружили (http://research.microsoft.com / pubs / 65140 / www2006.pdf ), что вероятность спамовости документа резко возрастает при длине title более 25 слов:

Распределение по средней длине слова также неплохо выявляет спам. Тексты, содержащие много коротких или длинных слов, неестественны и, вероятно, спамны:

Поисковый спам – это попытки обмана поисковой системы и манипулирования ее

результатами с целью завышения позиции сайтов (страниц) в результатах поиска. Сайты, использую‑щие поисковый спам, могут быть понижены при ранжировании или исключены из поиска Яндекса из‑за невозможности их корректного ранжирования.

Page 107: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 105

Весьма оригинальный и дешевый метод обнаружения спама – оценка сжимаемости текста. Для спамовых документов, содержащих множество повторений терминов, характерна высокая сжимаемость:

Интересна техника определения спамовости по доле самых частых терминов корпуса в тексте. Видно, что в спамовых текстах доля частых слов ниже, а доля редких слов – выше, чем в естественных текстах:

Примечательна публикация разработчиков Яндекса (http://download.yandex.ru / company / A_Kustarev_A_Raigorodsky_poisk_neestestvennih_textov_statia.pdf),

Общеизвестно, что включение термина в title улучшает ранжирование документа

по этому запросу поисковыми системами. Это обуславливает традиционный спам в title, поскольку оптимизаторы пытаются употребить максимальное число терминов в заголовке документа.

Page 108: Л.Гроховский - Руководство по внутренним факторам

106 SEO‑аналитика

в которой оценивалась частота встречаемости пар терминов в естественных и синонимизированных текстах. Показательно, что спамовые документы содержат большее количество редких пар и меньшее количество частых пар, чем естествен‑ные документы.Существует множество методов выявления текстового спама. Главная идея очевидна – использование традиционных оп‑тимизаторских метрик («плотность ключевого слова», «длина текста» и пр.) давно потеряло актуальность.В современных условиях намного продуктивнее писать хорошие тексты, разносторонне описывающие продукт. Важны стилистика и потребительская ценность текста. Соответствен‑но, самая честная метрика качества текста – отношение пользователей (продолжительность сессии, степень конверсии и пр.). Действительно, если качество навигации или юзаби‑лити сайта принято оценивать по поведению пользователей, почему качество текстов нужно оценивать иначе?

РеЗюМе: Бессмысленно делать нечто исключительно для поисковых систем, как ни банально звучит этот тезис. У поисковых систем достаточно ресурсов для подавления спамерских активностей.

В современных условиях намного продук‑тивнее писать хорошие тексты, разносто‑

ронне описывающие продукт. Важны стилистика и потребительская ценность текста. Соответствен‑но, самая честная метрика качества текста – отно‑шение пользователей (продолжительность сессии, степень конверсии и пр.).

Page 109: Л.Гроховский - Руководство по внутренним факторам

Глава 8Исследование «SEO-альманах 2010»

в конце 2010  года было проведено масштабное исследование факто-ров ранжирования, целью кото-

рого стала оценка значимости этих фак-торов. Подобные исследования наши зарубежные коллеги проводят с периодич-ностью раз в два года, публикуя результаты на seomoz.com. В российском проекте при-няли участие признанные эксперты рын-ка, руководители топовых компаний, спе-циалисты, успешно продвигающие сайты в самых конкурентных тематиках, разра-ботчики программ и сервисов, которыми пользуется весь рынок.

В экспертный совет вошли:

1. Анар Бабаев (Click.ru)2. Александр Баженов (Biplane)3. Василий Ткачев (All in Top)4. Леонид Гроховский (ArrowMedia)5. Николай Хиврин (ALTWeb Group)6. Елизавета Трибунская (Web Advance)7. Сергей Кошкин (SmartSEO)8. Евгений Смирнов (Viaset.ru)9. Роман Клевцов (Optimism.ru)10. Сергей Карпович (Apexes)11. Дмитрий Жохов (UnMedia)12. Алексей Довжиков (eLama)13. Тимофей Квачев (TRINET)14. Валентин Домбровский (NextUpMedia)15. Константин Леонович (Sape.ru)16. Алексей Жуков (Новотех)17. Антон Агапов (WebExpert)

Page 110: Л.Гроховский - Руководство по внутренним факторам

108 Исследование «SEO‑альманах 2010»

18. Иван Севостьянов (ВебПроекты)19. Олег Сковородников (VIPRO)20. Виктор Нагайцев (PerfectSeo)21. Денис Юрасов (Медведев Маркетинг)22. Михаил Райцин (Корпорации РБС)23. Василий Сорокин (Techart)24. Александр Люстик (MyOnlineStudio)25. Станислав Поломарь (web-it.ru)26. Алексей Елфимов (i-Media)

Исследование «SEO-альманах 2010» про-водилось с  помощью голосования. Все факторы были распределены по группам, и каждый из них оценивался по критерию влияния на ранжирование. Конечная оцен-ка определялась на основании голосов экс-пертов. Рассматривалось более 200 факто-ров ранжирования: внутренние, внешние, поведенческие, наиболее распространен-ные их связки, а также факторы, связанные с ранжированием картинок и определени-ем аффилиатов.

Методология исследования выстраива-лась на  анкетировании. Каждый из  экс-пертов оценивал факторы по  степени их значимости:

0 – не влияет вообще,

1 – влияет незначительно,

2 – стоит учитывать,

3 – сильно влияет,

4 – важнейший фактор.

Оценки каждого фактора суммировались, после чего было подсчитано процентное соотношение значимости каждого факто-ра от значимости того, который имеет са-мый высокий рейтинг в группе. Факторы объединялись в группы по признаку воз-действия: внешние факторы, внутренние, поведенческие, аффилированность, про-движение по картинкам.

Все факторы были отсортированы по сте-пени важности и отображены в процент-ных долях. Отрицательные получили от-рицательное значение.

Исследование «SEO‑альманах 2010» проводилось с помощью голосования. Все

факторы были распределены по группам, и каждый из них оценивался по критерию влияния на ранжирование. Конечная оценка определялась на основании голосов экспертов. Рассматривалось более 200 факторов ранжирования: внутренние, внешние, поведенческие, наиболее распростра‑ненные их связки, а также факторы, связанные с ранжированием картинок и определением аффилиатов.

Page 111: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 109

Итоги исследования стоит воспринимать следующим образом:

0–20 % означают, что фактор не влия-ет на продвижение,

20–40 %  – влияние фактора незначи-тельно,

40–60 %  – фактор важно учитывать при продвижении,

60–80 % – фактор значительно влияет на продвижение,

80–100 %  – фактор нужно учитывать обязательно.

Результаты исследования с  комментари-ями экспертов были опубликованы по ад-ресу http://топэксперт.рф и сразу получи-ли широкий резонанс: за  первую неделю после анонсирования только на  офици-альном сайте исследования побывало 10  тысяч человек. В  Интернете зафикси-ровано более 100 публикаций, в том чис-ле в  крупнейших отраслевых СМИ, та-ких как  seonews.ru, searchengines.ru, webmasters.ru, advertology.ru и других, так-же написаны статьи в нескольких отрасле-вых журналах, результаты исследования освещались на конференциях и семинарах.

Влияние HTML-тегов на вес ключевого слова для страницы

TITLE 100%

H1-H6 71%

STRONG 34%

Description 31%

B 27%

EM 25%

P 24%

Keywords 24%

UL –> LI & OL –> LI 13%

Page 112: Л.Гроховский - Руководство по внутренним факторам

110 Исследование «SEO‑альманах 2010»

Влияние HTML-тегов на вес ключевого слова для страницы

Ключевое слово в H1-H6 & ключевое слово в P 54%

Ключевое слово в STRONG, B, EM & ключевое слово на странице 34%

Ключевое слово в KEYWORDS и ключевое слово на странице 27%

Последовательное употребление заголовков 24%

Пересечение тегов STRONG, B, EM & A href=… –8%

Пересечение тегов H1-H6 A href=… –9%

Повтор заголовков H1, H1, H1 –15%

Пересечение тегов H1-H6 & STRONG, B, EM –25%

Содержание заголовков H1-H6, TITLE

Прямое вхождение ключевого слова в заголовке 84%

Уникальность заголовка в отношении ко всем страницам сайта 48%

Близость заголовка (H1-H6) к началу документа 47%

Близость ключевого слова к началу заголовка 43%

Длина заголовка 36%

Грамматически правильное содержание заголовка 35%

Уникальность заголовка в отношении ко всем сайтам в индексе 33%

Разбавление заголовка неключевыми словами 18%

Page 113: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 111

Содержание элементов абзаца STRONG, EM, B

Прямое вхождение ключевого слова 37%

Разбавление элемента неключевыми словами 19%

Ранжирование по ключевым словам

Наличие прямого вхождения ключевого слова в тексте страницы 94%

Словоформа ключевого слова с сохранением части речи 66%

Наличие как прямого вхождения ключа, так и его словоформы 65%

Словоформа ключевого слова с изменением части речи 40%

Соответствие регистра ключевого слова 28%

Удаление частей составного словосочетания друг от друга –77%

Текст страницы

% уникального контента по отношению ко всему индексу 82%

% уникального контента по отношению ко всему сайту 76%

Разнообразное оформление текста 47%

Близость ключевых слов к началу страницы 45%

Соответствие объема текста на странице сайтам конкурентов 40%

Выделение абзаца текста в тег <P> 30%

Наличие контента на иностранном языке 5%

Высокая плотность ключевых слов на странице –5%

Концентрация повторений ключевого слова в одной точке –22%

Визуальное уравнивание разметки текста с обычным текстом –35%

Ошибки кодировки –52%

Видимость контента (речь о таких эффектах, как display:none) –57%

Page 114: Л.Гроховский - Руководство по внутренним факторам

112 Исследование «SEO‑альманах 2010»

Сервер

301 редирект при постоянном изменении адреса страницы 67%

Отсутствие на сайте значительного количества 404 ошибок 64%

Использование 404 кода ответа для 404 страниц 63%

Высокий аптайм сервера 63%

Высокая скорость загрузки документа 57%

Время отклика 53%

1-шаговая конструкция редиректорв 40%

302 редиректа при временном изменении адреса страницы 30%

Географическая зона сервера 27%

URL

Наличие ключевого слова в имени домена 83%

Наличие ключевого слова на транслите в адресе страницы 71%

Наличие ключевого слова в названии категории 61%

Наличие ключевого слова в названии документа 59%

Наличие ключевого слова на английском в адресе страницы 49%

ЧПУ 48%

Наличие словоформы ключевого слова в адресе страницы 45%

Наличие части ключевого слова в адресе страницы 37%

Большая глубина вложенности категории с документом –7%

Page 115: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 113

Возрастные факторы

Возраст индексации 83%

Динамика появления уникального контента на сайте 59%

Возраст домена 55%

Возраст URL-страницы 55%

Динамика появления контента на сайте 51%

Возраст контента на странице 46%

Влияние картинок на ранжирование

Ключевое слово в ALT картинки 47%

Ключевое слово в названии картинки 43%

Ключевое слово в TITLE картинки 36%

Географическое расположение

Указание регионов в Яндекс.Каталоге 95%

Наличие адресов и телефонов региональных филиалов на сайте 87%

Географическая близость офиса к продвигаемому региону 77%

Упоминание региональных центров в тексте страниц 64%

Перелинковка

Ограничение количества исходящих и внутренних ссылок 66%

Закрывать от индексации исходящие внешние ссылки 53%

Использование сквозных ссылок для внутренней перелинковки 18%

Страница ссылается на другую несколько раз –2%

Страница ссылается на себя –6 %

Page 116: Л.Гроховский - Руководство по внутренним факторам

114 Исследование «SEO‑альманах 2010»

CMS

Использование бесплатных общедоступных CMS –25%

Использование стандартных шаблонов –38%

Карта сайта

Наличие карты сайта 58%

Актуальность карты сайта 54%

Наличие страницы в карте сайта 48%

Указание приоритета индексации страниц в карте сайта 40%

Взаимодействие с Яндексом

Наличие сайта в Яндекс.Вебмастер 23%

Факт выгрузки обратных ссылок –12%

Факт ранее наложенных санкций –54%

Page 117: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 115

Сергей Панков, технический директор, Rookee

Преамбула

Прежде всего, стоит отметить то титани‑ческое трудолюбие и скрупулезность,

которые помогли автору в проведении исследования о факторах ранжирования. Совершенно искренне выражаем благодарность автору, его бесконечно‑му профессионализму и желанию сделать рынок 2.0 более цивилизованным. Надеемся, что Леонид и дальше будет радовать сообщество качественными и своевременными исследованиями.Предостережение

Материалы исследования послужат хорошей теоретической базой для новичков и seo‑энтузиастов, желающих повысить качество своего сайта и добиться новых высот в поисковой выдаче.Представленное исследование – это не кнопка «в топ» и даже не рецепт долголетия и счастья. Это скорее набор критериев, по которым можно определить качество отдельно взятой стра‑ницы веб‑сайта, оценить ее привлекательность с точки зрения поискового робота, который ищет наиболее релевантный ответ на вопрос пользователя.Что мы об этом думаем

Исследование еще раз подтвердило высокую точность той ин‑формации, что была получена в результате наших внутренних экспериментов. Знания об этих факторах заложены в основу алгоритмов наших сервисов:• технический аудит,• текстовой анализ страницы,• анализ конкурентов топ‑10.Однако стоит отметить, что в среде seo‑профессионалов сильны различные мифы. Одна неосторожная статья от Дэна Расковалова о его путешествии на Бали может породить с десяток предположений и теорий, которые будут дотошно анализироваться гуру всех мастей.Например, значимость следующих факторов мы ставим под сомнение:1. Прямое вхождение ключевого слова куда бы то ни было.2. Разнообразное оформление текста.3. Соответствие объема текста на странице сайтам конкурентов.4. Закрытие от индексации исходящих внешних ссылок.5. Факторы, связанные с CMS.Ценность блока критериев под названием «текст ссылки» ставится под большое сомнение. Все мы читали знаменитый мадридский доклад Яндекса за 2009 год. После него практиче‑ски бессмысленно рассуждать на тему, что лучше – «вечная»

МненИе Представленное исследование – это не кнопка «в топ» и даже не рецепт

долголетия и счастья. Это скорее набор критериев, по которым можно определить качество отдельно взятой страницы веб‑сайта, оценить ее привлека‑тельность с точки зрения поискового робота, который ищет наиболее релевантный ответ на вопрос пользователя.

Page 118: Л.Гроховский - Руководство по внутренним факторам

116 Исследование «SEO‑альманах 2010»

ссылка или «биржевая», «прямое вхождение или со словофор‑мами» и т. д.Следует отметить, что за пределами исследования остались вопросы, ответы на которые хотелось бы получить в будущем:1. Верстка.2. Поведенческие факторы.3. Соответствие тематики донора и акцептора.4. «Трафиконосность» ссылок с доноров.Конечно, наши возражения не умаляют всех достоинств проделанной работы. На то и нужны исследования, чтобы привлечь внимание к каким‑то важным вопросам и заставить нас самостоятельно искать ответы на поставленные вопросы.выводы

Безусловно, Интернет меняется. И то, что было актуально вчера, сегодня уже не работает. Остается пожелать одно: анализируйте и делайте выводы, остальное – дело техники.

Безусловно, Интернет меняется. И то, что было актуально вчера, сегодня уже

не работает. Остается пожелать одно: анализируйте и делайте выводы, остальное – дело техники.

Page 119: Л.Гроховский - Руководство по внутренним факторам

Полный курс SEO от «топЭксперт.РФ» (130 часов)

Хочу представить вам самый полный учебный курс по SEO. После прохо-ждения этого курса вы сможете само-стоятельно заниматься продвижением сайтов. Продолжительность курса – 130 часов, это 62 часа занятий в ауди-тории +40 часов практики в течение месяца +20 часов консультаций на веби-нарах. Программа корректируется и до-рабатывается совместно с признанными экспертами в области поискового про-движения. По окончании курса прово-дится сертификация, результаты которой передаются HR-специалистам ведущих SEO-компаний.

авторы и преподаватели курса:

Леонид Гроховский, директор по тех-нологии продвижения и автоматизации, «Оптимизм.ру»,

Станислав Поломарь, руководитель на-правления продвижения сайтов, Web-IT,

Алексей Чекушин, руководитель депар-тамента SEO, Wikimart.ru,

Михаил Сливинский, ведущий анали-тик, Wikimart.ru,

Станислав Ставский, ex. аналитик веб-поиска Яндекса.

Для кого этот курс:

Для начинающих SEO-специалистов, которые хотят получить прочные базо-вые знания.

Для продвинутых SEO-специалистов, которые хотят разобраться в информаци-онном поиске.

Для студентов, которые хотят полу-чить высокооплачиваемую и интересную работу.

Для оптимизаторов, которые за не-сколько лет все забыли и хотят обновить актуальность своих знаний.

Для интернет-маркетологов, которые хотят очень глубоко погрузиться в SEO.

Дни проведения:

Блок 1. Информационный поиск

• 21 января 11.00–20.00

• 22 октября 11.00–20.00

Блок 2. Поисковое продвижение

• 28 января 11.00–20.00

• 29 января 11.00–20.00

• 4 февраля 11.00–20.00

• 5 февраля 11.00–20.00

Блок 3. Аналитика

• 11 февраля 11.00–20.00

• 12 февраля 11.00–15.00

Экзамен: 19 февраля 11.00–20.00

Формат обучения:

• Очное обучение – проходит в Москве в учебной аудитории

• Заочное обучение – посредством веби-нар-трансляции на площадке COMDI

Семинары и курсы

Page 120: Л.Гроховский - Руководство по внутренним факторам

118 Семинары и курсы

• Всем слушателям на время обучения и в течение 2 месяцев после экзаменов предоставляется доступ к записям за-нятий на COMDI.ru

Уникальность курса:

Программа составлена людьми, имею-щими большой опыт руководства и об-учения сотрудников в SEO-компаниях, а значит, и вас учить будут тому, что дей-ствительно применимо и необходимо.

Программа является коллективным трудом, а не частным мнением, а значит, нам удастся избежать субъективности.

По итогам курса проводится сертифи-кация, резюме успешных студентов пере-даются в HR-службы многих SEO-компа-ний, что гарантирует их трудоустройство.

Это самый полный, профессиональный и практичный курс по SEO.

И самое главное – в течение всего кур-са вы будете получать задания в форма-те реальной стажировки, а саппорт будет помогать вам в трудных ситуациях.

Предварительная программа аудиторных лекций учебного курса SEOБлок 1. Информационный поиск

HTTP-протокол

• (GET)

• Понятие о протоколе

• Структура протокола

• Коды состояния

• IP, Прокси

• Заголовки

• Основные механизмы протокола

• DNS, работа хостинга

• Языки и кодировки

Как устроены поисковые системы

• Поисковый робот-индексатор

Скорость индексации

Краулинговый бюджет

Частота индексации

• Типы ботов (быстробот, блоги и т. п.) из описания веб-мастера Яндекса

• Инвертированный индекс

• Ранжирование

• Результаты поиска (SERP)

• Кластеризация

Идеология поисковых систем

• Качество поиска

Релевантность

Свежесть

Полнота индекса

Разнообразие результатов поиска

Антиспам (в т. ч. про цепи Маркова и дорвеи)

Сниппеты

Производительность

Вертикальный поиск

• Важнейшие ценности

• Способы монетизации

• Взаимодействие с пользователями

• Конкуренция

• Ответственность

• Нарушения и санкции

введение в информационный поиск

• Булев поиск

• Лексикон и списки словопозиций

• Словари и нечеткий поиск

• Построение индекса

• Ранжирование, взвешивание терминов и модель векторного пространства

• Ранжирование в полнофункциональ-ной поисковой системе

Page 121: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 119

Вертикальный поиск

• Оценка качества поиска

• Расширение запроса, переформулировки

• Машинное обучение

• Языковые модели для информационно-го поиска

Стемминг

Морфология

Лемматизация

• Кластеризация

Поисковые технологии

• IDF TF

• BM 25

• PageRank

• HITS

• ClickRank

• BrowseRank

• SpamRank

обработка информации

• Алгоритм шинглов

• Разбиение текста на пассажи

типы запросов с точки зрения поиско-вых систем

• Типы классификации

• По бродеру

• Количество

• Коммерческие и некоммерческие

Блок 2. Поисковое продвижение

теория

• SEO-факторы

Текстовые

– Плотность ключевых слов

– Зоны документа (TITLE, H1 и т. д.)

– Фильтрации и антиспам

• Ссылки

Внутренние ссылки

Внешние ссылки

Ссылочное ранжирование

– Статическое (PR, ТИЦ)

– Динамическое (анкорное)

• Host-факторы

Возраст

Key в URL, в домене

Видимость

• Поведенческие факторы

Поведение в серпе

Поведение на сайте

– Время просмотра

– Количество страниц

– Источники трафика

– Переходы по ссылкам

• Социальные факторы

• Региональность

Практика

внутренние факторы

• Перелинковка

Базовые схемы перелинковки

– Комплексное продвижение всего сайта

– Продвижение главной страницы под ВЧ

– Продвижение разделов под СЧ

– Продвижение внутренних страниц под НЧ

Локальные схемы перелинковки

– Кольцо

– Куб

– Звезда

Правила перелинковки

Page 122: Л.Гроховский - Руководство по внутренним факторам

120 Семинары и курсы

Способы перелинковки

Составление текста ссылки для перелинковки

Создание модулей для автомати-зации перелинковки (начальный уровень)

– Портал

– Интернет-магазин

– Корпоративный сайт

– Каталог

• Устранение дубликатов

Чем вредны дубликаты

Классификация дубликатов

Устранение дубликатов на примерах

Способы устранения дубликатов

• Инструкции для поисковых систем

Зачем нужен robots.txt?

Robots.txt – универсальные директивы

Robots.txt – директивы для Яндекса

Правила составления robots.txt

Разбор robots.txt на примерах

Зачем нужен sitemap.xml

Директивы sitemap.xml

Правила составления sitemap.xml

Пример sitemap.xml

Принцип взаимодействия sitemap.xml и robots.txt

Автоматизация добавления страниц в sitemap.xml

Зеркала сайтов, переклейка

Данные Яндекс.Вебмастер

Данные Google.Вебмастер

• Уникальность контента

Как защитить контент от воровства?

Как воровать контент?

Отсутствие и недостаток контента

Автоматизация генерации контента

– Автоматизация генерации описа-ний товаров

– Автоматизация генерации техниче-ских характеристик (уровень 1)

– Автоматизация генерации техниче-ских характеристик (уровень 2)

– Автоматизация наполнения Description, Keywords, TITLE

– Обнаружение дубликатов

– Инструкция по обнаружению дуб-ликатов вручную

– Способы автоматизации обнаруже-ния дубликатов

• Коды ответов сервера

Код ответа 20*

Коды ответов 301 / 302 / 303 / 307 / 3**

Код ответа 40*

Код ответа 50*

• Стандарты W3C

Правила HTML-разметки для SEO

Проверка верстки на соответствие стандартам W3C

• Подготовка ТЗ на доработку сайта

• Типичные ошибки, допускаемые при работе с внутренними факторами

• Типичные ошибки разработки сайтов

• Типичные ошибки юзабилити

• Типичные ошибки копирайтеров

Подробно про внешние факторы

• Все источники привлечения внешних ссылок, оценка эффективности и эко-номическая целесообразность. Сравни-тельная таблица

Обычные покупные ссылки

Ссылки в виде контекстных объявлений

Page 123: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 121

Статьи

Пресс-релизы и посты в блогах

Социальные сети

Форумы

Естественные ссылки

• Возможности автоматизации

• Продвижение молодых сайтов и сай-ты с историей: отличия в работе со ссылками

• Продвижение крупных сайтов: особен-ности в работе со ссылками

• Если по ссылке кликают – она работает лучше. Миф или реальность?

• Критерии выбора ссылок: на что на са-мом деле стоит обращать внимание

Оценка эффективности ссылок через Яндекс.Метрика

По каким критериям отбирать площадки

ТИЦ, тематичность, количество вне-шних – что в действительности важ-но сейчас

• Альтернативные источники внешних ссылок

Веб-PR

– Бриф для клиента

– Подбор площадок для публикации

– Пресс-релизы, статьи, интервью, отзывы

– Заказ статей

– Примеры успешных PR-стратегий для SEO

SMM

– Возможности получения ссылок из социальных сетей

– Критерии оценки качества блогов

– Ссылки из Twitter и Facebook для SEO

– Примеры успешного применения

SMO

– Возможности SMO

– Создание ценности для посетителей

– Рейтинг

– Акции

– Закрытый клуб

– Предложение о репосте

– Примеры успешного применения

Инструментарий

– Аналитика – «СайтРепорт.РФ»

– Подбор запросов – KeyCollector

– Биржа ссылок – Sape.ru

– Биржа ссылок – PR.sape.ru

– Биржа ссылок – Blogun.ru

– Биржа ссылок – GoGetLinks.net

– Биржа ссылок – MiraLinks.ru

– Агрегатор – Rookee

– Агрегатор – MegaIndex

– Плагин для браузера – NetPromoterBar

– Анализ ссылок – Solomono.ru

– Анализ ссылок – DriveLink

Составление ссылочной стратегии

– Обычные ссылки

– PR-ссылки

– Ссылки без анкоров

– Мертвые ссылки

– Ссылки с социальных сетей

Размещение ссылок

Проверка ссылок

Подробно о поведенческих факторах

• Теория: развитие поведенческих метрик

• 3 группы поведенческих факторов

Page 124: Л.Гроховский - Руководство по внутренним факторам

122 Семинары и курсы

переходы по ссылкам

результаты поиска

поведение на сайте

• Где покупать естественные ссылки

• Связки поведенческих факторов: как это работает

• Исследование пользователей: какими данными располагает Яндекс

• 3 способа накрутки поведенческих факторов

имитация живых пользователей: со-здание «живых» ботов

ботнет

биржа

• Мифы и заблуждения о поведенческих факторах

• Отличия ПФ для разных тематик

• Возможности Яндекс.Метрики: демон-страция функционала

Составление семантического ядра

• Запрос выгрузки структуры сайта

• Подбор запросов

• Проверка запросов

• Группировка запросов

• Формирование новой структуры сайта

аудит

• Изучение сайта

• Классификация типов страниц

• Классификация разделов сайта

• Изучение <HTML> шаблонов по типам страниц

• ТЗ по <HTML> доработке страниц

• Изучение данных Яндекс.Вебмастер

• Изучение данных Google.Вебмастер

• Изучение данных Яндекс.Метрика

• Сравнение индексов

• Изучение перелинковки

• Изучение серверных настроек

• Изучение контента

• Поиск дубликатов

• Поиск внешних ссылок

• Анализ и сравнение индексации в по-исковых системах

• Анализ внутреннего анкор-листа

• Лингвистический анализ сайта

• Поиск и анализ исходящих внешних ссылок

• Анализ распределения весов по страницам

• Анализ страниц с 404 ошибками

• Анализ редиректов

• Создание sitemap.xml

• Анализ sitemap.xml, robots.txt

• Оценка размера страниц и скорости их загрузки

• Анализ уровней вложенности

• Поиск полных дублей

• Поиск неполных дублей

• Анализ заполненности страниц

• Поиск пустых страниц и страниц-простыней

• Анализ TITLE, Keywords, Description на наличие дубликатов, пустоты, переспама

• Анализ уязвимостей сайта

• Анализ конкурентов

• Проверка сайта на наложение фильтров

• Анализ внешних ссылок

• Поиск дубликатов контента на других сайтах

• Лексикологический анализ сайта

Page 125: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 123

типичные ошибки оптимизатора

• Типичные ошибки, допускаемые при работе с внешними факторами

• Типичные ошибки PR

• Типичные ошибки SMM

• Типичные ошибки разработки

Накрутка

• Накрутка внешних факторов

• Накрутка внутренних факторов

• Накрутка поведенческих факторов

Копирайтинг

• Взаимодействие с копирайтерами

• Как правильно составить ТЗ по копирайтингу

• Определяем уникальность текста

• Бриф для клиента

• Входные страницы

• Что лучше продает: содержание, заго-ловки, оформление или иллюстрации?

• Нестандартные способы получения контента

Блок 3. Аналитика

введение в SEO-аналитику

• Кто такой SEO-аналитик

• Примеры работы SEO-аналитика

• Аналитика

Эмпирический анализ

Статистический анализ

Теория вероятности

Нестандартное мышление

Логические задачи

Собеседование на SEO-аналитика

• Мозговой штурм

• Автоматизация

Сбор позиций

Проверка индексации

Проверка текстов

Перелинковка

Покупка ссылок

• Как писать ТЗ

Правила написание ТЗ

Таблицы

Модули

Интерфейс

Примеры ТЗ

• Область применения знаний и навыков SEO-аналитика

• Источники получения информации, список литературы

• Сервисы поисковых систем

Яндекс.Вебмастер

Google.Вебмастер

• Веб-аналитика

Задачи веб-аналитики

Возможности веб-аналитики

Виды инструментов веб-аналитики

– Внутренние системы

– Внешние системы

Погрешность веб-аналитики

Курс обучения работы с Яндекс.Метрика

– Задачи и цели

– Установка счетчика

– Описание функционала

– Настройка целей

– Статистика по трафику

– Источники трафика

– Поисковые фразы

– Поисковые системы

– Внешние ссылки

Page 126: Л.Гроховский - Руководство по внутренним факторам

124 Семинары и курсы

– Содержание сайта

– Профиль пользователя

– Конструктор отчетов

– Поведенческие метрики

– Карта кликов

– Карта путей

– Тепловые карты

– Применение Яндекс.Метрики для SEO-специалиста

– Замеры, эксперименты

Юзабилити

– Основы юзабилити

– Юзабилити-аудит

– Взаимодействие с профессиональ-ным юзабилистом

Хронология развития поисковых си-стем от каталогов до нашего времени

• Google

• Rambler

• Yandex

• Nigma

Проводимые исследования

• Исследования Яндекса

• Исследования Google

• Исследования зарубежных компаний

• Исследования российских компаний

• Исследования частных специалистов

• Исследования «ТопЭксперт.РФ»

Условия участия:

• Стоимость участия: 25 000 руб. при оплате до 15 декабря.

• Стоимость участия: 30 000 руб. при оплате до 1 января.

• Стоимость участия: 35 000 руб. при оплате до 15 января.

• Стоимость участия: 40 000 руб. при оплате на семинаре.

• При оплате по безналу стоимость воз-растает на 20 %.

VIP- участие:

• Во время курса вы сидите на первом ряду.

• По окончании вы получаете видеозапись.

• Вы получаете подробные комментарии по выполненным домашним заданиям.

• На практических занятиях мы разби-раем материал на примере вашего сай-та, в частности SEO-аудит и семантиче-ское ядро.

• В течение курса у вас будет право на 4 индивидуальные консультации.

• Стоимость: + 30 % от стоимости курса на момент оплаты.

Page 127: Л.Гроховский - Руководство по внутренним факторам

DVD-семинар – #1 «Продвижение порталов и крупных интернет-магазинов» – 8 часов (Уровень подготовки: профессионал)

Для кого этот DVD?

• Для оптимизаторов, продвигающих са-мые крупные и сложные проекты рунета

• Для директоров по маркетингу, плани-рующих создавать внутренний отдел SEO

• Для руководителей крупнейших порта-лов и интернет-магазинов

Семинар вели:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

• Олег Пролубщиков, технический директор, «РДВ-Медиа» (Rabota.ru; Ucheba.ru; VashDosug.ru)

• Алексей Чекушин, аналитик, Wikimart.ru

• Роман Прохоров, руководитель службы продвижения, Wikimart.ru

Среди участников семинара были пред-ставители компаний:

• mail.ru

• pulscen.ru

• raise.ru

• turinfo.ru

• championat.ru

• books.ru

• labirint.ru

• absent.ru

• terminal.ru

• fastlaneventures.ru

• etorg.ru

• wildberries.ru

• kika.ru

• proskater.ru

• molotok.ru

Подробнее о семинаре:

• Докладчики семинара на передаче «ТопЭксперт»

• Краткая программа семинара

• Обсуждение семинара

• Репортаж с семинара от searchengines.ru

• Интервью для seonews.ru

– Олег Пролубщиков, технический ди-ректор «РДВ-Медиа»

– Алексей Чекушин, аналитик, Wikimart

DVD-cеминары и курсы

Page 128: Л.Гроховский - Руководство по внутренним факторам

126 DVD‑семинары и курсы

– Роман Прохоров, руководитель службы продвижения, Wikimart

Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике.

Отзыв от Александра Рыжова, wildberries.ru

+ Бонус:

• Индивидуальная консультация

Покупка:

•СтоимостьDVD-бокса30 000 рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

• Тираж ограничен, всего 20 коробок.

• В целях профилактики пиратства и со-хранения эксклюзивности информа-ции, DVD продаю только реальным людям, представляющим реальные компании. В сомнительных случаях за-прашиваются рекомендации. Если вы не связаны ни с одним крупным проек-том – вы не сможете приобрести этот семинар. Оставляю за собой право от-казать любому в возможности покупки без объяснения причины.

•По вопросампокупкиобращатьсяна [email protected] .ru

DVD – семинар #2 «Продвижение сайтов: работа с внешними факторами» – 4 часа (Уровень подготовки: специалист)

Для кого этот DVD?

• Для оптимизатора, который хочет эф-фективно продвигать сайты

• Для интернет-маркетолога

• Для куководитель проекта, коммуни-цирующего с оптимизатором

вам нужен этот видеокурс, если

• Ссылочная масса растет, а позиции сайта не меняются

• Вы не понимаете, как можно покупать естественные ссылки

• Агрегаторы не всегда работают эффективно

• Вы хотите сократить ссылочный бюд-жет в несколько раз, сняв неэффектив-ные ссылки

• Вам хочется получить трафик с пресс-релизов, блогов и статей

автор и ведущий:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Программа семинара:

• Все источники привлечения вне-шних ссылок, оценка эффективности

Page 129: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 127

и экономическая целесообразность. Сравнение между собой

Обычные покупные ссылки

Ссылки в виде контекстных объявлений

Статьи

Пресс-релизы и посты в блогах

Социальные сети

Форумы

Естественные ссылки

• Возможности автоматизации по каж-дому источнику

• Агрегаторы, взгляд со стороны, оценка эффективности использования

WebEffector

SeoPult

Rookee

Megaindex

• Продвижение молодых сайтов и сай-ты с историей: отличия в работе со ссылками

• Если по ссылке кликают – она работает лучше. Миф или реальность?

Исследования Блогуна

Исследования других бирж

• Критерии выбора ссылок: на что на са-мом деле стоит обращать внимание

• Оценка эффективности ссылок через Яндекс.Метрика и Google.Analytics

• По каким критериям отбирать площадки

Выбор площадок вчера и сегодня, что изменилось

ТИЦ, тематичность, количество вне-шних – что в действительности важ-но сейчас

• Типичные ошибки, допускаемые при покупке ссылок

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

+ Бонус:

• Семинар «Продвижение молодых сайтов»

Покупка:

•СтоимостьDVD-бокса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна [email protected] .ru

Page 130: Л.Гроховский - Руководство по внутренним факторам

128 DVD‑семинары и курсы

DVD – семинар #3 «Продвижение сайтов: задействуем внутренние факторы» – 5 часов (Уровень подготовки: специалист)

Для кого этот DVD?

• Для руководителя SEO-отдела или SEO-аналитика, создающего технологию продвижения

• Для штатного SEO-специалиста или фрилансера

• Для веб-разработчика или программи-ста, занимающихся созданием сайтов для SEO

• Для продвинутых клиентов, кото-рые хотят понять потенциал сво-его сайта с точки зрения внутренней оптимизации

• Для специалиста, продвигающего интер-нет-магазины и заинтересованного в ав-томатизации перелинковки и генерации контента

вам нужен этот видеокурс, если

• Вы продвигаете интернет-магазин

• Вы столкнулись с проблемой воровства контента и не знаете, что делать

• У вас на сайте нет уникального контен-та, и это вызывает сложности

• Вы хотите сэкономить на ссылках, ис-пользуя внутренние ресурсы сайта

• Вы хотите делать эффективные сайты для SEO

• Вы хотите автоматизировать перелин-ковку и генерацию контента на сайте

автор и ведущий:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Подробная программа семинара по ссылке

отзывы

•ВладимирБаязитов(www .manuolog .ru):

– Это был самый лучший семинар по вну‑тренним факторам из всех, которые я посещал.

•АндрейТрапезников(многопроектов): – Семинар понравился, немного не хвата‑ло примеров конкретных сайтов.

•ОльгаДергачева(www.r52.ru):– Хорошая атмосфера, понятный язык. Отличный семинар и знания преподавателя.

•АндрейЗарецкий(www.primelog.ru): – Очень познавательно, открыл много нового для себя.

•СергейНазаренко(www .aquacorp .ru): – Весь материал очень четко изло‑жен, спокойная уверенная манера веде‑ния семинара положительно сказалась на усвояемости материала.

•ВалентинДомбровский,Psycho(www .nextup .ru)– Достаточно полный и интересный се‑минар от человека, который, безусловно, очень хорошо разбирается в теме. Полу‑ченные знания по столь важному аспек‑ту SEO, конечно, необходимо применять на практике.

Покупка:

•СтоимостьDVD-бокса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

Page 131: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 129

•По вопросампокупкиобращатьсяна [email protected] .ru

DVD-семинар – #4 «Поведенческие факторы, юзабилити и яндекс.Метрика для SEO-специалиста» (Уровень подготовки: специалист)

Для кого этот DVD?

• Для оптимизатора, который хочет эф-фективно продвигать сайты

• Для интернет-маркетолога

• Для веб-аналитика

вам нужен этот видеокурс, если

• Стандартные методы продвижения не работают

• Вы все еще не понимаете, как можно влиять на поведенческие факторы

• Вам нужно, чтобы сайт клиента продавал

• Вы не умеете пользоваться Яндекс.Метрикой

ведущий семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Программа:

• Теория: развитие поведенческих метрик

• 3 группы поведенческих факторов

переходы по ссылкам

результаты поиска

поведение на сайте

• Где покупать естественные ссылки

• Связки поведенческих факторов: как это работает

• Исследование пользователей: какими данными располагает Яндекс

• 3 способа накрутки поведенческих факторов

имитация живых пользователей: со-здание «живых» ботов

ботнет

биржа

• Мифы и заблуждения о поведенческих факторах

• Основы юзабилити

• Чек-лист: типичные ошибки юзабилити

• Юзабилити-аудит сайта

• Отличия ПФ для 4 тематик

свадебные платья

ноутбуки

такси

индийская косметика

• Возможности Яндекс.Метрики: демон-страция функционала

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

Покупка:

•СтоимостьDVD-курса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна [email protected] .ru

Page 132: Л.Гроховский - Руководство по внутренним факторам

130 DVD‑семинары и курсы

DVD – семинар #5 «Комплексная стратегия продвижения» – 3 часа [Уровень подготовки: начинающий]

Для кого этот DVD?

• Для начинающих оптимизаторов

• Для интернет-маркетологов

• Для заказчиков

вам нужен этот видеокурс, если

• Вы хотите использовать комплексный подход к продвижению сайта

• Вы самостоятельно продвигаете сайт и вам нужны выдающиеся результаты

• Вам кажется, что ваши знания устарели

• Вы хотите понять, использует ли ваш оптимизатор комплексный подход к продвижению сайта

ведущие семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

• Станислав Поломарь, руководитель службы продвижения, Web-it

• Виктор Нагайцев, генеральный директор, PerfectSeo

Среди слушателей были

• Магомед Чербижев, руководитель Seointellect.ru

• Вениамин Моисеев, преподаватель АиР

• Илья Савинов, преподаватель АиР

• Денис Макаров, технический директор, Miralab.ru

Программа семинара:

• Что такое комплексный подход к про-движению сайтов

• Как совмещать внешние и внутренние факторы

• Как поведенческие факторы коррели-руют с внутренними

• Как использовать <HTML> разметку для пользователей и для роботов

• Как составлять текст ссылки

• Как влияет возраст сайта на продвиже-ние и что с этим делать

• Как правильно настраивать редиректы и 404 ошибки

• Как картинки влияют на продвижение

• Как избежать склейки нескольких сай-тов одной компании

Покупка:

•СтоимостьDVD-бокса3000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна [email protected] .ru

Page 133: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 131

DVD-семинар – #1 «Автоматизация в SEO» – 8 DVD (Уровень подготовки: профессионал)

Для кого этот DVD?

• Для руководителя SEO-компании

• Для директора по маркетингу, руково-дящего внутренним отделом SEO

• Для разработчика веб-сервисов и про-грамм для интернет-маркетинга

ведущий семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Содержание

1‑й диск

• Задачи и цели автоматизации

• Автоматизация продаж

2‑й диск

• Расчет стоимости

• Отчетность, статистика, биллинг

3‑й диск

• Система контроля рисков

4‑й диск

• Контроль работы оптимизаторов

• Составление семантического ядра

• Копирайтинг

5‑й диск

• Генерация контента

• SEO-аудит, диагностика сайта

6‑й диск

• Перелинковка

• Анализ конкурентов

7‑й диск

• Система для отдела SEO-аналитики

• Яндекс.Метрика, Google.Analytics

• Поведенческие факторы

8‑й диск

• Агрегаторы: внутренние и внешние ссылки

• Комплексная автоматизация

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

+ Бонус на 40 000 руб .:

• 2 часа индивидуальных консультаций (экономия 10  000 руб.)

• аудит автоматизации SEO-отдела (эко-номия 30  000 руб.)

отзывы:

•РоманКлевцов,генеральный директор «оптимизм .ру»:

– В условиях динамично меняющего‑ся SEO Леонид один из немногих успе‑вает профессионально реагировать на нововведения и повышать качество автоматизации.

•ТимофейКвачев,руководительотде-ла интернет-маркетинга, TRINET:

– Хороший контент от хорошего специа‑листа. Полагаю, что топ‑менеджеры ком‑паний смогут почерпнуть много полез‑ной информации, а также ряд методик для быстрого внедрения в практическую деятельность своей компании, оптимиза‑ции рутинных процессов и развития бизне‑са в целом.

Page 134: Л.Гроховский - Руководство по внутренним факторам

132 DVD‑семинары и курсы

•ИванСевостьянов,генеральный директор, «вебПроекты»:

– Леонид Гроховский имеет огромный опыт в автоматизации процессов SEO‑компаний. Уверен, что его знания вам пригодятся!

•ВикторНагайцев,генеральный директор, PerfectSeo:

– Леонид является признанным гранд‑мастером в области автоматизации продвижения сайтов. Я глубоко убежден, что в данном курсе каждый сможет по‑черпнуть что‑то новое.

•СтаниславПоломарь,руководительSEO-направления, Web-IT:

– Все вещи, о которых рассказывает Лео‑нид, опробованы и отточены на многих проектах (от мелких до очень крупных). Поэтому подходы и знания, получен‑ные от данного семинара, безусловно, представляют большую практическую ценность.

•КириллСамойлов,генеральный директор, ArrowMedia:– Современный бизнес в области SEO не‑возможен без высокого уровня автомати‑зации. Знания и опыт Леонида по данно‑му вопросу будут очень полезны.

•АртемБородатюк,генеральный директор NetPeak:

– Леонид Гроховский подготовил, пожа‑луй, самый полезный материал, который доводилось просматривать с топ‑ме‑неджментом Netpeak за последнее время.

•АлександрСалтыков,директорпо маркетингу, Ingate Development:

– Невозможно представить сегодня SEO без автоматизации. Леонид обладает большим и, безусловно, полезным опы‑том в разработке автоматизированных систем. Его консультации будут весьма полезны тем, кто заинтересован в повы‑шении эффективности бизнес‑процессов SEO‑компании.

Покупка:

•СтоимостьDVD-курса50 000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

• Тираж ограничен – всего 10 коробок.

• В целях профилактики пиратства и сохранения эксклюзивности ин-формации, DVD продаю только тем, с кем знаком лично, либо запрашиваю рекомендации. Оставляю за собой пра-во отказать любому в возможности по-купки без объяснения причины.

•По вопросампокупкиобращатьсяна [email protected] .ru

Page 135: Л.Гроховский - Руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав Ставский

SEO: руководство по внутренним факторам

Книга содержит комментарии экспертов проекта «ТопЭксперт.РФ»:Ивана Севостьянова, Николая Хиврина, Константина Шурыгина,

Анара Бабаева, Сергея Панкова и Даниила Маула

Научный редактор Станислав СтавскийЛитературный редактор Татьяна Байдак

Верстальщик-дизайнер Юлия Кинаш-КонстантиноваКорректор Валентина Максимова

Подписано в печать 28.12.2011. Формат 70 100 1/16.

Издательство Центр исследований и образования «ТопЭксперт.РФ»

Page 136: Л.Гроховский - Руководство по внутренним факторам

«SEO: руководство по внутренним факторам» - Леонид Гроховский, Михаил Сливинский

Эта книга кардинальным образом отличается от аналогичных изданий: написана она оптимизаторами и для оптимизаторов, при этом является первым изданием посвященным теме внутренних факторов SEO. Авторы связали свои разноплановые познания в сфере внутренней оп

О чем эта книга «SEO: руководство по внутренним факторам»
Эта книга кардинальным образом отличается от аналогичных изданий: написана она оптимизаторами и для оптимизаторов, при этом является первым изданием посвященным теме внутренних факторов SEO. Авторы связали свои разноплановые познания в сфере внутренней оптимизации и простым языком изложили довольно сложный материал.
Отныне вы можете пользоваться актуальной информацией и смело применять новые знания на практике, наиболее полно использовать весь потенциал сайта и улучшить его позиции в выдаче капризных поисковых систем.
Прежде чем скачать бесплатно книгу «SEO: руководство по внутренним факторам», ознакомьтесь с отзывами о ней.
— Книга и вправду стоящая, для новичков и людей начальным уровнем знания различных поисковых систем. Буквально бесценная литература. Естественно, без рекламы услуг авторы не обошлись, но без нее в наше время никуда.
— Знаю по опыту, сколь у каждого из нас устают глаза, в связи с этим, сразу говорю — книжка стоит потраченных усилий. Написана она практиками и для практиков.
— Перед чтением основательно прошерстил интернет в поисках отзывов, дабы зря не насиловать зрительный аппарат.

Page 1: Л.Гроховский - Руководство по внутренним факторам

руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав СтавскийSEO

Page 2: Л.Гроховский - Руководство по внутренним факторам

Page 3: Л.Гроховский - Руководство по внутренним факторам

руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав СтавскийSEO

Page 4: Л.Гроховский - Руководство по внутренним факторам

Леонид Гроховский, Михаил Сливинский, Алексей Чекушин, Станислав Ставский

SEO: руководство по внутренним факторам. – М.: Центр исследований и образова-ния «ТопЭксперт.РФ», 2011. – 133 с.

© Центр исследований и образования «ТопЭксперт.РФ»

© Леонид Гроховский, Михаил Сливинский, Алексей Чекушин, Станислав Ставский

Эта книга кардинально отличается от  аналогичных изданий: она написана оптимизаторами для оптимизаторов и является первым изданием по теме внутренних факторов в SEO. Авторы со-единили свои разноплановые познания в области внутренней оптимизации и смогли простым язы-ком изложить сложный материал. Теперь вы можете воспользоваться актуальной информацией и применить новые знания в своей практике, наиболее полно задействовав потенциал собственно-го сайта и улучшив его позиции в выдаче поисковых систем. Книга написана в соавторстве с лучши-ми аналитиками нашей профессии – Станиславом Ставским, Михаилом Сливинским и Алексеем Чекушиным. Их участие сделало книгу полезной не только для начинающих, но и для продвину-тых специалистов.

Page 5: Л.Гроховский - Руководство по внутренним факторам

Леонид Грохов-ский, В  SEO с 2005 года, в на-

стоящий момент ди-ректор по  технологии продвижения и автома-тизации компании «Оп-тимизм.ру», входящей в топ-10 SEO-компаний. Опыт продвижения – бо-лее 300 сайтов. Область

деятельности: автоматизация, аналити-ка, проведение исследований. Руководи-тель центра образования и исследований «ТопЭксперт.РФ», автор ряда публикаций в профессиональных изданиях, постоянный докладчик на  отраслевых конференциях. Руководитель разработки аналитической системы «СайтРепорт». Автор исследова-ния «SEO-альманах 2010». Специализиру-ется на продвижении порталов и крупных интернет-магазинов. Продвигал и консуль-тировал такие проекты, как championat.ru, woman.ru, rabota.ru, ucheba.ru, pressfoto.ru, aforex.ru, best-realty.ru, panasonic.ru. Пре-подает SEO в  Академии интернет-рекла-мы и  в  учебном центре «Специалист» при МГТУ им. Н. Э. Баумана. Ведущий про-граммы «ТопЭксперт.РФ» на интернет-те-левидении MEGAINDEX.TV.

Автор и преподаватель курсов:

«Основные ошибки в SEO от создания сайта до покупки ссылок»

«Пошаговая реализация SEO-стратегии для маркетологов и руководителей»

«Оптимизация сайтов: задействуем внут-ренние факторы»

«Источники привлечения внешних ссылок»

«Юзабилити, аналитика и  Яндекс.Ме-трика для SEO-специалиста»

«Комплексная стратегия продвижения»

«Автоматизация в SEO»

«Продвижение порталов и  крупных интернет-магазинов»

«Высший пилотаж в SEO»

«Полный курс SEO – 130 часов»

СоавторыМихаил Сливинский, руководитель отдела аналитики, Wikimart.ru; преподаватель учебного центра «ТопЭксперт.РФ»

алексей Чекушин, руководитель департамента продвижения, Wikimart.ru; преподаватель учебного центра «ТопЭксперт.РФ»

Станислав Ставский, руководитель направле-ния зарубежных проектов, Sape.ru; ex. аналитик веб-поиска Яндекса; преподаватель учебного центра «ТопЭксперт.РФ»

об авторе и соавторах

Page 6: Л.Гроховский - Руководство по внутренним факторам

Содержание

Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6введение в продвижение сайтов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

0.1. Понятие о внутренних факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

0.2. Понятие о внешних факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

0.3. Понятие о поведенческих факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

0.4. Комплексный подход к продвижению сайтов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Глава 1 . Перелинковка страниц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.1. Как вычисляется PageRank и почему это так важно знать . . . . . . . . . . . . . . . . . . . . . . . 24

• По материалам статьи в переводе Александра Садовского «Растолкованный PageRank» . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.2. Базовые схемы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25• Комплексное продвижение всего сайта . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26• Продвижение главной страницы под ВЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26• Продвижение разделов под СЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27• Продвижение внутренних страниц под НЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.3. Локальные схемы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Кольцо . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Куб . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Звезда . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.4. Правила перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.5. Способы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.6. Составление текста ссылки для перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

1.7. Создание модуля для перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40• Портал . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40• Интернет-магазин . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41• Корпоративный сайт . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42• Каталог . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Глава 2 . Устранение дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.1. Чем вредны дубликаты . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.2. Классификация дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.3. Кейсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49• Компания «БЕСТ-Недвижимость», www.best-realty.ru . . . . . . . . . . . . . . . . . . . . . . . . . 49• ММЦ «ОнКлиник», www.onclinic.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51• Магазин итальянской мебели, www.eurointerier.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.4. Способы устранения дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Page 7: Л.Гроховский - Руководство по внутренним факторам

Глава 3 . Инструкции для поисковых систем . . . . . . . . . . . . . . . . . . . . . . . 573.1. Зачем нужен robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.2. Robots.txt – универсальные директивы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.3. Robots.txt – директивы для Яндекса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.4. Правила составления robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.5. Разбор robots.txt на примерах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .61

3.6. Зачем нужен sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.7. Директивы sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.8. Правила составления sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.9. Пример sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.10. Принцип взаимодействия sitemap.xml и robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.11. Автоматизация добавления страниц в sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

Глава 4 . работа с авторским контентом . . . . . . . . . . . . . . . . . . . . . . . . . . . 714.1. Уникальность контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.2. Как защитить контент от воровства? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74

4.3. Как воровать контент? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.4. Отсутствие и недостаток контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76• Разбор решения на примере www.mobiguru.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.5. Автоматизация наполнения Description, Keywords, Title . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.6. Автоматизация генерации контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79• Автоматизация генерации описаний товаров . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79• Автоматизация генерации технических характеристик (уровень 1) . . . . . . . . . . . . . 79• Автоматизация генерации технических характеристик (уровень 2) . . . . . . . . . . . . . 80

4.7. Обнаружение дубликатов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80• Инструкция по обнаружению дубликатов вручную . . . . . . . . . . . . . . . . . . . . . . . . . . . 81• Способы автоматизации обнаружения дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Глава 5 . Коды ответов сервера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855.1. Код ответа 200 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .85

5.2. Коды ответов 301/302/303/307/3** . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.3. Код ответа 404 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

Глава 6 . Стандарты W3C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 896.1. Правила HTML-разметки для SEO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.2. Проверка верстки на соответствие стандартам W3C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Глава 7 . SEO-аналитика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97Глава 8 . Исследование «SEO-альманах 2010» . . . . . . . . . . . . . . . . . . . . . . 107Семинары и курсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117DVD-семинары и курсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

Содержание 5

Page 8: Л.Гроховский - Руководство по внутренним факторам

П риветствую! Меня зовут Леонид Гроховский. В настоящий момент я  работаю директором по  тех-

нологии продвижения и  автоматизации в компании «Оптимизм.ру». Моя область деятельности  – исследование поисковых алгоритмов и  создание технологии про-движения. Также я  занимаюсь разработ-кой стратегии продвижения ключевых клиентов компании, т. е. порталов, круп-ных интернет-магазинов и сайтов – лиде-ров тематики. В SEO с 2005 года.

В этой книге я стремился собрать воеди-но свои познания в  области внутренней оптимизации и  доступным языком изло-жить этот материал, чтобы вы смогли при-менить почерпнутую здесь информацию в своей практике. Мне хочется, чтобы в ре-зультате вы смогли задействовать потен-циал собственного сайта и улучшили его позиции в выдаче поисковых систем. Кро-ме того, мне удалось привлечь лучших ана-литиков нашей профессии  – Станислава Ставского, Михаила Сливинского и Алек-сея Чекушина. Они стали соавторами этой книги и дали комментарии по вопросам PRO-уровня, сделав книгу интересной не только для начинающих, но и для про-двинутых специалистов.

Следует отметить, что книга, которую вы держите в  руках, кардинально отличает-ся от аналогичных изданий. Она написана оптимизатором для оптимизаторов. Я пи-сал не об абстрактном поисковом продви-жении, а сосредоточился на практических рекомендациях, поэтому здесь органично сочетаются краткие фундаментальные

Предисловие

Page 9: Л.Гроховский - Руководство по внутренним факторам

понятия с многочисленными конкретны-ми советами, которые являются остроак-туальными сегодня и останутся таковыми завтра. Это первое издание по данной теме. Вероятно, очень скоро нам придется столк-нуться с новыми исследованиями и новы-ми факторами ранжирования, изменится значимость этих факторов и способы воз-действия на них. Рад избавить вас от лиш-него беспокойства.

Технологически работы по продвижению сайта делятся на два этапа: оптимизация и  продвижение. В  этой книге мы пого-ворим о  первом этапе, который включа-ет в себя все работы, проводимые внутри сайта: это работа с  текстом, ссылками, настройками сервера, HTML-версткой, а  также создание инструкций для  поис-ковых систем. Здесь также описаны спо-собы автоматизации генерации текстов, заголовков и  метатегов, перелинковки. Эта информация пригодится специали-стам, продвигающим крупные порталы и интернет-магазины.

Продвигая сайт, я  всегда стараюсь мак-симально использовать потенциал вну-тренних факторов. Мой подход к продви-жению тесно связан с  автоматизацией, аналитикой и проведением исследований. На то есть ряд причин.

В 2010 году количество конференций, по-священных SEO, увеличилось в  два раза. Очевиден и  рост интереса к  образова-тельным мероприятиям: чаще проводят-ся семинары и курсы, открываются новые центры обучения. SEO-бум – закономерное следствие того, что технологии продвиже-ния усложнились и ценность информации очень сильно возросла. Рядовым SEO-спе-циалистам, чтобы не выпасть из обоймы, необходимо постоянно повышать свою квалификацию, консультируясь у  более опытных коллег.

Особая прослойка экспертов, имеющих практическое подтверждение высокого

Рецензия на книгу Леонида Гроховского «SEO: руководство по внутренним факторам»

Книга Леонида очень необычна! Прежде всего, тем, что в ней много практики и не так много теории. Немногие авторы

трудов, посвященных поисковой оптимизации, раскрывают практические методы работы. Это происходит из‑за того, что мир SEO быстро меняется. И пока написанное выходит в свет, большая часть знаний уже устаревает.В данной книге сделана, на мой взгляд, достаточно удачная попытка раскрыть именно практические инструменты оптимизации сайтов. Достоинство ее и в том, что она узко‑специализированная. Книга целиком и полностью посвящена только внутренним факторам оптимизации сайта: структуре, контенту, перелинковке, написанию файла robots.txt и другим аспектам работы с сайтом.Порадовало меня и большое количество реальных примеров из практики автора, наглядно иллюстрированных.Издание, несомненно, будет полезно всем специалистам по оптимизации для закрепления уже имеющихся знаний, а также начинающим оптимизаторам для приобретения новых знаний по SEO.

С уважением, Иван СевоСтьянов, генеральный директор компании «вебПроекты»

Предисловие 7

Page 10: Л.Гроховский - Руководство по внутренним факторам

уровня их  знаний и  обладающих ценной информацией, в SEO-сообществе уже сфор-мировалась. В их числе – руководители ли-дирующих компаний, разработчики анали-тических программ и систем автоматизации продвижения, высококвалифицированные SEO-профессионалы, успешно работаю-щие с самыми конкурентными тематиками. Под моим руководством в конце 2010 года группа таких экспертов провела исследо-вание факторов ранжирования, которое получило название «SEO-альманах 2010». В ходе исследования было рассмотрено бо-лее 200 факторов, сгруппированных в бло-ки. Нами применялась методология эксперт-ных оценок, были привлечены 26 ведущих SEO-экспертов. Исследование получило ши-рокий резонанс в SEO-кругах и за их преде-лами. Результаты проделанной работы, ка-сающиеся внутренних факторов, изложены в приложении к этой книге. Комментарии некоторых экспертов вы будете встречать и в процессе чтения основной части.

Вообще, говоря о тенденциях поискового продвижения сегодня, можно сделать сле-дующие выводы:

1 . Снижается значение покупных ссылок

«Священная война» с автоматическим про-движением набирает обороты, и  очевид-но, что успех сейчас на стороне Яндекса. Можно уверенно говорить о том, что сте-пень влияния покупных ссылок на  ран-жирование сведена к  минимуму. Стоит ожидать еще большего ужесточения, так что биржам ссылок уже сейчас необходи-мо становиться на путь повышения каче-ства площадок. Впрочем, такая ситуация не  стала для  кого-то  громом среди ясно-го неба: представители Яндекса не едино-жды предрекали «смерть» платных ссылок.

2 . возрастает значение внутренних факторов

Факторы, которые поддаются влиянию оптимизаторов, стали гораздо менее

Одной из первых задач, с которой я столкнулся после того, как возглавил отдел маркетинга в компании Adrenalin

Forex, была задача по поисковой оптимизации ее сайта. К тому моменту компания уже успела поработать по данной задаче с несколькими крупными SEO‑агентствами и, полностью разочаровавшись в нулевых результатах, перешла на само‑стоятельное SEO‑продвижение. К сожалению, предыдущий специалист так и не смог добиться высоких показателей, совмещая работу по продвижению с целым перечнем иных задач, соответствующих его компетенции и должности в компании.Таким образом, я пришел к выводу, что требуется поиск нового партнера по продвижению сайта компании с четко обозначен‑ными планами и обязательствами по их выполнению. После первой встречи с Леонидом появилось ощущение, что это тот человек, который обладает всем необходимым опытом для решения данной задачи. Тем не менее, учитывая преды‑дущий опыт компании, прошло несколько этапов согласования договора по оптимизации, где финансовые взаиморасчеты были привязаны к конкретным результатам работы и срокам их достижения.После подписания всех документов и начала нашей совмест‑ной деятельности агентством было подготовлено ТЗ, где было описано, какие тексты потребуется написать и как они должны размещаться на сайте для эффективного его продвижения. По условиям договора, текст готовился копирайтерами агентства, но здесь мы столкнулись с проблемой восприятия «оптимизаторских» текстов посетителями сайта. Говоря проще, в компании изначально были заданы особые стандарты к содержанию сайта, а именно требования по простоте, лаконичности и доступности материалов. Поэтому те тексты, которые написал копирайтер агентства, мы однозначно не могли позволить разместить на сайте компании. Требо‑валось подготовить такой текст, чтобы, если кому‑то вдруг и захотелось бы его прочитать, у него не возникло бы даже подозрений, что текст написан не для него, а для поисковых роботов. В результате кропотливого труда эти тексты удалось подготовить собственными силами. Итогом мы гордимся и по сей день, ведь написать понятный, простой и осмыслен‑ный текст с постоянно повторяющимися словами в строго заданном формате – весьма непростая задача.Не прошло и пары месяцев, как мы поняли, что проделали эту сложную работу совсем не зря, наблюдая, как наши позиции в поисковиках стремительно стали подниматься. А уже спустя полгода они по самым конкурентным запросам Forex и «Фо‑рекс» вышли на 2 место, что на первых этапах работы казалось практически невозможным.

отЗЫв КЛИентА

8 Предисловие

Page 11: Л.Гроховский - Руководство по внутренним факторам

значимыми. Те  же, на  которые повлиять очень сложно, а  порой и  нереально, вы-шли на первый план. Что ж, против лома нет приема, а  на  любое действие проти-водействие найдется: оптимизаторам не-обходимо повышать квалификацию, рабо-тать над своим подходом к продвижению и сосредотачивать внимание на внутрен-них факторах.

3 . Каждая тематика может иметь свои особенности продвижения

Введение алгоритма машинного обуче-ния «Матрикснет» не прошло бесследно: сейчас каждая конкретная тематика име-ет свою специфику продвижения, и  спе-цифика эта может зависеть еще и от типа запросов. Например, подходы к продвиже-нию однословного запроса и запроса более конкретного могут отличаться коренным образом. Технология продвижения многих запросов теперь еще и напрямую зависит от географической принадлежности сайта.

Резюмируя все вышесказанное, подчерк-нем: продвигать сайты стало сложнее. Да, было проделано много работы по раз-грузке оптимизаторского труда: создава-лись ссылочные агрегаторы, переводящие продвижение в  автоматический режим. И что же мы имеем сегодня? Необходимо буквально вручную прорабатывать вну-тренние факторы и  напрямую договари-ваться о  размещении ссылок на  качест-венных тематических площадках. Сроки продвижения растягиваются. Конкурен-ция растет. Утешительным моментом в  сложившейся ситуации является ме-жду тем рост покупательской аудитории. К примеру, количество запросов «ноутбук», по данным Яндекс.Вордстат, за год вырос-ло с 1  589  943 (ноябрь 2009) до 2  591  179 (ноябрь 2010). Разумеется, конкретные по-казатели зависят от тематики, но в целом тенденция роста очевидна.

По  мере развития поисковых систем количество факторов ранжирования

Продвигать сайты стало сложнее. Да, было проделано много работы по разгрузке

оптимизаторского труда: создавались ссылочные агрегаторы, переводящие продвижение в автома‑тический режим. И что же мы имеем сегодня? Необходимо буквально вручную прорабатывать внутренние факторы и напрямую договариваться о размещении ссылок на качественных тематиче‑ских площадках. Сроки продвижения растягивают‑ся. Конкуренция растет.

Предисловие 9

Page 12: Л.Гроховский - Руководство по внутренним факторам

увеличивается. Разумно предположить, что в таких условиях достичь положитель-ного результата можно быстрее, если воз-действовать на все возможные факторы, пусть даже некоторые кажутся пустяко-выми. Помните о том, что многие из них, накладываясь друг на друга, при оценке влияния на ранжирование считаются с ку-мулятивным эффектом. Согласитесь, луч-ше сделать все, что в ваших силах, и видеть результат стараний, чем что-то упустить и размышлять, что же конкретно. Имен-но этому принципу я  следую в  своей деятельности. Для  анализа потенциала внутренних факторов под моим руковод-ством разработана аналитическая систе-ма «СайтРепорт». С  ее помощью можно воздействовать практически на  все фак-торы, описанные в этой книге. Подробно о возможностях «СайтРепорт» вы прочте-те в приложении. Там же вы найдете ин-формацию об  акциях и  скидочных купо-нах на мои семинары и консалтинговые услуги.

Наша книга поможет вам удержаться на плаву, адаптироваться к изменившим-ся условиям и  переориентировать свою стратегию на внутренние факторы. Если вы решите углубить свои знания еще боль-ше и  информации в  этой книге для вас окажется недостаточно, вы можете полу-чить подкрепление почерпнутым знаниям на одноименном платном семинаре «оп-тимизация сайтов: задействуем вну-тренние факторы», который проводит-ся раз в год. На семинаре вы поучаствуете в разборе реальных сайтов слушателей, за-дадите интересующие вас вопросы и полу-чите особые бонусы.

Наша книга поможет вам удержаться на плаву, адаптироваться к изменившимся

условиям и переориентировать свою стратегию на внутренние факторы.

10 Предисловие

Page 13: Л.Гроховский - Руководство по внутренним факторам

вы можете смело пропустить эту часть, если считаете себя опыт-ным оптимизатором. Информация,

представленная здесь, будет полезна тем, кто  только начинает свою деятельность на поприще продвижения сайтов.

Поисковое продвижение сайтов – это ком-плекс работ, направленных на улучшение позиций веб-ресурса в выдаче поисковых систем. Цель этих мероприятий – извле-чение коммерческой выгоды за счет при-влечения на сайт посетителей из поиско-вых систем.

Существуют 3 способа продвижения сайтов:

воздействие на внутренние факторы;

воздействие на внешние факторы;

воздействие на поведенческие факторы.

Также продвижение сайтов часто делят по типам факторов, на которые произво-дится влияние со стороны оптимизатора.

внутренние факторы – это все работы, проводимые над  сайтом, а  также домен и серверные настройки.

внешние факторы – это использование рекомендательных ссылок, размещаемых на внешних ресурсах.

Поведенческие факторы  – статистиче-ская информация о посетителях сайта, со-бираемая поисковыми системами.

Внутренние и внешние факторы подраз-деляются на динамические и статичные. Первые учитывают статистику, накоплен-ную за  некоторый временной промежу-ток, например, возраст сайта, динамику

введение в продвижение сайтов

Page 14: Л.Гроховский - Руководство по внутренним факторам

12 Введение в продвижение сайтов

прироста рекомендательных ссылок. Ста-тичные факторы учитывают текущие значения.

Для эффективного продвижения необхо-димо использовать все три вышеперечис-ленных способа. Они неразделимы и дол-жны использоваться в комплексе. Только такой подход позволяет добиваться успе-ха в SEO.

0.1. Понятие о внутренних факторах

Верстка (HTML-теги)

Эта группа факторов учитывает правиль-ность верстки страниц с точки зрения ме-ждународного стандарта W3C. В  этом плане важны HTML-теги, наделенные ло-гическим смыслом: заголовок страницы, заголовки абзацев, смысловые выделе-ния текста, метатеги и др. Поисковые си-стемы учитывают текстовое содержание этих тегов и по ним определяют содержа-ние страниц. Обратите внимание: смыс-ловые теги не должны пересекаться друг с другом, например, заголовок не должен быть ссылкой.

Текст

Имеет значение не  только текстовое на-полнение страниц, но и ключевые слова, уникальность текста, объем информации и другие моменты. Очень важно наполнять сайт уникальным и полезным для посети-телей контентом, кроме того, нельзя дуб-лировать тексты на разных его страницах.

Настройки сервера

Настройки сервера – это инструкция, ко-торую получает поисковый робот, захо-дя на  каждую страницу. Эти настройки используются также при  перемещении страниц или  их  удалении с  сайта. Важ-но правильно настраивать эти инструк-ции, поскольку даже незначительные на  первый взгляд ошибки в  серверных

Продвигать сайты можно разными способами. Эти способы можно разделять

по многим критериям, например по степени соответствия рекомендациям поисковых си‑стем (черные и белые методы). Поисковики плохо относятся к сайтам, использующим методы, которые вводят алгоритм в заблуждение.К черным методам относится:• клоакинг (показ роботу поисковой системы другого

контента, отличного от того, который увидит пользователь, например текста, содержащего длинные списки ключевых слов),

• накрутка поведенческих факторов, когда веб‑мастер эму‑лирует интерес к своему сайту со стороны пользователя.

Покупку рекламных ссылок обычно называют серыми методами. Получается так, потому что поисковики хотели бы чтобы никто не покупал ссылок и не воздействовал подобным образом на алгоритм, однако данная практика, несмотря на такое отношение, стала общепринятой. Поэтому серьезные санкции за покупку ссылок со стороны поисковиков сейчас не применяются.Когда говорят о «белой» оптимизации, в основном подразуме‑вают оптимизацию внутренних факторов и создание информа‑ционных поводов в сети для получения ссылок и повышения авторитетности.

МненИе

Page 15: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 13

настройках могут стать фатальными для процесса продвижения сайта.

URL

Воздействие на  URL-факторы в  первую очередь подразумевает использование в адресе страницы ключевых слов. Важен также вид URL, его формула, учитывается и длина. Одно из непреложных правил гла-сит: страница должна быть доступна толь-ко по одному URL.

Возрастные факторы

К возрастным факторам среди прочих от-носятся возраст сайта, страницы, URL, ди-намика прироста контента, частота добав-ления новых страниц.

Географическое расположение

Географическое расположение важно для  регионального продвижения. В  этом плане имеют значение указанные на сайте контакты и  адреса организации, а  также обозначенные в тексте страниц сайта регио-нальные пункты и подобная информация.

Перелинковка

Страницы сайта связаны между собой се-тью внутренних ссылок. К группе факто-ров перелинковки относятся схемы пе-релинковки, тексты внутренних ссылок, а также вес передаваемых ссылок. Кроме того, имеет значение актуальность ссы-лок, а именно наличие переходов посети-телей по ним.

CMS

Важно содержание и тип сайта, вид CMS, факт использования бесплатных шабло-нов, тип движка, наличие особых блоков на сайте.

Инструкции для поисковых систем

Имеет значение наличие и содержание ин-струкции robots.txt, карты сайта sitemap.xml, их доступность для индексации.

Резюме: Внутренние факто-ры  – самое обширное направление

Настройки сервера – это инструкция, которую получает поисковый робот, заходя

на каждую страницу. Эти настройки используются также при перемещении страниц или их удалении с сайта. Важно правильно настраивать эти инструкции, поскольку даже незначительные на первый взгляд ошибки в серверных настройках могут стать фатальными для процесса продвиже‑ния сайта.

Page 16: Л.Гроховский - Руководство по внутренним факторам

14 Введение в продвижение сайтов

в  поисковом продвижении. Воздей-ствие на них не поддается автома-тизации и является самым затрат-ным направлением работ с  точки зрения временных ресурсов. между тем игра действительно стоит свеч: грамотный подход к использованию внутренних факторов позволяет до-стигать значительных результатов и на несколько шагов опережать кон-курентов. Преимущество внутрен-них факторов заключается в  том, что  большая часть работ прово-дится единоразово. Из этого правила есть исключения, но обычно 20 % уси-лий в этом направлении позволяют достигать 80 % результатов. Сей-час и в ближайшем будущем именно внутренние факторы «задают тон» в продвижении сайтов.

0.2. Понятие о внешних факторах Вес внешних рекомендательных ссылок

К этой группе относится большое количе-ство факторов, косвенно характеризующих качество площадки, размещающей рекомен-дательную ссылку: возраст площадки, уни-кальность текстов, количество размещен-ных рекомендательных ссылок, наличие донора в  Яндекс.Каталоге, позиции сайта в ПС, уровень вложенности страницы-доно-ра, количество контента на странице, авто-ритетность сайта-донора и другие факторы.

Содержание текста рекомендательных ссылок

Важно наличие ключевых слов в  тексте ссылки, а  также сама форма словосоче-тания: прямое вхождение, словоформа, разбавление ключевых вхождений, уни-кальность текста ссылки. Имеет значение и текст, окружающий анкор ссылки.

Статистика прироста внешних ссылок

Существуют (и  не  должны оставаться без  внимания) динамические факторы,

Важно наличие ключевых слов в тексте ссылки, а также сама форма словосочета‑

ния: прямое вхождение, словоформа, разбавление ключевых вхождений, уникальность текста ссылки. Имеет значение и текст, окружающий анкор ссылки.

Page 17: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 15

среди которых – плавность прироста ре-комендательных ссылок, соотношение их прироста в месяц и общей массы, плот-ность ключевых слов в анкор-листе.

Резюме: Воздействуют на внешние факторы двумя основными спосо-бами: ищут площадки для  разме-щения ссылок либо отправляются на  специализированные биржи сай-тов и статей. Однако покупка ссы-лок легко поддается автоматизации с помощью ссылочных агрегаторов, поэтому значение внешних факто-ров сейчас не так велико, как раньше, и продолжает снижаться дальше.

0.3. Понятие о поведенческих факторах Удовлетворенность пользователей со-

держанием сайта

Чтобы на первых страницах выдачи оказы-вались исключительно полезные для поль-зователей сайты, разработчики поиско-вых систем «обучают» своих детищ сбору и анализу статистики поведения посетите-лей сайта. По ряду косвенных признаков поисковый робот «соображает», насколь-ко пользователь был удовлетворен резуль-татами поиска и собственно содержимым конкретного сайта. В силах оптимизатора добиться более высокого уровня лояльно-сти пользователей. Для этого нужно поза-ботиться о качестве наполнения сайта.

Удобство пользования сайтом

Сайт должен быть не только содержатель-ным, но и удобным. Пользователи не за-держиваются на сайтах, где невозможно быстро отыскать нужную информацию, а поисковые роботы умеют по косвенным признакам определять, насколько ком-фортно будет чувствовать себя на  сайте посетитель. Важно поработать с  юзаби-лити: качественно представить информа-цию, сделать ее доступной в пару кликов, а ее изучение незатруднительным.

Чтобы на первых страницах выдачи оказывались исключительно полезные

для пользователей сайты, разработчики поисковых систем «обучают» своих детищ сбору и анализу статистики поведения посетителей сайта. По ряду косвенных признаков поисковый робот «сообража‑ет», насколько пользователь был удовлетворен результатами поиска и собственно содержимым конкретного сайта. В силах оптимизатора добиться более высокого уровня лояльности пользователей. Для этого нужно позаботиться о качестве наполне‑ния сайта.

Page 18: Л.Гроховский - Руководство по внутренним факторам

16 Введение в продвижение сайтов

Переходы на сайт из иных источников

Счетчик Яндекс.Метрика определяет ста-тистику посещений сайта, отграничивая переходы с поисковых систем от иных ис-точников. Сайт будет ранжироваться луч-ше, если его посещают также по прямому заходу, из закладки или со сторонних ре-сурсов. Ссылка, по которой переходят жи-вые посетители, имеет большее значение. Ссылка, которая простояла год, но ни при-влекла ни одного посетителя, справедливо может считаться бесполезной.

Статистика переходов на сайт из резуль-татов поиска

Имеет значение и то, пользуется ли сайт спросом у пользователей поисковой систе-мы. Разумно предположить, что сайт из-вестной компании и / или компании, услу-гами которой посетитель уже пользовался и остался доволен, привлечет больше вни-мания. Если, несмотря на высокие пози-ции, сайт имеет низкий CTR – он может потерять преимущество в ранжировании.

Прочие источники статистики

Портфель поведенческих факторов все на-ращивается. Возникают новые источники статистики вроде ссылок в почтовой пере-писке или оценок «Like» («Мне нравится») в социальных сетях.

Резюме: Поведенческие факторы уже стали самым значимым фактором. Однако тенденции развития поиско-вых систем явно направлены в сторо-ну улучшения анализа поведенческих факторов, так что в будущем стоит ожидать постепенного повышения значимости этой группы факторов.

0.4. Комплексный подход к продвижению сайтов

В  деле продвижения сайтов важен ком-плексный подход: оптимизатор должен воздействовать на все группы факторов.

Анкор ссылки (Anchor) Это текстовое содержимое, находящееся между тегами. Синоним – «текст ссылки».Апдейт Апдейтом называют пополнение базы данных поисковой машины новой информацией. Выдача поисковых систем меняется с различной частотой. В Google это происходит постоянно, в Яндексе апдейты случаются реже, несколько раз в неделю. В течение дней между апдейтами выдача Яндекса практически не меняется. Исключение – такие тематики и запросы, где присутствуют результаты работы специализиро‑ванных роботов, например новости или блоги.внешняя ссылка Это голосующая единица, дающая рекомендацию сайту, на который она ведет. Понятие «внешняя» означает, что один сайт ссылается на другой, в отличие от внутренних ссылок, которые перенаправляют пользователя в рамках одного сайта. Внешние ссылки помогают поисковым системам определить содержимое страниц, а также их значимость. Небезоснова‑тельно предполагается, что на более качественный сайт в Сети размещено большее количество внешних ссылок. Существуют специализированные биржи для работы с такими ссылками. Кроме того, уже несколько лет оптимизаторы пользуются агрегаторами – автоматизированными системами, которые позволяют решить вопрос покупки ссылок практически без ручного труда.внутренняя ссылка Так называют ссылку, ведущую на другую страницу того же сайта. Понятие «внутренняя» означает, что одна страница ссылается на другую в рамках одного ресурса, «внутри» него. Внутренние ссылки влияют на перераспределение веса между страницами, этот процесс носит название перелинковки. Пере‑линковка – один из важных моментов внутренней оптимиза‑ции сайта, который мастерски используют в своих интересах опытные SEO‑специалисты.вЧ Аббревиатура расшифровывается как «высокочастотный». Обычно этим термином обозначают наиболее часто вводимые запросы. Нужно понимать, что частотность, пусть и является спутником конкуренции, напрямую с ней не связана: нередко можно встретить крайне конкурентные запросы, которые не являются высокочастотными.Донор, Акцептор Донором называют страницу, на которой размещена рекомен‑дательная ссылка. Соответственно, акцептором в поисковом продвижении обозначают страницу, на которую эта ссылка ведет.Дублированный контент Обозначает неуникальный, существующее где‑то еще в Интер‑нете контент. Поисковые системы негативно воспринимают дубликаты, поскольку с ними связаны проблемы хранения и обработки «мусорных» данных.

ЛИКБеЗ

Page 19: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 17

При  таком раскладе возникает синер-гия, и значение каждого фактора в груп-пе возрастает. Подобный подход возможен за счет планирования стратегии продви-жения, представляющей собой план дол-госрочного последовательного захвата позиций в  поисковых системах. Давайте разберем такую стратегию.

Этап 1: Подготовка сайта к продвижению

Составление семантического ядра

Составление семантического ядра – важ-нейший этап в продвижении сайта. На пер-вый взгляд может показаться, что техноло-гия подбора ключевых слов незатейлива, но это не так. Большинство оптимизато-ров совершают фатальные ошибки уже на этой стадии. В действительности «не-затейливый» процесс подбора и проверки запросов, например, для интернет-магази-на бытовой техники, может занять у опти-мизатора несколько дней.

Анализ тематики

Сейчас, когда алгоритмы используют тех-нологию машинного обучения, каждая тематика может иметь свои особенности в  продвижении. Важно провести анализ конкурентов в топ-10 – топ-30, выделить среди них сайты, похожие на ваш, подсчи-тать средние значения факторов ранжиро-вания и сделать все «под копирку».

Выбор входных страниц

При  выборе входных страниц важно учесть два правила. Во-первых, чем мень-ше запросов продвигается на одну страни-цу, тем лучше. Не бывает много входных страниц, бывает много запросов. Поэтому, если вы решили продвигать большое ко-личество запросов, а подходящих страниц нет, не старайтесь уместить ключи на уже существующих, лучше создавайте новые страницы. Во-вторых, на входной страни-це посетитель обязательно должен найти то, за чем он пришел на сайт.

Индекс Это база данных поисковой системы, хранилище всех документов, собранных в Сети. Поиск осуществляется только по тем документам, которые в данный момент времени содержатся в индексе поисковых систем.

Конверсия Так называется отношение количества посетителей сайта, совершивших какое‑либо целевое действие, к общему коли‑честву привлеченных посетителей. Целевым действием может быть регистрация в сервисе, звонок, заказ услуги или покупка товара, подписка на рассылку, добавление сайта в закладки, скачивание файла и т. п.

нЧ Аббревиатура расшифровывается как «низкочастотный». Низкочастотными называют те запросы, которые пользо‑ватели поисковых систем вводят редко. Многие из таких запросов вводят раз в месяц и даже реже. НЧ‑запрос может быть тем не менее высококонкурентным. Продвигать такие запросы проще. Кроме того, тенденция развития поведения пользователей – стремление к уточнению запросов, поэтому с каждым годом доля НЧ‑запросов возрастает, а ВЧ падает. Как правило, «низкочастотники» выигрывают в трафике за счет охвата огромной массы запросов.

Покупка ссылок Цель этого мероприятия – улучшение позиций сайта по за‑просам, содержащимся в тексте ссылки. Существуют разные источники покупки ссылок: биржи, ручной обмен, размещение статей и т. п.

ПС Так сокращенно называют поисковую систему. Для оптимиза‑тора наибольший интерес представляют поисковые системы Яндекс, Google, Mail.ru. Некогда лидировавшая на рынке поиска система Rambler сейчас при продвижении всерьез не рассматривается, поскольку обеспечивает совсем незначи‑тельное количество посетителей.

Результаты поиска Это ответ поисковой системы на запрос пользователя. При стандартных настройках на первой странице результатов поиска в Яндекс и Google оказывается всего десять сайтов, поэтому большинство договоров на SEO‑услуги предполагают вывод именно в десятку.

Релевантность Под релевантностью понимают меру схожести и применяют это понятие в SEO при оценке соответствия результатов поиска запросу пользователя. Понятие «релевантная запросу страни‑ца» используется также в момент выбора входной страницы (страницы, на которую будет попадать посетитель из поиско‑вых систем). Часто в качестве входной страницы выбирают наиболее релевантную.

Сниппет Это описание сайта в результатах поиска. Традиционно сниппет берется из текста страницы. При его формировании также могут быть использованы другие источники, например,

Page 20: Л.Гроховский - Руководство по внутренним факторам

18 Введение в продвижение сайтов

Составление технического задания на написание текстов

Подготовка текстов  – важный этап, и ошибки здесь обходятся дорого. Поэто-му техническое задание (ТЗ) на написание текстов должен подготовить опытный SEO-специалист. В этом документе должны со-держаться подробные указания: объем текста на страницах, употребляемые клю-чевые слова, их количество, рекомендации по составлению заголовков. После написа-ния текстов их нужно проверить на соот-ветствие требованиям ТЗ.

Подготовка текстов

Тексты должны не только содержать клю-чевые слова, но  также быть полезными и удобочитаемыми для посетителей. Не ре-комендую прибегать к  услугам дешевых неопытных SEO-копирайтеров, за  каче-ство стоит переплатить. В первую очередь тексты должны продавать. В книге мы рас-смотрим подход к продвижению, при кото-ром достигается баланс между SEO и про-дающей способностью текстов.

Аудит внутренних факторов

Необходимо провести полную диагности-ку сайта, выявить ошибки, обнаружить об-ласти с незадействованным потенциалом. После этого следует устранить недоработ-ки и подстроить сайт под требования и ре-комендации поисковых систем.

Составление технического задания на доработку сайта

Задача оптимизатора – подготовить пол-ное и понятное ТЗ для веб-программиста, проконтролировать выполнение рабо-ты и принять результат. Без привлечения программиста внести все правки удаст-ся только в том случае, если оптимизатор сам уже несколько лет работает с CMS-си-стемами, умеет управлять базами данных и знает языки программирования.

Доработка сайта под SEO

описание сайта в Яндекс.Каталоге или Description. Сниппет мо‑жет содержать разделы сайта, дату, новости, телефон и адрес компании. Привлекательный для пользователя сниппет может существенно увеличить посещаемость сайта.

СЧ

Аббревиатура расшифровывается как «среднечастотный». Этим термином обозначают нечто среднее между высокоча‑стотным и низкочастотным запросом.Сквозняк Сквозной называют ссылку, размещенную на многих страницах сайта. «Сквозняки» дублируются либо между всеми страницами сайта, либо внутри какого‑то раздела. Они, как правило, «зашиты» в шаблон.трафик Это синоним понятия «количество посетителей сайта».Семантическое ядро Подразумевается набор запросов, по которым продвигается сайт. Составление семантического ядра – очень важный, одна‑ко сложный и долгий процесс. Семантическое ядро для обыч‑ного интернет‑магазина содержит несколько тысяч запросов, для некоторых крупных сайтов их количество исчисляется десятками тысяч.тИЦ Аббревиатура расшифровывается как «тематический индекс цитирования». ТИЦ – это числовая величина, характери‑зующая авторитетность того или иного сайта, с точки зрения Яндекса. Рассчитывается ТИЦ на основании качества и ко‑личества ссылающихся на данный сайт источников с учетом динамики прироста этих ссылок.

Page 21: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 19

Лучше изначально делать сайт под  SEO, чем «натягивать» SEO на сайт. Но, к сожа-лению, культура создания сайтов под SEO развита у нас очень слабо: людей, способ-ных делать такие сайты, можно пересчи-тать по пальцам. Несмотря на то, что мно-гие компании, предоставляющие услуги комплексного интернет-маркетинга, уве-ряют, что  делают «заточенные» под  SEO сайты, на поверку оказывается, что лишь единицы могут похвастаться слаженной работой специалистов. В итоге часто на вы-ходе получается сайт, который оптимизато-рам приходится значительно дорабатывать под нужды SEO. Причем доработки могут быть очень серьезными, вплоть до сущест-венных изменений в структуре сайта и его программной части. Тем не менее без них об эффективном продвижении сайта в по-исковых системах говорить не приходится.

Этап 2: Продвижение сайта

Покупка рекомендательных ссылок

Работа над  внешними факторами в  це-лом сводится к  покупке рекомендатель-ных ссылок. На сегодняшний день с этим лучше всего справляются ссылочные агре-гаторы, позволяющие полностью автома-тизировать процесс: вам нужно лишь ука-зать запросы и настроить покупку ссылок.

Привлечение бесплатных рекоменда-тельных ссылок

Большое количество ссылок можно добыть бесплатно. На их поиск придется затратить немало времени, но, если подойти к это-му процессу с  умом, многие бесплатные ссылки будут иметь гораздо больший вес, чем покупные. Этот вопрос подробно ра-зобран на моем DVD-семинаре «Продви-жение сайта: источники привлечения вне-шних ссылок».

Повторный аудит внутренних факторов

Подготовка дополнительных текстов

Повторная доработка сайта под SEO

Не стоит тешиться иллюзией, будто ваш веб‑мастер, наделавший ошибок

при верстке и программировании сайта, исправит их по вашему новому ТЗ и не допустит ни одной новой оплошности. К примеру, он может поставить редирект 302 вместо 301. Посетителям от этого хуже не станет, но поисковые системы могут вас неправильно «понять», и для продвижения в поиске такое «пустяковое» различие может стать фатальным. Важно не просто проверить исполне‑ние рекомендаций по ТЗ, а провести полноценный повторный аудит, иначе новые ошибки могут остаться незамеченными. Приготовьтесь к тому, что аудит придется проводить несколько раз, и только после проведения контрольного анализа, подтверждающего, что ошибок больше нет, можно будет вздохнуть спокойно.

Page 22: Л.Гроховский - Руководство по внутренним факторам

20 Введение в продвижение сайтов

Из стратегического плана видно, насколь-ко важно воздействовать на  внешние и  внутренние факторы в  течение всего периода продвижения сайта. Среди опти-мизаторов бытует миф, будто достаточно один раз внести доработки на сайт на на-чальной стадии продвижения и можно за-крыть вопрос воздействия на внутренние факторы. В действительности все обстоит иначе. внутренние факторы также ну-ждаются в постоянном анализе и дора-ботке. Ниже рассмотрим основные при-чины такой необходимости.

Со временем текст сайта теряет уникальность

Контент «утекает» с сайта по разным кана-лам. Тексты воруют конкуренты, которые не  удосужились придумать что-то  свое, а также непорядочные «дорвейщики», за-рабатывающие на перепродаже трафика. Копии текста страницы множатся, а сайт теряет вес для поисковых систем. Чтобы не потерять позиции по ВЧ- и СЧ-запросам, время от времени нужно проводить анализ уникальности контента и при необходимо-сти обновлять его, переписывая тексты. Что касается продвижения по НЧ-запро-сам, воровство контента не наносит силь-ного ущерба текущим позициям, тем более что существует защитная методика, о ко-торой будет рассказано в одной из следую-щих глав.

После доработок сайта часто возника-ют новые проблемы

Не  стоит тешиться иллюзией, будто ваш веб-мастер, наделавший ошибок при  верстке и  программировании сай-та, исправит их  по  вашему новому ТЗ и не допустит ни одной новой оплошно-сти. К примеру, он может поставить реди-рект 302 вместо 301. Посетителям от этого хуже не станет, но поисковые системы мо-гут вас неправильно «понять», и для про-движения в  поиске такое «пустяковое» различие может стать фатальным. Важно

настоящее и будущее факторов ранжированияОсновная задача поиска – обеспечить точный и полный ответ на запрос пользова‑теля. Яндекс, равно как и другие поисковые системы, использует множество метрик качества поиска, например:• средняя позиция первого клика в выдаче,• доля некликнутых результатов.Любая модификация алгоритмов антиспама или ранжи‑рования не должна ухудшить качество поиска. В условиях существенного seo‑прессинга разработчики поисковых систем вынуждены постоянно искать новые качественные и незаспамленные сигналы, которые можно использовать в технологии антиспама или ранжирования.Поле факторов стремительно расширилось за последние несколько лет благодаря двум основным направлениям:1. Факторы, учитывающие поведение пользователей: продол‑жительность просмотра документов, ctr‑ссылок на сайт в выдаче поисковых систем, доля непоискового трафика на сайт и т. д.2. Факторы, учитывающие отношение пользователей к сайту: цитируемость и количество «лайков» в социальных сетях, количество твитов и ретвитов со ссылкой на сайт и пр. и пр.Модель, учитывающая поведение и отношение пользова‑телей к документам сайта, существенно более устойчива к спаму и позволяет более эффективно ранжировать документы в выдаче. Можно легко проиллюстрировать это сравнением топовых сайтов, отранжированных различными алгоритмами:

Top-20 websites by three different algorithmsNo PageRank TrustRank BrowseRank1 adobe.com adobe.com myspace.com2 passport.com yahoo.com msn.com3 msn.com google.com yahoo.com4 microsoft.com msn.com youtube.com5 yahoo.com microsoft.com live.com6 google.com passport.net facebook.com7 mapquest.com ufindus.com google.com8 miibeian.gov.cn sourceforge.net ebay.com9 w3.org myspace.com hi5.com10 godaddy.com wikipedia.org bebo.com11 statcounter.com phpbb.com orkut.com12 apple.com yahoo.co.jp aol.com13 live.com ebay.com friendster.com14 xbox.com nifty.com craigslist.org15 passport.com mapquest.com google.co.th16 sourceforge.net cafepress.com microsoft.com17 amazon.com apple.com comcast.net18 paypal.com infoseek.co.jp wikipedia.org19 aol.com miibeian.gov.cn pogo.com20 blogger.com youtube.com photobucket.com

Источник: BrowseRank: Letting Web Users Vote for Page Importance, https://research.microsoft.com / en‑us / people / tyliu / fp032‑liu.pdf

МненИе

Page 23: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 21

не просто проверить исполнение рекомен-даций по ТЗ, а провести полноценный по-вторный аудит, иначе новые ошибки могут остаться незамеченными. Приготовьтесь к тому, что аудит придется проводить не-сколько раз, и  только после проведения контрольного анализа, подтверждающе-го, что ошибок больше нет, можно будет вздохнуть спокойно.

Некоторые доработки являются экспериментальными

Многие доработки экспериментальны, особенно это касается тех факторов, ко-торые зависят от тематики. С первого раза крайне редко удается выбрать правиль-ные значения для  подобных факторов. Прибавьте к  этому нестабильность сре-ды: алгоритм Яндекса, использующий тех-нологии машинного обучения и  оценки асессоров, постоянно изменяется в рамках каждой тематики. В результате становит-ся очевидным необходимость экспери-ментов и  оценки результатов с  адапта-цией сайта к тематике. Только при таком раскладе можно рассчитывать на повыше-ние эффективности продвижения. Экспе-риментальный подход хорошо иллюстри-рует работа с плотностью ключевых слов, когда в написанном тексте мы увеличива-ем плотность ключевых слов и ждем ап-дейта. Если позиции падают – уменьша-ем плотность. Если растут – увеличиваем еще.

Конкуренты не стоят на месте

Выход в  топ для  многих оптимизаторов становится сигналом к прекращению ра-боты над сайтом. Между тем нельзя терять бдительность. Удержание позиций  – это постоянная борьба. Все хотят в топ, а в ито-ге попадает туда самый упорный и смыш-леный. Чтобы удержать позиции, нужно анализировать конкурентов и вовремя по-вторять их шаги.

Контент-менеджер может допускать ошибки

Как видно, алгоритм BrowseRank позволил существенно лучше отранжировать сайты с длинной пользовательской сессией, чем традиционный PageRank.Логично ожидать и дальнейшего расширения поля влияющих факторов.Вообще довольно эффективных критериев можно при‑думать весьма немало. Для решения одной из задач мне потребовалось придумать алгоритм фильтрации сплогов (спамовых блогов, созданных исключительно для размещения рекламных сообщений). Одна из найденных закономерностей: посты в спамовых блогах обычно получают гораздо меньше комментариев, чем посты в хороших блогах. Распределение количества блогов по среднему числу комментариев к посту выглядит так:

Данные получены на выборке в 30 тысяч блогов. Использо‑вание лишь одного параметра позволило отфильтровать спа‑мовые блоги с точностью и полнотой порядка 80 % при пороге ~7 комментариев на пост. Введение в алгоритм фильтрации дополнительных критериев позволит еще более эффективно отсеять спам.Собственно, в этом состоит один из серьезных трендов совре‑менного поиска – использование мономов, т. е. комбинаций факторов. Широкое применение мономов позволяет повысить эффективность алгоритмов и затрудняет реверс‑инжиниринг.Логичен вывод: любой сигнал, обеспечивающий достоверное отделение некачественного документа или сайта от качествен‑ного, будет использован.

Page 24: Л.Гроховский - Руководство по внутренним факторам

22 Введение в продвижение сайтов

Если сайт постоянно обновляется, кон-тент-менеджеры публикуют новости и до-бавляют товары в каталог, нужно отсле-живать, не допускают ли они критичных для SEO ошибок. А в случае, когда на сай-те периодически появляются новые разде-лы и меняется текстовое наполнение ста-рых, вероятность ошибок резко возрастает и почти равна 100 %.

Резюме: Хочу заметить, что ошиб-ка никогда не станет критической, если отыскать ее сразу после появле-ния, а не дотянуть до падения пози-ций сайта и лишь тогда приступить к исправлению упущений.

Page 25: Л.Гроховский - Руководство по внутренним факторам

П ри  перелинковке важно пони-мать, каким образом вес пере-дается между страницами. Сра-

зу хотелось бы отметить, что знание это весьма относительно, так как при переда-че веса от страницы к странице задейству-ется множество факторов и точного расче-та здесь не может быть по определению.

Доподлинно известно, что  при  расчете веса ссылки учитывается фактор ее «кли-кабельности», то есть та ссылка, по кото-рой пользователи активно кликают мы-шью, передает больший вес, нежели та, которая остается без  внимания посети-телей сайта. Это утверждение справедли-во не только в плане внутренней перелин-ковки: расчет влияния входящий внешних ссылок ведется по такой же схеме. Свою роль играет и  способ размещения ссыл-ки, в частности, важно, является ли ссыл-ка сквозной.

Как  ни  печально, но  при  всем желании вы не сможете рассчитать передаваемый ссылкой вес точно. Однако знание о спо-собах перелинковки позволит вам мак-симально задействовать потенциал вну-тренних ссылок с точки зрения технологии передачи ссылочного веса PageRank.

Некоторые оптимизаторы могут возра-зить: о  каком PageRank идет речь, если эта технология по нынешним меркам уже может быть отнесена к «каменному веку» эпохи интернет-продвижения? Да, техно-логии уже 10 лет, безусловно, она претер-пела немалые изменения, однако базовые принципы остались прежними. С  ними я вас и познакомлю в этой главе.

Глава 1Перелинковка страниц

Page 26: Л.Гроховский - Руководство по внутренним факторам

24 Перелинковка страниц

1.1. Как вычисляется PageRank и почему это так важно знать

Говоря о  поисковом предложении в  це-лом, я  стараюсь предлагать универсаль-ные решения, которые подходят для всех (или для большей части) популярных по-исковых систем. Однако иногда выбора ме-жду различными подходами не избежать, и в этом случае я вынужден отдавать при-оритет продвижению под поисковую си-стему Яндекс, доля поискового трафика ко-торой растет день ото дня.

В этой связи кажется странным, что я по-свящаю целую главу PageRank, кото-рый является атрибутом Google, но ни-как не Яндекс. Зачем я это делаю? Ответ прост: значение PR-страницы для  Ян-декса не важно, и тем не менее эта поис-ковая система тоже оперирует таким по-нятием, как вес страницы, и использует ссылки при ранжировании. Поскольку основа технологии PageRank представ-ляет собой базовые принципы ссылоч-ного ранжирования, вполне закономер-ным кажется следующий вывод: знание принципов расчета PageRank наилуч-шим образом поможет вам понять, как передается вес между страницами с точки зрения популярных поисковых систем. Итак, начнем.

Что все это значит на практике?

Чем глубже в структуре сайта расположе-на страница, тем меньший вес ей достается (помним о коэффициенте затухания). Вес страницы делится поровну между всеми ссылками на  странице. Соответственно, входные страницы должны получать мак-симальный вес, а  второстепенные стра-ницы – обеспечивать максимальный вес входным страницам. Добиться оптималь-ного соотношения можно, закрывая лиш-ние ссылки от индексации.

Существуют моменты, которые могут стать помехой для оптимизации:

В1998 году основатели компании Google Сергей Брин и Ларри Пейдж опубликовали

статью, в которой ввели понятие PageRank, как меру авторитетности страницы. Рейтинг страницы в этой модели зависит от количе‑ства ведущих на нее ссылок и от рейтинга ссылающихся страниц. Статическим весом является доля PageRank, передаваемая каждой ссылкой.Каждая рассмотренная модель является условным идеаль‑ным примером, не учитывающим, что на внутренние стра‑ницы могут стоять ссылки извне. Также результаты расчета статического веса внутренних страниц могут искажаться из‑за неравномерности индексации страниц со ссылками поисковым роботом.Большую роль играет и то, на скольких страницах сайта раз‑мещена ссылка. Одна сквозная, т. е. стоящая на всех страницах сайта ссылка перераспределит значения рангов внутренних страниц гораздо сильнее, чем одна ссылка с главной страницы.

*Sergey Brin and Larry Page. The Anatomy of a Search Engine http://www‑db.stanford.edu / pub / papers / google.pdf

МненИе

Page 27: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 25

• ограниченные возможности CMS,• обилие ссылок на крупном сайте,• устоявшаяся структура сайта.

1.2. Базовые схемы перелинковкиДля достижения целей вам необходимо ис-пользовать правильную схему перелин-ковки. На  примере некоторых базовых конструкций я покажу, каким образом мо-жет быть выстроена такая схема.

Сразу сделаю небольшую оговорку: лю-бая схема перелинковки условна и может быть масштабирована. Так, рассматривая схему, в  которой участвуют 10 страниц, мы можем подразумевать сайт с десятка-ми тысяч страниц, которые распределены по 10 основным подразделам. Таким обра-зом, мы построим пути передачи ссылоч-ного веса по главным разделам, а потом уже рассмотрим их по отдельности и про-считаем схему распределения веса в каж-дом разделе.

Планируя перелинковку, я исхожу из со-ображений оптимального использова-ния внутреннего ссылочного потенциала сайта, поэтому высокочастотные запросы в приведенных ниже схемах перелинковки двигаются на главную страницу, средне-частотные – на страницу раздела (обычно это страница первого уровня вложенно-сти), а низкочастотные – на страницы то-вара / услуги (обычно это страницы второ-го, третьего и ниже уровня вложенности).

Универсальной схемы перелинковки не су-ществует. Конкретный выбор зависит даже не от выбора группы запросов, а от осо-бенностей тематики. Существуют такие тематики, в которых основная доля посе-тителей приходится на 5 запросов, а все остальные запросы не принесут даже 10 % того трафика, что обеспечат эти 5 (напри-мер, тематика «такси»). В таких случаях, безусловно, оптимальной тактикой будет продвижение пяти выбранных запросов

Растолкованный PageRank1

PageRank – это методика измерения «важности» веб‑страни‑цы в Google. Когда все другие значимые факторы, такие как тег Title и ключевые слова, учтены, Google прибегает к PageRank и корректирует результаты ранжирования с расчетом, чтобы более важные сайты оказывались выше на странице результа‑тов поиска пользователя.Главный момент: никто точно не знает, как Google рас-считывает PR. Однако есть нюансы, которые стоит учитывать всегда:1. Сайт, который ссылается на забаненные сайты, может попасть в бан.

Будьте щепетильны в выборе исходящих ссылок. Не ссылай‑тесь на подозрительные сайты: каталоги ссылок («линко‑помойки»), забаненные ресурсы и т. п. Всегда проверяйте PR сайтов, на которые собрались сослаться, иначе есть вероятность, что Google выпишет вам «желтую карточку» – пенализирует сайт.2. Ссылки на тематические сайты с высоким PR и ссылки с таких сайтов очень важны.

Причем передаваемый ссылкой PR будет тем больше, чем бли‑же будет тематика страниц. Ссылки на полезные и интересные тематические ресурсы указывают поисковым машинам, что сайт имеет определенную ценность для пользователей Сети. Таким образом, проставляя ссылки только на качествен‑ные сайты, можно на несколько шагов опередить конкурентов.в целом порядок ранжирования в Google выглядит так:

1. Найти все страницы в индексе, которые соответствуют ключевым словам поиска.2. Отранжировать найденное в соответствии со «страничными факторами» (ключевыми словами и т. п.).3. Учесть текст ссылок на страницы.4. Скорректировать результаты, использовав данные PageRank.Принципы вычисления PageRank:

• PageRank – это число, характеризующее исключительно голосующую способность всех входящих ссылок на страницу и ту силу, с которой они эту страницу рекомендуют.

• Если страница А ссылается на страницу В, то страница А считает, что страница В важная.

• Если на страницу ведет много важных ссылок, то и ее ссылки на другие страницы становятся более важными.

• Внутренние ссылки учитываются при расчете веса PageRank для других страниц сайта.

ФАКт

1По материалам статьи «Растолкованный PageRank» в перево‑де Александра Садовского.

Page 28: Л.Гроховский - Руководство по внутренним факторам

26 Перелинковка страниц

• Страница не может голосовать так, чтобы другая страница стала столь же важна, как она сама. Таким образом, чем труднее добраться до какой‑то web‑страницы, тем меньшим авторитетом она обладает.

• Существует так называемый коэффициент затухания: страница всегда передает другой странице меньший вес, чем получает сама. Например, коэффициент равен 0,85. В таком случае передача веса после затухания равна 0,85. В том случае, если со страницы ведут две ссылки, передан‑ный по каждой из них вес будет равняться 0,425 и так далее.

• Во время одной итерации вычислений страница 1 дает странице 2 повышение в весе. Если страницы ссылаются друг на друга, то во время следующей итерации страни ‑ ца 1 получает увеличение веса, пропорциональное новому, увеличившемуся весу страницы 2.

• Вес PageRank, передаваемый на страницу А со страницы В, которая указывает на нее, куда‑нибудь уменьшается с каж‑дой ссылкой, которая находится на странице В. Это значит, что вес страницы – это, по сути, мера ее голоса. Страница может разделить этот голос между одной, двумя или более ссылками, но общая голосующая сила остается неизменной.

на главную страницу и выбор схемы пере-линковки под ВЧ-запросы.

Комплексное продвижение всего сайта

Эта схема наиболее универсальна и с ней приходится сталкиваться чаще всего. Она подходит в тех случаях, когда планируется продвигать все группы запросов (ВЧ, СЧ, НЧ), а  также тогда, когда шаблонизатор сайта не позволяет закрыть от индексации часть ссылок на конкретной странице. Не-даром эту схему перелинковки называют «все ссылаются на всех».

Принцип ее построения прост:

1. Главная страница ссылается на страни-цы всех разделов.

2. Страница каждого раздела ссылается на вложенные страницы, а также на глав-ную. Разделы перелинковываются между собой так, чтобы все они ссылались друг на друга.

3. Все вложенные страницы ссылаются на вышестоящий раздел и на главную стра-ницу. Вложенные страницы конкретного раздела ссылаются друг на друга. Все вло-женные страницы – на начальные страни-цы соседних разделов.

При таком раскладе вес равномерно уга-сает от  страницы 0 уровня вложенности к странице 2 уровня. Однако у этой схе-мы есть определенный недостаток: сай-ту, на котором применена такая методика перелинковки, при  продвижении ВЧ-за-просов сложно конкурировать с сайтами, где задействована схема перелинковки, предполагающая направление всего веса на главную страницу.

Рассмотрим такую схему на рис. 1.

Продвижение главной страницы под вЧ

В  условиях напряженной конкуренции используют главный «ход конем» – пере-линковку с  передачей веса на  главную страницу. Эта методика очень проста: каждая страница ссылается на  главную,

Page 29: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 27

и на каждую страницу, кроме главной, сто-ит всего одна ссылка (рис. 2). При такой перелинковке главная страница получает максимально возможный вес. Недостат-ки этой схемы очевидны: в плюсе остается только главная, а все остальные страницы получают очень низкий вес, поэтому кон-курировать по СЧ- и НЧ-запросам с сайта-ми, избравшими стратегию приоритета этих запросов, становится затруднительно.

Продвижение разделов под СЧ

Такая схема прекрасно подходит интернет-магазинам в тех отраслях, где люди ищут не название модели / товара, а целую то-варную группу. Например, когда пользо-ватель хочет купить индийскую космети-ку, он не ориентируется в брендах, а ищет просто «индийский шампунь» или «индий-скую пену для ванны», поэтому для мага-зина индийской косметики схема продви-жения разделов под СЧ будет идеальной.

Методика сводится к тому, что сайт соби-рает трафик по СЧ запросам и вес получа-ют страницы разделов. Принцип построе-ния этой схемы прост: все страницы сайта

Пара фактов о PageRank

«Чем меньше ссылок со страницы – тем меньше веса с нее утекает» –

думают многие оптимизаторы. Это миф. Взглянув на формулу PageRank нетрудно понять, что количество исходящих ссылок не имеет никакого значения. Одна она будет или 100 – со стра‑ницы уйдет одинаковое количество веса.Более того, даже если убрать все исходящие ссылки со страни‑цы, оставив входящие, это не приведет к накоплению на ней PageRank. Здесь вступают в игру методы обработки «висящих ссылок» (dangling links), и такие страницы могут вовсе не полу‑чить статического веса.Для больших сайтов бывает трудно построить модель и посчитать PageRank. Тогда можно руководствоваться двумя простыми принципами:a) страница имеет высокий PageRank, если количество входя‑щих ссылок кратно превышает количество исходящих,b) страница имеет высокий PageRank, если на нее ссылается страница предыдущего типа (высокий относительно среднего уровня. Разумеется, он будет меньше, чем в варианте «а»).Эти принципы не являются гарантией. Существуют исключе‑ния. Но в большинстве случаев они работают.

ФАКт

Рис. 1. Комплексное продвижение всего сайта

PageRank 1,65

PageRank 1,6

PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77

PageRank 1,6

Page 30: Л.Гроховский - Руководство по внутренним факторам

28 Перелинковка страниц

ссылаются на страницы разделов, и исклю-чительно на страницы разделов ссылают-ся страницы 2 и ниже уровня вложенно-сти. Выглядит такая схема перелинковки следующим образом (рис. 3).

Рис. 3. Продвижение разделов под СЧ

Рис. 2. Продвижение главной страницы под ВЧ

Продвижение СЧ

2

3 3 3 3 3 3

2

PageRank 3,86

PageRank 0,31 PageRank 0,31

PageRank 0,97

PageRank 0,97

PageRank 0,97

PageRank 0,97

PageRank 0,31 PageRank 0,31

Page 31: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 29

Продвижение внутренних страниц под НЧ

В  интернет-магазине, который торгует продукцией популярных брендов, поль-зователи, как правило, ищут товар по на-званию конкретной модели. В этом случае стоит задействовать схему перелинков-ки, продвигающую внутренние страницы под НЧ (рис. 4).

Пример тематики, для которой схема ока-жется чрезвычайно эффективной, – ноутбу-ки. Так, на момент написания книги «ноут-бук asus» по России искали 4 393 человека, а «ноутбук Asus k50c» – 722 человека. А ведь у бренда Asus широчайший модельный ряд. Несложно смекнуть, что  в  совокупности запросы с названием моделей могут дать больше трафика, чем более общий запрос «ноутбук Asus». Кроме того, поскольку эти запросы более точные, конверсия с них бу-дет на порядок выше, ведь посетитель най-дет именно ту модель, которую искал.

Если вы выбираете эту схему перелин-ковки, стоит придерживаться следующих правил: страницы карточек товаров / услуг ссылаются только друг на друга, нельзя от-давать вес страницам разделов.

Итак, мы рассмотрели основные схемы пе-релинковки. Помните о  масштабирова-нии: одной страницей на шаблоне по фак-ту может являться огромный раздел сайта.

Следует отметить, что комплексный под-ход к  продвижению является намно-го более эффективным, чем  методика,

Рис. 4. Продвижение внутренних страниц под НЧ

Следует отметить, что комплексный подход к продвижению является намного более

эффективным, чем методика, ориентированная лишь на один из сегментов запросов.

PageRank 1,3 PageRank 1,3

PageRank 0,21

PageRank 0,15

PageRank 0,21

PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3

Page 32: Л.Гроховский - Руководство по внутренним факторам

30 Перелинковка страниц

ориентированная лишь на  один из  сег-ментов запросов (ВЧ, СЧ, НЧ). Конечно, в  тематиках типа «такси» или  «пласти-ковые окна» выбор схемы перелинков-ки под  ВЧ-запросы полностью оправдан и даже является единственно верным, од-нако в других случаях я не рекомендую ис-пользовать строго схему продвижения од-ной группы. Каждый раз на этапе выбора схемы перелинковки нужно определиться с целями и особенностями тематики и уже исходя из этой информации модифициро-вать схему под свои нужды.

1.3. Локальные схемы перелинковкиЧтобы правильно строить схемы пере-линковки, важно разбираться в способах перелинковки локальной. В  данном слу-чае между собой связываются родствен-ные страницы одного уровня вложенно-сти (чаще всего вложенные в один раздел).

Кольцо

Популярная схема перелинковки, в кото-рой страницы последовательно связыва-ются между собой, замыкаясь в  кольцо: 1 —> 2 —> 3 —> 1.

Явный недостаток такой схемы сводится к тому, что в случае выпадения одной стра-ницы из индекса связь нарушается и вес теряет все кольцо. Экспериментально до-казано: в сравнении с другими схемами ло-кальной перелинковки кольцевая схема дает максимальный вес каждой странице.

Куб

Для реализации этой схемы страницы груп-пируются в два кольца, каждое из которых состоит из  количества страниц, кратно-го четырем. Считаем звенья одного коль-ца как «А» и второго как «B». Кольца пере-линковываются между собой перекрестно по принципу А1 —> B2 —> А3 —> B4 —> А1; B1 —> A2 —> B3 —> A4 —> B1; A1 —> A2 —> A3 —> A4 —> A1; B1 —> B2 —>

Допустимы случаи со значительным отклонением от предложенных чисел.

Например, существует рекомендация об ограниче‑нии количества исходящих ссылок со страницы. Когда мы работаем с особо крупными сайтами (новостными порталами, серьезными агрегатора‑ми), отклонения неизбежны.

Page 33: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 31

B3 —> B4 —> B1. Схема «Куб» на порядок сложнее «Кольца» и труднее поддается ав-томатизации, однако у нее есть серьезный козырь: даже если несколько звеньев выпа-дет из этой цепочки, вес все равно сохра-нится и цепь будет замкнута.

Звезда

Название это схемы не должно вас пугать. На самом деле все здесь предельно просто: «все ссылаются на всех».

1.4. Правила перелинковки

Мы рассмотрели основные схемы перелин-ковки. Теперь пора усвоить правила, кото-рые позволят не допустить ошибок и эф-фективно внедрить выбранную схему.

Важно понимать, что приведенные реко-мендации являются усредненными. Допу-стимы случаи со значительным отклоне-нием от предложенных чисел. Например, существует рекомендация об ограничении количества исходящих ссылок со страни-цы. Когда мы работаем с  особо крупны-ми сайтами (новостными порталами, серьезными агрегаторами), отклонения

Рис. 5. Куб

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

Page 34: Л.Гроховский - Руководство по внутренним факторам

32 Перелинковка страниц

неизбежны. Однако рекомендация все рав-но имеет силу, просто необходимо будет закрывать часть неважных ссылок от ин-дексации и  не  допускать дублирования их дублирования.

рекомендация 1: Не стоит использовать более 50 ссылок на одной странице .

Вес распределяется по  всем исходящим ссылкам: чем  больше ссылок, тем  мень-ший вес передает каждая из  них. Огра-ничивая количество исходящих ссылок, оптимизатор регулирует передаваемый вес, направляя его на нужные страницы. Так, вес страниц-шлюзов увеличивается, и они, в свою очередь, передают больший вес продвигаемым страницам.

Некоторые ссылки необходимо закрыть от индексации.

рекомендация 2: Ссылки нужно оформ-лять текстом .

Часто для сохранения фирменного стиля элементы меню, набранные в макете не-стандартным шрифтом, верстают картин-ками или анимацией. Поисковая система в этом случае не передает веса по ключе-вым словам, ведь она не может опреде-лить, к  какой группе запросов относит-ся ссылка. Для корректной передачи веса рекомендуется, пусть даже в ущерб эсте-тическим задачам, использовать тексто-вые ссылки с  содержанием ключевых слов. Текст должен быть оформлен на сай-те в явном виде, то есть присутствовать в HTML-коде страницы.

рекомендация 3: Желательно не дуб-лировать ссылки с одной страницы на другую .

Иллюстрация | Название модели

Иллюстрация | Технические характеристики

Иллюстрация | Краткое описание модели

Иллюстрация | Подробнее…

Что показывать поисковику

Часто структура сайта для пользователя входит в противоречие с SEO‑логи‑

кой. Тогда нужно как‑то спрятать ссылки от поисковика, оставив их для пользователя. Для этого есть несколько инструментов:<noindex>

Тег <noindex> работает для Яндекса. Google его не восприни‑мает. Ссылка, закрытая тегом <noindex>, передает статиче‑ский вес, но ее анкор не работает для Яндекса. Робот Яндекса по таким ссылкам переходит. Тег <noindex> может также использоваться внутри тега <a>, тогда мы сможем закрыть лишь часть анкора. Например:<a href=«http://site.ru»>ноутбуки <noindex>toshiba< / noindex>< / a>rel=nofollow

rel=nofollow блокирует передачу как статического веса, так и работу анкора. Однако его чрезмерное использование на сайте может вызвать проблемы с Google. Летом 2009 года Google презентовал изменение в концепцию работы nofollow на внутренних ссылках.Допустим, страница может передать 10 «поинтов» PageRank. С нее стоит 10 ссылок. 5 из них закрыты в nofollow.Как было раньше: по 5 ссылкам, не закрытым в nofollow, пе‑редается 10 «поинтов» веса, по 2 «поинта» на каждую. То есть вес с закрытых в nofollow ссылок перераспределяется в пользу незакрытых.Как стало: по 5 ссылкам, не закрытым в nofollow, передается лишь 5 «поинтов» веса, по 1 «поинту» на каждую. Вес больше не перераспределяется, а просто теряется.Роботы переходят по ссылкам с nofollow.Некоторые ссылки с nofollow все равно учитываются поискови‑ками. Например, ссылки с Твиттера.JavaScript

Закрытие ссылки в JavaScript позволяет скрыть сам факт нали‑чия ссылки на странице и таким образом избежать послед‑ствий для Google, описанных в предыдущем пункте.От Google не так просто что‑то скрыть. Но работающие вариан‑ты существуют:1. Использовать безатрибутную ссылку. В этом варианте мы фактически полностью убираем href из тега <a>.2. Использовать внешний скрипт с закрытием в robots.txt фай‑ла со скриптом. Этот вариант сложнее. В тексте html страницы мы только вызываем скрипт, который убран в отдельный js‑файл. Сам же файл закрыт в robots.txt. Таким образом, бот Google не может прочитать его и восстановить содержание страницы.

МненИе

Page 35: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 33

Особенно часто дублирование ссылок встречается в  каталоге товаров. В  нем обычно содержится три ссылки: изображе-ние товара, название модели и ссылка «по-дробнее» в описании. Рекомендуется до-пускать к индексации только одну ссылку, которая, как мы помним, должна быть тек-стовой и содержать ключевые слова. Если продвигаете только в Яндексе, ссылку «по-дробнее» можно закрыть в <NOINDEX>. К  ссылке картинкой лучше добавить ат-рибут rel=nofollow, поскольку иногда кар-тинки могут быть полезны: при грамотной оптимизации они могут привлечь на сайт дополнительный трафик.

рекомендация 4: URL страниц должны содержать ключевые слова .

По данным исследования «SEO-альманах», проведенного в конце 2010 года, ключевое слово в URL – один из наиболее значимых факторов ранжирования. Причем наиболь-шее значение имеет употребление ключе-вого слова в имени домена (www.key.ru), следующим по важности является употреб-ление ключевого слова в названии дирек-тории или страницы. Замечено, что ключе-вое слово на транслите получает больший рейтинг, чем его перевод на английский.

Проще говоря, не рекомендуется исполь-зовать URL вида:

http://www.site.ru / list.php? SECTION_ID=14,

http://www.site.ru / dir / content / 32 / .

URL должен содержать все слова, форми-рующие основные запросы:

http://www.site.ru / brand / model / modification / ,

http://www.mobile-phone.ru / nokia / 6700 / classic / .

По некоторым наблюдениям, для ранжи-рования конкретной страницы из разделе-ний « / » и «-» лучше выбрать последнее. Так, последний URL рекомендуется употребить

Второе применение JavaScript – это скрыть ссылку от Яндекса, оставив ее видимой для Google. Иногда это может понадобить‑ся. Сделать это несложно. Даже простейший document.write ставит Яндекс в тупик, и ссылка перестает работать. В то время как Google будет ее учитывать.

Page 36: Л.Гроховский - Руководство по внутренним факторам

34 Перелинковка страниц

в  виде http://www.mobile-phone.ru / nokia-6700-classic / . Конечно, этот подход не панацея, у него есть недостатки, напри-мер, отсутствие логической структуры сай-та: все страницы будут находиться в одной директории. Но для сайтов с небольшим количеством страниц такая подача URL весьма и весьма полезна.

рекомендация 5: Ссылки необходимо за-крывать от индексации .

Для  правильной передачи веса, необхо-димо на отдельных страницах закрывать разделы меню и прочие ссылки от индек-сации, оставляя лишь важные ссылки, поставленные для  передачи веса между страницами. К  сожалению, не  все CMS позволяют изменять блоки каждой стра-ницы, используя единый шаблон. В этом случае приходится совершать доработки в программной части сайта.

1.5. Способы перелинковкитип 1 . Меню

Меню – основной способ навигации на сай-те, представляющий собой блок сквозных ссылок. Как правило, главное меню дубли-руется на всех страницах сайта, за исклю-чением страниц версии для печати и не-которых других. Вес, передаваемый через подобные ссылки, не складывается, а счи-тается по иному принципу. Страницы раз-делов ранжируются иначе, нежели осталь-ные страницы сайта. В этой связи можно дать несколько рекомендаций:

Текст ссылки в меню должен содержать основные ключевые слова из продвигае-мых на вложенной странице. Например, для  страницы каталога мобильных теле-фонов текстом ссылки может быть «теле-фоны» / «мобильные телефоны» / «каталог телефонов», но никак не «каталог».

Оптимальнее всего использовать иерархичное меню. Нет смысла пытаться

Меню – основной способ навигации на сайте, представляющий собой блок

сквозных ссылок. Как правило, главное меню дублируется на всех страницах сайта, за исключе‑нием страниц версии для печати и некоторых других. Вес, передаваемый через подобные ссылки, не складывается, а считается по иному принципу. Страницы разделов ранжируются иначе, нежели остальные страницы сайта.

Page 37: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 35

поместить ссылки сразу на  все страни-цы сайта в главном меню. Достаточно со-слаться на основные разделы. Внутри раз-делов целесообразно поместить вложенное меню, направляющее на страницы следую-щих уровней.

Текст ссылки в  меню должен соответ-ствовать элементу URL и элементу нави-гационной строки вложенной страницы (если навигационная строка присутству-ет на сайте).

тип 2: Навигационная строка

Благодаря навигационной строке поль-зователь всегда в  курсе своего местона-хождения на сайте. Оптимизатору важно оформить навигационную строку пра-вильно. Для этого необходимо учесть не-сколько моментов:

В навигационной строке должна при-сутствовать ссылка на главную страни-цу, и лучше всего, если в тексте ссылки будут прописаны слова, соответствую-щие тематике сайта, а  не  просто слово «главная».

Желательно, чтобы каждая ссылка на-вигационной строки содержала наиболее конкурентное ключевое слово, продвигае-мое на данную страницу. Например:

http://www.mobile-phone.ru / nokia / 6700 / classic /

Сотовые телефоны –> Nokia –> Но-киа 6700 Classic

Фрагмент навигационной строки теку-щей страницы не  должен быть ссылкой. Помните о том, что страница не должна ссылаться на саму себя.

тип 3: HTML-карта сайта

HTML-карта сайта – это раздел навигации, который помогает пользователю быстро отыскать ссылки на необходимые ему стра-ницы сайта. HTML-карту вовсе не обяза-тельно использовать, но, если грамотно ее оформить, можно убить двух зайцев сразу:

Благодаря навигационной строке пользова‑тель всегда в курсе своего местонахожде‑

ния на сайте. Оптимизатору важно оформить навигационную строку правильно.

Page 38: Л.Гроховский - Руководство по внутренним факторам

36 Перелинковка страниц

сделать сайт еще удобнее для пользовате-ля и улучшить индексацию.

При создании HTML-карты стоит придер-живаться следующих принципов:

HTML-карта не должна включать в себя более 30 ссылок на внутренние страницы сайта.

Необходимо, чтобы HTML-карта содер-жала ссылки на основные разделы и наи-более важные страницы.

HTML-карта может быть многоуровне-вой и  состоять из  нескольких страниц, если общее количество страниц сайта пре-вышает 30.

тип 4: Многоуровневый каталог

Когда счет страницам идет уже не на де-сятки, нельзя обойтись без рубрикатора, который упростит поиск информации. Обычно для этих целей используется ка-талог товаров, который является также од-ним из основных способов перелинковки. При  организации каталога важно соста-вить HTML-шаблон так, чтобы единствен-ной индексируемой ссылкой осталось на-именование товара, оформленное текстом (об этом мы уже говорили выше).

тип 5: Подсказки

Подсказка  – это рекомендация, которую дает сайт своим посетителям, как правило, это сообщение об акции, скидках или со-путствующих товарах. Для удобства поль-зователей подсказки оформляются с  ис-пользованием ссылок, что предоставляет оптимизатору еще  одно поле для  манев-ров. При  перелинковке использование подсказок – очень эффективный инстру-мент, особенно если продвижение ведет-ся по низкочастотным запросам.

Часто используются блоки:

«Похожие товары», «Сопутствующие товары», «Акция», «Дополнительные услуги»,

Подсказка – это рекомендация, которую дает сайт своим посетителям, как правило,

это сообщение об акции, скидках или сопутствую‑щих товарах. Для удобства пользователей подсказки оформляются с использованием ссылок, что предоставляет оптимизатору еще одно поле для маневров.

Page 39: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 37

«Последние поступления».

Учитывая возрастающее значение пове-денческих факторов в  алгоритмах ран-жирования поисковых систем, мы можем предположить, что ссылка, по которой кли-кают, имеет большее значение, чем та, ко-торая никому не понадобилась. Опираясь на это, мы можем сделать вывод, что хоро-шо оформленный блок ссылок-подсказок будет тем лучше выполнять свое «seoшное» предназначение, чем удобнее для посети-телей будет навигация.

Популярные товары:

#IMG Марка + модель #1

#IMG Марка + модель #2

#IMG Марка + модель #3

#IMG Марка + модель #4

#IMG Марка + модель #5

тип 6: Перелинковка внутри текста

Перелинковка этого типа очень просто внедряется и в уже написанные тексты, но лучше закладывать ее еще на этапе их создания, чтобы хорошо продумать струк-туру текстов и сделать ссылки внутри них максимально полезными посетителю страницы. В качестве примера приведем текст из Википедии, где ссылки оформле-ны очень удобно для пользователей.

Автоматизировать подобную перелин-ковку достаточно просто. Для этого нуж-но написать несложный скрипт, который будет искать в текстах базы данных задан-ные ключевые слова и по определенному

Анар Бабаев, директор по развитию, Click.ru:

– Как вы думаете, почему поисковики учитывают внутренние ссылки?

Откуда это пошло?Разработчикам алгоритмов в свое время приходилось цепляться за каждый более‑менее осязаемый фактор. Но обсчет этих факторов накладывал определенные ограничения на их внедрение. Учет внутренних ссылок – не та‑кая уж сложная процедура.Программисты видели, как рядовые пользователи ставили внутренние ссылки. И задавались вопросом: если мы учитыва‑ем внешние ссылки, почему бы не учитывать и внутренние?Лучшие схемы перелинковки вы найдете не в учебниках по SEO и не на сайтах оптимизаторов, а там, где владельцы сайтов думают о своих посетителях:• Внутренние ссылки помогают продавать. Посмотрите на то‑

варную карточку магазина «Озон». Купившие этот товар также покупают… и текстовые ссылки на похожие книги. Ссылки на авторов, отзывы, издательства, каталог. Удобно, не правда ли?

• Внутренние ссылки заставляют пользователя не уходить с сайта. Зайдите на любую страницу Википедии. Вы читаете один материал, потом интересуетесь другим, смотрите дополнительную информацию, открываете изображения и всячески взаимодействуете с сайтом. Полезно?

• Внутренние ссылки помогают не потеряться. Вы наверняка встречали на многих ресурсах облака тегов, хлебные крош‑ки, сквозные ссылки и другие элементы навигации. Все это крайне необходимо! Такие фишки придуманы не оптимиза‑торами, поисковики же с удовольствием их учитывают.

Прежде чем вникать в «кольца», «пирамиды» и «звезды», подумайте о ваших посетителях. Как им было бы удобнее находить информацию на вашем сайте?

МненИе

Page 40: Л.Гроховский - Руководство по внутренним факторам

38 Перелинковка страниц

алгоритму, для некоторых из них дописы-вать анкоры.

тип 7: Перелинковка внутри текста с ис-пользованием якорей

Навигация по  большому тексту станет удобнее, если поставить несколько якорей вида <a name=…. В этом случае при пе-релинковке можно ставить ссылку сразу с указанием якоря в URL.

1.6. Составление текста ссылки для перелинковки

Правильная перелинковка позволяет управлять весом страниц, поэтому важ-но уделить внимание текстам ссылок. При составлении текстов ссылок для вну-тренней перелинковки нужно иметь чет-кое представление о  том, какие группы запросов являются целевыми для конкрет-ных страниц. В ваших интересах сделать так, чтобы как  можно большее количе-ство ссылок получило уникальный текст.

Рис. 6. http://ru.wikipedia.org/wiki/Nofollow

Page 41: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 39

По  возможности задействуйте больше ключевых слов.

В  качестве текста ссылок для  коммерче-ских тематик рекомендуется использовать следующие конструкции:

прямая форма запроса (например, «но-утбук Acer Aspire 5551g»),

прямая форма запроса + образующие слова («купить ноутбук Acer Aspire 5551g»).

Кроме того, при подборе запросов важно определить часть запроса, формирующую группу. В нашем примере это – 5551g, так как все запросы, содержащие в себе этот фрагмент, будут актуальны для продвиже-ния на данную страницу. Поэтому к реко-мендуемым конструкциям мы добавляем еще следующую:

часть запроса + образующие слова («ку-пить Acer Aspire 5551g»).

Подобные комбинации, сгенерирован-ные из  полного шлейфа НЧ-запросов, составляют большие списки уникаль-ных текстов ссылок для  внутренней перелинковки.

При  перелинковке важно выдерживать баланс. Если множество ссылок содержит одинаковый текст, это множество может учитываться иначе, ссылки расценивают-ся как сквозные. Также рассматриваются как  сквозные такие ссылки, когда каж-дая страница сайта ссылается на данную с  различным текстом. Для  перелинков-ки не стоит задействовать все страницы сайта. И не нужно каждый раз использо-вать различные тексты ссылки: несколь-ко повторений одного текста (до 10) впол-не достаточно, если ссылка не  является сквозной.

Важно выдержать определенный по-рог так, чтобы число повторений не вы-шло на  уровень сквозных ссылок, ина-че они могут сильно перераспределить вес внутри сайта. В «СайтРепорт» поиск

При перелинковке важно выдерживать баланс. Если множество ссылок содержит

одинаковый текст, это множество может учиты‑ваться иначе, ссылки расцениваются как сквозные. Также рассматриваются как сквозные такие ссылки, когда каждая страница сайта ссылается на данную с различным текстом. Для перелинковки не стоит задействовать все страницы сайта.

Page 42: Л.Гроховский - Руководство по внутренним факторам

40 Перелинковка страниц

порога сквозных ссылок реализован в виде графика.

50

100

150

1.7. Создание модуля для перелинковкиЛегко организовать перелинковку, если сайт состоит из  20–30 страничек, но как быть, если продвигать нужно интер-нет-магазин с тысячами, а то и десятками тысяч товаров? Задача непростая. Мне хва-тило материала, чтобы создать отдельный семинар, посвященный этому вопросу. Ос-новных типов четыре: портал, интернет-магазин, корпоративный сайт, каталог.

Портал

Для перелинковки на портале можно ис-пользовать блоки:

«Другие статьи этого автора»,

«Другие статьи в этой категории»,

«Другие статьи за сегодня»,

«Самые популярные статьи за сегодня»,

«Последние статьи».

Контекстная перелинковка с  простанов-кой ссылок в  тексте статьи на  порталах воспринимается как  естественная, ее тоже нужно непременно использовать (смотрите, например, как это реализова-но в Википедии).

Следует понимать, что  при  перелинковке ссылки не  должны меняться со  временем, тем более не стоит проставлять их в динами-ческих блоках, которые трансформируются при каждом обновлении страницы. Не всегда

Контекстная перелинковка на страницах интернет‑магазина не очень эффективна,

вероятность клика по таким ссылкам низкая. А вот потенциал навигационной строки можно задей‑ствовать по полной. Каталог товаров должен быть составлен безупречно: ссылки на странице списка товаров ни в коем случае нельзя дублировать, все дубликаты нужно закрыть для индексации.

Page 43: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 41

бывает оправдано и использование навига-ционной строки, поскольку основной по-ток посетителей приходится на  НЧ-запро-сы, а  навигационная строка  – инструмент повышения веса страниц разделов.

Интернет-магазин

Для перелинковки на сайте интернет-ма-газина можно использовать блоки:

«Другие товары в этой ценовой категории»,

«С этим товаром смотрели»,

«Сопутствующие услуги / товары»,

«Другие товары этого производителя»,

«Другие товары этой группы».

Контекстная перелинковка на страницах интернет-магазина не очень эффективна, вероятность клика по таким ссылкам низ-кая. А вот потенциал навигационной стро-ки можно задействовать полностью.

Каталог товаров должен быть составлен безупречно: ссылки на  странице спис-ка товаров ни в коем случае нельзя дуб-лировать, все дубликаты нужно закрыть для индексации.

Наглядный пример подобного модуля пе-релинковки вы можете наблюдать на сайте www.mobiguru.ru (рис. 7). Здесь мы видим

Рис. 7. www.mobiguru.ru

Page 44: Л.Гроховский - Руководство по внутренним факторам

42 Перелинковка страниц

два блока (слева и  сверху) со  ссылками на карточки популярных товаров.

Корпоративный сайт

Корпоративные сайты редко достигают та-ких масштабов, чтобы для перелинковки страниц потребовалась автоматизация. Если  же такая необходимость возникла, лучше всего использовать контекстную перелинковку.

Каталог

По  сути, каталог  – это уменьшенная мо-дель интернет-магазина, следовательно, в  продвижении каталога можно исполь-зовать все блоки, которые актуальны для последнего:

«Другие товары в этой ценовой катего-рии»,

«С этим товаром смотрели»,

«Сопутствующие услуги / товары»,

«Другие товары этого производителя»,

«Другие товары этой группы».

По сути, каталог – это уменьшенная модель интернет‑магазина, следовательно,

в продвижении каталога можно использовать все блоки, которые актуальны для последнего.

Page 45: Л.Гроховский - Руководство по внутренним факторам

Н а сайте могут наличествовать дуб-ликаты контента – страницы, пол-ностью или частично идентичные

друг другу. Одной из  главных проблем поисковых систем является устранение дубликатов.

2.1. Чем вредны дубликатыСкорее всего, вы уже наслышаны о мусор-ных сайтах, которые содержат автоматиче-ски созданные документы, дорвеи. Созда-ются дорвеи в поистине промышленных масштабах, а живут за счет продажи трафи-ка. Наполняются такие сайты легко и бы-стро  – ворованным контентом или  сге-нерированными текстами. Понятно, что для пользователей дорвеи не представ-ляют ценности, кроме того, они занимают серверные ресурсы поисковых систем, по-этому последние стремятся исключать по-добные сайты из индекса.

Проблема дубликатов схожа с проблемой дорвеев. Для поисковых систем это стра-ницы, захламляющие Интернет, ведь они не содержат уникального контента. Зна-чит, нет никакого смысла в их индексации.

Со стороны ПС проблема дубликатов, с од-ной стороны, схожа с  проблемой дорве-ев – ибо какой смысл индексировать не-уникальный контент. С  другой стороны, неуникальный контент  – это не  всегда приговор. Поговорим об этом во врезке. Однако, особенно это касается нечетких дубликатов, поисковик не  может забы-вать, что  иногда на  базе неуникального

Глава 2Устранение дубликатов

Page 46: Л.Гроховский - Руководство по внутренним факторам

44 Устранение дубликатов

контента возникают сервисы, обладаю-щие так называемой «добавочной стои-мостью», которой они могут наделять не-уникальный контент. Хорошим примером таких сервисов является рейтинг блогов и новостей.

Масштабы этой проблемы часто недооце-нивают. Мне встречались «прекрасные» сайтики, содержащие по  40 дубликатов каждой страницы. Подобный сайт зани-мает у поисковой системы в 40 раз боль-ше ресурсов, чем требуется. Казалось бы, почему не проиндексировать все? Простой подсчет: для индексации и обработки мил-лиарда страниц, допустим, понадобится 100 серверов, а если каждая страница име-ет хотя бы по три дубликата? Как видите, решение проблемы дубликатов позволяет уменьшить затраты на серверные мощно-сти в несколько раз.

Чем вредны дубликаты для оптимизатора?

1. Ссылочный вес размывается.

Вместо того, чтобы увеличивать значение одной страницы, мы рассеиваем ссылки по  нескольким страницам-дубликатам, в результате чего каждый из этих дубли-катов получает меньший вес.

2. Входной может оказаться не та копия, на которую стоят ссылки.

Нередко бывает, что после очередного ап-дейта дубликат вытесняет в выдаче про-двигаемую страницу, и та теряет позиции.

3. Контент теряет уникальность.

Дублированный контент понижает сте-пень уникальности всех страниц, на кото-рых он размещен. Страница с уникальным контентом имеет существенно больший вес.

4. Поскольку дубликаты исключаются из поиска, из него может исчезнуть нуж-ная нам страница.

Важной областью информационного поиска является поиск дубликатов

документов. От того момента, как документ первый раз индексируется поисковой систе‑мой, и до того, как этот документ появится в основных результатах поиска, содержимое документа многократно оценивается и сравнивается с содер‑жанием индекса ПС.

МненИе

Page 47: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 45

В борьбе с дубликатами поисковые систе-мы могут запросто исключить из  своей базы те страницы, которые мы продвига-ем, и оставить дубликат, который не име-ет ни входящих внешних ссылок, ни осо-бых бонусов по внутренней оптимизации.

Итак, проблема дубликатов в целом сво-дится к двум моментам:

поисковые системы часто исключают из поиска значимые страницы, поскольку не способны корректно определять, какой из дубликатов имеет большую ценность;

сайт с  огромным количеством дуб-лированного контента индексируется не полностью.

2.2. Классификация дубликатовДубли бывают полными и  частичными. Полный дубликат – это абсолютно иден-тичные страницы, частичный – страницы, совпадающие не полностью. В зависимо-сти от  типа дубликата выбирают способ его устранения: полные дубликаты за-крывают через robots.txt и 301 редирект, для устранения частичных дублей прихо-дится делать правки на страницах.

Полные дубликаты

1 . Фокусы с URL

В индексе поисковых систем должна нахо-диться только одна версия главной страни-цы сайта, все ее дубликаты нужно удалить либо закрыть для индексации.

Например, мы имеем варианты такого вида:

http://www.site.ru / http://www.site.ru / index.phphttp://www.site.ruhttp://site.ru / https://www.site.ru /

Из  вышеперечисленных конструкций оптимально использовать для  продви-жения первую (http://www.site.ru / ).

Встречаются «прекрасные» сайтики, содержащие по 40 дубликатов каждой

страницы. Подобный сайт занимает у поисковой системы в 40 раз больше ресурсов, чем требуется. Казалось бы, почему не проиндексировать все? Простой подсчет: для индексации и обработки миллиарда страниц, допустим, понадобится 100 серверов, а если каждая страница имеет хотя бы по три дубликата? Как видите, решение проблемы дубликатов позволяет уменьшить затраты на серверные мощности в несколько раз.

Page 48: Л.Гроховский - Руководство по внутренним факторам

46 Устранение дубликатов

Для  устранения остальных применя-ем 301  редирект и  настройки robots.txt (в  случае с  конструкциями вида https://www.site.ru / ).

2 . Смена директорий

Золотое правило гласит: каждая страница должна быть доступна только по одному адресу. Нельзя, чтобы адреса варьирова-лись таким образом:

http://www.site.ru / dir1 / dir2 / http://www.site.ru / dir2 / dir1 /

Пользователь может переходить по пути «фотоаппараты» –> Canon или Canon –> «фотоаппараты», и в любом случае адрес страницы должен быть одним, к примеру, http://www… / fotoapparat / canon / .

3 . Формирование URL

При  формировании URL нужно по-добающим образом настроить сер-вер: переменных в  «урле» отображать-ся не  должно. Использование URL типа http://www.site.ru / index.php?dir=1231&id =313  – ошибка. Корректным будет упо-требление http://www.site.ru / dir / 1231 / id / 313.

4 . Идентификатор сессий

Идентификатор сессий, который мы можем наблюдать в  примере URL http://www.site.ru / dir / 1231 / id / 313.php?PHPSESSID=2123, указывает на сайт, который фактически содержит бесконеч-ное количество дубликатов каждой стра-ницы. Эти страницы при очень большом везении попадают в индекс поисковых си-стем, создавая копии. Если сессии невоз-можно заменить чем-то еще, нужно закры-вать их через настройки robots.txt.

5 . Уязвимость 404 ошибки

Когда мы пытаемся открыть несущест-вующую страницу, то  чаще всего видим заглушку. Что «видит» в этом случае сер-вер? Это зависит от настроек кода ответа. Если в них прописано 404, сервер решает,

Дубли бывают полными и частичными. Полный дубликат – это абсолютно

идентичные страницы, частичный – страницы, совпадающие не полностью. В зависимости от типа дубликата выбирают способ его устранения: полные дубликаты закрывают через robots.txt и 301 редирект, для устранения частичных дублей приходится делать правки на страницах.

Page 49: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 47

что такой страницы не существует. Такой подход наиболее правильный.

К сожалению, вместо этого нередко мож-но встретить код ответа 301 («страница перемещена навсегда») или 200 («все хо-рошо»). И если в первом случае страницы просто склеиваются, то во втором случае создается дубликат. Наиболее проигрыш-ный расклад выглядит так: на сайте для не-существующей страницы отдается код от-вета 200, а вместо заглушки отображается главная страница. В  этом случае может быть поставлено любое количество вне-шних ссылок на несуществующие страни-цы, каждая из которых продублирует глав-ную и размоет ее вес.

6 . Лишние переменные

Проблема наличия лишних переменных наиболее актуальна для  универсальных коммерческих CMS. Лишние перемен-ные образуются, например, в  тех случа-ях, когда посетитель указывает дополни-тельный параметр поиска, сортировки или отображения, который не влияет на со-держание страницы, но  может учиты-ваться CMS. Через настройки robots.txt необходимо добиться того, чтобы URL ни  в  коем случае не  имели вид типа http://www.site.ru / dir / 1231 / id / 313.php?mode=2&coin=3 (корректным будет вариант http://www.site.ru / dir / 1231 / id / 313.php?mode=4).

7 . реф-ссылки

В  электронной коммерции распро-странена практика создания партнер-ских программ, способствующих про-движению товара или  услуги. Один из  принципов работы такой программы заключается в  том, что  партнер распро-страняет по  своим каналам ссылку, со-держащую его личный ID. Регистрация каждого нового пользователя по  такой ссылке приносит партнеру вознагражде-ние. Выглядит реф-ссылка примерно так:

При прочих равных более уникальная страница выигрывает у страницы с менее

уникальным наполнением. А сайт, содержа‑щий много неуникальных страниц, может в какой‑то момент быть признан менее авторитетным.

МненИе

Page 50: Л.Гроховский - Руководство по внутренним факторам

48 Устранение дубликатов

http://www.site.ru / dir / 1231 / id / 313.php?ref=1323. Понятно, что  использова-ние реф-ссылок становится причиной по-явления дубликатов. Устранить их можно также через настройки robots.txt. (в данном примере нужно дописать Disallow: *?ref).

Частичные дубликаты

1 . Сортировка

На сайтах, содержащих каталог, для удоб-ства посетителей предлагаются различные виды сортировки: по цене, по количеству отображаемых элементов на  странице, по дате добавления, по рейтингу, по ка-тегории и т. п. Пользователям становится действительно удобно, а вот у оптимиза-торов появляется проблема: сортиров-ка создает мусорные для  поисковых си-стем страницы, не содержащие никакого уникального контента. Чтобы избавиться от полудубликатов, в некоторых случаях содержимое таких страниц закрывают че-рез метатеги noindex, nofollow, в других – к URL приписывают директорию или пе-ременную, которая закрывается через robots.txt.

Иногда, правда, продвижение страниц сор-тировок в поисковых системах – единствен-но верная стратегия. В этом случае бороть-ся с полудубликатами не приходится.

2 . Частичное дублирование контента

По данным исследования «SEO-альманах 2010», проведенного в  рамках проекта «ТопЭксперт.РФ», уникальность контен-та – один из важнейших факторов ранжи-рования. Некоторые оптимизаторы упор-но игнорируют этот момент, в  то  время как на сайте есть области, таящие в себе большой потенциал для поискового про-движения. В  этой связи можно дать не-сколько советов:

На многих сайтах есть дубликаты в те-гах Description, Title, H1, Keywords. Уника-лизировав их содержимое на своем сайте,

По данным исследования «SEO‑альманах 2010», проведенного в рамках проекта

«ТопЭксперт.РФ», уникальность контента – один из важнейших факторов ранжирования. Некото‑рые оптимизаторы упорно игнорируют этот момент, в то время как на сайте есть области, таящие в себе большой потенциал для поискового продвижения.

Page 51: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 49

вы сделаете отличный вклад в продвиже-ние ресурса.

Весь дублирующийся контент в блоках типа «Схожие предложения» необходи-мо скрывать через <NOINDEX>, оставляя доступными для поисковых роботов лишь ссылки и наименования товаров.

Страницы списка анонсов должны со-держать уникальный контент, а  не  фор-мироваться из  текстов, частично дубли-рующих полное содержание статей.

Схожие страницы типа «Оставить заяв-ку» вообще не имеют значения, а потому индексироваться не должны.

Если контента на сайте нет или его мало, стоит прибегнуть к услугам копирайтеров, или сгенерировать тексты машинным пу-тем, или подумать о том, как привлечь по-ток User Generated Content.

Рассмотрим некоторые частные случаи.

2.3. Кейсы1 . Компания «БЕСт-Недвижимость»,

www .best-realty .ru

По  данным Яндекс.Вебмастер, на  мо-мент анализа всего роботом загружено 37 684 страниц, а для поиска из них доступ-но лишь 795. Чем объяснить разрыв в бо-лее чем 50 раз между количеством загру-женных и доступных для поиска страниц? Почему Яндекс исключил около 36 тысяч страниц из своей базы?

На момент проведения анализа на сайте компании было обнаружено большое ко-личество дубликатов:

1 .1 . Дубликаты сортировки

На www.best-realty.ru используется слож-ная система обработки баз данных, ко-торая все переменные помещает в  URL, и  в  результате последний выглядит сле-дующим образом:

Если контента на сайте нет или его мало, стоит прибегнуть к услугам копирайтеров,

или сгенерировать тексты машинным путем, или подумать о том, как привлечь поток User Generated Content.

Page 52: Л.Гроховский - Руководство по внутренним факторам

50 Устранение дубликатов

/ services / buy / flat / ?search_center_lat= 0&search_center_lng=0&search_radius= 0&halt_id=34&search_metro=0&is_moscow=true&search_city=0&search_fmt=0&search_mfb=1&search_price= 0&search_currency=1&search_proc= 10&search_s_min=13&search_s_max= 9936&search_ls_min=8&search_ls_max= 6000&search_ks_min=1&search_ks_max= 52&go=&go2=false.

При  малейших изменениях в  настрой-ках отображения результатов поиска URL трансформируется при  сортировке по цене, алфавиту и т. д. CMS работает та-ким образом, что возникает большое ко-личество дубликатов, вследствие чего не-которые страницы выпадают из индекса. Для решения этой проблемы инструкция-ми в robots.txt не обойтись. Возникает не-обходимость внести правки в саму струк-туру сайта, но  изменить существующую схему формирования URL невозможно из-за специфики работы базы данных. По-этому на сайте www.best-realty.ru пробле-ма с дубликатами решена нестандартно:

все страницы, содержащие переменные, закрыты от индексации;

создан дублирующий раздел, построен-ный на  ЧПУ («человекопонятном урле») с содержанием ключевых слов в адресах страниц.

В результате нам удалось добиться устра-нения всех дубликатов. Теперь URL сайта имеют вид:

http://www.best-realty.ru / buy / flat / moscow / aviamotornaya /

http://www.best-realty.ru / buy / flat / moscow / krasnokazarmennaya_ulitsa / id1120801 /

2 .1 .  «Посмотреть другие объекты в ра-диусе 1 км»

На  странице каждого объекта размеще-на ссылка «Посмотреть другие объекты

При малейших изменениях в настройках отображения результатов поиска URL

трансформируется при сортировке по цене, алфавиту и т. д. CMS работает таким образом, что возникает большое количество дубликатов, вследствие чего некоторые страницы выпадают из индекса. Для решения этой проблемы инструк‑циями в robots.txt не обойтись.

Page 53: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 51

в  радиусе 1 км». Понятно, что  подобная страница дублирует контент, посколь-ку создает дополнительную страницу сортировки.

В результате преобразований, описанных в п. 1, эта проблема была также устранена.

3 .1 . «оставить заявку на объект»

Компания «БЕСТ-Недвижимость»  – один из крупнейших риелторов на российском рынке, ее сайт содержит информацию о нескольких тысячах объектов. На стра-нице каждого из  них есть ссылка «Оста-вить заявку на объект», которая направ-ляет посетителя на страницу заявки. Все страницы этого рода идентичны, но каж-дая имеет уникальный URL, в результате чего на сайте появляется несколько тысяч дубликатов.

Проблема решена очень просто: все по-добные страницы запрещены к  индекса-ции в robots.txt.

2 . ММЦ «онКлиник», www .onclinic .ru

После анализа сайта выяснилось, что по-лезных страниц всего около 4 500. При этом реально на сайте существовало на момент исследования порядка 95 000 страниц. Дуб-ликаты появились из-за ошибок, допущен-ных разработчиками сайта.

2 .1 .  разделы «Консультации», «терми-ны», «отзывы»

На www.onclinic.ru существуют 3 дополни-тельных информационных раздела: «Кон-сультации», «Термины», «Отзывы». В эти разделы посетитель может попасть двумя путями: посетив их полную версию через главное меню сайта или посетив разделы медицинских услуг, где эти блоки пред-ставлены частями (например, в  разделе «Стоматология» вложены блоки, в  кото-рых представлены консультации, расши-фровка терминов и отзывы только по этой группе медицинских услуг). Каждый путь

Компания «БЕСТ‑Недвижимость» – один из крупнейших риелторов на российском

рынке, ее сайт содержит информацию о нескольких тысячах объектов. На странице каждого из них есть ссылка «Оставить заявку на объект», которая направляет посетителя на страницу заявки. Все страницы этого рода идентичны, но каждая имеет уникальный URL, в результате чего на сайте появляется несколько тысяч дубликатов.

Page 54: Л.Гроховский - Руководство по внутренним факторам

52 Устранение дубликатов

имеет свой URL, из-за этого на сайте по-явились дубликаты.

Для  решения проблемы полные версии разделов «Консультации», «Термины», «От-зывы» закрыты от индексации в robots.txt. Индексируемыми остались только их ча-сти, привязанные к конкретным медицин-ским направлениям.

2 .2 . Список анонсов

Элементы разделов «Консультации», «Тер-мины», «Отзывы» состоят из двух частей: вопрос-ответ, автор-отзыв, термин-тол-кование. Структура этих разделов состо-ит из страниц списка анонсов и страниц полного контента. Однако содержание каждого элемента представлено в полном объеме как на странице списка анонсов, так и на странице полного контента. В ре-зультате контент в полном объеме дубли-руется между страницами сайта.

Проблема решена следующим образом: страницы полного контента удалены за ненадобностью.

3 .  Магазин итальянской мебели, www .eurointerier .ru

В индексную базу попало более 12 500 стра-ниц, однако на сайте всего около 1 000 стра-ниц, полезных для посетителей, все осталь-ные  – дубликаты, которые появились частично вследствие недоработок на эта-пе создания сайта, а частично позже – в ре-зультате ошибок, допущенных веб-масте-ром в ходе внесения изменений на сайте.

Этот случай – яркий пример того, как по-сле доработки сайта под SEO, он стано-вится еще  менее пригодным для  про-движения. Хочу снова подчеркнуть, что  создание ТЗ на  доработку сайта и контроль его исполнения, а также по-вторный анализ сайта – прямая обязан-ность квалифицированного SEO-специа-листа. В  моей практике было всего два

Существует два простых способа борьбы с дубликатами: использование 301 реди‑

ректа и инструкций в robots.txt. К сожалению, простое решение позволяет свести на нет только проблему полных дубликатов, и то не всегда: если у вас крупный сайт, прописывать сотни строк в инструкции robots.txt, чтобы закрыть от индекса‑ции десятки, а возможно, и сотни тысяч страниц, не лучший выход. Хотя можно запретить с помо‑щью метатегов.

Page 55: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 53

случая, когда в процессе доработки сай-та, в еб-программист не создавал новых ошибок. Дело в том, что у веб-програм-миста есть свое видение хорошего сай-та, которое часто отличается от видения поисковой системы. А поскольку специ-альной подготовки в области SEO у про-граммиста нет, он не в состоянии само-стоятельно сделать сайт совершенным в плане продвижения.

Итак, в случае www.eurointerier.ru стояла задача заменить URL на ЧПУ. После прове-дения доработок каждая из страниц была доступна по трем адресам:

http://www.eurointerier.ru / index.php?catalog=1&brand= 34&model=231

http://www.eurointerier.ru / catalog / 1/ brand / 34 / model / 231 /

http://www.eurointerier.ru / catalog / gostinie / a_r_arredamenti / barnaya_ stoyka_opera /

Так, все страницы были доступны при из-менении порядка частей URL:

http://www.eurointerier.ru / catalog / a_r_arredamenti / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / a_r_arredamenti / barnaya_stoyka_opera / gostinie /

http://www.eurointerier.ru / catalog / gostinie / a_r_arredamenti / barnaya_ stoyka_opera /

http://www.eurointerier.ru / catalog / gostinie / barnaya_stoyka_opera / a_r_arredamenti /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera / a_r_arredamenti / gostinie /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera / gostinie / a_r_arredamenti /

Кстати, в панели Яндекс.Вебмастера есть весьма полезный инструмент, проверяю‑

щий корректность составления robots.txt (на дан‑ный момент Clean‑param он не читает, лишь Disallow). Добавляете сайт в панель, затем щелкаете «Настройка индексирования» и «Анализ robots.txt». После чего вам требуется в «Список URL» добавить URL, которые нуждаются в провер‑ке: будут ли они индексироваться при введенном robots.txt или не будут.

Page 56: Л.Гроховский - Руководство по внутренним факторам

54 Устранение дубликатов

Страницы карточки товара отобража-лись даже после удаления части URL с  названием товарной группы или фабрики:

http://www.eurointerier.ru / catalog / a_r_arredamenti / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / a_r_arredamenti / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera /

Прибегнув к  элементарным арифмети-ческим подсчетам, получаем, что каждая страница карточки товара имела 30 дуб-ликатов. Кроме того, на сайте были дуб-ли сортировки и  частичные дубликаты в каталоге.

Подобные проблемы решаются доработ-кой CMS, цель которых проста: каждая страница должна быть доступна толь-ко по одному адресу. В случае изменения правил формирования URL необходимо ис-пользовать 301 редирект. Страницы сорти-ровки закрываются от индексации.

2.4. Способы устранения дубликатов

Существует два простых способа борьбы с дубликатами: использование 301 реди-ректа и инструкций в robots.txt. К сожале-нию, простое решение позволяет свести на  нет только проблему полных дубли-катов, и то не всегда: если у вас крупный сайт, прописывать сотни строк в инструк-ции robots.txt, чтобы закрыть от индекса-ции десятки, а возможно, и сотни тысяч страниц, не лучший выход. Хотя можно за-претить с помощью метатегов.

Сложное решение сводится к  доработ-ке сайта: от  использования метатегов

Даниил Маул:

– Действительно, по наличию дублей в индексе порой можно отличить

оптимизатора‑новичка от профессионала. Проверку на дубли проще всего осуществить следующим образом. Если у вас интернет‑магазин, имеющий плюс ко всему раздел статей, то заходим на разные типы страниц (категория товаров, товары, статьи, главная), копируем от каждого из типов кусок текста (в рамках одного предложения, допустим, несколько слов) и вбиваем его в виде цитаты с кавычками в поиск по вашему домену в Яндексе.Если же в индексе вашего сайта в пределах ХХХ страниц, то же‑лательно обойти весь список страниц, которые видит Яндекс. Если в этом списке видны дубли или же просто бесконтентные страницы, то их нужно или удалить, или поставить запрет в robots.txt. Запрет в этом файле можно сделать двумя метода‑ми: или Disallow, или Clean‑param (второй метод более новый). Как говорит саппорт Яндекса, срабатывает Clean‑param медленнее. Ну, а действие Disallow будет заметно уже после первой переиндексации и последующего апдейта Яндекса.Кстати, в панели Яндекс.Вебмастера есть весьма полезный инструмент, проверяющий корректность составления robots.txt (на данный момент Clean‑param он не читает, лишь Disallow). Добавляете сайт в панель, затем щелкаете «Настрой‑ка индексирования» и «Анализ robots.txt». После чего вам требуется в «Список URL» добавить URL, которые нуждаются в проверке: будут ли они индексироваться при введенном robots.txt или не будут.Впрочем, должен заметить, что если анонс, например, статьи дублируется в категории статей в виде нескольких пред‑ложений, то, на мой взгляд, это ничего страшного не несет. Разумеется, если сами статьи объемные. Например, на своем блоге maulnet.ru я до сих пор не решился на страницах вида page / x запретить индексацию анонсов статей.Озаботиться стоит не только отсутствием дублей, но и все тем же ЧПУ. Я знаю случай, когда у человека, использовавшего CMS Joomla и мод к нему, Яндексом индексировался весь сайт, кроме контента, который генерил этот мод. Мод генерил, собственно, сам магазин (товары). Все из‑за того, что товары располагались на кривых и довольно длинных URL. Затем этот пользователь сделал их вида «url.ru / nazvanie‑tovara.html», и товары начали индексироваться.

МненИе

Page 57: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 55

noindex, nofollow на странице и скрытия части страницы тегом <NOINDEX> до пе-реработки структуры базы данных и  ре-структуризации сайта. Фактически мы де-лаем следующее:

1. Удаляем мусорный дублирующий контент.

2. Закрываем от  индексации дублирую-щийся, но  важный для  удобства пользо-вателей контент.

3. Если удалить разделы невозможно, дуб-лируем их вместе с содержимым, а затем скрываем от индексации. Важный момент: дубликат должен быть не только «индекси-руемым», но и «юзабельным», то есть им действительно должны пользоваться по-сетители сайта. Пример такой доработки рассмотрен выше – www.best-realty.ru. Та-кие приемы, как раздел «Статьи», запря-танный куда-нибудь в подвал и обозначен-ный мелким шрифтом, сейчас не работают (за исключением случаев, когда этот раз-дел существует уже на  протяжении не-скольких лет).

4. Используем robots.txt, чтобы закрыть лишние страницы от робота-индексатора.

*Проверить, как  будет вести себя робот Яндекса на  сайте, мож-но с  помощью специальной ути-литы из  набора Яндекс.Вебмастер http://webmaster.yandex.ru / robots.xml

В результате этих манипуляций на сайте создается не  содержащий дублей марш-рут для робота. Хорошей работой можно назвать такой маршрут, который посети-тели сайта тоже используют.

Должен поделиться своим наблюдени-ем: эффективные сайты с  высокой ви-димостью по шлейфу НЧ-запросов реже исключают страницы в  robots.txt; чаще дорабатывается сам сайт. Это связано с тем, что в результате скрытия страниц в robots.txt вес на них уходит, но обрат-но не возвращается, ссылки с них также

Важный момент: дубликат должен быть не только «индексируемым», но и «юза‑

бельным», то есть им действительно должны пользоваться посетители сайта.

Page 58: Л.Гроховский - Руководство по внутренним факторам

56 Устранение дубликатов

перестают работать. Сайт, структура ко-торого хороша настолько, что нет нужды закрывать страницы в robots.txt, ранжи-руется лучше.

Резюме: мы рассмотрели основные виды дублирования контента и спо-собы борьбы с ними. К сожалению, все случаи разобрать невозможно: вари-антов очень много, и каждый из них может иметь свои особенности. Бо-лее подробно поднятую в данной гла-ве тему я освещаю в рамках семинара «Оптимизация сайта: задействуем внутренние факторы».

Page 59: Л.Гроховский - Руководство по внутренним факторам

в этой главе мы разберемся, как со-ставлять инструкции robots.txt и  sitemap.xml для  поисковых си-

стем. Предназначение этих инструкций – помочь поисковой системе отграничить важные страницы от  мусорных, чтобы скорректировать робота, индексирующе-го сайт.

3.1. Зачем нужен robots.txtСтандарт robots.txt был принят консорциу-мом W3C 30 января 1994 года. Эта инструк-ция используется для исключения дублика-тов и других мусорных страниц из индекса поисковых систем. Кроме того, именно че-рез robots.txt можно указать Яндексу глав-ное зеркало сайта и адрес карты сайта.

В некоторых случаях к robots.txt прибега-ют для того, чтобы закрыть сайт от неже-лательной поисковой системы. Например, если вы хотите скрыть от ваших конкурен-тов информацию о сайтах, разместивших ссылку на ваш веб-ресурс, вы можете за-крыть сайт от индексации поисковой си-стемой Yahoo.

Итак, файл robots.txt выполняет следую-щие функции:

указание главного зеркала,

исключение лишних страниц из индекса,

отказ в индексации нежелательным роботам,

указание адреса карты сайта.

Глава 3Инструкции для поисковых систем

Page 60: Л.Гроховский - Руководство по внутренним факторам

58 Инструкции для поисковых систем

3.2. Robots.txt – универсальные директивы

Существуют универсальные директивы, которые воспринимают любые поиско-вые системы:

1 . Директива User-Agent

Иногда, учитывая особенности алгорит-мов ранжирования, целесообразно исполь-зовать для разных поисковых систем раз-личные маршруты обхода сайта. Для этого существует директива User-Agent.

User-Agent указывает имя робота, которо-му адресована инструкция (тогда дирек-тива имеет вид ‘User-agent: botname’), либо сообщает, что инструкция предназначена для всех поисковых систем (выглядит она как  ‘User-agent: *’). Робот botname в пер-вую очередь обращает внимание на пер-сональную инструкцию, если таковая име-ется, и следует ее указаниям, игнорируя все остальные. Если же персональной ин-струкции для робота конкретной поиско-вой системы нет, он руководствуется ‘User-agent: *’.

2 . Директива Disallow

Disallow – основная директива. Использу-ется она для запрета индексации. Указание ‘Disallow: / dir / ’ налагает вето на индекса-цию всех страниц, расположенных по ад-ресу www.site.ru / dir / . Важно указывать адрес непосредственно от корневой дирек-тории сайта. Конструкция вида ‘Disallow: http://www.site.ru / ’ некорректна и воспри-нимается как  http://www.site.ru / http:// www.site.ru / .

3 . Директива Sitemap

Sitemap указывает адрес xml-карты сайта. Если эта директива не  заполне-на, то  поисковые системы по  умолча-нию ищут файл sitemap.xml по  адре-су www.site.ru / sitemap.xml. Директив Sitemap на одном сайте может быть не-сколько, и  они бывают вложенными

В некоторых случаях к robots.txt прибегают для того, чтобы закрыть сайт от нежела‑

тельной поисковой системы. Например, если вы хотите скрыть от ваших конкурентов информацию о сайтах, разместивших ссылку на ваш веб‑ресурс, вы можете закрыть сайт от индексации поисковой системой Yahoo.

Page 61: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 59

во внутренние директории, но их непре-менно нужно указать в robots.txt.

3.3. Robots.txt – директивы для яндексаЧтобы веб-мастерам и  оптимизаторам было удобнее, Яндекс ввел дополнитель-ные директивы для указаний маршрута по-искового робота. В частности, существуют директивы:

1 . Allow

Эта директива указывает поисковой си-стеме страницы, которые нужно проин-дексировать обязательно. Ее удобство за-ключается в том, что на некоторых сайтах так сложно искать все мусорные страни-цы, что проще вместо этого указать стра-ницы полезные. В этом случае весь сайт за-крывается от индексации через директиву ‘Disallow: / ’, а инструкциями ‘Allow: …’ ро-бот направляется на полезные страницы.

Часто директива Allow используется для указания важных страниц в закрытой от индексации директории. Также ее мож-но применять, когда нужно закрыть все внутренние страницы раздела, но  оста-вить индексируемой собственно главную страницу. В  этом случае уместна такая конструкция:

User-agent: YandexDisallow: / dir / Allow: / dir / $

2 . Clean-Param

Директива Clean-param склеивает все страницы с переменной в одну:

www.site.ru / some_dir / get_book.pl?ref=site_1&book_id=123

www.site.ru / some_dir / get_book.pl?ref=site_2&book_id=123

www.site.ru / some_dir / get_book.pl?ref=site_3&book_id=123.

‘Clean-param: ref / some_dir / get_book.pl’ указывает срез для  всех страниц,

Часто директива Allow используется для указания важных страниц в закрытой

от индексации директории. Также ее можно применять, когда нужно закрыть все внутренние страницы раздела, но оставить индексируемой собственно главную страницу.

Page 62: Л.Гроховский - Руководство по внутренним факторам

60 Инструкции для поисковых систем

содержащих в URL что-то еще. В этом слу-чае проиндексируется только страница www.site.ru / some_dir / get_book.pl.

Директива Clean-param полезна для устра-нения дубликатов, связанных с сортиров-кой и реферальными ссылками.

3 . Host

Если сайт компании доступен по несколь-ким адресам, с помощью инструкции ‘Host: www.site.ru’ можно указать основное зер-кало. Именно этот сайт будет отображать-ся в результатах поиска, а все второстепен-ные зеркала будут исключены из основной базы робота-индексатора. Если у вас всего один сайт, в директиве Host нужно указать, какое из зеркал сайта является основным: www.site.ru или site.ru. В случае когда та-кой инструкции нет, Яндекс может проин-дексировать страницы обоих зеркал.

4 . Спецсимволы * и $

Спецсимвол * означает любую последова-тельность символов. Например, директива ‘Disallow: / * / search / ’ указывает поисково-му роботу на необходимость индексации всех страниц, содержащих / search / .

Спецсимвол $ означает строгое соответ-ствие. Так, ‘Disallow: / catalog / $’ демон-стрирует поисковому роботу запрет на ин-дексацию страницы www.site.ru / catalog / , при  этом вложенные страницы, напри-мер, www.site.ru / catalog / page_1.php, бу-дут проиндексированы.

3.4. Правила составления robots.txtНеопытные оптимизаторы при составле-нии robots.txt очень часто делают ошиб-ки. Чтобы не  наступать на  чужие граб-ли, нужно хорошо усвоить следующую информацию:

количество директив в файле не должно превышать 1 024,

максимальная длина 1 строки – 1 024 символа,

Если сайт компании доступен по несколь‑ким адресам, с помощью инструкции ‘Host:

www.site.ru’ можно указать основное зеркало. Именно этот сайт будет отображаться в результатах поиска, а все второстепенные зеркала будут исключены из основной базы робота‑индексатора.

Page 63: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 61

инструкция должна начинаться с User-agent,

robots.txt может содержать несколько инструкций,

http://основное_зеркало_сайта / robots.txt должен отдавать код ответа 200. Ника-кой другой код ответа не воспринимается поисковым роботом. Если по этому адре-су происходит перенаправление через ре-директ, поисковая система не станет учи-тывать robots.txt,

спецсимвол # в  начале инструкции (# Disallow: / ) отключает ее.

3.5. Разбор robots.txt на примерахПример 1 . http://mobiguru .ru /

На момент написания этой главы на сайте http://mobiguru.ru / была размещена сле-дующая инструкция robots.txt:

User-agent: Yandex

Disallow: / search /

Disallow: / js

Disallow: / *?_openstat

Disallow: / *?loc

Disallow: / * / ?*

Disallow: / *sort / price /

Disallow: / *sort / rate /

Disallow: / guru_*

Host: mobiguru.ru

Sitemap: http://mobiguru.ru / mobiguru.xml

Попробуем разобраться в  том, что  хо-тели сообщить поисковым роботам оптимизаторы.

Итак, мы видим, что инструкция предна-значена для  поисковой системы Яндекс. Для других поисковых систем инструкций не предусмотрено, следовательно, они ин-дексируют все страницы сайта.

особенность Google в Robots.txt

Если ваш URL имеет конструкцию вида http://site.ru / ?price [500], то директива

Disallow: * [* не уберет его из выдачи Google. (При этом в валидаторе все будет правиль‑но). Почему? Google некорректно восприни‑мает некоторые символы. Например «[». В выдаче ваш URL будет выглядеть так: http://site.ru / ?price%5B500 %5D. Поэтому, чтобы исключить его из выдачи, необходимо вписать в robots такую строчку:Disallow: *%5B*Квадратные скобки – не единственный случай. Всегда нужно смотреть на вид URL в выдаче.

МненИе

Page 64: Л.Гроховский - Руководство по внутренним факторам

62 Инструкции для поисковых систем

Инструкция закрывает от  индекса-ции раздел поиска (search), страни-цы сортировки (sort) и  некоторые переменные. Основное зеркало сайта  – mobiguru.ru. Карта сайта расположена по ад-ресу http://mobiguru.ru / mobiguru.xml.

Пример 2 . http://www .last .fm /

Любопытная инструкция размещена на сайте last.fm

User-Agent: *

Disallow: / music?

Disallow: / widgets / radio?

Disallow: / show_ads.php

Disallow: / affiliate /

Disallow: / affiliate_redirect.php

Disallow: / affiliate_sendto.php

Disallow: / affiliatelink.php

Disallow: / campaignlink.php

Disallow: / delivery.php

Disallow: / music / +noredirect /

Disallow: / harming / humans

Disallow: / ignoring / human / orders

Disallow: / harm / to / self

Allow: /

Инструкция предназначена для  всех ро-ботов. От индексации закрыты некоторые внутренние страницы, несколько страниц с переменными и одна директория. Три по-следние инструкции Disallow вызывают особый интерес:

1. Disallow: / harming / humans («За-прещается: причинять вред людям»)

2. Disallow: / ignoring / human / orders («Запрещается: игнорировать чело-веческие приказы»)

3. Disallow: / harm / to / self («Запреща-ется: причинять вред себе»)

Если основное предназначение robots.txt – это запрет индексации, то карта сайта

выполняет прямо противоположные задачи. Она отвечает за ускорение индексации сайта и полноту его индексации.

Page 65: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 63

Эти указания могут показаться бессмыс-лицей для каждого, кто не знаком с тремя законами робототехники, которые сфор-мулировал в рассказе «Хоровод» знамени-тый писатель-фантаст Айзек Азимов. За-коны гласят:

1. Робот не может причинить вред челове-ку или своим бездействием допустить, что-бы человеку был причинен вред.

2. Робот должен повиноваться всем прика-зам, которые дает человек, кроме тех слу-чаев, когда эти приказы противоречат Пер-вому Закону.

3.  Робот должен заботиться о  своей без-опасности в той мере, в которой это не про-тиворечит Первому и Второму Законам.

3.6. Зачем нужен sitemap.xmlЕсли основное предназначение robots.txt – это запрет индексации, то карта сайта вы-полняет прямо противоположные задачи. Она отвечает за:

ускорение индексации сайта,

полноту индексации сайта.

Sitemap.xml указывает поисковой систе-ме частоту, с которой возникает необходи-мость в переиндексации страниц. В этом плане инструкция особенно важна для сай-тов с регулярно обновляющимся контен-том (новостные порталы и т. п.).

Кроме того, sitemap.xml содержит все важные страницы сайта с  указанием их приоритета.

3.7. Директивы sitemap.xmlобязательные атрибуты

<urlset>

Атрибут инкапсулирует этот файл и указы-вает стандарт текущего протокола.

<url>

Sitemap.xml указывает поисковой системе частоту, с которой возникает необходи‑

мость в переиндексации страниц. В этом плане инструкция особенно важна для сайтов с регуляр‑но обновляющимся контентом (новостные порталы и т. п.).

Page 66: Л.Гроховский - Руководство по внутренним факторам

64 Инструкции для поисковых систем

Это родительский тег для каждой записи URL. Остальные теги являются для  него дочерними.

<loc>

Представляет URL-адрес страницы. Этот URL должен начинаться с  префикса (на-пример, HTTP) и  заканчиваться косой чертой, если ваш веб-сервер требует это-го. Длина этого значения не должна пре-вышать 2 048 символов.

Необязательные атрибуты

<lastmod>

Здесь в формате W3C Datetime указыва-ется дата последнего изменения файла. W3C Datetime позволяет при необходимо-сти опустить сегмент времени и исполь-зовать формат ГГГГ-ММ-ДД. Обратите внимание: этот тег не имеет отношения к заголовку ‘If-Modified-Since (304)’, ко-торый может вернуть сервер, поэтому поисковые системы иногда по-разному используют информацию из  этих двух источников.

<changefreq>

Атрибут задает вероятную частоту изме-нения страницы. Это значение предостав-ляет общую информацию для поисковых систем и может не соответствовать в точ-ности частоте сканирования этой страни-цы. Допустимые значения:

always,

hourly,

daily,

weekly,

monthly,

yearly,

never.

Значение «всегда» (always) должно исполь-зоваться для описания документов, кото-рые изменяются при каждом доступе к ним,

Значение «всегда» (always) должно использоваться для описания документов,

которые изменяются при каждом доступе к ним, значение «никогда» (never) – для описания архивных URL‑адресов.

Page 67: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 65

значение «никогда» (never) – для описания архивных URL-адресов.

Имейте в  виду, что  значение для  это-го тега рассматривается как  подсказ-ка, а  не  как  команда. Несмотря на  то, что сканеры поисковой системы учиты-вают эту информацию при принятии ре-шений, они могут сканировать страни-цы с пометкой «ежечасно» менее часто, чем указано, а страницы с пометкой «еже-годно» – чаще одного раза в год. Бывает, что поисковые роботы сканируют стра-ницы с пометкой «никогда», чтобы отсле-живать неожиданные изменения на этих страницах.

<priority>

Указывается приоритетность данного URL относительно других URL на вашем сайте. Допустимый диапазон значений – от 0,0 до 1,0; по умолчанию приоритетность рав-на 0,5.

Значение <priority> не  влияет на  про-цедуру сравнения ваших страниц со стра-ницами других сайтов, оно только по-зволяет указать поисковым системам, какие страницы более важны для скане-ров, на  ваш взгляд. Таким образом, вы не  сможете повлиять на  положение ва-ших URL на  страницах результатов ка-кой-либо поисковой системы. Однако поисковые системы используют эту ин-формацию при  обработке URL, кото-рые относятся к  одному и  тому  же сай-ту. Поэтому можно использовать этот тег для увеличения вероятности присутствия в поисковом индексе самых важных стра-ниц вашего сайта.

Вы должны понимать, что нет смысла на-значать высокий приоритет всем URL ва-шего сайта. Это очень относительная ве-личина, поэтому параметр используется лишь для того, чтобы определить очеред-ность обработки URL в  пределах одного сайта.

Значение <priority> не влияет на процеду‑ру сравнения ваших страниц со страницами

других сайтов, оно только позволяет указать поисковым системам, какие страницы более важны для сканеров, на ваш взгляд.

Page 68: Л.Гроховский - Руководство по внутренним факторам

66 Инструкции для поисковых систем

3.8. Правила составления sitemap.xmlСуществует несколько правил по составле-нию инструкции sitemap.xml:

Размер sitemap.xml не  должен превы-шать 10 Мб.

Файл sitemap.xml может быть разбит на несколько отдельных файлов, каждый из которых должен быть указан в robots.txt.

Файл sitemap.xml, расположенный в  некотором каталоге, должен включать только URL, находящиеся в  этом  же ка-талоге либо его вложенных разделах. Нельзя, чтобы он включал в  себя адре-са из другого (из данного и не вложен-ного в данный) каталога сайта. То  есть в  sitemap.xml, расположенном по  адресу http://www.site.ru / dir_1 / , будут учиты-ваться только инструкции для вложенных в эту категорию страниц. Инструкции, ка-сающиеся страниц, вложенных, например, в категорию http://www.site.ru / dir_2 / , бу-дут проигнорированы.

Файл sitemap.xml не должен содержать более 50 000 URL.

Нельзя использовать более 1 000 фай-лов sitemap.xml.

Эти правила очень просты, но возможно-стей sitemap.xml действительно хватит, чтобы указать информацию о  50  мил-лионах страниц сайта, а  этого более чем достаточно.

3.9. Пример sitemap.xmlРассмотрим на  примере все того  же mobiguru.ru, как  составлять sitemap.xml. Всю карту разбирать не будем, нам доста-точно небольшой ее части.

<urlset>

<url>

<loc>http://mobiguru.ru / < / loc>

<changefreq>hourly< / changefreq>

Файл sitemap.xml, расположенный в некотором каталоге, должен включать

только URL, находящиеся в этом же каталоге либо его вложенных разделах. Нельзя, чтобы он включал в себя адреса из другого (из данного и не вложенного в данный) каталога сайта.

Page 69: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 67

< / url>

<url>

<loc>http://mobiguru.ru / phones / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>http://mobiguru.ru / photo / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>http://mobiguru.ru / notebooks / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>

http://mobiguru.ru / phones / nokia / nokia_5800_xpressmusic.html

< / loc>

<changefreq>daily< / changefreq>

< / url>

. . .

Указанный отрезок карты сайта инструк-тирует поисковые системы, что  страницы http://mobiguru.ru / , http://mobiguru.ru / phones / , http://mobiguru.ru / photo / , http://mobiguru.ru / notebooks / должны индексироваться ежечасно. Частота пере-индексации страницы http://mobiguru.ru / phones / nokia / nokia_5800_xpressmusic.html – ежедневно.

. . .

<sitemapindex>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-000.txt< / loc>

Файл sitemap.xml не должен содержать более 50 000 URL.

Page 70: Л.Гроховский - Руководство по внутренним факторам

68 Инструкции для поисковых систем

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-001.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-002.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-003.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-004.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-005.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-006.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-007.txt< / loc>

Инструкции sitemap.xml и robots.txt при правильном их использовании должны

дополнять друг друга. Существуют три правила взаимодействия этих инструкций.

Page 71: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 69

<lastmod>2010-07-21< / lastmod>

< / sitemap>

3.10. Принцип взаимодействия sitemap.xml и robots.txt

Инструкции sitemap.xml и  robots.txt при правильном их использовании должны дополнять друг друга. Существуют три пра-вила взаимодействия этих инструкций:

sitemap.xml и robots.txt не должны про-тиворечить друг другу;

все страницы, исключенные в robots.txt, должны быть исключены также из sitemap.xml;

все индексируемые страницы, разре-шенные в robots.txt, должны содержаться в sitemap.xml.

3.11. Автоматизация добавления страниц в sitemap.xml

Сайтам, на  которых часто обновляется контент (новостным порталам, интер-нет-магазинам), необходима автоматиза-ция файла sitemap.xml, иначе он потеря-ет свою актуальность. Вручную обновлять инструкцию каждый день  – совершенно нерациональный подход. Для того чтобы автоматизировать добавление и  исклю-чение страниц в sitemap.xml, необходимо создать модуль, связывающий БД сайта, инструкции robots.txt и sitemap.xml. Про-грамма должна руководствоваться следую-щими правилами:

1. Примем как  данность, что  файл sitemap.xml уже изначально создан на сай-те, проработан вручную и содержит толь-ко важные страницы.

2. При добавлении новой страницы систе-ма дописывает строчку в sitemap.xml с ука-занием этой страницы. В  зависимости

Сайтам, на которых часто обновляется контент (новостным порталам, интернет‑

магазинам), необходима автоматизация файла sitemap.xml, иначе он потеряет свою актуальность.

Page 72: Л.Гроховский - Руководство по внутренним факторам

70 Инструкции для поисковых систем

от типа последней указывается параметр частоты индексации и ее приоритет. Если страница закрыта от индексации в robots.txt, она не прописывается в sitemap.xml.

3. При  удалении страницы программа ищет строчку с указанием данной страни-цы в sitemap.xml. Если страница там есть, информация о ней удаляется.

Page 73: Л.Гроховский - Руководство по внутренним факторам

вот мы и  добрались до  самого ин-тересного. В  этой главе я  расска-жу вам о  том, как  решать пробле-

мы уникальности и  недостатка текста на сайте. Непременно уделите представ-ленной ниже информации должное вни-мание, поскольку именно по наполнению страниц поисковая система распознает со-держание сайта. Нет текста – не понятно, о чем сайт, следовательно, для поисковой системы он «пустышка».

Вообще есть три серьезные проблемы оп-тимизаторов, связанные с  текстами: во-ровство контента, отсутствие и  недоста-ток текстов, дублирование текстов внутри сайта.

К сожалению, действенной методики борь-бы с воровством контента не существует. Несмотря на усилия юристов, есть способы воровства, пресечь которые невозможно. Между тем в этой главе вы познакомитесь с одной методикой, которая сводит к нулю вред, причиненный «угоном» контента.

Что касается проблемы отсутствия и недо-статка контента, то решается она обычно за счет автоматизации, а при продвиже-нии небольших сайтов  – ручным допи-сыванием недостающего уникального контента.

4.1. Уникальность контентаКаждый, кто  занимается продвижением сайтов не первый день, сталкивался с про-блемой воровства контента. Казалось бы, воруют  – и  пусть, что  в  этом такого?

Глава 4работа с авторским контентом

Page 74: Л.Гроховский - Руководство по внутренним факторам

72 Работа с авторским контентом

Но дело в том, что очень часто в итоге ко-пия оказывается выше оригинала в резуль-татах поиска, а значит, воровство контента можно приравнять к воровству трафика. Ходят слухи, что на одной из конференций представители Яндекса озвучили значение погрешности определения первоисточни-ка, назвав цифру ~ 30 %.

Как  же так? Неужели поисковая систе-ма не  может определить первоисточник и  ранжировать сайты справедливо? Все-го-то и нужно – определить, где контент появился раньше, и  отдать этому сайту предпочтение. Но не все так просто. Ведь поисковая система переиндексирует сай-ты неравномерно. Допустим, если ваш ресурс обновляется не часто, значит, ско-рее всего, и поисковый робот – не частый ваш гость. Если вы публикуете результа-ты научного исследования раз в  3 меся-ца, а  новостной портал разместит вашу статью как  свою, шансы, что  у  вас ста-тья будет проиндексирована раньше, ни-чтожны. На живые новостные порталы ро-бот-индексатор заглядывает несколько раз в час, а ресурс с менее подвижным контен-том может посетить и через несколько не-дель. Таким образом, выходит, что «ори-гинал» статьи расположен на новостном портале, а научный центр опубликовал его «копию». Как видите, по дате индексации определять оригинал нельзя.

Тогда, может быть, определять первоис-точник по авторству в тексте статьи? Бес-полезно, ведь ворам не  составит труда указать свое авторство и сайт в качестве первоисточника. Даже ссылки на ориги-нал, которые указали добросовестные сайты, разместившие ваши статьи,  тоже не спасение. Можно запросто разместить на своем сайте чужую статью, а потом про-дублировать ее в нескольких блогах с ука-занием сайта как первоисточника.

Как  видите, любые признаки оригина-ла легко подделать. Поисковые системы

Если вы публикуете результаты научного исследования раз в 3 месяца, а новостной

портал разместит вашу статью как свою, шансы, что у вас статья будет проиндексирована раньше, ничтожны. На живые новостные порталы робот‑индексатор заглядывает несколько раз в час, а ресурс с менее подвижным контентом может посетить и через несколько недель.

Page 75: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 73

не  станут разбираться в  этих тонкостях, а владельцам сайта нет смысла в каждом случае пытаться восстановить свои автор-ские права юридически. Борьба с дорвея-ми, ворующими контент, подобна борь-бе с  ветряными мельницами, ведь эти сайты размещают на  доменах, зарегист-рированных на  несуществующих людей в  зонах, не  подвластных влиянию юрис-дикции Российской Федерации. Против сайтов, размещенных на зарубежных хо-стингах и  не  в  доменной зоне РФ, вы  – увы! – бессильны. Если же сайт, укравший ваш контент, располагается на  россий-ской «интернет-территории», а вы име ете юридическое подтверждение авторства или хотя бы след в веб-архиве, вы можете связаться с хостером или владельцем доме-на и попросить убрать ворованые тексты, а  в  случае их  отказа сделать это, подать иск. Но все-таки куда проще и дешевле на-писать новый текст, чем закрепить за со-бой через суд авторство существующего.

Открою вам страшный секрет: поиско-вые системы не пытаются распознать оригиналы и копии контента. Их зада-ча  – удовлетворить своих посетителей, а  на  уровень удовлетворенности никак не повлияет, окажется ли на первом ме-сте в результатах поиска оригинал или же там расположится копия. Поэтому воров-ство контента – это головная боль исклю-чительно оптимизаторов, а не разработчи-ков поисковых систем.

Второй важный момент: в рунете практи-чески нет статей, уникальных на 100 %. Какая-то  часть любой статьи с  огром-ной долей вероятности уже встречалась где-то в Сети, а значит, невозможно точ-но разграничить оригинал и  переписан-ный текст (рерайт).

Немного статистики для  понимания масштабов:

По данным проекта «Черный квадрат», реализованного Алексеем Тутубалиным

Поисковые системы не пытаются распо‑знать оригиналы и копии контента.

Их задача – удовлетворить своих посетителей, а на уровень удовлетворенности никак не повлия‑ет, окажется ли на первом месте в результатах поиска оригинал или же там расположится копия.

Page 76: Л.Гроховский - Руководство по внутренним факторам

74 Работа с авторским контентом

по адресу http://www.rukv.ru / , 9 сентября 2010 года в Рунете только на поддоменах второго уровня в зонах.RU и.SU работало 1 893 837 сайтов.

По данным Яндекса, опубликованным в  информационном бюллетене осенью 2009  года, в  Рунете насчитывалось око-ло 15 миллионов сайтов (это около 6,5 % всего Интернета). При этом информация в Сети распределена неравномерно: 88 % всего текста находится менее чем на 1 % сайтов. Средний сайт Рунета состоит из 255 страниц, содержит 159 тысяч слов и 204 картинки. Большинство сайтов го-раздо меньше среднего: половина из них состоит всего из одной страницы.

Так будем  же реалистами и  усвоим три простые истины:

1. Невозможно достоверно определить первоисточник.

2. Практически не  существует на  100 % уникального контента.

3. Большинство страниц имеет дубликаты.

Неутешительная картинка? Не стоит опу-скать руки. В действительности все не так плохо, как кажется. Периодически обнов-ляйте контент на входных страницах, это положительно сказывается на  ранжиро-вании сайтов. Как поступать с дубликата-ми, вы уже знаете из 2-й главы. Что касает-ся воровства контента, есть действенный способ нейтрализовать вред, который оно наносит.

4.2. Как защитить контент от воровства?

БЕСПоЛЕЗНо:

дублировать статью на сторонних сай-тах с указанием вашего сайта в качестве первоисточника, поскольку это не оказы-вает значительного влияния на позиции сайта в выдаче;

По данным Яндекса, опубликованным в информационном бюллетене осенью

2009 года, в Рунете насчитывалось около 15 мил‑лионов сайтов (это около 6,5 % всего Интернета). При этом информация в Сети распределена неравномерно: 88 % всего текста находится менее чем на 1 % сайтов.

Page 77: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 75

отключать через JavaScript правую кноп-ку мышки и выделение текста на странице, использовать любые программные спосо-бы защиты контента от копирования, по-скольку в 99 % случаев воруют не путем ко-пирования контента со страницы, а парсят специальными программами, которые пе-рекачивают сайт и срезают теги, оставляя только текст статьи, а иногда контент вы-дирают вручную из HTML;

ставить ссылки на первоисточник в тек-сте статьи, так как чаще всего такие ссыл-ки срезаются программами-парсерами.

Что же делать?

определите, по каким запросам вас мо-гут искать, составьте правильные анко-ры, закупите ссылки . Ссылки нужно раз-мещать с  быстроиндексируемых сайтов, а в качестве текстов ссылок следует исполь-зовать небольшие части статьи. Если при-менять простенький скрипт, можно авто-матизировать этот процесс. Скрипт будет разбивать заданный текст на пассажи с от-бивкой не более 100 символов и дописы-вать теги для размещения ссылок в SAPE.

Закупая ссылки с частями текста статьи, мы поднимаем страницу со статьей в ре-зультатах поиска выше других копий, по-скольку синергия между содержимым на странице и в анкор-листе увеличивает значимость этой страницы.

У  этой методики существует свой недо-статок: используя разбивку текста на пас-сажи, мы теряем запросы, возникающие на их стыке, ведь текст дробится на части, которые не накладываются друг на друга. Кроме того, если мы будем просто последо-вательно перебирать весь текст, то станем тратить лишние деньги на продвижение запросов вроде «продукция предприятия получила высшую оценку», а они никогда не приведут к нам целевых посетителей. Поэтому нужно брать тексты ссылок из об-ластей около ключевых слов конкретной

Ссылки нужно размещать с быстроиндекси‑руемых сайтов, а в качестве текстов ссылок

следует использовать небольшие части статьи. Если применять простенький скрипт, можно автоматизировать этот процесс. Скрипт будет разбивать заданный текст на пассажи с отбивкой не более 100 символов и дописывать теги для раз‑мещения ссылок в SAPE.

Page 78: Л.Гроховский - Руководство по внутренним факторам

76 Работа с авторским контентом

страницы. Именно по ним на сайт могут попасть целевые посетители. В общем виде методика такова: анкор не более 100 сим-волов, отбивка «ключевое слово в конце текста ссылки» и отбивка «ключевое сло-во в начале текста ссылки».

4.3. Как воровать контент?Воруется контент точно по такому же прин-ципу, как и защищается. Вышеописанный способ работает в обе стороны: при краже статья копируется, а на нее размещаются входящие внешние ссылки с частями тек-ста статьи в анкоре.

4.4. отсутствие и недостаток контентаНехватка или полное отсутствие контен-та на сайте приводит к ошибкам в ранжи-ровании, поскольку поисковые системы не  могут корректно распознать принад-лежность страницы к ключевым словам. На небольших сайтах недостаток контен-та восполняется вручную – дописывани-ем недостающих текстов, а вот на крупных ресурсах не обойтись без автоматизации. Например, на  сайте http://mobiguru.ru

О том, как купить DELL Alienware M11x дешевлеСравни все цены на DELL Alienware M11x в более чем 27 интернет-магазинах, продающих ноутбуки, найди, где можно купить DELL Alienware M11x дешевле, определив лучшую и среднюю стоимость, закажи ноутбук DELL Alienware M11x в самом дешевом месте с доставкой по Москве, Санкт-Петер-бургу, Екатеринбургу или всей России и даже Украине!

О том, как купить ASUS K50IJ дешевлеСравни все цены на ASUS K50IJ в более чем 49 интернет-магазинах, продающих ноутбуки, найди, где можно купить ASUS K50IJ дешевле, определив лучшую и среднюю стоимость, закажи ноут-бук ASUS K50IJ в самом дешевом месте с доставкой по Москве, Санкт-Петербургу, Екатеринбургу или всей России и даже Украине!

Информация о Toshiba Satellite A350Прочитай полный обзор Toshiba Satellite A350 и эксклюзивный тест ноутбука, ознакомься с от-зывами владельцев Toshiba Satellite A350 в форуме ноутбука, просмотри описание Toshiba Satellite A350 с характеристиками и фото ноутбука и не забудь про новости!

О том, как купить DELL Inspiron M301z дешевлеСравни все цены на DELL Inspiron M301z в более чем 18 интернет-магазинах, продающих ноутбуки, найди, где можно купить DELL Inspiron M301z дешевле, определив лучшую и среднюю стоимость, закажи ноутбук DELL Inspiron M301z в самом дешевом месте с доставкой по Москве, Санкт-Петер-бургу, Екатеринбургу или всей России и даже Украине!

Page 79: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 77

проблему недостатка контента решили за счет генерации мини-описаний с вхо-ждениями ключевых слов в тексте.

Следует отметить, что важно не только на-личие контента, но  и  его уникальность, структура, наполненность. По  лицензии Яндекса, сайты, использующие неуни-кальный контент, могут быть частично или полностью исключены из индексной базы. Кроме того, страницы с неуникаль-ным контентом ранжируются хуже.

Далее нам предстоит подробно рассмо-треть способы автоматической генера-ции контента. Мы разберем не только ге-нерацию контента в  тексте страницы, но также генерацию метатегов description и keywords и генерацию заголовков TITLE.

4.5. Автоматизация наполнения Description, Keywords, Title

В зависимости от приспособленности CMS автоматизация заполнения заголовков и метатегов может быть реализована дву-мя путями:

разработка встраиваемого в  CMS модуля,

ручная загрузка ранее сгенерированных текстов в БД.

Первый способ более практичен и  удо-бен, чем  второй. Для  продвижения сай-тов, на которых часто появляются новые страницы, подходит только он. Второй спо-соб значительно более прост в реализации, но он идеален только для тех сайтов, где количество новых страниц за месяц мож-но пересчитать по пальцам.

автоматизация наполнения keywords

По  умолчанию этот тег должен быть пу-стым. На входных страницах в него впи-сываются все продвигаемые запросы. Ав-томатизировать наполнение тега можно в зависимости от типа сайта: либо через интеграцию с БД, откуда будет забираться

Воруется контент точно по такому же принципу, как и защищается. Вышеописан‑

ный способ работает в обе стороны: при краже статья копируется, а на нее размещаются входящие внешние ссылки с частями текста статьи в анкоре.

Page 80: Л.Гроховский - Руководство по внутренним факторам

78 Работа с авторским контентом

наименование товарной группы и назва-ние конкретной модели, либо через лин-гвистический анализ текста страницы, результатом которого должны стать наи-более часто употребляемые на ней слова. Неключевые частоупотребимые слова мо-гут удаляться через специальный словарь или вручную при небольших объемах.

автоматизация наполнения TITLE

Настраивается через формулу [TITLE стра-ницы] [TITLE раздела] [TITLE сайта]. TITLE страницы = H1 страницы, TITLE раздела = H1 раздела, TITLE сайта задается изна-чально и дублируется на всех страницах сайта. Желательно, чтобы в TITLE попали все возможные части запросообразующих слов. В этом случае не обойтись без пропи-сывания корректных заголовков H1, хотя при правильной верстке и грамотном на-полнении сайта, этот тег должен содержать основные ключевые слова страницы.

Пример TITLE с  сайта компании «БЕСТ-Недвижимость»:

Квартиры в  Бибирево. Предложения по продаже квартир в Москве, новострой-ки и вторичная недвижимость. Агентство недвижимости «БЕСТ».

Квартиры в Медведково. Предложения по продаже квартир в Москве, новострой-ки и вторичная недвижимость. Агентство недвижимости «БЕСТ».

Коттеджи в  Солнцево. Загородная не-движимость в Подмосковье. Агентство не-движимости «БЕСТ».

автоматизация генерации Description

Настраивается по заданной формуле2 типа [Текст] [x] [Текст] [y] [z] [a] [b] [Текст].

С айтРепорт – система SEO‑аналитики, позволяющая проводить диагностику сайта.

СайтРепорт – это возможность провести полную диагности‑ку сайта, увидеть его глазами поисковых систем. Оптими‑затору приходится сталкиваться со множеством проблем: недостаток контента, 404 ошибки, дубликаты страниц, мусорные ссылки, страницы 30 уровня вложенности, отсут‑ствие заголовков… Легко найти ошибки на небольшом сайте, достаточно просмотреть все страницы вручную. Что делать, если на сайте несколько тысяч страниц? Наш робот выполнит эту работу за вас, перекачает ваш сайт, после чего система проведет анализ, который вы подробно изучите. Сделав анализ сайта, вы получите подробный отчет об ошибках и узнаете потенциал вашего проекта в работе с внутренними факторами.Проще говоря, бесплатно решите проблему внутренних факторов.

КАК РАБотАет СИСтеМА:

Система представляет собой программный комплекс, исполь‑зующий мощности нескольких серверных машин и состоящий из 5 модулей:# Робот-индексатор

Робот обходит все страницы сайта в соответствии со всеми инструкциями для вашего сайта, то есть фактически имеет все функции поискового робота. Робот заносит в базу код ответа каждой страницы, запоминает скорость соединения, сохраняет контент каждой страницы, вынося в отдельный блок все исходящие ссылки.# Анализ ссылочных связей

Модуль выстраивает ссылочные связи всех страниц между собой, обрабатывая миллионы ссылок. Для каждой страницы составляется список входящих внутренних ссылок с указанием анкоров. Все ссылки проверяются на индексацию. Система рассчитывает условный вес каждой страницы по технологии, имитирующей расчет PageRank. Создаются отчеты с указани‑ем всех страниц, ссылающихся на 404 ошибки, а также всех страниц, с которых стоят редиректы.# обработчик контента

Система определяет уникальность контента каждой страницы сайта по отношению к другим его страницам, сравнивая содер‑жание всех страниц между собой. Модуль сравнения основан на собственной технологии построения хешей частей страниц с использованием технологии шинглов, что обеспечивает большую скорость и точность полученных данных. Система также определяет страницы с недостатком и переизбытком контента.

ФАКт

2Бывает, что  в  формуле полностью отсут-ствует статичный текст. Переменные могут быть выражены как  элементом БД (наиме-нование модели, название марки, цена), так и браться из словаря, который заранее гото-вит копирайтер.

Page 81: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 79

Пример:

«Фабрикой [M] производится классиче-ская и  современная [A]. Модель [N] от-личается от [B]. Позвоните прямо сейчас +7 495 777-77-77».

A = [мебель для  кухни|кухонная мебель]

B = [элегантностью и уникальным ди-зайном|оригинальным дизайном и  на-дежностью конструкций]

M = $fabrique

N = $model

4.6. Автоматизация генерации контента

автоматизация генерации описаний товаров

Аналогично с  Description настраивается по  формуле3 типа [Текст] [x] [Текст] [y] [z] [a] [b] [Текст].

Пример:

«Фабрикой [M] производится классиче-ская и современная [A]. Модель [N] отли-чается от [B]».

A = [мебель для  кухни|кухонная мебель]

B = [элегантностью и уникальным ди-зайном|оригинальным дизайном и  на-дежностью конструкций]

M = $fabrique

N = $model

автоматизация генерации технических характеристик (уровень 1)

Аналогично настраивается по  формуле типа [x] [A]; [y] [B]; [z] [C];

# HTML-валидатор

Модуль обрабатывает HTML‑код каждой страницы, выделяя содержание всех важных HTML‑тегов: TITLE, Meta keywords, Meta description, STRONG, B, EM, H1‑H6. Система выстраивает отчеты по дублированию содержимого этих тегов, а также делает срезы по страницам, где важные HTML‑теги пусты.# Среда для аналитики – http://СайтРепорт.РФ /

Вы изучаете полученные данные и на основании их планируе‑те, как вам дальше продвигать сайт.Система перекачивает до 5 000 страниц вашего сайта.

Какую информацию вы получите о сайте:• Общий анализ сайта.• Анализ внутреннего анкор‑листа.• Расчет распределения весов между страницами при пере‑

линковке по классической формуле PageRank.• Поиск битых ссылок.• Поиск сквозных ссылок.• Проверка HTML‑кода всех страниц на валидность.• Анализ корректности <noindex> и rel=nofollow.• Генератор sitemap.xml.• Анализ внутренней перелинковки.• Сводные отчеты с графиками по перелинковке.• Проверка на наличие сайта в крупных каталогах.• Поиск страниц с исходящими внешними ссылками.• График распределения страниц по ответу сервера.• Поиск страниц с 404 ошибками.• Поиск страниц с 3** редиректами.• Оценка размера страниц и скорости их загрузки.• График распределения страниц по уровням вложенности.• Список 100 % дубликатов страниц, одинаковых в рамках

сайта.• Список 90 %+ дубликатов страниц, одинаковых в рамках

сайта.• Анализ заполненности страниц.• Пустые страницы.• Отчет «На какие страницы ссылается данная».• Отчет «Какие страницы ссылаются на данную».• Анализ TITLE.• Страницы с одинаковыми TITLE.• Дубликаты Keywords.• Дубликаты Description.• Страницы с пустыми TITLE.• Оценка составления заголовков H1‑H6.• Анализ разметки STRONG и B.• Анализ разметки EM.

3Бывает, что  в  формуле полностью отсут-ствует статичный текст. Переменные могут быть выражены как  элементом БД (наиме-нование модели, название марки, цена), так и браться из словаря, который заранее гото-вит копирайтер.

Page 82: Л.Гроховский - Руководство по внутренним факторам

80 Работа с авторским контентом

Пример:

«Вес шкафа 213 кг. В  высоту шкаф 10 м. В длину 8 м».

A = [213 кг]

B = [10 м]

C = [8 м]

x = [Вес шкафа | Масса шкафа | Шкаф весит | Вес | Масса | Насколько тяжелый]

y = [Высота шкафа| В высоту шкаф | Вы-сота | В высоту | Высота от пола | Габари-ты: высота]

z = [Длина шкафа | Габариты: ширина | Длина | В длину шкаф | В длину]

автоматизация генерации технических характеристик (уровень 2)

Строим зависимости переменных от зна-чений: выставляем пороги.

вес: крохотный 0–100; небольшой 100–200; не  очень большой 200–300; доста-точно большой 300–400; огромный 400+. В  этом случае дописываются текстовые блоки из разных словарей.

Пример: Вес шкафа не очень большой – всего 213 кг, можно хранить в помещени-ях, не оборудованных укрепленными пе-рекрытиями. В высоту шкаф займет около 10 м  – впишется в  складское помещение с высокими потолками. В длину – 8 м, до-статочно емкий, чтобы хранить большое количество грузов.

4.7. обнаружение дубликатовДубликаты – это, как правило, «побочный эффект» некоторых характеристик сайта, как-то:

наличие сквозного блока с контентом,

недостаток контента,

конструкция страниц списка анонсов,

особенности CMS, из-за которых полно-стью дублируются страницы.

• Анализ robots.txt.• Лемматизация всего контента на сайте.• Анализ плотности ключевых слов на каждой странице.• Поиск страниц, содержащих ключевые словосочетания

по сайту.• Представление контента каждой страницы без <HTML>

кода.• Анализ данных whois‑домена.• Настройка маски страниц, которые система анализирует,

т. е. можно, например, проанализировать только страницы, содержащие в URL / beauty /, или все, кроме страниц, содер‑жащих в URL thread.php.

• Настройка глубины анализа страниц.• Возможность настроить robots.txt для робота‑индексатора

системы.• Отчет только по входным страницам.• Анализ установленных метрик.• Количество ссылок в Yahoo.• Анализ скорости загрузки страниц.• Анализ размеров страниц.• Список всех страниц, на которых встречается любая форма

заданного слова.• Отчет по наиболее часто употребляемым словам всего сайта.• Экспресс‑отчет по типичным ошибкам сайта.• Структура и иерархия сайта.• Сравнение индексации типов страниц и категория в поиско‑

вых системахи множество других отчетов, список которых мы постоянно расширяем.

некоторые графики из отчета:• График заполненности TITLE

• График дубликатов в теге TITLE

Page 83: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 81

Обнаружить дубликаты можно двумя пу-тями: вручную и автоматически.

Инструкция по обнаружению дубликатов вручную

Нет необходимости объяснять, почему вручную дубликаты обнаружить сложно. Этот способ подходит лишь для  неболь-ших сайтов, где все страницы можно вни-мательно просмотреть, но даже в этом слу-чае погрешностей не избежать.

Для  ручной проверки воспользуйтесь следующим алгоритмом:

1. Анализируем данные Яндекс.Вебма-стер. Просмотрите, какие страницы Ян-декс решил удалить из результатов поис-ка. Именно они нас интересуют.

2. Через расширенный поиск Яндекса ищем все страницы, проиндексирован-ные с  данного сайта, и  ставим режим отображения 50 результатов на страни-це. Прокликиваем все проиндексирован-ные Яндексом страницы, если их меньше 500, просматриваем каждую из них вруч-ную. Если страниц больше 500, прокли-киваем только первые 500, у остальных просто просматриваем сниппеты. Этой информации хватит для  поверхностно-го анализа сайта на  дубликаты. Далее смотрим страницы, проиндексирован-ные в  Google, особенно обращая вни-мание на те, которых не было в Яндексе (они будут подсвечены в браузере синим цветом, так как вы их еще не посещали). Во время просмотра вы обнаружите часть дубликатов.

3. Просматриваем структуру сайта, вни-кая, каким образом формируется контент на  страницах, откуда берутся текстовые блоки, где возникают блоки дублирующе-гося контента.

4. Ищем контент внутри сайта по точному вхождению (для этого нужно пассаж тек-ста искать в Яндексе с использованием опе-раторов «кавычки» и  «восклицательный

• Анализ сайта на наличие сквозных ссылок

• Анализ исходящих ссылок

• Анализ глубины вложенности страниц сайта

• Анализ сайта на наличие дубликатов страниц

Page 84: Л.Гроховский - Руководство по внутренним факторам

82 Работа с авторским контентом

знак»: «!слово!слово!слово») с  основных входных страниц. Особенно здесь можно выделить главную страницу. Если дубли-каты есть, вы их увидите.

Способы автоматизации обнаружения дубликатов

Для  автоматического анализа нужно воспользоваться специализированными приложениями. На  момент написания книги существует всего одна програм-ма, доступная к  бесплатному использо-ванию и  способная провести подобный анализ, – «СайтРепорт».

Некоторые системы способны сделать не-большую часть анализа, но все они явля-ются пользовательскими и  используют мощности вашего компьютера, что очень сильно ограничивает объемы сканируе-мой информации. Сайт из нескольких со-тен страниц просканировать получится, но интернет-магазины с десятками тысяч страниц таким системам не по зубам.

Для поверхностного анализа я могу ре-комендовать некоторые программы. Например,

Semonitor осуществляет следующие операции:

поиск битых/нерабочих ссылок;

поиск «потерянных» файлов;

поиск недочетов и ошибок в html-коде;

создание подробного отчета по всем ис-ходящим ссылкам с данного сайта;

NetPromoter выполняет такие задачи:

проверка работоспособности ссылок на сайте;

поиск неработающих ссылок;

определение размера страниц.

К сожалению, эти программы не помогут вам в обнаружении дубликатов. Серьезный анализ можно сделать лишь с помощью од-ной системы, имя которой – «СайтРепорт».

Иван Севостьянов, генеральный директор «вебПроекты»:

–Контент очень важен для любого сай‑та. Еще 2–3 года назад можно было

пренебрежительно относиться к содержанию сайта, копировать информацию с чужих сайтов или вовсе не наполнять сайт полезной для посетителя информацией.Сейчас такие методы не работают, и в дальнейшем требования к текстовой составляющей сайта со стороны поисковых машин будут только расти.У контентной составляющей любого интернет‑сайта есть три проблемы. Первая – воровство контента. Вторая – стоимость создания контента. Третья – определение первоисточника контента.К сожалению, контент воровали, воруют и будут воровать, так как правовые механизмы защиты авторского права в Интер‑нете еще должным образом не отработаны, и даже если вы выиграете судебное дело, то затраты времени на судебное разбирательство будут много выше, чем сумма компенсации.Контент – дорогое удовольствие, особенно если у вас крупный контентный проект. Написание 1 страницы хорошего контента стоит от 300 рублей. Даже если у вас 200 страниц на сайте, то это уже 60 тысяч. А если страниц несколько тысяч, то сумма будет еще выше. Частично проблему можно решить за счет автоматической генерации контента, но это подойдет не всем сайтам. Поэтому вкладываться в контент спешат не все, особенно учитывая то, что его все равно могут своровать.Третья проблема – поисковики до конца не научились опреде‑лять первоисточник контента. Это тоже мешает вкладываться в написание уникального контента, так как вы можете сделать сайт с качественным контентом, его своруют, а поисковая система первоисточником может посчитать именно сайт с ворованным контентом.С сожалению или к счастью, выход один – писать уникальный и качественный контент, учиться защищать его от воровства, отстаивать свою позицию перед поисковиками в спорных ситуациях. И самое главное – помнить, что контент пишется для людей, а не для роботов!

МненИе

Page 85: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 83

Резюме: Существует две методи-ки обнаружения дубликатов: руч-ная и автоматизированная. Ручная бесплатна, но  менее эффектив-на. Для автоматизированного ана-лиза идеально подходит система «СайтРепорт» либо некоторые са-мописные разработки, используе-мые компаниями-лидерами рынка для собственных нужд.

Константин Шурыгин, генеральный директор автоматического сервиса по продвижению сайтов «Маремото»:

–Проблема дублированного контента в реальности стоит даже острее,

чем отмечено выше. В настоящий момент я веду переписку с Яндексом, который только что удалил из индекса уважаемый 8‑летний сайт, имеющий хорошие по‑казатели авторитетности и 62 000 естественных ссылок. Вместо него «главным зеркалом» был признан безвестный клон трех месяцев от роду, имеющий всего 5 платных ссылок, укравший чужой контент. Авторитетный сайт был удален и из каталога Яндекса, а его место здесь занял вынырнувший из ниоткуда дубль. От аргументов Платона Щукина веет безысходностью: «…если даже описание в каталоге Яндекса будет перенесено вручную на правильный адрес, оно автоматически вернется обратно через некоторое время, потому что ваш сайт все еще является неглавным зеркалом. Пока сайты – зеркала, перенос описания не поможет. Как только сайты перестанут быть зеркалами, напишите нам снова по вопросу возвраще‑ния в каталог…».Как показывает опыт, «раззеркаливание» может занять от одной недели до трех месяцев. За это время владелец клона с ворованным контентом обычно успевает разослать всем вла‑дельцам ссылающихся сайтов письма с просьбой «обновить ссылки в связи с переездом сайта на новый адрес». В качестве аргумента обычно приводят «новый» адрес, указываемый в Яндекс.Каталоге. Таким образом рейдерам удается украсть у ничего не подозревающих владельцев сайта не только тысячи страниц уникальных текстов, но и место в каталоге Яндекса, а также накопленную годами ссылочную базу, а потом и PageRank. Даже если впоследствии двойник будет удален из Яндекса, такой клон может зависнуть в ссылочных биржах и годами приносить доход своим владельцам.Часто дубли вашего сайта создают конкуренты, которые выка‑чивают ваш контент программами типа Teleport или Webcopier, размещают его на бесплатных хостингах, накачивают бесплатными или платными ссылками, а также дают на этот сайт рекламу в Директе. Этого бывает достаточно, чтобы спро‑воцировать Яндекс к неверному зазеркаливанию сайтов.Однако бывает и так, что дубли вашего сайта создают вовсе не злоумышленники. Дубли может создать ваш собствен‑ный веб‑мастер, заполняя зеркалами все выкупленные корпоративные домены. Часто это дело рук давно уволенного веб‑мастера, который это делал из благородных намерений не оставить тайп‑сквоттерам ни одного шанса. Так, однажды столкнувшись с проблемами в продвижении корпоративного сайта, я обнаружил 17 зеркал на доменах второго уровня, о су‑ществовании которых никто из владельцев понятия не имел. В таких случаях организация 301 редиректа на главное зеркало и наличие директивы Host в robots.txt всех доменов помогает избежать больших проблем.

МненИе

Page 86: Л.Гроховский - Руководство по внутренним факторам

84 Работа с авторским контентом

Но неожиданнее всего бывает ситуация, когда зеркала сайта делают… сервера сами. На некоторых версиях сервера Apache поддомены третьего уровня по умолчанию заполняются содержимым домена второго уровня. Если веб‑мастер создает поддомены с прицелом «на будущее», то они неожиданно для всех могут стать клонами основного сайта. Это может вы‑звать «зазеркаливание», катастрофическое падение позиций в выдаче Яндекса, заметное сокращение целевого трафика и продаж. А всему виной – один‑единственный символ *, который надо было удалить из настроек сервера.Следует постоянно следить за появлением «зеркал» своего сайта в Интернете. При наличии более авторитетных дублей вашего контента, продвижение сайта будет неэффективным, пока вы не решите проблему с этими зеркалами. Перед нача‑лом продвижения определяет наличие у сайта авторитетных зеркал. Ведь при наличии таких зеркал продвижение сайта будет нестабильным, а результат будет отсутствовать.

Page 87: Л.Гроховский - Руководство по внутренним факторам

К од ответа – это инструкция, кото-рую получает посетитель, захо-дя на страницу сайта. С помощью

этой инструкции браузер может скоррек-тировать обработку страницы на стороне посетителя. На первый взгляд, код ответа сервера – фактор, не имеющий никакого отношения к продвижению сайтов. Одна-ко это не так. Да, настройки ответа серве-ра не могут улучшить ранжирование сай-та, но  допущенная в  них ошибка может поставить крест на ваших планах покоре-ния топа результатов поиска. Поисковые роботы, как и посетители, учитывают коды ответов сервера и на их основании коррек-тируют обработку страниц. В частности, по кодам ответа поисковые системы при-нимают решение о том, что:

страница существует и  работает корректно;

страница не существует;

страница перемещена навсегда;

страница временно перемещена;

сервер загружен и не может обработать запрос.

Существуют и  другие, менее значимые, инструкции.

5.1. Код ответа 200Поисковые системы добавляют в свою ин-дексную базу только те страницы, которые отдают код ответа 200, означающий «стра-ница существует и доступна для просмо-тра». Все важные страницы, которые мы

Глава 5Коды ответов сервера

Page 88: Л.Гроховский - Руководство по внутренним факторам

86 Коды ответов сервера

хотим «скормить» поисковому роботу, дол-жны отдавать код ответа 200.

Если страница использует редирект и лишь после перемещения отдает код ответа 200, поисковая система индексирует только ко-нечную страницу. Страница-шлюз может быть удалена или понижена в ранжирова-нии (это зависит от типа редиректа).

Если страница отдавала код ответа 200 и  попала в  индексную базу, но  позже была удалена и теперь отдает код 404, она со временем удаляется из индексной базы.

Если на странице поставить 301 редирект, то через некоторое время она будет так-же удалена из индекса, а ее вес в некото-рых случаях будет передан той странице, на  которую ссылался редирект. К  сожа-лению, Яндекс очень долго осуществляет переиндексацию страниц с  редиректом: были зафиксированы случаи, когда пере-клейка происходила почти год.

5.2. Коды ответов 301 / 302 / 303 / 307 / 3**Существует большое количество кодов для обозначения редиректа. Укажем здесь основные, наиболее важные для поиско-вых систем:

301  – «постоянное перенаправление». Означает, что  страница перемещена на-всегда. Этот редирект используется чаще всего. В случае если адрес страницы изме-нился навсегда, что происходит, например, при редизайне или реструктуризации сай-та, 301 редирект позволяет сохранить вхо-дящие внешние ссылки за счет переклейки их веса на новые адреса страниц. Яндекс обрабатывает этот редирект очень долго, может пройти до года, прежде чем страни-цы склеятся.

302 / 303 / 307  – «временное перена-правление». Веб-мастер таким образом указывает роботу поисковых систем, что  страница перемещена временно,

николай Хиврин:

–Значимость верного использования кодов ответов сервера трудно

переоценить. Правильная работа с ними может позволить совершенно безболезнен‑но перейти на новую систему управления и адресацию web‑сайта. В сфере поискового продвижения особенное внимание стоит уделять трем кодам ответов: 200, 404 и 301. Пожалуй, самой частой ошибкой сегодня является неверное использование редиректов 301. Они могут отсутство‑вать вообще, а могут вести последовательно через несколько адресов. Другой важной проблемой является дублирование содержимого, а это возникает из‑за того, что у ряда сгенериро‑ванных адресов возникает код ответа 200. Правильная работа c кодами ответов сервера является очень важным навыком для поискового оптимизатора и позволяет избежать целого ряда очень серьезных ошибок.Рассмотрим наиболее распространенную ситуацию, в которой предыдущая версия сайта компании сильно устарела. Компа‑ния хочет обновить свой сайт, однако боится потерять позиции в результатах поиска, а как следствие, и источник новых клиентов. Как правило, обновление сайта связано с установкой новой системы управления (CMS), в результате чего на сайте создается новая структура адресов страниц. Если осуществить переход на новую адресацию, то, конечно же, все старые страницы пропадут из индекса поисковых систем, а вместе с ними и позиции по ключевым запросам. Однако если сделать 301 редиректы с каждого старого адреса на новые страницы, то этой проблемы можно избежать. Поисковые роботы и по‑сетители сайта будут перенаправляться на новые страницы, что позволить полностью сохранить их вес и не потерять позиции в результатах поиска.Другая распространенная ошибка: интернет‑магазин содержит каталог, он генерирует очень большое количество внутренних ссылок, а структура их бывает хаотичной. В результате этого поисковые роботы могут попасть на такие страницы, адреса которых совсем не были предусмотрены разработчиком проекта. Для того чтобы эти страницы не засоряли индекс поисковых систем, нужно правильно расставить ошибки 404 и исключить эти страницы из индекса.

МненИе

Page 89: Л.Гроховский - Руководство по внутренним факторам

Коды ответов сервера 87

а значит, ее не нужно удалять из индекс-ной базы. В этом случае Яндекс может до-бавить в свою базу обе страницы, но ото-бражать только одну из них в результатах поиска.

Из инструкций Яндекс .вебмастер:

При  постоянном перенаправлении (301) между внутренними страницами хоста в результатах поиска будет отобра-жаться цель.

При  временном перенаправлении (302 / 303 / 307 / Meta refresh) между вну-тренними страницами хоста в  результа-тах поиска будет отображаться наиболее компактный URL.

типичные ошибки:

Вместо 301 стоит конструкция вида 302 —> 302 —> 302 —> 301

Резюме: если вы изменили адрес страницы, выложили новую вер-сию сайта или  просто хотите убрать дубликат (например, скле-ить / site / и / site), используйте 301 ре-директ. Важно использовать именно одношаговый редирект, не создавай-те сложных конструкций из несколь-ких редиректов.

5.3. Код ответа 404Код ответа 404 используется для указания браузеру или поисковой системе, что стра-ницы не  существует. Сервер в  этом слу-чае отображает или стандартную страни-цу «по этому адресу ничего не найдено», или страницу-заглушку, если создан спе-циальный шаблон для  несуществующих страниц.

Важно не  путать серверный ответ 404 и  404-ю страницу-заглушку. Некоторые веб-мастера по каким-то им одним ведо-мым причинам на  404-й странице раз-мещают заглушку с  указанием «страни-ца не существует», но на уровне сервера

Другая распространенная ошибка: интернет‑магазин содержит каталог, он

генерирует очень большое количество внутренних ссылок, а структура их бывает хаотичной. В резуль‑тате этого поисковые роботы могут попасть на такие страницы, адреса которых совсем не были предусмотрены разработчиком проекта. Для того чтобы эти страницы не засоряли индекс поисковых систем, нужно правильно расставить ошибки 404 и исключить эти страницы из индекса.

Page 90: Л.Гроховский - Руководство по внутренним факторам

88 Коды ответов сервера

отдают код ответа 200. Посетитель этого не замечает, но поисковая система воспри-нимает такие страницы как  существую-щие, индексирует их и заносит в свою базу как дубликаты. Используя подобную уяз-вимость, на сайте вы можете создать сколь угодно большое количество дублирующих-ся страниц, понизив вес сайта для поиско-вой системы.

типичные ошибки:

вместо 404 стоит 200,

вместо 404 стоит 301 —> 404,

вместо 404 стоят конструкции типа 302 —> 302 —> 301 —> 404.

Резюме: если страницы не сущест-вуют, сервер должен отдавать от-вет 404.

В этой главе мы разобрали основные сер-верные ответы и методы работы с ними. Используя эту информацию, вы можете избежать фатальных ошибок, приводя-щих к исключению страниц сайта из вы-дачи, созданию дополнительных дублика-тов и потере веса при переклейке страниц.

рекомендация: Для ручной проверки кода ответа используйте бесплатный плагин LiveHTTPHeaders для Firefox. С его помо-щью вы сможете отследить весь путь ре-директов и  узнать конечный код ответа каждой страницы сайта. Автоматизиро-ванная же проверка всех страниц на код ответа доступна в  анализе, проводимом программой «СайтРепорт.РФ».

В этой главе мы разобрали основные серверные ответы и методы работы с ними.

Используя эту информацию, вы можете избежать фатальных ошибок, приводящих к исключению страниц сайта из выдачи, созданию дополнитель‑ных дубликатов и потере веса при переклейке страниц.

Page 91: Л.Гроховский - Руководство по внутренним факторам

Консорциум всемирной па-утины (англ . World Wide Web Consortium, W3C) – организация,

разрабатывающая и  внедряющая техно-логические стандарты для Всемирной па-утины. Консорциум возглавляет сэр Ти-моти Джон Бернерс-Ли, автор множества разработок в  области информационных технологий.

W3C разрабатывает для Интернета единые принципы и стандарты (называемые реко-мендациями), которые затем внедряются производителями программ и оборудова-ния. Таким образом достигается совмести-мость между программными продукта-ми и аппаратурой различных компаний, что  делает Всемирную сеть более совер-шенной, универсальной и удобной.

Миссия W3C: «Полностью раскрыть потен-циал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети»4.

Так, существует ряд стандартов HTML-верстки. Эти стандарты носят рекомен-дательный характер, но, как  пишет пер-воисточник www.w3c.org, являются желательными. Что  это означает? Суще-ствуют теги, имеющие смысловое значе-ние: заголовки, визуальное выделение тек-ста и т. п. По стандартам W3C, выделенный

Глава 6Стандарты W3C

4По материалам Википедии

Page 92: Л.Гроховский - Руководство по внутренним факторам

90 Стандарты W3C

этими тегами текстовые элементы дол-жны иметь соответствующую смысло-вую нагрузку. Например, тег H1 должен содержать заголовок страницы, пото-му что  поисковая система воспринима-ет содержание тегов H1 именно как заго-ловок, то есть очень краткое содержание страницы.

К чему приводит игнорирование реко-мендаций W3C

Верстальщики часто игнорируют рекомен-дации W3C. Это понятно, ведь перед ними не стоит задача поискового продвижения: они получают деньги лишь за корректное отображение сайта в популярных браузе-рах на распространенных разрешениях мо-нитора. В свою очередь, браузеры стремят-ся обладать максимально универсальным алгоритмом распознавания HTML, чтобы сайты с ошибками верстки отображались корректно. В  результате верстальщики, например, используют теги H1 для  обо-значения элементов меню, настоящие за-головки выделяют тегами SPAN, создают пересечения тегов заголовков H1 с ссыл-ками A. Для верстки это неважно: бра узер отобразит текст в  виде заголовка, даже если текст будет оформлен тегом P, но че-рез CSS будут прописаны соответствующие параметры визуального отображения.

Поисковые системы разборчивее браузе-ров: они не пытаются определить, как ви-зуально отображается элемент страницы, а  руководствуются исключительно стан-дартами W3C. Так, найдя на странице H1, они воспринимают его содержимое имен-но как заголовок страницы. И вот тут возни-кает самое интересное: какая информация содержится на странице, если ее заголовок выглядит как «Каталог» или «11.10.2011»? Какие услуги продает сайт, какие товары представлены на этой странице? К сожале-нию, при такой верстке потенциал факто-ров HTML-тегов остается незадействован-ным для поискового продвижения.

Поисковые системы разборчивее браузе‑ров: они не пытаются определить, как визу‑

ально отображается элемент страницы, а руковод‑ствуются исключительно стандартами W3C.

Page 93: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 91

Чтобы вы смогли избежать ошибок, в этой главе мы разберем самые важные правила HTML-верстки, с  точки зрения стандартов W3C, а следовательно, с по-зиций SEO.

6.1. Правила HTML-разметки для SEO

Итак, поговорим об  основных тегах, важных для  SEO, опишем специфику их  использования и  подробно остано-вимся на  правилах компоновки тегов на  страницах сайта для  улучшения его ранжирования.

<TITLE>

Тег TITLE используется для  обозначения заголовка страницы. Это самый важный тег, он больше всех увеличивает вес стра-ницы по ключевым словам. Сделать в нем ошибки достаточно сложно, но некоторые рекомендации стоит учесть.

Каждая страница обязательно должна иметь уникальный заголовок, нельзя дуб-лировать заголовки TITLE между страни-цами сайта. Используйте ключевые сло-ва, но не повторяйте ключ более трех раз. Если повтора избежать не удается, вклю-чайте не менее трех разбавляющих слов между повторяющимися ключевыми словами.

Заголовок не обязательно должен быть со-ставлен грамотно с точки зрения русско-го языка, но он должен быть продающим, привлекательным и  содержательным. При  составлении заголовков рекоменду-ем проанализировать заголовки конку-рентов в топ-10 и составить собственные по их подобию.

<H1–H6>

Текстовые заголовки H1–H6 по значимо-сти следуют сразу за заголовком страницы TITLE. В этих заголовках важно употреб-лять ключевые слова.

Тег TITLE используется для обозначения заголовка страницы. Это самый важный тег,

он больше всех увеличивает вес страницы по ключевым словам. Сделать в нем ошибки достаточно сложно, но некоторые рекомендации стоит учесть.

Page 94: Л.Гроховский - Руководство по внутренним факторам

92 Стандарты W3C

На странице должен быть только один за-головок H1, количество подзаголовков H2–H6 не лимитировано, но не стоит де-лать их слишком много: вес ключевых слов распределяется по количеству заголовков на  странице. Теги H1–H6 имеют очень большой вес, но их можно использовать только для визуального выделения тексто-вых заголовков. При этом содержимое за-головка H1 не рекомендуется дублировать между страницами сайта.

Важно понимать, что навигационная стро-ка и элементы меню не являются заголов-ками страницы и  должны обозначаться иными тегами, в частности тегом выделе-ния ссылки A.

<B> и <STRONG>

Теги B и STRONG должны использовать-ся для визуального выделения текста жир-ным написанием. Визуально акцентируя ключевые части страницы, то есть обра-щение к посетителю, поисковые системы повышают вес страницы по запросам, со-держащимся в тегах STRONG и B, но толь-ко в том случае, если их содержимое кор-релирует с текстом страницы.

Важно, чтобы в этих тегах не содержалось мусора. Обозначайте ими ключевые слова и помните, что встречающиеся в этих тегах ключи нужно также употребить на стра-нице и без тегов, чтобы поисковая систе-ма не воспринимала это как спам. Не сто-ит злоупотреблять тегами, несколько их употреблений на  странице будет вполне достаточно.

Следует отметить, что  теги B и  STRONG (также как I и EM), несмотря на сходство визуального отображения, неидентичны. B – тег физической разметки, задающий жирное начертание текста. STRONG – тег логической разметки, определяющий важ-ность помеченного текста. Такое разделе-ние тегов на логическое и физическое фор-матирование изначально предназначалось

Важно понимать, что навигационная строка и элементы меню не являются заголовками

страницы и должны обозначаться иными тегами, в частности тегом выделения ссылки A.

Page 95: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 93

для того, чтобы сделать HTML универсаль-ным, в том числе не зависящим от устрой-ства вывода информации. Теоретически, если воспользоваться, например, рече-вым браузером, то  текст, оформленный с помощью тегов B и STRONG, будет отме-чен по-разному. Получилось так, что в по-пулярных браузерах результат использова-ния этих тегов равнозначен. Но для нужд SEO рекомендуется использовать выделе-ние «логическим» тегом STRONG.

<EM>

Тегом EM принято выделять курсивное написание на  странице: цитату, назва-ние или просто термин в тексте. Этот тег тоже повышает вес страницы по  ключе-вому слову, хотя по значимости уступает предыдущим.

<P>

Тег P обозначает текстовый абзац. Важно использовать его именно для выделения абзаца, а не каждого предложения, как это реализовано во многих CMS. Для разрыва строки можно использовать тег BR. Текст на странице лучше выделять с помощью тега абзаца P, чем  заменителей вроде SPAN: последний универсален и не имеет логической нагрузки.

рекомендации по использованию важ-ных для SEO тегов:

Грамотно используйте связки <H1>–<H6> и <P>

Заголовок H1 должен включать в себя ос-новные ключевые слова, содержащиеся на странице. Заголовками H2–H6 обозна-чаем начало абзаца. В них должны содер-жаться основные ключевые слова, характе-ризующие последующий абзац P. В абзацах P, написанных до следующего заголовка, важно употребить те  же ключевые сло-ва. Ключевые слова могут повторяться и в других абзацах, но в указанной области они должны иметь максимальную концен-трацию, в этом случае возникает синергия,

Тегом EM принято выделять курсивное написание на странице: цитату, название

или просто термин в тексте. Этот тег тоже повыша‑ет вес страницы по ключевому слову, хотя по значимости уступает предыдущим.

Page 96: Л.Гроховский - Руководство по внутренним факторам

94 Стандарты W3C

значительно увеличивающая вес страни-цы по ключевым словам.

Обозначение тегами должно быть об-основано в соответствии со стандартами W3C

Все перечисленные выше теги должны нес-ти указанный логический смысл. Напри-мер, H1-H6 следует использовать толь-ко для выделения логических заголовков, для визуального форматирования сущест-вует универсальный тег SPAN.

Теги не  должны пересекаться друг с другом

Теги, имеющие логический смысл, не дол-жны пересекаться друг с другом. Заголовок не должен быть ссылкой, выделение жир-ным не  должно пересекаться с  заголов-ком. Конструкции вида <H1><A>Заго-ловок 1< / A>< / H1> недопустимы. Если здесь важнее ссылка, нужно оставить толь-ко <A>< / A> с указанием настроек визу-ального отображения через CSS. Заголовок лучше дописать рядом, но для его выделе-ния оставить только тег <H1>< / H1>.

Теги не должны ставиться бессмысленно

Многие CMS, содержащие блок визуаль-ного редактирования контента, работают с  ошибками, порождая, например, кон-струкции вида <B>&nbsp;< / B>. Такие элементы в коде страницы недопустимы, и все подобные ошибки должны быть уда-лены, чтобы не размывать вес значимых тегов.

Теги не должны использоваться для об-мана поисковых систем

Недопустимо употребление тегов STRONG, имеющих визуальное отображение, иден-тичное с  текстом страницы. Выделение подобными тегами должно действитель-но менять визуальное отображение эле-мента и  отграничивать его от  окружаю-щего текста.

Теги должны закрываться

Многие CMS, содержащие блок визуального редактирования контента, работают

с ошибками, порождая, например, конструкции вида <B>&nbsp;< / B>. Такие элементы в коде страницы недопустимы, и все подобные ошибки должны быть удалены, чтобы не размывать вес значимых тегов.

Page 97: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 95

Рекомендуется все страницы сайта прове-рять на  наличие ошибок верстки. Часто бывает так, что открывающий тег на стра-нице есть, а закрывающего нет. Подобные ошибки, как правило, визуально заметны при  заходе на  страницу, но  в  некоторых случаях посетителям они не видны, а поис-ковые системы при этом не могут коррект-но отранжировать содержимое страницы.

6.2. Проверка верстки на соответствие стандартам W3C

К счастью, вам не придется в поисках оши-бок вручную проверять HTML-код. Суще-ствует бесплатный сервис, определяющий его валидность. Сервис доступен по адре-су http://validator.w3.org / unicorn / , где для проверки валидности кода вам нужно просто ввести адрес сайта.

Должен заметить, что на 100 % валидных сайтов практически не  существует, ведь бессмысленно доводить код до  идеала. Выше мы разобрали самые важные фак-торы, которые и являются теми контроль-ными точками, которые вам нужно прове-рить через валидатор.

Не  смущайтесь, если найдете на  сайте ошибку тега <NOINDEX>: он не является валидным, поскольку по стандартам HTML его не существует. <NOINDEX> введен по-исковой системой Яндекс для того, чтобы облегчить жизнь себе и оптимизаторам.

Недопустимо употребление тегов STRONG, имеющих визуальное отображение,

идентичное с текстом страницы. Выделение подобными тегами должно действительно менять визуальное отображение элемента и отграничи‑вать его от окружающего текста.

Page 98: Л.Гроховский - Руководство по внутренним факторам

96 Стандарты W3C

Не смущайтесь, если найдете на сайте ошибку тега <NOINDEX>: он не является

валидным, поскольку по стандартам HTML его не существует. <NOINDEX> введен поисковой системой Яндекс для того, чтобы облегчить жизнь себе и оптимизаторам.

Page 99: Л.Гроховский - Руководство по внутренним факторам

яндекс.вебмастер (чему можно доверять, а чему нет)

ВЯндекс.Вебмастере можно найти коли‑чество страниц вашего сайта в индексе,

количество ссылок на ваш сайт и количество ссылающихся сайтов. Но можно ли доверять этим цифрам?Замечено, что от апдейта к апдейту показываемые веб‑масте‑ром числа могут изменяться в разы. Например, количество страниц в индексе прыгает от 50 тысяч до 10 тысяч и обратно.Такие скачки не соответствуют действительности и обращать внимание на них не нужно (если они не сопровождаются резкими изменениями трафика). Чтобы узнать реальное количество страниц вашего сайта в индексе, нужно проверить каждую из них вот таким запросом: url:site.ru / page / То же самое относится и к выгрузке всех внешних ссылок. Данные часто скачут и не отражают реальной картины, когда ссылок на сайт стоит десятки тысяч. Многие работающие ссылки могут не оказаться в выгрузке.Микроформаты

Микроформаты – это способ семантической разметки информации на веб‑страницах, использующий стандартные элементы языка HTML. Фактически мы сообщаем роботу, где и какие данные лежат в коде. В ряде случаев разметка страниц микроформатами может быть альтернативой прямой передаче данных через Яндекс.Вебмастер.Спецификации микроформатов можно найти здесь: http://microformats.org / На данный момент поисковики пока не заявляют о влиянии микроформатов на ранжирование. Однако, очевидно, что при их помощи вы можете сформировать более привлекательный сниппет. Более привлекательный сниппет –> больше CTR вашего сайта в выдаче. А CTR уже напрямую влияет на ранжирование.

ФАКт

Глава 7SEO-аналитика

Page 100: Л.Гроховский - Руководство по внутренним факторам

98 SEO‑аналитика

Эксперимент и наблюдение

Что такое наблюдение? Мы посмотрели на два сайта по запросу «пластиковые окна». У одного ТИЦ 40, он занимает первое место. У другого – 450, он на втором месте. Это наблюдение. Мы увидели некий факт.Можно ли из этого сделать вывод о том, что ТИЦ не влияет на ранжирование? Конечно же, нет. Ведь на ранжирование влияют сотни параметров и их комбинаций. И один сайт мог оказаться более релевантным за счет иных параметров.Когда оптимизатор просматривает топ, он делает много на‑блюдений. Заметив какой‑то повторяющийся факт, мы можем сформировать гипотезу (предположение).Пример гипотезы: «Частичное вхождение ключевика в URL страницы положительно влияет на релевантность».Что такое эксперимент? Это когда мы искусственно создали условия для проверки гипотезы, в которых максимально отсечены посторонние факторы.Пример эксперимента.Мы захотели проверить гипотезу «Keywords не влияет на ранжирование». Для этого зарегистрировали 10 доменов. На каждом из них разместили сайт из одной страницы с псев‑доуникальным контентом (одинаковый набор слов, объем текста и т. д.) В каждом из текстов есть уникальный ключевик, например, «сковородковед». На половине из них добавили его в meta keywords, на половине – нет. Добавили сайты в поиск, подождали пока все проиндексируются. И посмотрели выдачу по запросу «сковородковед». Если 5 сайтов с keywords оказа‑лись выше других – можно сделать вывод о подтверждении гипотезы. Если же сайты оказались перемешанными – гипоте‑за опровергнута.

Page 101: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 99

Методы управления семантическим ядром для крупных проектов

Крупные проекты обычно характеризуются большим семантическим ядром. Во мно‑

гих случаях недостаточно создать хорошее семантическое ядро, нужна его регулярная актуализация. Это связано с изменением спроса: популярность части запросов падает со временем, при этом появляется спрос, не нашедший отражения в ядре.Методология формирования обширного семантическо-го ядра:

1. Сбор запросов из всех доступных источников:a) статистика запросов к поисковым системам,b)  базы ключевых слов (база Пастухова, liveinternet

и аналогичные),c) выгрузки ключевых слов входа из систем веб‑аналитики,d)  оценка видимости конкурентов по запросам (semrush.com,

megaindex.ru и пр.).2. Уточнение региональной частотности, исключая подзапросы и морфологически измененные формы терминов, оценка сезонной популярности и ссылочного бюджета по запросам.3. Кластеризация собранных запросов.4. Формирование набора страниц приземления.5. Сопоставление запросов страницам приземления.Источники данных для актуализации ядра:

1. Динамика частотности запросов:

ФАКт

Page 102: Л.Гроховский - Руководство по внутренним факторам

100 SEO‑аналитика

a) статистика запросов к поисковым системам,b) semrush.com и аналогичные сервисы.2. Собственная аналитика (конкретика зависит от выбранных KPI), например:a) отбрасываем запросы с высоким соотношением [стоимость продвижения / полученный доход],b) автоматически проверяем частотность запросов и позиции по выгруженным из системы веб‑аналитики данным, выбирая эффективные запросы (в соответствии с выбранными KPI, например, с большим временем сессии, доходом или сущест‑венным числом просмотренных страниц).Исходя из статистики запросов к поисковым системам и данных веб‑аналитики несложно оценить трафик и доход от вывода конкретного запроса на определенную позицию в ТОПе. Таким образом, возможна эффективная приоритиза‑ция простым ранжированием запросов в порядке убывания потенциального дохода.Курица или яйцо?

Что вначале – сайт или семантическое ядро? Обычно сбор запросов выполняется после создания сайта. По сути, подбор запросов – эквивалент оценки спроса. Чем раньше собира‑ется семантическое ядро – тем меньше ненужной работы приходится выполнять. Из собранных и оцененных запросов логично формируются структура каталога и товарная номенклатура.Корректный эксперимент в seo – миф или реальность?

Многие оптимизаторы ставят эксперименты. Однако действи‑тельно достоверные выводы можно получить крайне редко. Основные причины неудач:• отсутствие четко сформулированной гипотезы,• некорректная постановка эксперимента,• некорректная обработка результатов.И если первая и последняя проблемы решаются довольно просто, то корректная постановка эксперимента требует суще‑ственных интеллектуальных и технологических затрат.Воспринимая поисковую систему как черный ящик, мы можем пытаться выявить некоторые закономерности, анализируя ответ в зависимости от варьируемых входных параметров. Проблема заключается в том, что на выдачу влияет огромное число факторов. По большому счету все, что нужно, – это провести несколько тестов, варьируя один параметр и удержи‑вая неизменными все прочие. Обилие влияющих факторов усложняет постановку чистого эксперимента, однако нужно стремиться к этому.Конечно, результаты даже корректно проведенного экспе‑римента нужно использовать осмысленно. Ранжирующая формула различна для различных типов запросов и регионов. Соответственно, найденные закономерности позволяют повлиять на ранжирование в диапазоне значений конкретного фактора. Иными словами, невозможно обеспечить хорошее

Исходя из статистики запросов к поисковым системам и данных веб‑аналитики

несложно оценить трафик и доход от вывода конкретного запроса на определенную позицию в ТОПе. Таким образом, возможна эффективная приоритизация простым ранжированием запросов в порядке убывания потенциального дохода.

Page 103: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 101

ранжирование документов по сколь‑нибудь конкурентным запросам, влияя лишь на часть факторов.Альтернативные методы генерации служебных частей документов на основе правиловых алгоритмов и стати-стики поисковых запросов

Для многих типов сайтов характерно наличие большого числа похожих документов (например, финальные страницы това‑ров в интернет‑магазинах или вакансии на сайтах о работе). Понятно, что наилучшим является title, написанный вручную хорошим копирайтером с учетом семантического ядра доку‑мента. Этот подход хорош, но трудозатратен. Более дешевый путь – формирование title, description и прочих служебных компонент документа на основе правиловых алгоритмов.Первый этап – сбор семантического ядра для однотипных документов. Не принципиально, используется ли автомат или ручной труд, главное – максимальная полнота ядра.Далее в этом корпусе необходимо выделить самые частотные термины и конструкции запросов.Собственно, третий шаг – написание правил. Если структура запросов примерно одинакова для всего их набора, достаточно универсального правила, кодирующего title и description. Если структура запросов различна в различных тематиках – по‑требуется несколько правил. Правила также нужны, если есть желание разнообразить title и description даже для сходных документов.В этой задаче, равно как и в задаче автоматизированной перелинковки, может потребоваться случайное, но не‑изменное во времени распределение. Для этого отлично подходит генератор случайных чисел, инициализируемый какой‑либо константой, специфичной для документа. Самый простой вариант – URL. URL обычно не меняются и уникальны по определению.BrowseRank – технология учета поведения пользовате-лей для ранжирования документов

Одна из технологий учета поведения пользователей при ран‑жировании документов в выдаче поисковых систем – техно‑логия BrowseRank от Microsoft (https://research.microsoft.com / en‑us / people / tyliu / fp032‑liu.pdf).Граф кликов вместо ссылочного графа

Основное отличие BrowseRank от PageRank – структура графа. В технологии PageRank узлами графа являются документы,

Для многих типов сайтов характерно наличие большого числа похожих докумен‑

тов (например, финальные страницы товаров в интернет‑магазинах или вакансии на сайтах о работе). Понятно, что наилучшим является title, написанный вручную хорошим копирайтером с учетом семантического ядра документа. Этот подход хорош, но трудозатратен. Более дешевый путь – формирование title, description и прочих служебных компонент документа на основе правиловых алгоритмов.

Page 104: Л.Гроховский - Руководство по внутренним факторам

102 SEO‑аналитика

а ребрами – ссылки. В технологии BrowseRank ребра образуют не ссылки, но клики (переходы). Помимо этого, сохраняется метаинформация о продолжительности сессии в рамках документа.очевидны два существенных преимущества BrowseRank:

• существенно лучшая устойчивость к ссылочному спаму,• учет продолжительности сессии позволяет оценить полез‑

ность документа для посетителя.Поведенческий граф более достоверно отражает процесс веб‑серфинга, а, следовательно, он более полезен для расчета значимости документов. Наибольшее число посещений стра‑ницы и более продолжительное время, проведенное на ней, означают большую важность страницы.основной источник данных о поведении пользовате-лей – браузерные бары. Все ведущие поисковые системы имеют плагины, обеспечивающие мониторинг активности значительной доли аудитории. Для обработки данных о поведении пользователей предложено использовать цепи Маркова с непрерывным временем. Экспериментальные данные демонстрируют преимущество алгоритма BrowseRank по сравнению с алгоритмами PageRank и TrustRank в определе‑нии важности документов, борьбе со спамом и ранжировании.По сути, собираемые данные можно представить записью вида URL; TIME; TYPE [input | click]. Предполагается два пути пе‑рехода на документ: по ссылке с другого документа (click), либо набором URL в адресной строке браузера (input). Механизм извлечения данных о переходах:1. Сегментация сессии.

Новая сессия инициируется в случае 30‑минутной и более паузы с момента предыдущей активности, либо в случае ввода названия сайта в адресную строку.2. Формирование пар URL.

В рамках каждой сессии создаются пары URL из соседних записей. Пара URL означает, что переход был осуществлен при помощи ссылки.3. Формирование начального распределения.

В каждой сессии, сегментированной по типу перехода, первый URL введен непосредственно пользователем. Такие URL мы счи‑таем «доверительными» и называем этот трафик «зеленым». Обрабатывая данные о поведении пользователей, мы считаем переходы на эти URL следствием случайного распределения. Нормализация на частоту посещения этих документов дает начальные вероятности посещения соответствующих страниц.4. Извлечение продолжительности сессии.

Для каждой пары URL продолжительность сессии первого URL вычисляется простой разностью дат. Если URL был последним в сессии, возможны два варианта. Для сессий, сегментирован‑ных по времени, продолжительность просмотра последнего URL рассчитывается на основании данных о просмотрах других страниц. Для сессий, сегментированных по типу, время

Основной источник данных о поведении пользователей – браузерные бары. Все

ведущие поисковые системы имеют плагины, обеспечивающие мониторинг активности значительной доли аудитории. Для обработки данных о поведении пользователей предложено использовать цепи Маркова с непрерывным временем. Экспериментальные данные демон‑стрируют преимущество алгоритма BrowseRank по сравнению с алгоритмами PageRank и TrustRank в определении важности документов, борьбе со спамом и ранжировании.

Page 105: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 103

просмотра последнего URL рассчитывается исходя из времени начала следующей сессии.Результаты применения BrowseRank

Microsoft провела два исследования. Первый был сделан на уровне сайта для выявления важных сайтов и подавления спама. Второй эксперимент – на уровне документа для тести‑рования BrowseRank с целью улучшения ранжирования.

Для первого эксперимента использовался набор данных из примерно 3 миллиардов записей, содержащий примерно 950 миллионов уникальных URL. Любопытно, что распределе‑ние количества просмотров по времени отлично описывается классической экспонентой. В рамках этого эксперимента по‑страничные данные не использовались, они были агрегирова‑ны на уровне сайтов. Полученный поведенческий граф состоял из 5,6 миллиона узлов и 53 миллионов ребер.Любопытна выборка топ‑20 сайтов, полученных ранжиро‑ванием по трем разным алгоритмам. BrowseRank отлично отранжировал MySpace, Youtube, Facebook и прочие сайты, для которых характерно большое время сессии. На случайной выборке в 10 тысяч сайтов, вручную размеченной асессора‑ми, показано, что BrowserRank эффективнее, чем TrustRank и PageRank, решает задачу фильтрации спам‑сайтов.Второй эксперимент не менее интересен.Факторы ранжирования документов можно грубо разделить на две группы: факторы релевантности и факторы важности. Предполагаем итоговую функцию релевантности линейной комбинацией этих двух групп факторов:Θ * rankrelevance + (1‑Θ) * rankimportance,где Θ лежит в интервале [0;1].

Любопытна выборка топ‑20 сайтов, полученных ранжированием по трем

разным алгоритмам. BrowseRank отлично отранжировал MySpace, Youtube, Facebook и прочие сайты, для которых характерно большое время сессии. На случайной выборке в 10 тысяч сайтов, вручную размеченной асессорами, показано, что BrowserRank эффективнее, чем TrustRank и PageRank, решает задачу фильтрации спам‑сайтов.

Page 106: Л.Гроховский - Руководство по внутренним факторам

104 SEO‑аналитика

Данные взяты на выборке из сайтов, полученных для 8 000 запросов. Каждая пара запрос‑документ оцени‑валась тремя асессорами по бинарной шкале [релевантно; нерелевантно]. Релевантными сочтены документы, полу‑чившие по запросу не менее 2 оценок «релевантно».

Результат: алгоритм BrowseRank обеспечивает существенно лучшее качество вплоть до полного подавления факторов важности факторами релевантности (Θ ~ 0,9).

текстовый спам глазами поиска и современные метрики качества текстов

Точного определения поискового спама нет, есть лишь общая формулировка.

Поисковый спам – это попытки обмана поисковой системы и манипулирования ее результатами с целью завышения позиции сайтов (страниц) в результатах поиска. Сайты, использующие поисковый спам, могут быть понижены при ранжировании или исключены из поиска Яндекса из‑за невозможности их корректного ранжирования.

http://company.yandex.ru / legal / termsofuse

Понятно, что точные критерии спама поисковые системы не озвучивают, поскольку это неминуемо спровоцирует генерацию околоспамовых текстов оптимизаторов и веб‑мастерами. Между тем в арсенале поисковых систем большое количество разнообразных методов определения спама. Рассмотрим некоторые из них.

Общеизвестно, что включение термина в title улучшает ранжирование документа по этому запросу поисковы‑ми системами. Это обуславливает традиционный спам в title, поскольку оптимизаторы пытаются употребить максимальное число терминов в заголовке документа. Исследователи из Microsoft обнаружили (http://research.microsoft.com / pubs / 65140 / www2006.pdf ), что вероятность спамовости документа резко возрастает при длине title более 25 слов:

Распределение по средней длине слова также неплохо выявляет спам. Тексты, содержащие много коротких или длинных слов, неестественны и, вероятно, спамны:

Поисковый спам – это попытки обмана поисковой системы и манипулирования ее

результатами с целью завышения позиции сайтов (страниц) в результатах поиска. Сайты, использую‑щие поисковый спам, могут быть понижены при ранжировании или исключены из поиска Яндекса из‑за невозможности их корректного ранжирования.

Page 107: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 105

Весьма оригинальный и дешевый метод обнаружения спама – оценка сжимаемости текста. Для спамовых документов, содержащих множество повторений терминов, характерна высокая сжимаемость:

Интересна техника определения спамовости по доле самых частых терминов корпуса в тексте. Видно, что в спамовых текстах доля частых слов ниже, а доля редких слов – выше, чем в естественных текстах:

Примечательна публикация разработчиков Яндекса (http://download.yandex.ru / company / A_Kustarev_A_Raigorodsky_poisk_neestestvennih_textov_statia.pdf),

Общеизвестно, что включение термина в title улучшает ранжирование документа

по этому запросу поисковыми системами. Это обуславливает традиционный спам в title, поскольку оптимизаторы пытаются употребить максимальное число терминов в заголовке документа.

Page 108: Л.Гроховский - Руководство по внутренним факторам

106 SEO‑аналитика

в которой оценивалась частота встречаемости пар терминов в естественных и синонимизированных текстах. Показательно, что спамовые документы содержат большее количество редких пар и меньшее количество частых пар, чем естествен‑ные документы.Существует множество методов выявления текстового спама. Главная идея очевидна – использование традиционных оп‑тимизаторских метрик («плотность ключевого слова», «длина текста» и пр.) давно потеряло актуальность.В современных условиях намного продуктивнее писать хорошие тексты, разносторонне описывающие продукт. Важны стилистика и потребительская ценность текста. Соответствен‑но, самая честная метрика качества текста – отношение пользователей (продолжительность сессии, степень конверсии и пр.). Действительно, если качество навигации или юзаби‑лити сайта принято оценивать по поведению пользователей, почему качество текстов нужно оценивать иначе?

РеЗюМе: Бессмысленно делать нечто исключительно для поисковых систем, как ни банально звучит этот тезис. У поисковых систем достаточно ресурсов для подавления спамерских активностей.

В современных условиях намного продук‑тивнее писать хорошие тексты, разносто‑

ронне описывающие продукт. Важны стилистика и потребительская ценность текста. Соответствен‑но, самая честная метрика качества текста – отно‑шение пользователей (продолжительность сессии, степень конверсии и пр.).

Page 109: Л.Гроховский - Руководство по внутренним факторам

Глава 8Исследование «SEO-альманах 2010»

в конце 2010  года было проведено масштабное исследование факто-ров ранжирования, целью кото-

рого стала оценка значимости этих фак-торов. Подобные исследования наши зарубежные коллеги проводят с периодич-ностью раз в два года, публикуя результаты на seomoz.com. В российском проекте при-няли участие признанные эксперты рын-ка, руководители топовых компаний, спе-циалисты, успешно продвигающие сайты в самых конкурентных тематиках, разра-ботчики программ и сервисов, которыми пользуется весь рынок.

В экспертный совет вошли:

1. Анар Бабаев (Click.ru)2. Александр Баженов (Biplane)3. Василий Ткачев (All in Top)4. Леонид Гроховский (ArrowMedia)5. Николай Хиврин (ALTWeb Group)6. Елизавета Трибунская (Web Advance)7. Сергей Кошкин (SmartSEO)8. Евгений Смирнов (Viaset.ru)9. Роман Клевцов (Optimism.ru)10. Сергей Карпович (Apexes)11. Дмитрий Жохов (UnMedia)12. Алексей Довжиков (eLama)13. Тимофей Квачев (TRINET)14. Валентин Домбровский (NextUpMedia)15. Константин Леонович (Sape.ru)16. Алексей Жуков (Новотех)17. Антон Агапов (WebExpert)

Page 110: Л.Гроховский - Руководство по внутренним факторам

108 Исследование «SEO‑альманах 2010»

18. Иван Севостьянов (ВебПроекты)19. Олег Сковородников (VIPRO)20. Виктор Нагайцев (PerfectSeo)21. Денис Юрасов (Медведев Маркетинг)22. Михаил Райцин (Корпорации РБС)23. Василий Сорокин (Techart)24. Александр Люстик (MyOnlineStudio)25. Станислав Поломарь (web-it.ru)26. Алексей Елфимов (i-Media)

Исследование «SEO-альманах 2010» про-водилось с  помощью голосования. Все факторы были распределены по группам, и каждый из них оценивался по критерию влияния на ранжирование. Конечная оцен-ка определялась на основании голосов экс-пертов. Рассматривалось более 200 факто-ров ранжирования: внутренние, внешние, поведенческие, наиболее распространен-ные их связки, а также факторы, связанные с ранжированием картинок и определени-ем аффилиатов.

Методология исследования выстраива-лась на  анкетировании. Каждый из  экс-пертов оценивал факторы по  степени их значимости:

0 – не влияет вообще,

1 – влияет незначительно,

2 – стоит учитывать,

3 – сильно влияет,

4 – важнейший фактор.

Оценки каждого фактора суммировались, после чего было подсчитано процентное соотношение значимости каждого факто-ра от значимости того, который имеет са-мый высокий рейтинг в группе. Факторы объединялись в группы по признаку воз-действия: внешние факторы, внутренние, поведенческие, аффилированность, про-движение по картинкам.

Все факторы были отсортированы по сте-пени важности и отображены в процент-ных долях. Отрицательные получили от-рицательное значение.

Исследование «SEO‑альманах 2010» проводилось с помощью голосования. Все

факторы были распределены по группам, и каждый из них оценивался по критерию влияния на ранжирование. Конечная оценка определялась на основании голосов экспертов. Рассматривалось более 200 факторов ранжирования: внутренние, внешние, поведенческие, наиболее распростра‑ненные их связки, а также факторы, связанные с ранжированием картинок и определением аффилиатов.

Page 111: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 109

Итоги исследования стоит воспринимать следующим образом:

0–20 % означают, что фактор не влия-ет на продвижение,

20–40 %  – влияние фактора незначи-тельно,

40–60 %  – фактор важно учитывать при продвижении,

60–80 % – фактор значительно влияет на продвижение,

80–100 %  – фактор нужно учитывать обязательно.

Результаты исследования с  комментари-ями экспертов были опубликованы по ад-ресу http://топэксперт.рф и сразу получи-ли широкий резонанс: за  первую неделю после анонсирования только на  офици-альном сайте исследования побывало 10  тысяч человек. В  Интернете зафикси-ровано более 100 публикаций, в том чис-ле в  крупнейших отраслевых СМИ, та-ких как  seonews.ru, searchengines.ru, webmasters.ru, advertology.ru и других, так-же написаны статьи в нескольких отрасле-вых журналах, результаты исследования освещались на конференциях и семинарах.

Влияние HTML-тегов на вес ключевого слова для страницы

TITLE 100%

H1-H6 71%

STRONG 34%

Description 31%

B 27%

EM 25%

P 24%

Keywords 24%

UL –> LI & OL –> LI 13%

Page 112: Л.Гроховский - Руководство по внутренним факторам

110 Исследование «SEO‑альманах 2010»

Влияние HTML-тегов на вес ключевого слова для страницы

Ключевое слово в H1-H6 & ключевое слово в P 54%

Ключевое слово в STRONG, B, EM & ключевое слово на странице 34%

Ключевое слово в KEYWORDS и ключевое слово на странице 27%

Последовательное употребление заголовков 24%

Пересечение тегов STRONG, B, EM & A href=… –8%

Пересечение тегов H1-H6 A href=… –9%

Повтор заголовков H1, H1, H1 –15%

Пересечение тегов H1-H6 & STRONG, B, EM –25%

Содержание заголовков H1-H6, TITLE

Прямое вхождение ключевого слова в заголовке 84%

Уникальность заголовка в отношении ко всем страницам сайта 48%

Близость заголовка (H1-H6) к началу документа 47%

Близость ключевого слова к началу заголовка 43%

Длина заголовка 36%

Грамматически правильное содержание заголовка 35%

Уникальность заголовка в отношении ко всем сайтам в индексе 33%

Разбавление заголовка неключевыми словами 18%

Page 113: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 111

Содержание элементов абзаца STRONG, EM, B

Прямое вхождение ключевого слова 37%

Разбавление элемента неключевыми словами 19%

Ранжирование по ключевым словам

Наличие прямого вхождения ключевого слова в тексте страницы 94%

Словоформа ключевого слова с сохранением части речи 66%

Наличие как прямого вхождения ключа, так и его словоформы 65%

Словоформа ключевого слова с изменением части речи 40%

Соответствие регистра ключевого слова 28%

Удаление частей составного словосочетания друг от друга –77%

Текст страницы

% уникального контента по отношению ко всему индексу 82%

% уникального контента по отношению ко всему сайту 76%

Разнообразное оформление текста 47%

Близость ключевых слов к началу страницы 45%

Соответствие объема текста на странице сайтам конкурентов 40%

Выделение абзаца текста в тег <P> 30%

Наличие контента на иностранном языке 5%

Высокая плотность ключевых слов на странице –5%

Концентрация повторений ключевого слова в одной точке –22%

Визуальное уравнивание разметки текста с обычным текстом –35%

Ошибки кодировки –52%

Видимость контента (речь о таких эффектах, как display:none) –57%

Page 114: Л.Гроховский - Руководство по внутренним факторам

112 Исследование «SEO‑альманах 2010»

Сервер

301 редирект при постоянном изменении адреса страницы 67%

Отсутствие на сайте значительного количества 404 ошибок 64%

Использование 404 кода ответа для 404 страниц 63%

Высокий аптайм сервера 63%

Высокая скорость загрузки документа 57%

Время отклика 53%

1-шаговая конструкция редиректорв 40%

302 редиректа при временном изменении адреса страницы 30%

Географическая зона сервера 27%

URL

Наличие ключевого слова в имени домена 83%

Наличие ключевого слова на транслите в адресе страницы 71%

Наличие ключевого слова в названии категории 61%

Наличие ключевого слова в названии документа 59%

Наличие ключевого слова на английском в адресе страницы 49%

ЧПУ 48%

Наличие словоформы ключевого слова в адресе страницы 45%

Наличие части ключевого слова в адресе страницы 37%

Большая глубина вложенности категории с документом –7%

Page 115: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 113

Возрастные факторы

Возраст индексации 83%

Динамика появления уникального контента на сайте 59%

Возраст домена 55%

Возраст URL-страницы 55%

Динамика появления контента на сайте 51%

Возраст контента на странице 46%

Влияние картинок на ранжирование

Ключевое слово в ALT картинки 47%

Ключевое слово в названии картинки 43%

Ключевое слово в TITLE картинки 36%

Географическое расположение

Указание регионов в Яндекс.Каталоге 95%

Наличие адресов и телефонов региональных филиалов на сайте 87%

Географическая близость офиса к продвигаемому региону 77%

Упоминание региональных центров в тексте страниц 64%

Перелинковка

Ограничение количества исходящих и внутренних ссылок 66%

Закрывать от индексации исходящие внешние ссылки 53%

Использование сквозных ссылок для внутренней перелинковки 18%

Страница ссылается на другую несколько раз –2%

Страница ссылается на себя –6 %

Page 116: Л.Гроховский - Руководство по внутренним факторам

114 Исследование «SEO‑альманах 2010»

CMS

Использование бесплатных общедоступных CMS –25%

Использование стандартных шаблонов –38%

Карта сайта

Наличие карты сайта 58%

Актуальность карты сайта 54%

Наличие страницы в карте сайта 48%

Указание приоритета индексации страниц в карте сайта 40%

Взаимодействие с Яндексом

Наличие сайта в Яндекс.Вебмастер 23%

Факт выгрузки обратных ссылок –12%

Факт ранее наложенных санкций –54%

Page 117: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 115

Сергей Панков, технический директор, Rookee

Преамбула

Прежде всего, стоит отметить то титани‑ческое трудолюбие и скрупулезность,

которые помогли автору в проведении исследования о факторах ранжирования. Совершенно искренне выражаем благодарность автору, его бесконечно‑му профессионализму и желанию сделать рынок 2.0 более цивилизованным. Надеемся, что Леонид и дальше будет радовать сообщество качественными и своевременными исследованиями.Предостережение

Материалы исследования послужат хорошей теоретической базой для новичков и seo‑энтузиастов, желающих повысить качество своего сайта и добиться новых высот в поисковой выдаче.Представленное исследование – это не кнопка «в топ» и даже не рецепт долголетия и счастья. Это скорее набор критериев, по которым можно определить качество отдельно взятой стра‑ницы веб‑сайта, оценить ее привлекательность с точки зрения поискового робота, который ищет наиболее релевантный ответ на вопрос пользователя.Что мы об этом думаем

Исследование еще раз подтвердило высокую точность той ин‑формации, что была получена в результате наших внутренних экспериментов. Знания об этих факторах заложены в основу алгоритмов наших сервисов:• технический аудит,• текстовой анализ страницы,• анализ конкурентов топ‑10.Однако стоит отметить, что в среде seo‑профессионалов сильны различные мифы. Одна неосторожная статья от Дэна Расковалова о его путешествии на Бали может породить с десяток предположений и теорий, которые будут дотошно анализироваться гуру всех мастей.Например, значимость следующих факторов мы ставим под сомнение:1. Прямое вхождение ключевого слова куда бы то ни было.2. Разнообразное оформление текста.3. Соответствие объема текста на странице сайтам конкурентов.4. Закрытие от индексации исходящих внешних ссылок.5. Факторы, связанные с CMS.Ценность блока критериев под названием «текст ссылки» ставится под большое сомнение. Все мы читали знаменитый мадридский доклад Яндекса за 2009 год. После него практиче‑ски бессмысленно рассуждать на тему, что лучше – «вечная»

МненИе Представленное исследование – это не кнопка «в топ» и даже не рецепт

долголетия и счастья. Это скорее набор критериев, по которым можно определить качество отдельно взятой страницы веб‑сайта, оценить ее привлека‑тельность с точки зрения поискового робота, который ищет наиболее релевантный ответ на вопрос пользователя.

Page 118: Л.Гроховский - Руководство по внутренним факторам

116 Исследование «SEO‑альманах 2010»

ссылка или «биржевая», «прямое вхождение или со словофор‑мами» и т. д.Следует отметить, что за пределами исследования остались вопросы, ответы на которые хотелось бы получить в будущем:1. Верстка.2. Поведенческие факторы.3. Соответствие тематики донора и акцептора.4. «Трафиконосность» ссылок с доноров.Конечно, наши возражения не умаляют всех достоинств проделанной работы. На то и нужны исследования, чтобы привлечь внимание к каким‑то важным вопросам и заставить нас самостоятельно искать ответы на поставленные вопросы.выводы

Безусловно, Интернет меняется. И то, что было актуально вчера, сегодня уже не работает. Остается пожелать одно: анализируйте и делайте выводы, остальное – дело техники.

Безусловно, Интернет меняется. И то, что было актуально вчера, сегодня уже

не работает. Остается пожелать одно: анализируйте и делайте выводы, остальное – дело техники.

Page 119: Л.Гроховский - Руководство по внутренним факторам

Полный курс SEO от «топЭксперт.РФ» (130 часов)

Хочу представить вам самый полный учебный курс по SEO. После прохо-ждения этого курса вы сможете само-стоятельно заниматься продвижением сайтов. Продолжительность курса – 130 часов, это 62 часа занятий в ауди-тории +40 часов практики в течение месяца +20 часов консультаций на веби-нарах. Программа корректируется и до-рабатывается совместно с признанными экспертами в области поискового про-движения. По окончании курса прово-дится сертификация, результаты которой передаются HR-специалистам ведущих SEO-компаний.

авторы и преподаватели курса:

Леонид Гроховский, директор по тех-нологии продвижения и автоматизации, «Оптимизм.ру»,

Станислав Поломарь, руководитель на-правления продвижения сайтов, Web-IT,

Алексей Чекушин, руководитель депар-тамента SEO, Wikimart.ru,

Михаил Сливинский, ведущий анали-тик, Wikimart.ru,

Станислав Ставский, ex. аналитик веб-поиска Яндекса.

Для кого этот курс:

Для начинающих SEO-специалистов, которые хотят получить прочные базо-вые знания.

Для продвинутых SEO-специалистов, которые хотят разобраться в информаци-онном поиске.

Для студентов, которые хотят полу-чить высокооплачиваемую и интересную работу.

Для оптимизаторов, которые за не-сколько лет все забыли и хотят обновить актуальность своих знаний.

Для интернет-маркетологов, которые хотят очень глубоко погрузиться в SEO.

Дни проведения:

Блок 1. Информационный поиск

• 21 января 11.00–20.00

• 22 октября 11.00–20.00

Блок 2. Поисковое продвижение

• 28 января 11.00–20.00

• 29 января 11.00–20.00

• 4 февраля 11.00–20.00

• 5 февраля 11.00–20.00

Блок 3. Аналитика

• 11 февраля 11.00–20.00

• 12 февраля 11.00–15.00

Экзамен: 19 февраля 11.00–20.00

Формат обучения:

• Очное обучение – проходит в Москве в учебной аудитории

• Заочное обучение – посредством веби-нар-трансляции на площадке COMDI

Семинары и курсы

Page 120: Л.Гроховский - Руководство по внутренним факторам

118 Семинары и курсы

• Всем слушателям на время обучения и в течение 2 месяцев после экзаменов предоставляется доступ к записям за-нятий на COMDI.ru

Уникальность курса:

Программа составлена людьми, имею-щими большой опыт руководства и об-учения сотрудников в SEO-компаниях, а значит, и вас учить будут тому, что дей-ствительно применимо и необходимо.

Программа является коллективным трудом, а не частным мнением, а значит, нам удастся избежать субъективности.

По итогам курса проводится сертифи-кация, резюме успешных студентов пере-даются в HR-службы многих SEO-компа-ний, что гарантирует их трудоустройство.

Это самый полный, профессиональный и практичный курс по SEO.

И самое главное – в течение всего кур-са вы будете получать задания в форма-те реальной стажировки, а саппорт будет помогать вам в трудных ситуациях.

Предварительная программа аудиторных лекций учебного курса SEOБлок 1. Информационный поиск

HTTP-протокол

• (GET)

• Понятие о протоколе

• Структура протокола

• Коды состояния

• IP, Прокси

• Заголовки

• Основные механизмы протокола

• DNS, работа хостинга

• Языки и кодировки

Как устроены поисковые системы

• Поисковый робот-индексатор

Скорость индексации

Краулинговый бюджет

Частота индексации

• Типы ботов (быстробот, блоги и т. п.) из описания веб-мастера Яндекса

• Инвертированный индекс

• Ранжирование

• Результаты поиска (SERP)

• Кластеризация

Идеология поисковых систем

• Качество поиска

Релевантность

Свежесть

Полнота индекса

Разнообразие результатов поиска

Антиспам (в т. ч. про цепи Маркова и дорвеи)

Сниппеты

Производительность

Вертикальный поиск

• Важнейшие ценности

• Способы монетизации

• Взаимодействие с пользователями

• Конкуренция

• Ответственность

• Нарушения и санкции

введение в информационный поиск

• Булев поиск

• Лексикон и списки словопозиций

• Словари и нечеткий поиск

• Построение индекса

• Ранжирование, взвешивание терминов и модель векторного пространства

• Ранжирование в полнофункциональ-ной поисковой системе

Page 121: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 119

Вертикальный поиск

• Оценка качества поиска

• Расширение запроса, переформулировки

• Машинное обучение

• Языковые модели для информационно-го поиска

Стемминг

Морфология

Лемматизация

• Кластеризация

Поисковые технологии

• IDF TF

• BM 25

• PageRank

• HITS

• ClickRank

• BrowseRank

• SpamRank

обработка информации

• Алгоритм шинглов

• Разбиение текста на пассажи

типы запросов с точки зрения поиско-вых систем

• Типы классификации

• По бродеру

• Количество

• Коммерческие и некоммерческие

Блок 2. Поисковое продвижение

теория

• SEO-факторы

Текстовые

– Плотность ключевых слов

– Зоны документа (TITLE, H1 и т. д.)

– Фильтрации и антиспам

• Ссылки

Внутренние ссылки

Внешние ссылки

Ссылочное ранжирование

– Статическое (PR, ТИЦ)

– Динамическое (анкорное)

• Host-факторы

Возраст

Key в URL, в домене

Видимость

• Поведенческие факторы

Поведение в серпе

Поведение на сайте

– Время просмотра

– Количество страниц

– Источники трафика

– Переходы по ссылкам

• Социальные факторы

• Региональность

Практика

внутренние факторы

• Перелинковка

Базовые схемы перелинковки

– Комплексное продвижение всего сайта

– Продвижение главной страницы под ВЧ

– Продвижение разделов под СЧ

– Продвижение внутренних страниц под НЧ

Локальные схемы перелинковки

– Кольцо

– Куб

– Звезда

Правила перелинковки

Page 122: Л.Гроховский - Руководство по внутренним факторам

120 Семинары и курсы

Способы перелинковки

Составление текста ссылки для перелинковки

Создание модулей для автомати-зации перелинковки (начальный уровень)

– Портал

– Интернет-магазин

– Корпоративный сайт

– Каталог

• Устранение дубликатов

Чем вредны дубликаты

Классификация дубликатов

Устранение дубликатов на примерах

Способы устранения дубликатов

• Инструкции для поисковых систем

Зачем нужен robots.txt?

Robots.txt – универсальные директивы

Robots.txt – директивы для Яндекса

Правила составления robots.txt

Разбор robots.txt на примерах

Зачем нужен sitemap.xml

Директивы sitemap.xml

Правила составления sitemap.xml

Пример sitemap.xml

Принцип взаимодействия sitemap.xml и robots.txt

Автоматизация добавления страниц в sitemap.xml

Зеркала сайтов, переклейка

Данные Яндекс.Вебмастер

Данные Google.Вебмастер

• Уникальность контента

Как защитить контент от воровства?

Как воровать контент?

Отсутствие и недостаток контента

Автоматизация генерации контента

– Автоматизация генерации описа-ний товаров

– Автоматизация генерации техниче-ских характеристик (уровень 1)

– Автоматизация генерации техниче-ских характеристик (уровень 2)

– Автоматизация наполнения Description, Keywords, TITLE

– Обнаружение дубликатов

– Инструкция по обнаружению дуб-ликатов вручную

– Способы автоматизации обнаруже-ния дубликатов

• Коды ответов сервера

Код ответа 20*

Коды ответов 301 / 302 / 303 / 307 / 3**

Код ответа 40*

Код ответа 50*

• Стандарты W3C

Правила HTML-разметки для SEO

Проверка верстки на соответствие стандартам W3C

• Подготовка ТЗ на доработку сайта

• Типичные ошибки, допускаемые при работе с внутренними факторами

• Типичные ошибки разработки сайтов

• Типичные ошибки юзабилити

• Типичные ошибки копирайтеров

Подробно про внешние факторы

• Все источники привлечения внешних ссылок, оценка эффективности и эко-номическая целесообразность. Сравни-тельная таблица

Обычные покупные ссылки

Ссылки в виде контекстных объявлений

Page 123: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 121

Статьи

Пресс-релизы и посты в блогах

Социальные сети

Форумы

Естественные ссылки

• Возможности автоматизации

• Продвижение молодых сайтов и сай-ты с историей: отличия в работе со ссылками

• Продвижение крупных сайтов: особен-ности в работе со ссылками

• Если по ссылке кликают – она работает лучше. Миф или реальность?

• Критерии выбора ссылок: на что на са-мом деле стоит обращать внимание

Оценка эффективности ссылок через Яндекс.Метрика

По каким критериям отбирать площадки

ТИЦ, тематичность, количество вне-шних – что в действительности важ-но сейчас

• Альтернативные источники внешних ссылок

Веб-PR

– Бриф для клиента

– Подбор площадок для публикации

– Пресс-релизы, статьи, интервью, отзывы

– Заказ статей

– Примеры успешных PR-стратегий для SEO

SMM

– Возможности получения ссылок из социальных сетей

– Критерии оценки качества блогов

– Ссылки из Twitter и Facebook для SEO

– Примеры успешного применения

SMO

– Возможности SMO

– Создание ценности для посетителей

– Рейтинг

– Акции

– Закрытый клуб

– Предложение о репосте

– Примеры успешного применения

Инструментарий

– Аналитика – «СайтРепорт.РФ»

– Подбор запросов – KeyCollector

– Биржа ссылок – Sape.ru

– Биржа ссылок – PR.sape.ru

– Биржа ссылок – Blogun.ru

– Биржа ссылок – GoGetLinks.net

– Биржа ссылок – MiraLinks.ru

– Агрегатор – Rookee

– Агрегатор – MegaIndex

– Плагин для браузера – NetPromoterBar

– Анализ ссылок – Solomono.ru

– Анализ ссылок – DriveLink

Составление ссылочной стратегии

– Обычные ссылки

– PR-ссылки

– Ссылки без анкоров

– Мертвые ссылки

– Ссылки с социальных сетей

Размещение ссылок

Проверка ссылок

Подробно о поведенческих факторах

• Теория: развитие поведенческих метрик

• 3 группы поведенческих факторов

Page 124: Л.Гроховский - Руководство по внутренним факторам

122 Семинары и курсы

переходы по ссылкам

результаты поиска

поведение на сайте

• Где покупать естественные ссылки

• Связки поведенческих факторов: как это работает

• Исследование пользователей: какими данными располагает Яндекс

• 3 способа накрутки поведенческих факторов

имитация живых пользователей: со-здание «живых» ботов

ботнет

биржа

• Мифы и заблуждения о поведенческих факторах

• Отличия ПФ для разных тематик

• Возможности Яндекс.Метрики: демон-страция функционала

Составление семантического ядра

• Запрос выгрузки структуры сайта

• Подбор запросов

• Проверка запросов

• Группировка запросов

• Формирование новой структуры сайта

аудит

• Изучение сайта

• Классификация типов страниц

• Классификация разделов сайта

• Изучение <HTML> шаблонов по типам страниц

• ТЗ по <HTML> доработке страниц

• Изучение данных Яндекс.Вебмастер

• Изучение данных Google.Вебмастер

• Изучение данных Яндекс.Метрика

• Сравнение индексов

• Изучение перелинковки

• Изучение серверных настроек

• Изучение контента

• Поиск дубликатов

• Поиск внешних ссылок

• Анализ и сравнение индексации в по-исковых системах

• Анализ внутреннего анкор-листа

• Лингвистический анализ сайта

• Поиск и анализ исходящих внешних ссылок

• Анализ распределения весов по страницам

• Анализ страниц с 404 ошибками

• Анализ редиректов

• Создание sitemap.xml

• Анализ sitemap.xml, robots.txt

• Оценка размера страниц и скорости их загрузки

• Анализ уровней вложенности

• Поиск полных дублей

• Поиск неполных дублей

• Анализ заполненности страниц

• Поиск пустых страниц и страниц-простыней

• Анализ TITLE, Keywords, Description на наличие дубликатов, пустоты, переспама

• Анализ уязвимостей сайта

• Анализ конкурентов

• Проверка сайта на наложение фильтров

• Анализ внешних ссылок

• Поиск дубликатов контента на других сайтах

• Лексикологический анализ сайта

Page 125: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 123

типичные ошибки оптимизатора

• Типичные ошибки, допускаемые при работе с внешними факторами

• Типичные ошибки PR

• Типичные ошибки SMM

• Типичные ошибки разработки

Накрутка

• Накрутка внешних факторов

• Накрутка внутренних факторов

• Накрутка поведенческих факторов

Копирайтинг

• Взаимодействие с копирайтерами

• Как правильно составить ТЗ по копирайтингу

• Определяем уникальность текста

• Бриф для клиента

• Входные страницы

• Что лучше продает: содержание, заго-ловки, оформление или иллюстрации?

• Нестандартные способы получения контента

Блок 3. Аналитика

введение в SEO-аналитику

• Кто такой SEO-аналитик

• Примеры работы SEO-аналитика

• Аналитика

Эмпирический анализ

Статистический анализ

Теория вероятности

Нестандартное мышление

Логические задачи

Собеседование на SEO-аналитика

• Мозговой штурм

• Автоматизация

Сбор позиций

Проверка индексации

Проверка текстов

Перелинковка

Покупка ссылок

• Как писать ТЗ

Правила написание ТЗ

Таблицы

Модули

Интерфейс

Примеры ТЗ

• Область применения знаний и навыков SEO-аналитика

• Источники получения информации, список литературы

• Сервисы поисковых систем

Яндекс.Вебмастер

Google.Вебмастер

• Веб-аналитика

Задачи веб-аналитики

Возможности веб-аналитики

Виды инструментов веб-аналитики

– Внутренние системы

– Внешние системы

Погрешность веб-аналитики

Курс обучения работы с Яндекс.Метрика

– Задачи и цели

– Установка счетчика

– Описание функционала

– Настройка целей

– Статистика по трафику

– Источники трафика

– Поисковые фразы

– Поисковые системы

– Внешние ссылки

Page 126: Л.Гроховский - Руководство по внутренним факторам

124 Семинары и курсы

– Содержание сайта

– Профиль пользователя

– Конструктор отчетов

– Поведенческие метрики

– Карта кликов

– Карта путей

– Тепловые карты

– Применение Яндекс.Метрики для SEO-специалиста

– Замеры, эксперименты

Юзабилити

– Основы юзабилити

– Юзабилити-аудит

– Взаимодействие с профессиональ-ным юзабилистом

Хронология развития поисковых си-стем от каталогов до нашего времени

• Google

• Rambler

• Yandex

• Nigma

Проводимые исследования

• Исследования Яндекса

• Исследования Google

• Исследования зарубежных компаний

• Исследования российских компаний

• Исследования частных специалистов

• Исследования «ТопЭксперт.РФ»

Условия участия:

• Стоимость участия: 25 000 руб. при оплате до 15 декабря.

• Стоимость участия: 30 000 руб. при оплате до 1 января.

• Стоимость участия: 35 000 руб. при оплате до 15 января.

• Стоимость участия: 40 000 руб. при оплате на семинаре.

• При оплате по безналу стоимость воз-растает на 20 %.

VIP- участие:

• Во время курса вы сидите на первом ряду.

• По окончании вы получаете видеозапись.

• Вы получаете подробные комментарии по выполненным домашним заданиям.

• На практических занятиях мы разби-раем материал на примере вашего сай-та, в частности SEO-аудит и семантиче-ское ядро.

• В течение курса у вас будет право на 4 индивидуальные консультации.

• Стоимость: + 30 % от стоимости курса на момент оплаты.

Page 127: Л.Гроховский - Руководство по внутренним факторам

DVD-семинар – #1 «Продвижение порталов и крупных интернет-магазинов» – 8 часов (Уровень подготовки: профессионал)

Для кого этот DVD?

• Для оптимизаторов, продвигающих са-мые крупные и сложные проекты рунета

• Для директоров по маркетингу, плани-рующих создавать внутренний отдел SEO

• Для руководителей крупнейших порта-лов и интернет-магазинов

Семинар вели:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

• Олег Пролубщиков, технический директор, «РДВ-Медиа» (Rabota.ru; Ucheba.ru; VashDosug.ru)

• Алексей Чекушин, аналитик, Wikimart.ru

• Роман Прохоров, руководитель службы продвижения, Wikimart.ru

Среди участников семинара были пред-ставители компаний:

• mail.ru

• pulscen.ru

• raise.ru

• turinfo.ru

• championat.ru

• books.ru

• labirint.ru

• absent.ru

• terminal.ru

• fastlaneventures.ru

• etorg.ru

• wildberries.ru

• kika.ru

• proskater.ru

• molotok.ru

Подробнее о семинаре:

• Докладчики семинара на передаче «ТопЭксперт»

• Краткая программа семинара

• Обсуждение семинара

• Репортаж с семинара от searchengines.ru

• Интервью для seonews.ru

– Олег Пролубщиков, технический ди-ректор «РДВ-Медиа»

– Алексей Чекушин, аналитик, Wikimart

DVD-cеминары и курсы

Page 128: Л.Гроховский - Руководство по внутренним факторам

126 DVD‑семинары и курсы

– Роман Прохоров, руководитель службы продвижения, Wikimart

Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике.

Отзыв от Александра Рыжова, wildberries.ru

+ Бонус:

• Индивидуальная консультация

Покупка:

•СтоимостьDVD-бокса30 000 рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

• Тираж ограничен, всего 20 коробок.

• В целях профилактики пиратства и со-хранения эксклюзивности информа-ции, DVD продаю только реальным людям, представляющим реальные компании. В сомнительных случаях за-прашиваются рекомендации. Если вы не связаны ни с одним крупным проек-том – вы не сможете приобрести этот семинар. Оставляю за собой право от-казать любому в возможности покупки без объяснения причины.

•По вопросампокупкиобращатьсяна grohovskiy@yandex .ru

DVD – семинар #2 «Продвижение сайтов: работа с внешними факторами» – 4 часа (Уровень подготовки: специалист)

Для кого этот DVD?

• Для оптимизатора, который хочет эф-фективно продвигать сайты

• Для интернет-маркетолога

• Для куководитель проекта, коммуни-цирующего с оптимизатором

вам нужен этот видеокурс, если

• Ссылочная масса растет, а позиции сайта не меняются

• Вы не понимаете, как можно покупать естественные ссылки

• Агрегаторы не всегда работают эффективно

• Вы хотите сократить ссылочный бюд-жет в несколько раз, сняв неэффектив-ные ссылки

• Вам хочется получить трафик с пресс-релизов, блогов и статей

автор и ведущий:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Программа семинара:

• Все источники привлечения вне-шних ссылок, оценка эффективности

Page 129: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 127

и экономическая целесообразность. Сравнение между собой

Обычные покупные ссылки

Ссылки в виде контекстных объявлений

Статьи

Пресс-релизы и посты в блогах

Социальные сети

Форумы

Естественные ссылки

• Возможности автоматизации по каж-дому источнику

• Агрегаторы, взгляд со стороны, оценка эффективности использования

WebEffector

SeoPult

Rookee

Megaindex

• Продвижение молодых сайтов и сай-ты с историей: отличия в работе со ссылками

• Если по ссылке кликают – она работает лучше. Миф или реальность?

Исследования Блогуна

Исследования других бирж

• Критерии выбора ссылок: на что на са-мом деле стоит обращать внимание

• Оценка эффективности ссылок через Яндекс.Метрика и Google.Analytics

• По каким критериям отбирать площадки

Выбор площадок вчера и сегодня, что изменилось

ТИЦ, тематичность, количество вне-шних – что в действительности важ-но сейчас

• Типичные ошибки, допускаемые при покупке ссылок

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

+ Бонус:

• Семинар «Продвижение молодых сайтов»

Покупка:

•СтоимостьDVD-бокса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна grohovskiy@yandex .ru

Page 130: Л.Гроховский - Руководство по внутренним факторам

128 DVD‑семинары и курсы

DVD – семинар #3 «Продвижение сайтов: задействуем внутренние факторы» – 5 часов (Уровень подготовки: специалист)

Для кого этот DVD?

• Для руководителя SEO-отдела или SEO-аналитика, создающего технологию продвижения

• Для штатного SEO-специалиста или фрилансера

• Для веб-разработчика или программи-ста, занимающихся созданием сайтов для SEO

• Для продвинутых клиентов, кото-рые хотят понять потенциал сво-его сайта с точки зрения внутренней оптимизации

• Для специалиста, продвигающего интер-нет-магазины и заинтересованного в ав-томатизации перелинковки и генерации контента

вам нужен этот видеокурс, если

• Вы продвигаете интернет-магазин

• Вы столкнулись с проблемой воровства контента и не знаете, что делать

• У вас на сайте нет уникального контен-та, и это вызывает сложности

• Вы хотите сэкономить на ссылках, ис-пользуя внутренние ресурсы сайта

• Вы хотите делать эффективные сайты для SEO

• Вы хотите автоматизировать перелин-ковку и генерацию контента на сайте

автор и ведущий:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Подробная программа семинара по ссылке

отзывы

•ВладимирБаязитов(www .manuolog .ru):

– Это был самый лучший семинар по вну‑тренним факторам из всех, которые я посещал.

•АндрейТрапезников(многопроектов): – Семинар понравился, немного не хвата‑ло примеров конкретных сайтов.

•ОльгаДергачева(www.r52.ru):– Хорошая атмосфера, понятный язык. Отличный семинар и знания преподавателя.

•АндрейЗарецкий(www.primelog.ru): – Очень познавательно, открыл много нового для себя.

•СергейНазаренко(www .aquacorp .ru): – Весь материал очень четко изло‑жен, спокойная уверенная манера веде‑ния семинара положительно сказалась на усвояемости материала.

•ВалентинДомбровский,Psycho(www .nextup .ru)– Достаточно полный и интересный се‑минар от человека, который, безусловно, очень хорошо разбирается в теме. Полу‑ченные знания по столь важному аспек‑ту SEO, конечно, необходимо применять на практике.

Покупка:

•СтоимостьDVD-бокса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

Page 131: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 129

•По вопросампокупкиобращатьсяна grohovskiy@yandex .ru

DVD-семинар – #4 «Поведенческие факторы, юзабилити и яндекс.Метрика для SEO-специалиста» (Уровень подготовки: специалист)

Для кого этот DVD?

• Для оптимизатора, который хочет эф-фективно продвигать сайты

• Для интернет-маркетолога

• Для веб-аналитика

вам нужен этот видеокурс, если

• Стандартные методы продвижения не работают

• Вы все еще не понимаете, как можно влиять на поведенческие факторы

• Вам нужно, чтобы сайт клиента продавал

• Вы не умеете пользоваться Яндекс.Метрикой

ведущий семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Программа:

• Теория: развитие поведенческих метрик

• 3 группы поведенческих факторов

переходы по ссылкам

результаты поиска

поведение на сайте

• Где покупать естественные ссылки

• Связки поведенческих факторов: как это работает

• Исследование пользователей: какими данными располагает Яндекс

• 3 способа накрутки поведенческих факторов

имитация живых пользователей: со-здание «живых» ботов

ботнет

биржа

• Мифы и заблуждения о поведенческих факторах

• Основы юзабилити

• Чек-лист: типичные ошибки юзабилити

• Юзабилити-аудит сайта

• Отличия ПФ для 4 тематик

свадебные платья

ноутбуки

такси

индийская косметика

• Возможности Яндекс.Метрики: демон-страция функционала

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

Покупка:

•СтоимостьDVD-курса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна grohovskiy@yandex .ru

Page 132: Л.Гроховский - Руководство по внутренним факторам

130 DVD‑семинары и курсы

DVD – семинар #5 «Комплексная стратегия продвижения» – 3 часа [Уровень подготовки: начинающий]

Для кого этот DVD?

• Для начинающих оптимизаторов

• Для интернет-маркетологов

• Для заказчиков

вам нужен этот видеокурс, если

• Вы хотите использовать комплексный подход к продвижению сайта

• Вы самостоятельно продвигаете сайт и вам нужны выдающиеся результаты

• Вам кажется, что ваши знания устарели

• Вы хотите понять, использует ли ваш оптимизатор комплексный подход к продвижению сайта

ведущие семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

• Станислав Поломарь, руководитель службы продвижения, Web-it

• Виктор Нагайцев, генеральный директор, PerfectSeo

Среди слушателей были

• Магомед Чербижев, руководитель Seointellect.ru

• Вениамин Моисеев, преподаватель АиР

• Илья Савинов, преподаватель АиР

• Денис Макаров, технический директор, Miralab.ru

Программа семинара:

• Что такое комплексный подход к про-движению сайтов

• Как совмещать внешние и внутренние факторы

• Как поведенческие факторы коррели-руют с внутренними

• Как использовать <HTML> разметку для пользователей и для роботов

• Как составлять текст ссылки

• Как влияет возраст сайта на продвиже-ние и что с этим делать

• Как правильно настраивать редиректы и 404 ошибки

• Как картинки влияют на продвижение

• Как избежать склейки нескольких сай-тов одной компании

Покупка:

•СтоимостьDVD-бокса3000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна grohovskiy@yandex .ru

Page 133: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 131

DVD-семинар – #1 «Автоматизация в SEO» – 8 DVD (Уровень подготовки: профессионал)

Для кого этот DVD?

• Для руководителя SEO-компании

• Для директора по маркетингу, руково-дящего внутренним отделом SEO

• Для разработчика веб-сервисов и про-грамм для интернет-маркетинга

ведущий семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Содержание

1‑й диск

• Задачи и цели автоматизации

• Автоматизация продаж

2‑й диск

• Расчет стоимости

• Отчетность, статистика, биллинг

3‑й диск

• Система контроля рисков

4‑й диск

• Контроль работы оптимизаторов

• Составление семантического ядра

• Копирайтинг

5‑й диск

• Генерация контента

• SEO-аудит, диагностика сайта

6‑й диск

• Перелинковка

• Анализ конкурентов

7‑й диск

• Система для отдела SEO-аналитики

• Яндекс.Метрика, Google.Analytics

• Поведенческие факторы

8‑й диск

• Агрегаторы: внутренние и внешние ссылки

• Комплексная автоматизация

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

+ Бонус на 40 000 руб .:

• 2 часа индивидуальных консультаций (экономия 10  000 руб.)

• аудит автоматизации SEO-отдела (эко-номия 30  000 руб.)

отзывы:

•РоманКлевцов,генеральный директор «оптимизм .ру»:

– В условиях динамично меняющего‑ся SEO Леонид один из немногих успе‑вает профессионально реагировать на нововведения и повышать качество автоматизации.

•ТимофейКвачев,руководительотде-ла интернет-маркетинга, TRINET:

– Хороший контент от хорошего специа‑листа. Полагаю, что топ‑менеджеры ком‑паний смогут почерпнуть много полез‑ной информации, а также ряд методик для быстрого внедрения в практическую деятельность своей компании, оптимиза‑ции рутинных процессов и развития бизне‑са в целом.

Page 134: Л.Гроховский - Руководство по внутренним факторам

132 DVD‑семинары и курсы

•ИванСевостьянов,генеральный директор, «вебПроекты»:

– Леонид Гроховский имеет огромный опыт в автоматизации процессов SEO‑компаний. Уверен, что его знания вам пригодятся!

•ВикторНагайцев,генеральный директор, PerfectSeo:

– Леонид является признанным гранд‑мастером в области автоматизации продвижения сайтов. Я глубоко убежден, что в данном курсе каждый сможет по‑черпнуть что‑то новое.

•СтаниславПоломарь,руководительSEO-направления, Web-IT:

– Все вещи, о которых рассказывает Лео‑нид, опробованы и отточены на многих проектах (от мелких до очень крупных). Поэтому подходы и знания, получен‑ные от данного семинара, безусловно, представляют большую практическую ценность.

•КириллСамойлов,генеральный директор, ArrowMedia:– Современный бизнес в области SEO не‑возможен без высокого уровня автомати‑зации. Знания и опыт Леонида по данно‑му вопросу будут очень полезны.

•АртемБородатюк,генеральный директор NetPeak:

– Леонид Гроховский подготовил, пожа‑луй, самый полезный материал, который доводилось просматривать с топ‑ме‑неджментом Netpeak за последнее время.

•АлександрСалтыков,директорпо маркетингу, Ingate Development:

– Невозможно представить сегодня SEO без автоматизации. Леонид обладает большим и, безусловно, полезным опы‑том в разработке автоматизированных систем. Его консультации будут весьма полезны тем, кто заинтересован в повы‑шении эффективности бизнес‑процессов SEO‑компании.

Покупка:

•СтоимостьDVD-курса50 000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

• Тираж ограничен – всего 10 коробок.

• В целях профилактики пиратства и сохранения эксклюзивности ин-формации, DVD продаю только тем, с кем знаком лично, либо запрашиваю рекомендации. Оставляю за собой пра-во отказать любому в возможности по-купки без объяснения причины.

•По вопросампокупкиобращатьсяна grohovskiy@yandex .ru

Page 135: Л.Гроховский - Руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав Ставский

SEO: руководство по внутренним факторам

Книга содержит комментарии экспертов проекта «ТопЭксперт.РФ»:Ивана Севостьянова, Николая Хиврина, Константина Шурыгина,

Анара Бабаева, Сергея Панкова и Даниила Маула

Научный редактор Станислав СтавскийЛитературный редактор Татьяна Байдак

Верстальщик-дизайнер Юлия Кинаш-КонстантиноваКорректор Валентина Максимова

Подписано в печать 28.12.2011. Формат 70 100 1/16.

Издательство Центр исследований и образования «ТопЭксперт.РФ»

Page 136: Л.Гроховский - Руководство по внутренним факторам

Page 1: Л.Гроховский - Руководство по внутренним факторам

руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав СтавскийSEO

Page 2: Л.Гроховский - Руководство по внутренним факторам

Page 3: Л.Гроховский - Руководство по внутренним факторам

руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав СтавскийSEO

Page 4: Л.Гроховский - Руководство по внутренним факторам

Леонид Гроховский, Михаил Сливинский, Алексей Чекушин, Станислав Ставский

SEO: руководство по внутренним факторам. – М.: Центр исследований и образова-ния «ТопЭксперт.РФ», 2011. – 133 с.

© Центр исследований и образования «ТопЭксперт.РФ»

© Леонид Гроховский, Михаил Сливинский, Алексей Чекушин, Станислав Ставский

Эта книга кардинально отличается от  аналогичных изданий: она написана оптимизаторами для оптимизаторов и является первым изданием по теме внутренних факторов в SEO. Авторы со-единили свои разноплановые познания в области внутренней оптимизации и смогли простым язы-ком изложить сложный материал. Теперь вы можете воспользоваться актуальной информацией и применить новые знания в своей практике, наиболее полно задействовав потенциал собственно-го сайта и улучшив его позиции в выдаче поисковых систем. Книга написана в соавторстве с лучши-ми аналитиками нашей профессии – Станиславом Ставским, Михаилом Сливинским и Алексеем Чекушиным. Их участие сделало книгу полезной не только для начинающих, но и для продвину-тых специалистов.

Page 5: Л.Гроховский - Руководство по внутренним факторам

Леонид Грохов-ский, В  SEO с 2005 года, в на-

стоящий момент ди-ректор по  технологии продвижения и автома-тизации компании «Оп-тимизм.ру», входящей в топ-10 SEO-компаний. Опыт продвижения – бо-лее 300 сайтов. Область

деятельности: автоматизация, аналити-ка, проведение исследований. Руководи-тель центра образования и исследований «ТопЭксперт.РФ», автор ряда публикаций в профессиональных изданиях, постоянный докладчик на  отраслевых конференциях. Руководитель разработки аналитической системы «СайтРепорт». Автор исследова-ния «SEO-альманах 2010». Специализиру-ется на продвижении порталов и крупных интернет-магазинов. Продвигал и консуль-тировал такие проекты, как championat.ru, woman.ru, rabota.ru, ucheba.ru, pressfoto.ru, aforex.ru, best-realty.ru, panasonic.ru. Пре-подает SEO в  Академии интернет-рекла-мы и  в  учебном центре «Специалист» при МГТУ им. Н. Э. Баумана. Ведущий про-граммы «ТопЭксперт.РФ» на интернет-те-левидении MEGAINDEX.TV.

Автор и преподаватель курсов:

«Основные ошибки в SEO от создания сайта до покупки ссылок»

«Пошаговая реализация SEO-стратегии для маркетологов и руководителей»

«Оптимизация сайтов: задействуем внут-ренние факторы»

«Источники привлечения внешних ссылок»

«Юзабилити, аналитика и  Яндекс.Ме-трика для SEO-специалиста»

«Комплексная стратегия продвижения»

«Автоматизация в SEO»

«Продвижение порталов и  крупных интернет-магазинов»

«Высший пилотаж в SEO»

«Полный курс SEO – 130 часов»

СоавторыМихаил Сливинский, руководитель отдела аналитики, Wikimart.ru; преподаватель учебного центра «ТопЭксперт.РФ»

алексей Чекушин, руководитель департамента продвижения, Wikimart.ru; преподаватель учебного центра «ТопЭксперт.РФ»

Станислав Ставский, руководитель направле-ния зарубежных проектов, Sape.ru; ex. аналитик веб-поиска Яндекса; преподаватель учебного центра «ТопЭксперт.РФ»

об авторе и соавторах

Page 6: Л.Гроховский - Руководство по внутренним факторам

Содержание

Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6введение в продвижение сайтов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

0.1. Понятие о внутренних факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

0.2. Понятие о внешних факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

0.3. Понятие о поведенческих факторах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

0.4. Комплексный подход к продвижению сайтов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Глава 1 . Перелинковка страниц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.1. Как вычисляется PageRank и почему это так важно знать . . . . . . . . . . . . . . . . . . . . . . . 24

• По материалам статьи в переводе Александра Садовского «Растолкованный PageRank» . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.2. Базовые схемы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25• Комплексное продвижение всего сайта . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26• Продвижение главной страницы под ВЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26• Продвижение разделов под СЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27• Продвижение внутренних страниц под НЧ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

1.3. Локальные схемы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Кольцо . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Куб . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30• Звезда . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.4. Правила перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.5. Способы перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.6. Составление текста ссылки для перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

1.7. Создание модуля для перелинковки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40• Портал . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40• Интернет-магазин . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41• Корпоративный сайт . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42• Каталог . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Глава 2 . Устранение дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.1. Чем вредны дубликаты . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.2. Классификация дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.3. Кейсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49• Компания «БЕСТ-Недвижимость», www.best-realty.ru . . . . . . . . . . . . . . . . . . . . . . . . . 49• ММЦ «ОнКлиник», www.onclinic.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51• Магазин итальянской мебели, www.eurointerier.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.4. Способы устранения дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Page 7: Л.Гроховский - Руководство по внутренним факторам

Глава 3 . Инструкции для поисковых систем . . . . . . . . . . . . . . . . . . . . . . . 573.1. Зачем нужен robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.2. Robots.txt – универсальные директивы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3.3. Robots.txt – директивы для Яндекса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.4. Правила составления robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.5. Разбор robots.txt на примерах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .61

3.6. Зачем нужен sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.7. Директивы sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.8. Правила составления sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.9. Пример sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.10. Принцип взаимодействия sitemap.xml и robots.txt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.11. Автоматизация добавления страниц в sitemap.xml . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

Глава 4 . работа с авторским контентом . . . . . . . . . . . . . . . . . . . . . . . . . . . 714.1. Уникальность контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.2. Как защитить контент от воровства? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74

4.3. Как воровать контент? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.4. Отсутствие и недостаток контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76• Разбор решения на примере www.mobiguru.ru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.5. Автоматизация наполнения Description, Keywords, Title . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.6. Автоматизация генерации контента . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79• Автоматизация генерации описаний товаров . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79• Автоматизация генерации технических характеристик (уровень 1) . . . . . . . . . . . . . 79• Автоматизация генерации технических характеристик (уровень 2) . . . . . . . . . . . . . 80

4.7. Обнаружение дубликатов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80• Инструкция по обнаружению дубликатов вручную . . . . . . . . . . . . . . . . . . . . . . . . . . . 81• Способы автоматизации обнаружения дубликатов . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Глава 5 . Коды ответов сервера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855.1. Код ответа 200 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .85

5.2. Коды ответов 301/302/303/307/3** . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.3. Код ответа 404 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

Глава 6 . Стандарты W3C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 896.1. Правила HTML-разметки для SEO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.2. Проверка верстки на соответствие стандартам W3C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Глава 7 . SEO-аналитика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97Глава 8 . Исследование «SEO-альманах 2010» . . . . . . . . . . . . . . . . . . . . . . 107Семинары и курсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117DVD-семинары и курсы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

Содержание 5

Page 8: Л.Гроховский - Руководство по внутренним факторам

П риветствую! Меня зовут Леонид Гроховский. В настоящий момент я  работаю директором по  тех-

нологии продвижения и  автоматизации в компании «Оптимизм.ру». Моя область деятельности  – исследование поисковых алгоритмов и  создание технологии про-движения. Также я  занимаюсь разработ-кой стратегии продвижения ключевых клиентов компании, т. е. порталов, круп-ных интернет-магазинов и сайтов – лиде-ров тематики. В SEO с 2005 года.

В этой книге я стремился собрать воеди-но свои познания в  области внутренней оптимизации и  доступным языком изло-жить этот материал, чтобы вы смогли при-менить почерпнутую здесь информацию в своей практике. Мне хочется, чтобы в ре-зультате вы смогли задействовать потен-циал собственного сайта и улучшили его позиции в выдаче поисковых систем. Кро-ме того, мне удалось привлечь лучших ана-литиков нашей профессии  – Станислава Ставского, Михаила Сливинского и Алек-сея Чекушина. Они стали соавторами этой книги и дали комментарии по вопросам PRO-уровня, сделав книгу интересной не только для начинающих, но и для про-двинутых специалистов.

Следует отметить, что книга, которую вы держите в  руках, кардинально отличает-ся от аналогичных изданий. Она написана оптимизатором для оптимизаторов. Я пи-сал не об абстрактном поисковом продви-жении, а сосредоточился на практических рекомендациях, поэтому здесь органично сочетаются краткие фундаментальные

Предисловие

Page 9: Л.Гроховский - Руководство по внутренним факторам

понятия с многочисленными конкретны-ми советами, которые являются остроак-туальными сегодня и останутся таковыми завтра. Это первое издание по данной теме. Вероятно, очень скоро нам придется столк-нуться с новыми исследованиями и новы-ми факторами ранжирования, изменится значимость этих факторов и способы воз-действия на них. Рад избавить вас от лиш-него беспокойства.

Технологически работы по продвижению сайта делятся на два этапа: оптимизация и  продвижение. В  этой книге мы пого-ворим о  первом этапе, который включа-ет в себя все работы, проводимые внутри сайта: это работа с  текстом, ссылками, настройками сервера, HTML-версткой, а  также создание инструкций для  поис-ковых систем. Здесь также описаны спо-собы автоматизации генерации текстов, заголовков и  метатегов, перелинковки. Эта информация пригодится специали-стам, продвигающим крупные порталы и интернет-магазины.

Продвигая сайт, я  всегда стараюсь мак-симально использовать потенциал вну-тренних факторов. Мой подход к продви-жению тесно связан с  автоматизацией, аналитикой и проведением исследований. На то есть ряд причин.

В 2010 году количество конференций, по-священных SEO, увеличилось в  два раза. Очевиден и  рост интереса к  образова-тельным мероприятиям: чаще проводят-ся семинары и курсы, открываются новые центры обучения. SEO-бум – закономерное следствие того, что технологии продвиже-ния усложнились и ценность информации очень сильно возросла. Рядовым SEO-спе-циалистам, чтобы не выпасть из обоймы, необходимо постоянно повышать свою квалификацию, консультируясь у  более опытных коллег.

Особая прослойка экспертов, имеющих практическое подтверждение высокого

Рецензия на книгу Леонида Гроховского «SEO: руководство по внутренним факторам»

Книга Леонида очень необычна! Прежде всего, тем, что в ней много практики и не так много теории. Немногие авторы

трудов, посвященных поисковой оптимизации, раскрывают практические методы работы. Это происходит из‑за того, что мир SEO быстро меняется. И пока написанное выходит в свет, большая часть знаний уже устаревает.В данной книге сделана, на мой взгляд, достаточно удачная попытка раскрыть именно практические инструменты оптимизации сайтов. Достоинство ее и в том, что она узко‑специализированная. Книга целиком и полностью посвящена только внутренним факторам оптимизации сайта: структуре, контенту, перелинковке, написанию файла robots.txt и другим аспектам работы с сайтом.Порадовало меня и большое количество реальных примеров из практики автора, наглядно иллюстрированных.Издание, несомненно, будет полезно всем специалистам по оптимизации для закрепления уже имеющихся знаний, а также начинающим оптимизаторам для приобретения новых знаний по SEO.

С уважением, Иван СевоСтьянов, генеральный директор компании «вебПроекты»

Предисловие 7

Page 10: Л.Гроховский - Руководство по внутренним факторам

уровня их  знаний и  обладающих ценной информацией, в SEO-сообществе уже сфор-мировалась. В их числе – руководители ли-дирующих компаний, разработчики анали-тических программ и систем автоматизации продвижения, высококвалифицированные SEO-профессионалы, успешно работаю-щие с самыми конкурентными тематиками. Под моим руководством в конце 2010 года группа таких экспертов провела исследо-вание факторов ранжирования, которое получило название «SEO-альманах 2010». В ходе исследования было рассмотрено бо-лее 200 факторов, сгруппированных в бло-ки. Нами применялась методология эксперт-ных оценок, были привлечены 26 ведущих SEO-экспертов. Исследование получило ши-рокий резонанс в SEO-кругах и за их преде-лами. Результаты проделанной работы, ка-сающиеся внутренних факторов, изложены в приложении к этой книге. Комментарии некоторых экспертов вы будете встречать и в процессе чтения основной части.

Вообще, говоря о тенденциях поискового продвижения сегодня, можно сделать сле-дующие выводы:

1 . Снижается значение покупных ссылок

«Священная война» с автоматическим про-движением набирает обороты, и  очевид-но, что успех сейчас на стороне Яндекса. Можно уверенно говорить о том, что сте-пень влияния покупных ссылок на  ран-жирование сведена к  минимуму. Стоит ожидать еще большего ужесточения, так что биржам ссылок уже сейчас необходи-мо становиться на путь повышения каче-ства площадок. Впрочем, такая ситуация не  стала для  кого-то  громом среди ясно-го неба: представители Яндекса не едино-жды предрекали «смерть» платных ссылок.

2 . возрастает значение внутренних факторов

Факторы, которые поддаются влиянию оптимизаторов, стали гораздо менее

Одной из первых задач, с которой я столкнулся после того, как возглавил отдел маркетинга в компании Adrenalin

Forex, была задача по поисковой оптимизации ее сайта. К тому моменту компания уже успела поработать по данной задаче с несколькими крупными SEO‑агентствами и, полностью разочаровавшись в нулевых результатах, перешла на само‑стоятельное SEO‑продвижение. К сожалению, предыдущий специалист так и не смог добиться высоких показателей, совмещая работу по продвижению с целым перечнем иных задач, соответствующих его компетенции и должности в компании.Таким образом, я пришел к выводу, что требуется поиск нового партнера по продвижению сайта компании с четко обозначен‑ными планами и обязательствами по их выполнению. После первой встречи с Леонидом появилось ощущение, что это тот человек, который обладает всем необходимым опытом для решения данной задачи. Тем не менее, учитывая преды‑дущий опыт компании, прошло несколько этапов согласования договора по оптимизации, где финансовые взаиморасчеты были привязаны к конкретным результатам работы и срокам их достижения.После подписания всех документов и начала нашей совмест‑ной деятельности агентством было подготовлено ТЗ, где было описано, какие тексты потребуется написать и как они должны размещаться на сайте для эффективного его продвижения. По условиям договора, текст готовился копирайтерами агентства, но здесь мы столкнулись с проблемой восприятия «оптимизаторских» текстов посетителями сайта. Говоря проще, в компании изначально были заданы особые стандарты к содержанию сайта, а именно требования по простоте, лаконичности и доступности материалов. Поэтому те тексты, которые написал копирайтер агентства, мы однозначно не могли позволить разместить на сайте компании. Требо‑валось подготовить такой текст, чтобы, если кому‑то вдруг и захотелось бы его прочитать, у него не возникло бы даже подозрений, что текст написан не для него, а для поисковых роботов. В результате кропотливого труда эти тексты удалось подготовить собственными силами. Итогом мы гордимся и по сей день, ведь написать понятный, простой и осмыслен‑ный текст с постоянно повторяющимися словами в строго заданном формате – весьма непростая задача.Не прошло и пары месяцев, как мы поняли, что проделали эту сложную работу совсем не зря, наблюдая, как наши позиции в поисковиках стремительно стали подниматься. А уже спустя полгода они по самым конкурентным запросам Forex и «Фо‑рекс» вышли на 2 место, что на первых этапах работы казалось практически невозможным.

отЗЫв КЛИентА

8 Предисловие

Page 11: Л.Гроховский - Руководство по внутренним факторам

значимыми. Те  же, на  которые повлиять очень сложно, а  порой и  нереально, вы-шли на первый план. Что ж, против лома нет приема, а  на  любое действие проти-водействие найдется: оптимизаторам не-обходимо повышать квалификацию, рабо-тать над своим подходом к продвижению и сосредотачивать внимание на внутрен-них факторах.

3 . Каждая тематика может иметь свои особенности продвижения

Введение алгоритма машинного обуче-ния «Матрикснет» не прошло бесследно: сейчас каждая конкретная тематика име-ет свою специфику продвижения, и  спе-цифика эта может зависеть еще и от типа запросов. Например, подходы к продвиже-нию однословного запроса и запроса более конкретного могут отличаться коренным образом. Технология продвижения многих запросов теперь еще и напрямую зависит от географической принадлежности сайта.

Резюмируя все вышесказанное, подчерк-нем: продвигать сайты стало сложнее. Да, было проделано много работы по раз-грузке оптимизаторского труда: создава-лись ссылочные агрегаторы, переводящие продвижение в  автоматический режим. И что же мы имеем сегодня? Необходимо буквально вручную прорабатывать вну-тренние факторы и  напрямую договари-ваться о  размещении ссылок на  качест-венных тематических площадках. Сроки продвижения растягиваются. Конкурен-ция растет. Утешительным моментом в  сложившейся ситуации является ме-жду тем рост покупательской аудитории. К примеру, количество запросов «ноутбук», по данным Яндекс.Вордстат, за год вырос-ло с 1  589  943 (ноябрь 2009) до 2  591  179 (ноябрь 2010). Разумеется, конкретные по-казатели зависят от тематики, но в целом тенденция роста очевидна.

По  мере развития поисковых систем количество факторов ранжирования

Продвигать сайты стало сложнее. Да, было проделано много работы по разгрузке

оптимизаторского труда: создавались ссылочные агрегаторы, переводящие продвижение в автома‑тический режим. И что же мы имеем сегодня? Необходимо буквально вручную прорабатывать внутренние факторы и напрямую договариваться о размещении ссылок на качественных тематиче‑ских площадках. Сроки продвижения растягивают‑ся. Конкуренция растет.

Предисловие 9

Page 12: Л.Гроховский - Руководство по внутренним факторам

увеличивается. Разумно предположить, что в таких условиях достичь положитель-ного результата можно быстрее, если воз-действовать на все возможные факторы, пусть даже некоторые кажутся пустяко-выми. Помните о том, что многие из них, накладываясь друг на друга, при оценке влияния на ранжирование считаются с ку-мулятивным эффектом. Согласитесь, луч-ше сделать все, что в ваших силах, и видеть результат стараний, чем что-то упустить и размышлять, что же конкретно. Имен-но этому принципу я  следую в  своей деятельности. Для  анализа потенциала внутренних факторов под моим руковод-ством разработана аналитическая систе-ма «СайтРепорт». С  ее помощью можно воздействовать практически на  все фак-торы, описанные в этой книге. Подробно о возможностях «СайтРепорт» вы прочте-те в приложении. Там же вы найдете ин-формацию об  акциях и  скидочных купо-нах на мои семинары и консалтинговые услуги.

Наша книга поможет вам удержаться на плаву, адаптироваться к изменившим-ся условиям и  переориентировать свою стратегию на внутренние факторы. Если вы решите углубить свои знания еще боль-ше и  информации в  этой книге для вас окажется недостаточно, вы можете полу-чить подкрепление почерпнутым знаниям на одноименном платном семинаре «оп-тимизация сайтов: задействуем вну-тренние факторы», который проводит-ся раз в год. На семинаре вы поучаствуете в разборе реальных сайтов слушателей, за-дадите интересующие вас вопросы и полу-чите особые бонусы.

Наша книга поможет вам удержаться на плаву, адаптироваться к изменившимся

условиям и переориентировать свою стратегию на внутренние факторы.

10 Предисловие

Page 13: Л.Гроховский - Руководство по внутренним факторам

вы можете смело пропустить эту часть, если считаете себя опыт-ным оптимизатором. Информация,

представленная здесь, будет полезна тем, кто  только начинает свою деятельность на поприще продвижения сайтов.

Поисковое продвижение сайтов – это ком-плекс работ, направленных на улучшение позиций веб-ресурса в выдаче поисковых систем. Цель этих мероприятий – извле-чение коммерческой выгоды за счет при-влечения на сайт посетителей из поиско-вых систем.

Существуют 3 способа продвижения сайтов:

воздействие на внутренние факторы;

воздействие на внешние факторы;

воздействие на поведенческие факторы.

Также продвижение сайтов часто делят по типам факторов, на которые произво-дится влияние со стороны оптимизатора.

внутренние факторы – это все работы, проводимые над  сайтом, а  также домен и серверные настройки.

внешние факторы – это использование рекомендательных ссылок, размещаемых на внешних ресурсах.

Поведенческие факторы  – статистиче-ская информация о посетителях сайта, со-бираемая поисковыми системами.

Внутренние и внешние факторы подраз-деляются на динамические и статичные. Первые учитывают статистику, накоплен-ную за  некоторый временной промежу-ток, например, возраст сайта, динамику

введение в продвижение сайтов

Page 14: Л.Гроховский - Руководство по внутренним факторам

12 Введение в продвижение сайтов

прироста рекомендательных ссылок. Ста-тичные факторы учитывают текущие значения.

Для эффективного продвижения необхо-димо использовать все три вышеперечис-ленных способа. Они неразделимы и дол-жны использоваться в комплексе. Только такой подход позволяет добиваться успе-ха в SEO.

0.1. Понятие о внутренних факторах

Верстка (HTML-теги)

Эта группа факторов учитывает правиль-ность верстки страниц с точки зрения ме-ждународного стандарта W3C. В  этом плане важны HTML-теги, наделенные ло-гическим смыслом: заголовок страницы, заголовки абзацев, смысловые выделе-ния текста, метатеги и др. Поисковые си-стемы учитывают текстовое содержание этих тегов и по ним определяют содержа-ние страниц. Обратите внимание: смыс-ловые теги не должны пересекаться друг с другом, например, заголовок не должен быть ссылкой.

Текст

Имеет значение не  только текстовое на-полнение страниц, но и ключевые слова, уникальность текста, объем информации и другие моменты. Очень важно наполнять сайт уникальным и полезным для посети-телей контентом, кроме того, нельзя дуб-лировать тексты на разных его страницах.

Настройки сервера

Настройки сервера – это инструкция, ко-торую получает поисковый робот, захо-дя на  каждую страницу. Эти настройки используются также при  перемещении страниц или  их  удалении с  сайта. Важ-но правильно настраивать эти инструк-ции, поскольку даже незначительные на  первый взгляд ошибки в  серверных

Продвигать сайты можно разными способами. Эти способы можно разделять

по многим критериям, например по степени соответствия рекомендациям поисковых си‑стем (черные и белые методы). Поисковики плохо относятся к сайтам, использующим методы, которые вводят алгоритм в заблуждение.К черным методам относится:• клоакинг (показ роботу поисковой системы другого

контента, отличного от того, который увидит пользователь, например текста, содержащего длинные списки ключевых слов),

• накрутка поведенческих факторов, когда веб‑мастер эму‑лирует интерес к своему сайту со стороны пользователя.

Покупку рекламных ссылок обычно называют серыми методами. Получается так, потому что поисковики хотели бы чтобы никто не покупал ссылок и не воздействовал подобным образом на алгоритм, однако данная практика, несмотря на такое отношение, стала общепринятой. Поэтому серьезные санкции за покупку ссылок со стороны поисковиков сейчас не применяются.Когда говорят о «белой» оптимизации, в основном подразуме‑вают оптимизацию внутренних факторов и создание информа‑ционных поводов в сети для получения ссылок и повышения авторитетности.

МненИе

Page 15: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 13

настройках могут стать фатальными для процесса продвижения сайта.

URL

Воздействие на  URL-факторы в  первую очередь подразумевает использование в адресе страницы ключевых слов. Важен также вид URL, его формула, учитывается и длина. Одно из непреложных правил гла-сит: страница должна быть доступна толь-ко по одному URL.

Возрастные факторы

К возрастным факторам среди прочих от-носятся возраст сайта, страницы, URL, ди-намика прироста контента, частота добав-ления новых страниц.

Географическое расположение

Географическое расположение важно для  регионального продвижения. В  этом плане имеют значение указанные на сайте контакты и  адреса организации, а  также обозначенные в тексте страниц сайта регио-нальные пункты и подобная информация.

Перелинковка

Страницы сайта связаны между собой се-тью внутренних ссылок. К группе факто-ров перелинковки относятся схемы пе-релинковки, тексты внутренних ссылок, а также вес передаваемых ссылок. Кроме того, имеет значение актуальность ссы-лок, а именно наличие переходов посети-телей по ним.

CMS

Важно содержание и тип сайта, вид CMS, факт использования бесплатных шабло-нов, тип движка, наличие особых блоков на сайте.

Инструкции для поисковых систем

Имеет значение наличие и содержание ин-струкции robots.txt, карты сайта sitemap.xml, их доступность для индексации.

Резюме: Внутренние факто-ры  – самое обширное направление

Настройки сервера – это инструкция, которую получает поисковый робот, заходя

на каждую страницу. Эти настройки используются также при перемещении страниц или их удалении с сайта. Важно правильно настраивать эти инструкции, поскольку даже незначительные на первый взгляд ошибки в серверных настройках могут стать фатальными для процесса продвиже‑ния сайта.

Page 16: Л.Гроховский - Руководство по внутренним факторам

14 Введение в продвижение сайтов

в  поисковом продвижении. Воздей-ствие на них не поддается автома-тизации и является самым затрат-ным направлением работ с  точки зрения временных ресурсов. между тем игра действительно стоит свеч: грамотный подход к использованию внутренних факторов позволяет до-стигать значительных результатов и на несколько шагов опережать кон-курентов. Преимущество внутрен-них факторов заключается в  том, что  большая часть работ прово-дится единоразово. Из этого правила есть исключения, но обычно 20 % уси-лий в этом направлении позволяют достигать 80 % результатов. Сей-час и в ближайшем будущем именно внутренние факторы «задают тон» в продвижении сайтов.

0.2. Понятие о внешних факторах Вес внешних рекомендательных ссылок

К этой группе относится большое количе-ство факторов, косвенно характеризующих качество площадки, размещающей рекомен-дательную ссылку: возраст площадки, уни-кальность текстов, количество размещен-ных рекомендательных ссылок, наличие донора в  Яндекс.Каталоге, позиции сайта в ПС, уровень вложенности страницы-доно-ра, количество контента на странице, авто-ритетность сайта-донора и другие факторы.

Содержание текста рекомендательных ссылок

Важно наличие ключевых слов в  тексте ссылки, а  также сама форма словосоче-тания: прямое вхождение, словоформа, разбавление ключевых вхождений, уни-кальность текста ссылки. Имеет значение и текст, окружающий анкор ссылки.

Статистика прироста внешних ссылок

Существуют (и  не  должны оставаться без  внимания) динамические факторы,

Важно наличие ключевых слов в тексте ссылки, а также сама форма словосочета‑

ния: прямое вхождение, словоформа, разбавление ключевых вхождений, уникальность текста ссылки. Имеет значение и текст, окружающий анкор ссылки.

Page 17: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 15

среди которых – плавность прироста ре-комендательных ссылок, соотношение их прироста в месяц и общей массы, плот-ность ключевых слов в анкор-листе.

Резюме: Воздействуют на внешние факторы двумя основными спосо-бами: ищут площадки для  разме-щения ссылок либо отправляются на  специализированные биржи сай-тов и статей. Однако покупка ссы-лок легко поддается автоматизации с помощью ссылочных агрегаторов, поэтому значение внешних факто-ров сейчас не так велико, как раньше, и продолжает снижаться дальше.

0.3. Понятие о поведенческих факторах Удовлетворенность пользователей со-

держанием сайта

Чтобы на первых страницах выдачи оказы-вались исключительно полезные для поль-зователей сайты, разработчики поиско-вых систем «обучают» своих детищ сбору и анализу статистики поведения посетите-лей сайта. По ряду косвенных признаков поисковый робот «соображает», насколь-ко пользователь был удовлетворен резуль-татами поиска и собственно содержимым конкретного сайта. В силах оптимизатора добиться более высокого уровня лояльно-сти пользователей. Для этого нужно поза-ботиться о качестве наполнения сайта.

Удобство пользования сайтом

Сайт должен быть не только содержатель-ным, но и удобным. Пользователи не за-держиваются на сайтах, где невозможно быстро отыскать нужную информацию, а поисковые роботы умеют по косвенным признакам определять, насколько ком-фортно будет чувствовать себя на  сайте посетитель. Важно поработать с  юзаби-лити: качественно представить информа-цию, сделать ее доступной в пару кликов, а ее изучение незатруднительным.

Чтобы на первых страницах выдачи оказывались исключительно полезные

для пользователей сайты, разработчики поисковых систем «обучают» своих детищ сбору и анализу статистики поведения посетителей сайта. По ряду косвенных признаков поисковый робот «сообража‑ет», насколько пользователь был удовлетворен результатами поиска и собственно содержимым конкретного сайта. В силах оптимизатора добиться более высокого уровня лояльности пользователей. Для этого нужно позаботиться о качестве наполне‑ния сайта.

Page 18: Л.Гроховский - Руководство по внутренним факторам

16 Введение в продвижение сайтов

Переходы на сайт из иных источников

Счетчик Яндекс.Метрика определяет ста-тистику посещений сайта, отграничивая переходы с поисковых систем от иных ис-точников. Сайт будет ранжироваться луч-ше, если его посещают также по прямому заходу, из закладки или со сторонних ре-сурсов. Ссылка, по которой переходят жи-вые посетители, имеет большее значение. Ссылка, которая простояла год, но ни при-влекла ни одного посетителя, справедливо может считаться бесполезной.

Статистика переходов на сайт из резуль-татов поиска

Имеет значение и то, пользуется ли сайт спросом у пользователей поисковой систе-мы. Разумно предположить, что сайт из-вестной компании и / или компании, услу-гами которой посетитель уже пользовался и остался доволен, привлечет больше вни-мания. Если, несмотря на высокие пози-ции, сайт имеет низкий CTR – он может потерять преимущество в ранжировании.

Прочие источники статистики

Портфель поведенческих факторов все на-ращивается. Возникают новые источники статистики вроде ссылок в почтовой пере-писке или оценок «Like» («Мне нравится») в социальных сетях.

Резюме: Поведенческие факторы уже стали самым значимым фактором. Однако тенденции развития поиско-вых систем явно направлены в сторо-ну улучшения анализа поведенческих факторов, так что в будущем стоит ожидать постепенного повышения значимости этой группы факторов.

0.4. Комплексный подход к продвижению сайтов

В  деле продвижения сайтов важен ком-плексный подход: оптимизатор должен воздействовать на все группы факторов.

Анкор ссылки (Anchor) Это текстовое содержимое, находящееся между тегами. Синоним – «текст ссылки».Апдейт Апдейтом называют пополнение базы данных поисковой машины новой информацией. Выдача поисковых систем меняется с различной частотой. В Google это происходит постоянно, в Яндексе апдейты случаются реже, несколько раз в неделю. В течение дней между апдейтами выдача Яндекса практически не меняется. Исключение – такие тематики и запросы, где присутствуют результаты работы специализиро‑ванных роботов, например новости или блоги.внешняя ссылка Это голосующая единица, дающая рекомендацию сайту, на который она ведет. Понятие «внешняя» означает, что один сайт ссылается на другой, в отличие от внутренних ссылок, которые перенаправляют пользователя в рамках одного сайта. Внешние ссылки помогают поисковым системам определить содержимое страниц, а также их значимость. Небезоснова‑тельно предполагается, что на более качественный сайт в Сети размещено большее количество внешних ссылок. Существуют специализированные биржи для работы с такими ссылками. Кроме того, уже несколько лет оптимизаторы пользуются агрегаторами – автоматизированными системами, которые позволяют решить вопрос покупки ссылок практически без ручного труда.внутренняя ссылка Так называют ссылку, ведущую на другую страницу того же сайта. Понятие «внутренняя» означает, что одна страница ссылается на другую в рамках одного ресурса, «внутри» него. Внутренние ссылки влияют на перераспределение веса между страницами, этот процесс носит название перелинковки. Пере‑линковка – один из важных моментов внутренней оптимиза‑ции сайта, который мастерски используют в своих интересах опытные SEO‑специалисты.вЧ Аббревиатура расшифровывается как «высокочастотный». Обычно этим термином обозначают наиболее часто вводимые запросы. Нужно понимать, что частотность, пусть и является спутником конкуренции, напрямую с ней не связана: нередко можно встретить крайне конкурентные запросы, которые не являются высокочастотными.Донор, Акцептор Донором называют страницу, на которой размещена рекомен‑дательная ссылка. Соответственно, акцептором в поисковом продвижении обозначают страницу, на которую эта ссылка ведет.Дублированный контент Обозначает неуникальный, существующее где‑то еще в Интер‑нете контент. Поисковые системы негативно воспринимают дубликаты, поскольку с ними связаны проблемы хранения и обработки «мусорных» данных.

ЛИКБеЗ

Page 19: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 17

При  таком раскладе возникает синер-гия, и значение каждого фактора в груп-пе возрастает. Подобный подход возможен за счет планирования стратегии продви-жения, представляющей собой план дол-госрочного последовательного захвата позиций в  поисковых системах. Давайте разберем такую стратегию.

Этап 1: Подготовка сайта к продвижению

Составление семантического ядра

Составление семантического ядра – важ-нейший этап в продвижении сайта. На пер-вый взгляд может показаться, что техноло-гия подбора ключевых слов незатейлива, но это не так. Большинство оптимизато-ров совершают фатальные ошибки уже на этой стадии. В действительности «не-затейливый» процесс подбора и проверки запросов, например, для интернет-магази-на бытовой техники, может занять у опти-мизатора несколько дней.

Анализ тематики

Сейчас, когда алгоритмы используют тех-нологию машинного обучения, каждая тематика может иметь свои особенности в  продвижении. Важно провести анализ конкурентов в топ-10 – топ-30, выделить среди них сайты, похожие на ваш, подсчи-тать средние значения факторов ранжиро-вания и сделать все «под копирку».

Выбор входных страниц

При  выборе входных страниц важно учесть два правила. Во-первых, чем мень-ше запросов продвигается на одну страни-цу, тем лучше. Не бывает много входных страниц, бывает много запросов. Поэтому, если вы решили продвигать большое ко-личество запросов, а подходящих страниц нет, не старайтесь уместить ключи на уже существующих, лучше создавайте новые страницы. Во-вторых, на входной страни-це посетитель обязательно должен найти то, за чем он пришел на сайт.

Индекс Это база данных поисковой системы, хранилище всех документов, собранных в Сети. Поиск осуществляется только по тем документам, которые в данный момент времени содержатся в индексе поисковых систем.

Конверсия Так называется отношение количества посетителей сайта, совершивших какое‑либо целевое действие, к общему коли‑честву привлеченных посетителей. Целевым действием может быть регистрация в сервисе, звонок, заказ услуги или покупка товара, подписка на рассылку, добавление сайта в закладки, скачивание файла и т. п.

нЧ Аббревиатура расшифровывается как «низкочастотный». Низкочастотными называют те запросы, которые пользо‑ватели поисковых систем вводят редко. Многие из таких запросов вводят раз в месяц и даже реже. НЧ‑запрос может быть тем не менее высококонкурентным. Продвигать такие запросы проще. Кроме того, тенденция развития поведения пользователей – стремление к уточнению запросов, поэтому с каждым годом доля НЧ‑запросов возрастает, а ВЧ падает. Как правило, «низкочастотники» выигрывают в трафике за счет охвата огромной массы запросов.

Покупка ссылок Цель этого мероприятия – улучшение позиций сайта по за‑просам, содержащимся в тексте ссылки. Существуют разные источники покупки ссылок: биржи, ручной обмен, размещение статей и т. п.

ПС Так сокращенно называют поисковую систему. Для оптимиза‑тора наибольший интерес представляют поисковые системы Яндекс, Google, Mail.ru. Некогда лидировавшая на рынке поиска система Rambler сейчас при продвижении всерьез не рассматривается, поскольку обеспечивает совсем незначи‑тельное количество посетителей.

Результаты поиска Это ответ поисковой системы на запрос пользователя. При стандартных настройках на первой странице результатов поиска в Яндекс и Google оказывается всего десять сайтов, поэтому большинство договоров на SEO‑услуги предполагают вывод именно в десятку.

Релевантность Под релевантностью понимают меру схожести и применяют это понятие в SEO при оценке соответствия результатов поиска запросу пользователя. Понятие «релевантная запросу страни‑ца» используется также в момент выбора входной страницы (страницы, на которую будет попадать посетитель из поиско‑вых систем). Часто в качестве входной страницы выбирают наиболее релевантную.

Сниппет Это описание сайта в результатах поиска. Традиционно сниппет берется из текста страницы. При его формировании также могут быть использованы другие источники, например,

Page 20: Л.Гроховский - Руководство по внутренним факторам

18 Введение в продвижение сайтов

Составление технического задания на написание текстов

Подготовка текстов  – важный этап, и ошибки здесь обходятся дорого. Поэто-му техническое задание (ТЗ) на написание текстов должен подготовить опытный SEO-специалист. В этом документе должны со-держаться подробные указания: объем текста на страницах, употребляемые клю-чевые слова, их количество, рекомендации по составлению заголовков. После написа-ния текстов их нужно проверить на соот-ветствие требованиям ТЗ.

Подготовка текстов

Тексты должны не только содержать клю-чевые слова, но  также быть полезными и удобочитаемыми для посетителей. Не ре-комендую прибегать к  услугам дешевых неопытных SEO-копирайтеров, за  каче-ство стоит переплатить. В первую очередь тексты должны продавать. В книге мы рас-смотрим подход к продвижению, при кото-ром достигается баланс между SEO и про-дающей способностью текстов.

Аудит внутренних факторов

Необходимо провести полную диагности-ку сайта, выявить ошибки, обнаружить об-ласти с незадействованным потенциалом. После этого следует устранить недоработ-ки и подстроить сайт под требования и ре-комендации поисковых систем.

Составление технического задания на доработку сайта

Задача оптимизатора – подготовить пол-ное и понятное ТЗ для веб-программиста, проконтролировать выполнение рабо-ты и принять результат. Без привлечения программиста внести все правки удаст-ся только в том случае, если оптимизатор сам уже несколько лет работает с CMS-си-стемами, умеет управлять базами данных и знает языки программирования.

Доработка сайта под SEO

описание сайта в Яндекс.Каталоге или Description. Сниппет мо‑жет содержать разделы сайта, дату, новости, телефон и адрес компании. Привлекательный для пользователя сниппет может существенно увеличить посещаемость сайта.

СЧ

Аббревиатура расшифровывается как «среднечастотный». Этим термином обозначают нечто среднее между высокоча‑стотным и низкочастотным запросом.Сквозняк Сквозной называют ссылку, размещенную на многих страницах сайта. «Сквозняки» дублируются либо между всеми страницами сайта, либо внутри какого‑то раздела. Они, как правило, «зашиты» в шаблон.трафик Это синоним понятия «количество посетителей сайта».Семантическое ядро Подразумевается набор запросов, по которым продвигается сайт. Составление семантического ядра – очень важный, одна‑ко сложный и долгий процесс. Семантическое ядро для обыч‑ного интернет‑магазина содержит несколько тысяч запросов, для некоторых крупных сайтов их количество исчисляется десятками тысяч.тИЦ Аббревиатура расшифровывается как «тематический индекс цитирования». ТИЦ – это числовая величина, характери‑зующая авторитетность того или иного сайта, с точки зрения Яндекса. Рассчитывается ТИЦ на основании качества и ко‑личества ссылающихся на данный сайт источников с учетом динамики прироста этих ссылок.

Page 21: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 19

Лучше изначально делать сайт под  SEO, чем «натягивать» SEO на сайт. Но, к сожа-лению, культура создания сайтов под SEO развита у нас очень слабо: людей, способ-ных делать такие сайты, можно пересчи-тать по пальцам. Несмотря на то, что мно-гие компании, предоставляющие услуги комплексного интернет-маркетинга, уве-ряют, что  делают «заточенные» под  SEO сайты, на поверку оказывается, что лишь единицы могут похвастаться слаженной работой специалистов. В итоге часто на вы-ходе получается сайт, который оптимизато-рам приходится значительно дорабатывать под нужды SEO. Причем доработки могут быть очень серьезными, вплоть до сущест-венных изменений в структуре сайта и его программной части. Тем не менее без них об эффективном продвижении сайта в по-исковых системах говорить не приходится.

Этап 2: Продвижение сайта

Покупка рекомендательных ссылок

Работа над  внешними факторами в  це-лом сводится к  покупке рекомендатель-ных ссылок. На сегодняшний день с этим лучше всего справляются ссылочные агре-гаторы, позволяющие полностью автома-тизировать процесс: вам нужно лишь ука-зать запросы и настроить покупку ссылок.

Привлечение бесплатных рекоменда-тельных ссылок

Большое количество ссылок можно добыть бесплатно. На их поиск придется затратить немало времени, но, если подойти к это-му процессу с  умом, многие бесплатные ссылки будут иметь гораздо больший вес, чем покупные. Этот вопрос подробно ра-зобран на моем DVD-семинаре «Продви-жение сайта: источники привлечения вне-шних ссылок».

Повторный аудит внутренних факторов

Подготовка дополнительных текстов

Повторная доработка сайта под SEO

Не стоит тешиться иллюзией, будто ваш веб‑мастер, наделавший ошибок

при верстке и программировании сайта, исправит их по вашему новому ТЗ и не допустит ни одной новой оплошности. К примеру, он может поставить редирект 302 вместо 301. Посетителям от этого хуже не станет, но поисковые системы могут вас неправильно «понять», и для продвижения в поиске такое «пустяковое» различие может стать фатальным. Важно не просто проверить исполне‑ние рекомендаций по ТЗ, а провести полноценный повторный аудит, иначе новые ошибки могут остаться незамеченными. Приготовьтесь к тому, что аудит придется проводить несколько раз, и только после проведения контрольного анализа, подтверждающего, что ошибок больше нет, можно будет вздохнуть спокойно.

Page 22: Л.Гроховский - Руководство по внутренним факторам

20 Введение в продвижение сайтов

Из стратегического плана видно, насколь-ко важно воздействовать на  внешние и  внутренние факторы в  течение всего периода продвижения сайта. Среди опти-мизаторов бытует миф, будто достаточно один раз внести доработки на сайт на на-чальной стадии продвижения и можно за-крыть вопрос воздействия на внутренние факторы. В действительности все обстоит иначе. внутренние факторы также ну-ждаются в постоянном анализе и дора-ботке. Ниже рассмотрим основные при-чины такой необходимости.

Со временем текст сайта теряет уникальность

Контент «утекает» с сайта по разным кана-лам. Тексты воруют конкуренты, которые не  удосужились придумать что-то  свое, а также непорядочные «дорвейщики», за-рабатывающие на перепродаже трафика. Копии текста страницы множатся, а сайт теряет вес для поисковых систем. Чтобы не потерять позиции по ВЧ- и СЧ-запросам, время от времени нужно проводить анализ уникальности контента и при необходимо-сти обновлять его, переписывая тексты. Что касается продвижения по НЧ-запро-сам, воровство контента не наносит силь-ного ущерба текущим позициям, тем более что существует защитная методика, о ко-торой будет рассказано в одной из следую-щих глав.

После доработок сайта часто возника-ют новые проблемы

Не  стоит тешиться иллюзией, будто ваш веб-мастер, наделавший ошибок при  верстке и  программировании сай-та, исправит их  по  вашему новому ТЗ и не допустит ни одной новой оплошно-сти. К примеру, он может поставить реди-рект 302 вместо 301. Посетителям от этого хуже не станет, но поисковые системы мо-гут вас неправильно «понять», и для про-движения в  поиске такое «пустяковое» различие может стать фатальным. Важно

настоящее и будущее факторов ранжированияОсновная задача поиска – обеспечить точный и полный ответ на запрос пользова‑теля. Яндекс, равно как и другие поисковые системы, использует множество метрик качества поиска, например:• средняя позиция первого клика в выдаче,• доля некликнутых результатов.Любая модификация алгоритмов антиспама или ранжи‑рования не должна ухудшить качество поиска. В условиях существенного seo‑прессинга разработчики поисковых систем вынуждены постоянно искать новые качественные и незаспамленные сигналы, которые можно использовать в технологии антиспама или ранжирования.Поле факторов стремительно расширилось за последние несколько лет благодаря двум основным направлениям:1. Факторы, учитывающие поведение пользователей: продол‑жительность просмотра документов, ctr‑ссылок на сайт в выдаче поисковых систем, доля непоискового трафика на сайт и т. д.2. Факторы, учитывающие отношение пользователей к сайту: цитируемость и количество «лайков» в социальных сетях, количество твитов и ретвитов со ссылкой на сайт и пр. и пр.Модель, учитывающая поведение и отношение пользова‑телей к документам сайта, существенно более устойчива к спаму и позволяет более эффективно ранжировать документы в выдаче. Можно легко проиллюстрировать это сравнением топовых сайтов, отранжированных различными алгоритмами:

Top-20 websites by three different algorithmsNo PageRank TrustRank BrowseRank1 adobe.com adobe.com myspace.com2 passport.com yahoo.com msn.com3 msn.com google.com yahoo.com4 microsoft.com msn.com youtube.com5 yahoo.com microsoft.com live.com6 google.com passport.net facebook.com7 mapquest.com ufindus.com google.com8 miibeian.gov.cn sourceforge.net ebay.com9 w3.org myspace.com hi5.com10 godaddy.com wikipedia.org bebo.com11 statcounter.com phpbb.com orkut.com12 apple.com yahoo.co.jp aol.com13 live.com ebay.com friendster.com14 xbox.com nifty.com craigslist.org15 passport.com mapquest.com google.co.th16 sourceforge.net cafepress.com microsoft.com17 amazon.com apple.com comcast.net18 paypal.com infoseek.co.jp wikipedia.org19 aol.com miibeian.gov.cn pogo.com20 blogger.com youtube.com photobucket.com

Источник: BrowseRank: Letting Web Users Vote for Page Importance, https://research.microsoft.com / en‑us / people / tyliu / fp032‑liu.pdf

МненИе

Page 23: Л.Гроховский - Руководство по внутренним факторам

Введение в продвижение сайтов 21

не просто проверить исполнение рекомен-даций по ТЗ, а провести полноценный по-вторный аудит, иначе новые ошибки могут остаться незамеченными. Приготовьтесь к тому, что аудит придется проводить не-сколько раз, и  только после проведения контрольного анализа, подтверждающе-го, что ошибок больше нет, можно будет вздохнуть спокойно.

Некоторые доработки являются экспериментальными

Многие доработки экспериментальны, особенно это касается тех факторов, ко-торые зависят от тематики. С первого раза крайне редко удается выбрать правиль-ные значения для  подобных факторов. Прибавьте к  этому нестабильность сре-ды: алгоритм Яндекса, использующий тех-нологии машинного обучения и  оценки асессоров, постоянно изменяется в рамках каждой тематики. В результате становит-ся очевидным необходимость экспери-ментов и  оценки результатов с  адапта-цией сайта к тематике. Только при таком раскладе можно рассчитывать на повыше-ние эффективности продвижения. Экспе-риментальный подход хорошо иллюстри-рует работа с плотностью ключевых слов, когда в написанном тексте мы увеличива-ем плотность ключевых слов и ждем ап-дейта. Если позиции падают – уменьша-ем плотность. Если растут – увеличиваем еще.

Конкуренты не стоят на месте

Выход в  топ для  многих оптимизаторов становится сигналом к прекращению ра-боты над сайтом. Между тем нельзя терять бдительность. Удержание позиций  – это постоянная борьба. Все хотят в топ, а в ито-ге попадает туда самый упорный и смыш-леный. Чтобы удержать позиции, нужно анализировать конкурентов и вовремя по-вторять их шаги.

Контент-менеджер может допускать ошибки

Как видно, алгоритм BrowseRank позволил существенно лучше отранжировать сайты с длинной пользовательской сессией, чем традиционный PageRank.Логично ожидать и дальнейшего расширения поля влияющих факторов.Вообще довольно эффективных критериев можно при‑думать весьма немало. Для решения одной из задач мне потребовалось придумать алгоритм фильтрации сплогов (спамовых блогов, созданных исключительно для размещения рекламных сообщений). Одна из найденных закономерностей: посты в спамовых блогах обычно получают гораздо меньше комментариев, чем посты в хороших блогах. Распределение количества блогов по среднему числу комментариев к посту выглядит так:

Данные получены на выборке в 30 тысяч блогов. Использо‑вание лишь одного параметра позволило отфильтровать спа‑мовые блоги с точностью и полнотой порядка 80 % при пороге ~7 комментариев на пост. Введение в алгоритм фильтрации дополнительных критериев позволит еще более эффективно отсеять спам.Собственно, в этом состоит один из серьезных трендов совре‑менного поиска – использование мономов, т. е. комбинаций факторов. Широкое применение мономов позволяет повысить эффективность алгоритмов и затрудняет реверс‑инжиниринг.Логичен вывод: любой сигнал, обеспечивающий достоверное отделение некачественного документа или сайта от качествен‑ного, будет использован.

Page 24: Л.Гроховский - Руководство по внутренним факторам

22 Введение в продвижение сайтов

Если сайт постоянно обновляется, кон-тент-менеджеры публикуют новости и до-бавляют товары в каталог, нужно отсле-живать, не допускают ли они критичных для SEO ошибок. А в случае, когда на сай-те периодически появляются новые разде-лы и меняется текстовое наполнение ста-рых, вероятность ошибок резко возрастает и почти равна 100 %.

Резюме: Хочу заметить, что ошиб-ка никогда не станет критической, если отыскать ее сразу после появле-ния, а не дотянуть до падения пози-ций сайта и лишь тогда приступить к исправлению упущений.

Page 25: Л.Гроховский - Руководство по внутренним факторам

П ри  перелинковке важно пони-мать, каким образом вес пере-дается между страницами. Сра-

зу хотелось бы отметить, что знание это весьма относительно, так как при переда-че веса от страницы к странице задейству-ется множество факторов и точного расче-та здесь не может быть по определению.

Доподлинно известно, что  при  расчете веса ссылки учитывается фактор ее «кли-кабельности», то есть та ссылка, по кото-рой пользователи активно кликают мы-шью, передает больший вес, нежели та, которая остается без  внимания посети-телей сайта. Это утверждение справедли-во не только в плане внутренней перелин-ковки: расчет влияния входящий внешних ссылок ведется по такой же схеме. Свою роль играет и  способ размещения ссыл-ки, в частности, важно, является ли ссыл-ка сквозной.

Как  ни  печально, но  при  всем желании вы не сможете рассчитать передаваемый ссылкой вес точно. Однако знание о спо-собах перелинковки позволит вам мак-симально задействовать потенциал вну-тренних ссылок с точки зрения технологии передачи ссылочного веса PageRank.

Некоторые оптимизаторы могут возра-зить: о  каком PageRank идет речь, если эта технология по нынешним меркам уже может быть отнесена к «каменному веку» эпохи интернет-продвижения? Да, техно-логии уже 10 лет, безусловно, она претер-пела немалые изменения, однако базовые принципы остались прежними. С  ними я вас и познакомлю в этой главе.

Глава 1Перелинковка страниц

Page 26: Л.Гроховский - Руководство по внутренним факторам

24 Перелинковка страниц

1.1. Как вычисляется PageRank и почему это так важно знать

Говоря о  поисковом предложении в  це-лом, я  стараюсь предлагать универсаль-ные решения, которые подходят для всех (или для большей части) популярных по-исковых систем. Однако иногда выбора ме-жду различными подходами не избежать, и в этом случае я вынужден отдавать при-оритет продвижению под поисковую си-стему Яндекс, доля поискового трафика ко-торой растет день ото дня.

В этой связи кажется странным, что я по-свящаю целую главу PageRank, кото-рый является атрибутом Google, но ни-как не Яндекс. Зачем я это делаю? Ответ прост: значение PR-страницы для  Ян-декса не важно, и тем не менее эта поис-ковая система тоже оперирует таким по-нятием, как вес страницы, и использует ссылки при ранжировании. Поскольку основа технологии PageRank представ-ляет собой базовые принципы ссылоч-ного ранжирования, вполне закономер-ным кажется следующий вывод: знание принципов расчета PageRank наилуч-шим образом поможет вам понять, как передается вес между страницами с точки зрения популярных поисковых систем. Итак, начнем.

Что все это значит на практике?

Чем глубже в структуре сайта расположе-на страница, тем меньший вес ей достается (помним о коэффициенте затухания). Вес страницы делится поровну между всеми ссылками на  странице. Соответственно, входные страницы должны получать мак-симальный вес, а  второстепенные стра-ницы – обеспечивать максимальный вес входным страницам. Добиться оптималь-ного соотношения можно, закрывая лиш-ние ссылки от индексации.

Существуют моменты, которые могут стать помехой для оптимизации:

В1998 году основатели компании Google Сергей Брин и Ларри Пейдж опубликовали

статью, в которой ввели понятие PageRank, как меру авторитетности страницы. Рейтинг страницы в этой модели зависит от количе‑ства ведущих на нее ссылок и от рейтинга ссылающихся страниц. Статическим весом является доля PageRank, передаваемая каждой ссылкой.Каждая рассмотренная модель является условным идеаль‑ным примером, не учитывающим, что на внутренние стра‑ницы могут стоять ссылки извне. Также результаты расчета статического веса внутренних страниц могут искажаться из‑за неравномерности индексации страниц со ссылками поисковым роботом.Большую роль играет и то, на скольких страницах сайта раз‑мещена ссылка. Одна сквозная, т. е. стоящая на всех страницах сайта ссылка перераспределит значения рангов внутренних страниц гораздо сильнее, чем одна ссылка с главной страницы.

*Sergey Brin and Larry Page. The Anatomy of a Search Engine http://www‑db.stanford.edu / pub / papers / google.pdf

МненИе

Page 27: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 25

• ограниченные возможности CMS,• обилие ссылок на крупном сайте,• устоявшаяся структура сайта.

1.2. Базовые схемы перелинковкиДля достижения целей вам необходимо ис-пользовать правильную схему перелин-ковки. На  примере некоторых базовых конструкций я покажу, каким образом мо-жет быть выстроена такая схема.

Сразу сделаю небольшую оговорку: лю-бая схема перелинковки условна и может быть масштабирована. Так, рассматривая схему, в  которой участвуют 10 страниц, мы можем подразумевать сайт с десятка-ми тысяч страниц, которые распределены по 10 основным подразделам. Таким обра-зом, мы построим пути передачи ссылоч-ного веса по главным разделам, а потом уже рассмотрим их по отдельности и про-считаем схему распределения веса в каж-дом разделе.

Планируя перелинковку, я исхожу из со-ображений оптимального использова-ния внутреннего ссылочного потенциала сайта, поэтому высокочастотные запросы в приведенных ниже схемах перелинковки двигаются на главную страницу, средне-частотные – на страницу раздела (обычно это страница первого уровня вложенно-сти), а низкочастотные – на страницы то-вара / услуги (обычно это страницы второ-го, третьего и ниже уровня вложенности).

Универсальной схемы перелинковки не су-ществует. Конкретный выбор зависит даже не от выбора группы запросов, а от осо-бенностей тематики. Существуют такие тематики, в которых основная доля посе-тителей приходится на 5 запросов, а все остальные запросы не принесут даже 10 % того трафика, что обеспечат эти 5 (напри-мер, тематика «такси»). В таких случаях, безусловно, оптимальной тактикой будет продвижение пяти выбранных запросов

Растолкованный PageRank1

PageRank – это методика измерения «важности» веб‑страни‑цы в Google. Когда все другие значимые факторы, такие как тег Title и ключевые слова, учтены, Google прибегает к PageRank и корректирует результаты ранжирования с расчетом, чтобы более важные сайты оказывались выше на странице результа‑тов поиска пользователя.Главный момент: никто точно не знает, как Google рас-считывает PR. Однако есть нюансы, которые стоит учитывать всегда:1. Сайт, который ссылается на забаненные сайты, может попасть в бан.

Будьте щепетильны в выборе исходящих ссылок. Не ссылай‑тесь на подозрительные сайты: каталоги ссылок («линко‑помойки»), забаненные ресурсы и т. п. Всегда проверяйте PR сайтов, на которые собрались сослаться, иначе есть вероятность, что Google выпишет вам «желтую карточку» – пенализирует сайт.2. Ссылки на тематические сайты с высоким PR и ссылки с таких сайтов очень важны.

Причем передаваемый ссылкой PR будет тем больше, чем бли‑же будет тематика страниц. Ссылки на полезные и интересные тематические ресурсы указывают поисковым машинам, что сайт имеет определенную ценность для пользователей Сети. Таким образом, проставляя ссылки только на качествен‑ные сайты, можно на несколько шагов опередить конкурентов.в целом порядок ранжирования в Google выглядит так:

1. Найти все страницы в индексе, которые соответствуют ключевым словам поиска.2. Отранжировать найденное в соответствии со «страничными факторами» (ключевыми словами и т. п.).3. Учесть текст ссылок на страницы.4. Скорректировать результаты, использовав данные PageRank.Принципы вычисления PageRank:

• PageRank – это число, характеризующее исключительно голосующую способность всех входящих ссылок на страницу и ту силу, с которой они эту страницу рекомендуют.

• Если страница А ссылается на страницу В, то страница А считает, что страница В важная.

• Если на страницу ведет много важных ссылок, то и ее ссылки на другие страницы становятся более важными.

• Внутренние ссылки учитываются при расчете веса PageRank для других страниц сайта.

ФАКт

1По материалам статьи «Растолкованный PageRank» в перево‑де Александра Садовского.

Page 28: Л.Гроховский - Руководство по внутренним факторам

26 Перелинковка страниц

• Страница не может голосовать так, чтобы другая страница стала столь же важна, как она сама. Таким образом, чем труднее добраться до какой‑то web‑страницы, тем меньшим авторитетом она обладает.

• Существует так называемый коэффициент затухания: страница всегда передает другой странице меньший вес, чем получает сама. Например, коэффициент равен 0,85. В таком случае передача веса после затухания равна 0,85. В том случае, если со страницы ведут две ссылки, передан‑ный по каждой из них вес будет равняться 0,425 и так далее.

• Во время одной итерации вычислений страница 1 дает странице 2 повышение в весе. Если страницы ссылаются друг на друга, то во время следующей итерации страни ‑ ца 1 получает увеличение веса, пропорциональное новому, увеличившемуся весу страницы 2.

• Вес PageRank, передаваемый на страницу А со страницы В, которая указывает на нее, куда‑нибудь уменьшается с каж‑дой ссылкой, которая находится на странице В. Это значит, что вес страницы – это, по сути, мера ее голоса. Страница может разделить этот голос между одной, двумя или более ссылками, но общая голосующая сила остается неизменной.

на главную страницу и выбор схемы пере-линковки под ВЧ-запросы.

Комплексное продвижение всего сайта

Эта схема наиболее универсальна и с ней приходится сталкиваться чаще всего. Она подходит в тех случаях, когда планируется продвигать все группы запросов (ВЧ, СЧ, НЧ), а  также тогда, когда шаблонизатор сайта не позволяет закрыть от индексации часть ссылок на конкретной странице. Не-даром эту схему перелинковки называют «все ссылаются на всех».

Принцип ее построения прост:

1. Главная страница ссылается на страни-цы всех разделов.

2. Страница каждого раздела ссылается на вложенные страницы, а также на глав-ную. Разделы перелинковываются между собой так, чтобы все они ссылались друг на друга.

3. Все вложенные страницы ссылаются на вышестоящий раздел и на главную стра-ницу. Вложенные страницы конкретного раздела ссылаются друг на друга. Все вло-женные страницы – на начальные страни-цы соседних разделов.

При таком раскладе вес равномерно уга-сает от  страницы 0 уровня вложенности к странице 2 уровня. Однако у этой схе-мы есть определенный недостаток: сай-ту, на котором применена такая методика перелинковки, при  продвижении ВЧ-за-просов сложно конкурировать с сайтами, где задействована схема перелинковки, предполагающая направление всего веса на главную страницу.

Рассмотрим такую схему на рис. 1.

Продвижение главной страницы под вЧ

В  условиях напряженной конкуренции используют главный «ход конем» – пере-линковку с  передачей веса на  главную страницу. Эта методика очень проста: каждая страница ссылается на  главную,

Page 29: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 27

и на каждую страницу, кроме главной, сто-ит всего одна ссылка (рис. 2). При такой перелинковке главная страница получает максимально возможный вес. Недостат-ки этой схемы очевидны: в плюсе остается только главная, а все остальные страницы получают очень низкий вес, поэтому кон-курировать по СЧ- и НЧ-запросам с сайта-ми, избравшими стратегию приоритета этих запросов, становится затруднительно.

Продвижение разделов под СЧ

Такая схема прекрасно подходит интернет-магазинам в тех отраслях, где люди ищут не название модели / товара, а целую то-варную группу. Например, когда пользо-ватель хочет купить индийскую космети-ку, он не ориентируется в брендах, а ищет просто «индийский шампунь» или «индий-скую пену для ванны», поэтому для мага-зина индийской косметики схема продви-жения разделов под СЧ будет идеальной.

Методика сводится к тому, что сайт соби-рает трафик по СЧ запросам и вес получа-ют страницы разделов. Принцип построе-ния этой схемы прост: все страницы сайта

Пара фактов о PageRank

«Чем меньше ссылок со страницы – тем меньше веса с нее утекает» –

думают многие оптимизаторы. Это миф. Взглянув на формулу PageRank нетрудно понять, что количество исходящих ссылок не имеет никакого значения. Одна она будет или 100 – со стра‑ницы уйдет одинаковое количество веса.Более того, даже если убрать все исходящие ссылки со страни‑цы, оставив входящие, это не приведет к накоплению на ней PageRank. Здесь вступают в игру методы обработки «висящих ссылок» (dangling links), и такие страницы могут вовсе не полу‑чить статического веса.Для больших сайтов бывает трудно построить модель и посчитать PageRank. Тогда можно руководствоваться двумя простыми принципами:a) страница имеет высокий PageRank, если количество входя‑щих ссылок кратно превышает количество исходящих,b) страница имеет высокий PageRank, если на нее ссылается страница предыдущего типа (высокий относительно среднего уровня. Разумеется, он будет меньше, чем в варианте «а»).Эти принципы не являются гарантией. Существуют исключе‑ния. Но в большинстве случаев они работают.

ФАКт

Рис. 1. Комплексное продвижение всего сайта

PageRank 1,65

PageRank 1,6

PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77 PageRank 0,77

PageRank 1,6

Page 30: Л.Гроховский - Руководство по внутренним факторам

28 Перелинковка страниц

ссылаются на страницы разделов, и исклю-чительно на страницы разделов ссылают-ся страницы 2 и ниже уровня вложенно-сти. Выглядит такая схема перелинковки следующим образом (рис. 3).

Рис. 3. Продвижение разделов под СЧ

Рис. 2. Продвижение главной страницы под ВЧ

Продвижение СЧ

2

3 3 3 3 3 3

2

PageRank 3,86

PageRank 0,31 PageRank 0,31

PageRank 0,97

PageRank 0,97

PageRank 0,97

PageRank 0,97

PageRank 0,31 PageRank 0,31

Page 31: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 29

Продвижение внутренних страниц под НЧ

В  интернет-магазине, который торгует продукцией популярных брендов, поль-зователи, как правило, ищут товар по на-званию конкретной модели. В этом случае стоит задействовать схему перелинков-ки, продвигающую внутренние страницы под НЧ (рис. 4).

Пример тематики, для которой схема ока-жется чрезвычайно эффективной, – ноутбу-ки. Так, на момент написания книги «ноут-бук asus» по России искали 4 393 человека, а «ноутбук Asus k50c» – 722 человека. А ведь у бренда Asus широчайший модельный ряд. Несложно смекнуть, что  в  совокупности запросы с названием моделей могут дать больше трафика, чем более общий запрос «ноутбук Asus». Кроме того, поскольку эти запросы более точные, конверсия с них бу-дет на порядок выше, ведь посетитель най-дет именно ту модель, которую искал.

Если вы выбираете эту схему перелин-ковки, стоит придерживаться следующих правил: страницы карточек товаров / услуг ссылаются только друг на друга, нельзя от-давать вес страницам разделов.

Итак, мы рассмотрели основные схемы пе-релинковки. Помните о  масштабирова-нии: одной страницей на шаблоне по фак-ту может являться огромный раздел сайта.

Следует отметить, что комплексный под-ход к  продвижению является намно-го более эффективным, чем  методика,

Рис. 4. Продвижение внутренних страниц под НЧ

Следует отметить, что комплексный подход к продвижению является намного более

эффективным, чем методика, ориентированная лишь на один из сегментов запросов.

PageRank 1,3 PageRank 1,3

PageRank 0,21

PageRank 0,15

PageRank 0,21

PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3 PageRank 1,3

Page 32: Л.Гроховский - Руководство по внутренним факторам

30 Перелинковка страниц

ориентированная лишь на  один из  сег-ментов запросов (ВЧ, СЧ, НЧ). Конечно, в  тематиках типа «такси» или  «пласти-ковые окна» выбор схемы перелинков-ки под  ВЧ-запросы полностью оправдан и даже является единственно верным, од-нако в других случаях я не рекомендую ис-пользовать строго схему продвижения од-ной группы. Каждый раз на этапе выбора схемы перелинковки нужно определиться с целями и особенностями тематики и уже исходя из этой информации модифициро-вать схему под свои нужды.

1.3. Локальные схемы перелинковкиЧтобы правильно строить схемы пере-линковки, важно разбираться в способах перелинковки локальной. В  данном слу-чае между собой связываются родствен-ные страницы одного уровня вложенно-сти (чаще всего вложенные в один раздел).

Кольцо

Популярная схема перелинковки, в кото-рой страницы последовательно связыва-ются между собой, замыкаясь в  кольцо: 1 —> 2 —> 3 —> 1.

Явный недостаток такой схемы сводится к тому, что в случае выпадения одной стра-ницы из индекса связь нарушается и вес теряет все кольцо. Экспериментально до-казано: в сравнении с другими схемами ло-кальной перелинковки кольцевая схема дает максимальный вес каждой странице.

Куб

Для реализации этой схемы страницы груп-пируются в два кольца, каждое из которых состоит из  количества страниц, кратно-го четырем. Считаем звенья одного коль-ца как «А» и второго как «B». Кольца пере-линковываются между собой перекрестно по принципу А1 —> B2 —> А3 —> B4 —> А1; B1 —> A2 —> B3 —> A4 —> B1; A1 —> A2 —> A3 —> A4 —> A1; B1 —> B2 —>

Допустимы случаи со значительным отклонением от предложенных чисел.

Например, существует рекомендация об ограниче‑нии количества исходящих ссылок со страницы. Когда мы работаем с особо крупными сайтами (новостными порталами, серьезными агрегатора‑ми), отклонения неизбежны.

Page 33: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 31

B3 —> B4 —> B1. Схема «Куб» на порядок сложнее «Кольца» и труднее поддается ав-томатизации, однако у нее есть серьезный козырь: даже если несколько звеньев выпа-дет из этой цепочки, вес все равно сохра-нится и цепь будет замкнута.

Звезда

Название это схемы не должно вас пугать. На самом деле все здесь предельно просто: «все ссылаются на всех».

1.4. Правила перелинковки

Мы рассмотрели основные схемы перелин-ковки. Теперь пора усвоить правила, кото-рые позволят не допустить ошибок и эф-фективно внедрить выбранную схему.

Важно понимать, что приведенные реко-мендации являются усредненными. Допу-стимы случаи со значительным отклоне-нием от предложенных чисел. Например, существует рекомендация об ограничении количества исходящих ссылок со страни-цы. Когда мы работаем с  особо крупны-ми сайтами (новостными порталами, серьезными агрегаторами), отклонения

Рис. 5. Куб

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

PageRank 1

Page 34: Л.Гроховский - Руководство по внутренним факторам

32 Перелинковка страниц

неизбежны. Однако рекомендация все рав-но имеет силу, просто необходимо будет закрывать часть неважных ссылок от ин-дексации и  не  допускать дублирования их дублирования.

рекомендация 1: Не стоит использовать более 50 ссылок на одной странице .

Вес распределяется по  всем исходящим ссылкам: чем  больше ссылок, тем  мень-ший вес передает каждая из  них. Огра-ничивая количество исходящих ссылок, оптимизатор регулирует передаваемый вес, направляя его на нужные страницы. Так, вес страниц-шлюзов увеличивается, и они, в свою очередь, передают больший вес продвигаемым страницам.

Некоторые ссылки необходимо закрыть от индексации.

рекомендация 2: Ссылки нужно оформ-лять текстом .

Часто для сохранения фирменного стиля элементы меню, набранные в макете не-стандартным шрифтом, верстают картин-ками или анимацией. Поисковая система в этом случае не передает веса по ключе-вым словам, ведь она не может опреде-лить, к  какой группе запросов относит-ся ссылка. Для корректной передачи веса рекомендуется, пусть даже в ущерб эсте-тическим задачам, использовать тексто-вые ссылки с  содержанием ключевых слов. Текст должен быть оформлен на сай-те в явном виде, то есть присутствовать в HTML-коде страницы.

рекомендация 3: Желательно не дуб-лировать ссылки с одной страницы на другую .

Иллюстрация | Название модели

Иллюстрация | Технические характеристики

Иллюстрация | Краткое описание модели

Иллюстрация | Подробнее…

Что показывать поисковику

Часто структура сайта для пользователя входит в противоречие с SEO‑логи‑

кой. Тогда нужно как‑то спрятать ссылки от поисковика, оставив их для пользователя. Для этого есть несколько инструментов:<noindex>

Тег <noindex> работает для Яндекса. Google его не восприни‑мает. Ссылка, закрытая тегом <noindex>, передает статиче‑ский вес, но ее анкор не работает для Яндекса. Робот Яндекса по таким ссылкам переходит. Тег <noindex> может также использоваться внутри тега <a>, тогда мы сможем закрыть лишь часть анкора. Например:<a href=«http://site.ru»>ноутбуки <noindex>toshiba< / noindex>< / a>rel=nofollow

rel=nofollow блокирует передачу как статического веса, так и работу анкора. Однако его чрезмерное использование на сайте может вызвать проблемы с Google. Летом 2009 года Google презентовал изменение в концепцию работы nofollow на внутренних ссылках.Допустим, страница может передать 10 «поинтов» PageRank. С нее стоит 10 ссылок. 5 из них закрыты в nofollow.Как было раньше: по 5 ссылкам, не закрытым в nofollow, пе‑редается 10 «поинтов» веса, по 2 «поинта» на каждую. То есть вес с закрытых в nofollow ссылок перераспределяется в пользу незакрытых.Как стало: по 5 ссылкам, не закрытым в nofollow, передается лишь 5 «поинтов» веса, по 1 «поинту» на каждую. Вес больше не перераспределяется, а просто теряется.Роботы переходят по ссылкам с nofollow.Некоторые ссылки с nofollow все равно учитываются поискови‑ками. Например, ссылки с Твиттера.JavaScript

Закрытие ссылки в JavaScript позволяет скрыть сам факт нали‑чия ссылки на странице и таким образом избежать послед‑ствий для Google, описанных в предыдущем пункте.От Google не так просто что‑то скрыть. Но работающие вариан‑ты существуют:1. Использовать безатрибутную ссылку. В этом варианте мы фактически полностью убираем href из тега <a>.2. Использовать внешний скрипт с закрытием в robots.txt фай‑ла со скриптом. Этот вариант сложнее. В тексте html страницы мы только вызываем скрипт, который убран в отдельный js‑файл. Сам же файл закрыт в robots.txt. Таким образом, бот Google не может прочитать его и восстановить содержание страницы.

МненИе

Page 35: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 33

Особенно часто дублирование ссылок встречается в  каталоге товаров. В  нем обычно содержится три ссылки: изображе-ние товара, название модели и ссылка «по-дробнее» в описании. Рекомендуется до-пускать к индексации только одну ссылку, которая, как мы помним, должна быть тек-стовой и содержать ключевые слова. Если продвигаете только в Яндексе, ссылку «по-дробнее» можно закрыть в <NOINDEX>. К  ссылке картинкой лучше добавить ат-рибут rel=nofollow, поскольку иногда кар-тинки могут быть полезны: при грамотной оптимизации они могут привлечь на сайт дополнительный трафик.

рекомендация 4: URL страниц должны содержать ключевые слова .

По данным исследования «SEO-альманах», проведенного в конце 2010 года, ключевое слово в URL – один из наиболее значимых факторов ранжирования. Причем наиболь-шее значение имеет употребление ключе-вого слова в имени домена (www.key.ru), следующим по важности является употреб-ление ключевого слова в названии дирек-тории или страницы. Замечено, что ключе-вое слово на транслите получает больший рейтинг, чем его перевод на английский.

Проще говоря, не рекомендуется исполь-зовать URL вида:

http://www.site.ru / list.php? SECTION_ID=14,

http://www.site.ru / dir / content / 32 / .

URL должен содержать все слова, форми-рующие основные запросы:

http://www.site.ru / brand / model / modification / ,

http://www.mobile-phone.ru / nokia / 6700 / classic / .

По некоторым наблюдениям, для ранжи-рования конкретной страницы из разделе-ний « / » и «-» лучше выбрать последнее. Так, последний URL рекомендуется употребить

Второе применение JavaScript – это скрыть ссылку от Яндекса, оставив ее видимой для Google. Иногда это может понадобить‑ся. Сделать это несложно. Даже простейший document.write ставит Яндекс в тупик, и ссылка перестает работать. В то время как Google будет ее учитывать.

Page 36: Л.Гроховский - Руководство по внутренним факторам

34 Перелинковка страниц

в  виде http://www.mobile-phone.ru / nokia-6700-classic / . Конечно, этот подход не панацея, у него есть недостатки, напри-мер, отсутствие логической структуры сай-та: все страницы будут находиться в одной директории. Но для сайтов с небольшим количеством страниц такая подача URL весьма и весьма полезна.

рекомендация 5: Ссылки необходимо за-крывать от индексации .

Для  правильной передачи веса, необхо-димо на отдельных страницах закрывать разделы меню и прочие ссылки от индек-сации, оставляя лишь важные ссылки, поставленные для  передачи веса между страницами. К  сожалению, не  все CMS позволяют изменять блоки каждой стра-ницы, используя единый шаблон. В этом случае приходится совершать доработки в программной части сайта.

1.5. Способы перелинковкитип 1 . Меню

Меню – основной способ навигации на сай-те, представляющий собой блок сквозных ссылок. Как правило, главное меню дубли-руется на всех страницах сайта, за исклю-чением страниц версии для печати и не-которых других. Вес, передаваемый через подобные ссылки, не складывается, а счи-тается по иному принципу. Страницы раз-делов ранжируются иначе, нежели осталь-ные страницы сайта. В этой связи можно дать несколько рекомендаций:

Текст ссылки в меню должен содержать основные ключевые слова из продвигае-мых на вложенной странице. Например, для  страницы каталога мобильных теле-фонов текстом ссылки может быть «теле-фоны» / «мобильные телефоны» / «каталог телефонов», но никак не «каталог».

Оптимальнее всего использовать иерархичное меню. Нет смысла пытаться

Меню – основной способ навигации на сайте, представляющий собой блок

сквозных ссылок. Как правило, главное меню дублируется на всех страницах сайта, за исключе‑нием страниц версии для печати и некоторых других. Вес, передаваемый через подобные ссылки, не складывается, а считается по иному принципу. Страницы разделов ранжируются иначе, нежели остальные страницы сайта.

Page 37: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 35

поместить ссылки сразу на  все страни-цы сайта в главном меню. Достаточно со-слаться на основные разделы. Внутри раз-делов целесообразно поместить вложенное меню, направляющее на страницы следую-щих уровней.

Текст ссылки в  меню должен соответ-ствовать элементу URL и элементу нави-гационной строки вложенной страницы (если навигационная строка присутству-ет на сайте).

тип 2: Навигационная строка

Благодаря навигационной строке поль-зователь всегда в  курсе своего местона-хождения на сайте. Оптимизатору важно оформить навигационную строку пра-вильно. Для этого необходимо учесть не-сколько моментов:

В навигационной строке должна при-сутствовать ссылка на главную страни-цу, и лучше всего, если в тексте ссылки будут прописаны слова, соответствую-щие тематике сайта, а  не  просто слово «главная».

Желательно, чтобы каждая ссылка на-вигационной строки содержала наиболее конкурентное ключевое слово, продвигае-мое на данную страницу. Например:

http://www.mobile-phone.ru / nokia / 6700 / classic /

Сотовые телефоны –> Nokia –> Но-киа 6700 Classic

Фрагмент навигационной строки теку-щей страницы не  должен быть ссылкой. Помните о том, что страница не должна ссылаться на саму себя.

тип 3: HTML-карта сайта

HTML-карта сайта – это раздел навигации, который помогает пользователю быстро отыскать ссылки на необходимые ему стра-ницы сайта. HTML-карту вовсе не обяза-тельно использовать, но, если грамотно ее оформить, можно убить двух зайцев сразу:

Благодаря навигационной строке пользова‑тель всегда в курсе своего местонахожде‑

ния на сайте. Оптимизатору важно оформить навигационную строку правильно.

Page 38: Л.Гроховский - Руководство по внутренним факторам

36 Перелинковка страниц

сделать сайт еще удобнее для пользовате-ля и улучшить индексацию.

При создании HTML-карты стоит придер-живаться следующих принципов:

HTML-карта не должна включать в себя более 30 ссылок на внутренние страницы сайта.

Необходимо, чтобы HTML-карта содер-жала ссылки на основные разделы и наи-более важные страницы.

HTML-карта может быть многоуровне-вой и  состоять из  нескольких страниц, если общее количество страниц сайта пре-вышает 30.

тип 4: Многоуровневый каталог

Когда счет страницам идет уже не на де-сятки, нельзя обойтись без рубрикатора, который упростит поиск информации. Обычно для этих целей используется ка-талог товаров, который является также од-ним из основных способов перелинковки. При  организации каталога важно соста-вить HTML-шаблон так, чтобы единствен-ной индексируемой ссылкой осталось на-именование товара, оформленное текстом (об этом мы уже говорили выше).

тип 5: Подсказки

Подсказка  – это рекомендация, которую дает сайт своим посетителям, как правило, это сообщение об акции, скидках или со-путствующих товарах. Для удобства поль-зователей подсказки оформляются с  ис-пользованием ссылок, что предоставляет оптимизатору еще  одно поле для  манев-ров. При  перелинковке использование подсказок – очень эффективный инстру-мент, особенно если продвижение ведет-ся по низкочастотным запросам.

Часто используются блоки:

«Похожие товары», «Сопутствующие товары», «Акция», «Дополнительные услуги»,

Подсказка – это рекомендация, которую дает сайт своим посетителям, как правило,

это сообщение об акции, скидках или сопутствую‑щих товарах. Для удобства пользователей подсказки оформляются с использованием ссылок, что предоставляет оптимизатору еще одно поле для маневров.

Page 39: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 37

«Последние поступления».

Учитывая возрастающее значение пове-денческих факторов в  алгоритмах ран-жирования поисковых систем, мы можем предположить, что ссылка, по которой кли-кают, имеет большее значение, чем та, ко-торая никому не понадобилась. Опираясь на это, мы можем сделать вывод, что хоро-шо оформленный блок ссылок-подсказок будет тем лучше выполнять свое «seoшное» предназначение, чем удобнее для посети-телей будет навигация.

Популярные товары:

#IMG Марка + модель #1

#IMG Марка + модель #2

#IMG Марка + модель #3

#IMG Марка + модель #4

#IMG Марка + модель #5

тип 6: Перелинковка внутри текста

Перелинковка этого типа очень просто внедряется и в уже написанные тексты, но лучше закладывать ее еще на этапе их создания, чтобы хорошо продумать струк-туру текстов и сделать ссылки внутри них максимально полезными посетителю страницы. В качестве примера приведем текст из Википедии, где ссылки оформле-ны очень удобно для пользователей.

Автоматизировать подобную перелин-ковку достаточно просто. Для этого нуж-но написать несложный скрипт, который будет искать в текстах базы данных задан-ные ключевые слова и по определенному

Анар Бабаев, директор по развитию, Click.ru:

– Как вы думаете, почему поисковики учитывают внутренние ссылки?

Откуда это пошло?Разработчикам алгоритмов в свое время приходилось цепляться за каждый более‑менее осязаемый фактор. Но обсчет этих факторов накладывал определенные ограничения на их внедрение. Учет внутренних ссылок – не та‑кая уж сложная процедура.Программисты видели, как рядовые пользователи ставили внутренние ссылки. И задавались вопросом: если мы учитыва‑ем внешние ссылки, почему бы не учитывать и внутренние?Лучшие схемы перелинковки вы найдете не в учебниках по SEO и не на сайтах оптимизаторов, а там, где владельцы сайтов думают о своих посетителях:• Внутренние ссылки помогают продавать. Посмотрите на то‑

варную карточку магазина «Озон». Купившие этот товар также покупают… и текстовые ссылки на похожие книги. Ссылки на авторов, отзывы, издательства, каталог. Удобно, не правда ли?

• Внутренние ссылки заставляют пользователя не уходить с сайта. Зайдите на любую страницу Википедии. Вы читаете один материал, потом интересуетесь другим, смотрите дополнительную информацию, открываете изображения и всячески взаимодействуете с сайтом. Полезно?

• Внутренние ссылки помогают не потеряться. Вы наверняка встречали на многих ресурсах облака тегов, хлебные крош‑ки, сквозные ссылки и другие элементы навигации. Все это крайне необходимо! Такие фишки придуманы не оптимиза‑торами, поисковики же с удовольствием их учитывают.

Прежде чем вникать в «кольца», «пирамиды» и «звезды», подумайте о ваших посетителях. Как им было бы удобнее находить информацию на вашем сайте?

МненИе

Page 40: Л.Гроховский - Руководство по внутренним факторам

38 Перелинковка страниц

алгоритму, для некоторых из них дописы-вать анкоры.

тип 7: Перелинковка внутри текста с ис-пользованием якорей

Навигация по  большому тексту станет удобнее, если поставить несколько якорей вида <a name=…. В этом случае при пе-релинковке можно ставить ссылку сразу с указанием якоря в URL.

1.6. Составление текста ссылки для перелинковки

Правильная перелинковка позволяет управлять весом страниц, поэтому важ-но уделить внимание текстам ссылок. При составлении текстов ссылок для вну-тренней перелинковки нужно иметь чет-кое представление о  том, какие группы запросов являются целевыми для конкрет-ных страниц. В ваших интересах сделать так, чтобы как  можно большее количе-ство ссылок получило уникальный текст.

Рис. 6. http://ru.wikipedia.org/wiki/Nofollow

Page 41: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 39

По  возможности задействуйте больше ключевых слов.

В  качестве текста ссылок для  коммерче-ских тематик рекомендуется использовать следующие конструкции:

прямая форма запроса (например, «но-утбук Acer Aspire 5551g»),

прямая форма запроса + образующие слова («купить ноутбук Acer Aspire 5551g»).

Кроме того, при подборе запросов важно определить часть запроса, формирующую группу. В нашем примере это – 5551g, так как все запросы, содержащие в себе этот фрагмент, будут актуальны для продвиже-ния на данную страницу. Поэтому к реко-мендуемым конструкциям мы добавляем еще следующую:

часть запроса + образующие слова («ку-пить Acer Aspire 5551g»).

Подобные комбинации, сгенерирован-ные из  полного шлейфа НЧ-запросов, составляют большие списки уникаль-ных текстов ссылок для  внутренней перелинковки.

При  перелинковке важно выдерживать баланс. Если множество ссылок содержит одинаковый текст, это множество может учитываться иначе, ссылки расценивают-ся как сквозные. Также рассматриваются как  сквозные такие ссылки, когда каж-дая страница сайта ссылается на данную с  различным текстом. Для  перелинков-ки не стоит задействовать все страницы сайта. И не нужно каждый раз использо-вать различные тексты ссылки: несколь-ко повторений одного текста (до 10) впол-не достаточно, если ссылка не  является сквозной.

Важно выдержать определенный по-рог так, чтобы число повторений не вы-шло на  уровень сквозных ссылок, ина-че они могут сильно перераспределить вес внутри сайта. В «СайтРепорт» поиск

При перелинковке важно выдерживать баланс. Если множество ссылок содержит

одинаковый текст, это множество может учиты‑ваться иначе, ссылки расцениваются как сквозные. Также рассматриваются как сквозные такие ссылки, когда каждая страница сайта ссылается на данную с различным текстом. Для перелинковки не стоит задействовать все страницы сайта.

Page 42: Л.Гроховский - Руководство по внутренним факторам

40 Перелинковка страниц

порога сквозных ссылок реализован в виде графика.

50

100

150

1.7. Создание модуля для перелинковкиЛегко организовать перелинковку, если сайт состоит из  20–30 страничек, но как быть, если продвигать нужно интер-нет-магазин с тысячами, а то и десятками тысяч товаров? Задача непростая. Мне хва-тило материала, чтобы создать отдельный семинар, посвященный этому вопросу. Ос-новных типов четыре: портал, интернет-магазин, корпоративный сайт, каталог.

Портал

Для перелинковки на портале можно ис-пользовать блоки:

«Другие статьи этого автора»,

«Другие статьи в этой категории»,

«Другие статьи за сегодня»,

«Самые популярные статьи за сегодня»,

«Последние статьи».

Контекстная перелинковка с  простанов-кой ссылок в  тексте статьи на  порталах воспринимается как  естественная, ее тоже нужно непременно использовать (смотрите, например, как это реализова-но в Википедии).

Следует понимать, что  при  перелинковке ссылки не  должны меняться со  временем, тем более не стоит проставлять их в динами-ческих блоках, которые трансформируются при каждом обновлении страницы. Не всегда

Контекстная перелинковка на страницах интернет‑магазина не очень эффективна,

вероятность клика по таким ссылкам низкая. А вот потенциал навигационной строки можно задей‑ствовать по полной. Каталог товаров должен быть составлен безупречно: ссылки на странице списка товаров ни в коем случае нельзя дублировать, все дубликаты нужно закрыть для индексации.

Page 43: Л.Гроховский - Руководство по внутренним факторам

Перелинковка страниц 41

бывает оправдано и использование навига-ционной строки, поскольку основной по-ток посетителей приходится на  НЧ-запро-сы, а  навигационная строка  – инструмент повышения веса страниц разделов.

Интернет-магазин

Для перелинковки на сайте интернет-ма-газина можно использовать блоки:

«Другие товары в этой ценовой категории»,

«С этим товаром смотрели»,

«Сопутствующие услуги / товары»,

«Другие товары этого производителя»,

«Другие товары этой группы».

Контекстная перелинковка на страницах интернет-магазина не очень эффективна, вероятность клика по таким ссылкам низ-кая. А вот потенциал навигационной стро-ки можно задействовать полностью.

Каталог товаров должен быть составлен безупречно: ссылки на  странице спис-ка товаров ни в коем случае нельзя дуб-лировать, все дубликаты нужно закрыть для индексации.

Наглядный пример подобного модуля пе-релинковки вы можете наблюдать на сайте www.mobiguru.ru (рис. 7). Здесь мы видим

Рис. 7. www.mobiguru.ru

Page 44: Л.Гроховский - Руководство по внутренним факторам

42 Перелинковка страниц

два блока (слева и  сверху) со  ссылками на карточки популярных товаров.

Корпоративный сайт

Корпоративные сайты редко достигают та-ких масштабов, чтобы для перелинковки страниц потребовалась автоматизация. Если  же такая необходимость возникла, лучше всего использовать контекстную перелинковку.

Каталог

По  сути, каталог  – это уменьшенная мо-дель интернет-магазина, следовательно, в  продвижении каталога можно исполь-зовать все блоки, которые актуальны для последнего:

«Другие товары в этой ценовой катего-рии»,

«С этим товаром смотрели»,

«Сопутствующие услуги / товары»,

«Другие товары этого производителя»,

«Другие товары этой группы».

По сути, каталог – это уменьшенная модель интернет‑магазина, следовательно,

в продвижении каталога можно использовать все блоки, которые актуальны для последнего.

Page 45: Л.Гроховский - Руководство по внутренним факторам

Н а сайте могут наличествовать дуб-ликаты контента – страницы, пол-ностью или частично идентичные

друг другу. Одной из  главных проблем поисковых систем является устранение дубликатов.

2.1. Чем вредны дубликатыСкорее всего, вы уже наслышаны о мусор-ных сайтах, которые содержат автоматиче-ски созданные документы, дорвеи. Созда-ются дорвеи в поистине промышленных масштабах, а живут за счет продажи трафи-ка. Наполняются такие сайты легко и бы-стро  – ворованным контентом или  сге-нерированными текстами. Понятно, что для пользователей дорвеи не представ-ляют ценности, кроме того, они занимают серверные ресурсы поисковых систем, по-этому последние стремятся исключать по-добные сайты из индекса.

Проблема дубликатов схожа с проблемой дорвеев. Для поисковых систем это стра-ницы, захламляющие Интернет, ведь они не содержат уникального контента. Зна-чит, нет никакого смысла в их индексации.

Со стороны ПС проблема дубликатов, с од-ной стороны, схожа с  проблемой дорве-ев – ибо какой смысл индексировать не-уникальный контент. С  другой стороны, неуникальный контент  – это не  всегда приговор. Поговорим об этом во врезке. Однако, особенно это касается нечетких дубликатов, поисковик не  может забы-вать, что  иногда на  базе неуникального

Глава 2Устранение дубликатов

Page 46: Л.Гроховский - Руководство по внутренним факторам

44 Устранение дубликатов

контента возникают сервисы, обладаю-щие так называемой «добавочной стои-мостью», которой они могут наделять не-уникальный контент. Хорошим примером таких сервисов является рейтинг блогов и новостей.

Масштабы этой проблемы часто недооце-нивают. Мне встречались «прекрасные» сайтики, содержащие по  40 дубликатов каждой страницы. Подобный сайт зани-мает у поисковой системы в 40 раз боль-ше ресурсов, чем требуется. Казалось бы, почему не проиндексировать все? Простой подсчет: для индексации и обработки мил-лиарда страниц, допустим, понадобится 100 серверов, а если каждая страница име-ет хотя бы по три дубликата? Как видите, решение проблемы дубликатов позволяет уменьшить затраты на серверные мощно-сти в несколько раз.

Чем вредны дубликаты для оптимизатора?

1. Ссылочный вес размывается.

Вместо того, чтобы увеличивать значение одной страницы, мы рассеиваем ссылки по  нескольким страницам-дубликатам, в результате чего каждый из этих дубли-катов получает меньший вес.

2. Входной может оказаться не та копия, на которую стоят ссылки.

Нередко бывает, что после очередного ап-дейта дубликат вытесняет в выдаче про-двигаемую страницу, и та теряет позиции.

3. Контент теряет уникальность.

Дублированный контент понижает сте-пень уникальности всех страниц, на кото-рых он размещен. Страница с уникальным контентом имеет существенно больший вес.

4. Поскольку дубликаты исключаются из поиска, из него может исчезнуть нуж-ная нам страница.

Важной областью информационного поиска является поиск дубликатов

документов. От того момента, как документ первый раз индексируется поисковой систе‑мой, и до того, как этот документ появится в основных результатах поиска, содержимое документа многократно оценивается и сравнивается с содер‑жанием индекса ПС.

МненИе

Page 47: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 45

В борьбе с дубликатами поисковые систе-мы могут запросто исключить из  своей базы те страницы, которые мы продвига-ем, и оставить дубликат, который не име-ет ни входящих внешних ссылок, ни осо-бых бонусов по внутренней оптимизации.

Итак, проблема дубликатов в целом сво-дится к двум моментам:

поисковые системы часто исключают из поиска значимые страницы, поскольку не способны корректно определять, какой из дубликатов имеет большую ценность;

сайт с  огромным количеством дуб-лированного контента индексируется не полностью.

2.2. Классификация дубликатовДубли бывают полными и  частичными. Полный дубликат – это абсолютно иден-тичные страницы, частичный – страницы, совпадающие не полностью. В зависимо-сти от  типа дубликата выбирают способ его устранения: полные дубликаты за-крывают через robots.txt и 301 редирект, для устранения частичных дублей прихо-дится делать правки на страницах.

Полные дубликаты

1 . Фокусы с URL

В индексе поисковых систем должна нахо-диться только одна версия главной страни-цы сайта, все ее дубликаты нужно удалить либо закрыть для индексации.

Например, мы имеем варианты такого вида:

http://www.site.ru / http://www.site.ru / index.phphttp://www.site.ruhttp://site.ru / https://www.site.ru /

Из  вышеперечисленных конструкций оптимально использовать для  продви-жения первую (http://www.site.ru / ).

Встречаются «прекрасные» сайтики, содержащие по 40 дубликатов каждой

страницы. Подобный сайт занимает у поисковой системы в 40 раз больше ресурсов, чем требуется. Казалось бы, почему не проиндексировать все? Простой подсчет: для индексации и обработки миллиарда страниц, допустим, понадобится 100 серверов, а если каждая страница имеет хотя бы по три дубликата? Как видите, решение проблемы дубликатов позволяет уменьшить затраты на серверные мощности в несколько раз.

Page 48: Л.Гроховский - Руководство по внутренним факторам

46 Устранение дубликатов

Для  устранения остальных применя-ем 301  редирект и  настройки robots.txt (в  случае с  конструкциями вида https://www.site.ru / ).

2 . Смена директорий

Золотое правило гласит: каждая страница должна быть доступна только по одному адресу. Нельзя, чтобы адреса варьирова-лись таким образом:

http://www.site.ru / dir1 / dir2 / http://www.site.ru / dir2 / dir1 /

Пользователь может переходить по пути «фотоаппараты» –> Canon или Canon –> «фотоаппараты», и в любом случае адрес страницы должен быть одним, к примеру, http://www… / fotoapparat / canon / .

3 . Формирование URL

При  формировании URL нужно по-добающим образом настроить сер-вер: переменных в  «урле» отображать-ся не  должно. Использование URL типа http://www.site.ru / index.php?dir=1231&id =313  – ошибка. Корректным будет упо-требление http://www.site.ru / dir / 1231 / id / 313.

4 . Идентификатор сессий

Идентификатор сессий, который мы можем наблюдать в  примере URL http://www.site.ru / dir / 1231 / id / 313.php?PHPSESSID=2123, указывает на сайт, который фактически содержит бесконеч-ное количество дубликатов каждой стра-ницы. Эти страницы при очень большом везении попадают в индекс поисковых си-стем, создавая копии. Если сессии невоз-можно заменить чем-то еще, нужно закры-вать их через настройки robots.txt.

5 . Уязвимость 404 ошибки

Когда мы пытаемся открыть несущест-вующую страницу, то  чаще всего видим заглушку. Что «видит» в этом случае сер-вер? Это зависит от настроек кода ответа. Если в них прописано 404, сервер решает,

Дубли бывают полными и частичными. Полный дубликат – это абсолютно

идентичные страницы, частичный – страницы, совпадающие не полностью. В зависимости от типа дубликата выбирают способ его устранения: полные дубликаты закрывают через robots.txt и 301 редирект, для устранения частичных дублей приходится делать правки на страницах.

Page 49: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 47

что такой страницы не существует. Такой подход наиболее правильный.

К сожалению, вместо этого нередко мож-но встретить код ответа 301 («страница перемещена навсегда») или 200 («все хо-рошо»). И если в первом случае страницы просто склеиваются, то во втором случае создается дубликат. Наиболее проигрыш-ный расклад выглядит так: на сайте для не-существующей страницы отдается код от-вета 200, а вместо заглушки отображается главная страница. В  этом случае может быть поставлено любое количество вне-шних ссылок на несуществующие страни-цы, каждая из которых продублирует глав-ную и размоет ее вес.

6 . Лишние переменные

Проблема наличия лишних переменных наиболее актуальна для  универсальных коммерческих CMS. Лишние перемен-ные образуются, например, в  тех случа-ях, когда посетитель указывает дополни-тельный параметр поиска, сортировки или отображения, который не влияет на со-держание страницы, но  может учиты-ваться CMS. Через настройки robots.txt необходимо добиться того, чтобы URL ни  в  коем случае не  имели вид типа http://www.site.ru / dir / 1231 / id / 313.php?mode=2&coin=3 (корректным будет вариант http://www.site.ru / dir / 1231 / id / 313.php?mode=4).

7 . реф-ссылки

В  электронной коммерции распро-странена практика создания партнер-ских программ, способствующих про-движению товара или  услуги. Один из  принципов работы такой программы заключается в  том, что  партнер распро-страняет по  своим каналам ссылку, со-держащую его личный ID. Регистрация каждого нового пользователя по  такой ссылке приносит партнеру вознагражде-ние. Выглядит реф-ссылка примерно так:

При прочих равных более уникальная страница выигрывает у страницы с менее

уникальным наполнением. А сайт, содержа‑щий много неуникальных страниц, может в какой‑то момент быть признан менее авторитетным.

МненИе

Page 50: Л.Гроховский - Руководство по внутренним факторам

48 Устранение дубликатов

http://www.site.ru / dir / 1231 / id / 313.php?ref=1323. Понятно, что  использова-ние реф-ссылок становится причиной по-явления дубликатов. Устранить их можно также через настройки robots.txt. (в данном примере нужно дописать Disallow: *?ref).

Частичные дубликаты

1 . Сортировка

На сайтах, содержащих каталог, для удоб-ства посетителей предлагаются различные виды сортировки: по цене, по количеству отображаемых элементов на  странице, по дате добавления, по рейтингу, по ка-тегории и т. п. Пользователям становится действительно удобно, а вот у оптимиза-торов появляется проблема: сортиров-ка создает мусорные для  поисковых си-стем страницы, не содержащие никакого уникального контента. Чтобы избавиться от полудубликатов, в некоторых случаях содержимое таких страниц закрывают че-рез метатеги noindex, nofollow, в других – к URL приписывают директорию или пе-ременную, которая закрывается через robots.txt.

Иногда, правда, продвижение страниц сор-тировок в поисковых системах – единствен-но верная стратегия. В этом случае бороть-ся с полудубликатами не приходится.

2 . Частичное дублирование контента

По данным исследования «SEO-альманах 2010», проведенного в  рамках проекта «ТопЭксперт.РФ», уникальность контен-та – один из важнейших факторов ранжи-рования. Некоторые оптимизаторы упор-но игнорируют этот момент, в  то  время как на сайте есть области, таящие в себе большой потенциал для поискового про-движения. В  этой связи можно дать не-сколько советов:

На многих сайтах есть дубликаты в те-гах Description, Title, H1, Keywords. Уника-лизировав их содержимое на своем сайте,

По данным исследования «SEO‑альманах 2010», проведенного в рамках проекта

«ТопЭксперт.РФ», уникальность контента – один из важнейших факторов ранжирования. Некото‑рые оптимизаторы упорно игнорируют этот момент, в то время как на сайте есть области, таящие в себе большой потенциал для поискового продвижения.

Page 51: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 49

вы сделаете отличный вклад в продвиже-ние ресурса.

Весь дублирующийся контент в блоках типа «Схожие предложения» необходи-мо скрывать через <NOINDEX>, оставляя доступными для поисковых роботов лишь ссылки и наименования товаров.

Страницы списка анонсов должны со-держать уникальный контент, а  не  фор-мироваться из  текстов, частично дубли-рующих полное содержание статей.

Схожие страницы типа «Оставить заяв-ку» вообще не имеют значения, а потому индексироваться не должны.

Если контента на сайте нет или его мало, стоит прибегнуть к услугам копирайтеров, или сгенерировать тексты машинным пу-тем, или подумать о том, как привлечь по-ток User Generated Content.

Рассмотрим некоторые частные случаи.

2.3. Кейсы1 . Компания «БЕСт-Недвижимость»,

www .best-realty .ru

По  данным Яндекс.Вебмастер, на  мо-мент анализа всего роботом загружено 37 684 страниц, а для поиска из них доступ-но лишь 795. Чем объяснить разрыв в бо-лее чем 50 раз между количеством загру-женных и доступных для поиска страниц? Почему Яндекс исключил около 36 тысяч страниц из своей базы?

На момент проведения анализа на сайте компании было обнаружено большое ко-личество дубликатов:

1 .1 . Дубликаты сортировки

На www.best-realty.ru используется слож-ная система обработки баз данных, ко-торая все переменные помещает в  URL, и  в  результате последний выглядит сле-дующим образом:

Если контента на сайте нет или его мало, стоит прибегнуть к услугам копирайтеров,

или сгенерировать тексты машинным путем, или подумать о том, как привлечь поток User Generated Content.

Page 52: Л.Гроховский - Руководство по внутренним факторам

50 Устранение дубликатов

/ services / buy / flat / ?search_center_lat= 0&search_center_lng=0&search_radius= 0&halt_id=34&search_metro=0&is_moscow=true&search_city=0&search_fmt=0&search_mfb=1&search_price= 0&search_currency=1&search_proc= 10&search_s_min=13&search_s_max= 9936&search_ls_min=8&search_ls_max= 6000&search_ks_min=1&search_ks_max= 52&go=&go2=false.

При  малейших изменениях в  настрой-ках отображения результатов поиска URL трансформируется при  сортировке по цене, алфавиту и т. д. CMS работает та-ким образом, что возникает большое ко-личество дубликатов, вследствие чего не-которые страницы выпадают из индекса. Для решения этой проблемы инструкция-ми в robots.txt не обойтись. Возникает не-обходимость внести правки в саму струк-туру сайта, но  изменить существующую схему формирования URL невозможно из-за специфики работы базы данных. По-этому на сайте www.best-realty.ru пробле-ма с дубликатами решена нестандартно:

все страницы, содержащие переменные, закрыты от индексации;

создан дублирующий раздел, построен-ный на  ЧПУ («человекопонятном урле») с содержанием ключевых слов в адресах страниц.

В результате нам удалось добиться устра-нения всех дубликатов. Теперь URL сайта имеют вид:

http://www.best-realty.ru / buy / flat / moscow / aviamotornaya /

http://www.best-realty.ru / buy / flat / moscow / krasnokazarmennaya_ulitsa / id1120801 /

2 .1 .  «Посмотреть другие объекты в ра-диусе 1 км»

На  странице каждого объекта размеще-на ссылка «Посмотреть другие объекты

При малейших изменениях в настройках отображения результатов поиска URL

трансформируется при сортировке по цене, алфавиту и т. д. CMS работает таким образом, что возникает большое количество дубликатов, вследствие чего некоторые страницы выпадают из индекса. Для решения этой проблемы инструк‑циями в robots.txt не обойтись.

Page 53: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 51

в  радиусе 1 км». Понятно, что  подобная страница дублирует контент, посколь-ку создает дополнительную страницу сортировки.

В результате преобразований, описанных в п. 1, эта проблема была также устранена.

3 .1 . «оставить заявку на объект»

Компания «БЕСТ-Недвижимость»  – один из крупнейших риелторов на российском рынке, ее сайт содержит информацию о нескольких тысячах объектов. На стра-нице каждого из  них есть ссылка «Оста-вить заявку на объект», которая направ-ляет посетителя на страницу заявки. Все страницы этого рода идентичны, но каж-дая имеет уникальный URL, в результате чего на сайте появляется несколько тысяч дубликатов.

Проблема решена очень просто: все по-добные страницы запрещены к  индекса-ции в robots.txt.

2 . ММЦ «онКлиник», www .onclinic .ru

После анализа сайта выяснилось, что по-лезных страниц всего около 4 500. При этом реально на сайте существовало на момент исследования порядка 95 000 страниц. Дуб-ликаты появились из-за ошибок, допущен-ных разработчиками сайта.

2 .1 .  разделы «Консультации», «терми-ны», «отзывы»

На www.onclinic.ru существуют 3 дополни-тельных информационных раздела: «Кон-сультации», «Термины», «Отзывы». В эти разделы посетитель может попасть двумя путями: посетив их полную версию через главное меню сайта или посетив разделы медицинских услуг, где эти блоки пред-ставлены частями (например, в  разделе «Стоматология» вложены блоки, в  кото-рых представлены консультации, расши-фровка терминов и отзывы только по этой группе медицинских услуг). Каждый путь

Компания «БЕСТ‑Недвижимость» – один из крупнейших риелторов на российском

рынке, ее сайт содержит информацию о нескольких тысячах объектов. На странице каждого из них есть ссылка «Оставить заявку на объект», которая направляет посетителя на страницу заявки. Все страницы этого рода идентичны, но каждая имеет уникальный URL, в результате чего на сайте появляется несколько тысяч дубликатов.

Page 54: Л.Гроховский - Руководство по внутренним факторам

52 Устранение дубликатов

имеет свой URL, из-за этого на сайте по-явились дубликаты.

Для  решения проблемы полные версии разделов «Консультации», «Термины», «От-зывы» закрыты от индексации в robots.txt. Индексируемыми остались только их ча-сти, привязанные к конкретным медицин-ским направлениям.

2 .2 . Список анонсов

Элементы разделов «Консультации», «Тер-мины», «Отзывы» состоят из двух частей: вопрос-ответ, автор-отзыв, термин-тол-кование. Структура этих разделов состо-ит из страниц списка анонсов и страниц полного контента. Однако содержание каждого элемента представлено в полном объеме как на странице списка анонсов, так и на странице полного контента. В ре-зультате контент в полном объеме дубли-руется между страницами сайта.

Проблема решена следующим образом: страницы полного контента удалены за ненадобностью.

3 .  Магазин итальянской мебели, www .eurointerier .ru

В индексную базу попало более 12 500 стра-ниц, однако на сайте всего около 1 000 стра-ниц, полезных для посетителей, все осталь-ные  – дубликаты, которые появились частично вследствие недоработок на эта-пе создания сайта, а частично позже – в ре-зультате ошибок, допущенных веб-масте-ром в ходе внесения изменений на сайте.

Этот случай – яркий пример того, как по-сле доработки сайта под SEO, он стано-вится еще  менее пригодным для  про-движения. Хочу снова подчеркнуть, что  создание ТЗ на  доработку сайта и контроль его исполнения, а также по-вторный анализ сайта – прямая обязан-ность квалифицированного SEO-специа-листа. В  моей практике было всего два

Существует два простых способа борьбы с дубликатами: использование 301 реди‑

ректа и инструкций в robots.txt. К сожалению, простое решение позволяет свести на нет только проблему полных дубликатов, и то не всегда: если у вас крупный сайт, прописывать сотни строк в инструкции robots.txt, чтобы закрыть от индекса‑ции десятки, а возможно, и сотни тысяч страниц, не лучший выход. Хотя можно запретить с помо‑щью метатегов.

Page 55: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 53

случая, когда в процессе доработки сай-та, в еб-программист не создавал новых ошибок. Дело в том, что у веб-програм-миста есть свое видение хорошего сай-та, которое часто отличается от видения поисковой системы. А поскольку специ-альной подготовки в области SEO у про-граммиста нет, он не в состоянии само-стоятельно сделать сайт совершенным в плане продвижения.

Итак, в случае www.eurointerier.ru стояла задача заменить URL на ЧПУ. После прове-дения доработок каждая из страниц была доступна по трем адресам:

http://www.eurointerier.ru / index.php?catalog=1&brand= 34&model=231

http://www.eurointerier.ru / catalog / 1/ brand / 34 / model / 231 /

http://www.eurointerier.ru / catalog / gostinie / a_r_arredamenti / barnaya_ stoyka_opera /

Так, все страницы были доступны при из-менении порядка частей URL:

http://www.eurointerier.ru / catalog / a_r_arredamenti / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / a_r_arredamenti / barnaya_stoyka_opera / gostinie /

http://www.eurointerier.ru / catalog / gostinie / a_r_arredamenti / barnaya_ stoyka_opera /

http://www.eurointerier.ru / catalog / gostinie / barnaya_stoyka_opera / a_r_arredamenti /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera / a_r_arredamenti / gostinie /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera / gostinie / a_r_arredamenti /

Кстати, в панели Яндекс.Вебмастера есть весьма полезный инструмент, проверяю‑

щий корректность составления robots.txt (на дан‑ный момент Clean‑param он не читает, лишь Disallow). Добавляете сайт в панель, затем щелкаете «Настройка индексирования» и «Анализ robots.txt». После чего вам требуется в «Список URL» добавить URL, которые нуждаются в провер‑ке: будут ли они индексироваться при введенном robots.txt или не будут.

Page 56: Л.Гроховский - Руководство по внутренним факторам

54 Устранение дубликатов

Страницы карточки товара отобража-лись даже после удаления части URL с  названием товарной группы или фабрики:

http://www.eurointerier.ru / catalog / a_r_arredamenti / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / a_r_arredamenti / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / gostinie / barnaya_stoyka_opera /

http://www.eurointerier.ru / catalog / barnaya_stoyka_opera /

Прибегнув к  элементарным арифмети-ческим подсчетам, получаем, что каждая страница карточки товара имела 30 дуб-ликатов. Кроме того, на сайте были дуб-ли сортировки и  частичные дубликаты в каталоге.

Подобные проблемы решаются доработ-кой CMS, цель которых проста: каждая страница должна быть доступна толь-ко по одному адресу. В случае изменения правил формирования URL необходимо ис-пользовать 301 редирект. Страницы сорти-ровки закрываются от индексации.

2.4. Способы устранения дубликатов

Существует два простых способа борьбы с дубликатами: использование 301 реди-ректа и инструкций в robots.txt. К сожале-нию, простое решение позволяет свести на  нет только проблему полных дубли-катов, и то не всегда: если у вас крупный сайт, прописывать сотни строк в инструк-ции robots.txt, чтобы закрыть от индекса-ции десятки, а возможно, и сотни тысяч страниц, не лучший выход. Хотя можно за-претить с помощью метатегов.

Сложное решение сводится к  доработ-ке сайта: от  использования метатегов

Даниил Маул:

– Действительно, по наличию дублей в индексе порой можно отличить

оптимизатора‑новичка от профессионала. Проверку на дубли проще всего осуществить следующим образом. Если у вас интернет‑магазин, имеющий плюс ко всему раздел статей, то заходим на разные типы страниц (категория товаров, товары, статьи, главная), копируем от каждого из типов кусок текста (в рамках одного предложения, допустим, несколько слов) и вбиваем его в виде цитаты с кавычками в поиск по вашему домену в Яндексе.Если же в индексе вашего сайта в пределах ХХХ страниц, то же‑лательно обойти весь список страниц, которые видит Яндекс. Если в этом списке видны дубли или же просто бесконтентные страницы, то их нужно или удалить, или поставить запрет в robots.txt. Запрет в этом файле можно сделать двумя метода‑ми: или Disallow, или Clean‑param (второй метод более новый). Как говорит саппорт Яндекса, срабатывает Clean‑param медленнее. Ну, а действие Disallow будет заметно уже после первой переиндексации и последующего апдейта Яндекса.Кстати, в панели Яндекс.Вебмастера есть весьма полезный инструмент, проверяющий корректность составления robots.txt (на данный момент Clean‑param он не читает, лишь Disallow). Добавляете сайт в панель, затем щелкаете «Настрой‑ка индексирования» и «Анализ robots.txt». После чего вам требуется в «Список URL» добавить URL, которые нуждаются в проверке: будут ли они индексироваться при введенном robots.txt или не будут.Впрочем, должен заметить, что если анонс, например, статьи дублируется в категории статей в виде нескольких пред‑ложений, то, на мой взгляд, это ничего страшного не несет. Разумеется, если сами статьи объемные. Например, на своем блоге maulnet.ru я до сих пор не решился на страницах вида page / x запретить индексацию анонсов статей.Озаботиться стоит не только отсутствием дублей, но и все тем же ЧПУ. Я знаю случай, когда у человека, использовавшего CMS Joomla и мод к нему, Яндексом индексировался весь сайт, кроме контента, который генерил этот мод. Мод генерил, собственно, сам магазин (товары). Все из‑за того, что товары располагались на кривых и довольно длинных URL. Затем этот пользователь сделал их вида «url.ru / nazvanie‑tovara.html», и товары начали индексироваться.

МненИе

Page 57: Л.Гроховский - Руководство по внутренним факторам

Устранение дубликатов 55

noindex, nofollow на странице и скрытия части страницы тегом <NOINDEX> до пе-реработки структуры базы данных и  ре-структуризации сайта. Фактически мы де-лаем следующее:

1. Удаляем мусорный дублирующий контент.

2. Закрываем от  индексации дублирую-щийся, но  важный для  удобства пользо-вателей контент.

3. Если удалить разделы невозможно, дуб-лируем их вместе с содержимым, а затем скрываем от индексации. Важный момент: дубликат должен быть не только «индекси-руемым», но и «юзабельным», то есть им действительно должны пользоваться по-сетители сайта. Пример такой доработки рассмотрен выше – www.best-realty.ru. Та-кие приемы, как раздел «Статьи», запря-танный куда-нибудь в подвал и обозначен-ный мелким шрифтом, сейчас не работают (за исключением случаев, когда этот раз-дел существует уже на  протяжении не-скольких лет).

4. Используем robots.txt, чтобы закрыть лишние страницы от робота-индексатора.

*Проверить, как  будет вести себя робот Яндекса на  сайте, мож-но с  помощью специальной ути-литы из  набора Яндекс.Вебмастер http://webmaster.yandex.ru / robots.xml

В результате этих манипуляций на сайте создается не  содержащий дублей марш-рут для робота. Хорошей работой можно назвать такой маршрут, который посети-тели сайта тоже используют.

Должен поделиться своим наблюдени-ем: эффективные сайты с  высокой ви-димостью по шлейфу НЧ-запросов реже исключают страницы в  robots.txt; чаще дорабатывается сам сайт. Это связано с тем, что в результате скрытия страниц в robots.txt вес на них уходит, но обрат-но не возвращается, ссылки с них также

Важный момент: дубликат должен быть не только «индексируемым», но и «юза‑

бельным», то есть им действительно должны пользоваться посетители сайта.

Page 58: Л.Гроховский - Руководство по внутренним факторам

56 Устранение дубликатов

перестают работать. Сайт, структура ко-торого хороша настолько, что нет нужды закрывать страницы в robots.txt, ранжи-руется лучше.

Резюме: мы рассмотрели основные виды дублирования контента и спо-собы борьбы с ними. К сожалению, все случаи разобрать невозможно: вари-антов очень много, и каждый из них может иметь свои особенности. Бо-лее подробно поднятую в данной гла-ве тему я освещаю в рамках семинара «Оптимизация сайта: задействуем внутренние факторы».

Page 59: Л.Гроховский - Руководство по внутренним факторам

в этой главе мы разберемся, как со-ставлять инструкции robots.txt и  sitemap.xml для  поисковых си-

стем. Предназначение этих инструкций – помочь поисковой системе отграничить важные страницы от  мусорных, чтобы скорректировать робота, индексирующе-го сайт.

3.1. Зачем нужен robots.txtСтандарт robots.txt был принят консорциу-мом W3C 30 января 1994 года. Эта инструк-ция используется для исключения дублика-тов и других мусорных страниц из индекса поисковых систем. Кроме того, именно че-рез robots.txt можно указать Яндексу глав-ное зеркало сайта и адрес карты сайта.

В некоторых случаях к robots.txt прибега-ют для того, чтобы закрыть сайт от неже-лательной поисковой системы. Например, если вы хотите скрыть от ваших конкурен-тов информацию о сайтах, разместивших ссылку на ваш веб-ресурс, вы можете за-крыть сайт от индексации поисковой си-стемой Yahoo.

Итак, файл robots.txt выполняет следую-щие функции:

указание главного зеркала,

исключение лишних страниц из индекса,

отказ в индексации нежелательным роботам,

указание адреса карты сайта.

Глава 3Инструкции для поисковых систем

Page 60: Л.Гроховский - Руководство по внутренним факторам

58 Инструкции для поисковых систем

3.2. Robots.txt – универсальные директивы

Существуют универсальные директивы, которые воспринимают любые поиско-вые системы:

1 . Директива User-Agent

Иногда, учитывая особенности алгорит-мов ранжирования, целесообразно исполь-зовать для разных поисковых систем раз-личные маршруты обхода сайта. Для этого существует директива User-Agent.

User-Agent указывает имя робота, которо-му адресована инструкция (тогда дирек-тива имеет вид ‘User-agent: botname’), либо сообщает, что инструкция предназначена для всех поисковых систем (выглядит она как  ‘User-agent: *’). Робот botname в пер-вую очередь обращает внимание на пер-сональную инструкцию, если таковая име-ется, и следует ее указаниям, игнорируя все остальные. Если же персональной ин-струкции для робота конкретной поиско-вой системы нет, он руководствуется ‘User-agent: *’.

2 . Директива Disallow

Disallow – основная директива. Использу-ется она для запрета индексации. Указание ‘Disallow: / dir / ’ налагает вето на индекса-цию всех страниц, расположенных по ад-ресу www.site.ru / dir / . Важно указывать адрес непосредственно от корневой дирек-тории сайта. Конструкция вида ‘Disallow: http://www.site.ru / ’ некорректна и воспри-нимается как  http://www.site.ru / http:// www.site.ru / .

3 . Директива Sitemap

Sitemap указывает адрес xml-карты сайта. Если эта директива не  заполне-на, то  поисковые системы по  умолча-нию ищут файл sitemap.xml по  адре-су www.site.ru / sitemap.xml. Директив Sitemap на одном сайте может быть не-сколько, и  они бывают вложенными

В некоторых случаях к robots.txt прибегают для того, чтобы закрыть сайт от нежела‑

тельной поисковой системы. Например, если вы хотите скрыть от ваших конкурентов информацию о сайтах, разместивших ссылку на ваш веб‑ресурс, вы можете закрыть сайт от индексации поисковой системой Yahoo.

Page 61: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 59

во внутренние директории, но их непре-менно нужно указать в robots.txt.

3.3. Robots.txt – директивы для яндексаЧтобы веб-мастерам и  оптимизаторам было удобнее, Яндекс ввел дополнитель-ные директивы для указаний маршрута по-искового робота. В частности, существуют директивы:

1 . Allow

Эта директива указывает поисковой си-стеме страницы, которые нужно проин-дексировать обязательно. Ее удобство за-ключается в том, что на некоторых сайтах так сложно искать все мусорные страни-цы, что проще вместо этого указать стра-ницы полезные. В этом случае весь сайт за-крывается от индексации через директиву ‘Disallow: / ’, а инструкциями ‘Allow: …’ ро-бот направляется на полезные страницы.

Часто директива Allow используется для указания важных страниц в закрытой от индексации директории. Также ее мож-но применять, когда нужно закрыть все внутренние страницы раздела, но  оста-вить индексируемой собственно главную страницу. В  этом случае уместна такая конструкция:

User-agent: YandexDisallow: / dir / Allow: / dir / $

2 . Clean-Param

Директива Clean-param склеивает все страницы с переменной в одну:

www.site.ru / some_dir / get_book.pl?ref=site_1&book_id=123

www.site.ru / some_dir / get_book.pl?ref=site_2&book_id=123

www.site.ru / some_dir / get_book.pl?ref=site_3&book_id=123.

‘Clean-param: ref / some_dir / get_book.pl’ указывает срез для  всех страниц,

Часто директива Allow используется для указания важных страниц в закрытой

от индексации директории. Также ее можно применять, когда нужно закрыть все внутренние страницы раздела, но оставить индексируемой собственно главную страницу.

Page 62: Л.Гроховский - Руководство по внутренним факторам

60 Инструкции для поисковых систем

содержащих в URL что-то еще. В этом слу-чае проиндексируется только страница www.site.ru / some_dir / get_book.pl.

Директива Clean-param полезна для устра-нения дубликатов, связанных с сортиров-кой и реферальными ссылками.

3 . Host

Если сайт компании доступен по несколь-ким адресам, с помощью инструкции ‘Host: www.site.ru’ можно указать основное зер-кало. Именно этот сайт будет отображать-ся в результатах поиска, а все второстепен-ные зеркала будут исключены из основной базы робота-индексатора. Если у вас всего один сайт, в директиве Host нужно указать, какое из зеркал сайта является основным: www.site.ru или site.ru. В случае когда та-кой инструкции нет, Яндекс может проин-дексировать страницы обоих зеркал.

4 . Спецсимволы * и $

Спецсимвол * означает любую последова-тельность символов. Например, директива ‘Disallow: / * / search / ’ указывает поисково-му роботу на необходимость индексации всех страниц, содержащих / search / .

Спецсимвол $ означает строгое соответ-ствие. Так, ‘Disallow: / catalog / $’ демон-стрирует поисковому роботу запрет на ин-дексацию страницы www.site.ru / catalog / , при  этом вложенные страницы, напри-мер, www.site.ru / catalog / page_1.php, бу-дут проиндексированы.

3.4. Правила составления robots.txtНеопытные оптимизаторы при составле-нии robots.txt очень часто делают ошиб-ки. Чтобы не  наступать на  чужие граб-ли, нужно хорошо усвоить следующую информацию:

количество директив в файле не должно превышать 1 024,

максимальная длина 1 строки – 1 024 символа,

Если сайт компании доступен по несколь‑ким адресам, с помощью инструкции ‘Host:

www.site.ru’ можно указать основное зеркало. Именно этот сайт будет отображаться в результатах поиска, а все второстепенные зеркала будут исключены из основной базы робота‑индексатора.

Page 63: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 61

инструкция должна начинаться с User-agent,

robots.txt может содержать несколько инструкций,

http://основное_зеркало_сайта / robots.txt должен отдавать код ответа 200. Ника-кой другой код ответа не воспринимается поисковым роботом. Если по этому адре-су происходит перенаправление через ре-директ, поисковая система не станет учи-тывать robots.txt,

спецсимвол # в  начале инструкции (# Disallow: / ) отключает ее.

3.5. Разбор robots.txt на примерахПример 1 . http://mobiguru .ru /

На момент написания этой главы на сайте http://mobiguru.ru / была размещена сле-дующая инструкция robots.txt:

User-agent: Yandex

Disallow: / search /

Disallow: / js

Disallow: / *?_openstat

Disallow: / *?loc

Disallow: / * / ?*

Disallow: / *sort / price /

Disallow: / *sort / rate /

Disallow: / guru_*

Host: mobiguru.ru

Sitemap: http://mobiguru.ru / mobiguru.xml

Попробуем разобраться в  том, что  хо-тели сообщить поисковым роботам оптимизаторы.

Итак, мы видим, что инструкция предна-значена для  поисковой системы Яндекс. Для других поисковых систем инструкций не предусмотрено, следовательно, они ин-дексируют все страницы сайта.

особенность Google в Robots.txt

Если ваш URL имеет конструкцию вида http://site.ru / ?price [500], то директива

Disallow: * [* не уберет его из выдачи Google. (При этом в валидаторе все будет правиль‑но). Почему? Google некорректно восприни‑мает некоторые символы. Например «[». В выдаче ваш URL будет выглядеть так: http://site.ru / ?price%5B500 %5D. Поэтому, чтобы исключить его из выдачи, необходимо вписать в robots такую строчку:Disallow: *%5B*Квадратные скобки – не единственный случай. Всегда нужно смотреть на вид URL в выдаче.

МненИе

Page 64: Л.Гроховский - Руководство по внутренним факторам

62 Инструкции для поисковых систем

Инструкция закрывает от  индекса-ции раздел поиска (search), страни-цы сортировки (sort) и  некоторые переменные. Основное зеркало сайта  – mobiguru.ru. Карта сайта расположена по ад-ресу http://mobiguru.ru / mobiguru.xml.

Пример 2 . http://www .last .fm /

Любопытная инструкция размещена на сайте last.fm

User-Agent: *

Disallow: / music?

Disallow: / widgets / radio?

Disallow: / show_ads.php

Disallow: / affiliate /

Disallow: / affiliate_redirect.php

Disallow: / affiliate_sendto.php

Disallow: / affiliatelink.php

Disallow: / campaignlink.php

Disallow: / delivery.php

Disallow: / music / +noredirect /

Disallow: / harming / humans

Disallow: / ignoring / human / orders

Disallow: / harm / to / self

Allow: /

Инструкция предназначена для  всех ро-ботов. От индексации закрыты некоторые внутренние страницы, несколько страниц с переменными и одна директория. Три по-следние инструкции Disallow вызывают особый интерес:

1. Disallow: / harming / humans («За-прещается: причинять вред людям»)

2. Disallow: / ignoring / human / orders («Запрещается: игнорировать чело-веческие приказы»)

3. Disallow: / harm / to / self («Запреща-ется: причинять вред себе»)

Если основное предназначение robots.txt – это запрет индексации, то карта сайта

выполняет прямо противоположные задачи. Она отвечает за ускорение индексации сайта и полноту его индексации.

Page 65: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 63

Эти указания могут показаться бессмыс-лицей для каждого, кто не знаком с тремя законами робототехники, которые сфор-мулировал в рассказе «Хоровод» знамени-тый писатель-фантаст Айзек Азимов. За-коны гласят:

1. Робот не может причинить вред челове-ку или своим бездействием допустить, что-бы человеку был причинен вред.

2. Робот должен повиноваться всем прика-зам, которые дает человек, кроме тех слу-чаев, когда эти приказы противоречат Пер-вому Закону.

3.  Робот должен заботиться о  своей без-опасности в той мере, в которой это не про-тиворечит Первому и Второму Законам.

3.6. Зачем нужен sitemap.xmlЕсли основное предназначение robots.txt – это запрет индексации, то карта сайта вы-полняет прямо противоположные задачи. Она отвечает за:

ускорение индексации сайта,

полноту индексации сайта.

Sitemap.xml указывает поисковой систе-ме частоту, с которой возникает необходи-мость в переиндексации страниц. В этом плане инструкция особенно важна для сай-тов с регулярно обновляющимся контен-том (новостные порталы и т. п.).

Кроме того, sitemap.xml содержит все важные страницы сайта с  указанием их приоритета.

3.7. Директивы sitemap.xmlобязательные атрибуты

<urlset>

Атрибут инкапсулирует этот файл и указы-вает стандарт текущего протокола.

<url>

Sitemap.xml указывает поисковой системе частоту, с которой возникает необходи‑

мость в переиндексации страниц. В этом плане инструкция особенно важна для сайтов с регуляр‑но обновляющимся контентом (новостные порталы и т. п.).

Page 66: Л.Гроховский - Руководство по внутренним факторам

64 Инструкции для поисковых систем

Это родительский тег для каждой записи URL. Остальные теги являются для  него дочерними.

<loc>

Представляет URL-адрес страницы. Этот URL должен начинаться с  префикса (на-пример, HTTP) и  заканчиваться косой чертой, если ваш веб-сервер требует это-го. Длина этого значения не должна пре-вышать 2 048 символов.

Необязательные атрибуты

<lastmod>

Здесь в формате W3C Datetime указыва-ется дата последнего изменения файла. W3C Datetime позволяет при необходимо-сти опустить сегмент времени и исполь-зовать формат ГГГГ-ММ-ДД. Обратите внимание: этот тег не имеет отношения к заголовку ‘If-Modified-Since (304)’, ко-торый может вернуть сервер, поэтому поисковые системы иногда по-разному используют информацию из  этих двух источников.

<changefreq>

Атрибут задает вероятную частоту изме-нения страницы. Это значение предостав-ляет общую информацию для поисковых систем и может не соответствовать в точ-ности частоте сканирования этой страни-цы. Допустимые значения:

always,

hourly,

daily,

weekly,

monthly,

yearly,

never.

Значение «всегда» (always) должно исполь-зоваться для описания документов, кото-рые изменяются при каждом доступе к ним,

Значение «всегда» (always) должно использоваться для описания документов,

которые изменяются при каждом доступе к ним, значение «никогда» (never) – для описания архивных URL‑адресов.

Page 67: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 65

значение «никогда» (never) – для описания архивных URL-адресов.

Имейте в  виду, что  значение для  это-го тега рассматривается как  подсказ-ка, а  не  как  команда. Несмотря на  то, что сканеры поисковой системы учиты-вают эту информацию при принятии ре-шений, они могут сканировать страни-цы с пометкой «ежечасно» менее часто, чем указано, а страницы с пометкой «еже-годно» – чаще одного раза в год. Бывает, что поисковые роботы сканируют стра-ницы с пометкой «никогда», чтобы отсле-живать неожиданные изменения на этих страницах.

<priority>

Указывается приоритетность данного URL относительно других URL на вашем сайте. Допустимый диапазон значений – от 0,0 до 1,0; по умолчанию приоритетность рав-на 0,5.

Значение <priority> не  влияет на  про-цедуру сравнения ваших страниц со стра-ницами других сайтов, оно только по-зволяет указать поисковым системам, какие страницы более важны для скане-ров, на  ваш взгляд. Таким образом, вы не  сможете повлиять на  положение ва-ших URL на  страницах результатов ка-кой-либо поисковой системы. Однако поисковые системы используют эту ин-формацию при  обработке URL, кото-рые относятся к  одному и  тому  же сай-ту. Поэтому можно использовать этот тег для увеличения вероятности присутствия в поисковом индексе самых важных стра-ниц вашего сайта.

Вы должны понимать, что нет смысла на-значать высокий приоритет всем URL ва-шего сайта. Это очень относительная ве-личина, поэтому параметр используется лишь для того, чтобы определить очеред-ность обработки URL в  пределах одного сайта.

Значение <priority> не влияет на процеду‑ру сравнения ваших страниц со страницами

других сайтов, оно только позволяет указать поисковым системам, какие страницы более важны для сканеров, на ваш взгляд.

Page 68: Л.Гроховский - Руководство по внутренним факторам

66 Инструкции для поисковых систем

3.8. Правила составления sitemap.xmlСуществует несколько правил по составле-нию инструкции sitemap.xml:

Размер sitemap.xml не  должен превы-шать 10 Мб.

Файл sitemap.xml может быть разбит на несколько отдельных файлов, каждый из которых должен быть указан в robots.txt.

Файл sitemap.xml, расположенный в  некотором каталоге, должен включать только URL, находящиеся в  этом  же ка-талоге либо его вложенных разделах. Нельзя, чтобы он включал в  себя адре-са из другого (из данного и не вложен-ного в данный) каталога сайта. То  есть в  sitemap.xml, расположенном по  адресу http://www.site.ru / dir_1 / , будут учиты-ваться только инструкции для вложенных в эту категорию страниц. Инструкции, ка-сающиеся страниц, вложенных, например, в категорию http://www.site.ru / dir_2 / , бу-дут проигнорированы.

Файл sitemap.xml не должен содержать более 50 000 URL.

Нельзя использовать более 1 000 фай-лов sitemap.xml.

Эти правила очень просты, но возможно-стей sitemap.xml действительно хватит, чтобы указать информацию о  50  мил-лионах страниц сайта, а  этого более чем достаточно.

3.9. Пример sitemap.xmlРассмотрим на  примере все того  же mobiguru.ru, как  составлять sitemap.xml. Всю карту разбирать не будем, нам доста-точно небольшой ее части.

<urlset>

<url>

<loc>http://mobiguru.ru / < / loc>

<changefreq>hourly< / changefreq>

Файл sitemap.xml, расположенный в некотором каталоге, должен включать

только URL, находящиеся в этом же каталоге либо его вложенных разделах. Нельзя, чтобы он включал в себя адреса из другого (из данного и не вложенного в данный) каталога сайта.

Page 69: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 67

< / url>

<url>

<loc>http://mobiguru.ru / phones / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>http://mobiguru.ru / photo / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>http://mobiguru.ru / notebooks / < / loc>

<changefreq>hourly< / changefreq>

< / url>

<url>

<loc>

http://mobiguru.ru / phones / nokia / nokia_5800_xpressmusic.html

< / loc>

<changefreq>daily< / changefreq>

< / url>

. . .

Указанный отрезок карты сайта инструк-тирует поисковые системы, что  страницы http://mobiguru.ru / , http://mobiguru.ru / phones / , http://mobiguru.ru / photo / , http://mobiguru.ru / notebooks / должны индексироваться ежечасно. Частота пере-индексации страницы http://mobiguru.ru / phones / nokia / nokia_5800_xpressmusic.html – ежедневно.

. . .

<sitemapindex>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-000.txt< / loc>

Файл sitemap.xml не должен содержать более 50 000 URL.

Page 70: Л.Гроховский - Руководство по внутренним факторам

68 Инструкции для поисковых систем

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-001.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-002.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-003.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-004.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-005.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-006.txt< / loc>

<lastmod>2010-07-21< / lastmod>

< / sitemap>

<sitemap>

<loc>http://www.gstatic.com / s2 / sitemaps / sitemap-007.txt< / loc>

Инструкции sitemap.xml и robots.txt при правильном их использовании должны

дополнять друг друга. Существуют три правила взаимодействия этих инструкций.

Page 71: Л.Гроховский - Руководство по внутренним факторам

Инструкции для поисковых систем 69

<lastmod>2010-07-21< / lastmod>

< / sitemap>

3.10. Принцип взаимодействия sitemap.xml и robots.txt

Инструкции sitemap.xml и  robots.txt при правильном их использовании должны дополнять друг друга. Существуют три пра-вила взаимодействия этих инструкций:

sitemap.xml и robots.txt не должны про-тиворечить друг другу;

все страницы, исключенные в robots.txt, должны быть исключены также из sitemap.xml;

все индексируемые страницы, разре-шенные в robots.txt, должны содержаться в sitemap.xml.

3.11. Автоматизация добавления страниц в sitemap.xml

Сайтам, на  которых часто обновляется контент (новостным порталам, интер-нет-магазинам), необходима автоматиза-ция файла sitemap.xml, иначе он потеря-ет свою актуальность. Вручную обновлять инструкцию каждый день  – совершенно нерациональный подход. Для того чтобы автоматизировать добавление и  исклю-чение страниц в sitemap.xml, необходимо создать модуль, связывающий БД сайта, инструкции robots.txt и sitemap.xml. Про-грамма должна руководствоваться следую-щими правилами:

1. Примем как  данность, что  файл sitemap.xml уже изначально создан на сай-те, проработан вручную и содержит толь-ко важные страницы.

2. При добавлении новой страницы систе-ма дописывает строчку в sitemap.xml с ука-занием этой страницы. В  зависимости

Сайтам, на которых часто обновляется контент (новостным порталам, интернет‑

магазинам), необходима автоматизация файла sitemap.xml, иначе он потеряет свою актуальность.

Page 72: Л.Гроховский - Руководство по внутренним факторам

70 Инструкции для поисковых систем

от типа последней указывается параметр частоты индексации и ее приоритет. Если страница закрыта от индексации в robots.txt, она не прописывается в sitemap.xml.

3. При  удалении страницы программа ищет строчку с указанием данной страни-цы в sitemap.xml. Если страница там есть, информация о ней удаляется.

Page 73: Л.Гроховский - Руководство по внутренним факторам

вот мы и  добрались до  самого ин-тересного. В  этой главе я  расска-жу вам о  том, как  решать пробле-

мы уникальности и  недостатка текста на сайте. Непременно уделите представ-ленной ниже информации должное вни-мание, поскольку именно по наполнению страниц поисковая система распознает со-держание сайта. Нет текста – не понятно, о чем сайт, следовательно, для поисковой системы он «пустышка».

Вообще есть три серьезные проблемы оп-тимизаторов, связанные с  текстами: во-ровство контента, отсутствие и  недоста-ток текстов, дублирование текстов внутри сайта.

К сожалению, действенной методики борь-бы с воровством контента не существует. Несмотря на усилия юристов, есть способы воровства, пресечь которые невозможно. Между тем в этой главе вы познакомитесь с одной методикой, которая сводит к нулю вред, причиненный «угоном» контента.

Что касается проблемы отсутствия и недо-статка контента, то решается она обычно за счет автоматизации, а при продвиже-нии небольших сайтов  – ручным допи-сыванием недостающего уникального контента.

4.1. Уникальность контентаКаждый, кто  занимается продвижением сайтов не первый день, сталкивался с про-блемой воровства контента. Казалось бы, воруют  – и  пусть, что  в  этом такого?

Глава 4работа с авторским контентом

Page 74: Л.Гроховский - Руководство по внутренним факторам

72 Работа с авторским контентом

Но дело в том, что очень часто в итоге ко-пия оказывается выше оригинала в резуль-татах поиска, а значит, воровство контента можно приравнять к воровству трафика. Ходят слухи, что на одной из конференций представители Яндекса озвучили значение погрешности определения первоисточни-ка, назвав цифру ~ 30 %.

Как  же так? Неужели поисковая систе-ма не  может определить первоисточник и  ранжировать сайты справедливо? Все-го-то и нужно – определить, где контент появился раньше, и  отдать этому сайту предпочтение. Но не все так просто. Ведь поисковая система переиндексирует сай-ты неравномерно. Допустим, если ваш ресурс обновляется не часто, значит, ско-рее всего, и поисковый робот – не частый ваш гость. Если вы публикуете результа-ты научного исследования раз в  3 меся-ца, а  новостной портал разместит вашу статью как  свою, шансы, что  у  вас ста-тья будет проиндексирована раньше, ни-чтожны. На живые новостные порталы ро-бот-индексатор заглядывает несколько раз в час, а ресурс с менее подвижным контен-том может посетить и через несколько не-дель. Таким образом, выходит, что «ори-гинал» статьи расположен на новостном портале, а научный центр опубликовал его «копию». Как видите, по дате индексации определять оригинал нельзя.

Тогда, может быть, определять первоис-точник по авторству в тексте статьи? Бес-полезно, ведь ворам не  составит труда указать свое авторство и сайт в качестве первоисточника. Даже ссылки на ориги-нал, которые указали добросовестные сайты, разместившие ваши статьи,  тоже не спасение. Можно запросто разместить на своем сайте чужую статью, а потом про-дублировать ее в нескольких блогах с ука-занием сайта как первоисточника.

Как  видите, любые признаки оригина-ла легко подделать. Поисковые системы

Если вы публикуете результаты научного исследования раз в 3 месяца, а новостной

портал разместит вашу статью как свою, шансы, что у вас статья будет проиндексирована раньше, ничтожны. На живые новостные порталы робот‑индексатор заглядывает несколько раз в час, а ресурс с менее подвижным контентом может посетить и через несколько недель.

Page 75: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 73

не  станут разбираться в  этих тонкостях, а владельцам сайта нет смысла в каждом случае пытаться восстановить свои автор-ские права юридически. Борьба с дорвея-ми, ворующими контент, подобна борь-бе с  ветряными мельницами, ведь эти сайты размещают на  доменах, зарегист-рированных на  несуществующих людей в  зонах, не  подвластных влиянию юрис-дикции Российской Федерации. Против сайтов, размещенных на зарубежных хо-стингах и  не  в  доменной зоне РФ, вы  – увы! – бессильны. Если же сайт, укравший ваш контент, располагается на  россий-ской «интернет-территории», а вы име ете юридическое подтверждение авторства или хотя бы след в веб-архиве, вы можете связаться с хостером или владельцем доме-на и попросить убрать ворованые тексты, а  в  случае их  отказа сделать это, подать иск. Но все-таки куда проще и дешевле на-писать новый текст, чем закрепить за со-бой через суд авторство существующего.

Открою вам страшный секрет: поиско-вые системы не пытаются распознать оригиналы и копии контента. Их зада-ча  – удовлетворить своих посетителей, а  на  уровень удовлетворенности никак не повлияет, окажется ли на первом ме-сте в результатах поиска оригинал или же там расположится копия. Поэтому воров-ство контента – это головная боль исклю-чительно оптимизаторов, а не разработчи-ков поисковых систем.

Второй важный момент: в рунете практи-чески нет статей, уникальных на 100 %. Какая-то  часть любой статьи с  огром-ной долей вероятности уже встречалась где-то в Сети, а значит, невозможно точ-но разграничить оригинал и  переписан-ный текст (рерайт).

Немного статистики для  понимания масштабов:

По данным проекта «Черный квадрат», реализованного Алексеем Тутубалиным

Поисковые системы не пытаются распо‑знать оригиналы и копии контента.

Их задача – удовлетворить своих посетителей, а на уровень удовлетворенности никак не повлия‑ет, окажется ли на первом месте в результатах поиска оригинал или же там расположится копия.

Page 76: Л.Гроховский - Руководство по внутренним факторам

74 Работа с авторским контентом

по адресу http://www.rukv.ru / , 9 сентября 2010 года в Рунете только на поддоменах второго уровня в зонах.RU и.SU работало 1 893 837 сайтов.

По данным Яндекса, опубликованным в  информационном бюллетене осенью 2009  года, в  Рунете насчитывалось око-ло 15 миллионов сайтов (это около 6,5 % всего Интернета). При этом информация в Сети распределена неравномерно: 88 % всего текста находится менее чем на 1 % сайтов. Средний сайт Рунета состоит из 255 страниц, содержит 159 тысяч слов и 204 картинки. Большинство сайтов го-раздо меньше среднего: половина из них состоит всего из одной страницы.

Так будем  же реалистами и  усвоим три простые истины:

1. Невозможно достоверно определить первоисточник.

2. Практически не  существует на  100 % уникального контента.

3. Большинство страниц имеет дубликаты.

Неутешительная картинка? Не стоит опу-скать руки. В действительности все не так плохо, как кажется. Периодически обнов-ляйте контент на входных страницах, это положительно сказывается на  ранжиро-вании сайтов. Как поступать с дубликата-ми, вы уже знаете из 2-й главы. Что касает-ся воровства контента, есть действенный способ нейтрализовать вред, который оно наносит.

4.2. Как защитить контент от воровства?

БЕСПоЛЕЗНо:

дублировать статью на сторонних сай-тах с указанием вашего сайта в качестве первоисточника, поскольку это не оказы-вает значительного влияния на позиции сайта в выдаче;

По данным Яндекса, опубликованным в информационном бюллетене осенью

2009 года, в Рунете насчитывалось около 15 мил‑лионов сайтов (это около 6,5 % всего Интернета). При этом информация в Сети распределена неравномерно: 88 % всего текста находится менее чем на 1 % сайтов.

Page 77: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 75

отключать через JavaScript правую кноп-ку мышки и выделение текста на странице, использовать любые программные спосо-бы защиты контента от копирования, по-скольку в 99 % случаев воруют не путем ко-пирования контента со страницы, а парсят специальными программами, которые пе-рекачивают сайт и срезают теги, оставляя только текст статьи, а иногда контент вы-дирают вручную из HTML;

ставить ссылки на первоисточник в тек-сте статьи, так как чаще всего такие ссыл-ки срезаются программами-парсерами.

Что же делать?

определите, по каким запросам вас мо-гут искать, составьте правильные анко-ры, закупите ссылки . Ссылки нужно раз-мещать с  быстроиндексируемых сайтов, а в качестве текстов ссылок следует исполь-зовать небольшие части статьи. Если при-менять простенький скрипт, можно авто-матизировать этот процесс. Скрипт будет разбивать заданный текст на пассажи с от-бивкой не более 100 символов и дописы-вать теги для размещения ссылок в SAPE.

Закупая ссылки с частями текста статьи, мы поднимаем страницу со статьей в ре-зультатах поиска выше других копий, по-скольку синергия между содержимым на странице и в анкор-листе увеличивает значимость этой страницы.

У  этой методики существует свой недо-статок: используя разбивку текста на пас-сажи, мы теряем запросы, возникающие на их стыке, ведь текст дробится на части, которые не накладываются друг на друга. Кроме того, если мы будем просто последо-вательно перебирать весь текст, то станем тратить лишние деньги на продвижение запросов вроде «продукция предприятия получила высшую оценку», а они никогда не приведут к нам целевых посетителей. Поэтому нужно брать тексты ссылок из об-ластей около ключевых слов конкретной

Ссылки нужно размещать с быстроиндекси‑руемых сайтов, а в качестве текстов ссылок

следует использовать небольшие части статьи. Если применять простенький скрипт, можно автоматизировать этот процесс. Скрипт будет разбивать заданный текст на пассажи с отбивкой не более 100 символов и дописывать теги для раз‑мещения ссылок в SAPE.

Page 78: Л.Гроховский - Руководство по внутренним факторам

76 Работа с авторским контентом

страницы. Именно по ним на сайт могут попасть целевые посетители. В общем виде методика такова: анкор не более 100 сим-волов, отбивка «ключевое слово в конце текста ссылки» и отбивка «ключевое сло-во в начале текста ссылки».

4.3. Как воровать контент?Воруется контент точно по такому же прин-ципу, как и защищается. Вышеописанный способ работает в обе стороны: при краже статья копируется, а на нее размещаются входящие внешние ссылки с частями тек-ста статьи в анкоре.

4.4. отсутствие и недостаток контентаНехватка или полное отсутствие контен-та на сайте приводит к ошибкам в ранжи-ровании, поскольку поисковые системы не  могут корректно распознать принад-лежность страницы к ключевым словам. На небольших сайтах недостаток контен-та восполняется вручную – дописывани-ем недостающих текстов, а вот на крупных ресурсах не обойтись без автоматизации. Например, на  сайте http://mobiguru.ru

О том, как купить DELL Alienware M11x дешевлеСравни все цены на DELL Alienware M11x в более чем 27 интернет-магазинах, продающих ноутбуки, найди, где можно купить DELL Alienware M11x дешевле, определив лучшую и среднюю стоимость, закажи ноутбук DELL Alienware M11x в самом дешевом месте с доставкой по Москве, Санкт-Петер-бургу, Екатеринбургу или всей России и даже Украине!

О том, как купить ASUS K50IJ дешевлеСравни все цены на ASUS K50IJ в более чем 49 интернет-магазинах, продающих ноутбуки, найди, где можно купить ASUS K50IJ дешевле, определив лучшую и среднюю стоимость, закажи ноут-бук ASUS K50IJ в самом дешевом месте с доставкой по Москве, Санкт-Петербургу, Екатеринбургу или всей России и даже Украине!

Информация о Toshiba Satellite A350Прочитай полный обзор Toshiba Satellite A350 и эксклюзивный тест ноутбука, ознакомься с от-зывами владельцев Toshiba Satellite A350 в форуме ноутбука, просмотри описание Toshiba Satellite A350 с характеристиками и фото ноутбука и не забудь про новости!

О том, как купить DELL Inspiron M301z дешевлеСравни все цены на DELL Inspiron M301z в более чем 18 интернет-магазинах, продающих ноутбуки, найди, где можно купить DELL Inspiron M301z дешевле, определив лучшую и среднюю стоимость, закажи ноутбук DELL Inspiron M301z в самом дешевом месте с доставкой по Москве, Санкт-Петер-бургу, Екатеринбургу или всей России и даже Украине!

Page 79: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 77

проблему недостатка контента решили за счет генерации мини-описаний с вхо-ждениями ключевых слов в тексте.

Следует отметить, что важно не только на-личие контента, но  и  его уникальность, структура, наполненность. По  лицензии Яндекса, сайты, использующие неуни-кальный контент, могут быть частично или полностью исключены из индексной базы. Кроме того, страницы с неуникаль-ным контентом ранжируются хуже.

Далее нам предстоит подробно рассмо-треть способы автоматической генера-ции контента. Мы разберем не только ге-нерацию контента в  тексте страницы, но также генерацию метатегов description и keywords и генерацию заголовков TITLE.

4.5. Автоматизация наполнения Description, Keywords, Title

В зависимости от приспособленности CMS автоматизация заполнения заголовков и метатегов может быть реализована дву-мя путями:

разработка встраиваемого в  CMS модуля,

ручная загрузка ранее сгенерированных текстов в БД.

Первый способ более практичен и  удо-бен, чем  второй. Для  продвижения сай-тов, на которых часто появляются новые страницы, подходит только он. Второй спо-соб значительно более прост в реализации, но он идеален только для тех сайтов, где количество новых страниц за месяц мож-но пересчитать по пальцам.

автоматизация наполнения keywords

По  умолчанию этот тег должен быть пу-стым. На входных страницах в него впи-сываются все продвигаемые запросы. Ав-томатизировать наполнение тега можно в зависимости от типа сайта: либо через интеграцию с БД, откуда будет забираться

Воруется контент точно по такому же принципу, как и защищается. Вышеописан‑

ный способ работает в обе стороны: при краже статья копируется, а на нее размещаются входящие внешние ссылки с частями текста статьи в анкоре.

Page 80: Л.Гроховский - Руководство по внутренним факторам

78 Работа с авторским контентом

наименование товарной группы и назва-ние конкретной модели, либо через лин-гвистический анализ текста страницы, результатом которого должны стать наи-более часто употребляемые на ней слова. Неключевые частоупотребимые слова мо-гут удаляться через специальный словарь или вручную при небольших объемах.

автоматизация наполнения TITLE

Настраивается через формулу [TITLE стра-ницы] [TITLE раздела] [TITLE сайта]. TITLE страницы = H1 страницы, TITLE раздела = H1 раздела, TITLE сайта задается изна-чально и дублируется на всех страницах сайта. Желательно, чтобы в TITLE попали все возможные части запросообразующих слов. В этом случае не обойтись без пропи-сывания корректных заголовков H1, хотя при правильной верстке и грамотном на-полнении сайта, этот тег должен содержать основные ключевые слова страницы.

Пример TITLE с  сайта компании «БЕСТ-Недвижимость»:

Квартиры в  Бибирево. Предложения по продаже квартир в Москве, новострой-ки и вторичная недвижимость. Агентство недвижимости «БЕСТ».

Квартиры в Медведково. Предложения по продаже квартир в Москве, новострой-ки и вторичная недвижимость. Агентство недвижимости «БЕСТ».

Коттеджи в  Солнцево. Загородная не-движимость в Подмосковье. Агентство не-движимости «БЕСТ».

автоматизация генерации Description

Настраивается по заданной формуле2 типа [Текст] [x] [Текст] [y] [z] [a] [b] [Текст].

С айтРепорт – система SEO‑аналитики, позволяющая проводить диагностику сайта.

СайтРепорт – это возможность провести полную диагности‑ку сайта, увидеть его глазами поисковых систем. Оптими‑затору приходится сталкиваться со множеством проблем: недостаток контента, 404 ошибки, дубликаты страниц, мусорные ссылки, страницы 30 уровня вложенности, отсут‑ствие заголовков… Легко найти ошибки на небольшом сайте, достаточно просмотреть все страницы вручную. Что делать, если на сайте несколько тысяч страниц? Наш робот выполнит эту работу за вас, перекачает ваш сайт, после чего система проведет анализ, который вы подробно изучите. Сделав анализ сайта, вы получите подробный отчет об ошибках и узнаете потенциал вашего проекта в работе с внутренними факторами.Проще говоря, бесплатно решите проблему внутренних факторов.

КАК РАБотАет СИСтеМА:

Система представляет собой программный комплекс, исполь‑зующий мощности нескольких серверных машин и состоящий из 5 модулей:# Робот-индексатор

Робот обходит все страницы сайта в соответствии со всеми инструкциями для вашего сайта, то есть фактически имеет все функции поискового робота. Робот заносит в базу код ответа каждой страницы, запоминает скорость соединения, сохраняет контент каждой страницы, вынося в отдельный блок все исходящие ссылки.# Анализ ссылочных связей

Модуль выстраивает ссылочные связи всех страниц между собой, обрабатывая миллионы ссылок. Для каждой страницы составляется список входящих внутренних ссылок с указанием анкоров. Все ссылки проверяются на индексацию. Система рассчитывает условный вес каждой страницы по технологии, имитирующей расчет PageRank. Создаются отчеты с указани‑ем всех страниц, ссылающихся на 404 ошибки, а также всех страниц, с которых стоят редиректы.# обработчик контента

Система определяет уникальность контента каждой страницы сайта по отношению к другим его страницам, сравнивая содер‑жание всех страниц между собой. Модуль сравнения основан на собственной технологии построения хешей частей страниц с использованием технологии шинглов, что обеспечивает большую скорость и точность полученных данных. Система также определяет страницы с недостатком и переизбытком контента.

ФАКт

2Бывает, что  в  формуле полностью отсут-ствует статичный текст. Переменные могут быть выражены как  элементом БД (наиме-нование модели, название марки, цена), так и браться из словаря, который заранее гото-вит копирайтер.

Page 81: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 79

Пример:

«Фабрикой [M] производится классиче-ская и  современная [A]. Модель [N] от-личается от [B]. Позвоните прямо сейчас +7 495 777-77-77».

A = [мебель для  кухни|кухонная мебель]

B = [элегантностью и уникальным ди-зайном|оригинальным дизайном и  на-дежностью конструкций]

M = $fabrique

N = $model

4.6. Автоматизация генерации контента

автоматизация генерации описаний товаров

Аналогично с  Description настраивается по  формуле3 типа [Текст] [x] [Текст] [y] [z] [a] [b] [Текст].

Пример:

«Фабрикой [M] производится классиче-ская и современная [A]. Модель [N] отли-чается от [B]».

A = [мебель для  кухни|кухонная мебель]

B = [элегантностью и уникальным ди-зайном|оригинальным дизайном и  на-дежностью конструкций]

M = $fabrique

N = $model

автоматизация генерации технических характеристик (уровень 1)

Аналогично настраивается по  формуле типа [x] [A]; [y] [B]; [z] [C];

# HTML-валидатор

Модуль обрабатывает HTML‑код каждой страницы, выделяя содержание всех важных HTML‑тегов: TITLE, Meta keywords, Meta description, STRONG, B, EM, H1‑H6. Система выстраивает отчеты по дублированию содержимого этих тегов, а также делает срезы по страницам, где важные HTML‑теги пусты.# Среда для аналитики – http://СайтРепорт.РФ /

Вы изучаете полученные данные и на основании их планируе‑те, как вам дальше продвигать сайт.Система перекачивает до 5 000 страниц вашего сайта.

Какую информацию вы получите о сайте:• Общий анализ сайта.• Анализ внутреннего анкор‑листа.• Расчет распределения весов между страницами при пере‑

линковке по классической формуле PageRank.• Поиск битых ссылок.• Поиск сквозных ссылок.• Проверка HTML‑кода всех страниц на валидность.• Анализ корректности <noindex> и rel=nofollow.• Генератор sitemap.xml.• Анализ внутренней перелинковки.• Сводные отчеты с графиками по перелинковке.• Проверка на наличие сайта в крупных каталогах.• Поиск страниц с исходящими внешними ссылками.• График распределения страниц по ответу сервера.• Поиск страниц с 404 ошибками.• Поиск страниц с 3** редиректами.• Оценка размера страниц и скорости их загрузки.• График распределения страниц по уровням вложенности.• Список 100 % дубликатов страниц, одинаковых в рамках

сайта.• Список 90 %+ дубликатов страниц, одинаковых в рамках

сайта.• Анализ заполненности страниц.• Пустые страницы.• Отчет «На какие страницы ссылается данная».• Отчет «Какие страницы ссылаются на данную».• Анализ TITLE.• Страницы с одинаковыми TITLE.• Дубликаты Keywords.• Дубликаты Description.• Страницы с пустыми TITLE.• Оценка составления заголовков H1‑H6.• Анализ разметки STRONG и B.• Анализ разметки EM.

3Бывает, что  в  формуле полностью отсут-ствует статичный текст. Переменные могут быть выражены как  элементом БД (наиме-нование модели, название марки, цена), так и браться из словаря, который заранее гото-вит копирайтер.

Page 82: Л.Гроховский - Руководство по внутренним факторам

80 Работа с авторским контентом

Пример:

«Вес шкафа 213 кг. В  высоту шкаф 10 м. В длину 8 м».

A = [213 кг]

B = [10 м]

C = [8 м]

x = [Вес шкафа | Масса шкафа | Шкаф весит | Вес | Масса | Насколько тяжелый]

y = [Высота шкафа| В высоту шкаф | Вы-сота | В высоту | Высота от пола | Габари-ты: высота]

z = [Длина шкафа | Габариты: ширина | Длина | В длину шкаф | В длину]

автоматизация генерации технических характеристик (уровень 2)

Строим зависимости переменных от зна-чений: выставляем пороги.

вес: крохотный 0–100; небольшой 100–200; не  очень большой 200–300; доста-точно большой 300–400; огромный 400+. В  этом случае дописываются текстовые блоки из разных словарей.

Пример: Вес шкафа не очень большой – всего 213 кг, можно хранить в помещени-ях, не оборудованных укрепленными пе-рекрытиями. В высоту шкаф займет около 10 м  – впишется в  складское помещение с высокими потолками. В длину – 8 м, до-статочно емкий, чтобы хранить большое количество грузов.

4.7. обнаружение дубликатовДубликаты – это, как правило, «побочный эффект» некоторых характеристик сайта, как-то:

наличие сквозного блока с контентом,

недостаток контента,

конструкция страниц списка анонсов,

особенности CMS, из-за которых полно-стью дублируются страницы.

• Анализ robots.txt.• Лемматизация всего контента на сайте.• Анализ плотности ключевых слов на каждой странице.• Поиск страниц, содержащих ключевые словосочетания

по сайту.• Представление контента каждой страницы без <HTML>

кода.• Анализ данных whois‑домена.• Настройка маски страниц, которые система анализирует,

т. е. можно, например, проанализировать только страницы, содержащие в URL / beauty /, или все, кроме страниц, содер‑жащих в URL thread.php.

• Настройка глубины анализа страниц.• Возможность настроить robots.txt для робота‑индексатора

системы.• Отчет только по входным страницам.• Анализ установленных метрик.• Количество ссылок в Yahoo.• Анализ скорости загрузки страниц.• Анализ размеров страниц.• Список всех страниц, на которых встречается любая форма

заданного слова.• Отчет по наиболее часто употребляемым словам всего сайта.• Экспресс‑отчет по типичным ошибкам сайта.• Структура и иерархия сайта.• Сравнение индексации типов страниц и категория в поиско‑

вых системахи множество других отчетов, список которых мы постоянно расширяем.

некоторые графики из отчета:• График заполненности TITLE

• График дубликатов в теге TITLE

Page 83: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 81

Обнаружить дубликаты можно двумя пу-тями: вручную и автоматически.

Инструкция по обнаружению дубликатов вручную

Нет необходимости объяснять, почему вручную дубликаты обнаружить сложно. Этот способ подходит лишь для  неболь-ших сайтов, где все страницы можно вни-мательно просмотреть, но даже в этом слу-чае погрешностей не избежать.

Для  ручной проверки воспользуйтесь следующим алгоритмом:

1. Анализируем данные Яндекс.Вебма-стер. Просмотрите, какие страницы Ян-декс решил удалить из результатов поис-ка. Именно они нас интересуют.

2. Через расширенный поиск Яндекса ищем все страницы, проиндексирован-ные с  данного сайта, и  ставим режим отображения 50 результатов на страни-це. Прокликиваем все проиндексирован-ные Яндексом страницы, если их меньше 500, просматриваем каждую из них вруч-ную. Если страниц больше 500, прокли-киваем только первые 500, у остальных просто просматриваем сниппеты. Этой информации хватит для  поверхностно-го анализа сайта на  дубликаты. Далее смотрим страницы, проиндексирован-ные в  Google, особенно обращая вни-мание на те, которых не было в Яндексе (они будут подсвечены в браузере синим цветом, так как вы их еще не посещали). Во время просмотра вы обнаружите часть дубликатов.

3. Просматриваем структуру сайта, вни-кая, каким образом формируется контент на  страницах, откуда берутся текстовые блоки, где возникают блоки дублирующе-гося контента.

4. Ищем контент внутри сайта по точному вхождению (для этого нужно пассаж тек-ста искать в Яндексе с использованием опе-раторов «кавычки» и  «восклицательный

• Анализ сайта на наличие сквозных ссылок

• Анализ исходящих ссылок

• Анализ глубины вложенности страниц сайта

• Анализ сайта на наличие дубликатов страниц

Page 84: Л.Гроховский - Руководство по внутренним факторам

82 Работа с авторским контентом

знак»: «!слово!слово!слово») с  основных входных страниц. Особенно здесь можно выделить главную страницу. Если дубли-каты есть, вы их увидите.

Способы автоматизации обнаружения дубликатов

Для  автоматического анализа нужно воспользоваться специализированными приложениями. На  момент написания книги существует всего одна програм-ма, доступная к  бесплатному использо-ванию и  способная провести подобный анализ, – «СайтРепорт».

Некоторые системы способны сделать не-большую часть анализа, но все они явля-ются пользовательскими и  используют мощности вашего компьютера, что очень сильно ограничивает объемы сканируе-мой информации. Сайт из нескольких со-тен страниц просканировать получится, но интернет-магазины с десятками тысяч страниц таким системам не по зубам.

Для поверхностного анализа я могу ре-комендовать некоторые программы. Например,

Semonitor осуществляет следующие операции:

поиск битых/нерабочих ссылок;

поиск «потерянных» файлов;

поиск недочетов и ошибок в html-коде;

создание подробного отчета по всем ис-ходящим ссылкам с данного сайта;

NetPromoter выполняет такие задачи:

проверка работоспособности ссылок на сайте;

поиск неработающих ссылок;

определение размера страниц.

К сожалению, эти программы не помогут вам в обнаружении дубликатов. Серьезный анализ можно сделать лишь с помощью од-ной системы, имя которой – «СайтРепорт».

Иван Севостьянов, генеральный директор «вебПроекты»:

–Контент очень важен для любого сай‑та. Еще 2–3 года назад можно было

пренебрежительно относиться к содержанию сайта, копировать информацию с чужих сайтов или вовсе не наполнять сайт полезной для посетителя информацией.Сейчас такие методы не работают, и в дальнейшем требования к текстовой составляющей сайта со стороны поисковых машин будут только расти.У контентной составляющей любого интернет‑сайта есть три проблемы. Первая – воровство контента. Вторая – стоимость создания контента. Третья – определение первоисточника контента.К сожалению, контент воровали, воруют и будут воровать, так как правовые механизмы защиты авторского права в Интер‑нете еще должным образом не отработаны, и даже если вы выиграете судебное дело, то затраты времени на судебное разбирательство будут много выше, чем сумма компенсации.Контент – дорогое удовольствие, особенно если у вас крупный контентный проект. Написание 1 страницы хорошего контента стоит от 300 рублей. Даже если у вас 200 страниц на сайте, то это уже 60 тысяч. А если страниц несколько тысяч, то сумма будет еще выше. Частично проблему можно решить за счет автоматической генерации контента, но это подойдет не всем сайтам. Поэтому вкладываться в контент спешат не все, особенно учитывая то, что его все равно могут своровать.Третья проблема – поисковики до конца не научились опреде‑лять первоисточник контента. Это тоже мешает вкладываться в написание уникального контента, так как вы можете сделать сайт с качественным контентом, его своруют, а поисковая система первоисточником может посчитать именно сайт с ворованным контентом.С сожалению или к счастью, выход один – писать уникальный и качественный контент, учиться защищать его от воровства, отстаивать свою позицию перед поисковиками в спорных ситуациях. И самое главное – помнить, что контент пишется для людей, а не для роботов!

МненИе

Page 85: Л.Гроховский - Руководство по внутренним факторам

Работа с авторским контентом 83

Резюме: Существует две методи-ки обнаружения дубликатов: руч-ная и автоматизированная. Ручная бесплатна, но  менее эффектив-на. Для автоматизированного ана-лиза идеально подходит система «СайтРепорт» либо некоторые са-мописные разработки, используе-мые компаниями-лидерами рынка для собственных нужд.

Константин Шурыгин, генеральный директор автоматического сервиса по продвижению сайтов «Маремото»:

–Проблема дублированного контента в реальности стоит даже острее,

чем отмечено выше. В настоящий момент я веду переписку с Яндексом, который только что удалил из индекса уважаемый 8‑летний сайт, имеющий хорошие по‑казатели авторитетности и 62 000 естественных ссылок. Вместо него «главным зеркалом» был признан безвестный клон трех месяцев от роду, имеющий всего 5 платных ссылок, укравший чужой контент. Авторитетный сайт был удален и из каталога Яндекса, а его место здесь занял вынырнувший из ниоткуда дубль. От аргументов Платона Щукина веет безысходностью: «…если даже описание в каталоге Яндекса будет перенесено вручную на правильный адрес, оно автоматически вернется обратно через некоторое время, потому что ваш сайт все еще является неглавным зеркалом. Пока сайты – зеркала, перенос описания не поможет. Как только сайты перестанут быть зеркалами, напишите нам снова по вопросу возвраще‑ния в каталог…».Как показывает опыт, «раззеркаливание» может занять от одной недели до трех месяцев. За это время владелец клона с ворованным контентом обычно успевает разослать всем вла‑дельцам ссылающихся сайтов письма с просьбой «обновить ссылки в связи с переездом сайта на новый адрес». В качестве аргумента обычно приводят «новый» адрес, указываемый в Яндекс.Каталоге. Таким образом рейдерам удается украсть у ничего не подозревающих владельцев сайта не только тысячи страниц уникальных текстов, но и место в каталоге Яндекса, а также накопленную годами ссылочную базу, а потом и PageRank. Даже если впоследствии двойник будет удален из Яндекса, такой клон может зависнуть в ссылочных биржах и годами приносить доход своим владельцам.Часто дубли вашего сайта создают конкуренты, которые выка‑чивают ваш контент программами типа Teleport или Webcopier, размещают его на бесплатных хостингах, накачивают бесплатными или платными ссылками, а также дают на этот сайт рекламу в Директе. Этого бывает достаточно, чтобы спро‑воцировать Яндекс к неверному зазеркаливанию сайтов.Однако бывает и так, что дубли вашего сайта создают вовсе не злоумышленники. Дубли может создать ваш собствен‑ный веб‑мастер, заполняя зеркалами все выкупленные корпоративные домены. Часто это дело рук давно уволенного веб‑мастера, который это делал из благородных намерений не оставить тайп‑сквоттерам ни одного шанса. Так, однажды столкнувшись с проблемами в продвижении корпоративного сайта, я обнаружил 17 зеркал на доменах второго уровня, о су‑ществовании которых никто из владельцев понятия не имел. В таких случаях организация 301 редиректа на главное зеркало и наличие директивы Host в robots.txt всех доменов помогает избежать больших проблем.

МненИе

Page 86: Л.Гроховский - Руководство по внутренним факторам

84 Работа с авторским контентом

Но неожиданнее всего бывает ситуация, когда зеркала сайта делают… сервера сами. На некоторых версиях сервера Apache поддомены третьего уровня по умолчанию заполняются содержимым домена второго уровня. Если веб‑мастер создает поддомены с прицелом «на будущее», то они неожиданно для всех могут стать клонами основного сайта. Это может вы‑звать «зазеркаливание», катастрофическое падение позиций в выдаче Яндекса, заметное сокращение целевого трафика и продаж. А всему виной – один‑единственный символ *, который надо было удалить из настроек сервера.Следует постоянно следить за появлением «зеркал» своего сайта в Интернете. При наличии более авторитетных дублей вашего контента, продвижение сайта будет неэффективным, пока вы не решите проблему с этими зеркалами. Перед нача‑лом продвижения определяет наличие у сайта авторитетных зеркал. Ведь при наличии таких зеркал продвижение сайта будет нестабильным, а результат будет отсутствовать.

Page 87: Л.Гроховский - Руководство по внутренним факторам

К од ответа – это инструкция, кото-рую получает посетитель, захо-дя на страницу сайта. С помощью

этой инструкции браузер может скоррек-тировать обработку страницы на стороне посетителя. На первый взгляд, код ответа сервера – фактор, не имеющий никакого отношения к продвижению сайтов. Одна-ко это не так. Да, настройки ответа серве-ра не могут улучшить ранжирование сай-та, но  допущенная в  них ошибка может поставить крест на ваших планах покоре-ния топа результатов поиска. Поисковые роботы, как и посетители, учитывают коды ответов сервера и на их основании коррек-тируют обработку страниц. В частности, по кодам ответа поисковые системы при-нимают решение о том, что:

страница существует и  работает корректно;

страница не существует;

страница перемещена навсегда;

страница временно перемещена;

сервер загружен и не может обработать запрос.

Существуют и  другие, менее значимые, инструкции.

5.1. Код ответа 200Поисковые системы добавляют в свою ин-дексную базу только те страницы, которые отдают код ответа 200, означающий «стра-ница существует и доступна для просмо-тра». Все важные страницы, которые мы

Глава 5Коды ответов сервера

Page 88: Л.Гроховский - Руководство по внутренним факторам

86 Коды ответов сервера

хотим «скормить» поисковому роботу, дол-жны отдавать код ответа 200.

Если страница использует редирект и лишь после перемещения отдает код ответа 200, поисковая система индексирует только ко-нечную страницу. Страница-шлюз может быть удалена или понижена в ранжирова-нии (это зависит от типа редиректа).

Если страница отдавала код ответа 200 и  попала в  индексную базу, но  позже была удалена и теперь отдает код 404, она со временем удаляется из индексной базы.

Если на странице поставить 301 редирект, то через некоторое время она будет так-же удалена из индекса, а ее вес в некото-рых случаях будет передан той странице, на  которую ссылался редирект. К  сожа-лению, Яндекс очень долго осуществляет переиндексацию страниц с  редиректом: были зафиксированы случаи, когда пере-клейка происходила почти год.

5.2. Коды ответов 301 / 302 / 303 / 307 / 3**Существует большое количество кодов для обозначения редиректа. Укажем здесь основные, наиболее важные для поиско-вых систем:

301  – «постоянное перенаправление». Означает, что  страница перемещена на-всегда. Этот редирект используется чаще всего. В случае если адрес страницы изме-нился навсегда, что происходит, например, при редизайне или реструктуризации сай-та, 301 редирект позволяет сохранить вхо-дящие внешние ссылки за счет переклейки их веса на новые адреса страниц. Яндекс обрабатывает этот редирект очень долго, может пройти до года, прежде чем страни-цы склеятся.

302 / 303 / 307  – «временное перена-правление». Веб-мастер таким образом указывает роботу поисковых систем, что  страница перемещена временно,

николай Хиврин:

–Значимость верного использования кодов ответов сервера трудно

переоценить. Правильная работа с ними может позволить совершенно безболезнен‑но перейти на новую систему управления и адресацию web‑сайта. В сфере поискового продвижения особенное внимание стоит уделять трем кодам ответов: 200, 404 и 301. Пожалуй, самой частой ошибкой сегодня является неверное использование редиректов 301. Они могут отсутство‑вать вообще, а могут вести последовательно через несколько адресов. Другой важной проблемой является дублирование содержимого, а это возникает из‑за того, что у ряда сгенериро‑ванных адресов возникает код ответа 200. Правильная работа c кодами ответов сервера является очень важным навыком для поискового оптимизатора и позволяет избежать целого ряда очень серьезных ошибок.Рассмотрим наиболее распространенную ситуацию, в которой предыдущая версия сайта компании сильно устарела. Компа‑ния хочет обновить свой сайт, однако боится потерять позиции в результатах поиска, а как следствие, и источник новых клиентов. Как правило, обновление сайта связано с установкой новой системы управления (CMS), в результате чего на сайте создается новая структура адресов страниц. Если осуществить переход на новую адресацию, то, конечно же, все старые страницы пропадут из индекса поисковых систем, а вместе с ними и позиции по ключевым запросам. Однако если сделать 301 редиректы с каждого старого адреса на новые страницы, то этой проблемы можно избежать. Поисковые роботы и по‑сетители сайта будут перенаправляться на новые страницы, что позволить полностью сохранить их вес и не потерять позиции в результатах поиска.Другая распространенная ошибка: интернет‑магазин содержит каталог, он генерирует очень большое количество внутренних ссылок, а структура их бывает хаотичной. В результате этого поисковые роботы могут попасть на такие страницы, адреса которых совсем не были предусмотрены разработчиком проекта. Для того чтобы эти страницы не засоряли индекс поисковых систем, нужно правильно расставить ошибки 404 и исключить эти страницы из индекса.

МненИе

Page 89: Л.Гроховский - Руководство по внутренним факторам

Коды ответов сервера 87

а значит, ее не нужно удалять из индекс-ной базы. В этом случае Яндекс может до-бавить в свою базу обе страницы, но ото-бражать только одну из них в результатах поиска.

Из инструкций Яндекс .вебмастер:

При  постоянном перенаправлении (301) между внутренними страницами хоста в результатах поиска будет отобра-жаться цель.

При  временном перенаправлении (302 / 303 / 307 / Meta refresh) между вну-тренними страницами хоста в  результа-тах поиска будет отображаться наиболее компактный URL.

типичные ошибки:

Вместо 301 стоит конструкция вида 302 —> 302 —> 302 —> 301

Резюме: если вы изменили адрес страницы, выложили новую вер-сию сайта или  просто хотите убрать дубликат (например, скле-ить / site / и / site), используйте 301 ре-директ. Важно использовать именно одношаговый редирект, не создавай-те сложных конструкций из несколь-ких редиректов.

5.3. Код ответа 404Код ответа 404 используется для указания браузеру или поисковой системе, что стра-ницы не  существует. Сервер в  этом слу-чае отображает или стандартную страни-цу «по этому адресу ничего не найдено», или страницу-заглушку, если создан спе-циальный шаблон для  несуществующих страниц.

Важно не  путать серверный ответ 404 и  404-ю страницу-заглушку. Некоторые веб-мастера по каким-то им одним ведо-мым причинам на  404-й странице раз-мещают заглушку с  указанием «страни-ца не существует», но на уровне сервера

Другая распространенная ошибка: интернет‑магазин содержит каталог, он

генерирует очень большое количество внутренних ссылок, а структура их бывает хаотичной. В резуль‑тате этого поисковые роботы могут попасть на такие страницы, адреса которых совсем не были предусмотрены разработчиком проекта. Для того чтобы эти страницы не засоряли индекс поисковых систем, нужно правильно расставить ошибки 404 и исключить эти страницы из индекса.

Page 90: Л.Гроховский - Руководство по внутренним факторам

88 Коды ответов сервера

отдают код ответа 200. Посетитель этого не замечает, но поисковая система воспри-нимает такие страницы как  существую-щие, индексирует их и заносит в свою базу как дубликаты. Используя подобную уяз-вимость, на сайте вы можете создать сколь угодно большое количество дублирующих-ся страниц, понизив вес сайта для поиско-вой системы.

типичные ошибки:

вместо 404 стоит 200,

вместо 404 стоит 301 —> 404,

вместо 404 стоят конструкции типа 302 —> 302 —> 301 —> 404.

Резюме: если страницы не сущест-вуют, сервер должен отдавать от-вет 404.

В этой главе мы разобрали основные сер-верные ответы и методы работы с ними. Используя эту информацию, вы можете избежать фатальных ошибок, приводя-щих к исключению страниц сайта из вы-дачи, созданию дополнительных дублика-тов и потере веса при переклейке страниц.

рекомендация: Для ручной проверки кода ответа используйте бесплатный плагин LiveHTTPHeaders для Firefox. С его помо-щью вы сможете отследить весь путь ре-директов и  узнать конечный код ответа каждой страницы сайта. Автоматизиро-ванная же проверка всех страниц на код ответа доступна в  анализе, проводимом программой «СайтРепорт.РФ».

В этой главе мы разобрали основные серверные ответы и методы работы с ними.

Используя эту информацию, вы можете избежать фатальных ошибок, приводящих к исключению страниц сайта из выдачи, созданию дополнитель‑ных дубликатов и потере веса при переклейке страниц.

Page 91: Л.Гроховский - Руководство по внутренним факторам

Консорциум всемирной па-утины (англ . World Wide Web Consortium, W3C) – организация,

разрабатывающая и  внедряющая техно-логические стандарты для Всемирной па-утины. Консорциум возглавляет сэр Ти-моти Джон Бернерс-Ли, автор множества разработок в  области информационных технологий.

W3C разрабатывает для Интернета единые принципы и стандарты (называемые реко-мендациями), которые затем внедряются производителями программ и оборудова-ния. Таким образом достигается совмести-мость между программными продукта-ми и аппаратурой различных компаний, что  делает Всемирную сеть более совер-шенной, универсальной и удобной.

Миссия W3C: «Полностью раскрыть потен-циал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети»4.

Так, существует ряд стандартов HTML-верстки. Эти стандарты носят рекомен-дательный характер, но, как  пишет пер-воисточник www.w3c.org, являются желательными. Что  это означает? Суще-ствуют теги, имеющие смысловое значе-ние: заголовки, визуальное выделение тек-ста и т. п. По стандартам W3C, выделенный

Глава 6Стандарты W3C

4По материалам Википедии

Page 92: Л.Гроховский - Руководство по внутренним факторам

90 Стандарты W3C

этими тегами текстовые элементы дол-жны иметь соответствующую смысло-вую нагрузку. Например, тег H1 должен содержать заголовок страницы, пото-му что  поисковая система воспринима-ет содержание тегов H1 именно как заго-ловок, то есть очень краткое содержание страницы.

К чему приводит игнорирование реко-мендаций W3C

Верстальщики часто игнорируют рекомен-дации W3C. Это понятно, ведь перед ними не стоит задача поискового продвижения: они получают деньги лишь за корректное отображение сайта в популярных браузе-рах на распространенных разрешениях мо-нитора. В свою очередь, браузеры стремят-ся обладать максимально универсальным алгоритмом распознавания HTML, чтобы сайты с ошибками верстки отображались корректно. В  результате верстальщики, например, используют теги H1 для  обо-значения элементов меню, настоящие за-головки выделяют тегами SPAN, создают пересечения тегов заголовков H1 с ссыл-ками A. Для верстки это неважно: бра узер отобразит текст в  виде заголовка, даже если текст будет оформлен тегом P, но че-рез CSS будут прописаны соответствующие параметры визуального отображения.

Поисковые системы разборчивее браузе-ров: они не пытаются определить, как ви-зуально отображается элемент страницы, а  руководствуются исключительно стан-дартами W3C. Так, найдя на странице H1, они воспринимают его содержимое имен-но как заголовок страницы. И вот тут возни-кает самое интересное: какая информация содержится на странице, если ее заголовок выглядит как «Каталог» или «11.10.2011»? Какие услуги продает сайт, какие товары представлены на этой странице? К сожале-нию, при такой верстке потенциал факто-ров HTML-тегов остается незадействован-ным для поискового продвижения.

Поисковые системы разборчивее браузе‑ров: они не пытаются определить, как визу‑

ально отображается элемент страницы, а руковод‑ствуются исключительно стандартами W3C.

Page 93: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 91

Чтобы вы смогли избежать ошибок, в этой главе мы разберем самые важные правила HTML-верстки, с  точки зрения стандартов W3C, а следовательно, с по-зиций SEO.

6.1. Правила HTML-разметки для SEO

Итак, поговорим об  основных тегах, важных для  SEO, опишем специфику их  использования и  подробно остано-вимся на  правилах компоновки тегов на  страницах сайта для  улучшения его ранжирования.

<TITLE>

Тег TITLE используется для  обозначения заголовка страницы. Это самый важный тег, он больше всех увеличивает вес стра-ницы по ключевым словам. Сделать в нем ошибки достаточно сложно, но некоторые рекомендации стоит учесть.

Каждая страница обязательно должна иметь уникальный заголовок, нельзя дуб-лировать заголовки TITLE между страни-цами сайта. Используйте ключевые сло-ва, но не повторяйте ключ более трех раз. Если повтора избежать не удается, вклю-чайте не менее трех разбавляющих слов между повторяющимися ключевыми словами.

Заголовок не обязательно должен быть со-ставлен грамотно с точки зрения русско-го языка, но он должен быть продающим, привлекательным и  содержательным. При  составлении заголовков рекоменду-ем проанализировать заголовки конку-рентов в топ-10 и составить собственные по их подобию.

<H1–H6>

Текстовые заголовки H1–H6 по значимо-сти следуют сразу за заголовком страницы TITLE. В этих заголовках важно употреб-лять ключевые слова.

Тег TITLE используется для обозначения заголовка страницы. Это самый важный тег,

он больше всех увеличивает вес страницы по ключевым словам. Сделать в нем ошибки достаточно сложно, но некоторые рекомендации стоит учесть.

Page 94: Л.Гроховский - Руководство по внутренним факторам

92 Стандарты W3C

На странице должен быть только один за-головок H1, количество подзаголовков H2–H6 не лимитировано, но не стоит де-лать их слишком много: вес ключевых слов распределяется по количеству заголовков на  странице. Теги H1–H6 имеют очень большой вес, но их можно использовать только для визуального выделения тексто-вых заголовков. При этом содержимое за-головка H1 не рекомендуется дублировать между страницами сайта.

Важно понимать, что навигационная стро-ка и элементы меню не являются заголов-ками страницы и  должны обозначаться иными тегами, в частности тегом выделе-ния ссылки A.

<B> и <STRONG>

Теги B и STRONG должны использовать-ся для визуального выделения текста жир-ным написанием. Визуально акцентируя ключевые части страницы, то есть обра-щение к посетителю, поисковые системы повышают вес страницы по запросам, со-держащимся в тегах STRONG и B, но толь-ко в том случае, если их содержимое кор-релирует с текстом страницы.

Важно, чтобы в этих тегах не содержалось мусора. Обозначайте ими ключевые слова и помните, что встречающиеся в этих тегах ключи нужно также употребить на стра-нице и без тегов, чтобы поисковая систе-ма не воспринимала это как спам. Не сто-ит злоупотреблять тегами, несколько их употреблений на  странице будет вполне достаточно.

Следует отметить, что  теги B и  STRONG (также как I и EM), несмотря на сходство визуального отображения, неидентичны. B – тег физической разметки, задающий жирное начертание текста. STRONG – тег логической разметки, определяющий важ-ность помеченного текста. Такое разделе-ние тегов на логическое и физическое фор-матирование изначально предназначалось

Важно понимать, что навигационная строка и элементы меню не являются заголовками

страницы и должны обозначаться иными тегами, в частности тегом выделения ссылки A.

Page 95: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 93

для того, чтобы сделать HTML универсаль-ным, в том числе не зависящим от устрой-ства вывода информации. Теоретически, если воспользоваться, например, рече-вым браузером, то  текст, оформленный с помощью тегов B и STRONG, будет отме-чен по-разному. Получилось так, что в по-пулярных браузерах результат использова-ния этих тегов равнозначен. Но для нужд SEO рекомендуется использовать выделе-ние «логическим» тегом STRONG.

<EM>

Тегом EM принято выделять курсивное написание на  странице: цитату, назва-ние или просто термин в тексте. Этот тег тоже повышает вес страницы по  ключе-вому слову, хотя по значимости уступает предыдущим.

<P>

Тег P обозначает текстовый абзац. Важно использовать его именно для выделения абзаца, а не каждого предложения, как это реализовано во многих CMS. Для разрыва строки можно использовать тег BR. Текст на странице лучше выделять с помощью тега абзаца P, чем  заменителей вроде SPAN: последний универсален и не имеет логической нагрузки.

рекомендации по использованию важ-ных для SEO тегов:

Грамотно используйте связки <H1>–<H6> и <P>

Заголовок H1 должен включать в себя ос-новные ключевые слова, содержащиеся на странице. Заголовками H2–H6 обозна-чаем начало абзаца. В них должны содер-жаться основные ключевые слова, характе-ризующие последующий абзац P. В абзацах P, написанных до следующего заголовка, важно употребить те  же ключевые сло-ва. Ключевые слова могут повторяться и в других абзацах, но в указанной области они должны иметь максимальную концен-трацию, в этом случае возникает синергия,

Тегом EM принято выделять курсивное написание на странице: цитату, название

или просто термин в тексте. Этот тег тоже повыша‑ет вес страницы по ключевому слову, хотя по значимости уступает предыдущим.

Page 96: Л.Гроховский - Руководство по внутренним факторам

94 Стандарты W3C

значительно увеличивающая вес страни-цы по ключевым словам.

Обозначение тегами должно быть об-основано в соответствии со стандартами W3C

Все перечисленные выше теги должны нес-ти указанный логический смысл. Напри-мер, H1-H6 следует использовать толь-ко для выделения логических заголовков, для визуального форматирования сущест-вует универсальный тег SPAN.

Теги не  должны пересекаться друг с другом

Теги, имеющие логический смысл, не дол-жны пересекаться друг с другом. Заголовок не должен быть ссылкой, выделение жир-ным не  должно пересекаться с  заголов-ком. Конструкции вида <H1><A>Заго-ловок 1< / A>< / H1> недопустимы. Если здесь важнее ссылка, нужно оставить толь-ко <A>< / A> с указанием настроек визу-ального отображения через CSS. Заголовок лучше дописать рядом, но для его выделе-ния оставить только тег <H1>< / H1>.

Теги не должны ставиться бессмысленно

Многие CMS, содержащие блок визуаль-ного редактирования контента, работают с  ошибками, порождая, например, кон-струкции вида <B>&nbsp;< / B>. Такие элементы в коде страницы недопустимы, и все подобные ошибки должны быть уда-лены, чтобы не размывать вес значимых тегов.

Теги не должны использоваться для об-мана поисковых систем

Недопустимо употребление тегов STRONG, имеющих визуальное отображение, иден-тичное с  текстом страницы. Выделение подобными тегами должно действитель-но менять визуальное отображение эле-мента и  отграничивать его от  окружаю-щего текста.

Теги должны закрываться

Многие CMS, содержащие блок визуального редактирования контента, работают

с ошибками, порождая, например, конструкции вида <B>&nbsp;< / B>. Такие элементы в коде страницы недопустимы, и все подобные ошибки должны быть удалены, чтобы не размывать вес значимых тегов.

Page 97: Л.Гроховский - Руководство по внутренним факторам

Стандарты W3C 95

Рекомендуется все страницы сайта прове-рять на  наличие ошибок верстки. Часто бывает так, что открывающий тег на стра-нице есть, а закрывающего нет. Подобные ошибки, как правило, визуально заметны при  заходе на  страницу, но  в  некоторых случаях посетителям они не видны, а поис-ковые системы при этом не могут коррект-но отранжировать содержимое страницы.

6.2. Проверка верстки на соответствие стандартам W3C

К счастью, вам не придется в поисках оши-бок вручную проверять HTML-код. Суще-ствует бесплатный сервис, определяющий его валидность. Сервис доступен по адре-су http://validator.w3.org / unicorn / , где для проверки валидности кода вам нужно просто ввести адрес сайта.

Должен заметить, что на 100 % валидных сайтов практически не  существует, ведь бессмысленно доводить код до  идеала. Выше мы разобрали самые важные фак-торы, которые и являются теми контроль-ными точками, которые вам нужно прове-рить через валидатор.

Не  смущайтесь, если найдете на  сайте ошибку тега <NOINDEX>: он не является валидным, поскольку по стандартам HTML его не существует. <NOINDEX> введен по-исковой системой Яндекс для того, чтобы облегчить жизнь себе и оптимизаторам.

Недопустимо употребление тегов STRONG, имеющих визуальное отображение,

идентичное с текстом страницы. Выделение подобными тегами должно действительно менять визуальное отображение элемента и отграничи‑вать его от окружающего текста.

Page 98: Л.Гроховский - Руководство по внутренним факторам

96 Стандарты W3C

Не смущайтесь, если найдете на сайте ошибку тега <NOINDEX>: он не является

валидным, поскольку по стандартам HTML его не существует. <NOINDEX> введен поисковой системой Яндекс для того, чтобы облегчить жизнь себе и оптимизаторам.

Page 99: Л.Гроховский - Руководство по внутренним факторам

яндекс.вебмастер (чему можно доверять, а чему нет)

ВЯндекс.Вебмастере можно найти коли‑чество страниц вашего сайта в индексе,

количество ссылок на ваш сайт и количество ссылающихся сайтов. Но можно ли доверять этим цифрам?Замечено, что от апдейта к апдейту показываемые веб‑масте‑ром числа могут изменяться в разы. Например, количество страниц в индексе прыгает от 50 тысяч до 10 тысяч и обратно.Такие скачки не соответствуют действительности и обращать внимание на них не нужно (если они не сопровождаются резкими изменениями трафика). Чтобы узнать реальное количество страниц вашего сайта в индексе, нужно проверить каждую из них вот таким запросом: url:site.ru / page / То же самое относится и к выгрузке всех внешних ссылок. Данные часто скачут и не отражают реальной картины, когда ссылок на сайт стоит десятки тысяч. Многие работающие ссылки могут не оказаться в выгрузке.Микроформаты

Микроформаты – это способ семантической разметки информации на веб‑страницах, использующий стандартные элементы языка HTML. Фактически мы сообщаем роботу, где и какие данные лежат в коде. В ряде случаев разметка страниц микроформатами может быть альтернативой прямой передаче данных через Яндекс.Вебмастер.Спецификации микроформатов можно найти здесь: http://microformats.org / На данный момент поисковики пока не заявляют о влиянии микроформатов на ранжирование. Однако, очевидно, что при их помощи вы можете сформировать более привлекательный сниппет. Более привлекательный сниппет –> больше CTR вашего сайта в выдаче. А CTR уже напрямую влияет на ранжирование.

ФАКт

Глава 7SEO-аналитика

Page 100: Л.Гроховский - Руководство по внутренним факторам

98 SEO‑аналитика

Эксперимент и наблюдение

Что такое наблюдение? Мы посмотрели на два сайта по запросу «пластиковые окна». У одного ТИЦ 40, он занимает первое место. У другого – 450, он на втором месте. Это наблюдение. Мы увидели некий факт.Можно ли из этого сделать вывод о том, что ТИЦ не влияет на ранжирование? Конечно же, нет. Ведь на ранжирование влияют сотни параметров и их комбинаций. И один сайт мог оказаться более релевантным за счет иных параметров.Когда оптимизатор просматривает топ, он делает много на‑блюдений. Заметив какой‑то повторяющийся факт, мы можем сформировать гипотезу (предположение).Пример гипотезы: «Частичное вхождение ключевика в URL страницы положительно влияет на релевантность».Что такое эксперимент? Это когда мы искусственно создали условия для проверки гипотезы, в которых максимально отсечены посторонние факторы.Пример эксперимента.Мы захотели проверить гипотезу «Keywords не влияет на ранжирование». Для этого зарегистрировали 10 доменов. На каждом из них разместили сайт из одной страницы с псев‑доуникальным контентом (одинаковый набор слов, объем текста и т. д.) В каждом из текстов есть уникальный ключевик, например, «сковородковед». На половине из них добавили его в meta keywords, на половине – нет. Добавили сайты в поиск, подождали пока все проиндексируются. И посмотрели выдачу по запросу «сковородковед». Если 5 сайтов с keywords оказа‑лись выше других – можно сделать вывод о подтверждении гипотезы. Если же сайты оказались перемешанными – гипоте‑за опровергнута.

Page 101: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 99

Методы управления семантическим ядром для крупных проектов

Крупные проекты обычно характеризуются большим семантическим ядром. Во мно‑

гих случаях недостаточно создать хорошее семантическое ядро, нужна его регулярная актуализация. Это связано с изменением спроса: популярность части запросов падает со временем, при этом появляется спрос, не нашедший отражения в ядре.Методология формирования обширного семантическо-го ядра:

1. Сбор запросов из всех доступных источников:a) статистика запросов к поисковым системам,b)  базы ключевых слов (база Пастухова, liveinternet

и аналогичные),c) выгрузки ключевых слов входа из систем веб‑аналитики,d)  оценка видимости конкурентов по запросам (semrush.com,

megaindex.ru и пр.).2. Уточнение региональной частотности, исключая подзапросы и морфологически измененные формы терминов, оценка сезонной популярности и ссылочного бюджета по запросам.3. Кластеризация собранных запросов.4. Формирование набора страниц приземления.5. Сопоставление запросов страницам приземления.Источники данных для актуализации ядра:

1. Динамика частотности запросов:

ФАКт

Page 102: Л.Гроховский - Руководство по внутренним факторам

100 SEO‑аналитика

a) статистика запросов к поисковым системам,b) semrush.com и аналогичные сервисы.2. Собственная аналитика (конкретика зависит от выбранных KPI), например:a) отбрасываем запросы с высоким соотношением [стоимость продвижения / полученный доход],b) автоматически проверяем частотность запросов и позиции по выгруженным из системы веб‑аналитики данным, выбирая эффективные запросы (в соответствии с выбранными KPI, например, с большим временем сессии, доходом или сущест‑венным числом просмотренных страниц).Исходя из статистики запросов к поисковым системам и данных веб‑аналитики несложно оценить трафик и доход от вывода конкретного запроса на определенную позицию в ТОПе. Таким образом, возможна эффективная приоритиза‑ция простым ранжированием запросов в порядке убывания потенциального дохода.Курица или яйцо?

Что вначале – сайт или семантическое ядро? Обычно сбор запросов выполняется после создания сайта. По сути, подбор запросов – эквивалент оценки спроса. Чем раньше собира‑ется семантическое ядро – тем меньше ненужной работы приходится выполнять. Из собранных и оцененных запросов логично формируются структура каталога и товарная номенклатура.Корректный эксперимент в seo – миф или реальность?

Многие оптимизаторы ставят эксперименты. Однако действи‑тельно достоверные выводы можно получить крайне редко. Основные причины неудач:• отсутствие четко сформулированной гипотезы,• некорректная постановка эксперимента,• некорректная обработка результатов.И если первая и последняя проблемы решаются довольно просто, то корректная постановка эксперимента требует суще‑ственных интеллектуальных и технологических затрат.Воспринимая поисковую систему как черный ящик, мы можем пытаться выявить некоторые закономерности, анализируя ответ в зависимости от варьируемых входных параметров. Проблема заключается в том, что на выдачу влияет огромное число факторов. По большому счету все, что нужно, – это провести несколько тестов, варьируя один параметр и удержи‑вая неизменными все прочие. Обилие влияющих факторов усложняет постановку чистого эксперимента, однако нужно стремиться к этому.Конечно, результаты даже корректно проведенного экспе‑римента нужно использовать осмысленно. Ранжирующая формула различна для различных типов запросов и регионов. Соответственно, найденные закономерности позволяют повлиять на ранжирование в диапазоне значений конкретного фактора. Иными словами, невозможно обеспечить хорошее

Исходя из статистики запросов к поисковым системам и данных веб‑аналитики

несложно оценить трафик и доход от вывода конкретного запроса на определенную позицию в ТОПе. Таким образом, возможна эффективная приоритизация простым ранжированием запросов в порядке убывания потенциального дохода.

Page 103: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 101

ранжирование документов по сколь‑нибудь конкурентным запросам, влияя лишь на часть факторов.Альтернативные методы генерации служебных частей документов на основе правиловых алгоритмов и стати-стики поисковых запросов

Для многих типов сайтов характерно наличие большого числа похожих документов (например, финальные страницы това‑ров в интернет‑магазинах или вакансии на сайтах о работе). Понятно, что наилучшим является title, написанный вручную хорошим копирайтером с учетом семантического ядра доку‑мента. Этот подход хорош, но трудозатратен. Более дешевый путь – формирование title, description и прочих служебных компонент документа на основе правиловых алгоритмов.Первый этап – сбор семантического ядра для однотипных документов. Не принципиально, используется ли автомат или ручной труд, главное – максимальная полнота ядра.Далее в этом корпусе необходимо выделить самые частотные термины и конструкции запросов.Собственно, третий шаг – написание правил. Если структура запросов примерно одинакова для всего их набора, достаточно универсального правила, кодирующего title и description. Если структура запросов различна в различных тематиках – по‑требуется несколько правил. Правила также нужны, если есть желание разнообразить title и description даже для сходных документов.В этой задаче, равно как и в задаче автоматизированной перелинковки, может потребоваться случайное, но не‑изменное во времени распределение. Для этого отлично подходит генератор случайных чисел, инициализируемый какой‑либо константой, специфичной для документа. Самый простой вариант – URL. URL обычно не меняются и уникальны по определению.BrowseRank – технология учета поведения пользовате-лей для ранжирования документов

Одна из технологий учета поведения пользователей при ран‑жировании документов в выдаче поисковых систем – техно‑логия BrowseRank от Microsoft (https://research.microsoft.com / en‑us / people / tyliu / fp032‑liu.pdf).Граф кликов вместо ссылочного графа

Основное отличие BrowseRank от PageRank – структура графа. В технологии PageRank узлами графа являются документы,

Для многих типов сайтов характерно наличие большого числа похожих докумен‑

тов (например, финальные страницы товаров в интернет‑магазинах или вакансии на сайтах о работе). Понятно, что наилучшим является title, написанный вручную хорошим копирайтером с учетом семантического ядра документа. Этот подход хорош, но трудозатратен. Более дешевый путь – формирование title, description и прочих служебных компонент документа на основе правиловых алгоритмов.

Page 104: Л.Гроховский - Руководство по внутренним факторам

102 SEO‑аналитика

а ребрами – ссылки. В технологии BrowseRank ребра образуют не ссылки, но клики (переходы). Помимо этого, сохраняется метаинформация о продолжительности сессии в рамках документа.очевидны два существенных преимущества BrowseRank:

• существенно лучшая устойчивость к ссылочному спаму,• учет продолжительности сессии позволяет оценить полез‑

ность документа для посетителя.Поведенческий граф более достоверно отражает процесс веб‑серфинга, а, следовательно, он более полезен для расчета значимости документов. Наибольшее число посещений стра‑ницы и более продолжительное время, проведенное на ней, означают большую важность страницы.основной источник данных о поведении пользовате-лей – браузерные бары. Все ведущие поисковые системы имеют плагины, обеспечивающие мониторинг активности значительной доли аудитории. Для обработки данных о поведении пользователей предложено использовать цепи Маркова с непрерывным временем. Экспериментальные данные демонстрируют преимущество алгоритма BrowseRank по сравнению с алгоритмами PageRank и TrustRank в определе‑нии важности документов, борьбе со спамом и ранжировании.По сути, собираемые данные можно представить записью вида URL; TIME; TYPE [input | click]. Предполагается два пути пе‑рехода на документ: по ссылке с другого документа (click), либо набором URL в адресной строке браузера (input). Механизм извлечения данных о переходах:1. Сегментация сессии.

Новая сессия инициируется в случае 30‑минутной и более паузы с момента предыдущей активности, либо в случае ввода названия сайта в адресную строку.2. Формирование пар URL.

В рамках каждой сессии создаются пары URL из соседних записей. Пара URL означает, что переход был осуществлен при помощи ссылки.3. Формирование начального распределения.

В каждой сессии, сегментированной по типу перехода, первый URL введен непосредственно пользователем. Такие URL мы счи‑таем «доверительными» и называем этот трафик «зеленым». Обрабатывая данные о поведении пользователей, мы считаем переходы на эти URL следствием случайного распределения. Нормализация на частоту посещения этих документов дает начальные вероятности посещения соответствующих страниц.4. Извлечение продолжительности сессии.

Для каждой пары URL продолжительность сессии первого URL вычисляется простой разностью дат. Если URL был последним в сессии, возможны два варианта. Для сессий, сегментирован‑ных по времени, продолжительность просмотра последнего URL рассчитывается на основании данных о просмотрах других страниц. Для сессий, сегментированных по типу, время

Основной источник данных о поведении пользователей – браузерные бары. Все

ведущие поисковые системы имеют плагины, обеспечивающие мониторинг активности значительной доли аудитории. Для обработки данных о поведении пользователей предложено использовать цепи Маркова с непрерывным временем. Экспериментальные данные демон‑стрируют преимущество алгоритма BrowseRank по сравнению с алгоритмами PageRank и TrustRank в определении важности документов, борьбе со спамом и ранжировании.

Page 105: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 103

просмотра последнего URL рассчитывается исходя из времени начала следующей сессии.Результаты применения BrowseRank

Microsoft провела два исследования. Первый был сделан на уровне сайта для выявления важных сайтов и подавления спама. Второй эксперимент – на уровне документа для тести‑рования BrowseRank с целью улучшения ранжирования.

Для первого эксперимента использовался набор данных из примерно 3 миллиардов записей, содержащий примерно 950 миллионов уникальных URL. Любопытно, что распределе‑ние количества просмотров по времени отлично описывается классической экспонентой. В рамках этого эксперимента по‑страничные данные не использовались, они были агрегирова‑ны на уровне сайтов. Полученный поведенческий граф состоял из 5,6 миллиона узлов и 53 миллионов ребер.Любопытна выборка топ‑20 сайтов, полученных ранжиро‑ванием по трем разным алгоритмам. BrowseRank отлично отранжировал MySpace, Youtube, Facebook и прочие сайты, для которых характерно большое время сессии. На случайной выборке в 10 тысяч сайтов, вручную размеченной асессора‑ми, показано, что BrowserRank эффективнее, чем TrustRank и PageRank, решает задачу фильтрации спам‑сайтов.Второй эксперимент не менее интересен.Факторы ранжирования документов можно грубо разделить на две группы: факторы релевантности и факторы важности. Предполагаем итоговую функцию релевантности линейной комбинацией этих двух групп факторов:Θ * rankrelevance + (1‑Θ) * rankimportance,где Θ лежит в интервале [0;1].

Любопытна выборка топ‑20 сайтов, полученных ранжированием по трем

разным алгоритмам. BrowseRank отлично отранжировал MySpace, Youtube, Facebook и прочие сайты, для которых характерно большое время сессии. На случайной выборке в 10 тысяч сайтов, вручную размеченной асессорами, показано, что BrowserRank эффективнее, чем TrustRank и PageRank, решает задачу фильтрации спам‑сайтов.

Page 106: Л.Гроховский - Руководство по внутренним факторам

104 SEO‑аналитика

Данные взяты на выборке из сайтов, полученных для 8 000 запросов. Каждая пара запрос‑документ оцени‑валась тремя асессорами по бинарной шкале [релевантно; нерелевантно]. Релевантными сочтены документы, полу‑чившие по запросу не менее 2 оценок «релевантно».

Результат: алгоритм BrowseRank обеспечивает существенно лучшее качество вплоть до полного подавления факторов важности факторами релевантности (Θ ~ 0,9).

текстовый спам глазами поиска и современные метрики качества текстов

Точного определения поискового спама нет, есть лишь общая формулировка.

Поисковый спам – это попытки обмана поисковой системы и манипулирования ее результатами с целью завышения позиции сайтов (страниц) в результатах поиска. Сайты, использующие поисковый спам, могут быть понижены при ранжировании или исключены из поиска Яндекса из‑за невозможности их корректного ранжирования.

http://company.yandex.ru / legal / termsofuse

Понятно, что точные критерии спама поисковые системы не озвучивают, поскольку это неминуемо спровоцирует генерацию околоспамовых текстов оптимизаторов и веб‑мастерами. Между тем в арсенале поисковых систем большое количество разнообразных методов определения спама. Рассмотрим некоторые из них.

Общеизвестно, что включение термина в title улучшает ранжирование документа по этому запросу поисковы‑ми системами. Это обуславливает традиционный спам в title, поскольку оптимизаторы пытаются употребить максимальное число терминов в заголовке документа. Исследователи из Microsoft обнаружили (http://research.microsoft.com / pubs / 65140 / www2006.pdf ), что вероятность спамовости документа резко возрастает при длине title более 25 слов:

Распределение по средней длине слова также неплохо выявляет спам. Тексты, содержащие много коротких или длинных слов, неестественны и, вероятно, спамны:

Поисковый спам – это попытки обмана поисковой системы и манипулирования ее

результатами с целью завышения позиции сайтов (страниц) в результатах поиска. Сайты, использую‑щие поисковый спам, могут быть понижены при ранжировании или исключены из поиска Яндекса из‑за невозможности их корректного ранжирования.

Page 107: Л.Гроховский - Руководство по внутренним факторам

SEO‑аналитика 105

Весьма оригинальный и дешевый метод обнаружения спама – оценка сжимаемости текста. Для спамовых документов, содержащих множество повторений терминов, характерна высокая сжимаемость:

Интересна техника определения спамовости по доле самых частых терминов корпуса в тексте. Видно, что в спамовых текстах доля частых слов ниже, а доля редких слов – выше, чем в естественных текстах:

Примечательна публикация разработчиков Яндекса (http://download.yandex.ru / company / A_Kustarev_A_Raigorodsky_poisk_neestestvennih_textov_statia.pdf),

Общеизвестно, что включение термина в title улучшает ранжирование документа

по этому запросу поисковыми системами. Это обуславливает традиционный спам в title, поскольку оптимизаторы пытаются употребить максимальное число терминов в заголовке документа.

Page 108: Л.Гроховский - Руководство по внутренним факторам

106 SEO‑аналитика

в которой оценивалась частота встречаемости пар терминов в естественных и синонимизированных текстах. Показательно, что спамовые документы содержат большее количество редких пар и меньшее количество частых пар, чем естествен‑ные документы.Существует множество методов выявления текстового спама. Главная идея очевидна – использование традиционных оп‑тимизаторских метрик («плотность ключевого слова», «длина текста» и пр.) давно потеряло актуальность.В современных условиях намного продуктивнее писать хорошие тексты, разносторонне описывающие продукт. Важны стилистика и потребительская ценность текста. Соответствен‑но, самая честная метрика качества текста – отношение пользователей (продолжительность сессии, степень конверсии и пр.). Действительно, если качество навигации или юзаби‑лити сайта принято оценивать по поведению пользователей, почему качество текстов нужно оценивать иначе?

РеЗюМе: Бессмысленно делать нечто исключительно для поисковых систем, как ни банально звучит этот тезис. У поисковых систем достаточно ресурсов для подавления спамерских активностей.

В современных условиях намного продук‑тивнее писать хорошие тексты, разносто‑

ронне описывающие продукт. Важны стилистика и потребительская ценность текста. Соответствен‑но, самая честная метрика качества текста – отно‑шение пользователей (продолжительность сессии, степень конверсии и пр.).

Page 109: Л.Гроховский - Руководство по внутренним факторам

Глава 8Исследование «SEO-альманах 2010»

в конце 2010  года было проведено масштабное исследование факто-ров ранжирования, целью кото-

рого стала оценка значимости этих фак-торов. Подобные исследования наши зарубежные коллеги проводят с периодич-ностью раз в два года, публикуя результаты на seomoz.com. В российском проекте при-няли участие признанные эксперты рын-ка, руководители топовых компаний, спе-циалисты, успешно продвигающие сайты в самых конкурентных тематиках, разра-ботчики программ и сервисов, которыми пользуется весь рынок.

В экспертный совет вошли:

1. Анар Бабаев (Click.ru)2. Александр Баженов (Biplane)3. Василий Ткачев (All in Top)4. Леонид Гроховский (ArrowMedia)5. Николай Хиврин (ALTWeb Group)6. Елизавета Трибунская (Web Advance)7. Сергей Кошкин (SmartSEO)8. Евгений Смирнов (Viaset.ru)9. Роман Клевцов (Optimism.ru)10. Сергей Карпович (Apexes)11. Дмитрий Жохов (UnMedia)12. Алексей Довжиков (eLama)13. Тимофей Квачев (TRINET)14. Валентин Домбровский (NextUpMedia)15. Константин Леонович (Sape.ru)16. Алексей Жуков (Новотех)17. Антон Агапов (WebExpert)

Page 110: Л.Гроховский - Руководство по внутренним факторам

108 Исследование «SEO‑альманах 2010»

18. Иван Севостьянов (ВебПроекты)19. Олег Сковородников (VIPRO)20. Виктор Нагайцев (PerfectSeo)21. Денис Юрасов (Медведев Маркетинг)22. Михаил Райцин (Корпорации РБС)23. Василий Сорокин (Techart)24. Александр Люстик (MyOnlineStudio)25. Станислав Поломарь (web-it.ru)26. Алексей Елфимов (i-Media)

Исследование «SEO-альманах 2010» про-водилось с  помощью голосования. Все факторы были распределены по группам, и каждый из них оценивался по критерию влияния на ранжирование. Конечная оцен-ка определялась на основании голосов экс-пертов. Рассматривалось более 200 факто-ров ранжирования: внутренние, внешние, поведенческие, наиболее распространен-ные их связки, а также факторы, связанные с ранжированием картинок и определени-ем аффилиатов.

Методология исследования выстраива-лась на  анкетировании. Каждый из  экс-пертов оценивал факторы по  степени их значимости:

0 – не влияет вообще,

1 – влияет незначительно,

2 – стоит учитывать,

3 – сильно влияет,

4 – важнейший фактор.

Оценки каждого фактора суммировались, после чего было подсчитано процентное соотношение значимости каждого факто-ра от значимости того, который имеет са-мый высокий рейтинг в группе. Факторы объединялись в группы по признаку воз-действия: внешние факторы, внутренние, поведенческие, аффилированность, про-движение по картинкам.

Все факторы были отсортированы по сте-пени важности и отображены в процент-ных долях. Отрицательные получили от-рицательное значение.

Исследование «SEO‑альманах 2010» проводилось с помощью голосования. Все

факторы были распределены по группам, и каждый из них оценивался по критерию влияния на ранжирование. Конечная оценка определялась на основании голосов экспертов. Рассматривалось более 200 факторов ранжирования: внутренние, внешние, поведенческие, наиболее распростра‑ненные их связки, а также факторы, связанные с ранжированием картинок и определением аффилиатов.

Page 111: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 109

Итоги исследования стоит воспринимать следующим образом:

0–20 % означают, что фактор не влия-ет на продвижение,

20–40 %  – влияние фактора незначи-тельно,

40–60 %  – фактор важно учитывать при продвижении,

60–80 % – фактор значительно влияет на продвижение,

80–100 %  – фактор нужно учитывать обязательно.

Результаты исследования с  комментари-ями экспертов были опубликованы по ад-ресу http://топэксперт.рф и сразу получи-ли широкий резонанс: за  первую неделю после анонсирования только на  офици-альном сайте исследования побывало 10  тысяч человек. В  Интернете зафикси-ровано более 100 публикаций, в том чис-ле в  крупнейших отраслевых СМИ, та-ких как  seonews.ru, searchengines.ru, webmasters.ru, advertology.ru и других, так-же написаны статьи в нескольких отрасле-вых журналах, результаты исследования освещались на конференциях и семинарах.

Влияние HTML-тегов на вес ключевого слова для страницы

TITLE 100%

H1-H6 71%

STRONG 34%

Description 31%

B 27%

EM 25%

P 24%

Keywords 24%

UL –> LI & OL –> LI 13%

Page 112: Л.Гроховский - Руководство по внутренним факторам

110 Исследование «SEO‑альманах 2010»

Влияние HTML-тегов на вес ключевого слова для страницы

Ключевое слово в H1-H6 & ключевое слово в P 54%

Ключевое слово в STRONG, B, EM & ключевое слово на странице 34%

Ключевое слово в KEYWORDS и ключевое слово на странице 27%

Последовательное употребление заголовков 24%

Пересечение тегов STRONG, B, EM & A href=… –8%

Пересечение тегов H1-H6 A href=… –9%

Повтор заголовков H1, H1, H1 –15%

Пересечение тегов H1-H6 & STRONG, B, EM –25%

Содержание заголовков H1-H6, TITLE

Прямое вхождение ключевого слова в заголовке 84%

Уникальность заголовка в отношении ко всем страницам сайта 48%

Близость заголовка (H1-H6) к началу документа 47%

Близость ключевого слова к началу заголовка 43%

Длина заголовка 36%

Грамматически правильное содержание заголовка 35%

Уникальность заголовка в отношении ко всем сайтам в индексе 33%

Разбавление заголовка неключевыми словами 18%

Page 113: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 111

Содержание элементов абзаца STRONG, EM, B

Прямое вхождение ключевого слова 37%

Разбавление элемента неключевыми словами 19%

Ранжирование по ключевым словам

Наличие прямого вхождения ключевого слова в тексте страницы 94%

Словоформа ключевого слова с сохранением части речи 66%

Наличие как прямого вхождения ключа, так и его словоформы 65%

Словоформа ключевого слова с изменением части речи 40%

Соответствие регистра ключевого слова 28%

Удаление частей составного словосочетания друг от друга –77%

Текст страницы

% уникального контента по отношению ко всему индексу 82%

% уникального контента по отношению ко всему сайту 76%

Разнообразное оформление текста 47%

Близость ключевых слов к началу страницы 45%

Соответствие объема текста на странице сайтам конкурентов 40%

Выделение абзаца текста в тег <P> 30%

Наличие контента на иностранном языке 5%

Высокая плотность ключевых слов на странице –5%

Концентрация повторений ключевого слова в одной точке –22%

Визуальное уравнивание разметки текста с обычным текстом –35%

Ошибки кодировки –52%

Видимость контента (речь о таких эффектах, как display:none) –57%

Page 114: Л.Гроховский - Руководство по внутренним факторам

112 Исследование «SEO‑альманах 2010»

Сервер

301 редирект при постоянном изменении адреса страницы 67%

Отсутствие на сайте значительного количества 404 ошибок 64%

Использование 404 кода ответа для 404 страниц 63%

Высокий аптайм сервера 63%

Высокая скорость загрузки документа 57%

Время отклика 53%

1-шаговая конструкция редиректорв 40%

302 редиректа при временном изменении адреса страницы 30%

Географическая зона сервера 27%

URL

Наличие ключевого слова в имени домена 83%

Наличие ключевого слова на транслите в адресе страницы 71%

Наличие ключевого слова в названии категории 61%

Наличие ключевого слова в названии документа 59%

Наличие ключевого слова на английском в адресе страницы 49%

ЧПУ 48%

Наличие словоформы ключевого слова в адресе страницы 45%

Наличие части ключевого слова в адресе страницы 37%

Большая глубина вложенности категории с документом –7%

Page 115: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 113

Возрастные факторы

Возраст индексации 83%

Динамика появления уникального контента на сайте 59%

Возраст домена 55%

Возраст URL-страницы 55%

Динамика появления контента на сайте 51%

Возраст контента на странице 46%

Влияние картинок на ранжирование

Ключевое слово в ALT картинки 47%

Ключевое слово в названии картинки 43%

Ключевое слово в TITLE картинки 36%

Географическое расположение

Указание регионов в Яндекс.Каталоге 95%

Наличие адресов и телефонов региональных филиалов на сайте 87%

Географическая близость офиса к продвигаемому региону 77%

Упоминание региональных центров в тексте страниц 64%

Перелинковка

Ограничение количества исходящих и внутренних ссылок 66%

Закрывать от индексации исходящие внешние ссылки 53%

Использование сквозных ссылок для внутренней перелинковки 18%

Страница ссылается на другую несколько раз –2%

Страница ссылается на себя –6 %

Page 116: Л.Гроховский - Руководство по внутренним факторам

114 Исследование «SEO‑альманах 2010»

CMS

Использование бесплатных общедоступных CMS –25%

Использование стандартных шаблонов –38%

Карта сайта

Наличие карты сайта 58%

Актуальность карты сайта 54%

Наличие страницы в карте сайта 48%

Указание приоритета индексации страниц в карте сайта 40%

Взаимодействие с Яндексом

Наличие сайта в Яндекс.Вебмастер 23%

Факт выгрузки обратных ссылок –12%

Факт ранее наложенных санкций –54%

Page 117: Л.Гроховский - Руководство по внутренним факторам

Исследование «SEO‑альманах 2010» 115

Сергей Панков, технический директор, Rookee

Преамбула

Прежде всего, стоит отметить то титани‑ческое трудолюбие и скрупулезность,

которые помогли автору в проведении исследования о факторах ранжирования. Совершенно искренне выражаем благодарность автору, его бесконечно‑му профессионализму и желанию сделать рынок 2.0 более цивилизованным. Надеемся, что Леонид и дальше будет радовать сообщество качественными и своевременными исследованиями.Предостережение

Материалы исследования послужат хорошей теоретической базой для новичков и seo‑энтузиастов, желающих повысить качество своего сайта и добиться новых высот в поисковой выдаче.Представленное исследование – это не кнопка «в топ» и даже не рецепт долголетия и счастья. Это скорее набор критериев, по которым можно определить качество отдельно взятой стра‑ницы веб‑сайта, оценить ее привлекательность с точки зрения поискового робота, который ищет наиболее релевантный ответ на вопрос пользователя.Что мы об этом думаем

Исследование еще раз подтвердило высокую точность той ин‑формации, что была получена в результате наших внутренних экспериментов. Знания об этих факторах заложены в основу алгоритмов наших сервисов:• технический аудит,• текстовой анализ страницы,• анализ конкурентов топ‑10.Однако стоит отметить, что в среде seo‑профессионалов сильны различные мифы. Одна неосторожная статья от Дэна Расковалова о его путешествии на Бали может породить с десяток предположений и теорий, которые будут дотошно анализироваться гуру всех мастей.Например, значимость следующих факторов мы ставим под сомнение:1. Прямое вхождение ключевого слова куда бы то ни было.2. Разнообразное оформление текста.3. Соответствие объема текста на странице сайтам конкурентов.4. Закрытие от индексации исходящих внешних ссылок.5. Факторы, связанные с CMS.Ценность блока критериев под названием «текст ссылки» ставится под большое сомнение. Все мы читали знаменитый мадридский доклад Яндекса за 2009 год. После него практиче‑ски бессмысленно рассуждать на тему, что лучше – «вечная»

МненИе Представленное исследование – это не кнопка «в топ» и даже не рецепт

долголетия и счастья. Это скорее набор критериев, по которым можно определить качество отдельно взятой страницы веб‑сайта, оценить ее привлека‑тельность с точки зрения поискового робота, который ищет наиболее релевантный ответ на вопрос пользователя.

Page 118: Л.Гроховский - Руководство по внутренним факторам

116 Исследование «SEO‑альманах 2010»

ссылка или «биржевая», «прямое вхождение или со словофор‑мами» и т. д.Следует отметить, что за пределами исследования остались вопросы, ответы на которые хотелось бы получить в будущем:1. Верстка.2. Поведенческие факторы.3. Соответствие тематики донора и акцептора.4. «Трафиконосность» ссылок с доноров.Конечно, наши возражения не умаляют всех достоинств проделанной работы. На то и нужны исследования, чтобы привлечь внимание к каким‑то важным вопросам и заставить нас самостоятельно искать ответы на поставленные вопросы.выводы

Безусловно, Интернет меняется. И то, что было актуально вчера, сегодня уже не работает. Остается пожелать одно: анализируйте и делайте выводы, остальное – дело техники.

Безусловно, Интернет меняется. И то, что было актуально вчера, сегодня уже

не работает. Остается пожелать одно: анализируйте и делайте выводы, остальное – дело техники.

Page 119: Л.Гроховский - Руководство по внутренним факторам

Полный курс SEO от «топЭксперт.РФ» (130 часов)

Хочу представить вам самый полный учебный курс по SEO. После прохо-ждения этого курса вы сможете само-стоятельно заниматься продвижением сайтов. Продолжительность курса – 130 часов, это 62 часа занятий в ауди-тории +40 часов практики в течение месяца +20 часов консультаций на веби-нарах. Программа корректируется и до-рабатывается совместно с признанными экспертами в области поискового про-движения. По окончании курса прово-дится сертификация, результаты которой передаются HR-специалистам ведущих SEO-компаний.

авторы и преподаватели курса:

Леонид Гроховский, директор по тех-нологии продвижения и автоматизации, «Оптимизм.ру»,

Станислав Поломарь, руководитель на-правления продвижения сайтов, Web-IT,

Алексей Чекушин, руководитель депар-тамента SEO, Wikimart.ru,

Михаил Сливинский, ведущий анали-тик, Wikimart.ru,

Станислав Ставский, ex. аналитик веб-поиска Яндекса.

Для кого этот курс:

Для начинающих SEO-специалистов, которые хотят получить прочные базо-вые знания.

Для продвинутых SEO-специалистов, которые хотят разобраться в информаци-онном поиске.

Для студентов, которые хотят полу-чить высокооплачиваемую и интересную работу.

Для оптимизаторов, которые за не-сколько лет все забыли и хотят обновить актуальность своих знаний.

Для интернет-маркетологов, которые хотят очень глубоко погрузиться в SEO.

Дни проведения:

Блок 1. Информационный поиск

• 21 января 11.00–20.00

• 22 октября 11.00–20.00

Блок 2. Поисковое продвижение

• 28 января 11.00–20.00

• 29 января 11.00–20.00

• 4 февраля 11.00–20.00

• 5 февраля 11.00–20.00

Блок 3. Аналитика

• 11 февраля 11.00–20.00

• 12 февраля 11.00–15.00

Экзамен: 19 февраля 11.00–20.00

Формат обучения:

• Очное обучение – проходит в Москве в учебной аудитории

• Заочное обучение – посредством веби-нар-трансляции на площадке COMDI

Семинары и курсы

Page 120: Л.Гроховский - Руководство по внутренним факторам

118 Семинары и курсы

• Всем слушателям на время обучения и в течение 2 месяцев после экзаменов предоставляется доступ к записям за-нятий на COMDI.ru

Уникальность курса:

Программа составлена людьми, имею-щими большой опыт руководства и об-учения сотрудников в SEO-компаниях, а значит, и вас учить будут тому, что дей-ствительно применимо и необходимо.

Программа является коллективным трудом, а не частным мнением, а значит, нам удастся избежать субъективности.

По итогам курса проводится сертифи-кация, резюме успешных студентов пере-даются в HR-службы многих SEO-компа-ний, что гарантирует их трудоустройство.

Это самый полный, профессиональный и практичный курс по SEO.

И самое главное – в течение всего кур-са вы будете получать задания в форма-те реальной стажировки, а саппорт будет помогать вам в трудных ситуациях.

Предварительная программа аудиторных лекций учебного курса SEOБлок 1. Информационный поиск

HTTP-протокол

• (GET)

• Понятие о протоколе

• Структура протокола

• Коды состояния

• IP, Прокси

• Заголовки

• Основные механизмы протокола

• DNS, работа хостинга

• Языки и кодировки

Как устроены поисковые системы

• Поисковый робот-индексатор

Скорость индексации

Краулинговый бюджет

Частота индексации

• Типы ботов (быстробот, блоги и т. п.) из описания веб-мастера Яндекса

• Инвертированный индекс

• Ранжирование

• Результаты поиска (SERP)

• Кластеризация

Идеология поисковых систем

• Качество поиска

Релевантность

Свежесть

Полнота индекса

Разнообразие результатов поиска

Антиспам (в т. ч. про цепи Маркова и дорвеи)

Сниппеты

Производительность

Вертикальный поиск

• Важнейшие ценности

• Способы монетизации

• Взаимодействие с пользователями

• Конкуренция

• Ответственность

• Нарушения и санкции

введение в информационный поиск

• Булев поиск

• Лексикон и списки словопозиций

• Словари и нечеткий поиск

• Построение индекса

• Ранжирование, взвешивание терминов и модель векторного пространства

• Ранжирование в полнофункциональ-ной поисковой системе

Page 121: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 119

Вертикальный поиск

• Оценка качества поиска

• Расширение запроса, переформулировки

• Машинное обучение

• Языковые модели для информационно-го поиска

Стемминг

Морфология

Лемматизация

• Кластеризация

Поисковые технологии

• IDF TF

• BM 25

• PageRank

• HITS

• ClickRank

• BrowseRank

• SpamRank

обработка информации

• Алгоритм шинглов

• Разбиение текста на пассажи

типы запросов с точки зрения поиско-вых систем

• Типы классификации

• По бродеру

• Количество

• Коммерческие и некоммерческие

Блок 2. Поисковое продвижение

теория

• SEO-факторы

Текстовые

– Плотность ключевых слов

– Зоны документа (TITLE, H1 и т. д.)

– Фильтрации и антиспам

• Ссылки

Внутренние ссылки

Внешние ссылки

Ссылочное ранжирование

– Статическое (PR, ТИЦ)

– Динамическое (анкорное)

• Host-факторы

Возраст

Key в URL, в домене

Видимость

• Поведенческие факторы

Поведение в серпе

Поведение на сайте

– Время просмотра

– Количество страниц

– Источники трафика

– Переходы по ссылкам

• Социальные факторы

• Региональность

Практика

внутренние факторы

• Перелинковка

Базовые схемы перелинковки

– Комплексное продвижение всего сайта

– Продвижение главной страницы под ВЧ

– Продвижение разделов под СЧ

– Продвижение внутренних страниц под НЧ

Локальные схемы перелинковки

– Кольцо

– Куб

– Звезда

Правила перелинковки

Page 122: Л.Гроховский - Руководство по внутренним факторам

120 Семинары и курсы

Способы перелинковки

Составление текста ссылки для перелинковки

Создание модулей для автомати-зации перелинковки (начальный уровень)

– Портал

– Интернет-магазин

– Корпоративный сайт

– Каталог

• Устранение дубликатов

Чем вредны дубликаты

Классификация дубликатов

Устранение дубликатов на примерах

Способы устранения дубликатов

• Инструкции для поисковых систем

Зачем нужен robots.txt?

Robots.txt – универсальные директивы

Robots.txt – директивы для Яндекса

Правила составления robots.txt

Разбор robots.txt на примерах

Зачем нужен sitemap.xml

Директивы sitemap.xml

Правила составления sitemap.xml

Пример sitemap.xml

Принцип взаимодействия sitemap.xml и robots.txt

Автоматизация добавления страниц в sitemap.xml

Зеркала сайтов, переклейка

Данные Яндекс.Вебмастер

Данные Google.Вебмастер

• Уникальность контента

Как защитить контент от воровства?

Как воровать контент?

Отсутствие и недостаток контента

Автоматизация генерации контента

– Автоматизация генерации описа-ний товаров

– Автоматизация генерации техниче-ских характеристик (уровень 1)

– Автоматизация генерации техниче-ских характеристик (уровень 2)

– Автоматизация наполнения Description, Keywords, TITLE

– Обнаружение дубликатов

– Инструкция по обнаружению дуб-ликатов вручную

– Способы автоматизации обнаруже-ния дубликатов

• Коды ответов сервера

Код ответа 20*

Коды ответов 301 / 302 / 303 / 307 / 3**

Код ответа 40*

Код ответа 50*

• Стандарты W3C

Правила HTML-разметки для SEO

Проверка верстки на соответствие стандартам W3C

• Подготовка ТЗ на доработку сайта

• Типичные ошибки, допускаемые при работе с внутренними факторами

• Типичные ошибки разработки сайтов

• Типичные ошибки юзабилити

• Типичные ошибки копирайтеров

Подробно про внешние факторы

• Все источники привлечения внешних ссылок, оценка эффективности и эко-номическая целесообразность. Сравни-тельная таблица

Обычные покупные ссылки

Ссылки в виде контекстных объявлений

Page 123: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 121

Статьи

Пресс-релизы и посты в блогах

Социальные сети

Форумы

Естественные ссылки

• Возможности автоматизации

• Продвижение молодых сайтов и сай-ты с историей: отличия в работе со ссылками

• Продвижение крупных сайтов: особен-ности в работе со ссылками

• Если по ссылке кликают – она работает лучше. Миф или реальность?

• Критерии выбора ссылок: на что на са-мом деле стоит обращать внимание

Оценка эффективности ссылок через Яндекс.Метрика

По каким критериям отбирать площадки

ТИЦ, тематичность, количество вне-шних – что в действительности важ-но сейчас

• Альтернативные источники внешних ссылок

Веб-PR

– Бриф для клиента

– Подбор площадок для публикации

– Пресс-релизы, статьи, интервью, отзывы

– Заказ статей

– Примеры успешных PR-стратегий для SEO

SMM

– Возможности получения ссылок из социальных сетей

– Критерии оценки качества блогов

– Ссылки из Twitter и Facebook для SEO

– Примеры успешного применения

SMO

– Возможности SMO

– Создание ценности для посетителей

– Рейтинг

– Акции

– Закрытый клуб

– Предложение о репосте

– Примеры успешного применения

Инструментарий

– Аналитика – «СайтРепорт.РФ»

– Подбор запросов – KeyCollector

– Биржа ссылок – Sape.ru

– Биржа ссылок – PR.sape.ru

– Биржа ссылок – Blogun.ru

– Биржа ссылок – GoGetLinks.net

– Биржа ссылок – MiraLinks.ru

– Агрегатор – Rookee

– Агрегатор – MegaIndex

– Плагин для браузера – NetPromoterBar

– Анализ ссылок – Solomono.ru

– Анализ ссылок – DriveLink

Составление ссылочной стратегии

– Обычные ссылки

– PR-ссылки

– Ссылки без анкоров

– Мертвые ссылки

– Ссылки с социальных сетей

Размещение ссылок

Проверка ссылок

Подробно о поведенческих факторах

• Теория: развитие поведенческих метрик

• 3 группы поведенческих факторов

Page 124: Л.Гроховский - Руководство по внутренним факторам

122 Семинары и курсы

переходы по ссылкам

результаты поиска

поведение на сайте

• Где покупать естественные ссылки

• Связки поведенческих факторов: как это работает

• Исследование пользователей: какими данными располагает Яндекс

• 3 способа накрутки поведенческих факторов

имитация живых пользователей: со-здание «живых» ботов

ботнет

биржа

• Мифы и заблуждения о поведенческих факторах

• Отличия ПФ для разных тематик

• Возможности Яндекс.Метрики: демон-страция функционала

Составление семантического ядра

• Запрос выгрузки структуры сайта

• Подбор запросов

• Проверка запросов

• Группировка запросов

• Формирование новой структуры сайта

аудит

• Изучение сайта

• Классификация типов страниц

• Классификация разделов сайта

• Изучение <HTML> шаблонов по типам страниц

• ТЗ по <HTML> доработке страниц

• Изучение данных Яндекс.Вебмастер

• Изучение данных Google.Вебмастер

• Изучение данных Яндекс.Метрика

• Сравнение индексов

• Изучение перелинковки

• Изучение серверных настроек

• Изучение контента

• Поиск дубликатов

• Поиск внешних ссылок

• Анализ и сравнение индексации в по-исковых системах

• Анализ внутреннего анкор-листа

• Лингвистический анализ сайта

• Поиск и анализ исходящих внешних ссылок

• Анализ распределения весов по страницам

• Анализ страниц с 404 ошибками

• Анализ редиректов

• Создание sitemap.xml

• Анализ sitemap.xml, robots.txt

• Оценка размера страниц и скорости их загрузки

• Анализ уровней вложенности

• Поиск полных дублей

• Поиск неполных дублей

• Анализ заполненности страниц

• Поиск пустых страниц и страниц-простыней

• Анализ TITLE, Keywords, Description на наличие дубликатов, пустоты, переспама

• Анализ уязвимостей сайта

• Анализ конкурентов

• Проверка сайта на наложение фильтров

• Анализ внешних ссылок

• Поиск дубликатов контента на других сайтах

• Лексикологический анализ сайта

Page 125: Л.Гроховский - Руководство по внутренним факторам

Семинары и курсы 123

типичные ошибки оптимизатора

• Типичные ошибки, допускаемые при работе с внешними факторами

• Типичные ошибки PR

• Типичные ошибки SMM

• Типичные ошибки разработки

Накрутка

• Накрутка внешних факторов

• Накрутка внутренних факторов

• Накрутка поведенческих факторов

Копирайтинг

• Взаимодействие с копирайтерами

• Как правильно составить ТЗ по копирайтингу

• Определяем уникальность текста

• Бриф для клиента

• Входные страницы

• Что лучше продает: содержание, заго-ловки, оформление или иллюстрации?

• Нестандартные способы получения контента

Блок 3. Аналитика

введение в SEO-аналитику

• Кто такой SEO-аналитик

• Примеры работы SEO-аналитика

• Аналитика

Эмпирический анализ

Статистический анализ

Теория вероятности

Нестандартное мышление

Логические задачи

Собеседование на SEO-аналитика

• Мозговой штурм

• Автоматизация

Сбор позиций

Проверка индексации

Проверка текстов

Перелинковка

Покупка ссылок

• Как писать ТЗ

Правила написание ТЗ

Таблицы

Модули

Интерфейс

Примеры ТЗ

• Область применения знаний и навыков SEO-аналитика

• Источники получения информации, список литературы

• Сервисы поисковых систем

Яндекс.Вебмастер

Google.Вебмастер

• Веб-аналитика

Задачи веб-аналитики

Возможности веб-аналитики

Виды инструментов веб-аналитики

– Внутренние системы

– Внешние системы

Погрешность веб-аналитики

Курс обучения работы с Яндекс.Метрика

– Задачи и цели

– Установка счетчика

– Описание функционала

– Настройка целей

– Статистика по трафику

– Источники трафика

– Поисковые фразы

– Поисковые системы

– Внешние ссылки

Page 126: Л.Гроховский - Руководство по внутренним факторам

124 Семинары и курсы

– Содержание сайта

– Профиль пользователя

– Конструктор отчетов

– Поведенческие метрики

– Карта кликов

– Карта путей

– Тепловые карты

– Применение Яндекс.Метрики для SEO-специалиста

– Замеры, эксперименты

Юзабилити

– Основы юзабилити

– Юзабилити-аудит

– Взаимодействие с профессиональ-ным юзабилистом

Хронология развития поисковых си-стем от каталогов до нашего времени

• Google

• Rambler

• Yandex

• Nigma

Проводимые исследования

• Исследования Яндекса

• Исследования Google

• Исследования зарубежных компаний

• Исследования российских компаний

• Исследования частных специалистов

• Исследования «ТопЭксперт.РФ»

Условия участия:

• Стоимость участия: 25 000 руб. при оплате до 15 декабря.

• Стоимость участия: 30 000 руб. при оплате до 1 января.

• Стоимость участия: 35 000 руб. при оплате до 15 января.

• Стоимость участия: 40 000 руб. при оплате на семинаре.

• При оплате по безналу стоимость воз-растает на 20 %.

VIP- участие:

• Во время курса вы сидите на первом ряду.

• По окончании вы получаете видеозапись.

• Вы получаете подробные комментарии по выполненным домашним заданиям.

• На практических занятиях мы разби-раем материал на примере вашего сай-та, в частности SEO-аудит и семантиче-ское ядро.

• В течение курса у вас будет право на 4 индивидуальные консультации.

• Стоимость: + 30 % от стоимости курса на момент оплаты.

Page 127: Л.Гроховский - Руководство по внутренним факторам

DVD-семинар – #1 «Продвижение порталов и крупных интернет-магазинов» – 8 часов (Уровень подготовки: профессионал)

Для кого этот DVD?

• Для оптимизаторов, продвигающих са-мые крупные и сложные проекты рунета

• Для директоров по маркетингу, плани-рующих создавать внутренний отдел SEO

• Для руководителей крупнейших порта-лов и интернет-магазинов

Семинар вели:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

• Олег Пролубщиков, технический директор, «РДВ-Медиа» (Rabota.ru; Ucheba.ru; VashDosug.ru)

• Алексей Чекушин, аналитик, Wikimart.ru

• Роман Прохоров, руководитель службы продвижения, Wikimart.ru

Среди участников семинара были пред-ставители компаний:

• mail.ru

• pulscen.ru

• raise.ru

• turinfo.ru

• championat.ru

• books.ru

• labirint.ru

• absent.ru

• terminal.ru

• fastlaneventures.ru

• etorg.ru

• wildberries.ru

• kika.ru

• proskater.ru

• molotok.ru

Подробнее о семинаре:

• Докладчики семинара на передаче «ТопЭксперт»

• Краткая программа семинара

• Обсуждение семинара

• Репортаж с семинара от searchengines.ru

• Интервью для seonews.ru

– Олег Пролубщиков, технический ди-ректор «РДВ-Медиа»

– Алексей Чекушин, аналитик, Wikimart

DVD-cеминары и курсы

Page 128: Л.Гроховский - Руководство по внутренним факторам

126 DVD‑семинары и курсы

– Роман Прохоров, руководитель службы продвижения, Wikimart

Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике.

Отзыв от Александра Рыжова, wildberries.ru

+ Бонус:

• Индивидуальная консультация

Покупка:

•СтоимостьDVD-бокса30 000 рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

• Тираж ограничен, всего 20 коробок.

• В целях профилактики пиратства и со-хранения эксклюзивности информа-ции, DVD продаю только реальным людям, представляющим реальные компании. В сомнительных случаях за-прашиваются рекомендации. Если вы не связаны ни с одним крупным проек-том – вы не сможете приобрести этот семинар. Оставляю за собой право от-казать любому в возможности покупки без объяснения причины.

•По вопросампокупкиобращатьсяна [email protected] .ru

DVD – семинар #2 «Продвижение сайтов: работа с внешними факторами» – 4 часа (Уровень подготовки: специалист)

Для кого этот DVD?

• Для оптимизатора, который хочет эф-фективно продвигать сайты

• Для интернет-маркетолога

• Для куководитель проекта, коммуни-цирующего с оптимизатором

вам нужен этот видеокурс, если

• Ссылочная масса растет, а позиции сайта не меняются

• Вы не понимаете, как можно покупать естественные ссылки

• Агрегаторы не всегда работают эффективно

• Вы хотите сократить ссылочный бюд-жет в несколько раз, сняв неэффектив-ные ссылки

• Вам хочется получить трафик с пресс-релизов, блогов и статей

автор и ведущий:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Программа семинара:

• Все источники привлечения вне-шних ссылок, оценка эффективности

Page 129: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 127

и экономическая целесообразность. Сравнение между собой

Обычные покупные ссылки

Ссылки в виде контекстных объявлений

Статьи

Пресс-релизы и посты в блогах

Социальные сети

Форумы

Естественные ссылки

• Возможности автоматизации по каж-дому источнику

• Агрегаторы, взгляд со стороны, оценка эффективности использования

WebEffector

SeoPult

Rookee

Megaindex

• Продвижение молодых сайтов и сай-ты с историей: отличия в работе со ссылками

• Если по ссылке кликают – она работает лучше. Миф или реальность?

Исследования Блогуна

Исследования других бирж

• Критерии выбора ссылок: на что на са-мом деле стоит обращать внимание

• Оценка эффективности ссылок через Яндекс.Метрика и Google.Analytics

• По каким критериям отбирать площадки

Выбор площадок вчера и сегодня, что изменилось

ТИЦ, тематичность, количество вне-шних – что в действительности важ-но сейчас

• Типичные ошибки, допускаемые при покупке ссылок

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

+ Бонус:

• Семинар «Продвижение молодых сайтов»

Покупка:

•СтоимостьDVD-бокса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна [email protected] .ru

Page 130: Л.Гроховский - Руководство по внутренним факторам

128 DVD‑семинары и курсы

DVD – семинар #3 «Продвижение сайтов: задействуем внутренние факторы» – 5 часов (Уровень подготовки: специалист)

Для кого этот DVD?

• Для руководителя SEO-отдела или SEO-аналитика, создающего технологию продвижения

• Для штатного SEO-специалиста или фрилансера

• Для веб-разработчика или программи-ста, занимающихся созданием сайтов для SEO

• Для продвинутых клиентов, кото-рые хотят понять потенциал сво-его сайта с точки зрения внутренней оптимизации

• Для специалиста, продвигающего интер-нет-магазины и заинтересованного в ав-томатизации перелинковки и генерации контента

вам нужен этот видеокурс, если

• Вы продвигаете интернет-магазин

• Вы столкнулись с проблемой воровства контента и не знаете, что делать

• У вас на сайте нет уникального контен-та, и это вызывает сложности

• Вы хотите сэкономить на ссылках, ис-пользуя внутренние ресурсы сайта

• Вы хотите делать эффективные сайты для SEO

• Вы хотите автоматизировать перелин-ковку и генерацию контента на сайте

автор и ведущий:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Подробная программа семинара по ссылке

отзывы

•ВладимирБаязитов(www .manuolog .ru):

– Это был самый лучший семинар по вну‑тренним факторам из всех, которые я посещал.

•АндрейТрапезников(многопроектов): – Семинар понравился, немного не хвата‑ло примеров конкретных сайтов.

•ОльгаДергачева(www.r52.ru):– Хорошая атмосфера, понятный язык. Отличный семинар и знания преподавателя.

•АндрейЗарецкий(www.primelog.ru): – Очень познавательно, открыл много нового для себя.

•СергейНазаренко(www .aquacorp .ru): – Весь материал очень четко изло‑жен, спокойная уверенная манера веде‑ния семинара положительно сказалась на усвояемости материала.

•ВалентинДомбровский,Psycho(www .nextup .ru)– Достаточно полный и интересный се‑минар от человека, который, безусловно, очень хорошо разбирается в теме. Полу‑ченные знания по столь важному аспек‑ту SEO, конечно, необходимо применять на практике.

Покупка:

•СтоимостьDVD-бокса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

Page 131: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 129

•По вопросампокупкиобращатьсяна [email protected] .ru

DVD-семинар – #4 «Поведенческие факторы, юзабилити и яндекс.Метрика для SEO-специалиста» (Уровень подготовки: специалист)

Для кого этот DVD?

• Для оптимизатора, который хочет эф-фективно продвигать сайты

• Для интернет-маркетолога

• Для веб-аналитика

вам нужен этот видеокурс, если

• Стандартные методы продвижения не работают

• Вы все еще не понимаете, как можно влиять на поведенческие факторы

• Вам нужно, чтобы сайт клиента продавал

• Вы не умеете пользоваться Яндекс.Метрикой

ведущий семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Программа:

• Теория: развитие поведенческих метрик

• 3 группы поведенческих факторов

переходы по ссылкам

результаты поиска

поведение на сайте

• Где покупать естественные ссылки

• Связки поведенческих факторов: как это работает

• Исследование пользователей: какими данными располагает Яндекс

• 3 способа накрутки поведенческих факторов

имитация живых пользователей: со-здание «живых» ботов

ботнет

биржа

• Мифы и заблуждения о поведенческих факторах

• Основы юзабилити

• Чек-лист: типичные ошибки юзабилити

• Юзабилити-аудит сайта

• Отличия ПФ для 4 тематик

свадебные платья

ноутбуки

такси

индийская косметика

• Возможности Яндекс.Метрики: демон-страция функционала

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

Покупка:

•СтоимостьDVD-курса6000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна [email protected] .ru

Page 132: Л.Гроховский - Руководство по внутренним факторам

130 DVD‑семинары и курсы

DVD – семинар #5 «Комплексная стратегия продвижения» – 3 часа [Уровень подготовки: начинающий]

Для кого этот DVD?

• Для начинающих оптимизаторов

• Для интернет-маркетологов

• Для заказчиков

вам нужен этот видеокурс, если

• Вы хотите использовать комплексный подход к продвижению сайта

• Вы самостоятельно продвигаете сайт и вам нужны выдающиеся результаты

• Вам кажется, что ваши знания устарели

• Вы хотите понять, использует ли ваш оптимизатор комплексный подход к продвижению сайта

ведущие семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

• Станислав Поломарь, руководитель службы продвижения, Web-it

• Виктор Нагайцев, генеральный директор, PerfectSeo

Среди слушателей были

• Магомед Чербижев, руководитель Seointellect.ru

• Вениамин Моисеев, преподаватель АиР

• Илья Савинов, преподаватель АиР

• Денис Макаров, технический директор, Miralab.ru

Программа семинара:

• Что такое комплексный подход к про-движению сайтов

• Как совмещать внешние и внутренние факторы

• Как поведенческие факторы коррели-руют с внутренними

• Как использовать <HTML> разметку для пользователей и для роботов

• Как составлять текст ссылки

• Как влияет возраст сайта на продвиже-ние и что с этим делать

• Как правильно настраивать редиректы и 404 ошибки

• Как картинки влияют на продвижение

• Как избежать склейки нескольких сай-тов одной компании

Покупка:

•СтоимостьDVD-бокса3000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

•По вопросампокупкиобращатьсяна [email protected] .ru

Page 133: Л.Гроховский - Руководство по внутренним факторам

DVD‑семинары и курсы 131

DVD-семинар – #1 «Автоматизация в SEO» – 8 DVD (Уровень подготовки: профессионал)

Для кого этот DVD?

• Для руководителя SEO-компании

• Для директора по маркетингу, руково-дящего внутренним отделом SEO

• Для разработчика веб-сервисов и про-грамм для интернет-маркетинга

ведущий семинара:

• Леонид Гроховский, директор по техно-логии продвижения и автоматизации, «Оптимизм.ру»

Содержание

1‑й диск

• Задачи и цели автоматизации

• Автоматизация продаж

2‑й диск

• Расчет стоимости

• Отчетность, статистика, биллинг

3‑й диск

• Система контроля рисков

4‑й диск

• Контроль работы оптимизаторов

• Составление семантического ядра

• Копирайтинг

5‑й диск

• Генерация контента

• SEO-аудит, диагностика сайта

6‑й диск

• Перелинковка

• Анализ конкурентов

7‑й диск

• Система для отдела SEO-аналитики

• Яндекс.Метрика, Google.Analytics

• Поведенческие факторы

8‑й диск

• Агрегаторы: внутренние и внешние ссылки

• Комплексная автоматизация

– Краткое содержание семинара + от-зывы слушателей можно посмотреть на ролике

+ Бонус на 40 000 руб .:

• 2 часа индивидуальных консультаций (экономия 10  000 руб.)

• аудит автоматизации SEO-отдела (эко-номия 30  000 руб.)

отзывы:

•РоманКлевцов,генеральный директор «оптимизм .ру»:

– В условиях динамично меняющего‑ся SEO Леонид один из немногих успе‑вает профессионально реагировать на нововведения и повышать качество автоматизации.

•ТимофейКвачев,руководительотде-ла интернет-маркетинга, TRINET:

– Хороший контент от хорошего специа‑листа. Полагаю, что топ‑менеджеры ком‑паний смогут почерпнуть много полез‑ной информации, а также ряд методик для быстрого внедрения в практическую деятельность своей компании, оптимиза‑ции рутинных процессов и развития бизне‑са в целом.

Page 134: Л.Гроховский - Руководство по внутренним факторам

132 DVD‑семинары и курсы

•ИванСевостьянов,генеральный директор, «вебПроекты»:

– Леонид Гроховский имеет огромный опыт в автоматизации процессов SEO‑компаний. Уверен, что его знания вам пригодятся!

•ВикторНагайцев,генеральный директор, PerfectSeo:

– Леонид является признанным гранд‑мастером в области автоматизации продвижения сайтов. Я глубоко убежден, что в данном курсе каждый сможет по‑черпнуть что‑то новое.

•СтаниславПоломарь,руководительSEO-направления, Web-IT:

– Все вещи, о которых рассказывает Лео‑нид, опробованы и отточены на многих проектах (от мелких до очень крупных). Поэтому подходы и знания, получен‑ные от данного семинара, безусловно, представляют большую практическую ценность.

•КириллСамойлов,генеральный директор, ArrowMedia:– Современный бизнес в области SEO не‑возможен без высокого уровня автомати‑зации. Знания и опыт Леонида по данно‑му вопросу будут очень полезны.

•АртемБородатюк,генеральный директор NetPeak:

– Леонид Гроховский подготовил, пожа‑луй, самый полезный материал, который доводилось просматривать с топ‑ме‑неджментом Netpeak за последнее время.

•АлександрСалтыков,директорпо маркетингу, Ingate Development:

– Невозможно представить сегодня SEO без автоматизации. Леонид обладает большим и, безусловно, полезным опы‑том в разработке автоматизированных систем. Его консультации будут весьма полезны тем, кто заинтересован в повы‑шении эффективности бизнес‑процессов SEO‑компании.

Покупка:

•СтоимостьDVD-курса50 000рублей.

• Доставка в руки через EMS в течение 3 рабочих дней.

• Тираж ограничен – всего 10 коробок.

• В целях профилактики пиратства и сохранения эксклюзивности ин-формации, DVD продаю только тем, с кем знаком лично, либо запрашиваю рекомендации. Оставляю за собой пра-во отказать любому в возможности по-купки без объяснения причины.

•По вопросампокупкиобращатьсяна [email protected] .ru

Page 135: Л.Гроховский - Руководство по внутренним факторам

Леонид ГроховскийМихаил Сливинский, Алексей Чекушин, Станислав Ставский

SEO: руководство по внутренним факторам

Книга содержит комментарии экспертов проекта «ТопЭксперт.РФ»:Ивана Севостьянова, Николая Хиврина, Константина Шурыгина,

Анара Бабаева, Сергея Панкова и Даниила Маула

Научный редактор Станислав СтавскийЛитературный редактор Татьяна Байдак

Верстальщик-дизайнер Юлия Кинаш-КонстантиноваКорректор Валентина Максимова

Подписано в печать 28.12.2011. Формат 70 100 1/16.

Издательство Центр исследований и образования «ТопЭксперт.РФ»

Page 136: Л.Гроховский - Руководство по внутренним факторам

SEO руководство по внутренним факторам

Теперь вы можете воспользоваться актуальной информацией и применить новые знания в своей практике, наиболее полно задействовав потенциал собственного сайта и улучшив его позиции в выдаче поисковых систем.

«Эта книга кардинально отличается от аналогичных изданий: она написана оптимизаторами для оптимизаторов и является первым изданием по теме внутренних факторов в SEO. Авторы соединили свои разноплановые познания в области внутренней оптимизации и смогли простым языком изложить сложный материал.» © Центр исследований и образования «ТопЭксперт.РФ»

  • Предисловие.
  • Введение в продвижение сайтов.
    • 0.1. Понятие о внутренних факторах.
    • 0.2. Понятие о внешних факторах.
    • 0.3. Понятие о поведенческих факторах.
    • 0.4. Комплексный подход к продвижению сайтов.
  • Глава 1 . Перелинковка страниц.
    • 1.1. Как вычисляется PageRank и почему это так важно знать.
      • По материалам статьи в переводе Александра Садовского «Растолкованный PageRank».
    • 1.2. Базовые схемы перелинковки.
      • Комплексное продвижение всего сайта.
      • Продвижение главной страницы под ВЧ.
      • Продвижение разделов под СЧ.
      • Продвижение внутренних страниц под НЧ.
    • 1.3. Локальные схемы перелинковки.
      • Кольцо.
      • Куб.
      • Звезда.
    • 1.4. Правила перелинковки.
    • 1.5. Способы перелинковки.
    • 1.6. Составление текста ссылки для перелинковки.
    • 1.7. Создание модуля для перелинковки.
      • Портал.
      • Интернет-магазин.
      • Корпоративный сайт.
      • Каталог.
  • Глава 2 . Устранение дубликатов.
    • 2.1. Чем вредны дубликаты.
    • 2.2. Классификация дубликатов.
    • 2.3. Кейсы.
      • Компания «БЕСТ-Недвижимость», www.best-realty.ru.
      • ММЦ «ОнКлиник», www.onclinic.ru.
      • Магазин итальянской мебели, www.eurointerier.ru.
    • 2.4. Способы устранения дубликатов.
  • Глава 3 . Инструкции для поисковых систем.
    • 3.1. Зачем нужен robots.txt.
    • 3.2. Robots.txt – универсальные директивы.
    • 3.3. Robots.txt – директивы для Яндекса.
    • 3.4. Правила составления robots.txt.
    • 3.5. Разбор robots.txt на примерах.
    • 3.6. Зачем нужен sitemap.xml.
    • 3.7. Директивы sitemap.xml.
    • 3.8. Правила составления sitemap.xml.
    • 3.9. Пример sitemap.xml.
    • 3.10. Принцип взаимодействия sitemap.xml и robots.txt.
    • 3.11. Автоматизация добавления страниц в sitemap.xml.
  • Глава 4 . работа с авторским контентом.
    • 4.1. Уникальность контента.
    • 4.2. Как защитить контент от воровства?
    • 4.3. Как воровать контент?
    • 4.4. Отсутствие и недостаток контента.
      • Разбор решения на примере www.mobiguru.ru.
    • 4.5. Автоматизация наполнения Description, Keywords, Title.
    • 4.6. Автоматизация генерации контента.
      • Автоматизация генерации описаний товаров.
      • Автоматизация генерации технических характеристик (уровень 1).
      • Автоматизация генерации технических характеристик (уровень 2).
    • 4.7. Обнаружение дубликатов.
      • Инструкция по обнаружению дубликатов вручную.
      • Способы автоматизации обнаружения дубликатов.
  • Глава 5 . Коды ответов сервера.
    • 5.1. Код ответа 200.
    • 5.2. Коды ответов 301/302/303/307/3**.
    • 5.3. Код ответа 404.
  • Глава 6 . Стандарты W3C.
    • 6.1. Правила HTML-разметки для SEO.
    • 6.2. Проверка верстки на соответствие стандартам W3C.
  • Глава 7 . SEO-аналитика.
  • Глава 8 . Исследование «SEO-альманах 2010».
  • Семинары и курсы.
  • DVD-семинары и курсы.

«Я писал не об абстрактном поисковом продвижении, а сосредоточился на практических рекомендациях, поэтому здесь органично сочетаются краткие фундаментальные понятия с многочисленными конкретными советами, которые являются остроактуальными сегодня и останутся таковыми завтра. Это первое издание по данной теме. Вероятно, очень скоро нам придется столкнуться с новыми исследованиями и новыми факторами ранжирования, изменится значимость этих факторов и способы воздействия на них. Рад избавить вас от лишнего беспокойства. Книга написана в соавторстве с лучшими аналитиками нашей профессии — Станиславом Ставским, Михаилом Сливинским и Алексеем Чекушиным.» © Леонид Гроховский

[sociallocker id=»4165″]

Ваши ссылки: скачать книгу

[/sociallocker]

Дополнительная информация

SEO руководство по внутренним факторам

Источник: центр исследований и образования «ТопЭксперт.РФ».
Автор: Леонид Гроховский.
Соавторы: Алексей Чекушин, Михаил Сливинский, Станислав Ставский.
Дополнительно: бесплатно.
Формат: PDF.
Страниц: 136.
Размер: 5,35 МБ.

Вам также может понравиться

Понравилась статья? Поделить с друзьями:
  • Л гроховский руководство по внутренним факторам гроховский л
  • Сервис мануалы на весы
  • Танзитал лекарство инструкция по применению цена
  • Таблетки силденафил инструкция по применению отзывы мужчин цена в аптеках
  • Balaban 2 pomad инструкция на русском