Что такое техническая оптимизация сайта? Начало

12 декабря 2018

Довольно часто приходится объяснять клиентам что такое оптимизация сайта под поисковые системы. Одним бывает достаточно узнать общую информацию о том, как работают сайты и какие ошибки мы устраняем, другим же требуется детальный план или отчет по проделанным работам. Однако и те, и другие обычно не углубляются и не вникают в суть работ. В этом цикле статей я на реальных примерах объясню самые важные тонкости SEO и постараюсь предостеречь людей от возможных неудач.

404-ошибка – тонкости оптимизации

Начнем с самого вроде бы простого – с 404-ошибки на страницах сайта. Обычно везде пишут: «Не должно быть страниц с 404-ошибкой. И все тут, это важно». Давайте разберемся…

Каждая страница сайта имеет свой контент (текст, изображения, видео) и техническую информацию. В технической информации содержатся скрытые от обычного пользователя параметры: дата обновления страницы, код ответа, скорость ответа сервера, «куки» и прочие параметры. Нас интересует именно код ответа.

Объясню подробнее: для того чтобы браузер пользователя понимал какой статус у страницы, при ее формировании на сервере создается код, которых существует большое множество. 404 код говорит о том, что страница не существует – ее либо удалили, либо страницу не создавали.

Данный код формируется системой администрирования сайта, либо если сайт самописный, то самими вебмастерами-программистами и настройками сервера.

Важно понимать, что для индексации сайта в поисковых системах по этим же данным собирается информация ботами поисковых систем. При сканировании сайта формируется список страниц с кодами ответа и уже по этим данным поисковая система анализирует ваш сайт. Так как по несуществующим страницам проходить не имеет смысла, боты не тратят ресурсы на их сканирование. И вот тут есть свои тонкости. Утверждение , что «404 ошибок не должно быть» - это только часть истинного положения вещей. Да, внутри сайта не должно быть ссылок на несуществующие страницы и когда их много это критично, так как поисковый бот натыкаясь на большой объем таких внутренних ссылок, может просто перестать далее сканировать сайт и отложить индексацию до лучших времен. Однако это не самое страшное, что может случиться.

Намного хуже если страница 404-ошибки нарисована, однако на деле отдает 200 код (страница существует). Это довольно критично, так как большой объем мусорных страниц начнет попадать в список индексации, а на деле бот увидит только одинаковый дублирующий контент. По сути тогда вероятность того, что поисковый бот попросту перестанет нормально индексировать сайт будет намного выше чем в предыдущем случае. Есть еще один нюанс: у бота есть лимит на индексацию сайта. Чем крупнее и авторитетнее сайт, тем больше у него таких лимитов и тем чаще и больше страниц он индексирует. Эти лимиты очень важны, и чем больше лимитов вы потратите на индексацию бесполезных страниц, тем меньше нужных страниц вовремя попадет в поиск.

Почему поисковые системы не индексируют все подряд. Ответ прост: не хватает ресурсов. Интернет большой и информации реально очень много. Если Google справляется с этой задачей (скорость индексации Google как правило нескольких дней), то Яндексу явно не хватает мощностей для этого. Пример: существуют очень крупный сайт, с очень высоким авторитетом, для которого не хватает лимитов и ресурсов Яндекса для своевременной индексации каждой страницы. Это социальная сеть вКонтакте. Вы можете проверить сами как ваше сообщество или личная страница индексируется в поиске. Достаточно ввести в поиске Яндекс «url:страница» Например, так выглядит запрос для моей страницы url:https://vk.com/kolbasnikov. Нажав на треугольник «▼» в меню выбрать «Сохраненная копия», вы сможете увидеть актуальную версию страницы в поиске.

В моем случае отставание может достигать несколько недель. В основном же страницы рядовых пользователей, вообще очень плохо индексируются поисковой системой и в ответе на запрос вы можете получить скудное: «По вашему запросу ничего не нашлось».

Давайте вернемся к нашим сайтам. В каких же случаях возникают эти пресловутые «мусорные» страницы без кода ответа 404.

Во-первых, страницы результатов поиска.

И как правило SEO-специалисты решают эту проблему закрытием от индексации данных страниц от поиска (подробнее об этом я расскажу в следующих статьях об оптимизации сайта). И это простой и эффективный способ не тратить квоты поискового робота.

Во-вторых, результаты выборки фильтров в каталогах. Наверное, вы встречали такие сайты, когда, выбирая параметры фильтра каталога возникали страницы без товаров.

Тоже самое касается пустых разделов каталога (их вообще не должно быть на сайте, но это уже другая история). В этом случае SEO-специалисты так же решают эту проблему закрытием фильтров от индекса. Однако для нашей компании такое решение неприемлемо - это противоречит нашему методу BigSEO. На таких страницах мы отдаем код 404 и визуально выводится пустая страница каталога. В идеале наша с вами задача сделать так, чтобы рядовой пользователь не попадал на такие страницы.

В-третьих, страницы корзины и форм обратной связи.

Данные страницы так же, как и в первом случае закрываются от индексации поисковыми системами. Так как для пользователя и поисковых систем нахождение этих страниц в поиске не имеет смысла.

В-четвертых, страницы сортировок по цене, названию, фильтр выборки по цене, и прочее.

Данные страницы часто закрывают от индекса или вовсе не обращают внимание на их существование. Однако существует метод канонизации страниц, что позволяет грамотно перераспределять вес на целевые страницы. Об этом методе я расскажу в следующих статьях.

Подведем итог. Только работая над одним параметром сайта (404 ошибкой) мы решаем одну из самых важных задач по своевременной индексации сайта. На первый взгляд сухая строчка в проделанных работах «Устранение 404-ошибки» несет в себе более широкое понятие и целый ряд работ по оптимизации работы кода сайта. А если это связано с работой коробочной CMS, работы могут занять не один час на поиски и устранение на первый взгляд простой ошибки.

Выводы:

  • Помимо устранения внутренних ссылок на страницы с 404-ошибкой, иногда необходимо формировать 404-ошибки на «мусорных» страницах.
  • Думайте о лимитах на индексацию. Они важны.
  • Необходимо проверять наличие правильного кода ответа даже если визуально страница выглядит как страница 404-ошибки.

Всем, хорошего дня и чистых от ошибок сайтов. Продолжение следует…

Интересные статьи по теме
Опишите свою задачу и мы с Вами свяжемся!
Имя:
E-mail:
Телефон:
Сообщение
наверх