Как проверить индексацию всего сайта и конкретной страницы в Яндексе и Google: инструкция по сервисам и рекомендации
Технические доработки под требования SEO и оптимизация структуры сайта – это первостепенные моменты в продвижении ресурса, но если поисковые системы не знают о нем, то есть он не проиндексирован, то продвижение невозможно.
Что же такое индексация? Это добавление поисковыми роботами собранных сведений о ресурсе в базы данных. Дальнейшее ранжирование происходит уже по проиндексированным страницам. Предлагаем несколько простых и понятных способов проверки страниц, которые «видят» поисковые системы.
Рассмотрим каждый вариант подробнее.
Оглавление:
-
Проверка индексирования сайта через панель Яндекс.Вебмастера и Google Search Console
-
Проверка количества проиндексированных страниц в ПС при помощи операторов
-
-
Отслеживание проиндексированных страниц с помощью online сервисов
-
Программы для контроля индексации сайта
-
Проверка индексации страницы
-
Почему сайт может не индексироваться
-
Выводы SEO-специалиста Веб-центра
1.
Проверка индексирования сайта через панель Яндекс.Вебмастера и Google Search ConsoleБесплатный и достоверный способ с использованием сервисов для вебмастеров.
Яндекс.Вебмастер
В первую очередь выполняем авторизацию в аккаунте Яндекса и входим в сервис Вебмастер. Далее вводим url ресурса и нажимаем кнопку «Добавить».
Добавление сайта в вебмастер Яндекса
После прохождения верификации переходим в панель и нажимаем вкладку «Индексирование» – «Страницы в поиске». Тут представлены страницы веб-сайта, участвующие в поиске Яндекса.
Просмотр страниц в поиске Яндекса через панель для вебмастеров
Также количество загруженных и проиндексированных страниц можно посмотреть в сервисе на странице «Мои сайты».
Просмотр количества страниц в поиске на вкладке «Мои сайты»
Для анализа список страниц можно скачать из сервиса файлом в форматах . xls и .csv.
Google Search Console
Аналогично вебмастеру Яндекса проходим авторизацию в аккаунте Google, входим в сервис search.google, вводим url сайта и нажимаем кнопку «Добавить ресурс».
Пример верификации в панели вебмастеров в Гугл
После подтверждения прав на сайт для проверки индексации ресурса в панели Вебмастера Гугл переходим во вкладку «Индекс» – «Покрытие».
Просмотр страниц в ПС Гугл через панель для вебмастеров
Нужно учитывать, что информация в Google Search Console примерная, так как в отчете показывается статистика после последнего обхода, то есть количество страниц может быть другим на текущий момент проверки.
Примеры проверки индексации сайта
На скриншоте – сайт, у которого нет проблем с индексацией в Яндексе
На скриншоте – сайт, у которого регулярно удаляются страницы из поиска Яндекса
На скриншоте – сайт, у которого регулярно удаляются страницы из поиска Гугл
2.
Проверка количества проиндексированных страниц в ПС при помощи операторовПрименяя документный оператор «site» возможно увидеть примерное количество страниц в индексе. Для использования этого параметра введите в строке поиска «site:адрес_интересующего_сайта», например «site:https://www.bordur32.ru».
Пример использования оператора «site» в Яндексе
Пример использования команды «site» в Гугле
3. Анализ индексации сайта при помощи плагинов и расширений
Чтобы не вводить операторы в строке браузера перед url используется данный автоматизированный способ. Скачиваем бесплатный букмарклет для браузера (небольшой по размеру скрипт, сохраняемый в закладках) и кликаем на специальную иконку находясь на сайте.
Пример использования плагина SEO-tools
Установить расширение вы можете по ссылке
Пример использования расширения RDS bar
Установить расширение вы можете по ссылке
4.
Отслеживание проиндексированных страниц с помощью online сервисовЕще один способ проверки индексации это использование сторонних ресурсов. Например, переходим на сайт a.pr-cy.ru вводим url и нажимаем «Анализировать».
Скриншот проверки индексации сайта в a.pr-cy.ru
Индексацию сайта можно проверить и в других сервисах, например: seogadget.ru, xseo.in и других.
5. Программы для контроля индексации сайта
Существуют бесплатные (Site-Auditor) и платные программы (Semonitor) для анализа сайта и проверки страниц в индексе. Выбранное программное обеспечение скачиваем и устанавливаем на ПК. В строку ввода добавляем url проверяемого сайта.
Скриншот фрагмента анализа сайта в программе Site-Auditor
Проверка индексации страницы
Иногда требуется не только узнать сколько страниц проиндексировано в Яндексе и Google, но и нужно определить индексируется ли какая-то конкретная страница. Это можно сделать следующими способами:
1. В панели для вебмастеров:
-
Яндекс – следовать по пути «Индексирование» – «Проверить статус URL». В поле для ввода данных ввести либо полный урл интересующей страницы, либо путь от корня сайта начинающийся с «/». Далее нажать кнопку «Проверить».
Проверяемая страница в поиске Яндекса
-
Google – перейти во вкладку «Проверка URL» и ввести урл интересующей страницы.
Проверяемая страница проиндексирована в Google
2. Оператор «url»
В строке поиска вводим специальный оператор. Запрос будет выглядеть так: «url:адрес_интересующей_страницы».
Пример использования оператора «url» в ПС Яндекс
3. Оператор «info»
В поисковой системе Google можно воспользоваться оператором «info». Запрос в строке поиска будет выглядеть следующим образом: «info:адрес_интересующей_страницы»
Пример использования оператора «info» в ПС Гугл
Почему сайт может не индексироваться
В идеале страницы ресурса должны быть проиндексированы и их количество в поисковых системах должно быть примерно одинаковым. Но так бывает далеко не всегда. Рассмотрим причины мешающие индексации сайта.
Ошибки в файле robots.txt
Файл robots.txt – это текстовый документ в формате .txt лежащий в корневом каталоге веб-сайта, запрещающий или разрешающий индексирование страниц роботам ПС. Поэтому неправильное использование директив может закрыть от индексации весь сайт или отдельные страницы ресурса.
Отсутствие файла sitemap.xml
Карта сайта (файл sitemap.xml) – это специальный документ расположенный в корневом каталоге, содержащий ссылки на все страницы ресурса. Этот файл помогает поисковым роботам оперативно и качественно индексировать ресурс. Поэтому в него нужно добавлять только те страницы, которые должны попасть в индекс.
Новый сайт
Приватные настройки
В некоторых CMS, таких, как WordPress и Megagroup, существует возможность скрыть от индексации страницы через админку сайта, данные настройки могут стоять по умолчанию.
Тег «noindex»
Страницы могут быть закрыты от индекса в коде с помощью мета тега name=»robots» content=»noindex, nofollow» />. Нужно проверить его наличие и либо убрать из кода, либо заменить на «index» и «follow».
Мусорные страницы
Еще одной из причин может стать большое количество мусорных страниц, не предоставляющих полезного и уникального контента в рамках сайта.
Также причиной не индексации страниц ресурса могут быть ошибки сканирования, блокировка сайта в файле .htaccess, дубли страниц, не уникальный контент, низкий uptime хостинга, медленная скорость загрузки сайта, баны и фильтры ПС.
Выводы SEO-специалиста Веб-центра
Главная цель как владельца сайта так и SEO-специалиста добиться индексирования нужных страниц ресурса. Для этого нужно регулярно контролировать страницы в поиске Яндекса и Google, проверять сервисы для вебмастеров на наличие ошибок на сайте, наполнять его уникальным и полезным контентом, следить и оптимизировать скорость загрузки ресурса.
Для ускорения процесса индексации нужно подтвердить права на сайт в Яндекс.Вебмастер и Google Search Console и разместить в них ссылку на файл sitemap. xml, также можно отправлять на переобход важные страницы ресурса.
Подробно эту тему мы разобрали в видео на нашем Ютуб-канале
Индексация страниц и сайта в Яндексе и Google
Индекс поисковой системы — база данных, которая хранит информацию о веб-документах. Назначение этого «хранилища» очевидно — используя базу данных, поисковик может быстро и точно вычислять значения факторов ранжирования, численное значение релевантности URL по запросу пользователя и формировать результаты выдачи.
Для SEO-специалистов и владельцев сайтов это означает одно — какое количество страниц проиндексировано, такое количество документов и может быть найдено в результатах выдачи по целевым запросам и столько же URL может привлекать трафик.
Как быстро проверить индексацию в Яндексе и Google?
Способов и сервисов массовой проверки индексации страниц достаточно много и у нас есть три инструмента, которые определяют количество документов в индексе по домену:
Просто укажите домен в любом из них. Инструмент поможет проверить сайт и обозначит количество проиндексированных страниц в базе данных Google и Яндекс, с учётом поддоменов или без них:
Поисковые операторы для проверки индексации
Узнать индексацию сайта можно, используя операторы поиска. Для Яндекса это операторы «site:», «host:» и «url:».
Для Google — «site:», «inurl:» и «info:».
В обеих поисковых системах указываются приблизительные результаты, но можно использовать дополнительные параметры, чтобы узнать, сколько страниц было проиндексировано, например, за неделю:
Для того, чтобы проверить индексацию определённой страницы сайта используйте оператор «url:» для Яндекса и «info:» для Google.
Вебмастер и Search Console
Если вы уже добавили свой сайт в панель Яндекс.Вебмастер и/или Google Search Console, то можете детально отслеживать статус сканирования и индексирования документов.
В Вебмастере переходим на вкладку «индексирование» — «страницы в поиске». Здесь расположилась статистика по добавленным и удалённым из поиска документам. Также можно посмотреть историю изменений для всего сайта за определённый интервал дат:
Проверить индексацию сайта в Google можно с помощью Search Console. В новой версии консоли переходим на вкладку «статус» — «индексирование отправленных URL» и получаем картину изменений, ошибок, исключенных страниц и график показов:
Возможный контроль индексации
Важно понимать, что сканирование или обход страницы сайта не означает её попадание в индекс. Иногда необходимо запретить индексирование страниц, которые не нужны в поиске, например: URL с техническими GET-параметрами, служебные или пользовательские документы (корзина, личный кабинет и прочие), документы с UTM-метками. Поэтому каждому сайту желательно иметь:
-
Sitemap.xml — файл, который помогает поисковым роботам сканировать сайт, с учётом заданных приоритетов.
-
Robots. txt — файл, задающий правила и параметры обхода для всех роботов поисковых систем или индивидуально для каждой:
-
С помощью команды Disallow можно запрещать индексирование отдельных URL или разделов сайта.
-
Crawl delay — задаёт минимальное время обращения робота к серверу для избегания нагрузок на сайт.
-
Clean param — позволяет указать неважные для индексации CGI-параметры в URL-адресах, то есть различные идентификаторы пользователей, сессий и так далее. Используется только в Яндексе.
-
Открытые страницы должны быть в поиске, только тогда можно думать о ранжировании. Не забывайте проверять сайт на индексацию, отслеживайте изменения и удачных позиций в выдаче!
Задайте вопрос или оставьте комментарий
Другие вопросы нашего FAQ
Как проверить разрешена ли индексация сайта поисковыми системами, запрещена ли индексация служебных страниц сайта
22. 07.2014.
В общем случае, если на сайт есть переходы с поисковых систем, то он разрешен к индексации. Как всегда в продвижении, есть несколько но:
- Не все нужные страницы могут быть открыты для индексации
- В индексе поисковых систем могут содержаться лишние страницы (ухудшающие ранжирование сайта, например, дубли)
- Могут быть закрыты для индексации определенные папки (например, картинки /images/)
- И т.д.
Теперь обо всем по-порядку. Для начала, проверяем, есть ли сайт в индексе Яндекса и Гугла, задав поисковикам следующий запрос: site:realyseo.ru (заменив на свой домен):
Если ничего не найдено, то выполняем инструкции, приведенные в этой статье.
Если же сайт индексируется, смотрим на страницы, проиндексированные поисковыми системами (в выдаче поисковиков по запросу, приведенному выше) и убеждаемся, что в индексе нет ничего лишнего (например, страниц меток/тегов, профилей пользователей и т. п.).
Если есть лишние страницы в индексе — запрещаем их индексирование (добавляем мета тег <meta name=»robots» content=»noindex»>).
Если лишних страниц в индексе нет, то переходим к проверке страниц и других материалов сайта, запрещенных к индексации поисковыми системами.
Проверить, какие страницы и материалы запрещены к индексированию, можно несколькими способами — посмотреть содержимое файла robots.txt в корневом каталоге сайта, в ручную просмотреть исходный код страниц на предмет наличия мета тега noindex… Но я бы рекомендовал воспользоваться специальным софтом или сервисом. Я пользуюсь бесплатной программой Netpeak Spider, в неё достаточно просто вбить адрес сайта и вы получите информацию о страницах, запрещенных к индексации:
Просматриваем страницы, запрещенные к индексации (disallow в robots.txt или noindex в MetaRobots), если есть нужные страницы — разрешаем их индексацию.
Случай из практики — был клиент, которому мы какое-то время продвигали сайт. Затем мы перестали сотрудничать и через какое-то время он обновил сайт (обновил движок Joomla и сменил дизайн), после обновления движка изменился файл robots.txt, в котором появился запрет на индексацию папки /images/ (туда по-умолчанию загружаются все картинки к статьям). Результаты не заставили себя долго ждать — трафик из поиска по картинками упал с ~600 человек в месяц (это коммерческий сайт, продающий строительные материала оптом, то есть, трафик был довольно большим) до нуля:
Клиент вновь обратился к нам весной с просьбой диагностировать причины падения трафика с поисковых систем (не только с поиска по картинкам), в результате проведенной диагностики, в том числе, была выявлена эта проблема. Изменили robots.txt, картинки начали индексироваться Яндексом только в июне (Google начал индексировать практически сразу), теперь начинается медленный рост трафика с картиночного поиска (видно в конце графика).
Как видно из примера, важно очень внимательно следить, что разрешено, а что запрещено индексировать на вашем сайте поисковым роботам.
Понравилась статься? Подпишитесь на обновления:
Как быстро проверить индексацию страниц всего сайта?
Уже было не мало статей про индексацию сайта, а именно:
— Индексация сайта в поисковых системах
— Что делать если сайт не индексируется?
— Как быстро проиндексировать сайт или страницу?
Эти статьи вам помогут с индексацией, после того, как вы очень быстро сможете определять индексацию ресурса.
В данной статье мы рассмотрим варианты, как быстро можно проверить свой сайт на индексацию в обеих поисковых системах как Google и Яндекс.
А дальше поработать над индексацией и увеличить посещаемость, за счет оптимизации и индексации нужных страниц.
Как это сделать?
На самом деле вариантов есть множество, давайте рассмотрим от сложного к простому:
1. Сложный и не всегда понятныйДелаем это с помощью оператора поисковых систем:
Используем оператор site:vashsite. com. Так же смотрим какие страницы находятся в основном индексе:
По сути количество страниц мы то увидим, даже можем сопоставить основной индекс с не основным.
Но как понять, какие важные страницы не индексируются?
Именно про это сегодняшняя статья. Сразу переходим к быстрому способу.
2. Быстрый способ проверки сайта на индексациюЕсть такой сервис: saitreport.ru, с помощью которого можно сделать небольшой аудит сайта.
Сервис платный, но стоит совсем небольших денег. Но может сильно помочь сэкономить время, а так же показать проблемные места.
Вот пошаговый план действий:
А) Добавляем проект для проверки
Вводим нужный URL вашего сайта, выбираем платную проверку, выбираем количество страниц, пополняем аккаунт и отправляем на проверку.
Если сайт небольшой, например, до 1000 страниц, то он проверяется довольно таки быстро 10-20 минут.
Б) Смотрим отчет по проверке
Сразу же смотрим в левую сторону и переходим во вкладку – индексация в ПС.
Далее нас интересуют 2 поисковых системы:
В) Проверяем индексацию в Google и Яндекс
Для этого меняем сортировку, чтобы изначально показывались не проиндексированные страницы:
Что там можно найти?
Как минимум:
— Битые ссылки
Например такое:
— Важные страницы, которые не индексируются
Это основная причина, делать такую быструю проверку. Так как если вы обнаружите такие страницы, то:
— понять причину
— исправить ошибки
— проиндексировать страницу
— получать с нее поисковый трафик
Почему именно этот сервис?
Он удобно показывает сразу индексацию по двум поисковым системам и сканирует довольно таки быстро.
Что действительно экономит время и дает возможность быстрее увидеть проблемные места.
3. Другие варианты проверкиСамым простым вариантом является Google и Яндекс вебмастер.
Читаем:
— Google Webmaster Tools
— Яндекс Вебмастер
Так же можно проверять внутренние технические моменты на сайте с помощью программы Screaming Frog, но она не покажет индексацию именно так по страницам.
В заключение
Мы используем этот вариант для именно быстрой проверки индексации и так же быстро потом правки ошибки на сайте и индексируем нужные страницы.
Как правило, если на сайте обращать внимание на такие моменты, то можно хорошо увеличить поисковый трафик.
Вот пример работы только с такими страницами на контентом сайте:
Индексация – самый важный момент в поисковом продвижении сайтов. Так как если страницы сайта не индексируются, то продвигать его нет смысла.
Поэтому важно:
— обращать на это внимание
— регулярно проверять
— исправлять ошибки на сайте
— помогать хорошо индексироваться новым страницам
Тогда сайт на порядок лучше и быстрее будет расти и получать нужный поисковый трафик на сайт.
А что вы думаете про быструю проверку индексации своего сайта?
Оцените статью
Загрузка…Количество страниц в индексе. Самый быстрый способ
Содержание:
Проверка индексации сайта в Яндекс и Google
Успешное продвижение сайта возможно лишь тогда, когда выполняется одно важное условие – поисковики должны проиндексировать все его странички, которые оптимизированы под нужные поисковые запросы.
Как убедиться, что это условие выполнено?
Нужно узнать какие страницы в индексе, а какие поисковые роботы обходят стороной.
Самая простая проверка индексации сайта в Яндекс и Google
- Чтобы проверить количество страниц в индексе Google используется команда «site:» для строки поиска.
- Проверить количество страниц в индексе Яндекс можно с помощью оператора «host:», введя эту команду в его поисковую строку в комбинации с адресом веб-ресурса, данные по которому необходимо определить.
В итоге проверка индексации сайта в Яндекс и Google должна выдавать примерно одинаковые результаты с разницей не более чем в 10%.
Если различие более существенное, значит у одного из поисковиков проблемы с индексацией определенного количества страничек Вашего веб-ресурса. Нужно найти и устранить причины этих проблем. Возможно, требуется правильно настроить robots.txt. В этом файле могут присутствовать запреты на индексацию страничек ботами одного из поисковиков.
Альтернативные способы
- Также возможно проверить количество страниц в индексе Google, используя профессиональные инструменты, находящиеся в Search Console. Просмотрев соответствующий раздел Вы сможете узнать сколько страничек всего учтены поисковым ботом и сколько заблокированы в robots.txt.
- Похожий сервис (Яндекс.Вебмастер) дает возможность проверить количество страниц в индексе Яндекс.
Кроме количества есть возможность увидеть, какие страницы в индексе поисковика, а какие нет. Это может значительно упростить работу по исправлению ошибок, препятствующих правильной индексации веб-ресурса.
- Также выполнение подобной проверки возможно с помощью сторонних сервисов, которых в интернете огромное количество.
Хотя зачем что-то выдумывать? Кто сможет показать, какие страницы в индексе, лучше самих поисковиков и профессиональных инструментов, предоставленных ими же?
Если нужно определить, как много и какие страницы в индексе, есть достаточно способов, из которых каждый выбирает на свой вкус. Кому-то нравится минимализм и простота (оператор «site:»). А кто-то может любить, чтобы все было посложнее и посерьезнее.
Но независимо от выбранного способа, результат должен быть достигнут один – определить существующие проблемы с индексацией страничек веб-ресурса и по максимуму их устранить. Ведь индексация – самый важный момент в продвижении. Если она не работает или дает сбои, Вы просто тратите время и деньги впустую.
А Вам какой способ подходит? Или может Вы знаете и другие? Пишите об этом в комментариях!
Что такое индексация сайта (Как улучшить индексацию в Google)
Индексация сайта — это процесс сбора информации поисковой системой о содержимом вашего сайта. Во время индексации поисковые роботы (пауки) сканирую и обрабатывают web страницы, изображения, видео и другие доступные для сканирования файлы. Чтобы поисковая система быстро проиндексировала сайт: создайте карту сайта и добавьте ее в Google Search Console.
Сайт должен быть проиндексирован чтобы отображаться в поиске
Страницы, которые прошли сканирование и обработку, сохраняются в базу данных. Такая база называется «поисковой индекс». Именно в этой базе данных поисковая система ищет результаты, отвечающие на запросы пользователей.
Важно понимать:
- Если страницы нет в поисковом индексе — ее невозможно найти в поисковой системе.
- Индексация нужна чтобы участвовать в поиске.
- У каждой поисковой системы свой поисковой индекс, свои поисковые боты.
- Поисковой бот от Google называется Googlebot.
- Настройка индексации сайта, это базовый уровень работ по SEO.
Содержание статьи
Как проверить индексацию страницы?
Самый быстрый способ — написать в строку поиска команду site:[адрес страницы]. Такой поиск найдет все проиндексированные страницы сайта. Для того, чтобы просмотреть дату последнего сканирования страницы, напишите в строку поиска cache:[адрес проверяемой страницы]. Если вам нужно проверить индексацию конкретной страницы просто скопируйте ее адрес и введи в поиск запрос site:[адрес страницы]. Этот метод будет работать как в Google так и в Yandex или Bing.
Совет: Сравните количество проиндексированных страниц с реальным количеством страниц на сайте. Это поможет быстро оценить есть ли у вашего сайта проблемы с индексацией. К примеру: если на сайте 100 товаров, 10 разделов и 10 информационных страниц (в сумме 120), а в индексе только 50 страниц, это означает, что поисковая система не знает о большей части вашего сайта.
Как проверить индексацию всего сайта
Для проверки индексации сайта нужно выполнить 2 простых шага:
- Узнать сколько страниц на сайте. Для этого просканируйте свой сайт специальными инструментами. Если ваш сайт до 500 страниц вам подойдет бесплатная версия Screaming Frog , если этого недостаточно используйте, бесплатный Site Analyzer. В разделе «HTML» вы увидите общее количество страниц вашего сайта.
- Зайдите в инструменты для вебмастеров или Google Search Console (Что такое Google Search Consol ) откройте отчет «Покрытие» и просмотрите количество страниц в статусе «Без ошибок». Количество страниц в сканере Site Analyzer и страниц в Google Search Console должно приблизительно совпадать. Это, будет означать, что основные страницы сайта сканируются. Если часть страниц попала в группу «Исключено» вы можете изучить причины исключения страниц. В этом же отчете вы можете познакомиться с историей индексации вашего сайта за последние 3, 6 или 12 месяцев.
- Довольно часто в отчете «Покрытие» вы можете увидеть большое количество страниц в статусе «Страница просканирована, но пока не проиндексирована» — это означает, что поисковая система уже получила данные о ваших страницах но пока не обработала их до конца. Так же, страницы могут находиться в этом статусе по причине низкого качества: пустые страницы или страницы с повторяющимся содержанием. Если количество «пока не проиндексированных» страниц не сокращается попробуйте уникализировать, добавить содержание или увеличить количество качественных внешних ссылок на свой сайт.
- Если вам нужно массово проверить индексацию страниц вашего сайта, воспользуйтесь онлайн инструментом https://indexchecking.com
- Хорошая идея проверить свой сайт с помощью инструментов https://en.ryte.com — это поможет вам понять какие страницы закрыты от индексации. А так же, обнаружить страницы на которых есть технические проблемы.
Проверяем не закрыта ли отдельная страница от индексации
Если перед вами появилась задача, проверить запрет индексации конкретной страницы проще всего использовать инструменты для вебмастеров. Скопируйте адрес страницы которую вы хотите проверить и вставьте в инструмент «Проверка URL на ресурсе».
В результате проверки вы получите информацию о запретах индексации. Обратите внимание на информацию о запретах, статусе страницы и канонический адрес.
Как добавить новый сайт в индекс поисковиков?
Сообщите поисковой системе о своем сайте в специальном инструменте Google или Yandex. Поделитесь своим сайтом в социальной сети или создайте на него ссылку с другого, уже проиндексированного сайта.
Узнайте больше о работе поисковой системы
Что делать, если сайт плохо индексируется?
Прежде всего нужно проверить не закрыт ли сайт от индексации. Это можно сделать по инструкции в этой статье чуть выше. Основные способы улучшить индексацию:
- Создайте карту сайта и загрузите в инструменты для вебмастеров.
- Обновите старые страницы.
- Удалите пустые страницы.
- Поставьте дополнительные ссылки на сайт с сторонних сайтов и соц. сетей.
Как происходит индексация сайта
Для решения проблем нужно разобраться в процессе индексации подробнее. С технической точки зрения “индексацию сайта” правильнее рассматривать как два отдельных процесса:
- Сканирование страниц.
- Обработка страниц.
Этап 1: Сканирование
Сканирование или “обход” страниц — это основная задача, которую выполняет поисковой бот. Попадая на новую страницу, бот получает со страницы два набора данных:
- Содержание самой страницы, информацию о сервере и служебные данные. А именно: ответ сервера, html код страницы, файлы css стилей, скриптов, изображений.
- Перечень ссылок, которые находятся на странице.
Полученное содержание передается для дальнейшей обработки и сохранения в базу. Просканированные ссылки так же сохраняются в специальный список — “очередь сканирования”, для дальнейшей обработки.
Когда бот добавляет в очередь индексации страницу, которая уже есть в очереди, эта страница занимает более высокое место в списке и индексируется быстрее. А это значит, что первый способ ускорить сканирование сайта — увеличить количество ссылок на нужные страницы.
Создавая очередь сканирования, google bot, как и другие поисковые боты, изучает карту сайта sitemap и добавляет в очередь ссылки из этой карты. Второй способ улучшить индексацию — создать карту сайта sitemap.xml и сообщить о ней поисковой системе. Карта сайта — самый простой способ отправить на индексацию все страницы в рамках нашего домена.
Есть несколько способов создать карту сайта:
- Бесплатный онлайн инструмент для сайтов до 500 страниц www.xml-sitemaps.com.
- Программа для сканирования сайта, с возможностью создания sitemap — xenu links.
- Библиотека приложений для создания sitemap.
- Самый популярный плагин для создания карты сайта для WordPress.
Чтобы Google узнал о вашем sitemap, нужно добавить ссылку на карту сайта в инструментах search console или файле robots.txt
Добавление карты сайта в Search Console:
- Зайдите в https://search.google.com/search-console/
- Добавьте свой сайт или выберите из списка.
- Перейдите в раздел Сканирование — Файлы Sitemap.
- Выберите “добавить файл sitemap”, вставьте ссылку и добавьте карту сайта.
Добавление sitemap в robots.txt:
- Зайдите в корневой каталог сайта через ftp.
- Откройте файл robots.txt
- Добавьте в конец файла строку “Sitemap: [адрес сайта]/sitemap.xml” и сохраните файл.
Третий способ ускорить индексацию — сообщить поисковому боту о дате последнего изменения страницы. Для получения даты и времени изменения страницы боты используют данные из заголовка ответа сервера lastmod. Сообщить наличие изменений на странице можно с помощью кода ответа not modify.
Инструмент проверки заголовка lastmod и ответа сервера not modify.
Наличие настроек lastmod и not modify позволяют поисковой системе быстро получить информацию о том, изменилась ли страница с даты последнего сканирования. Благодаря этому поисковой бот ставит в приоритет новые и измененные страницы, а новые страницы быстрее индексируются.
Для настройки lastmod и not modify вам нужно будет обратиться к веб разработчику.
Этап 2: Обработка данных
Перед тем как сохранить информацию в базу данных, она проходит обработку и структуризацию, которая необходима для ускорения дальнейшего поиска.
В первом шаге обработки программа-индексатор формирует страницу с учетом всех стилей, скриптов и эффектов. В этот момент программа-индексатор понимает расположение элементов на странице, определяет видимые и невидимые пользователю части, разделяет страницу на навигацию и содержание.
Важно чтобы google bot имел полный доступ к css и js файлам, ведь без них индексатор не сможет понять структуру страницы. Для проверки доступности всех служебных файлов зайдите в Google Search Console, отчет “Посмотреть как Googlebot” в разделе “Сканирование”. Проверьте с помощью этого инструмента основные страницы сайта, обратите внимание на различия между тем, как вашу страницу видит поисковой бот и как ее видит пользователи. Изучите таблицу из отчета. Все ресурсы, которые размещены на вашем домене, должны быть открыты для сканирования.
Сейчас Google использует алгоритм индексации, который называется Caffeine. Он был запущен в 2009 году. Основные задачи этого алгоритма:
- Обработка современных страниц, использующих сложные js и css элементы.
- Максимально быстрое сканирование всех страниц в Интернете.
Анализ текста при индексации
После разделения страницы на зоны и определения их важности, алгоритм выделяет из содержания основные элементы для дальнейших расчетов. Так одним из самых популярных показателей, которые поисковая система извлекает из страницы, является частота упоминания ключевого слова.
Стоит отметить, что перед расчетом частоты упоминания слова, индексатор проводит упрощение слов к элементарной форме. Этот процесс называется стеминг. Такое упрощение позволяет учитывать слово в разных словоформах как одно слово.
Частота упоминания (Term frecency, ТА) слова рассчитывается как отношение упоминания слова к общему количеству слов страницы. Пример: если на странице 100 слов и слово “машина” встречалось на ней 2 раза — частота упоминания слова “машина” будет равна TF=0,02
Самый простой поисковой индекс легко представить в виде огромной таблицы, в столбцах которой перечислены все слова языка, а в строках — адреса всех страниц. При этом в ячейках указаны частоты слов на соответствующих страницах.
Именно такая таблица позволяет поисковой системе быстро находить страницы, которые содержат нужные слова. Конечно современные поисковые системы учитывают не только частоту упоминания слов, но и более сложные факторы. Поисковой индекс Google значительно сложнее чем приведенный пример.
Анализируя содержание поисковая система проверяет уникальность страницы. Тексты и прочее содержание, которое уже было проиндексировано на других страницах, не несет ценности для системы, так как не добавляет в базу новой информации. А это значит, что страницы с низкой уникальностью могут быть не проиндексированы. Проверить уникальность достаточно просто с помощью бесплатных инструментов.
Старайтесь создавать максимально уникальный и полезный контент и он точно будет проиндексирован.
От чего зависит индексация сайта?
- Доступность сайта для индексации — если сканирование сайта запрещено поисковая система не сможет получить его страницы. Подробнее о инструментах управления индексацией: youtube.com Внутренняя оптимизация: robots.txt, sitemap
- Количество ссылок на ваш сайт — ссылки, это пути которые приводят поисковых роботов к вам на сайт. Чем больше ссылок с популярных ресурсов вы получаете, тем чаще будут сканироваться страницы вашего сайта.
- Частота обновления сайта. Поисковые системы всегда ищут новый интересный контент, чем чаще вы публикуете новое уникальное содержание, тем быстрее поисковая система будет его сканировать.
- Наличие сайта в инструментах поисковых систем. Видео в тему: Как зарегистрировать сайт в Google Search Console.
Подведем итоги
- Индексация — это процесс сканирования и обработки содержания для хранения в базе данных поисковой системы.
- Ускорить индексацию можно с помощью ссылок, карты сайта и настроек сервера.
Чтобы поисковая система понимала ваши страницы, все ресурсы вашего сайта должны быть доступны поисковому боту.
Мы можем проверить и настроить индексацию вашего сайта за вас.
SEO аудит с рекомендациями за 10 дней.
Надеюсь у вас больше не возникнет вопрос: “Что такое индексация сайта”.
Руководитель отдела продвижения SEO7. Ведущий Youtube канала Школа SEO. Автор блога о поисковой оптимизации seo-sign.com
10 действенных способов заставить Google индексировать ваш сайт
Если ваш сайт не индексируется Google, то он практически невидим. Он не будет попадать в результаты поиска и получать естественный трафик. Совсем. Вообще. Ничего.
Если вы читаете эту статью, то это вам уже и так известно. Так что перейдем сразу к делу.
Эта статья поможет вам решить три проблемы:
- Ваш сайт вообще не индексируется.
- Часть страниц сайта индексируется, а часть — нет.
- Свежеопубликованные статьи индексируются недостаточно быстро.
Но сперва давайте убедимся, что мы имеем в виду одно и то же, когда говорим об «индексировании».
Что такое краулинг и индексирование?
Google находит новые страницы при помощи паука, который ползает по Всемирной паутине («краулинг» дословно означает «ползание») и добавляет страницы в свою базу данных — индекс. Этот паук называется поисковым роботом, а у робота Google есть собственное имя — Гуглбот (Googlebot).
Запутались? Давайте дадим определения основным терминам.
- Краулинг — процесс перехода по гиперссылкам в Интернете с целью нахождения нового контента.
- Индексирование — процесс сохранения каждой веб-страницы в обширной базе данных.
- Поисковый робот — Программа, которая выполняет краулинг.
- Googlebot — поисковый робот Google.
Вот видео от Google, в котором этот процесс подробно объясняется:
Когда вы ищете что-то в поисковике Google, он выдает все релевантные страницы из своей базы данных — индекса. Поскольку часто запросу могут соответствовать миллионы страниц, алгоритм ранжирования Google делает все возможное, чтобы отсортировать их так, чтобы первыми шли страницы, которые лучше всего отвечают запросу.
Тут важно понимать, что индексирование и ранжирование — это совершенно разные вещи.
Индексирование — это регистрация на участие в гонке, а ранжирование — это распределение призовых мест.
Нельзя победить в гонке, не зарегистрировавшись сперва.
Как узнать, есть ли ваш сайт в индексе Google
Откройте сайт Google и введите в поиск site:ваш_сайт. com
Это число примерно показывает, сколько страниц вашего сайта содержится в индексе Google.
Если вы хотите узнать состояние индексирования конкретного URL-адреса, используйте тот же самый оператор site:ваш_сайт.com/адрес_страницы
.
Если результатов не будет, значит, страницы нет в индексе.
Стоит заметить, что если вы пользуетесь Google Search Console, то можете воспользоваться отчетом «Покрытие», чтобы получить более точные сведения о состоянии индексирования вашего сайта. Просто перейдите в раздел:
Google Search Console > Индексирование > Покрытие
Посмотрите на число действительных страниц (с предупреждениями и без).
Если эти числа в сумме отличаются от нуля, значит, по крайней мере часть страниц вашего сайта содержится в индексе Google. Если же оба числа равны нулю, то у вас серьезная проблема, поскольку ни одна страница сайта не проиндексирована.
Примечание.
Вы не пользуетесь Google Search Console? Зарегистрируйтесь. Это бесплатно. Каждый владелец сайта, которого заботит поисковый трафик, должен использовать Google Search Console. Да, настолько это важно.В Search Console можно также проверить, проиндексирована ли конкретная страница. Для этого вставьте ее URL-адрес в Инструмент проверки URL.
Если страница проиндексирована, то сервис выдаст сообщение «URL есть в индексе Google».
Если нет — то «URL нет в индексе Google».
Как сделать так, чтобы Google индексировал ваш сайт
Обнаружили, что Google не индексирует ваш сайт или страницу? Попробуйте следующее:
- Откройте Google Search Console.
- Перейдите в Инструмент проверки URL.
- Вставьте в строку поиска URL-адрес, который вы хотите видеть в индексе Google.
- Подождите, пока Google проверит адрес.
- Нажмите кнопку «Запросить индексирование».
Это полезно делать, когда вы публикуете новую статью или страницу. Так вы напрямую сообщаете Google о том, что добавили что-то новое на свой сайт и что поисковику следует взглянуть на это.
Однако непосредственный запрос не поможет решить глубинные проблемы, которые препятствуют индексированию старых страниц. Если это ваш случай, то пройдитесь по приведенному ниже списку, чтобы диагностировать и решить проблему.
Вот ссылки на каждую тактику — на случай, если вы пробовали часть из них:
- Удалите блокирующие условия из файла robots.txt
- Удалите шальные теги noindex
- Добавьте адрес страницы в файл sitemap
- Удалите шальные теги canonical
- Проверьте, не является ли страница сиротой
- Почините внутренние nofollow-ссылки
- Добавьте «сильные» внутренние ссылки
- Убедитесь, что страница уникальна и обладает ценностью
- Удалите некачественные страницы (чтобы оптимизировать «краулинговый бюджет»)
- Получите качественные обратные ссылки
1) Удалите блокирующие условия из файла robots.txt
Google не индексирует весь ваш сайт? Причиной может быть блокирующее условие в файле robots.txt.
Чтобы проверить эту возможность, перейдите по адресу ваш_сайт.com/robots.txt.
Посмотрите, нет ли в тексте одного из этих фрагментов:
User-agent: Googlebot</p> <p>Disallow: /
User-agent: *</p> <p>Disallow: /
Оба этих фрагмента сообщают Гуглботу, что ему нельзя сканировать страницы вашего сайта. Чтобы исправить проблему, просто удалите их. И всё.
Блокирующее условие в файле robots.txt может быть виновным и в том случае, когда Google не индексирует отдельную страницу. Чтобы проверить этот вариант, вставьте адрес страницы в Инструмент проверки URL в Google Search Console. Откройте раздел «Покрытие» и поищите ошибку «Сканирование разрешено? Нет: заблокировано через robots.txt».
Эта ошибка указывает на то, что страница заблокирована в файле robots.txt.
В таком случае поищите в файле robots.txt любые правила «disallow», относящиеся к странице или содержащему ее подкаталогу.
Важная страница заблокирована для индексирования в файле robots. txt.
Если нужно, удалите эти правила.
2) Удалите шальные теги noindex
Google не станет индексировать страницы, если попросить об этом. Так вы можете оградить некоторые страницы от публичного доступа. Есть два способа сделать это:
Способ 1: тег meta
Страницы с одним из этих тегов meta в секции <head>
не индексируются Google:
&lt;meta name=“robots” content=“noindex”&gt;
&lt;meta name=“googlebot” content=“noindex”&gt;
Это мета-тег robots, который сообщает поисковым системам, следует ли им индексировать данную страницу.
Примечание.
Главная часть — это значение “noindex”. Если вы видите его, значит, страница помечена как неиндексируемая.Чтобы найти на своем сайте все страницы с мета-тегом noindex, запустите сканирование в сервисе Site Audit от Ahrefs. Перейдите в отчет Indexability («Индексируемость»). Поищите предупреждения «Noindex page» («Неиндексируемая страница»).
Нажмите на одно из них, чтобы увидеть все такие страницы. Удалите мета-тег noindex со всех страниц, где он не нужен.
Способ 2: X‑Robots-Tag
Поисковые роботы также учитывают заголовок HTTP-ответа X‑Robots-Tag. Вы можете реализовать его на скриптовом языке для серверной стороны типа PHP, через файл .htaccess file или через изменение конфигурации своего сервера.
Инструмент проверки URL в Search Console позволяет узнать, блокирует ли Google сканирование страницы из-за заголовка. Просто введите свой URL-адрес, а затем поищите ошибку «Индексирование разрешено? Нет: обнаружено значение ‘noindex’ в HTTP-заголовке X‑Robots-Tag».
Если вы хотите исправить эту проблему на своем сайте, запустите сканирование в сервисе Site Audit от Ahrefs, а затем примените фильтр «Robots information in HTTP header» («Информация для роботов в заголовке HTTP») в разделе Page Explorer:
Попросите своего разработчика исключить страницы, которые нужно индексировать, из числа тех, что возвращают такой заголовок
Рекомендуем прочесть: Использование HTTP-заголовка X‑Robots-Tag для поисковой оптимизации: Секреты и хитрости
3) Добавьте адрес страницы в файл sitemap
Файл sitemap сообщает Google, какие страницы вашего сайта важны, а какие нет. Также он может рекомендовать, как часто следует повторно сканировать определенные страницы.
Google способен находить страницы на вашем сайте независимо от того, представлены ли они в файле sitemap, но хорошей практикой является указание важных страниц. В конце концов, нет смысла усложнять работу Google.
Чтобы проверить, указана ли страница в файле sitemap, используйте Инструмент проверки URL в Search Console. Если вы увидите ошибку «URL нет в индексе Google» и «Sitemap: н/д», значит, страницы нет в файле sitemap или индексе.
Не пользуетесь Search Console? Перейдите по URL-адресу своего файла sitemap — обычно этоваш_сайт.com/sitemap.xml — и поищите адрес страницы.
Либо, если вы хотите найти все сканируемые и индексируемые страницы, которых нет в файле sitemap, запустите сканирование в сервисе Site Audit от Ahrefs. Перейдите в Page Explorer и примените следующие фильтры:
Вы получите список страниц, которые следует добавить в файл sitemap. Когда вы это сделаете, сообщите Google о том, что вы обновили свой файл sitemap, перейдя по этому URL:
http://www.google.com/ping?sitemap=<полный_URL_адрес_файла_sitemap>
Только подставьте туда URL-адрес своего файла sitemap. Вы увидите что-то подобное:
Это должно ускорить индексирование страницы поисковой системой.
4) Удалите шальные теги canonical
Тег каноничности (тег canonical) сообщает Google о канонической версии страницы. Выглядит он так:
<link rel=“canonical” href=“/страница.html”/>
Большая часть страниц либо не имеют тега canonical, либо содержат так называемый автореферентный тег canonical. Он сообщает поисковой системе о том, что страница сама является канонической, а возможно, и единственной версией. Другими словами, вы хотите, чтобы эта страница индексировалась.
Но если на страницу затесался шальной тег canonical, он может направить Google на каноническую версию страницы, которая на самом деле не существует. В таком случае страница не будет проиндексирована.
Чтобы проверить такую возможность, воспользуйтесь Инструментом проверки URL от Google. Если тег каноничности указывает на другую страницу, то вы увидите предупреждение «Альтернативная каноническая страница».
Если такого быть не должно, и вы хотите, чтобы страница индексировалась, удалите тег каноничности.
ВАЖНО
Имейте в виду, что теги каноничности не всегда плохи. Чаще всего они добавляются не просто так. Если вы видите, что ваша страница содержит такой тег, проверьте страницу, которая указана как каноническая. Если окажется, что это и правда приоритетная версия страницы, которую нужно индексировать, то тег canonical следует оставить.
Если вы хотите быстро найти все шальные теги canonical на своем сайте, запустите сканирование в сервисе Site Audit от Ahrefs. Перейдите в раздел Page Explorer. Используйте такие настройки:
Они запустят поиск страниц в файле sitemap с неавтореферентными тегами каноничности. Если поиск с этим фильтром выдаст какие-либо результаты, вам следует разобраться с ними, поскольку вы наверняка хотели бы, чтобы эти страницы индексировались.
Высока вероятность того, что эти страницы либо содержат ошибочные теги каноничности, либо наоборот — не должны находиться в файле sitemap.
5) Проверьте, не является ли страница сиротой
Страницы-сироты — это такие страницы, на которые не ведет ни одной внутренней ссылки.
Поскольку Google находит новый контент, перемещаясь по Всемирной паутине от одной страницы к другой, он не может найти таким образом страницы-сироты. Точно так же их не смогут найти посетители сайта.
Чтобы найти страницы-сироты, просканируйте свой сайт при помощи сервиса Site Audit от Ahrefs. Затем откройте отчет Incoming links (Входящие ссылки) для ошибок «Orphan page (has no incoming internal links)» («Страница-сирота (не имеет входящих ссылок)»):
В нем показаны все индексируемые страницы, указанные в файле sitemap, на которые при этом не ведет ни одна внутренняя ссылка.
ВАЖНО
Чтобы это сработало, должны быть выполнены два условия:
- Все страницы, которые вы хотите видеть индексированными, указаны в вашем файле sitemap.
- При создании проекта в сервисе Site Audit от Ahrefs вы поставили галочку «Использовать страницы в файлах sitemap как исходные пункты для сканирования».
Вы не уверены, что все страницы, которые вы хотите видеть индексированными, указаны в файле sitemap? Попробуйте следующее:
- Загрузите полный список страниц вашего сайта (через систему CMS).
- Просканируйте сайт (при помощи Site Audit от Ahrefs или подобного сервиса).
- Сравните полученные списки URL-адресов.
Все адреса, не найденные в процессе сканирования, принадлежат страницам-сиротам.
Вы можете решить проблему страниц-сирот двумя способами:
- Если страница не важна, удалите ее и уберите из файла sitemap.
- Если страница важна, добавьте ее в схему внутренних ссылок сайта.
6) Почините внутренние nofollow-ссылки
Nofollow-ссылки — это ссылки с тегом rel=“nofollow”. Они препятствуют передаче показателя PageRank целевому URL-адресу. К тому же, Google не сканирует nofollow-ссылки.
Вот что об этом заявляют в Google:
По сути, использование атрибута nofollow заставляет Google не включать целевые ссылки в общий граф сети. Тем не менее, целевые страницы все равно могут попасть в наш индекс, если на других сайтах встретятся ссылки на них без атрибута nofollow либо если URL-адреса будут указаны в файле Sitemap.
Короче говоря, вам нужно убедиться, что внутренние ссылки на индексируемые страницы не должны иметь атрибута nofollow.
Для этого просканируйте свой сайт при помощи Site Audit от Ahrefs. В отчете Incoming links (Входящие ссылки) поищите индексируемые страницы с ошибками «Page has nofollow incoming internal links only» («На страницу ведут только внутренние nofollow-ссылки»):
Удалите атрибут nofollow из внутренних ссылок, если вы хотите, чтобы Google индексировал страницы, на которые они ведут. Если нет, то удалите страницы либо пометьте их тегом noindex.
Рекомендуем прочесть: Что такое nofollow-ссылки? Все, что вам нужно знать (без жаргона!)
7) Добавьте «сильные» внутренние ссылки
Google находит новый контент, сканируя ваш сайт. Если вы пренебрегаете созданием внутренних ссылок, то поисковик может и не найти некоторые страницы.
Одно из простых решений этой проблемы — добавить несколько внутренних ссылок, ведущих на нужную страницу. Разместить ссылки можно на любых других страницах, которые Google может сканировать и индексировать. Но если вы хотите, чтобы Google проиндексировал целевой контент как можно быстрее, то лучше всего разместить ссылку на одной из самых «сильных» страниц.
Почему? Потому что Google сканирует такие страницы чаще.
Для этого перейдите в Site Explorer от Ahrefs, введите адрес своего сайта, а затем откройте отчет Best by links (Лучшие по ссылкам).
В нем будут перечислены все страницы вашего сайта, отсортированные по показателю URL Rating (UR). Другими словами, он показывает первыми самые авторитетные страницы.
Пролистайте этот список, чтобы найти подходящие страницы, куда можно добавить внутренние ссылки на интересующую страницу.
Например, если мы хотим добавить внутреннюю ссылку на руководство по гостевому постингу, то руководство по линкбилдингу вполне подойдет для этого. Последняя страница очень кстати оказывается 11‑й по авторитетности в нашем блоге:
В следующий раз, когда Google будет сканировать эту страницу, он обнаружит новую ссылку и перейдет по ней.
СОВЕТ
Вставьте адрес страницы, на которой вы разместили внутреннюю ссылку, в Инструмент проверки URL от Google. Нажмите «Запросить индексирование», чтобы сообщить поисковой системе о том, что содержание страницы изменилось, и ее следует отсканировать заново. Это может ускорить процесс нахождения и индексирования той страницы, на которую ведет ссылка.
8) Убедитесь, что страница уникальна и обладает ценностью
Google, как правило, не индексирует некачественные страницы, которые не представляют ценности для пользователей. Вот что Джон Мюллер из Google говорил об индексировании в 2018 году:
Мы не индексируем все существующие URL-адреса, и это нормально. Сосредоточьтесь на том, чтобы делать сайт замечательным и вдохновляющим, и тогда у вас не будет проблем с индексированием.
— John (@JohnMu) January 3, 2018
То есть, если вы хотите, чтобы Google проиндексировал ваш сайт или страницу, их содержание должно быть «замечательным и вдохновляющим».
Если вы не находите технических причин отсутствия индексирования, возможно, виновником является отсутствие ценности. Поэтому нелишне будет взглянуть на страницу свежим взглядом и спросить себя, действительно ли эта страница имеет ценность и принесет ли она пользу тому, кто перейдет на нее из результатов поиска.
Если ответом будет «нет», значит, вам следует улучшить свой контент.
Вы можете использовать Site Audit от Ahrefs и URL Profiler, чтобы найти другие потенциально некачественные страницы, которые не индексируются. Для этого перейдите в раздел Page Explorer в Site Audit и установите такие настройки:
Так вы получите «слабые» страницы — индексируемые, но не приносящие в данный момент естественного трафика. Высока вероятность того, что они не проиндексированы.
Экспортируйте отчет, а затем вставьте все URL-адреса в URL Profiler и запустите проверку Google Indexation (Индексирование в Google).
Источник: https://urlprofiler.com/blog/google-indexation-checker-tutorial/
ВАЖНО
Если вы выполняете эту проверку для большого числа страниц (больше 100), то рекомендуется использовать прокси. Иначе вы рискуете тем, что Google забанит ваш IP-адрес. Если вариант с прокси не подходит, то введите в поиск Google «массовая проверка индексации в google бесплатно». Есть целый ряд инструментов, но в большинстве из них нельзя проверить более 25 страниц за раз.
Проверьте качество страниц, которые не индексируются. Улучшите качество, где это необходимо, и запросите индексирование в Google Search Console.
Также следует проверить возможность дублирования контента. Google старается не индексировать страницы-копии и очень похожие страницы. Загляните в отчет Content quality (Качество контента) в сервисе Site Audit, чтобы проверить этот вариант.
9) Удалите некачественные страницы (чтобы оптимизировать «краулинговый бюджет»)
Слишком большое число некачественных страниц на сайте приводит к пустой трате краулингового бюджета.
Вот что об этом говорят в Google:
[Страницы-с-низкой-ценностью] отвлекают на себя активность сканирования от страниц, которую действительно имеют ценность, что способно приводить к значительным задержкам в обнаружении хорошего контента на сайте.
Представьте, что учитель проверяет сочинения, одно из которых — ваше. Если ему нужно оценить десять сочинений, то он довольно быстро доберется до вашего. Если сочинений будет сто, то ему потребуется гораздо больше времени. Если их будут тысячи, то нагрузка будет слишком высокой, и учитель может вообще никогда не добраться до оценки вашего сочинения.
В Google заявляют, что «краулинговый бюджет […] — это не то, о чем большинству стоит беспокоиться», и что «если на сайте меньше нескольких тысяч адресов, то большую часть времени он будет сканироваться эффективно».
Тем не менее, удаление некачественных страниц с вашего сайта никогда не повредит. Это только пойдет на пользу краулинговому бюджету.
Вы можете использовать наш шаблон аудита контента, чтобы найти потенциально некачественные и нерелевантные страницы, которые можно удалить.
10) Получите качественные обратные ссылки
Обратные ссылки сообщают Google о том, что страница, на которую они ведут, важна. Раз кто-то дает на нее ссылку, значит, у нее должна быть некая ценность, верно? Поэтому Google индексирует страницы с обратными ссылками.
Для полной прозрачности Google индексирует не только страницы, имеющие обратные ссылки. Есть множество (миллиарды) проиндексированных страниц без обратных ссылок. Но поскольку Google считает страницы с качественными ссылками более важными, поисковик будет быстрее и чаще сканировать такие страницы, чем те, у которых нет обратных ссылок. То есть, индексирование страниц с качественными обратными ссылками происходит быстрее.
В нашем блоге есть много материалов по созданию качественных обратных ссылок.
Ниже приведены ссылки на некоторые из них.
Индексирование и ранжирование — это разные вещи
Наличие вашего сайта в индексе Google не означает, что он будет попадать в выдачу и приносить трафик.
Это разные вещи.
Индексирование означает только то, что Google известно о существовании вашего сайта. Это не означает, что ваш сайт будет показан в топе выдачи по подходящим запросам.
Тут-то и вступает в дело SEO — искусство оптимизации веб-страниц для попадания в топ выдачи по определенным запросам.
В общих чертах поисковая оптимизация (SEO) включает в себя:
- Определение тем, которые ищут ваши клиенты.
- Создание контента на эти темы.
- Оптимизацию созданных страниц под целевые ключевые фразы.
- Наращивание обратных ссылок.
- Постоянное поддержание контента в актуальном состоянии.
Вот видео, которое поможет разобраться в основах SEO:
…И несколько статей:
Напоследок
Есть только две возможные причины, почему Google не индексирует ваш сайт или веб-страницу:
- Технические проблемы, которые не дают поисковому роботу сделать это.
- Качество контента — Google считает ваш сайт или страницу некачественными и бесполезными для своих пользователей.
Вполне возможно, что имеют место обе эти проблемы. Но, по моему опыту, технические проблемы встречаются гораздо чаще. Технические проблемы также могут стать причиной автоматического создания индексируемого некачественного контента (например, проблемы с фасетной навигацией). Это нехорошо.
Но проход по приведенному выше списку в девяти случаях из десяти должен решить проблемы индексирования.
Только не забывайте, что индексирование и ранжирование — это разные вещи. Выполнение поисковой оптимизации по-прежнему жизненно необходимо, если вы хотите вывести свои страницы в топ выдачи по подходящим поисковым запросам и привлечь стабильный поток естественного трафика.
Перевела Кирик Наталья, владелец студии по написанию текстов для сайтов WordFactory.ua
Как проверить, проиндексирована ли ваша страница и как исправить проблемы
Вы изо всех сил пытаетесь найти свою веб-страницу с помощью онлайн-поиска? В этом посте вы узнаете, как проверить, проиндексирована ли ваша страница.
Если вы не ранжируете ни по одному из своих критериев, каким бы конкретным он ни был, это может не иметь никакого отношения к качеству вашего контента — это может быть проблема индексации.
Каждая поисковая система извлекает свои результаты из индекса, и если веб-страница отсутствует в этом индексе, очевидно, что она не может появиться в результатах.Из-за этого проблема индексации может привести к потере всего вашего высококачественного контента и работы по оптимизации страницы.
Если вы не уверены, правильно ли индексируется ваша веб-страница, или вам нужен совет по решению проблемы с индексированием, эта статья для вас. Мы рассмотрим, как работает индексация, каковы наиболее распространенные проблемы индексации и как вы можете внести необходимые изменения, чтобы избежать повторных проблем с индексированием.
Как работает индексация
Когда новые веб-сайты или страницы размещаются в сети, они не сообщают о себе поисковым системам — они должны приложить усилия, чтобы их найти.Они делают это через ботов поисковых систем (иначе называемых сканерами). Сканеры, как следует из названия, проходят через веб-сайты, переходя по внутренним и внешним ссылкам с целью индексации и организации всего найденного контента.
Все собранные данные передаются обратно в индекс, готовые для использования поисковой системой. Когда пользователь отправляет поисковый запрос, поисковая система делает следующее:
- Разобрать запрос, чтобы лучше понять намерения искателя.
- Отфильтровать индекс в соответствии с предполагаемым намерением.
- Выберите все страницы, которые сочтены подходящими (с учетом большого количества факторов).
- Представьте их пользователю в порядке актуальности.
Поскольку страницы регулярно обновляются, качество и соответствие определенным темам повышаются или понижается, поисковые роботы должны регулярно возвращаться на проиндексированные сайты. Насколько регулярно сканируется сайт, будет зависеть от того, как часто он меняется, насколько авторитетным он считается, а также от множества других показателей.
Почему некоторые страницы не следует индексировать
Поисковые индексы — это не просто базы данных всего, что найдены сканерами.
Есть три причины, по которым было бы плохой идеей перечислять абсолютно все живые ссылки в поисковом индексе:
- Цель поискового индекса — хранить ссылки, соответствующие намерениям поисковика, а определенные страницы (и типы страниц) не содержат такого содержания и не заслуживают включения. Например, веб-сайты с фильтрами продуктов часто могут автоматически создавать длинные списки различных URL-адресов для фильтрованных или отсортированных просмотров, и многие из этих просмотров никому не будут интересны. Кроме того, если несколько страниц имеют одинаковое содержание, только на одной из них должна быть указана ссылка: поисковики не получат выгоды от нескольких ссылок на одно и то же содержание.
- Страница должна подходить как с точки зрения содержания, так и с технической точки зрения. Если пользователь щелкает ссылку с результатом поиска, а страница никогда не загружается, или открывает всплывающие окна со спамом, или предоставляет неприемлемый пользовательский интерфейс, то это плохо отражается на поисковой системе и отпугивает пользователя.
- Поисковые системы хотят, чтобы владельцы веб-сайтов самостоятельно курировали их, поскольку нет никакой пользы от включения страниц, которые владельцы не хотят индексировать.Иногда владельцы веб-сайтов хотят сохранить контент для потомков, но предпочитают архивировать его, потому что он устарел и / или не соответствует цели. Результаты поиска следует ограничивать наиболее полезными страницами, и это те страницы, которые владельцы веб-сайтов активно хотят видеть.
В результате поисковая система может по разным причинам не проиндексировать страницу. Сканер может не только решить, что страница не стоит включать, но и владелец веб-сайта может указать, что страница не должна индексироваться, и даже пометить определенные ссылки на страницы как неподходящие для индексации, чтобы роботы не беспокоились о том, чтобы следить за ними в первую очередь. место.
Как узнать, проиндексирована ли страница
Чтобы узнать, проиндексирована ли страница Google, воспользуйтесь нашей бесплатной проверкой индекса Google. Вы можете использовать этот инструмент для массовой проверки до 10 URL-адресов одновременно. Если страница не проиндексирована, он сообщит вам, проиндексирован ли домен по крайней мере (то есть проиндексированы некоторые другие страницы из домена).
Распространенные причины, по которым страница не индексируется
Как уже отмечалось, существует множество причин, по которым страница не индексируется. Вот самые распространенные:
- Сканеры не могут его найти. Если на вашем веб-сайте нет исчерпывающей XML-карты сайта (списка всех страниц для индексации) или внутренних ссылок на определенную страницу, или если он спрятан глубоко внутри папок, часто сканер не сможет найти его, и таким образом, он не сможет его проиндексировать.
- Для страницы задано значение «noindex». Даже если у вас есть внутренняя ссылка на страницу или внешняя ссылка, указывающая на нее из другого домена, страница могла быть помечена как «noindex», что привело к тому, что сканеры ее проигнорировали.
- Заблокирован в robots.txt. Каждый веб-сервер предоставляет файл с именем txt, содержащий инструкции для поисковых роботов. Если файл robots.txt запрещает всем сканерам индексировать сайт, это, очевидно, огромная проблема. Хотя это редкость, разработчик не так уж редко пытается заблокировать определенные страницы, но случайно в конечном итоге блокирует гораздо больше в процессе.
- Недостаточно высокий уровень качества. Если в вашем домене есть малоценные ссылки и недостаточно контента (или вообще нет контента), поисковые системы могут принять решение не ранжировать некоторые или все ваши страницы, чтобы поддерживать высокий стандарт.
Существуют различные другие возможные причины, по которым страницы не индексируются, но они могут быть довольно сложными с технической точки зрения и зависеть от конкретной природы вашего сайта. В подавляющем большинстве случаев объяснение будет одним из перечисленных выше.
Последствия проблем с индексацией
Степень влияния проблем индексации на веб-сайт зависит от характера и масштабов проблем, а также от того, на какие страницы они влияют. Если небольшая страница на вашем сайте не проиндексирована, это еще не конец света, но если не проиндексирована качественная, оптимизированная для SEO часть вечнозеленого контента, это огромная трата усилий.
А для веб-сайтов в секторе электронной коммерции индексирование имеет еще большее значение. Органический трафик на сегодняшний день является наиболее рентабельной формой трафика для страниц продуктов, поскольку он не требует никаких затрат, чтобы появиться в результатах поиска, в отличие от PPC или рекламы в социальных сетях. Если половина продуктов компании не проиндексирована, возможности для конверсии значительно уменьшаются.
Информация о том, когда страница будет проиндексирована
Владельцы веб-сайтов часто задают один конкретный вопрос: когда моя страница будет проиндексирована? К сожалению, окончательно узнать невозможно.Даже если вы делаете абсолютно все правильно, строго следуя рекомендациям Google и других поисковых систем, это будет зависеть от факторов, находящихся вне вашего контроля.
Поскольку поисковые индексы охватывают миллионы и миллионы страниц со всего мира и должны постоянно обновлять их сканирование для обеспечения актуальной информации, ваша страница может быть проиндексирована завтра, на следующей неделе или через пару месяцев.
Устойчивость возможна только за счет операционной эффективности, и нет никакой эффективности или ценности в попытках проиндексировать абсолютно все в срочном порядке.Вот почему Google говорит о бюджете сканирования, который определяет, как часто будет сканироваться страница.
Как проверить настройки Интернета для индексации
Чтобы проиндексированные страницы оставались правильно проиндексированными, новые страницы добавлялись в этот список, а нежелательные страницы не включались, важно, чтобы любая компания с большим присутствием в Интернете выделяла время и ресурсы на решение этой конкретной проблемы SEO.
На некоторой регулярной основе (возможно, каждые три месяца или около того) вам следует проводить тщательную проверку следующих вещей:
- Информационная архитектура вашего сайта.Все ли работает как надо с технической точки зрения? Как следует справляется с нагрузкой сервер?
- Ваша внутренняя структура ссылок. Достаточно ли у вас внутренних ссылок для регулярного сканирования? Вы можете быть довольно либеральными с внутренними ссылками, поскольку они предоставляют полезный контекст, но не переусердствуйте с ними, поскольку это может привести к штрафу.
- Ваша настройка хлебных крошек. Правильно ли вложены страницы и отнесены ли они к нужным категориям? Поддержание логической внутренней структуры очень важно для того, чтобы показать поисковым системам, что ваши страницы стоит индексировать.
Хотя для этого не потребуется становиться ИТ-экспертом, вам нужно будет либо разобраться со всеми этими концепциями, либо проконсультироваться с кем-то, кто точно знает, как проверить эти вещи и внести необходимые изменения.
Где индексирование подходит для вашей стратегии SEO
Когда компании думают о том, как SEO влияет на их маркетинговые стратегии, они склонны рассматривать технические аспекты SEO как второстепенные проблемы. Другие соображения по SEO, такие как контент-маркетинг или охват социальных сетей, являются более творческими и, следовательно, считаются более гламурными и интересными.
Проблема с таким мышлением, конечно, в том, что упускать из виду технические основы крайне глупо. Если вы планируете длительную кампанию по платной рекламе, работе в социальных сетях, производству контента и защите бренда, но не понимаете, что вы укрепляете авторитет вокруг страницы, которую нельзя проиндексировать в Google, это будет бесполезным вложением средств, поскольку как только кампания закончится, ваш трафик снова исчезнет.
Использование индексов для исследования конкурентов
Не говоря уже о вашем собственном индексировании, есть еще один аспект поисковых индексов, заслуживающий упоминания: исследование конкурентов.Посмотрев, какие страницы индексируются вашим конкурентом (а какие нет), вы можете получить представление о том, что они делают, и иметь возможность перепроектировать их стратегии.
Просто подумайте, сколько информации можно получить бесплатно с помощью простого поиска в Google. Если вы потратите немного времени на изучение того, как другие компании вашей отрасли обрабатывают индексацию, обратные ссылки и результаты поиска в целом, вы многое из этого получите.
Заключение, как проверить, проиндексирована ли ваша страница
Сделать веб-сайт высококонкурентным в Интернете — непростая задача даже в лучшие времена, независимо от того, сколько у вас хорошего контента или насколько хорошо вы взаимодействуете со своей аудиторией.Это требует времени и последовательности, и есть много других отличных сайтов, которые стоят выше вас, если вы позволите своим стандартам упасть.
Поскольку вы должны вкладывать так много времени и усилий в содержание, информирование и разработку пользовательского интерфейса, абсолютно необходимо убедиться, что вас не сдерживают фундаментальные технические проблемы, такие как отсутствие индексации важных страниц.
Мы рассмотрели, что такое индексирование, почему оно так важно, и как вы можете принять меры для выявления и преодоления распространенных проблем с индексированием.Остальное зависит от тебя. Найдите время, чтобы тщательно изучить настройки, и планируйте периодические проверки, чтобы убедиться, что ваши усилия не подорваны техническими проблемами, которых можно избежать.
Кейли Тойра : Контент-стратег
Наполовину финн, наполовину британец, маркетолог из Бристоля. Я люблю писать и исследовать такие темы, как рассказывание историй и маркетинг клиентского опыта. Я руковожу небольшой командой писателей в бутик-агентстве.
Google Index Checker — проверьте, проиндексирована ли какая-либо страница Google
Что такое Google Index
В индексе Google перечислены все веб-страницы, о которых знает Google. Это содержит сотни миллиардов веб-страниц и постоянно пополняется новыми страницами. Чтобы появиться в результатах поиска, веб-страница должна быть в индексе Google.
Чтобы проиндексировать страницу, ее сначала нужно просканировать. Google назначает краулинговый бюджет каждому интернет сайт. Бюджет сканирования определяется как «количество URL-адресов роботом Googlebot может и хочет сканировать «. Если на сайте слишком много страниц по сравнению с бюджет сканирования, не все его страницы будут просканированы и проиндексированы Google.
Что такое инструмент проверки индекса Google
Средство проверки индекса Google — это бесплатный инструмент SEO, предлагаемый Linkody, чтобы проверить, является ли страница или веб-сайт проиндексировано Google. Вы можете проверять до 10 URL-адресов одновременно. Если страница не проиндексирован, инструмент проверит, проиндексирован ли домен (т. е. другой страницы домена проиндексированы).
Как использовать Google Index Checker
Введите до 10 URL и нажмите «ПРОВЕРИТЬ СОСТОЯНИЕ ИНДЕКСА GOOGLE» кнопка.Инструмент проверит URL-адреса и предоставит статус индексации. для каждого из них. Этот статус может быть:
индексируется | Страница проиндексирована. |
страница не проиндексирована | Страница не проиндексирована, но другие страницы в этом домене индексируются. |
домен не проиндексирован | Ни одна страница в этом домене не проиндексирована. |
Когда использовать Google Index Checker
Проверьте, проиндексирован ли ваш сайт
Если ваш сайт не проиндексирован Google, он практически не существует.Он не будет отображаться в результатах поиска и не получит никаких органический трафик. Поэтому крайне важно убедиться, что ваш страницы проиндексированы.
Воспользуйтесь нашим инструментом проверки индекса Google, чтобы убедиться, что ваши страницы проиндексировано. Если это новая страница и инструмент сообщает, что она не проиндексирована, попробуйте снова несколько недель спустя. Как быстро будет проиндексирована новая страница, зависит от от авторитета сайта, его размера, глубины страницы и многие другие факторы.
Если по истечении этого времени страница все еще не индексируется, работайте над улучшением это и сделать ваш сайт более авторитетным в своей нише.Использовать наша бесплатная проверка авторитета веб-сайта инструмент для проверки авторитета вашего сайта.
Проверить ценность обратной ссылки
Если у вас есть обратная ссылка или вы ищете обратную ссылку со страницы, важно проверить, проиндексирована ли страница, чтобы узнать, имеет любую ценность. Если страница не проиндексирована Google, скорее всего, Google не знает об этой ссылке. Поэтому, когда вы работаете над получением новых ссылок, используйте наш индекс Google. Средство проверки, чтобы сначала проверить, проиндексированы ли ссылающиеся страницы.
Как интерпретировать результаты
По каким причинам страница не индексируется?
Несколько причин могут объяснить, почему страница не проиндексирована:
- Google еще не знает об этой странице. Это может произойти, если страница новая, и Google ее еще не просканировал.
- Google просканировал страницу, но не проиндексировал ее. Это может произойдет, если страница низкого качества или сайт слишком большой и Google не хочет тратить ресурсы на эту страницу.
По каким причинам домен не индексируется?
Домен не индексируется, если ни одна из его страниц не индексируется. Несколько причины могут объяснить, почему домен не индексируется Google:
- Домен новый, и Google его еще предстоит обнаружить.
- Google решил не индексировать сайт, или сайт был ранее индексировался, но Google решил его деиндексировать. В обоих случаях, это означает, что Google считает этот сайт спамом или нарушил Google Webmaster Рекомендации, например, с помощью черного SEO или покупки ссылки.Деиндексирование веб-сайта означает полное его удаление из результаты поиска.
Статус индекса и SEO-ценность обратных ссылок
Как статус индекса влияет на SEO-ценность ссылки?
- Если страница проиндексирована, ссылка «следовать» с этой страницы имеет некоторые SEO-ценность. Прочтите наше руководство, чтобы узнать о все критерии, влияющие на ценность ссылки.
- Если страница не проиндексирована, но домен есть, обратная ссылка с эта страница может иметь или не иметь какую-то ценность для SEO.Это может быть вопрос времени; Google может решить проиндексировать эту страницу в будущем. это также подозревал, что Google переходит по ссылкам и передает некоторую ценность даже если он решил не индексировать страницу. Поэтому ссылки из не проиндексированные страницы могут иметь некоторую ценность, но обычно лучше иметь ссылку с проиндексированной страницы.
- Если домен не проиндексирован, потому что веб-сайт новый, обратная ссылка с этого сайта не будет иметь большого значения.Если в домене есть был деиндексирован, сайт токсичен, и ссылка с любой страницы из этот сайт может быть вредным.
Как учесть обратную ссылку в зависимости от статуса ее страницы?
Используйте нашу программу проверки обратных ссылок Google, чтобы проверить статус индекса ссылающиеся страницы и избегайте потенциально опасных обратных ссылок:
- Если страница проиндексирована и по ссылке переходят, значит у нее есть SEO ценность. Используйте такой инструмент, как Linkody, для мониторинга ваши обратные ссылки и получать уведомление, если какая-либо из ваших ссылок будет удалена или изменилось.
- Если страница не проиндексирована, подождите несколько недель и проверьте ее статус очередной раз. Для индексации страницы Google может потребоваться некоторое время.
- Если домен не проиндексирован, Google мог оштрафовать веб-сайт и ссылка могут быть токсичными и нанести вред вашему рейтингу. это настоятельно рекомендуется отклонить страницу или весь домен. Прочтите наш руководство по отключению токсичных ссылок.
Что делать, если вы ищете обратную ссылку?
Используйте нашу программу проверки индекса Google, чтобы проверить статус индексации целевая страница, прежде чем потратить время и силы на размещение ссылки:
- Если страница проиндексирована и вы можете получить ссылку для перехода, сделайте это, ссылка будет иметь определенную SEO-ценность (за исключением всех остальных критериев).
- Если страница не проиндексирована, подождите несколько недель и проверьте ее статус очередной раз. А пока направьте свои усилия на другую страницу, индексируется.
- Если домен не проиндексирован, избегайте любой ценой получения ссылки с этой страницы или любой другой страницы этого сайта. Направьте свой попытки получить ссылку с другого веб-сайта. Прочтите наш гид по лучшему для получения обратных ссылок.
Google Index Checker, проверьте, проиндексированы ли ваши веб-страницы
Google постоянно посещает миллионы веб-сайтов и создает индекс для каждого интересующего их веб-сайта.Однако он может не индексировать каждый посещаемый сайт. Если Google не найдет ключевые слова, имена или темы, которые представляют интерес, он, скорее всего, не проиндексирует их.
Это причина, по которой многие владельцы веб-сайтов, веб-мастера и специалисты по SEO беспокоятся о том, что Google индексирует их веб-сайты. Потому что никто, кроме Google, не знает, как он работает и какие меры он устанавливает для индексации веб-страниц. Все, что мы знаем, — это три аспекта, которые Google обычно ищет и принимает во внимание при индексировании веб-страницы: релевантность контента, авторитетность и посещаемость.
Кроме того, нет определенного времени относительно того, когда Google посетит конкретный сайт или решит ли он его проиндексировать. Вот почему владельцу веб-сайта важно убедиться, что все проблемы на ваших веб-страницах устранены и готовы к поисковой оптимизации. Чтобы помочь вам определить, какие страницы вашего веб-сайта еще не проиндексированы Google, этот инструмент проверки индекса сайта сделает свою работу за вас.
Если ваш веб-сайт еще не проиндексирован, не беспокойтесь, потому что Google непрерывно проверяет и индексирует веб-сайты.Возможно, вы захотите сосредоточиться на улучшении контента на своем веб-сайте и увеличении трафика, потому что по мере роста трафика ваш веб-сайт также приобретает актуальность и авторитет, что затем заставит Google заметить его и начать его ранжировать. Просто продолжайте проверять индекс Google с помощью этого инструмента проверки индекса Google и работайте над повышением производительности своего сайта. Обычно для увеличения органического трафика может потребоваться время, особенно для недавно запущенных веб-сайтов.
Улучшение ваших ссылок также может помочь вам, вы должны использовать только подлинные ссылки. Не используйте платные фермы ссылок, так как они могут принести вашему сайту больше вреда, чем пользы. После того, как ваш веб-сайт будет проиндексирован Google, вы должны приложить все усилия, чтобы поддерживать его. Вы можете добиться этого, постоянно обновляя свой веб-сайт, чтобы он всегда был свежим, и вы также должны следить за тем, чтобы вы сохраняли его актуальность и авторитет, чтобы он занял хорошую позицию в рейтинге страниц.
Spark Logix StudiosПроверьте, проиндексирована ли веб-страница (бесплатный инструмент Google)
обновлено в январе 2021 г.
Проверить, проиндексирована ли веб-страница, очень просто.Что вам нужно сделать:
- Скопировать URL-адрес
- Вставить URL-адрес в поле формы ниже
- Просмотреть результаты
Вы можете проверить, проиндексирована ли страница, используя наши формы ниже. Одна форма предназначена для адреса http:, другая — для https :, но не включает эту часть URL-адреса при использовании инструмента.
Когда страница проиндексирована
Вы увидите следующее сообщение:
Это кеш Google Введенный вами URL .Он включает в себя снимок страницы в том виде, в котором он появился на DATE GMT . Текущая страница за это время могла быть изменена.
Если он не был проиндексирован, не беспокойтесь, мы покажем вам, как проиндексировать вашу страницу как можно скорее.
Важно проиндексировать веб-страницу
Очень важно проиндексировать веб-страницу на вашем сайте. В противном случае ваш сайт будет полностью невидим для тех, кто ищет в Google.
Это происходит автоматически, если вы правильно создаете свой веб-сайт, но иногда могут возникать ошибки, которые мешают правильному индексированию вашего сайта поисковыми системами.
Если ваша страница не была проиндексирована Google, она не будет отображаться в результатах поиска Google.
Также важно обеспечить индексацию ваших списков каталогов и других веб-ресурсов (например, бизнес-каталогов) (чтобы использовать как можно больше сигналов ранжирования).
Вот отличное видео от Google, объясняющее, как работает индексирование и почему оно так важно.
Проверьте, проиндексирована ли ваша веб-страница
Как проиндексировать ваши ссылки
Что делать, если ваши ссылки не проиндексированы? На самом деле процесс довольно прост.
Шаг 1. Регистрация в Google Search Console
Вам понадобится учетная запись Google (по сути, Gmail), и вам нужно будет подтвердить, что вы являетесь владельцем URL. Но это довольно просто. Просто следуйте инструкциям Google.
Шаг 2. Введите URL-адрес в строку поиска.
Он находится прямо вверху страницы. Введите URL-адрес, который нужно проиндексировать, и нажмите Enter или щелкните значок увеличительного стекла.
Шаг 3. Нажмите «Запросить индексирование»
Вот и все.После того, как вы нажмете на нее, ваш URL попадет в очередь Google для индексации, и через пару дней ваша страница будет проиндексирована.
Есть вопросы?
Хотите задать конкретные вопросы и получить совет? Свяжитесь с нами сегодня, и мы научим вас, как правильно составить стратегию цифрового маркетинга. Никаких обязательств и затрат!
Еще от Spark Logix Studios
9 типов цифрового маркетинга (и способы их использования!)
Цифровой маркетинг — это не просто модное слово, которое используют на сетевых мероприятиях.Вам необходимо понимать, какие виды цифрового маркетинга есть в вашем распоряжении.
Советы по PageSpeed Insights
Вы тестировали свой веб-сайт с помощью Google PageSpeed Insights, но не знаете, как исправить обнаруженные проблемы? Я нашел несколько советов и методов, которые отлично работают практически на любом веб-сайте WordPress.
В чем разница между плагинами и виджетами?
Плагины и виджеты играют большую роль в гибкости WordPress, они были созданы большим сообществом, стремящимся помочь другим настроить свой веб-сайт и добавить необходимые функции.
Тест тегов Noindex | SEO Site Checkup
Проверьте, использует ли ваша веб-страница метатег robots или HTTP-заголовок X-Robots-Tag , чтобы поисковые системы не отображали ваш сайт на страницах результатов поиска.
Проверить все факторы Тест мета-заголовка Мета-описание Тест Предварительный просмотр результатов поиска Google Тест наиболее распространенных ключевых слов Тест использования ключевых слов Ключевые слова Cloud Test Тест по связанным ключевым словам Тестирование доменов конкурентов Тест тегов заголовков Роботы. txt Test Sitemap Test SEO дружественный URL-тест Image Alt Test Встроенный тест CSS Тест устаревших HTML-тегов Тест Google Analytics Тест Favicon Тест обратных ссылок Проверка ошибок JS Тест в социальных сетях Тест размера страницы HTML Сжатие HTML / тест GZIP Тест скорости загрузки сайта Тест объектов страницы Тест кеширования страниц (кеширование на стороне сервера) Флэш-тест Тест использования CDN Тест кеширования изображений Тест кеширования JavaScript Тест кеширования CSS Тест минификации JavaScript Тест минификации CSS Тест вложенных таблиц Тест набора фреймов Doctype Test Проверка переадресации URL Тест канонизации URL HTTPS тест Тест безопасного просмотра Проверка подписи сервера Тест просмотра каталогов Проверка электронных писем с открытым текстом Тест адаптивного медиа-запроса Тест мобильных снимков Структурированные данные Пользовательский тест страницы ошибки 404 Тест тегов Noindex Канонический тест тегов Тест тега Nofollow Тест запретить директиву SPF Records Test
youtube.com/embed/kgXIwAIclmQ?showinfo=0″ frameborder=»0″ webkitallowfullscreen=»» mozallowfullscreen=»» allowfullscreen=»»/>
Если вы хотите, чтобы ваша веб-страница индексировалась поисковыми системами, вам необходимо удалить метатег noindex из своего HTML-кода.10 шагов для проверки индексируемости вашего веб-сайта
Все маркетологи должны обеспечить индексацию своих веб-сайтов, чтобы привлечь больше пользователей и трафика на свои веб-сайты, чтобы обеспечить более высокий коэффициент конверсии. Эта статья поможет вам обеспечить индексацию вашего сайта.
Важным условием успеха вашего онлайн-бизнеса является то, что ваш веб-сайт должен быть виден пользователям в поисковой выдаче, то есть он должен индексироваться Google.Есть много способов проверить, индексируется ли ваш сайт. Ryte может помочь — вы можете использовать Ryte в качестве пошагового руководства, чтобы найти любые факторы, препятствующие индексации вашего сайта. После того, как вы проверите эти шаги и внесете необходимые исправления, ничто не будет препятствовать успешной индексации вашего веб-сайта, что приведет к увеличению трафика и конверсий.
Шаг 1. Проверьте свои страницы на наличие тегов Noindex
Это ошибка, которая может случиться даже с самыми опытными специалистами по поисковой оптимизации: вы могли случайно вставить метатег «noindex, follow» на свои подстраницы или забыть его удалить.Этот тег используется для того, чтобы гарантировать, что URL-адрес не будет проиндексирован поисковыми системами, и вставляется в область
веб-страницы следующим образом:Этот тег может быть полезным способом избежать дублирования контента, а также может использоваться, например, перед переносом домена для тестирования веб-сайта перед фактическим запуском. (Хотя, когда ваш сайт будет запущен, тег Noindex, конечно, должен быть удален.)
С помощью Ryte Website Success вы можете несколькими щелчками мыши проверить, какие страницы индексируются. Щелкните в разделе «Индексируемость» отчета «Что индексируется?»
Рисунок 1: Проверьте свою индексируемость с помощью Ryte
Шаг 2. Проверьте свой файл Robots.txt
Использование роботов. txt, вы можете активно управлять сканированием и индексированием своего веб-сайта, давая роботу Google конкретные инструкции относительно того, какие каталоги и URL-адреса следует сканировать.
Однако при настройке файла вы могли случайно исключить важные каталоги из сканирования или заблокировать целые страницы.Это не мешает напрямую индексировать ваши URL-адреса, поскольку робот Googlebot может находить, сканировать и индексировать их с помощью обратных ссылок с других веб-сайтов. Однако с ошибочным файлом robots.txt робот Google не сможет выполнять достаточный поиск во всех областях вашего веб-сайта при регулярном сканировании. Прочтите эту статью, чтобы узнать о других ошибках, которые могут быть сделаны при настройке файла robots.txt.
Вам следует проверить файл robots.txt на наличие ошибок, особенно после внесения изменений. Здесь вам может помочь Ryte: нажмите на отчет «Роботы.txt «в разделе» Индексируемость «. После этого Ryte Website Success предоставит вам список всех URL-адресов, исключенных из сканирования. С помощью Ryte вы также можете отслеживать свой файл robots.txt, чтобы отслеживать любые изменения.
Рисунок 2: Проверьте свой robots.txt с помощью Ryte
Шаг 3. Проверьте файл .htaccess на наличие ошибок.
Ваш файл .htaccess также может препятствовать отображению вашей страницы в результатах поиска и рассматривать сканирование как несанкционированный доступ..Htaccess — это управляющий файл, хранящийся в каталоге сервера Apache.
Помимо прочего, операторы веб-сайтов используют их для следующих действий:
- Переписывание URL
- Перенаправление старого URL-адреса на новый URL-адрес
- Перенаправление на www-версию страницы
Конкретные правила можно определить в файле. htaccess. Однако для того, чтобы эти правила выполнялись сервером, файл всегда должен называться точно так же в следующих случаях:
Перенаправление или перезапись URL:
RewriteEngine на
Требуется перезапись:
RewriteBase /
Определите правило, которое должен выполнять сервер:
RewriteEngine на
RewriteBase /
RewriteRule seitea.html seiteb.html [R = 301]
Конечно, возможно, что файл был назван неверно и поэтому не может перезаписывать или перенаправлять URL. В результате ни пользователи, ни поисковые системы не смогут получить доступ к страницам, и поэтому они не будут сканироваться или индексироваться.
Шаг 4. Проверьте свои канонические теги
Канонический тег помогает Google найти исходный URL-адрес для нескольких URL-адресов с одинаковым содержанием, чтобы можно было проиндексировать правильный URL-адрес. Канонический тег ссылается на HTML-тег со ссылкой на исходную страницу, «канонический» URL.
При установке канонических тегов могут возникать многочисленные ошибки, вызывающие проблемы с индексацией.
- Тег Canonical относится к относительному боковому пути
- Канонический тег относится к URL-адресу, который находится в теге Noindex .
- Страница с разбивкой на страницы относится к первой странице разбиения на страницы по тегу Canonical.
- Тег Canonical относится к URL без косой черты в конце
Как проверить теги Canonical с помощью Ryte:
Ryte имеет собственный отчет для канонических тегов в области «Индексируемость».После нажатия на «Канонические» и «Использовать» вы быстро получите обзор возможных проблем с реализованными каноническими тегами.
Рисунок 3: Проверка канонических тегов с помощью Ryte
Шаг 5. Отслеживайте доступность сервера и сообщения об ошибках состояния
Другая причина, по которой веб-сайт или URL не могут быть проиндексированы, может быть связана с отказом сервера. Это делает технически невозможным доступ к странице.
Серверытакже играют важную роль в поисковой оптимизации по многим причинам.Для хорошего рейтинга вам нужен быстрый и эффективный сервер. Если он медленный, время загрузки вашего веб-сайта будет задерживаться, что не нравится пользователям, что приведет к высокому показателю отказов и низкому среднему времени на странице. Google классифицирует эти KPI как отрицательные для пользовательского опыта, что, конечно же, отрицательно сказывается на SEO.
С помощью Ryte Website Success вы можете регулярно проверять свой сервер; Мониторинг сервера функций информирует вас о сбоях и тайм-аутах, чтобы вы могли действовать быстро.
Рисунок 4: Мониторинг сервера с помощью Ryte
Совет. Регулярно проверяйте коды состояния HTTP вашего сайта, чтобы убедиться, что переадресация 301 работает правильно или существуют коды состояния 404. Страницы с таким статусом не отслеживаются потенциальными читателями и поисковыми роботами. Ссылки, ведущие на такие страницы, называются «мертвыми ссылками».
Шаг 6. Найдите потерянные страницы
Когда вы реструктурируете свой веб-сайт или добавляете новые категории, эти новые страницы могут не иметь внутренних ссылок.Кроме того, если эти новые URL-адреса не указаны в sitemap.xml и не связаны с внешними источниками, существует высокий риск того, что эти страницы не будут проиндексированы. Поэтому старайтесь любой ценой избегать появления потерянных страниц.
Рисунок 5: Поиск страниц без входящих ссылок
Ryte Website Success быстро покажет вам потерянные страницы. Для этого нажмите на отчет «Страницы без входящих ссылок» в разделе «Ссылки».
Шаг 7. Поиск кражи контента — внешний дубликат контента
Внешний дублированный контент означает, что внешняя интернет-страница берет контент с вашей страницы.Хотя теперь Google стал лучше определять, что является «оригиналом», вполне возможно, что страница с вашим содержанием может занять более высокий рейтинг, чем вы, или, в крайних случаях, вообще помешать вашему содержанию индексироваться.
Предотвратить кражу контента поможет следующий совет:
При публикации вашего контента попросите ссылку на первоисточник. Заранее указывая условия передачи этих текстовых элементов, вы избегаете внешнего дублирования контента. Издатели могут использовать специальное уведомление, например «исходный текст на www.yourpage.com «или они могут установить канонический тег для URL-адреса, по которому вы изначально опубликовали контент.
Чтобы найти внешний дублированный контент, вы можете просто скопировать некоторые соответствующие текстовые строки со своей страницы и ввести их в поиск Google. Если несколько результатов с одинаковым содержанием появляются без ссылки на вашу страницу, это, очевидно, кража контента.
Шаг 8: Определите внутренние ссылки Nofollow
Если вы пометите свои внутренние ссылки атрибутом rel = «nofollow», робот Googlebot не будет переходить по ссылке, и вы будете препятствовать правильному сканированию вашего веб-сайта, как если бы вы не позволяли роботу Googlebot переходить по ссылке, это может не смогут проникнуть в более глубокие области страницы. Поэтому некоторые URL-адреса больше не будут сканироваться, а это означает, что вероятность их индексации снижается.
Если вы работаете с внутренними ссылками nofollow, вы можете уточнить у Ryte, где их найти. Затем мы рекомендуем вам удалить атрибут nofollow. Если вы действительно хотите исключить URL из индексации, лучше подходит тег noindex в сочетании с атрибутом follow.
Шаг 9. Проверьте свой XML-файл Sitemap
При создании карты сайта возможно, что карта сайта может содержать не все URL-адреса для индексации.Это создает ту же проблему, что и потерянные страницы, потому что нет ссылок на соответствующие URL-адреса. В этом случае велик риск пропустить индексацию.
Ryte Website Success может помочь вам в этом. В разделе «Успешность веб-сайта» в области «Карта сайта» перейдите к отчету «Коды состояния файлов». Там вам будут показаны все URL-адреса карты сайта, которые либо не найдены на сервере, либо перенаправлены.
Рисунок 6: Проверьте свой sitemap. xml на наличие ошибок с помощью Ryte
Вы также можете проверить свою карту сайта на наличие ошибок с помощью Google Search Console — предупреждение указывает на возможные проблемы с индексированием.
Шаг 10: Регулярно проверяйте, не были ли взломаны ваши страницы
Google стремится предоставить своим пользователям результаты поиска максимально высокого качества. Нарезанные страницы сильно ограничивают это качество. Обязательно ищите подсказки в Google Search Console. Если ваш сайт стал жертвой взлома, пора сохранять спокойствие. Первым шагом будет изменение паролей для доступа к бэкэнду, если это возможно.
Во избежание взлома вам следует регулярно менять пароли и максимально ограничивать количество пользователей паролей.Кроме того, важно всегда устанавливать все предлагаемые обновления. Google предоставляет дополнительную информацию и советы относительно взлома в центральном блоге веб-мастеров.
Заключение
Может быть множество причин, по которым ваш веб-сайт или отдельные URL-адреса не индексируются. С помощью Ryte вы можете легко находить и устранять ошибки, что приводит к лучшей индексации вашего веб-сайта, что приведет к лучшему ранжированию и большему успеху веб-сайта.
Контрольный список индексации
Площадь | Измерение | |
1 | Noindex-Теги | Проверьте свои URL-адреса на наличие тега без индекса.Если этот тег не является полностью необходимым, измените его на «index, follow». |
2 | Robots.txt | Проверьте файл robots.txt и убедитесь, что важные каталоги исключены из сканирования. |
3 | .htaccess | Проверьте этот файл на наличие неправильных перенаправлений или синтаксических ошибок. |
4 | Канонические теги | Убедитесь, что эти теги правильно ссылаются на канонический URL. |
5 | Доступность сервера и регистрация кода состояния | Следите за доступностью вашего сервера и проверяйте коды состояния ваших URL. |
6 | Сироты | Найдите страницы без входящих ссылок и создайте внутренние ссылки. |
7 | Кража содержимого | Проверьте, используют ли ваш контент внешние веб-сайты. Создавайте канонические теги и избегайте относительных URL. |
8 | Внутренние ссылки nofollow | Найдите на своем сайте теги nofollow и удалите их. Альтернативой являются теги canonical- или noindex-теги. |
9 | XML-карта сайта | Проверьте, содержит ли ваша карта сайта все URL-адреса, которые нужно проиндексировать, и проверьте коды состояния URL-адресов. |
10 | Взлом | Обратите внимание на предупреждения о взломанных страницах в Google Search Console и, например, измените свои данные для входа. |
Проверьте индексируемость своего сайта с помощью Ryte FREE
Начинай сейчас!Как проверить, проиндексирован ли URL в Google с помощью Google Search Console
youtube.com/embed/NR3SzxdDkKM?feature=oembed&wmode=opaque» frameborder=»0″ allow=»accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture» allowfullscreen=»»/>
Использование раздела покрытия в Google Search Console, чтобы узнать, проиндексирован ли ваш URL
[Стенограмма видео]
Всем привет и спасибо, что присоединились ко мне.
Сегодня мы поговорим о том, как увидеть URL-адреса, которые вы отправили и проиндексированы в Google.Так что, если я просто перейду в свою учетную запись в консоли поиска Google, я бы щелкнул по левой стороне в зоне покрытия, под индексом. И тогда вы увидите, что ошибки проверяются по умолчанию, когда я действительно хочу проверить, действительно ли здесь.
Затем я снимал флажок с поля с ошибками, а затем прокручиваю вниз, чтобы отправить индекс, и я вижу 113 страниц, которые были отправлены, и когда они в последний раз сканировались и являются частью индекса.
Хорошо, так что опять же в покрытии я также вижу исключенные, а затем вы можете видеть страницы с перенаправлениями или исключенные.