Мета-тег Robots — Robots.Txt по-русски
МЕТА-тег “Robots” позволяет указывать Роботам, можно ли индексировать данную страницу и можно ли использовать ссылки, приведенные на странице. Этот тег указывается на каждой конкретной странице, доступ к которой требуется ограничить.
В этом простом примере:
META NAME=»ROBOTS» CONTENT=»NOINDEX, NOFOLLOW»
робот не должен ни индексировать документ, ни анализировать стоящие на нем ссылки.
МЕТА-тег “Robots” – это простой инструмент для указания роботам, может ли страница быть проиндексирована и можно ли следовать по ссылкам со страницы.
Он отличается от Стандарта исключения для роботов тем, что вам не нужно тратить много усилий или получать доступ у Администратора cервера.
Куда писать META-тег “Robots”
Как и любой META-тег он должен быть помещен в область HEAD HTML страницы:
<html>
<head>
<meta name=“robots” content=“noindex,nofollow”>
<meta name=“description” content=“Эта страница ….”>
<title>…</title>
<body>
…
Что писать в META-теге “Robots”
META-тег “Robots” содержит указания, разделенные запятыми. В настоящее время определены существующие указания [NO]INDEX и [NO]FOLLOW. Директивы INDEX указывают, может ли робот индексировать страницу. Директива FOLLOW указывает роботу, может ли он следовать по ссылкам со страницы. Значения по умолчанию – INDEX и FOLLOW. Значения ALL и NONE обозначают активность всех директив и, соответственно, наоборот: ALL=INDEX,FOLLOW и NONE=NOINDEX,NOFOLLOW.
Несколько примеров:
<meta name=“robots” content=“index,follow”>
<meta name=“robots” content=“noindex,follow”>
<meta name=“robots” content=“index,nofollow”>
<meta name=“robots” content=“noindex,nofollow”>
Следует учесть, что параметр content тега “robots” нечувствителен к регистру.
Вы не должны включать конфликтующие и повторяющиеся директивы, как например:
<meta name=“robots” content=“INDEX,NOINDEX,NOFOLLOW,FOLLOW,FOLLOW”>
Правильный синтаксис атрибутов META-тега “Robots”:
content = all | none | directives
all = «ALL»
none = «NONE»
directives = directive [«,» directives]
directive = index | follow
index = «INDEX» | «NOINDEX»
follow = «FOLLOW» | «NOFOLLOW»
это программы, помогающие пользователям – например в выборе продукта, заполнении форм или даже в поиске. Такие программы имеют очень небольшое отношение к сетевому взаимодействию.
Дополнительно
Несколько ссылок по теме – постепенно надо будет добавить информацию из них на эту страницу.
Мета-тег Robots в стандарте HTML 4 на W3C
Как разные поисковики обрабатывают noindex
Запрет использования в выдаче описания из ODP
Что такое мета-тег Robots и зачем он нужен?
Содержание:
Мета-тег robots поможет найти общий язык с поисковыми роботами
Даже не зная, зачем нужен мета-тег robots, только исходя из его названия, уже можно сделать выводы о том, что он имеет какое-то отношение к роботам поисковых систем. И это действительно так.
Внедрение мета-тега robots в код веб-страницы дает возможность указать поисковым ботам свои пожелания по поводу индексирования ее содержимого и ссылок, расположенных на ней.
Это может пригодится в многих ситуациях. Например, при наличии на сайте дублирования контента или для предотвращения передачи веса страничек по ссылкам, расположенным на них.
Как воспользоваться возможностями мета-тега robots
Страница, к которой нужно применить желаемые условия индексирования, должна содержать внутри тега <head> своего html-кода правильно оформленный мета-тег robots.
Структура его довольно проста:
Чтобы он был правильно воспринят ботами поисковиков, в данной конструкции содержимое атрибута content (‘’ххххххххх’’) должно состоять из одной или нескольких (через запятую) стандартных директив:
- index/noindex – указывает на необходимость индексации/игнорирования содержимого страницы.
- follow/nofollow – анализировать/игнорировать ссылки в пределах веб-страницы.
- all/none – индексировать/игнорировать страницу полностью.
- noimageindex – запрет индексации присутствующих на странице изображений.
- noarchive – запрет на вывод в результатах поиска ссылки «Сохраненная копия», которая дает возможность просматривать сохраненную в кэше поисковика копию страницы (даже если она временно недоступна или удалена с сайта).
- nosnippet – запрет на вывод в поисковой выдаче под названием страницы фрагмента текста (сниппета), описывающего ее содержание.
- noodp – директива, которая сообщает Google-боту о запрете использования в качестве сниппета страницы, описания из каталога Open Directory Project (он же DMOZ).
Особенности использования мета-тега robots
Некоторые поддерживаемый этим мета-тегом комбинации директив взаимозаменяемы (тождественны). Например, если нужно запретить индексирование содержимого странички и всех ссылок на ней, можно использовать в мета-теге robots ‘’noindex, nofollow’’ или же директиву ‘’none’’.
В обратном случае, когда нужно индексировать всё (в параметре content мета-тега robots – ‘’index, follow’’ или ‘’all’’), появляется еще и третий вариант – вообще не внедрять этот тег в код страницы.
Бывают и частные случаи, в которых указания по поводу индексирования нужно сообщить только роботу какой-нибудь одной поисковой системы. Для этого нужно вместо ‘’robots’’ указать имя бота, которого касаются содержащиеся в мета-теге директивы. Например, если Google должен внести в свой индекс содержимое странички, но при этом не анализировать ссылки на ней:
Важно, чтобы в содержимом атрибута content не было повторений или присутствия противоречащих друг другу директив, поскольку в этом случае мета-тег может быть проигнорирован поисковым ботом.
Еще один момент, на почве которого довольно часто спорят веб-мастера – регистр, в котором прописывается содержимое мета-тега. Одни считают, что правильно использовать только прописные, другие – только строчные. Но на самом деле приемлемы оба варианта, поскольку мета-тег нечувствителен к регистру.
Зачем нужен мета-тег robots, если есть файл robots.txt?
Да, действительно на первый взгляд может показаться, что применение этого мета-тега предоставляет те же возможности, что и настройка файла robots.txt. Но несколько отличий все же есть. И они вполне могут быть причинами, чтобы отдать предпочтение использованию мета-тега:
- Мета-тег robots используется для более тонкой настройки индексации – можно закрыть контент, но оставить открытыми ссылки (в параметре content мета-тега robots – ‘’noindex, follow’’) и наоборот. В robots.txt такой возможности нет.
- В ситуациях, когда нет возможности получить доступ к корневой директории веб-сайта, редактировать robots.txt не представляется возможным. Вот тогда-то и приходит на помощь одноименный мета-тег.
- В robots.txt можно закрыть от индексации целый каталог, чтобы запретить доступ ботов ко всем, содержащимся в нем страницам, тогда как мета-тег придется использовать для каждой из них. Получается, что в таком случае удобнее произвести настройки в файле. Но если некоторые страницы внутри каталога все же нужно оставить открытыми, удобнее использовать мета-тег.
Для управления индексацией страниц веб-сайта допустимо одновременно использовать мета-тег robots и файл robots.txt. Они могут отвечать за указания поисковым ботам по поводу разных веб-страниц или же дублировать команды друг друга.
А вот если в них будут присутствовать противоречащие директивы по поводу одних и тех же страниц, роботы поисковиков будут принимать не всегда верное решение – по умолчанию выбирается более строгое указание. Получается, что страницы (или ссылки на них), по поводу которых между robots.txt и мета-тегом robots имеются разногласия, индексироваться не будут.
Возможность управления индексацией веб-сайта – очень полезный инструмент для SEO-продвижения. Главное, научиться правильно определять, в какой ситуации эффективнее использовать тот или иной из теперь известных Вам способов.
Как редактировать в Magento для отдельных страниц
Я изо всех сил пытаюсь найти в Magento способ редактировать <meta name="robots" content="NOINDEX,FOLLOW">
Кто-нибудь знает, как это сделать? Пожалуйста, помогите.
Спасибо
magento metatagПоделиться Источник Seosmart 05 мая 2011 в 09:35
2 ответа
- Установите NOINDEX, NOFOLLOW на конкретные продукты
My magento store имеет следующее, чтобы позволить google / поисковым системам сканировать весь сайт. <meta name=robots content=INDEX,FOLLOW /> Теперь я нуждаюсь в некоторых конкретных продуктах, чтобы иметь: <meta name=robots content=NOINDEX,NOFOLLOW /> чтобы google не сканировал/не…
- Ввод noindex в заголовок, получение белого экрана
Я хочу добавить noindex, следовать всем архивам, несколько разных страниц и страницу 404 на моем сайте WP, но везде, где я пытаюсь разместить это: if($paged > 1 || is_404 || is_page(array( 1110,1115, 1114 )){ echo ‘<meta name=robots content=noindex,follow />’; } Я получаю белый экран.
7
Вы должны быть в состоянии сделать это на основе каждого модуля, используя файлы layout xml.
Например, если вам нужно установить роботы на NOINDEX, FOLLOW на странице популярного поискового запроса:
Найдите макет (модуль) для этой конкретной страницы — > например, app/design/frontend/your_package/your_theme/layout/catalogsearch.xml
Найдите свою страницу:
<catalogsearch_term_popular translate="label">
Добавьте следующие строки вместе с другими ссылками:
<reference name="head"> <action method="setRobots"><value>NOINDEX,FOLLOW</value></action> </reference>
Вы можете сделать то же самое для любого другого модуля (checkout, sendfriendemail и т. д.), для которого вам нужно будет изменить значение роботов по умолчанию.
Поделиться zebulon 22 сентября 2011 в 13:20
1
Зависит от вашей установки… у нас есть модуль, который вы можете выбрать NOINDEX/INDEX,FOLLOW/NOFOLLOW в разделе администратора каждой страницы.
Взгляните на http://yoast.com/articles/magento-seo / пункт 3.1.
Поделиться Vince Pettit 05 мая 2011 в 10:37
Похожие вопросы:
Joomla noindex, следуйте коду PHP
У меня есть новостной сайт на базе joomla, на котором есть тонна бесполезных страниц, появляющихся в индексах поисковых систем. По крайней мере, в качестве быстрого решения, пока я не смогу…
noindex no follow variable-правильно ли я это сделал?
У меня есть этот сценарий в голове всех моих страниц — которые в том числе: <?php if (isset($robots) && $robots == off) { $robots = ‘<meta name=robots content=noindex,nofollow>’;…
Scrapy: только парсинг со страниц с meta noindex
Я пытаюсь сканировать веб-сайт и анализировать только страницы с meta noindex. Происходит то, что искатель ползет по первому уровню, но заканчивается первой страницей. Похоже, он не следует по…
Установите NOINDEX, NOFOLLOW на конкретные продукты
My magento store имеет следующее, чтобы позволить google / поисковым системам сканировать весь сайт. <meta name=robots content=INDEX,FOLLOW /> Теперь я нуждаюсь в некоторых конкретных…
Ввод noindex в заголовок, получение белого экрана
Я хочу добавить noindex, следовать всем архивам, несколько разных страниц и страницу 404 на моем сайте WP, но везде, где я пытаюсь разместить это: if($paged > 1 || is_404 || is_page(array(…
В WordPress есть ли способ исключить один каталог из индексирования с помощью тега meta robots вместо отдельных страниц или сообщений?
Я знаю, что это относится к тегу meta robots для определенных страниц или сообщений: <?php if ($post->ID == X || $post->ID == Y) { echo ‘<meta name=robots content=noindex,follow>’; }…
driver.page_source возвращает только meta name=»ROBOTS» content=»NOINDEX, NOFOLLOW» с использованием Selenium
Я хочу очистить один сайт, чтобы получить содержимое страницы с этим кодом: from selenium import webdriver from selenium.webdriver.common.desired_capabilities import DesiredCapabilities driver =…
Расположение <meta name=’robots’ content=’noindex,follow’ /> в WordPress файлах
Я работаю на сайте WordPress, построенном кем-то другим, и обнаружил, что этот мета-тег есть на всех страницах: <meta name=’robots’ content=’noindex,follow’ /> Мне нужно это отредактировать. Я…
В чем разница между «index, follow» или «следуй за мной»
в чем же заключаются отличия приведенных ниже списков: <meta name=robots content=index, follow> <meta name=robots content=follow> <meta name=robots content=noindex, follow>…
<meta name=»robots»> не работает
У меня есть страница по адресу: https:/ / www.luckycheckout.com/goto/282/cs/1?ct=1 который содержит следующую строку кода в разделе head: <meta name=robots content=noindex, nofollow /> У меня…
seo — Как НЕ СЛЕДУЮЩИЙ ИНДЕКСУ многоуровневой навигации на домашней странице или странице CMS в Magento?
У меня проблемы с тем, что Google много раз индексирует мою домашнюю страницу в различных состояниях сортировки и упорядочивания продуктов, которые я показываю на своей домашней странице. Ссылки, которые появляются в Google для моего сайта, выглядят следующим образом. Примерно 90 раз. Очевидно, я не хочу, чтобы моя домашняя страница проиндексировалась 90 раз.
http: /www.my-url.com/? Dir = desc & limit = 12 & mode = list & order = name
Как мне убедиться, что эти страницы с дублированным контентом удалены из Google? Я использую этот код в CMSblock, чтобы показать продукты:
{{block type = "catalog / product_list" name = "home.catalog.product.list "alias =" products_homepage "category_id =" 5 "template =" catalog / product / list.phtml "columnCount =" 5 "}}
Что я делал / пробовал до сих пор в следующем порядке:
Когда было уже слишком поздно и Google все это проиндексировал, я поместил это в свой robots.txt:
Запрещено: / *? *
После этого: я удалил все URL-адреса из Google в инструментах для веб-мастеров, но они вернулись в большем количестве.
Вчера в инструментах Google для веб-мастеров я убедился, что параметры URL, вызывающие дублирование контента, больше не сканируются. А именно:
заказ
дирек
предел
режим
Я поместил следующий код в свой local.xml, но обнаружил, что это касается только страниц категорий.
<уровень_категории_категории>
NOINDEX, FOLLOW NOINDEX, FOLLOW
Мой вопрос: есть ли что-нибудь еще, что я могу или должен сделать? Как мне вывести их из результатов поиска Google и деиндексировать.Или мне просто нужно подождать сейчас?
полное руководство • Yoast
Джоно АлдерсонДжоно — цифровой стратег, технолог по маркетингу и разработчик полного цикла. Он занимается техническим SEO, новыми технологиями и стратегией бренда.
Если вы используете мета-тегов роботов
на своих страницах, вы можете дать поисковым системам инструкции о том, как вы хотите, чтобы они сканировали или индексировали части вашего веб-сайта. На этой странице представлен обзор всех различных значений, которые могут быть в метатеге роботов, их функций и поисковых систем, поддерживающих каждое значение.
Различные значения метатегов роботов
Следующие значения («параметры») могут быть размещены по отдельности или вместе в атрибуте content
тега (разделенных запятой), чтобы управлять тем, как поисковые системы взаимодействуют с вашей страницей.
Прокрутите вниз, чтобы увидеть, какие поисковые системы поддерживают какие конкретные параметры.
- индекс
- Разрешить поисковым системам добавлять страницу в свой индекс, чтобы люди могли ее обнаружить.
- Примечание: Если нет директив, относящихся к индексированию, предполагается, что это значение по умолчанию.
- noindex
- Запретить поисковым системам добавлять эту страницу в свой индекс и, следовательно, запретить им показывать ее в своих результатах.
- Примечание: Неофициальные сообщения от Google предполагают, что если для страницы задано значение
noindex
в течение длительного периода времени, ее также можно рассматривать, как если бы она была также установлена наnofollow
.Точный механизм этого неясен, и неясно, ведут ли другие поисковые системы аналогично. - подписаться на
- Сообщает поисковым системам, что они могут переходить по ссылкам на странице, чтобы обнаружить другие страницы.
- Примечание: Если нет директив, относящихся к следующим ссылкам, предполагается, что это значение по умолчанию.
- nofollow
- Указывает роботам поисковых систем не «подтверждать» (передавать капитал) любые ссылок на странице.Обратите внимание, что сюда входят всех ссылок на странице, включая, например, ссылки в элементах навигации, ссылки на изображения или другие ресурсы и т. Д.
- Примечание: Неясно (и несовместимо между поисковыми системами), запрещает ли этот атрибут поисковым системам переходить по ссылкам или просто не дает им присваивать какое-либо значение этим ссылкам.
- нет
- Ярлык для
noindex, nofollow
. - все
- Ярлык для индекса
, следуйте за
. - Примечание: Предполагается по умолчанию на всех страницах и ничего не делает, если указано.
- noimageindex
- Запретить поисковым системам индексировать изображения на странице.
- Примечание: Если изображения связаны напрямую из других источников, поисковые системы все равно могут их индексировать, поэтому использование HTTP-заголовка X-Robots-Tag, как правило, является лучшей идеей.
- без архива
- Запрещает поисковым системам показывать кэшированную копию этой страницы в своих списках результатов поиска.
- нокаш
- То же, что
noarchive
, но используется только MSN / Live. - носниппет
- Запрещает поисковым системам показывать текст или фрагмент видео (т. Е. Метаописание
- Примечание: Фрагменты могут по-прежнему отображать миниатюру изображения, если также не используется
noimageindex
. - ссылки поиска
- Запрещает поисковой системе отображать встроенное окно поиска для вашего сайта.
- nopagereadaloud
- Запрещает поисковой системе читать вслух содержимое вашей страницы с помощью голосовых служб / результатов.
- notranslate
- Запрещает поисковым системам показывать перевод страницы в результатах поиска.
- max-snippet:
[номер]
- Устанавливает максимальное количество символов для метаописания.
- Примечание: Пропуск этого тега может привести к предполагаемому значению
0
. Значение по умолчанию-1
должно означать «без ограничений». - max-video-preview:
[номер]
- Устанавливает максимальное количество секунд для видео при предварительном просмотре.
- Примечание: Пропуск этого тега может привести к предполагаемому значению
0
. Значение по умолчанию-1
должно означать «без ограничений». - max-image-preview:
[настройка]
- Задает максимальный размер изображения для использования в предварительном просмотре (
нет
,стандартный
илибольшой
). - Примечание: Пропуск этого тега может привести к предполагаемому значению
none
. - рейтинг
- Указывает, что страница содержит материалы для взрослых.
- unavailable_after
- Сообщает поисковым системам дату / время, после которых они не должны показывать это в результатах поиска; «синхронизированная» версия
noindex
. - Примечание: должен быть в формате
RFC850
(например,понедельник, 15 августа 05 15:52:01 UTC
). - нояса
- Запрещает фрагменту результатов поиска использовать описание страницы из Справочника Яндекса.
- Примечание: Поддерживается только Яндекс.
-
нойдир - Запрещает Yahoo использовать описание этой страницы в каталоге Yahoo в качестве фрагмента для вашей страницы в результатах поиска.
- Примечание: Поскольку Yahoo закрыл свой каталог, этот тег устарел, но время от времени вы можете встретить его.
Какая поисковая система поддерживает какие значения метатегов роботов?
В этой таблице показано, какие поисковые системы поддерживают какие значения.Обратите внимание, что документация, предоставляемая некоторыми поисковыми системами, скудна, поэтому есть много неизвестных.
Стоимость роботов | Yahoo | Bing | Спросите | Baidu | Яндекс | |
---|---|---|---|---|---|---|
Элементы управления индексированием | ||||||
индекс | Я * | Я * | Я * | ? | Y | Y |
noindex | Y | Y | Y | ? | Y | Y |
noimageindex | Y | N | N | ? | N | N |
Следует ли переходить по ссылкам | ||||||
следовать | Я * | Я * | Я * | ? | Y | Y |
nofollow | Y | Y | Y | ? | Y | Y |
нет | Y | ? | ? | ? | N | Y |
все | Y | ? | ? | ? | N | Y |
Элементы управления фрагментом / предварительным просмотром | ||||||
без архива | Y | Y | Y | ? | Y | Y |
нокаш | N | N | Y | ? | N | N |
носниппет | Y | N | Y | ? | N | N |
nositelinkssearchbox | Y | N | N | N | N | N |
nopagereadaloud | Y | N | N | N | N | N |
notranslate | Y | N | N | ? | N | N |
max-snippet: [number] | Y | Y | N | N | N | N |
max-video-preview: [number] | Y | Y | N | N | N | N |
max-image-preview: [настройка] | Y | Y | N | N | N | N |
Разное | ||||||
рейтинг | Y | N | N | N | N | N |
недоступен_после | Y | N | N | ? | N | N |
лапша | N | Y ** | Y ** | ? | N | N |
нойдир | N | Y ** | N | ? | N | N |
Нояка | N | N | N | N | N | Y |
* Большинство поисковых систем не имеют специальной документации для этого, но мы предполагаем, что поддержка исключения параметров (например,g., nofollow
) подразумевает поддержку положительного эквивалента (например, следует за
).
** Хотя атрибуты noodp и noydir все еще могут «поддерживаться», эти каталоги больше не существуют, и вполне вероятно, что эти значения ничего не делают.
Правила для конкретных поисковых систем
Иногда вам может потребоваться предоставить конкретные инструкции определенной поисковой системе , но не другим. Или вы можете предоставить разные поисковые системы совершенно разные инструкции.
В этих случаях вы можете изменить значение атрибута content
для конкретной поисковой системы (например, googlebot
).
Примечание: Учитывая, что поисковые системы просто игнорируют инструкции, которые они не поддерживают или не понимают, очень редко нужно использовать несколько метатегов роботов для установки инструкций для определенных поисковых роботов.
Конфликтующие параметры и файлы robots.txt
Важно помнить, что мета-теги robots работают иначе, чем инструкции в вашем файле robots.txt, и конфликтующие правила могут вызвать неожиданное поведение. Например, поисковые системы не смогут увидеть ваши метатеги
, если страница заблокирована через robots.txt
.
Вам также следует позаботиться о том, чтобы избежать установки конфликтующих значений в вашем метатеге robots (например, при использовании параметров index
и noindex
), особенно если вы устанавливаете разные правила для разных поисковых систем. В случае конфликта обычно выбирается наиболее ограничительная интерпретация (т.е., «не показывать» обычно лучше «показывать»).
Добавить noindex
или nofollow
в сообщение или страницу очень просто, если вы используете WordPress. Прочтите, как использовать Yoast SEO, чтобы сообщения не появлялись в результатах поиска.
Ресурсы из поисковых систем
Что означает «сканирование» и «без индексации / подписки»? — Справка Uberflip
Вопрос
Когда я просматриваю список потоков в своем хабе, я вижу либо «для сканирования», либо «без индексации / подписки» рядом с каждым потоком в столбце SEO .Что это значит?
Ответ
Столбец SEO в списке потоков (в разделе Content> Streams ) показывает текущую настройку метатега Robots каждого потока , который представляет собой тег, помещенный в раздел
HTML-кода каждого потока. . Этот тег позволяет вам изменять поведение роботов поисковых систем, которые представляют собой автоматизированные системы, которые анализируют («сканируют») веб-сайты для включения в результаты поисковой системы («индексирование») в отношении Stream.
Вы увидите одну из трех настроек в столбце SEO для каждого потока:
- no-index / follow: В потоке установлен метатег роботов. Наличие тега указывает поисковым системам , а не , включать поток или любые элементы в нем в свои результаты поиска. Часть тега
follow
сообщает поисковым системам, что они все еще могут переходить по ссылкам в потоке для обнаружения другого контента (который может находиться в просматриваемом потоке). - для сканирования: Для потока не установлен метатег роботов.Поисковые системы могут сканировать и индексировать поток, и его содержимое будет отображаться в результатах поиска по релевантным условиям поиска.
- сканируемый (канонический): То же, что сканируемый , плюс также включен параметр Включить канонический метатег . Это указывает на то, что в потоке установлен отдельный метатег, который сообщает поисковым системам, что элементы в этом потоке изначально взяты из другого места (например, из внешнего блога).
Вы можете узнать, как настроить параметры, определяющие то, что вы видите в столбце SEO в этой статье:
Запретить Google (и другим поисковым системам) поиск содержимого вашего концентратора
Основы SEO: объяснение мета-роботов «Noindex, Nofollow»
Сегодня мы поговорим о , одной из самых больших ошибок SEO , которые может сделать владелец веб-сайта (или веб-разработчик): noindex .Одно лишь упоминание об этом может вызвать у разработчика дрожь.
Обновление от 29.08.2018: см. Примечания к обновлению в конце сообщения.
Что такое тег
?Проще говоря, этот метатег сообщает поисковым системам, какие действия они могут (или не предпринимать) на определенной странице. Основные поисковые системы будут соблюдать команды, включенные в этот тег.
Этот метатег может быть включен в любое место между тегами и в заголовке страницы, как показано ниже:
ВАЖНО: Этот тег не влияет на весь сайт.Он может содержать разные значения на разных страницах одного и того же веб-сайта.
Доступные значения для тега META ROBOTS
Вот список допустимых значений для тега META ROBOTS.
- Индекс ( значение по умолчанию )
- Noindex
- Нет
- Follow
- Nofollow
- Noarchive
- Nosnippet
- Noodp ( больше не актуально )
- Noydir ( 900 больше не актуально 9011
Эти значения можно комбинировать, поэтому, например, все приведенные ниже варианты являются совершенно допустимыми метатегами роботов:
Эффект NOINDEX, NOFOLLOW
Значение NOINDEX указывает поисковым системам НЕ индексировать эту страницу, поэтому в основном эта страница не должна отображаться в результатах поиска.
Значение NOFOLLOW указывает поисковым системам НЕ следить (обнаруживать) страницы, на которые есть СВЯЗЬ на этой странице.
Иногда разработчики добавляют мета-теги роботов NOINDEX, NOFOLLOW на веб-сайты разработки, чтобы поисковые системы случайно не начали отправлять трафик на веб-сайт, который все еще находится в стадии разработки.
Или у вас может быть текущий (действующий) веб-сайт на www.example.com, но вы также храните копию для разработки на www.dev.example.com/. В этом случае рекомендуется использовать noindex, nofollow для версии Dev, чтобы избежать многих потенциальных проблем.
Часто случается, что люди случайно добавляют этот тег к действующим веб-сайтам, забывают добавить его в разрабатываемые копии или, что еще хуже: забывают удалить его с действующих веб-сайтов после запуска.
Да, такие же результаты и проблемы могут возникнуть из-за плохого файла robots.txt в корне веб-сайта, но это выходит за рамки темы этой публикации.
~ 3% сайтов отелей затронутыСогласно независимому анализу, проведенному HermesThemes.com из более чем 50 000 веб-сайтов отелей со всего мира, было определено, что ~ 3% веб-сайтов блокируют индексацию своих веб-сайтов поисковыми системами.
Это было шокирующее открытие, которое побудило нас решить проблему в этой статье.
Как проверить, есть ли эта ошибка на моем веб-сайте?
К счастью, есть очень простой способ проверить любой веб-сайт / страницу на наличие этой ошибки.
Просто откройте страницу в своем браузере, щелкните правой кнопкой мыши где-нибудь на странице (но не по ссылкам или изображениям) и выберите «Просмотреть исходный код страницы».В большинстве браузеров в Windows вы можете просто нажать CTRL + U на клавиатуре.
Откроется новая вкладка с полным HTML-кодом (как его видит браузер) для текущей страницы. Как упоминалось ранее, метатеги обычно находятся в верхней части веб-сайта, как в этом примере:
Если вы видите на этой странице строку META ROBOTS со значением NOINDEX или NONE, вам необходимо немедленно принять меры !
Как затронутые веб-сайты выглядят в результатах поиска?
Рад, что вы (надеюсь) спросили.
Существует очень удобный способ поиска в Google проиндексированных страниц с определенного доменного имени: [site: example.com] (без квадратных скобок).
Итак, мы заходим в Google и ищем домен, который использует мета-роботов NOINDEX на своем веб-сайте, и вот что мы получаем:
Я надеюсь, что вы понимаете, какой ущерб может быть нанесен полным удалением вашего веб-сайта из Google и другие поисковые системы. Ваш органический поисковый трафик упадет до нуля в течение нескольких дней.
Как исправить / удалить строку Meta Robots?
К счастью, решить эту проблему легко, и откладывать ее нельзя. Сначала вам нужно определить, откуда эта линия.
В WordPress первое, что вам нужно сделать, это перейти в Панель управления> Настройки> Чтение.
Убедитесь, что для Search Engine Visibility установлен флажок , не отмечен .
Если это не устранило проблему, проверьте, жестко ли закодирована эта строка в теме.
Чтобы проверить это, перейдите в «Внешний вид»> «Редактор», а затем выберите «Заголовок темы header.php» из списка файлов справа (действительно для большинства тем).
Просмотрите этот файл и убедитесь, что в нем нет тега META ROBOTS с вредоносным значением. Если есть — удалите и нажмите синюю кнопку «Обновить файл».
Заключение
Эта строка кода может вызвать большую головную боль, потерю дохода и негативное долгосрочное влияние на SEO.
На ваш веб-сайт влияет NOINDEX? Проверьте сегодня!
Обновления от 29.08.2018:
Я хотел бы уделить время и упомянуть новые цифры от 29 августа 2018 года.
Количество сайтов, которые я анализирую, резко увеличилось. В исходной статье использовались данные, полученные с 50 000 веб-сайтов отелей. Сейчас я анализирую ~ 875 000 уникальных сайтов отелей (уникальных доменов).
Результаты этих 875 000+ веб-сайтов отелей показывают, что 1,502% веб-сайтов отелей используют NOINDEX или NONE в качестве значения мета-роботов.
Процент не кажется высоким, но это более 13 000 веб-сайтов отелей, которые эффективно блокируют индексацию своих веб-сайтов роботами поисковых систем.
Конечно, некоторые из них делают это во время обслуживания своих веб-сайтов. Другие веб-сайты на самом деле стараются оставаться в тени и отображать свой бизнес только с помощью прямых ссылок.
Но я потратил время, чтобы вручную посетить более 200 случайных веб-сайтов из этого списка, и быстро прикинул, что 3/4 из них действительно используют NOINDEX по ошибке. Так вот что.
noindex, nofollow, noarchive, noodp & noydir
Мета-тег роботов контролирует сканирование и индексацию вашей веб-страницы или публикации «пауками».В этом посте мы подробно рассмотрим все типы тегов. Мы можем использовать более одного метатега на веб-странице, но это не очень хорошая практика, потому что это может вызвать конфликты. Следовательно, это должно происходить только один раз на веб-странице.
Мета-тег роботов по умолчанию
Если вы не укажете метатег на веб-странице, то по умолчанию Spider будет сканировать и индексировать вашу веб-страницу. можно сказать, что по умолчанию он учитывает метатег ниже.
Мета-роботы noindex
Предотвращает индексацию страницы.Это означает, что если вы укажете ниже метатег для страницы, эта страница не будет отображаться в результатах поиска. Например: вы не хотите, чтобы страницы с вашими авторами появлялись в результатах поиска, поэтому для предотвращения этого вы можете использовать метатег роботов ниже на страницах авторов.
Мета-роботы nofollow
Этот метатег не позволяет паукам переходить по любой ссылке на странице. Если вы новичок, это может вас сбить с толку.Позвольте мне объяснить вам подробно. Каждый раз, когда паук (бот Google) находит ссылку (внутреннюю или внешнюю) на странице, он попадает на эту веб-страницу для сканирования и индексации, чтобы заставить паука не переходить по какой-либо ссылке на странице, мы можем использовать этот тег. Чтобы лучше понять это, вы можете обратиться к моему посту Dofollow vs nofollow.
Мета-роботы noarchive
Вы должны были видеть в результатах поиска, что всякий раз, когда вы наводите курсор на какой-либо результат, он показывает снимок этой страницы в правой части поиска Google ( см. Снимок экрана ниже !! ).Это мы называем кэшированной копией веб-страницы. Чтобы предотвратить кеширование страницы, мы можем указать тег ниже.
Мета-роботы noodp
Запрещает поисковой системе (Google, Yahoo и MSN) отображать собственное описание, взятое из его каталога, вместо вашего метаописания. Использование тега ниже гарантирует, что поисковая система будет отображать ваше метаописание под результатами поиска, и было бы полезно улучшить ваш CTR.
Мета роботы нойдир
Это то же самое, что и вышеупомянутый тег NOODP, с той лишь разницей, что он применим только для Yahoo.
Лучшая практика использования noodp и noydir: Вы можете использовать следующий тег для всех своих веб-страниц —
ИЛИ (над тегом и под двумя тегами — оба одинаковые)
Что делать, если на странице есть более одного мета-тега роботов
Мы должны использовать его только один раз на странице и это лучшая практика, но иногда из-за комбинации SEO-дружественных тем и SEO-плагинов у нас может быть несколько экземпляров таких тегов.Поэтому для таких случаев давайте обсудим, как это интерпретируют пауки (или краулеры).
CASE 1: Нет конфликтующих значений в метатеге robots.
Указанные выше два тега будут взяты так же, как:
CASE 2: Значение конфликта присутствует в метатеге robots.
Первый экземпляр:
Второй экземпляр:
В этом случае оба значения конфликтуют, поскольку одно сообщает noindex, а другое заставляет паука индексировать страницу. В таких случаях краулеры рассматривают первый случай конфликта.
Таким образом, бот поисковой системы будет принимать его как
Как заблокировать конкретного бота поисковой системы
Указывая мета-имя как «robots», вы фактически блокируете всех роботов поисковых систем. Однако, если вы хотите заблокировать определенного бота поисковой системы, вы можете указать имя бота вместо «роботы»
Имя BOT:
Google: GOOGLEBOT
Yahoo: SLURP
MSN: MSNBOT
СПРОСИТЬ: TEOMA
Итак, если вы хотите сделать свою страницу nofollow только для бота Google, вы можете использовать тег ниже.
Примечание. В мета-имени я дал «Googlebot» вместо «robots», чтобы сделать его применимым только для бота поисковой системы Google.
Номер ссылки
Мета-тег роботов: блог Google для веб-мастеров
<Кредит изображения>
Скрытие страницы от поисковых систем · Справочный центр Shopify
Эта страница была напечатана 16 марта 2021 г.Текущая версия доступна на https://help.shopify.com/en/manual/promoting-marketing/seo/hide-a-page-from-search-engines.
Поисковые системы, такие как Google, постоянно сканируют Интернет в поисках новых данных. Когда ваш сайт сканируется, файл
robots.txt
вашего магазина блокирует содержимое страницы, которое в противном случае могло бы снизить эффективность вашей стратегии SEO из-за кражи PageRank.Если вы внесли изменения или добавили страницу на свой сайт и хотите, чтобы Google повторно сканировал ваши URL-адреса, у вас есть два варианта.Вы можете использовать инструмент проверки URL-адресов или отправить карту сайта в Google. Для получения дополнительной информации см. Попросите Google повторно сканировать ваши URL-адреса.
Файл
robots.txt
находится в корневом каталоге основного доменного имени вашего магазина Shopify. Например:johns-apparel.com/robots.txt
.Хотя вы не можете редактировать содержимое файла
robots.txt
вашего магазина, вы должны знать о содержимом, которое он блокирует для поисковых систем. Например, страница корзины покупок заблокирована для поисковых систем, потому что вы хотите, чтобы клиенты находили страницы ваших продуктов перед страницей корзины.Вы можете скрыть страницы, которые не включены в ваш файл
robots.txt
, настроив разделtheme.liquid
вашего магазина. Вам нужно добавить код для noindex определенных страниц.Шагов:
От администратора Shopify перейдите в интернет-магазин > Темы .
Найдите тему, которую хотите отредактировать, и нажмите Действия > Изменить код .
В приложении Shopify нажмите Магазин .
В разделе Каналы продаж коснитесь Интернет-магазин .
Коснитесь Управление темами .
Найдите тему, которую хотите отредактировать, и нажмите Действия > Изменить код .
В приложении Shopify нажмите Магазин .
В разделе Каналы продаж коснитесь Интернет-магазин .
Коснитесь Управление темами .
Найдите тему, которую хотите отредактировать, и нажмите Действия > Изменить код .
Щелкните файл макета
theme.liquid
.Чтобы исключить шаблон поиска, вставьте следующий код в раздел
{%, если шаблон содержит "поиск"%} {% endif%}
Чтобы исключить определенную страницу, вставьте следующий код в раздел
{% если дескриптор содержит 'дескриптор-страницы-вы-хотите-исключить'%} {% endif%}
Убедитесь, что вы заменили
page-handle-you-want-to-exclude
правильным дескриптором страницы.Нажмите Сохранить .
Текст Декларации и последующие меры (ДЕКЛАРАЦИЯ)
Декларация МОТ об основополагающих принципах и правах в сфере труда и последующих мерах Принято Международной конференцией труда на ее Восемьдесят шестой сессии, Женева, 18 июня 1998 г. (Приложение от 15 июня 2010 г.)Поскольку МОТ была основана на убеждении, что социальная справедливость необходима для всеобщего и прочного мира;
Принимая во внимание, что экономический рост необходим, но недостаточен для обеспечения справедливости, социального прогресса и искоренения бедности, подтверждая необходимость того, чтобы МОТ продвигала сильную социальную политику, справедливость и демократические институты;
Принимая во внимание, что МОТ сейчас более, чем когда-либо, должна использовать все свои нормативные ресурсы, техническое сотрудничество и исследовательские ресурсы во всех областях своей компетенции, в частности в сфере занятости, профессионального обучения и условий труда, чтобы обеспечить, чтобы в контексте глобальная стратегия экономического и социального развития, экономическая и социальная политика являются взаимоусиливающими компонентами для обеспечения устойчивого развития на широкой основе;
Принимая во внимание, что МОТ должна уделять особое внимание проблемам лиц с особыми социальными потребностями, особенно безработным и трудящимся-мигрантам, а также мобилизовывать и поощрять международные, региональные и национальные усилия, направленные на решение их проблем, и продвигать эффективную политику, направленную на создание рабочих мест;
Принимая во внимание, что в стремлении поддерживать связь между социальным прогрессом и экономическим ростом гарантия основных принципов и прав в сфере труда имеет особое значение, поскольку позволяет заинтересованным лицам свободно и на основе равенства возможностей требовать справедливая доля богатства, которое они помогли создать, и полностью реализовать свой человеческий потенциал;
Принимая во внимание, что МОТ является международной организацией и компетентным органом, уполномоченным в соответствии с Уставом устанавливать и соблюдать международные трудовые стандарты, и пользуется всеобщей поддержкой и признанием в продвижении основных прав в сфере труда как выражения своих конституционных принципов;
Поскольку в ситуации растущей экономической взаимозависимости необходимо срочно подтвердить неизменный характер основных принципов и прав, закрепленных в Уставе Организации, и содействовать их универсальному применению;
МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ ТРУДА
1. Напоминает:
(a) , что, свободно вступая в МОТ, все члены одобрили принципы и права, изложенные в ее Уставе и в Филадельфийской декларации, и обязались работать над достижением общих целей Организации: наилучшие из своих ресурсов и в полном соответствии с их конкретными обстоятельствами;
(b) , что эти принципы и права были выражены и развиты в форме конкретных прав и обязательств в Конвенциях, признанных основополагающими как внутри, так и за пределами Организации.2. Заявляет, что все члены, даже если они не ратифицировали соответствующие конвенции, имеют обязательство, вытекающее из самого факта членства в Организации, уважать, поощрять и реализовывать, добросовестно и в соответствии с Конституция, принципы, касающиеся основных прав, которые являются предметом этих Конвенций, а именно:
(a) свобода ассоциации и эффективное признание права на ведение коллективных переговоров;
b) искоренение всех форм принудительного или обязательного труда;
c) эффективное упразднение детского труда; и
(d) о ликвидации дискриминации в области труда и занятий.3. Признает обязанность Организации оказывать помощь своим Членам в ответ на их установленные и выраженные потребности для достижения этих целей путем полного использования своих уставных, оперативных и бюджетных ресурсов, в том числе путем мобилизации внешние ресурсы и поддержку, а также путем поощрения других международных организаций, с которыми МОТ установила отношения в соответствии со статьей 12 своего Устава, поддерживать эти усилия:
(a) , предлагая техническое сотрудничество и консультативные услуги для содействия ратификация и выполнение основополагающих конвенций;
(b) путем оказания помощи тем Членам, которые еще не в состоянии ратифицировать некоторые или все эти Конвенции, в их усилиях по уважению, продвижению и реализации принципов, касающихся основных прав, которые являются предметом этих Конвенций; и
(c) , помогая странам-членам в их усилиях по созданию климата для экономического и социального развития.4. Решает, что для полного выполнения настоящей Декларации будут осуществляться значимые и эффективные рекламные мероприятия в соответствии с мерами, указанными в приложении к настоящему документу, которые должны рассматриваться как неотъемлемая часть. настоящей Декларации.
5. Подчеркивает, что трудовые нормы не должны использоваться в протекционистских торговых целях, и что ничто в настоящей Декларации и ее последующих действиях не может использоваться или иным образом использоваться для таких целей; кроме того, данная Декларация и последующие меры никоим образом не должны ставить под сомнение сравнительные преимущества любой страны.
Приложение (пересмотренное) Выполнение декларации
I. ОБЩЕЕ НАЗНАЧЕНИЕ1 . Целью последующих действий, описанных ниже, является поощрение усилий членов Организации по продвижению основополагающих принципов и прав, закрепленных в Уставе МОТ и Филадельфийской декларации и подтвержденных в настоящей Декларации.
2 . В соответствии с этой целью, которая носит строго рекламный характер, эта последующая деятельность позволит определить области, в которых помощь Организации в рамках ее деятельности по техническому сотрудничеству может оказаться полезной для ее членов, чтобы помочь им реализовать эти основополагающие принципы и права. .Он не заменяет установленные механизмы надзора и не препятствует их функционированию; следовательно, конкретные ситуации, относящиеся к сфере действия этих механизмов, не должны рассматриваться или повторно рассматриваться в рамках этой последующей деятельности.
3. Два аспекта этой последующей деятельности, описанные ниже, основаны на существующих процедурах: ежегодная последующая деятельность в отношении не ратифицированных основополагающих конвенций повлечет за собой лишь некоторую адаптацию нынешних условий применения пункта статьи 19. 5 (е) Конституции; и Глобальный доклад о влиянии, оказываемом на продвижение основополагающих принципов и прав в сфере труда, который послужит информационным источником для периодического обсуждения на Конференции потребностей членов, предпринятых действий МОТ и результатов, достигнутых в продвижении основные принципы и права в сфере труда.
II. ЕЖЕГОДНОЕ ПОСЛЕДУЮЩИЕ МЕРЫ В ОТНОШЕНИИ НЕРЕТИФИЦИРОВАННЫХ ФУНДАМЕНТАЛЬНЫХ КОНВЕНЦИЙ
A. Назначение и сфера применения
1 . Цель состоит в том, чтобы предоставить возможность ежегодно пересматривать с помощью упрощенных процедур усилия, предпринятые в соответствии с Декларацией странами-членами, которые еще не ратифицировали все основополагающие конвенции.
2. Последующие действия будут охватывать четыре категории основополагающих принципов и прав, указанных в Декларации.
B. Условия
1 . Последующие действия будут основываться на отчетах, запрашиваемых у членов в соответствии с пунктом 5 (е) статьи 19 Устава. Формы отчетов будут составлены таким образом, чтобы получать информацию от правительств, которые не ратифицировали одну или несколько основополагающих конвенций, о любых изменениях, которые могли иметь место в их законодательстве и практике, с должным учетом статьи 23 Конституции и сложившаяся практика.
2 .Эти отчеты, составленные Управлением, будут рассмотрены Административным советом.
3 . Необходимо изучить корректировки существующих процедур Управляющего органа, чтобы позволить членам, не представленным в Управляющем совете, предоставить наиболее подходящим образом разъяснения, которые могут оказаться необходимыми или полезными в ходе обсуждений Управляющего совета, чтобы дополнить информацию, содержащуюся в их отчетах.
III. ГЛОБАЛЬНЫЙ ОТЧЕТ ОБ ОСНОВНЫХ ПРИНЦИПАХ И ПРАВАХ В РАБОТЕ
А.Назначение и сфера применения
1. Цель Глобального отчета — представить динамическую глобальную картину, относящуюся к четырем категориям основополагающих принципов и прав в сфере труда, отмеченных в предыдущий период, и служить основой для оценки эффективности оказываемой помощи. Организацией и для определения приоритетов на следующий период, в том числе в форме планов действий по техническому сотрудничеству, направленных, в частности, на мобилизацию внутренних и внешних ресурсов, необходимых для их выполнения.
B. Условия
1. Отчет будет составлен под ответственность Генерального директора на основе официальной информации или информации, собранной и оцененной в соответствии с установленными процедурами. В случае государств, которые не ратифицировали основополагающие конвенции, он будет основан, в частности, на результатах вышеупомянутых ежегодных последующих мероприятий. В случае государств-членов, ратифицировавших соответствующие конвенции, отчет будет основан, в частности, на отчетах, рассматриваемых в соответствии со статьей 22 Устава.Он также будет относиться к опыту, полученному в результате технического сотрудничества и другой соответствующей деятельности МОТ.
2. Настоящий отчет будет представлен Конференции для периодического обсуждения стратегической цели фундаментальных принципов и прав в сфере труда на основе условий, согласованных Административным советом. Затем Конференция должна будет сделать выводы из этой дискуссии относительно всех имеющихся средств действий МОТ, включая приоритеты и планы действий по техническому сотрудничеству, которые будут реализованы на следующий период, и направить Административный совет и Бюро в их работе. обязанности.
IV. ПОНЯЛ, ЧТО:
1. Конференция в надлежащее время рассмотрит работу этой последующей деятельности в свете приобретенного опыта, чтобы оценить, адекватно ли она достигла общей цели, сформулированной в Части I.