Содержание

Правила и советы по поиску информации в Интернете

Каждый день мы ищем различную информацию в сети Интернет, будь-то описание нашего любимого фильма или доклад видного ученого. Мы давно привыкли к дизайну главных страниц крупнейших поисковиков — Google и Яндексу и посещаем их по десятков раз в день.

А часто ли Вы задумывались над правилами поиска информации? Я думаю не часто (сам сильно об этом не задумывался), но заметил что порой поиск нужной мне информации занимает довольно длительное время. В этой заметке я постараюсь рассказать о способах сокращения времени поиска и повышения его результативности.

Правила поиска информации в поисковых системах

Как уменьшить время на поиск и улучшить его результаты, общие рекомендации:

  • Запросы должны быть простыми. Если вы ищете какое-то предприятие, просто введите его название или хотя бы ту часть названия, которую вы помните наверняка. Если вы ищете конкретное понятие, место или продукт, начните с его названия или имени. Если вы ищете пиццерию, просто введите слово «пиццерия» и название своего города или почтовый индекс. Для большинства запросов вовсе не нужны редкие операторы или изощренный синтаксис. Чем проще, тем лучше.
  • Подумайте, какие слова присутствуют на странице, которую вы ищете. Поисковая система не человек. Это программа, которая сравнивает слова, которые вы вводите, и слова, которые имеются на веб-страницах. Используйте слова, которые с наибольшей вероятностью могут присутствовать на искомой странице. Например, вместо [ у меня болит голова ] введите [ головная боль ], потому что именно этот термин будет использоваться на странице, посвященной медицине. Запрос [ в какой стране летучие мыши считаются хорошей приметой? ] понятен человеку, но в документе, содержащем ответ, может не быть этих слов. Введите лучше [ летучие мыши считаются хорошей приметой в ] или даже [ летучие мыши хорошая примета ], поскольку эти слова скорее всего присутствуют на нужной странице.
  • Опишите, что вам нужно, используя как можно меньше слов. Каждое слово в запросе служит для сужения и уточнения области поиска. Поскольку используются все слова, каждое дополнительное слово ограничивает круг результатов. Если ввести слишком много ограничений, можно пропустить полезную информацию. Начните поиск с нескольких ключевых слов. Даже если вы не нашли то, что нужно, просмотрите найденные результаты, и вы поймете, какие дополнительные слова нужно включить в следующий запрос, чтобы получить более релевантные результаты. Например, простой запрос [ погода минск ] даст лучшие результаты, чем более длинный запрос [ прогноз погоды для минска беларусь ].
  • Подбирайте более информативные слова. Чем более информативное слово используется, тем больше вероятность, что результаты будут релевантными. Такие слова, как «документ», «веб-сайт», «компания» или «информация» обычно лишние. При этом следует помнить, что даже если вы используете правильное слово, но большинство людей редко им пользуется, это слово может не оказаться на нужной странице. Например, запрос [ популярные рингтоны ] более информативен и конкретен, чем [ популярные мелодии ].

Разработчики поисковых систем разработали специальный язык поисковых запросов (язык своеобразных правил поиска информации), который позволяет облегчить и ускорить поиск информации в Интернете. Ниже я приведу примеры использования выражения этого «языка».

Какую поисковую систему использовать: Google

или Яндекс?

Когда я был неопытен, для поиска я использовал только одну поисковую систему. Но опыт показал, что такой подход неэффективен, потому что у каждой поисковой системы свой уникальный запатентованный алгоритм поиска и, соответственно, свои плюсы и минусы. Куда важнее понять для каких типов поисковых запросов использовать тот или иной поисковик. Существует следующие типы поисковых запросов:

  • Навигационные запросы – это такие запросы целью которых является поиск определенного места в сети Интернет. Например, сайт фирмы или сайт недавно посещенного форума, поиск ссылки на блог и т.д.
  • Информационные запросы – такие запросы вводят, если хотят получить какие-то сведения или найти нужную информацию в Интернете. Например, поиск сведений об истории Древнего Рима или поиск результатов футбольного матча и т.д.
  • Транзакционные запросы – это вид запросов, которые вводят для того чтобы совершить какое-то действие в Интернете — транзакцию (купить, скачать, закачать, подписаться и т.п.)
  • Нечеткие запросы – это общие, конкретизированные запросы, которые, как правило, вводят неопытные пользователи. Напрмер, «мобильник», «музыка», «цветы» и т.д.

Особенности поисковой системы Google

Данный поисковик лучше использовать для навигационных запросов или поиска адреса сайта. Алгоритм этой поисковой машины особое внимание уделяет виду доменному имени и ссылке. Я несколько раз видел как при вводе нечеткого запроса в ТОП-10 выдачи присутствовали сайты, на которых вообще отсутствовал контент. Не стоит также забывать и о том, что Google — это международный поисковик, т.е. лучшее решение для поиска информации на иностранном языке.

Особенности поисковой системы Яндекс

Отечественный поисковик отлично подходит для поиска информации в Интернете по информационным запросам. Он очень хорошо индексирует Рунет, его алгоритм уже много раз подвергался доработке, к тому же он оптимизирован для поиска информации на русском языке. Примечательно что Яндекс тоже получил статус международного поисковика, произошло это 19 мая 2010 года (ссылка на источник).

Язык поисковых запросов Яндекс`а

Пример Значение
«К нам на утренний рассол« Слова идут подряд в точной форме
«Прибыл * посол« Пропущено слово в цитате
полгорбушки & мосол Слова в пределах одного предложения
снаряжайся && добудь Слова в пределах одного документа
глухаря | куропатку | кого-нибудь Поиск любого из слов
не смогешь << винить Неранжирующее «и»: выражение после оператора не влияет на позицию документа в выдаче
я должон /2 казнить Расстояние в пределах двух слов в любую сторону (то есть между заданными словами может встречаться одно слово)
государственное дело &&/3 улавливаешь нить Расстояние в 3 предложения в любую сторону
нешто я ~~ пойму Исключение слова пойму из поиска
при моем /+2 уму Расстояние в пределах двух слов в прямом порядке
чай ~ лаптем Поиск предложения, где слово чай встречается без слова лаптем
щи /(-1 +2) хлебаю Расстояние от одного слова в обратном порядке до двух слов в прямом
!Соображаю !что !чему Слова в точной форме с заданным регистром
получается && (+на | !мне) Скобки формируют группы в сложных запросах
!!политика Словарная форма слова
title:(в стране) Поиск по заголовкам документов
url:ptici.narod.ru/ptici/kuropatka.htm
Поиск по URL
беспременно inurl:vojne Поиск с учетом фрагмента URL
host:lib.ru Поиск по хосту
rhost:ru.lib.* Поиск по хосту в обратной записи
site:http://www.lib.ru/PXESY/FILATOW Поиск по всем поддоменам и страницам заданного сайта
mime:pdf Поиск по одному типу файлов
lang:en Поиск с ограничением по языку
domain:ru Поиск с ограничением по домену
date:200712* Поиск с ограничением по дате
date:20071215..20080101, date:>20091231 Поиск с ограничением по интервалу дат
cat:11000051 Поиск по рубрике Яндекс.Каталога

Язык поисковых запросов Google

ПРИМЕР ОПЕРАТОРА СОДЕРЖАНИЕ НАЙДЕННЫХ СТРАНИЦ
отпуск Гаваи два слова отпуск и Гаваи.
Мауи OR Гаваи либо слово Мауи или слово Гаваи
«Каждое слово« точная фраза каждое слово
вирус —компьютер слово
вирус
но НЕ слово компьютер
+носок только слово носок, а не его множественные формы и синонымы
~автомобильный кредит информация о кредите на автомобили с различными синонимами: грузовик, легковой автомобиль, и т.д.
define:компьютер определения слова компьютер в Интернете
красный * синий слова красный и синий разделенные несколькими словами.5
(2 в 5-той степени)
ДОПОЛНИТЕЛЬНЫЕ ОПЕРАТОРЫ ЗНАЧЕНИЕ ПОИСКОВЫЙ ЗАПРОС И ЕГО РЕЗУЛЬТАТЫ
site: Поиск только на одном сайте прием site:www.stanford.edu (Поиск информации о приеме на сайте Стенфордского университета)
[#][#] Искать в диапазоне чисел DVD плеер $100..150 (Поиск DVD плеера от $100 до $150)
link: Ссылающиеся страницы link:www.stanford.edu(Найти страницы, ссылающиеся на сайт Стэнфордского университета)
info: Информация о странице info:www.stanford.edu(Получение информации о сайте Стэнфордского университета)
related: Похожие страницы related:www.stanford.edu(Найти сайты, похожие на сайт Стэнфордского университета)

Итоги

В этой статье мной были рассмотрены правила поиска информации, т.е. способы уменьшения времени, затрачиваемого на поиск различной информации в Интернете. Здесь не были рассмотрены абсолютно все поисковые машины, но, если следовать описанным выше правилам, можно сэкономить много своего личного времени. Итак, основные правила поиска информации в Интернете:

  1. Не вводите слишком длинные поисковые запросы — это сокращает область поиска и Вы можете пропустить важную информацию.
  2. Используйте информативные слова, старайтесь избегать общих фраз и мало употребляемых синонимов
  3. Используйте разные поисковые системы для различных видов поисковых запросов
  4. Применяйте специально разработанные языки поисковых запросов
Работают ли электромобили в зимних условиях? Виды хостинга

Я задолбался искать один и тот же запрос в Яндекс и Google и создал Мультипоиск

Теперь можно искать в разных поисковиках в 1 клик

{«id»:275570,»type»:1,»typeStr»:»content»,»showTitle»:false,»initialState»:{«isActive»:false},»gtm»:»»}

{«id»:275570,»gtm»:null}

31 283 просмотров

Проблема: надоело искать одно и то же в разных поисковиках

Почти все мы используем Яндекс и Google. Но они дают разные результаты в поисковой выдаче. Google эффективнее в поиске информационных запросов. И круче Яндекса, если ищем на иностранных языках. Яндекс лучше работает с местными запросами. А иногда нужно посмотреть выдачу в двух поисковиках сразу.

Я заметил, что часто трачу лишнее время на поиск одной и той же информации в разных поисковиках. Получается примерно так:

  • Ищу запрос в Google
  • Решаю, что мне надо поискать еще в Яндексе
  • Ввожу слово Яндекс
  • Кликаю на ссылку с Яндексом
  • Перепечатываю в Яндексе поисковый запрос
  • Ищу в Яндексе
{ «osnovaUnitId»: null, «url»: «https://booster.osnova.io/a/relevant?site=vc&v=2», «place»: «between_entry_blocks», «site»: «vc», «settings»: {«modes»:{«externalLink»:{«buttonLabels»:[«\u0423\u0437\u043d\u0430\u0442\u044c»,»\u0427\u0438\u0442\u0430\u0442\u044c»,»\u041d\u0430\u0447\u0430\u0442\u044c»,»\u0417\u0430\u043a\u0430\u0437\u0430\u0442\u044c»,»\u041a\u0443\u043f\u0438\u0442\u044c»,»\u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c»,»\u0421\u043a\u0430\u0447\u0430\u0442\u044c»,»\u041f\u0435\u0440\u0435\u0439\u0442\u0438″]}},»deviceList»:{«desktop»:»\u0414\u0435\u0441\u043a\u0442\u043e\u043f»,»smartphone»:»\u0421\u043c\u0430\u0440\u0442\u0444\u043e\u043d\u044b»,»tablet»:»\u041f\u043b\u0430\u043d\u0448\u0435\u0442\u044b»}} }

Этапы, выделенные жирным шрифтом, явно лишние.

То же самое касается более специфических поисковиков: Википедия, YouTube, Wildberries, Яндекс.Маркет и т.д. Ведь все крупные сервисы — это поисковики, которые для отдельных запросов могут быть лучше Google.

Решение: Мультипоиск

Мы сделали простое расширение для браузера — Мультипоиск. Ищете в Google, не понравилась выдача — нажали на Яндекс. Этот же запрос автоматически найдется на Яндексе. Или наоборот. Не надо вручную заходить в другой поисковик и перебивать запрос:

Что сделаем дальше?

Расширение уже работает с десятком поисковиков. Скоро появится возможность добавлять собственные поисковики в несколько кликов.

А еще есть идея объединить выдачу из разных поисковиков, просто разместив их друг за другом. Получится примерно как здесь (откройте ссылку и покрутите вниз, чтобы увидеть, как страницы меняются друг за другом). Листаете Google, а следом за ним открывается Яндекс, потом Wildberries, потом Яндекс.Маркет, а затем другие релевантные поисковики, агрегаторы и маркетплейсы с этим же поисковым запросом. Сами поисковики и их последовательность подбирается на основе вашего поискового запроса: для информационных будут одни, для товарных — другие.

Напишите в комментариях, интересно ли было потестить такую фичу? Может быть есть другие запросы функций? Будем рады любому фидбеку и предложениям в комментариях.

Маленький эксперимент

Мультипоиск мы закодили за 4 дня. А вообще нашими проектами пользуются 200К юзеров каждый день. Пока мы их делали, я часто ловил себя на одной мысли. Чем больше ты усложняешь, мудришь, затягиваешь запуск и получение фидбека, тем хуже результат. А когда больше 2-3 месяца трудишься над чем-то без фидбека, в 90% случаев люди вообще не поймут, что ты сделал в итоге.

В итоге я решил провести эксперимент «12 за 12»: создал Telegram-канал, где обещаю запустить за 12 месяцев 12 маленьких продуктов, которые просто решают личные боли или проблемы друзей. Вот заметил проблему и за месяц сделал решение. Т.е. 12 раз запуститься настолько быстро, просто и дешево, насколько это возможно. И посмотреть что получится.

В канале буду отчитываться о прогрессе, писать обо всех метриках (включая о том, что получится заработать на этих проектах), достижениях и фейлах. В общем подписывайтесь, будет интересно.

9 поисковиков, которые лучше, чем Google

1. DuckDuckGo

Что это

DuckDuckGo — это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo, Bing, «Википедии».

Чем лучше

DuckDuckGo позиционирует себя как поисковик, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookies максимально ограничено.

Зачем это вам

Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.

DuckDuckGo формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на других языках, тогда как Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на иностранном.

DuckDuckGo →

2. You.com

Что это

Один из новых поисковиков, выдача которого формируется не по принципу «самый короткий релевантный ответ», а представляет собой всестороннюю выжимку данных из различных источников, включая соцсети, сообщества и форумы.

Чем лучше

У You.com современный интерфейс и приятный дизайн, которые обеспечивают наглядность информации и позволяют одним взглядом охватить полную картину. Результаты отображаются в виде блоков и разбиты на категории.

В зависимости от запроса поисковик даёт релевантные подсказки, пытаясь предугадать ваши мысли. А в выдачу попадают не только популярные сайты, но и малоизвестные проекты при условии, что у них есть правильный ответ на вопрос.

Зачем это вам

You.com удобнее многих других поисковиков и значительно экономит время. По сути, сервис гуглит за вас и в один клик предоставляет целую подборку результатов, которые можно быстро изучить прямо на странице поиска.

You.com →

3. StartPage

Что это

Интересный поисковик, который объединяет в себе лучшее из двух миров. В отличие о конкурентов, использующих собственные движки, которые откровенно слабее крупных игроков, StartPage берёт выдачу из Google. Важный момент: при этом он обезличивает все ваши запросы, сохраняя анонимность.

Чем лучше

Главная фишка StartPage — это забота о конфиденциальности. Сервис использует прокси, а также специальный генератор уникальных URL, благодаря которому отпадает надобность в cookies, что и обеспечивает полную анонимность в Сети. Поисковик не фиксирует ваши запросы и IP-адрес, а ещё имеет специальный приватный режим, который активируется в выдаче и не позволяет сайтам отслеживать ваши действия.

Зачем это вам

Попробуйте, если результаты альтернативных поисковиков не устраивают, а со слежкой Google вы мириться не готовы.

StartPage →

4. Swisscows

Что это

Швейцарский сервис, в основе которого лежит семантический поиск на основе машинного обучения. Искусственный интеллект определяет контекст поискового запроса и угадывает, что на самом деле вы ищете.

Swisscows сотрудничает с Bing и использует их индексированную выдачу в дополнение к своей собственной. Монетизация осуществляется за счёт рекламы, которая основывается исключительно на поисковых запросах.

Чем лучше

Ключевая особенность сервиса — в семантическом алгоритме, который делает поиск интеллектуальным. Swisscows не хранит файлы cookies, не отслеживает ваше поведение и сохраняет анонимность — вы всегда остаётесь гостем.

Зачем это вам

Swisscows пригодится, если вам нужен честный, безопасный и анонимный поисковик с собственным индексом.

Swisscows →

5. Dogpile

Что это

Метапоисковик Dogpile выводит комбинированный список результатов из поисковых выдач Google, Yahoo и других популярных систем.

Чем лучше

Во-первых, Dogpile отображает меньше рекламы. Во-вторых, сервис использует особый алгоритм, чтобы находить и показывать лучшие результаты из разных поисковиков. Как утверждают разработчики Dogpile, их система формирует самую полную выдачу во всём интернете.

Зачем это вам

Если вы не можете найти информацию в Google или другом стандартном поисковике, попробуйте обнаружить её сразу в нескольких поисковиках с помощью Dogpile.

Dogpile →

6. BoardReader

Что это

BoardReader — система для текстового поиска по форумам, сервисам вопросов и ответов и другим сообществам.

Чем лучше

Сервис позволяет сузить поле поиска до социальных площадок. Благодаря специальным фильтрам вы можете быстро находить посты и комментарии, которые соответствуют вашим критериям: языку, дате публикации и названию сайта.

Зачем это вам

BoardReader может пригодиться пиарщикам и другим специалистам в области медиа, которых интересует мнение массовой аудитории по тем или иным вопросам.

BoardReader →

7. Ahmia

Что это

Ahmia — система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный браузер. В отличие от других подобных сервисов в Ahmia недоступен незаконный контент, что сделает ваш поиск безопаснее.

Но учтите: в России Tor заблокирован, поэтому без VPN в этом случае точно не обойтись.

Чем лучше

Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.

Зачем это вам

В Tor много ресурсов, которые невозможно встретить в законопослушном интернете. Это своеобразная сеть внутри Сети со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.

Ahmia →

8. FindSounds

Что это

FindSounds — ещё один специализированный поисковик. Ищет в открытых источниках различные звуки: дом, природа, машины, люди и так далее. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнять поиск.

Чем лучше

В выдаче только звуки и ничего лишнего. В настройках можно выставить желаемый формат и качество звучания. Все найденные записи доступны для скачивания. Имеется поиск по образцу.

Зачем это вам

Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это мы выбрали только из доступных русскоязычных запросов. На английском спектр ещё шире.

Если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?

FindSounds →

9. Wolfram|Alpha

Что это

Wolfram|Alpha — вычислительно-поисковая система. Вместо ссылок на статьи, содержащие ключевые слова, она выдаёт готовый ответ на запрос пользователя. Например, если ввести в форму поиска «сравнить население Нью-Йорка и Сан-Франциско» на английском, то Wolfram|Alpha сразу выведет на экран таблицы и графики со сравнением.

Чем лучше

Этот сервис лучше других подходит для поиска фактов и вычисления данных. Wolfram|Alpha накапливает и систематизирует доступные в Сети знания из различных областей, включая науку, культуру и развлечения. Если в этой базе находится готовый ответ на поисковый запрос, система показывает его, если нет — вычисляет и выводит результат. При этом пользователь видит только нужную информацию и ничего лишнего.

Зачем это вам

Если вы, например, студент, аналитик, журналист или научный сотрудник, то можете использовать Wolfram|Alpha для поиска и вычисления данных, связанных с вашей деятельностью. Сервис понимает не все запросы, но постоянно развивается и становится умнее.

Wolfram|Alpha →

Текст был обновлён в феврале 2022 года.

Читайте также 🧐

Google изменит правила поиска информации в Сети

https://ria.ru/20210701/google-1739362551.html

Google изменит правила поиска информации в Сети

Google изменит правила поиска информации в Сети — РИА Новости, 01.07.2021

Google изменит правила поиска информации в Сети

Google внедряет в поисковый алгоритм новую технологию «многозадачная унифицированная модель» (MUM), сообщается в официальном блоге корпорации. РИА Новости, 01.07.2021

2021-07-01T10:45

2021-07-01T10:45

2021-07-01T10:45

наука

технологии

google

/html/head/meta[@name=’og:title’]/@content

/html/head/meta[@name=’og:description’]/@content

https://cdnn21.img.ria.ru/images/150927/47/1509274705_0:150:3008:1842_1920x0_80_0_0_a7b93732d230f5d1006545f5c09917c5.jpg

МОСКВА, 1 июл — РИА Новости. Google внедряет в поисковый алгоритм новую технологию «многозадачная унифицированная модель» (MUM), сообщается в официальном блоге корпорации.MUM работает со сложными поисковыми запросами, предоставляя более точные сведения на основе большого количества источников. Технология способна одновременно обрабатывать текст, визуальный контент и аудио. Поисковик, например, сможет дать развернутый ответ на запрос «сегодня я поднялся на гору Адамс, а через год хочу взойти на Фудзи, как подготовиться». Google сравнит высоту каждой горы, среднюю температуру, сложность пешеходных троп, подходящее снаряжение для использования.Работу новой технологии Google отрабатывает на информации о вакцинах против COVID-19. Поисковик по схожим вопросам выдает не привычные ссылки, а уже обработанную информацию из проверенных источников.В корпорации обещают, что MUM е будет навязывать пользователям ту или иную информацию, а сама технология не станет инструментом цензуры. Новый алгоритм полноценно развернут за несколько лет.

https://ria.ru/20210630/android-1739252964.html

РИА Новости

[email protected]

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

2021

РИА Новости

[email protected]

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

Новости

ru-RU

https://ria.ru/docs/about/copyright.html

https://xn--c1acbl2abdlkab1og.xn--p1ai/

РИА Новости

[email protected]

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

https://cdnn21.img.ria.ru/images/150927/47/1509274705_177:0:2833:1992_1920x0_80_0_0_08b81489f6f57b48b521c99c7af8c997.jpg

РИА Новости

[email protected]

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

РИА Новости

[email protected]

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

технологии, google

МОСКВА, 1 июл — РИА Новости. Google внедряет в поисковый алгоритм новую технологию «многозадачная унифицированная модель» (MUM), сообщается в официальном блоге корпорации.

MUM работает со сложными поисковыми запросами, предоставляя более точные сведения на основе большого количества источников. Технология способна одновременно обрабатывать текст, визуальный контент и аудио. Поисковик, например, сможет дать развернутый ответ на запрос «сегодня я поднялся на гору Адамс, а через год хочу взойти на Фудзи, как подготовиться». Google сравнит высоту каждой горы, среднюю температуру, сложность пешеходных троп, подходящее снаряжение для использования.

Работу новой технологии Google отрабатывает на информации о вакцинах против COVID-19. Поисковик по схожим вопросам выдает не привычные ссылки, а уже обработанную информацию из проверенных источников.

В корпорации обещают, что MUM е будет навязывать пользователям ту или иную информацию, а сама технология не станет инструментом цензуры. Новый алгоритм полноценно развернут за несколько лет.

30 июня 2021, 15:50НаукаGoogle приготовил для владельцев Android-смартфонов неприятный сюрприз

Поиск информации в Интернете. Эффективные советы по поиску информации.

Думаю, что меня не закидают помидорами, прочитав название статьи. Согласитесь, что без информации мы сейчас и дня прожить не можем, а для того, чтобы информацией обладать, ее нужно сначала найти. Находить нужно уметь быстро и правильно. Разве существуют правила, чтобы вести поиск информации в Интернете? – спросите вы.

Предлагаю вспомнить себя новичком в Интернете или оглянуться на своих знакомых, которых у каждого из нас  найдется предостаточно. Тех, кто использует Интернет в очень ограниченном количестве. А происходит это зачастую только из-за того, что человек не знает, как правильно составлять поисковые запросы, чтобы найти нужную ему информацию. В результате – сидение на одних и тех же сайтах и ресурсах, не понимая, что под ногами, то есть, под руками, есть огромный и неизведанный мир.

Как происходит поиск информации в Интернете?

Для начала, давайте определимся, кто для нас находит нужную нам информацию? Главные труженики – это поисковые системы и каталоги. Как верно замечено в справочнике Яндекса, умение искать – это искусство. Вести поиск эффективно при всей простоте интернета могут не все.

Находят для русского пользователя информацию различные поисковые системы, такие как  Google, Yandex, Ramble, Mail, Yahoo…  Общих правил поиска у них нет, так что нам предоставляется полная свобода действий. Я предпочитаю использовать Google, так как он имеет лучший в мире алгоритм ранжирования запросов. Для сравнения результатов всегда обращаюсь к Yandex. Если вы будете использовать эти два поисковика, то увидите, что результаты поиска в обоих случаях при одинаковом запросе будут отличаться друг от друга.

Поисковые системы ищут для нас информацию, учитывая следующие критерии:

  • Ключевое слово содержится в заголовке
  • Наличие ключевого слова в адресе домена или в названии страницы
  • Ключевое слово выделено жирным шрифтом
  • Плотность ключевого слова
  • Ссылки на странице и название ключевого слова в тексте ссылки

То есть, поисковой системе нужно проделать огромную работу, чтобы выдать нам результат. Поэтому первое, что мы должны научиться делать, правильно оформлять поисковые запросы, прежде чем их ввести в поисковую строку.

Правила поиска информации в Интернете

1. Сформулируйте несколько запросов по вашему вопросу. Учитывайте при этом, что если вам надо найти реферат о слоне, то по слову слон вы найдете слонов и всего того, что может и не может относиться к слову слон. Это могут быть книги со словом слон в заголовке, это могут быть сайты, статьи, анекдоты, сказки, вообщем, все то, что к вашему настоящему запросу не имеет никакого отношения. Поэтому пишем коротко и ясно: рефераты о слонах. Для увеличения нажмите на картинку.

Яндекс нам выдал 2 млн ответов, Гугл оценил, что нам будут полезны 335000 страниц. Как видите, придется попотеть, чтобы найти то, что нам действительно нужно.

2. Сузим область поиска. Для этого заключим в кавычки наш запрос, и он будет выглядеть так: “рефераты о слонах”. Посмотрим, что получится:

О чудо! Искать придется теперь гораздо меньше! Теперь мы уверены, что на этих страницах, которые нам предоставили поисковики, будет информация, связанная с рефератами о слонах.

3. Не забываем о том, что писать поисковый запрос нужно грамотно. От этого также зависит качество выданной нам информации.

4. Поисковый запрос пишем только маленьким буквами. Если мы используем в запросе большие буквы, то не сможем увидеть ответы, где данное слово пишется с маленькой буквы. Используйте заглавные буквы только в именах собственных.

5. Активно используем поиск в картинках. Обычно, картинки имеют подписи при загрузке, в которых могут прописаны именно ваши ключевые слова.

6. С помощью знаков + и – можно указать какие слова мы хотим или не хотим видеть. Например, при запросе “зеленый чай” можно отметить знаком (-) слово пакетированный. В этом случае, можете рассчитывать на то, что информацию о зеленом чае в пакетиках вы не увидите.

7. Знак | сможет дать понять поисковым системам, что вы хотите найти “или-или”. Если вы спросите “как написать реферат|оформить реферат”, то в ответах у вас будут и как написать реферат и как его оформить.

8. Знаком ! мы указываем, что хотим знать точную информацию по конкретному слову. Например, при поиске запроса !слон, мы увидим точное соответствие данному слову без словоформ. То есть, в поиске не будут отображены различные формы слова “слон” – слоны, слонов, слонами, о слонах и т.д.

9. Принимайте во внимание, что через какое-то время поиск может выдать вам совершенно другую информацию. Поэтому найденную информацию, если она вам действительно важна, лучше всего сохранять в избранном или в закладках браузера. Используйте систему хранения информации в своем браузере с помощью папок, их можно создавать прямо на панели, нажав правой кнопкой мыши и выбрав “добавить папку”. Я предпочитаю сохранять с метками в Evernote, можете прочитать о моем любимом помощнике в статье “Супер-человек? С Evernote возможно!”

10. Используйте функции расширенного поиска поисковых систем, если вам нужны уточнения по датам, географии, языку, формату файла.

11. Не пренебрегайте поиском на 2-й и последующих страницах. Часто бывает, что свежая и новая информация еще не успела попасть в ТОП 10, поэтому ее придется поискать. Иногда я нахожу свои сайты на пятой, или даже десятой странице.

12. Если вам постоянно нужна информация по конкретной сфере деятельности, используйте для сбора информации социальные сети, сообщества, группы, форумы, каталоги. Рассылка сервиса Subscribe может предложить вам большое количество специализированных, тематических групп, которые будут постоянно присылать на вашу почту новую информацию. Самое нужное и интересное вы также можете сохранять в закладках браузер или в любом удобном для этого дела сервисе, например, Evernote.

Вывод

Надеюсь, что вы убедились, что поиск информации в Интернете может стать увлекательным занятием. Главное при этом знать некоторые правила, которые помогут ее фильтровать, и тогда поиск не будет занимать много времени, а у вас не наступит разочарование от потерянного драгоценного времени. Когда вы “набьете руку”, то также сможете поделиться с друзьями своими эффективными советами.

Если эта статья для вас оказалась полезной и интересной, поделитесь ею с друзьями, нажав на кнопку любой социальной сети.

Для визуалов удалось найти советы Николая Фоменко:

Любую статью в моем блоге легче и эффективнее найти в разделе “Карта сайта”. Можете проверить прямо сейчас. Успехов вам в быстром и эффективном поиске информации!

Просмотры: 3 226

Правила эффективного поиска информации в интернете

Поиск информации – одна из задач, которую приходится решать каждому пользователю интернета.

Приступая к поиску данных в интернете, стоит определить цель поиска. Полезно ответить для себя на следующие вопросы:

  • известны ли вам адреса ресурсов сети, с которых можно начать поиск?
  • что вы уже знаете о проблеме, информацию о которой ищете?
  • с каких ключевых слов стоит начать поиск?
  • сколько времени вы готовы потратить на поиск нужных данных?
От того, как именно поставлена задача, во многом зависит и стратегия поисковой деятельности, и выбор соответствующих поисковых средств.

Существуют три основных способа поиска информации в интернете:

Способ 1: Указание адреса страницы
Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Способ 2: Передвижение по гиперссылкам
Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу. Но этот способ очень простой и подходит для начинающего пользователя.

Способ 3: Обращение к поисковой системе
На помощь приходят специальные поисковые системы (их еще называют поисковыми машинами).
Результатом выполнения запроса является перечень ссылок на Web-страницы, рядом с которыми присутствуют заданные текстовые фрагменты. Наиболее популярные поисковые серверы: Яндекс (yandex.ru), Гугл (google.ru) и Рамблер (rambler.ru). Языки запросов различных поисковиков несколько отличаются друг от друга.

Поисковая система Яндекс

  • Чтобы найти информацию с помощью поисковой системы Яндекс, откроем главную страницу. Строка для ввода поискового запроса расположена в верхней части страницы, в области, выделенной желтым фоном.
Укажем в ней необходимые ключевые слова и нажмем на клавиатуре клавишу или щелкнем мышью на кнопке «Найти», размещенной возле строки поиска.
Получив такую команду, Яндекс просмотрит всю свою базу данных и попытается найти в ней веб-страницы, где встречается введенное нами слово или словосочетание. При этом нужно заранее учитывать, что чем обширнее наш запрос, тем меньшее количество веб-страниц будет ему соответствовать.
  • По умолчанию на одной странице Яндекс отображает только 10 таких ссылок, поэтому для ознакомления с полными результатами поиска необходимо будет листать страницы с помощью цифр-ссылок. 
  • Каждый обнаруженный ресурс в результатах поиска представлен названием веб-страницы и текстом ссылки. Кроме того, в большинстве случаев поисковая система демонстрирует небольшой фрагмент текста, содержащегося на той или иной найденной веб-странице, в котором обнаружено совпадение с текстом вашего запроса. При этом слова, которые мы ввели для поиска, в этих фрагментах будут выделены полужирным начертанием.
  • Внизу страницы с результатами поиска, есть строка «в других поисковых системах». Рядом с этими словами имеются ссылки на несколько других популярных поисковых систем. Поэтому, если мы не нашли с помощью Яндекса нужной нам информации, можно воспользоваться другими поисковыми системами, перейдя по ссылке.

Поиск информации в Яндексе можно осуществлять 

в простом и расширенном поисковом режиме.

  • Простой поиск
Поиск по одному или нескольким ключевым словам, введенным в строку запроса.
Перед тем как начинать вводить в строку поиска поисковой системы запрос, тщательно его сформулируйте.
Чем более четкой будет выбранная формулировка, тем меньше ненужных вам сайтов предложит в результатах поиска поисковая система.
  • Расширенный поиск
Все популярные поисковые системы располагают специальными возможностями для расширенного поиска ресурсов.

Чтобы попасть на веб-страницу, предоставляющую такие возможности, необходимо воспользоваться ссылкой с названием типа «Расширенный поиск».

Перейдя по этой ссылке, мы увидим большую поисковую форму, в которой можно указать множество параметров.
Поисковая система Яндекс позволяет, например, настраивать параметры поиска слов в зависимости от их расположения (рядом, в одном предложении, на одной странице) и формы.
Кроме того, она может искать веб-страницы по их языку (русский, украинский, белорусский и т.д.), по дате последнего изменения и даже по формату файла веб-страницы.
Наконец, с помощью Яндекса информацию можно искать на каком-то конкретном сайте. Это бывает полезно в том случае, если на нужном вам сайте нет встроенной поисковой системы.

Для каждой поисковой системы существуют свои языки запросов. Мы познакомимся с логическим языком запросов для Яндекса, который позволяет в режиме обычного поиска вводить в строку поиска дополнительные служебные команды, уточняющие ваши требования. Рассмотрим некоторые такие команды.
  • Используйте знаки «+» и «-«.
Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса (-). И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс (+). Обратите внимание, что слово и знак плюс-минус должны быть написаны слитно.
Например, если вы хотите узнать про аквариумных рыбок, но без продажи и разведения, то набираем в поисковой строке:
«аквариумные рыбки -разведение -продажа».
  • Поиск точного соответствия — знак «!».
Искать по точной словоформе. Вы можете дать команду Яндексу не учитывать формы слов из запроса при поиске.
Например, запрос !иванов найдет только страницы с упоминанием этой фамилии, а не города «Иваново».
  • Поиск точной фразы – кавычки.
Помещать поисковый запрос в кавычки (например, «кто виноват и что делать») нужно только в том случае, если мы хотим найти  фразу, на 100% совпадающую с текстом нашего запроса.
Кавычки заставляют поисковый механизм отбирать лишь документы, в которых слова из запроса стоят в точно таком же порядке, в котором мы указали их в поисковом запросе. Если же кавычек нет, то по запросу «кто виноват и что делать» поисковая система может предложить нам страницу, содержащую фразу «кто виноват — тому и делать, что скажут» или же «ну и кто виноват, что Петр Петрович не умеет делать пельмени». Формально при этом поисковая система справится со своей работой, ведь в указанных отрывках есть все слова из введенной фразы. А то, что они стоят совсем не в том порядке, в котором нам нужно, — это уже другой вопрос, который и уточняется использованием кавычек.
При работе с поисковыми системами рано или поздно мы встретим слово «релевантность»
Релевантность — это степень соответствия найденных документов нашему запросу.  Например, в Яндексе его можно обнаружить внизу каждой веб-страницы, содержащей результаты поиска, сразу под набором цифр-ссылок. Здесь оно используется в качестве параметра для функции «Отсортировано». Помимо параметра по релевантности, доступен также вариант по дате.
Если страницы в результатах поиска сортируются по релевантности, то это значит, что в самом начале указываются сайты с наибольшим уровнем соответствия вашему запросу, после них располагаются ресурсы с меньшим уровнем релевантности и т.д.
Детские поисковые системы
  • Чтобы обезопасить детей от ненужной информации, созданы специальные детские поисковые системы, которые  индексируют не все сайты, а только сайты с детской или околодетской тематикой.
Для самых юных пользователей Интернета создана специальная поисковая система  АгА, которая предназначена для поиска информации детских ресурсов. Она содержит много ресурсов по воспитанию и здоровью детей, поэтому ее можно рекомендовать не только детям, но и родителям. Очень удобно искать в этой поисковой системе, используя карту сайта.

АгА не только поисковый сервис. Здесь есть всеми любимые мультики, раскраски, просмотр диафильмов, помощь по разным школьным предметам и т.д.

Quintura для Детей – визуальный поиск по детским ресурсам, разработанный специально для детей и ориентирован на школьников младших и средних классов.

Для поиска используется интерактивное облако Quintura. Красочный и привлекательный интерфейс сервиса содержит несколько интерактивных картинок, кликая на которые, дети сразу могут выбрать интересную для себя тему, например: наука, музыка, динозавры или игры.

10 способов поиска в Google, о которых не знает 96% людей / AdMe

В эру цифровых технологий и скоростного интернета можно узнать любую информацию. За несколько минут мы находим рецепты вкусного пирога или знакомимся с теорией корпускулярно-волнового дуализма. 

Но зачастую нужную информацию приходится высеивать по крупицам и тратить на это не один час. AdMe.ru собрал для вас самые действенные способы, которые помогут отыскать драгоценные материалы за пару кликов.

1. Или то, или другое

Иногда мы точно не уверены, что правильно запомнили или услышали нужную информацию. Не беда! Просто введите несколько подходящих вариантов через значок “|” или английское «or», а затем выберите подходящий результат.

2. Поиск по синониму

Как известно, великий и могучий русский язык богат синонимами. И иногда это совсем не на руку. Если вам нужно быстро найти сайты по заданной теме, а не просто конкретную фразу — поставьте символ «~».

Например, результаты запроса «здоровая ~еда» помогут узнать принципы здорового питания, познакомят с полезными рецептами и продуктами, а также предложат посетить рестораны правильного питания.

 3. Поиск внутри сайта

Бывает, прочитаешь интересную статью на сайте, а потом через время хочешь поделиться полезной информацией с друзьями или просто перечитать. Тогда на помощь приходит поиск внутри сайта. Для этого сначала вводим адрес сайта, а затем ключевые слова или фразу целиком. 

4. Сила звездочки

Когда коварная память подводит нас и безнадежно теряет из фразы слова или цифры, на помощь приходит значок «*». Просто поставьте его на месте забытого фрагмента и получите нужные результаты. 

5. Много пропущенных слов

А вот если из памяти выпало не одно слово, а половина фразы, попробуйте написать первое и последнее слово, а между ними — AROUND (примерное количество пропущенных слов). Например, вот так: «Я вас любил AROUND(7) не совсем».

6. Временные рамки

Иногда нам позарез нужно познакомиться с событиями, которые происходили в определенный промежуток времени. Для этого к основной фразе добавляем временные рамки, прописанные через многоточие. Например, мы хотим узнать, какие научные открытия были сделаны в период с 1900 по 2000 год.

7. Поиск по названию или ссылке

Для того, чтобы поисковик нашел ключевые слова в названии статьи — введите слово «intitle:» перед запросом без пробела, а для поиска слова в ссылке — «inurl:».  

8. Похожие сайты 

Если вы пришли в восторг от сайта и теперь хотите найти аналогичные — введите  «related:» перед адресом сайта.

9. Фраза целиком

Самый простой и эффективный способ найти что-то конкретное и именно в таком порядке, как вы ввели, — заключить фразу в кавычки.

Например, если вы введете самый забавный текст — поисковик покажет результаты по запросу «самый», «забавный» и «текст» в любой последовательности.

Если же ввести «самый забавный текст» — будут показаны только те результаты, в которых есть все три слова именно в таком порядке. Этот способ отлично подходит, когда нужно найти текст песни, но мы знаем только фразу.

10. Ненужные термины

Чтобы исключить ненужный термин из поиска — достаточно поставить перед ним знак минус. Например, если мы хотим найти сайты о книгах, но не заинтересованы в их покупке — попробуйте исключить ненужный термин.

Лицензия на использование поисковой системы Яндекс

Этот документ является переводом Лицензии на использование поисковой системы Яндекс на английском языке. В случае противоречия между русскоязычной версией Лицензии на использование поисковой системы Яндекса и данным переводом — только русскоязычная версия Лицензии на использование поисковой системы Яндекса имеет юридическую силу. Русскоязычную версию Лицензии на использование поисковой системы Яндекса можно найти здесь: https://yandex.ru/legal/termsofuse/?lang=ru.

1.1. ООО «ЯНДЕКС» (далее – «Яндекс») предлагает пользователям сети Интернет (далее – «Пользователь») возможность использовать поисковую систему Яндекс для поиска информации в сети.Сервис доступен по адресу http://www.yandex.com (далее — «Сервис»).

1.2. Настоящие Условия являются дополнительными к Пользовательскому соглашению сервисов Яндекса в части порядка использования Сервиса. В любых вопросах, не предусмотренных настоящим Соглашением, отношения между Яндексом и Пользователем в отношении Сервиса регулируются Пользовательским соглашением сервисов Яндекса (https://yandex.com/legal/rules) и Политикой конфиденциальности (https://yandex. com/юридический/конфиденциальный).

1.3. Приступая к использованию Сервиса/его отдельных функций, Пользователь считается принявшим настоящие Условия и условия всех вышеперечисленных документов в полном объеме без каких-либо ограничений и исключений.В случае несогласия Пользователя с какими-либо положениями вышеуказанных документов Пользователь не вправе использовать Сервис.

1.4. Настоящие Условия могут быть изменены Яндексом без какого-либо уведомления, и новая редакция настоящих Условий вступает в силу с момента ее размещения в Интернете по адресу, указанному в настоящем абзаце, если иное не указано в новой редакции настоящих Условий. Текущая редакция настоящих Условий всегда доступна по адресу https://yandex.com/legal/termsofuse.

1.5. В случае внесения Яндексом изменений в настоящие Условия в порядке, установленном пунктом 1.4 настоящего Соглашения, с которым Пользователь не согласен, Пользователь обязан прекратить использование Сервиса.

1.6. Все доступные в настоящее время функции Сервиса, а также любое развитие и/или добавление новых функций регулируются настоящими Условиями.

2.1. Сервис предоставляется Пользователю на безвозмездной основе и предназначен исключительно для личного некоммерческого использования, за исключением случаев, предусмотренных настоящей Лицензией, документами, указанными в п. 1.2 настоящего Соглашения, или Условиями использования конкретных сервисов Яндекса.Для использования Сервиса иными способами и в любых иных целях Пользователь должен получить предварительное письменное согласие Яндекса. Пользователь может запросить дополнительную информацию по адресу [email protected]

2.2. В случае использования Сервиса в коммерческих целях для предоставления услуг онлайн-поиска и/или навигации Пользователь должен уведомить об этом своего клиента и предоставить ссылку на Сервис Яндекса (www.yandex.com). Пользователь может разместить на своем личном или корпоративном сайте поисковую форму Яндекса с обязательным соблюдением Условий Яндекс.Сервис поиска по сайту (https://yandex.ru/legal/site_termsofuse).

2.3. Пользователь может отправлять автоматические запросы к Сервису только при соблюдении требований в соответствии с Условиями использования сервиса Яндекс.XML (https://yandex.ru/legal/xml).

2.4. Яндекс вправе не обрабатывать запросы любых Пользователей, веб-сайтов и программ, нарушающих условия настоящей Лицензии.

2.5. Условия использования предупреждения о потенциально опасных веб-сайтах

2.5.1. Яндекс предоставляет функционал предупреждения пользователя о сайтах с потенциально опасными страницами (далее — «Потенциально опасные сайты»), например, о страницах с вредоносным кодом (далее — «Функция») «как есть».Потенциально опасным веб-сайтам также может быть присвоен более низкий рейтинг или они могут быть удалены из базы данных Сервиса. Информация о потенциальных рисках отдельных сайтов, о степени и характере таких рисков (далее — «Информация») предоставляется партнерами Яндекса или определяется Яндексом собственными методами. Яндекс не дает никаких пояснений по поводу отнесения сайта к потенциально опасным. Яндекс не гарантирует соответствие Функции целям и ожиданиям Пользователя, бесперебойную и безошибочную работу Функции и не гарантирует достоверность Информации (в частности, не гарантирует, что веб-сайты, не отнесенные к категории потенциально опасных, не содержат каких-либо вредоносные коды и наоборот).Пользователь самостоятельно оценивает риски и несет ответственность за свои действия в отношении использования Информации. Яндекс не несет ответственности и не возмещает любые прямые или косвенные убытки, понесенные владельцами сайтов, Пользователем или третьими лицами в результате использования или невозможности использования Функции, а также использования или невозможности использования Информации, в том числе, но не ограничивается любыми убытками, понесенными из-за неточности Информации.

2.5.2. Любые комментарии и/или жалобы относительно работы Функции направляйте по адресу https://yandex.ru.com/support/common/troubleshooting/main.html.

2.5.3. Яндекс вправе без уведомления по своему усмотрению прекратить или приостановить предоставление Информации без объяснения причин.

2.6. Некоторые ссылки на веб-сайты, отображаемые в результатах поиска, могут иметь специальные теги, предоставляющие дополнительную информацию о веб-сайте и/или его функциях. Специальные теги могут быть назначены веб-сайту автоматически на основе данных об активности пользователей, которые обрабатываются автоматически, или могут давать пояснения об источнике такой информации.Специальные теги ставятся и предоставляются Пользователям «как есть». Яндекс не несет ответственности за правильность размещения специальной метки и достоверность дополнительной информации о сайте, а также за решения, принимаемые Пользователями на основе таких меток. Подробная информация о значении специальных тегов доступна по ссылке: https://yandex.ru/support/webmaster/search-results/tags.html.

2.7. Некоторые ссылки на веб-сайты и интерактивные элементы поиска, отображаемые как поисковые запросы, могут иметь кнопку контактной формы для взаимодействия Пользователя с партнерами Яндекса и обсуждения оказываемых ими услуг, распространения информации и действий, которые они совершают в соответствии с инструкциями Пользователя в отношении предлагаемых товаров/услуг. на сайте по ссылке.Поскольку Яндекс не является стороной в отношениях между Пользователем и партнером Яндекса, он не несет ответственности за действия партнера Яндекса по обработке переданной Пользователем информации, а также не гарантирует правильность, точность, правильность и правомерность действий партнера Яндекса.

В целях контроля качества и выполнения требований законодательства Яндекс хранит историю сообщений между Пользователями и Партнерами с использованием соответствующих функций Сервиса. Яндекс может получить доступ к истории сообщений в указанных целях по запросу заинтересованных сторон и в порядке, предусмотренном законодательством.

Кнопка контактной формы рядом с веб-сайтом не влияет на его рейтинг среди результатов поиска.

2.8. Яндекс может ограничить доступ Пользователя к Сервису (или отдельным функциям Сервиса, если это технически возможно) через учетную запись или заблокировать учетную запись Пользователя в случае неоднократного нарушения настоящих Условий (в случае доступа Пользователя к Сервису через учетную запись Пользователя). либо предпринимать иные действия в отношении Пользователя для соблюдения требований законодательства, прав и законных интересов третьих лиц.

3.1. Яндекс индексирует страницы сайтов, созданных третьими лицами. Яндекс не несет ответственности за качество и содержание таких страниц. Индексация осуществляется роботом поисковой системы Яндекс автоматически на основе определенных алгоритмов, не подразумевающих предварительной или последующей оценки содержания сайта (модерации) на предмет его соответствия правовым, этическим или моральным требованиям, а также какой-либо цензуры. Яндекс не несет ответственности за наличие/отсутствие, содержание и качество любых предложений услуг, товаров и т.п.доступных Пользователю через сайты третьих лиц, индексируемых Яндексом, или за любые убытки, понесенные Пользователем в связи с использованием таких предложений.

3.2. Любые изменения на страницах сайта автоматически отслеживаются роботом Яндекса (переиндексируется) для обновления результатов поиска. Однако любая информация и материалы, размещенные на сторонних сайтах, могут быть в любое время изменены владельцами сайтов, Яндекс не отслеживает и не несет ответственности за какие-либо изменения на таких сайтах.

3.3. Яндекс не гарантирует Пользователю, что результаты поиска Пользователя будут исчерпывающими и что Пользователь получит всю доступную в сети информацию по поисковому запросу.Яндекс не несет ответственности за абсолютную точность/релевантность ссылок на сайты в результатах поиска Сервиса по запросу Пользователя.

3.4. Яндекс включает в базу Сервиса все страницы сайта на русском языке или ориентированные на Россию. Яндекс вправе по своему усмотрению решать, какие сайты включать в базу Сервиса.

3.5. Последовательность результатов в процессе индексации и поиска полностью автоматизирована в соответствии с требованиями релевантности, которые могут быть изменены для повышения качества обслуживания по усмотрению Яндекса.Под релевантностью Яндекс понимает максимальное соответствие результатов поиска запросу пользователей, ищущих информацию, что в целом может не соответствовать интересам владельцев сайтов или отдельных Пользователей.

3.6. Яндекс не манипулирует позициями сайта в результатах поиска Сервиса по каким-либо запросам Пользователя (ключевым словам), не продает какие-либо позиции в любое время и не гарантирует одинаковое положение любого сайта в результатах поиска по любым запросам Пользователя.

3.7. Спамдексинг — это попытка манипулировать поисковой системой Сервиса и результатами поиска, чтобы изменить позицию любого веб-сайта.Веб-сайты, использующие индексацию спама, могут отображаться на более низкой позиции или исключаться из базы Сервиса из-за невозможности надлежащего ранжирования таких веб-сайтов.

3.8. Яндекс не дает никаких комментариев по поводу исключения сайтов из базы Сервиса и/или изменения их положения, не дает уведомлений о своих действиях и каких-либо гарантий или сроков, по истечении которых сайты будут повторно включены в базу Сервиса/их положение будет изменено.

3.9. Яндекс вправе не раскрывать полный перечень методов спам-индексирования, которые могут привести к исключению сайта из базы Сервиса и/или изменению его положения.Подробнее читайте на Как Яндекс видит разницу между качественными и некачественными сайтами? по адресу https://yandex.ru/support/webmaster/yandex-indexing/webmaster-advice.html.

4.1. Отношения между Пользователем и Яндексом в отношении любой информации, которую Яндекс может получить о Пользователе в процессе использования Пользователем Сервиса, регулируются Политикой конфиденциальности (https://yandex.com/legal/confidential).

4.2. Яндекс индексирует страницы сайтов, которые общедоступны в сети, т.е.е. те страницы, на которые можно перейти по ссылке без логина и пароля, индексация которых не запрещена в robots.txt соответствующего сайта (подробнее см. https://yandex.com/support/webmaster/controlling-robot/ robots-txt.html). Претензии по поводу наличия в базе Сервиса открытых в связи с этим страниц сайта не принимаются.

 

Дата публикации: 14.02.2019

Предыдущая версия документа: https://yandex.rucom/legal/termsofuse/05102018

Предыдущая версия документа: https://yandex.com/legal/termsofuse/04092018

Предыдущая версия документа: https://yandex.com/legal/termsofuse/04092018

com/legal/termsofuse/04072017

Предыдущая версия документа: https://yandex.com/legal/termsofuse/22032017

Предыдущая версия документа: https://yandex.com/legal/termsofuse/22032017

com/legal/termsofuse/20012016

Яндекс — Технологии — Геолокационный поиск

В зависимости от региона от 15 до 30% всех поисковых запросов на Яндексе требуют информацию о товарах, услугах, личностях или событиях, характерных для текущего пользователя. место нахождения.Соответственно, Яндекс отвечает на такие запросы результатами поиска, которые различаются от региона к региону. Тот, кто ищет адвоката в Москве, увидит ссылки на сайты юридических фирм в Москве, а тот, кто делает тот же поисковый запрос в Киеве, найдет ссылки на сайты местных юридических фирм.


Поиск по местоположению доступен в тех городах России, Украины и Беларуси, где количество местных сайтов позволяет предложить эту функцию. Результаты на основе местоположения также доступны для веб-пользователей в Казахстане и Турции.


Не все поисковые запросы требуют ответов на основе местоположения. Не имеет большого значения, где находится искатель, когда он ищет книгу, рецепт или закон физики. С другой стороны, те, кто просит спортзал или такси, скорее всего, будут искать ближайший к месту жительства спортзал или компанию такси в своем городе.

Люди в разных местах, ищущие одно и то же, могут рассчитывать найти что-то совершенно другое. Очень часто эти поиски являются именами местных знаменитостей или компаний.Интернет-пользователь в Москве, который ищет «орбиту», на самом деле ищет кинотеатр, а кто-то в Ростове-на-Дону, делая тот же запрос, ожидает увидеть сайт автосалона, и если этот поиск исходит из Израиля, его автор, скорее всего, ищет популярный местный веб-портал.

Способность поисковой системы чувствовать разницу между теми запросами пользователей, которые требуют результатов на основе местоположения, и теми, которые не требуют результатов, имеет решающее значение для ее способности понимать намерения искателя и предоставлять наилучшие результаты поиска для ответа на них.

Механизм, который позволяет поисковой системе решать, имеет ли значение текущее местоположение пользователя для запроса, основан на статистике поиска. В запросе, зависящем от местоположения, может не быть терминов, указывающих на его географию, но в нем должны быть слова, которые часто встречаются вместе с такими терминами. Поисковый запрос «транспорт», например, будет классифицироваться как зависящий от местоположения, потому что те, кто использует это слово в своих поисках, также часто добавляют местоположение.

Место поиска идентифицируется, прежде всего, по IP-адресу искателя.Однако эта информация не всегда надежна — IP-адрес может быть присвоен интернет-провайдером, зарегистрированным в другом регионе. Яндекс постоянно обновляет свой классификатор для идентификации регионов, используя информацию, которую он получает от клиентов, партнеров и конечных пользователей. Он всегда информирует пользователей о том, каково их текущее местоположение, по его мнению. Он отображается в правом верхнем углу на странице результатов поиска и может быть изменен вручную в настройках.

Поиск Яндекса отвечает на запросы, зависящие от местоположения, релевантными для региона поисковым запросом.Наиболее релевантные результаты для поискового запроса, зависящего от местоположения, как правило, поступают с локальных веб-ресурсов. Это, однако, не означает, что хороший ответ не может быть получен с веб-сайта, не зависящего от местоположения, или с веб-сайта в другом регионе. При доставке результатов поиска по запросу, зависящему от местоположения, локальные ресурсы имеют приоритет над другими, только если все остальные факторы равны. Пользователи Яндекса могут ограничить свой поиск исключительно локальными ресурсами в настройках поисковой системы. Если в поисковом запросе упоминается географическое название, Яндекс показывает релевантные этому месту результаты независимо от текущего местоположения пользователя.Таким образом, тот, кто ищет отель в Санкт-Петербурге, увидит ссылки на сайты отелей в этом городе, даже если он ищет из Москвы.

Когда пользователь получает ссылку на результаты поиска Яндекса от кого-то из другого региона, он видит именно ту страницу, которая была отправлена, а не результаты поиска, соответствующие его местоположению. Это возможно, потому что информация о текущем местоположении пользователя встроена в веб-адрес страницы.

Яндекс также использует текущее местоположение искателя, чтобы предоставить ему релевантную информацию в результатах поиска, включая местную погоду, события, вакансии, служебные адреса и т. д.Таким образом, улица Ленина, которую пользователи увидят в Яндексе, будет относиться именно к улице Ленина в их собственном городе, а не в каком-либо другом.

Поисковая система идентифицирует регион веб-сайта, используя ряд атрибутов, включая контактную информацию на его страницах, его IP-адрес, регион, который он часто упоминает, и т. д.

Региональные веб-сайты компании обычно определяются как локальные в соответствующих регионы. Веб-сайт компании может быть классифицирован как национальный независимо от того, где находится головной офис компании, если эта компания имеет национальное, а не региональное присутствие, например, почтовая служба.Та же логика применима и к веб-сайтам, доступность которых в Интернете гораздо важнее, чем их физическое местонахождение — хорошим примером являются электронные библиотеки или службы электронной почты.

Российский Яндекс достигает урегулирования спора о поисковой системе

Основатель и генеральный директор Яндекса Аркадий Волож (на первом плане, второй справа) празднует выход Яндекса на биржу Nasdaq во время их IPO на торговой площадке Nasdaq в Нью-Йорке 24 мая 2011 года. REUTERS /Mike Segar

Зарегистрируйтесь сейчас и получите БЕСПЛАТНЫЙ неограниченный доступ к Reuters.com

Регистрационный номер

МОСКВА, 19 янв (Рейтер) — Российский технологический гигант «Яндекс» (YNDX.O) в среду сообщил, что достиг мирового соглашения в споре с Федеральной антимонопольной службой (ФАС) по антимонопольному законодательству о результатах его поисковой системы. и консорциум ИТ-компаний.

В феврале прошлого года ФАС сообщила «Яндексу», что создала неравные рыночные условия для общих поисковых сервисов, что продвигает преимущественно собственные продукты, и попросила прекратить.Яндекс в свое время заявил, что готов отстаивать свою позицию.

Яндекс, зарегистрированный на Nasdaq, заявил, что мировое соглашение подтвердило выполнение им всех требований предупреждения, прекращение дела без каких-либо штрафов и установило определенные дополнительные обязательства для Яндекса по поддержке конкуренции, включая передачу информации в ФАС.

Зарегистрируйтесь прямо сейчас и получите БЕСПЛАТНЫЙ неограниченный доступ к Reuters.com

Зарегистрируйтесь

Кроме того, Яндекс заявил, что создаст совместную программу поддержки российских технологических компаний в продвижении их продуктов и услуг, внося свой вклад 1.5 млрд рублей (19,6 млн долларов) в Российский фонд развития информационных технологий.

В сообщении ФАС говорится, что соглашение было одобрено Арбитражным судом Москвы после подписания всеми сторонами.

В прошлом году около 20 российских интернет-компаний подписали открытое письмо в поддержку усилий ФАС. В нем они обвинили «Яндекс» в злоупотреблении своим доминирующим положением на рынке и призвали его создать равные условия для честной конкуренции в онлайн-поиске.

Позже ФАС возбудила антимонопольное дело против Яндекса, заявив, что расследует возможные антиконкурентные действия и оценивает их последствия.

Спор разгорелся вокруг расширенного поиска, который дает пользователям более подробные результаты поиска таких вещей, как события и рецепты.

Яндекс заявил, что использует глобальную практику расширенных результатов поиска для улучшения взаимодействия с пользователем и что более 30 000 компаний используют его технологию расширенного поиска бесплатно.

(1 доллар США = 76,3908 рублей)

Зарегистрируйтесь сейчас БЕСПЛАТНО неограниченный доступ к Reuters.com

Зарегистрируйтесь

Репортаж Александра Марроу; дополнительный репортаж Марины Бобровой, Габриэль Тетро-Фарбер и Глеба Столярова; Под редакцией Кирстен Донован и Эмилии Ситхол-Матарис

Наши стандарты: Принципы доверия Thomson Reuters.

Не копировать, а искать подбрюшье Google

Илья Сегалович, главный технический мозг Яндекса, очень хороший парень. Я говорю это не только потому, что он позволил мне прервать его плотный график, но и потому, что вы не можете разговаривать с ним, не думая, что вы и делитесь, и учитесь одновременно — он внимательно слушает то, что вы должен сказать, расширяет его и развивает его и дает вам больше каждый раз.

Слоном в комнате во время нашего разговора был Google.Нельзя говорить о Яндексе, не сравнивая с Гуглом — как с мерилом.

Но это не значит, что Яндекс копирует Google, как очень хочет подчеркнуть Илья. Первые слайды, которые он выстроил, чтобы показать мне, изначально были составлены как возражение Роберту Скоблу, который назвал Яндекс клоном Google в ответ на вопрос на Quora.

Это не пройдет хорошо в башнях Яндекса на улице Льва Толстого, где все разработано « Чтобы ответить на все вопросы пользователя » и определенно не потому, что калифорнийский конкурент, который также активен на российской территории, случайно приедет похожие, но не идентичные выводы.

Хронология Яндекса – Google

Фактически, на слайдах перечислены некоторые вещи, которые Яндекс запустил первым, указывая, во-первых, на то, что они фактически были запущены как поисковая система в 1997 году, на год раньше, чем Google. Яндекс также первым запустил карты в 2004 году, Google — годом позже, в 2005 году. Яндекс первым запустил поиск новостей в 2000 году, Google — в 2002 году. Поиск по блогам появился в России в 2004 году, а в Калифорнии — только в 2006 году. запустил агрегатор RSS в 2005 году, Google последовал за ним в 2006 году.

Для скептиков, вот еще одно доказательство, которое вы можете проверить сами. Согласно записям Whois, google.com был зарегистрирован 15 сентября 1997 года, а yandex.ru всего восемь дней спустя, 23 сентября 1997 года.

Между тем, yandex.com был зарегистрирован на год позже, чем его российский предшественник, тогда как Google потребовалось еще шесть с половиной лет, чтобы претендовать на google.ru 4 марта 2004 года. Таким образом, , если Яндекс скопировал Google через восемь дней, ну, по крайней мере, вы должны отдать им должное за их удивительное предвидение!

Рождение Яндекса

Илья также показывает мне эту завораживающую фотографию, сделанную в 1981 году, когда Аркадий Волож (крайний слева) и Илья (в центре) еще молодыми людьми только поступали в университет и уже хорошо знали друг друга.Спустя еще 16 лет, в 1997 году, yandex.ru наконец-то был запущен, а между тем было много приключений.

Источник: Илья Сегалович

Отец Ильи был известным русским геологом, которому приписывают выявление тектонических аномалий на Урале, приведших к открытию огромных запасов хромита. Ему была присуждена Государственная премия в те дни, когда Советский Союз занимался подобными вещами.

Аркадий Волож тоже сын геологов, и они впервые познакомились в Алмате в Казахстане в школьные годы.(Любопытно, что Аркадий Волож мне тоже отдельно упомянул, что семьи Сергея Брина и Аркадия тоже знают друг друга).

Илья ушел из университета, увлекаясь разработкой программного обеспечения, но в 1989 году он подумал, что «Поиск был очень глупой идеей» — если честно, тогда не было ни Интернета, ни Сети.

Компьютеры едва ли были компьютерами (я могу поручиться за это — я помню паровые машины той эпохи), и для загрузки раннего программного обеспечения для поиска данных и текста Comptek, например, требовалось загрузить 9 гибких дисков с установочным кодом.У Ильи были свои планы по программному обеспечению и команда.

Наконец, в 1990 году Аркадий добился своего и сумел завербовать Илью в команду «Аркадия». В конечном итоге это привело к тому, что у Ильи появился шанс оставить свой след в истории, поскольку несколько лет спустя российские венчурные капиталисты стремились инвестировать во все, что связано с Интернетом.

Это привлекло внимание к конкретному проекту Аркадии, которому в результате потребовалось название. В 1993 году Аркадий Волож и Илья Сегалович разработали поисковую систему «неструктурированной информации с русской морфологией».

Илья предложил название «Яндекс», производное от идеи «Yet Another inDEX», хотя в русском языке есть лишняя игра слов, так как первая буква «я» (произносится как «я») также означает «я». Он прижился, и в 1997 году родился yandex.ru, поисковая система была запущена в 1998 году, а в 2000 году Яндекс стал компанией.

Еще в 1994 году тип поиска, над которым работал Илья, иллюстрируется изображением ниже, которое иллюстрирует ключевую функцию, которая сделала Яндекс великим и которую Google не воспроизвел до 2006 года, примерно 12 лет спустя, — это поиск по русской морфологии.

Поисковый запрос в поле поиска представляет собой поисковый запрос из двух слов в одной определенной грамматической форме – выделенные красным цветом «находит» в тексте показывают термины, которые хотя и соответствуют поисковому запросу, но изменены в правописании по правилам русского языка .

Рисунок также довольно ясно иллюстрирует работу, над которой работала команда Arcadia/Comptek и которая позже превратилась в веб-поиск.

Предтеча Яндекса в 1994 году – Источник: Илья Сегалович

На самом деле, параллельные пути развития слона Google и Яндекса увлекательны и доминируют во многих наших разговорах.Илья ссылается на опубликованное в Google заявление, объясняющее методы поиска в 2000 году, в котором говорилось, что «Google не использует «выборку корней» и не поддерживает поиск по шаблону. Другими словами, Google ищет именно те слова, которые вы вводите в поле поиска».

Формулировка подразумевала, что это приведет к более релевантным результатам. Принимая во внимание, что рождение Яндекса в 1997 году непосредственно последовало за решением проводить «неточный» поиск с использованием стемминга, который был единственным способом достижения релевантности в русском языке, вы можете понять, что на улице Льва Толстого должно быть несколько кривых улыбок.

Я спрашиваю Илью, когда он впервые узнал о Google? «Дэнни Салливан обратил мое внимание на это в статье». Я полагаю, что он имеет в виду статью под названием «Подсчет кликов и просмотр ссылок» от августа 1998 года, в которой анонсируется новый экспериментальный Google, все еще размещенный на URL-адресе Стэнфордского университета.

Илья продолжает описывать историю развертывания Google в России: «В 2000 году Google сосредоточился на дистрибьюторских сделках, 2001 был годом интернационализации, когда они сосредоточились на полноте индекса и имели русский контент, но это только в 2006 году мы считали Google угрозой.Это был год, когда Google начал поддерживать русскую морфологию».

Он отмечает: «Нам не хватало ресурсов и не было нужных людей на нужных должностях. Пришлось вносить изменения и реорганизовываться. К счастью, мы нашли отличных парней, которые нас спасли».

Любопытно, что Илья связывает показатели Яндекса и Google в 2008–2009 годах, когда Яндекс потерял долю рынка, благодаря своим результатам поиска в 2006–2007 годах.

«Кажется, проходит два года, прежде чем пользователи действительно заметят разницу, когда вы внесете улучшения», — говорит он.«Мы внедрили машинное обучение MatrixNet в начале 2009 года и только в 2010 году заметили существенную разницу в долях поисковых запросов”. Он добавляет: «Сложнее разработать поисковую систему, чем космическую программу, пять стран имеют свои собственные поисковые системы, а 20 — космические программы». В этот момент к нам присоединился начальник отдела поиска Анатолий Орлов и добавил: «Поиск — это ракетостроение!»

Чем Яндекс отличается от других поисковых систем

Страница поиска Яндекса сильно отличается от страницы Google.В то время как у Яндекса есть страница только с окном поиска для тех, кто спешит по короткому URL-адресу Ya.ru, главная страница выглядит скорее в стиле портала. Яндекс тестировал страницу только с окном поиска в течение нескольких недель, но обнаружил, что большинство российских пользователей предпочитают обычную более загруженную страницу.

Илья отмечает, что люди могут изменить страницу поиска по умолчанию. «Мы даже позволяем пользователям отключать некоторые объявления», — говорит он. Одно совершенно ясно, Яндекс был и всегда был одержим поиском и удовлетворением потребностей пользователя.

В розыске нет ни развлечений, ни свиданий, и Илья признается: «Телевизор не смотрю, но понимаю, что люди его смотрят». Видимо, дома много детей, так что, возможно, это понятно. Обычная страница поиска может выглядеть как портал, но это еще не все.

Яндекс рассматривает его (пояснение ниже) как ответ на вопрос «Что нового? Что нового вокруг меня?» Вот почему есть новости, погода, информация о дорожном движении (важно для москвичей), новости рынка, трендовые деньги и автомобили — главный вертикальный рынок Яндекса.Так как это Россия, цена на нефть включена в список курсов валют!

Объяснение главной страницы поиска Яндекса Источник: Илья Сегалович

Как и все поисковые системы, Яндекс очень внимательно следит за качеством своего поиска. Илья показывает мне серию графиков от AnalyzeThis.ru — российской независимой SEO-фирмы, которая отслеживает качество работы поисковых систем в России. Илья очень хотел подчеркнуть, что это всего лишь один из источников, предоставляющих такие данные, но я нашел результат интересным и достойным публикации.

На первом графике ниже показан процент отсутствующих результатов навигации в Яндексе, Google и Bing в России, где чем ниже показатель, тем лучше результат.

Несмотря на краткий всплеск Яндекса (причины которого неясны), в целом Google и Яндекс очень близко отслеживают друг друга по этому показателю, давая очень похожее качество результатов для пользователя — но результаты Bing не так хороши, хотя они показали некоторое улучшение по сравнению с октябрем прошлого года.

% отсутствующих результатов навигации, где чем ниже оценка, тем лучше – Источник: AnalyzeThis.ru 2007-2010

Следующая мера качества относится к измерению того, имеет ли исходный текст более высокий или более низкий рейтинг, чем копии контента, при этом более высокий балл дает лучший результат. Это серьезная проблема для многих из нас, кто хочет разрешить синдикацию нашего контента, но не хочет, чтобы синдикаторы добивались лучших результатов, чем мы.

В России Google является самым слабым исполнителем по этому показателю, опережая даже Bing. Оценка Яндекса намного лучше, чем у Google или Bing: на 50% больше, чем у Google на 20%, и снижается производительность.Конечно, обновление Farmer не будет учитываться в этих цифрах, но если бы вы были Google, глядя на эти цифры, вы бы тоже хотели ориентироваться на контент-фермы!

Первоначальный текст имеет более высокий рейтинг, чем копии контента %, где чем выше балл, тем лучше — Источник: AnalyzeThis.ru 2009-2011

Теперь перейдем к любимой всеми теме — спам-результатам. Естественно, лучшие результаты для пользователей получают те, у кого процент спама ниже.

Угадай, кто победит? В индексе AnalyzeThis.ru с 2009 года и по сегодняшний день Яндекс ни разу не уступал ни Google, ни Bing. Они действительно заслужили репутацию очень жестких борцов со спамом, и эти цифры подтверждают это.

Явно спамные результаты – чем меньше, тем лучше — Источник: AnalyzeThis.Ru 2009 -2011

Предоставляет ли поисковая система чисто коммерческие ответы на коммерческие вопросы? Здесь показатель на нашей диаграмме ниже тем лучше, чем меньше процент, и снова Яндекс побеждает в России, обыгрывая Bing и обыгрывая Google.

Что наиболее важно, Яндекс показывает непрерывный нисходящий тренд, Bing аналогично и по пунктам лидирует. Google не показал хороших результатов по этому показателю. Возможно, Google не нацелен на эту меру?

Чисто коммерческие ответы на запросы коммерческой тематики – Источник:AnalyzeThis.ru 2009-2011
Может показаться, что

Яндекс обслуживает только одну страну, но это не совсем так. Есть 15 стран, которые используют кириллицу, и 77 регионов в самой России — и Яндекс стремится везде быть локальным.Культура, уровень жизни и средний доход сильно различаются в обширной области, которую обслуживает Яндекс, поэтому результаты поиска также должны сильно различаться, включая автозаполнение.

Наша окончательная диаграмма показывает процент местных результатов с более высоким баллом победителя. Здесь Яндекс серьезно отстает от Google, и, что касается Bing, их локальные результаты выглядят так, как будто они могут быть случайностью.

Локальные результаты по локальным запросам %: чем выше оценка, тем лучше результат — Источник: AnalyzeThis.ru 2009-2011

Yandex.com, латиница и английская версия Яндекса, описывается как «экспериментальная» и, несмотря на ажиотаж среди западных блоггеров, поясняется, что Яндекс некоторое время работал над индексацией сайтов на других рынках и Намерение состояло не в том, чтобы выйти на международный уровень, а в том, чтобы российские пользователи могли выполнять поиск в латинском тексте, не выходя из Яндекса.

Примерно 7% россиян знают английский язык, но только 1% знает английский язык достаточно хорошо, чтобы спокойно ориентироваться на английском языке и на англоязычных сайтах.Тем не менее российская пресса была очень взволнована выходом Яндекса на международные рынки.

Поэтому я напрямую спрашиваю Илью, есть ли планы по расширению Яндекса на международном уровне. Ответ подтверждает, что планы есть, но, конечно, ничем конкретным они со мной поделиться не могут.

Затем мы перейдем к тому, что вам нужно, чтобы добиться успеха с поисковой системой на местных рынках. Язык и правильное обращение с языком являются важным фактором, но «наличие локальной базы данных влияет примерно на 18% поисковых запросов.«Есть также специфические для рынка вещи, которые вам нужно сделать. Илья говорит: «Мы довольно ясно понимаем, как это сделать!»

ВКонтакте складывается ощущение, что мало делает их аналог в мире социальной сети – иными словами, локальный игрок и социальная сеть номер один. Однако оказывается, что «вКонтакте» — это поисковый запрос номер один в Яндексе, отражающий позицию Facebook в логах Google.

Делаю вывод, что Яндекс очень внимательно наблюдает за Google и ищет его слабое место, прежде чем начать тщательно продуманную атаку.Похоже, что это будет на рынках, где Google является номером один, но только потому, что там нет конкуренции, и на самом деле у Google нет надежной инфраструктуры и локализованного подхода на этом рынке, несмотря на его положение, и нет локальной базы данных.

В следующий раз мы будем иметь дело с подходом Яндекса к алгоритмам машинного обучения и последствиями для российского SEO и SEO в целом.


Новое в поисковой системе

Об авторе

Энди Аткинс-Крюгер основал Webcertain — многоязычную компанию по предоставлению услуг международного поискового маркетинга, которая вместе с SMX в Европе проводит Международный поисковый саммит, а также включает в себя собственный бизнес, который специализируется на поддержке внутренних агентств в рамках больших групп со специализированными языковыми потребностями.

как частично подконтрольная государству поисковая система «Яндекс» выступила посредником в акции протеста против режима

«Все найдется. ( Найдется все .)’

Лозунг торговой марки Яндекса

26 марта 2017 года авторитарному режиму России пришлось столкнуться с крупнейшими протестами оппозиции за более чем пять лет. Только в Москве было арестовано не менее тысячи граждан. Тем не менее, в течение всего этого дня антикоррупционные протесты по всей стране едва ли попали в список пяти лучших новостей, якобы основанных на алгоритмах, который российская частично контролируемая государством поисковая система «Яндекс» размещает в верхней части своей веб-страницы.В тот же день алгоритмы Яндекса высвечивали не новости о протестах, а, например, о вылупившихся в парке совах (Голунов, 2017). Это бросающееся в глаза наблюдение вызвало в дни после протестов волну возмущения среди российской оппозиции. Это породило недоверие к алгоритмам Яндекса и вызвало бурные споры об их предполагаемой политической предвзятости. Не только в России, но и во всем мире потенциальные последствия «предвзятости» поисковых систем в последнее время с большой озабоченностью обсуждаются как в научных кругах, так и в общественных кругах (Левченко, 2017; Лохов, 2019; Steiner et al., 2020; Ункель и Хаим, 2019). Как уже говорилось, поисковые системы превратились в одного из самых мощных посредников социально-политической информации в эпоху цифровых технологий (Puschmann, 2019). На этом фоне данное исследование поднимает исследовательский вопрос: если алгоритм Яндекса, входящий в пятерку лучших новостей, был так сильно раскритикован за отсутствие новостей о протестах 26 марта 2017 года, как поисковые алгоритмы компании опосредовали это событие в последующие двадцать месяцев?

Занимаясь этим довольно узким исследовательским вопросом, данное исследование стремится внести свой вклад в заполнение более широкого пробела в существующей литературе о предвзятости поисковых систем в дисциплине коммуникаций.Хотя огромные усилия были направлены на изучение предвзятости поисковых систем в демократическом контексте (Epstein & Robertson, 2015; Granka, 2010; Kulshrestha et al., 2019; Metaxa et al., 2019; Mowshowitz & Kawaguchi, 2005; Steiner et al., 2020; Unkel & Haim, 2019), и растущему объему литературы, посвященной цензуре поисковых систем в Китае (Jiang, 2014; Paltemaa et al., 2020; Vuori & Paltemaa, 2019), на сегодняшний день практически ни одно академическое исследование не установило для расследования потенциальной политизации алгоритмов российской частично контролируемой государством поисковой системы Яндекс (предварительное исследование см. Zavadski & Toepfl, 2019).По состоянию на 2020 год две из пяти самых популярных поисковых систем в мире управлялись компаниями, базирующимися в авторитарных режимах: «Яндекс» в России и «Baidu» в Китае (StatCounter, 2020). Однако «Яндекс» (и российский общественно-политический контекст) отличается от Baidu (и китайского контекста) как минимум в трех важных аспектах. Во-первых, Baidu открыто подвергает цензуре ряд конфиденциальных результатов, т. е. сопровождая их уведомлением о том, что пользователь искал неподходящий элемент (Paltemaa et al., 2020; Vuori & Paltemaa, 2019).Напротив, Яндекс стремится публично заявить, что он не вмешивается в свои поисковые алгоритмы по политическим мотивам (Яндекс, 2017). Во-вторых, российский авторитарный режим, по сравнению с его китайским аналогом, отличается несколько более открытой «лидерско-критической» (Toepfl, 2020) публичной сферой, где даже резкая критика самодержца может циркулировать в нишевых СМИ и ряде интернет-ресурсов. платформы с ограниченным охватом аудитории. Следовательно, веб-контент политически чувствительного содержания, размещенный на IP-адресах, зарегистрированных в России, может быть легко проиндексирован поисковыми роботами.В-третьих, в то время как Китай запретил иностранную компанию Google в 2010 году, Россия представляет собой пример страны, где две поисковые системы, иностранная компания Google (43%) и местная компания Яндекс (53%), имеют сопоставимые доли рынка (StatCounter, 2019).

Чтобы ответить на сформулированный выше исследовательский вопрос, мы сначала представляем краткий обзор академической литературы о социальных последствиях предвзятости поисковых систем, уделяя особое внимание исследованиям, изучающим авторитарные контексты. Впоследствии мы концептуализируем два типа предвзятости поиска, которые мы называем (1) предвзятостью ссылки и (2) предвзятостью источника.После следующего раздела, в котором подробно описывается наш методологический подход и исследовательская этика, мы представляем результаты нашего исследования. В последнем сравнивается посредничество одного громкого политического события (протеста 26 марта) за двадцать месяцев после его совершения в четырех поисковых интерфейсах: поисковых системах (1) , yandex.ru, и (2) . google.ru , а также новостные поисковые системы (3) news.yandex.ru и (4) news.google.ru . Для нашего анализа мы регулярно собирали данные в течение двадцати месяцев (с марта 2017 года по ноябрь 2018 года).Мы использовали набор из девяти поисковых запросов (на русском языке), нацеленных на акции протеста 26 марта. Основываясь на различных типах как ручного, так и автоматизированного контент-анализа полученного набора данных ( N  = 30 471 результатов), мы рисуем детальную аналитическую картину степени ссылочной и исходной предвзятости поисковых алгоритмов Яндекса (в сравнении с их Google аналоги). Кроме того, наш анализ также отслеживает изменения с течением времени и исследует влияние выбора условия запроса. В заключительном разделе мы обсудим, как это исследование продвигает академическую литературу по измерению, роли и последствиям предвзятости поисковых систем в условиях авторитарного правления.

Поисковые системы как метамедиа: предвзятость алгоритмов при авторитарном правлении

За последние три десятилетия появилось множество исследований поисковых систем, и ученые все чаще называют их новыми метамедиа (Metaxa et al., 2019; Pushmann, 2019; Trielli & Diakopoulos, 2020). Как уже говорилось, поисковые системы играют все более важную роль в «распространении и формировании знаний» (Granka, 2010, стр. 364). Было показано, что в демократическом контексте они обладают способностью влиять на общественное мнение (Dutton et al., 2017) и повлиять на колеблющихся избирателей (Epstein & Robertson, 2015). Существующие исследования изучали распределение пристрастных точек зрения в результатах поиска о кандидатах (Metaxa et al., 2019), влияние веб-страниц, контролируемых кандидатами, на охват кандидатов в результатах поиска (Puschmann, 2019) и последствия пристрастного поведения пользователей при поиске. (Триелли и Дьякопулос, 2020 г.). Однако результаты и выводы этих исследований едва ли можно обобщить на недемократический контекст, где преобладают другие политические и правовые условия (Paltemaa et al., 2020; Топфл, 2020).

Несмотря на огромное влияние поисковых систем на поток политической информации даже в авторитарных контекстах (для России см. Kovalev, 2020; для Китая см. Vuori & Paltemaa, 2019), производительность поисковых алгоритмов, управляемых (полу-)государством компаниям, находящимся под контролем ученых, уделялось сравнительно мало внимания со стороны ученых. Среди наиболее заметных исключений, которые исследовали предвзятость поиска и цензуру китайской поисковой системы Baidu, возможно, есть исключения, сделанные Jiang (2014), Vuori and Paltemaa (2019) и Paltemaa et al.(2020). Цзян (2014) сравнивает эффективность государственного Baidu с эффективностью Google на основе данных, собранных до запрета Google в 2010 году. В частности, анализ Цзяна (2014) основан на результатах поиска по 316 популярным интернет-событиям, которые охватывают широкий спектр тем, от официальных кампаний против вульгарности до информации о диссидентах. Исследование обнаруживает низкое совпадение (примерно 6,8%) результатов между двумя поисковыми системами, «подразумевая разные поисковые системы, разные результаты и разные социальные реалии» (стр.229). Палтемаа и др. (2020), напротив, сравнивают 3000 результатов поиска изображений Google.com и Baidu.com, полученных в ответ на ряд потенциально деликатных условий запроса, полученных в мае 2018 года. Все термины относятся к географическим местам, таким как, например, площадь Тяньаньмэнь. Square и, таким образом, не приводил (в отличие, например, от запросов имен диссидентов) к открытым уведомлениям о цензуре. Основываясь на ручном кодировании полученных изображений, Paltemaa et al. (2020) оценили степень «скрытой цензуры» (стр.2067), вписанный в алгоритм Baidu. Они пришли к выводу, что в первую очередь три характеристики алгоритма Baidu способствовали скрытой цензуре и привели к получению в целом крайне нейтральных или лояльных режиму результатов: (1) Baidu направлял пользователей в основном на домены, размещенные в Китае, и, таким образом, подвергались открытой цензуре. ; (2) Baidu вообще не отправляла своих пользователей на иностранные домены за пределами Великого брандмауэра, и (3) поисковый робот компании, похоже, отклонял изображения с конфиденциальными тегами. В другом исследовании Вуори и Палтемаа (2019) анализируют «явную цензуру» (стр.391) в результатах поиска китайской поисковой системы Sina Weibo в ответ на 2387 политически чувствительных слов и фраз. Они пришли к выводу, что «фильтрация поисковых систем [в авторитарном Китае] основана на двухуровневой системе, в которой краткосрочные политические инциденты, как правило, фильтруются в течение коротких периодов времени, а слова, которые способствуют повышению осведомленности оппозиции, как правило, подвергаются цензуре. более непрерывно» (стр. 391).

Это исследование продвигает этот недавно появившийся массив исследований о политизации (полу-)государственных поисковых систем, по крайней мере, в трех важных аспектах.Начнем с того, что это первое исследование, целью которого является систематическая оценка предполагаемой политической предвзятости российской государственной поисковой системы «Яндекс». В отличие от китайской Baidu, Яндекс работает в авторитарном режиме, где открытая цензура поисковых систем по политическим мотивам официально считается неприемлемой (Toepfl, 2020). Во-вторых, чтобы измерить скрытую предвзятость двух наиболее политически значимых алгоритмов Яндекса, в этом исследовании концептуализированы и введены в действие два типа предвзятости поисковых систем, которые также могут быть полезны для будущих исследований посредничества в громких политических событиях: (1 ) смещение источника и (2) смещение эталона.В-третьих, эти два типа предвзятости поисковых систем затем операционализируются и оцениваются эмпирически путем развертывания комбинации ручного и автоматического анализа текста в крупномасштабном наборе данных из более чем 30 000 результатов.

Концептуализация предвзятости ссылок и источников поисковых алгоритмов

За последние три десятилетия специалисты по коммуникациям предложили широкий спектр концепций предвзятости поисковых систем. Однако на самом фундаментальном уровне они согласны с тем, что алгоритмы как технологические артефакты никогда не бывают нейтральными и что, следовательно, неизбежна некоторая форма предвзятости при поиске (Granka, 2010; Haim et al., 2017; Цзян, 2014 г.; Кулшреста и др., 2019 г.; Мовшовиц и Кавагути, 2005 г .; Пушманн, 2019; Ункель и Хаим, 2019). Основная функциональность поисковых алгоритмов состоит в том, чтобы «систематически отдавать предпочтение одним (типам) сайтов по сравнению с другими как при индексации, так и при ранжировании» (Unkel & Haim, 2019, стр. 3; см. также Granka, 2010; Jiang, 2014; Pushmann). , 2019). Как лаконично выразились Мовшовиц и Кавагути (2005), предвзятость при поиске — это, по сути, «относительное понятие» (стр. 1194). Таким образом, операционализируя концепцию эмпирического исследования, ученые должны подумать, по крайней мере, над тремя ключевыми методологическими вопросами.Во-первых, им необходимо указать социальные результаты, которые они стремятся тщательно изучить. Какие люди или группы, как они ожидают, приобретут или потеряют власть, если алгоритм будет развернут в анализируемом политическом контексте? Например, в контексте демократических выборов в нескольких исследованиях изучалась степень, в которой результаты алгоритмов поиска более выгодны для одних партий или политиков по сравнению с другими (Metaxa et al., 2019; Pushmann, 2019; Unkel). и Хаим, 2019).В исследовании, представленном на следующих страницах, мы стремимся проверить предвзятость поисковых систем в контексте протеста против режима в условиях авторитарного правления. Таким образом, мы сосредоточимся на социальных последствиях алгоритмической предвзятости для двух ключевых групп, вовлеченных в такую ​​борьбу за власть: (1) авторитарные политические элиты и (2) их противники, то есть протестующие оппозиции.

Вторым методологическим вопросом, который необходимо решить исследователям, является нормативный эталон, по которому должна оцениваться производительность алгоритма поиска.В большинстве предыдущих исследований в качестве контрольных показателей использовались результаты одной или нескольких других поисковых систем (Jiang, 2014; Kulshrestha et al., 2019; Mowshowitz & Kawaguchi, 2005; Steiner et al., 2020). Другие исследования, напротив, вывели нормативные базовые уровни из связанных сегментов социальной реальности, таких как освещение в традиционных средствах массовой информации или распределение партий в парламенте (Haim et al., 2018; Unkel & Haim, 2019). Настоящее исследование проводится в репрессивном политическом контексте, когда альтернативные базовые принципы, такие как парламентское представительство или освещение в СМИ, можно считать сильно предвзятыми в отношении правящих авторитарных элит.Поэтому мы решили использовать производительность алгоритмов иностранной поисковой системы Google в качестве эталона для оценки производительности алгоритмов российской государственной поисковой системы Яндекс.

В-третьих, при использовании предвзятости поисковых систем исследователи должны указать, как они намерены измерять предвзятость. Какой результат алгоритма будет проанализирован и какими методами? В существующих исследованиях предвзятости поисковых систем были тщательно изучены различные выходные данные, включая полные URL-адреса, домены веб-сайтов и фрагменты контента, представленные на страницах результатов, а также содержание веб-страниц, на которые алгоритмы перенаправляют пользователей (Jiang, 2014; Pushmann). , 2019; Ункель и Хаим, 2019).Для анализа этих данных был применен широкий спектр ручных и автоматизированных подходов (Haim et al., 2018; Metaxa et al., 2019). В настоящем исследовании мы измерили два разных типа предвзятости, применив два принципиально разных методологических подхода. Во-первых, мы оценили то, что мы концептуализируем как «предвзятость источника», основанную на ручной классификации доменов веб-сайтов, которые две поисковые системы выделили в своих списках обычных результатов. Зафиксировав политическую позицию этих веб-сайтов по отношению к правящим элитам России, мы классифицировали эти веб-сайты как критические для руководства, политически критические или некритические источники (более подробную информацию см. в разделе «Методы»).Во-вторых, мы измерили то, что мы называем «смещение ссылок», основанное на автоматическом анализе содержания веб-страниц, на которые списки органических результатов двух компаний перенаправляли своих пользователей. В частности, мы установили, направляли ли поисковые системы пользователей, которые ввели один из девяти поисковых запросов, нацеленных на протестное мероприятие 26 марта, на веб-страницы, содержащие информацию об этом конкретном протестном мероприятии (подробнее см. в разделе «Метод»). В контексте нашего исследования направление пользователей на веб-страницы, на которых размещалась информация о протестах против режима, неизбежно способствовало политическому делу протестующих.Понижение информации о событии, напротив, укрепило властные позиции авторитарных элит.

Сравнение поисковой предвзятости Яндекса и Google: разработка гипотез

За последнее десятилетие сложные отношения между Яндексом и все более авторитарным российским государством перешли от открытого конфликта к сотрудничеству, при этом некоторые критики заявляли о полном «политическом присвоении» Яндекса (Dauce, 2017). , стр. 127). На момент проведения исследования российское государство владело так называемой «золотой акцией» Яндекса через государственный банк Сбербанк, что обеспечивало Сбербанку — и, следовательно, правящим элитам России — массивное, но неформальное влияние на политику компании (Рувинский, 2017).Из-за неформальных связей Яндекса с государством и его частичной собственности мы ожидаем, что Яндекс будет более уязвим для давления правительства по сравнению с глобальным гигантом Google, принадлежащим иностранцам. Можно также предположить, что на «Яндекс» сильнее повлияло постоянно усиливающееся юридическое давление на российские медиакомпании. В частности, что касается алгоритма поиска новостей, федеральный закон «Об агрегаторах новостей» от 2016 года возложил на «Яндекс.Новости» юридическую ответственность за его результаты со ссылками на СМИ, не зарегистрированные в Роскомнадзоре (Лохов, 2019).Примечательно, что закон не коснулся новостного агрегатора Google, так как он распространялся только на новостные агрегаторы с более чем миллионом ежедневных посетителей, которых у Google News в то время не было в России (Левченко, 2017). Принимая во внимание эти доводы, мы предполагаем, что алгоритмы Яндекса, по сравнению с алгоритмами Google, будут выдавать больше результатов поиска, продвигающих сторону правящих политических элит России в конфликте. Таким образом, мы формулируем следующую гипотезу: в течение всего периода в двадцать месяцев и по диапазону поисковых запросов, нацеленных на протесты 26 марта,

h2/h3: поиск Яндекса в Интернете (h2) и поиск Яндекса в новостях (h3) будут последовательно дают результаты, которые демонстрируют более высокую степень предвзятости относительно ссылок (h2a/h3a) и источников (h2b/h3b) в отношении правящих элит России по сравнению с их аналогами из Google.

В авторитарных режимах можно ожидать, что давление правительства на СМИ будет особенно сильным во время политического кризиса, например, сразу после широкомасштабного протеста против режима (Toepfl, 2020). Причина в том, что обычно ожидается, что модели использования СМИ повлияют на решения протеста и дальнейшую мобилизацию (Smyth & Oates, 2015). Более того, тщательно изучая динамику интернет-цензуры в авторитарном Китае, Вуори и Палтемаа (2019) обнаружили, что «кратковременные политические инциденты, как правило, фильтруются в течение коротких периодов времени» (стр.391). На этом фоне мы предполагаем, что акция протеста 26 марта, которую можно было бы также считать относительно кратковременным политическим инцидентом в период политического кризиса, сразу же после нее подверглась особенно ярко выраженной скрытой цензуре. Исходя из этого, мы выдвигаем гипотезу: в первую неделю после акции протеста

h4/h5: веб-поиск Яндекса (h4) и поиск новостей Яндекса (h5), по сравнению с их аналогами в Google, будут особенно склонны позиции правящих элит России.То есть различия в уровнях ссылок (h4a/h5a) и предвзятости источников (h4b/h5b) между двумя поисковыми системами в первую неделю после акции протеста будут значительно больше, чем в оставшийся изучаемый период времени.

Методы

Сбор данных

Чтобы собрать данные для этого исследования, мы автоматически извлекли результаты поиска по девяти поисковым запросам (на русском языке), нацеленным на антикоррупционные протесты в России 26 марта 2017 г., из четырех поисковых систем. : поисковые системы (1) yandex.ru и (2) google.ru , а также новостные агрегаторы (3) news.yandex.ru и (4) news.google.ru . В течение двадцати месяцев после события мы проводили девять запросов ежедневно во время политического кризиса (сразу после протестов в марте и апреле 2017 года) и еженедельно в политически более спокойное время. В общей сложности одни и те же поисковые запросы проводились 105 раз в период с 27 марта 2017 г. по 14 ноября 2018 г. Чтобы уменьшить влияние предвзятости, связанной с пользовательским вводом (т. е. предвзятости, возникающей из-за выбора условий поиска; Mowshowitz & Kawaguchi, 2005; Trielli & Diakopoulos, 2019) мы собрали данные не по одному, а по ряду из девяти тщательно отобранных терминов.Наш выбор запросов основывался на самых популярных запросах о протестах на момент их проведения (Google Trends, 2017 г.) и охватывал весь спектр, от самых общих терминов до очень конкретных терминов (см. русский язык и дополнительные пояснения по этим вариантам см. в дополнительном файле [SF]). Для каждого запроса мы тщательно изучили пять лучших результатов поиска, поскольку предыдущие исследования показали, что пользователи редко выходят за пределы пяти первых результатов, чтобы удовлетворить свои информационные потребности (Epstein & Robertson, 2015).В случае с новостными агрегаторами мы рассматривали пять самых популярных новостных «историй» (несколько новостей, объединенных алгоритмом в одну тему). Кроме того, поскольку мы сосредоточились на обычных результатах поиска, мы не рассматривали рекламу (помеченную как таковую) или информационные окна. В результате мы получили набор данных из 30 471 результатов поиска, из которых 13 353 – уникальные результаты, опубликованные на 1 726 уникальных веб-сайтах.

Оценка смещения ссылок и источников с течением времени: как российская частично контролируемая государством поисковая система «Яндекс» выступила посредником в акции протеста против режима https://doi.org/10.1080/1369118X.2021.1933563

Опубликовано в Интернете:
07 июня 2021 г.

В данном исследовании нашей целью было смоделировать результаты поиска, максимально репрезентативные для тех, которые в то время были бы получены обычными жителями Москвы по тем же запросам. Тем не менее, как Google, так и Яндекс, как известно, персонализируют свои результаты поиска. Однако, как показали недавние исследования, эффект персонализации поиска в ответ на политические поисковые запросы, особенно при рассмотрении только лучших результатов, как правило, минимален (Puschmann, 2019; Trielli & Diakopoulos, 2020).Таким образом, использование обезличенных браузеров в настоящее время является широко применяемой стратегией в исследованиях по проверке алгоритмов поисковых систем (см., например, Diakopoulos et al., 2018; Kulshrestha et al., 2019; Paltemaa et al., 2020; Unkel & Haim, 2019). . Приняв эту стратегию, мы удалили всю личную информацию, кроме местоположения и языка, из нашего исследовательского браузера. Чтобы повысить достоверность наших данных, которые мы собрали с помощью исследовательского компьютера в Берлине, мы деактивировали функцию автоматической геолокации в браузере и установили русский язык браузера.Для Google мы использовали локальную версию (google.ru), а язык поиска поставили русский. Для Яндекса появилась возможность выбирать географическое положение вручную. Ставим локацию в Москву.

Обоснованность аналогичного подхода была проверена ранее Zavadski and Toepfl (2019). В ходе теста на надежность Zavadski and Toepfl (2019) провели пробные запросы для девяти выбранных политических событий как в Яндексе, так и в Google. Они выполнили запросы одновременно (9 июня 2017 г.), сравнив результаты, полученные на их исследовательском компьютере за пределами России (с настройками, идентичными применяемым в этом исследовании), с результатами, полученными на пяти разных персонализированных компьютерах, принадлежащих волонтерам, проживающим в Москве.Учитывая 10 лучших результатов, Zavadski and Toepfl (2019) сообщили, что средний уровень согласия составляет 89 % для Google и 82 % для Яндекса. Это совпадение увеличилось до 92% для Google и 86% для Яндекса, когда на компьютерах участников в Москве были удалены истории поиска и файлы cookie. На этом фоне и со ссылкой на недавнее исследование, которое показывает, что и Google, и Яндекс рандомизируют значительную часть своих результатов (Махортых и др., 2020), мы считаем результаты, собранные для этого исследования, в целом репрезентативными для результатов, полученных на стандартных московских компьютерах. .

Измерение предвзятости источников

Чтобы операционализировать предвзятость источников, мы, во-первых, вручную закодировали все уникальные веб-сайты ( N  = 1,726) в (1) новостные веб-сайты, (2) личные веб-сайты (например, блоги, учетные записи в социальных сетях). /группы, форумы), (3) энциклопедии или (4) другие (например, организационные) веб-сайты. На следующем этапе мы ограничили наш анализ первыми двумя категориями веб-сайтов, которые, как мы предполагали, содержат явно политические нарративы: (1) новостные и (2) личные веб-сайты.На эти две категории приходится 1620 уникальных веб-сайтов (94% всех уникальных веб-сайтов) и 26 902 результата поиска (88% от общего числа результатов). Затем мы вручную закодировали каждый из этих уникальных веб-сайтов, опираясь на теорию авторитарной общественности Топфл (2020). Toepfl (2020) предположил, что в авторитарных режимах можно выделить три типа новостных веб-сайтов (как «общественных») в зависимости от степени критики автократа, которую они обычно допускают в своем повседневном освещении новостей. Основываясь на этом подходе, мы различаем:

  1. Сайты, критикующие руководство , новостные материалы которых содержат полную политическую критику, обрушивающуюся даже на самодержца.

  2. Политически критичные веб-сайты , которые тщательно избегают критики самодержца и высших правящих элит режима, но все же регулярно содержат критику в адрес чиновников более низкого уровня, и в частности политики, за которую отвечают эти чиновники более низкого уровня.

  3. Некритичные сайты , которые вообще не распространяют никакой критики ни в адрес самодержца, ни в адрес нижестоящих чиновников (если только эта критика ранее не высказывалась самодержцем).

В ходе ручного кодирования два независимых эксперта-кодировщика (один из которых является автором) присвоили каждому из 1620 уникальных веб-сайтов один из трех типов. Для этого кодировщики начали с поиска на веб-сайте 20 самых последних статей о российском самодержце (поисковый запрос: «Путин»). Если в этих статьях была обнаружена критика автократа, сайт был закодирован как критикующий лидерство (тип 1). Если критики в адрес автократа обнаружить не удавалось, кодировщики проверяли освещение издания на наличие статей по спорным вопросам политики (например,г., на момент кодирования выделялись темы роста бедности и пенсионной реформы в России). Если можно было выявить критику в адрес чиновников более низкого уровня или их политики, веб-сайт был закодирован как политически критичный (тип 2). Если не было выявлено никакой политической критики, кодировщики кодировали веб-сайт как некритичный (тип 3; более подробную информацию об этом процессе кодирования см. в онлайн-ФН). Чтобы проверить надежность интеркодера, два кодировщика дважды закодировали 100 случайно выбранных веб-сайтов. Они достигли удовлетворительного уровня надежности интеркодера (Криппендорф α  = .92).

Чтобы оценить разницу в предвзятости источников между поисковыми системами, мы сравнили разницу в доле только одной категории веб-сайтов: источников, критически важных для лидерства (тип 1). Что касается проверки гипотез, мы сосредоточимся на этом типе источников, потому что веб-сайты, критикующие руководство, были единственными источниками, которые недвусмысленно поддерживали дело протестующих против режима 26 марта (критическое отношение к лидерству). Таким образом, содержание этих веб-сайтов можно считать важным для дела протестующих, поскольку оно может способствовать дальнейшей мобилизации протеста.Напротив, политически критические и некритические СМИ имели тенденцию с разной степенью строгости (1) подчеркивать, что протесты 26 марта не были санкционированы властями и, следовательно, были незаконными, (2) не сообщали о реальных политических требованиях активистов, и (3) не давать ведущим активистам право голоса в виде оригинальных звуковых фрагментов или буквальных цитат. Хотя мы, таким образом, сосредотачиваемся на результатах, критически важных для руководства, для проверки гипотез, мы сообщаем о наличии всех трех типов источников в нашем наборе данных в разделе результатов этой статьи в целях предоставления читателям контекстуальных знаний и исследовательского анализа.

Измерение смещения ссылок

Чтобы измерить смещение ссылок, на первом этапе мы автоматически извлекли весь текстовый контент из 13 353 уникальных веб-страниц, на которые есть ссылки в результатах поиска (исключая комментарии пользователей, если они есть). Мы скачали эти данные за один день (10 января 2019 г.). Подробное обсуждение этических соображений и принятых мер см. в онлайн-журнале SF. На следующем этапе для каждого результата поиска ( N  = 30 471) мы определили, перенаправляет ли он пользователей на веб-страницу, содержащую информацию о акции протеста 26 марта.Для этого алгоритм классификации на основе словаря с использованием предварительно определенного списка терминов, относящихся к событию 26 марта, провел поиск на каждой веб-странице этих терминов и комбинаций этих терминов (используя выражения Regex; полный список терминов и многое другое). подробности о процедуре см. на сайте SF). Веб-страницы, содержащие хотя бы один из терминов, считались релевантными. Чтобы проверить надежность нашего подхода, мы вручную закодировали 500 веб-страниц, случайно выбранных из нашего набора данных. Процентное соответствие между автоматическим кодированием и кодированием человеком составило 96%, что мы сочли весьма удовлетворительным.Чтобы измерить смещение ссылок, мы рассчитали для каждой страницы результатов (учитывая только первые пять результатов) отношение (1) результатов, которые направляли пользователей на веб-страницы, содержащие информацию о акции протеста 26 марта, к (2) всем результатам.

Находки

Как показал первоначальный анализ, прямое совпадение (перекрытие) результатов поиска между парами поисковых систем было относительно низким. Мы рассчитали совпадения как среднее значение, разделив сумму количества результатов поиска из списка A, найденных в списке B, и результатов поиска из списка B, найденных в списке A (без учета различных рейтингов), на общее количество результатов, рассмотренных в каждом из 945 поисковых запросов, собранных в 105 моментов времени за 20-месячный период.В итоге для google.ru и yandex.ru мы получили перекрытие 22,7%. Для news.google.ru и news.yandex.ru перекрытие было значительно ниже — всего 5,7%.

h2a/h3a: смещение ссылок, усредненное за весь 20-месячный период

Чтобы оценить смещение ссылок, мы сначала рассчитали коэффициенты ссылок для каждого поискового термина для каждого раунда поиска. Впоследствии мы усреднили эти эталонные отношения по 105 раундам поиска. В таблице 1 обобщены наши выводы, в которых представлены средние коэффициенты ссылок по поисковым запросам и поисковым системам.Чтобы проверить статистическую значимость средних соотношений ссылок между парами поисковых систем, мы провели t -тестов с независимыми выборками. Как показано в таблице 1, алгоритм поиска в Интернете Яндекса (по сравнению с его аналогом Google) был значительно смещен в отношении протестующих по трем поисковым запросам, в то время как он был предвзят в пользу протестующих только по одному поисковому запросу («демонстрации в России»). . Таким образом, h2a можно считать поддерживаемым. Для сравнения, алгоритм поиска новостей Яндекса (по сравнению с его аналогом Google) был значительно ориентирован на протестующих по шести из девяти поисковых запросов, в то время как он был ориентирован на протестующих только по двум поисковым запросам («антикоррупционные протесты»). , «антикоррупционные митинги»).Эти данные подтверждают h3a.

h2b/h3b: предвзятость источников, агрегированная за 20-месячный период веб-сайт (

некритические , критически важные для политики и критически важные для руководства) все пять результатов, рассмотренных для каждого из девяти запросов. Затем мы вычислили средние значения этих соотношений по девяти поисковым запросам и по 105 раундам поиска для каждой поисковой системы (аналогичный подход, оценивающий «усредненную по времени систематическую ошибку», см. в Kulshrestha et al., 2019, с. 197). Результаты визуализированы на рисунке 1. Затем, чтобы проверить предвзятость источников, мы сравнили различия в средних соотношениях источников, критически важных для руководства, в двух парах поисковых систем, проведя t -тестов Уэлча. Мы обнаружили, что веб-поиск Google действительно содержит значительно больше важных для руководства результатов ( М =  34,28%, SD =  23,77%), чем веб-поиск Яндекса ( M =  31,33%, SD %), т (1860) = 2.85, р  = 004. Хотя разницу в 2,95 процентных пункта можно считать незначительной, наши данные подтверждают h2b. Однако для новостных агрегаторов картина более контрастная. Новости Google ( M =  49,28%, SD =  22,81%) действительно почти в два раза чаще отсылали своих пользователей к источникам, критически важным для руководства, чем Новости Яндекса ( M =  26,16%, SD =  22,353%). t (1888) = 22,25, p  < 001. Этот вывод сильно поддерживает h3b.

Измерение предвзятости ссылок и источников с течением времени: как российская частично контролируемая государством поисковая система «Яндекс» выступила посредником в акции протеста против режимаhttps://doi.org/10.1080/1369118X.2021.1933563

1. Оценка предвзятости источника: категории веб-сайтов, представленные поисковой системой.

Примечание. Пропорции представляют собой средние значения по 105 раундам поиска и 9 поисковым запросам (N = 945 для каждой поисковой системы). Категория «Другое» состоит из энциклопедических и прочих (т.г., организационные) веб-сайты.

Рисунок 1. Оценка предвзятости источника: категории веб-сайтов, рекомендуемых поисковой системой.

Примечание. Пропорции представляют собой средние значения по 105 раундам поиска и 9 поисковым запросам (N = 945 для каждой поисковой системы). Категория «Другое» состоит из энциклопедических и других (например, организационных) веб-сайтов.

h4a/h5a: систематическая ошибка ссылок во времени: сравнение первой недели и оставшегося периода для каждого раунда поиска (

N  = 105).Затем мы вычислили средние значения этих различий в течение первой недели ( N  = 7 точек измерения во времени) и оставшегося периода времени ( N  = 98 точек измерения во времени). Для поисковых систем мы обнаружили, что разница в соотношении ссылок между Google и Яндексом была огромной в первую неделю после протестов (средняя разница (M diff ) = 22,86%, SD  = 7,88%), в то время как они были менее выражены в оставшийся изучаемый период времени ( M diff  = 7.05%, SD  = 5,15%). Таким образом, разрыв между эталонными отношениями, измеренными для двух поисковых систем, был примерно на 16 процентных пунктов больше сразу после протестов, t (103) = 5,63, p  = 001. Этот вывод поддерживает h4a. Кроме того, для целей исследовательского анализа на Рисунке 2 показаны дезагрегированные результаты. Он показывает, как различия в референсных коэффициентах (1) в основном объяснялись результатами, полученными в ответ на общие условия поиска, и (2) в течение 20-месячного периода времени, на которые предположительно также повлияли последующие громкие события (для дальнейшего исследовательского анализа, см. СФ).

Измерение предвзятости ссылок и источников с течением времени: как российская частично контролируемая государством поисковая система «Яндекс» выступила посредником в акции протеста против режимаhttps://doi.org/10.1080/1369118X.2021.1933563

2. Измерение смещения ссылок с течением времени по группе поисковых терминов.

Примечание. Для этого рисунка 9 поисковых терминов, используемых в этом исследовании, были сгруппированы по конкретным («антикоррупционные митинги», «антикоррупционные митинги 26 марта», «антикоррупционные протесты», «он не димон вам») и общие поисковые запросы («митинг», «протесты», «демонстрации», «демонстрации в россии», «протесты в россии»).Коэффициенты ссылок — это средние средние значения поисковых запросов одной и той же группы для каждого раунда поиска ( N = 105).

Рис. 2. Измерение смещения ссылок с течением времени по группам поисковых терминов.

Примечание. Для этого рисунка 9 поисковых терминов, используемых в этом исследовании, были сгруппированы по конкретным («антикоррупционные митинги», «антикоррупционные митинги 26 марта», «антикоррупционные протесты», «он не димон вам») и общие поисковые запросы («митинг», «протесты», «демонстрации», «демонстрации в россии», «протесты в россии»).Коэффициенты ссылок — это средние средние значения поисковых запросов одной и той же группы для каждого раунда поиска ( N = 105).

Что касается двух новостных агрегаторов, наши данные также показывают, что сразу после протестов разрыв между эталонными коэффициентами увеличился. В частности, разрыв в соотношении ссылок между Новостями Google и Новостями Яндекса был примерно на 14 процентных пунктов больше в первую неделю после протестов ( M diff = 24.25%, SD = 5,54%) по сравнению с оставшимся периодом времени ( м разных = 9,82%, SD = 80356 SD T (103) = 6,83, P <. 001. Таким образом, наши данные сильно поддерживают h5a.

h4b/h5b: смещение источника во времени: сравнение первой недели и оставшегося периода отношения извлеченных пропорций веб-сайтов, важных для руководства, как средние средние значения по девяти поисковым запросам.Затем для каждой пары двигателей и суток вычислялись абсолютные различия в соотношениях между двигателями как |μGoogle−μYandex| и сравнили их между первой неделей (

N  = 7 точек измерения во времени) и остальными ( N  = 98 точек измерения во времени) с использованием независимых выборок t -тестов. Вопреки нашим ожиданиям, для поисковых систем в Интернете мы не обнаружили никаких признаков того, что алгоритмы поиска в Интернете Яндекса были более предвзятыми по отношению к веб-сайтам, критически важным для руководства, сразу после протестов ( M diff =  8.10%, SD = 8,12%) по сравнению с остальными двадцать месяцами ( м разных = 5,75%, SD = 4,56%), T (103) = 0,76, р =. 477. Таким образом, h4b отклоняется.

Однако у новостных агрегаторов результаты выглядят иначе. Результаты Яндекс-Новостей действительно были более предвзятыми в отношении веб-сайтов, критикующих руководство, сразу после акции протеста по сравнению с их аналогом Google ( M diff  = 33,73%, SD  = 10.35%), чем в оставшийся период ( M diff  = 22,57%, SD  = 8,79%, t (103) = 2,99, p  2= 2,99, p  ). Таким образом, наши данные поддерживают h5b.

Обсуждение

В этом исследовании мы разработали и ввели в действие две концепции для оценки скрытой предвзятости политических поисковых систем в российской авторитарной широкой общественности, «критикующей руководство» (Toepfl, 2020): алгоритм дискриминирует результаты, направляющие пользователей на веб-сайты, которые содержат информацию о громких политических событиях, организованных оппозицией) и (2) предвзятость источника (алгоритм дискриминирует результаты, направляющие пользователей на веб-сайты, которые регулярно содержат критичный для руководства контент).

Помимо простых метрик: преимущества анализа предвзятости ссылок и источников широко распространенные чисто технические показатели сходства (например, простое совпадение результатов, часто рассчитываемое как индекс Жаккара, см., например, Pushmann, 2019). Основная причина этого заключается в том, что простые меры перекрытия полностью игнорируют значения, нарративы и фреймы, встроенные в контент, к которому алгоритмы поиска отсылают своих пользователей.В нашем примере, например, перекрытие отдельных результатов, выдаваемых поисковыми алгоритмами Google и Яндекс, было довольно низким: 23% (между поисковыми системами) и 6% (между агрегаторами новостей). Основываясь на таких же низких результатах совпадения результатов, ученые утверждают, что «разные социальные реальности» (Jiang, 2014, стр. 229) могут создаваться разными поисковыми системами. Однако, как показывает наш анализ предвзятости ссылок и источников, связь между совпадением результатов и различиями в создании социальных реалий ни в коем случае не является прямой.В нашем исследовании поисковые системы Google и Яндекс, несмотря на более чем 75% неидентичных результатов, отсылали своих пользователей к веб-страницам, которые с точки зрения ключевых политических нарративов были гораздо более похожими, чем цифры с низким перекрытием. указал бы. Например, что касается веб-сайтов с критикой политического лидера России Владимира Путина, мы определили разницу между поисковыми запросами Google и Яндекса всего в 3% (см. рис. 1).

Происхождение и последствия предвзятости скрытого поиска в авторитарных режимах

Несмотря на то, что различия в предвзятости политического поиска могут быть не столь выраженными, как можно предположить по малому совпадению показателей между двумя поисковыми системами, результаты этого анализа по-прежнему ярко и детально иллюстрируют как алгоритмы, управляемые Яндексом, в нескольких отношениях благоприятствовали позициям правящих элит России.Например, по сравнению с поиском новостей Google, поиск новостей Яндекса был в значительной степени ориентирован на источники по отношению к веб-сайтам, которые открыто критиковали авторитарное руководство России (h3b). Аналогичным образом алгоритмы поиска в Интернете и новостях Яндекса, по сравнению с их аналогами в Google, были значительно предвзяты по ссылкам на протестующих (h2a/h3a). Кроме того, один из самых интригующих вопросов, поднятых нашим последующим анализом предвзятости поисковых систем с течением времени, заключается в следующем: почему алгоритмы Яндекса (как в Интернете, так и в новостях) показали значительно более высокие уровни предвзятости ссылок в первую неделю после протестных событий (h4a). /h5a)? Ссылочная предвзятость результатов поиска Яндекса особенно примечательна, поскольку пользователи широко хвалят Яндекс за лучшие результаты в поиске в русском контексте по сравнению с Google.Google, напротив, часто критикуют за то, что он не улавливает понятие локальности во многих регионах своей деятельности (Rogers, 2019). На этом фоне поразительно низкие коэффициенты ссылок алгоритмов веб-поиска Яндекса в ответ на самые общие термины запроса «демонстрации» (0,00) и «протесты» (0,09) вызывают как минимум подозрение (см. Таблицу 1). . Как показывает дальнейший исследовательский анализ нашего набора данных, веб-поиск Яндекса отправлял пользователей, которые вводили термин «демонстрации», только 12 раз на неэнциклопедические веб-сайты в течение всего 20-месячного периода.Все энциклопедические сайты были о значении слова «демонстрации», а не о реальных демонстрациях 26 марта. Таким образом, пользователи, которые ввели термин «демонстрации» в поисковой системе Яндекса, не встретили упоминаний о событии 26 марта среди своих первых пяти результатов в любой момент времени в течение 20-месячного периода. Последнее и ряд аналогичных результатов, выявленных в ходе нашего анализа, напоминают модели скрытой цензуры, нацеленной на определенные термины запроса в определенные периоды (например,g., нацеливание на события, чувствительные к режиму, сразу после их окончания), поскольку они наблюдались также в китайском социально-политическом контексте (Paltemaa et al., 2020; Vuori & Paltemaa, 2019). По сути, наши эмпирические данные подтверждают обвинения активистов российской оппозиции (см. введение к этой статье). Сразу после массовых уличных протестов не только список пяти лучших новостей Яндекса, но и его алгоритмы веб-поиска явно «отстали от картины дня» (Яндекс, 2017).

Еще одним примечательным наблюдением является то, что алгоритм веб-поиска Яндекса, по сравнению с его аналогом Google, продемонстрировал особенно высокие уровни смещения ссылок (см. Таблицу 1), а также смещения источников (для дополнительного анализа см. SF) в ответ на общие условия поиска. Как следствие, веб-поиск Яндекса, очевидно, давал особенно предвзятые результаты лицам, которые мало или совсем не знали о текущих протестах и, следовательно, не могли использовать определенные поисковые запросы.Это наблюдение, по-видимому, в целом соответствует одному из основных принципов критической власти авторитарной общественности в целом, согласно которому поток критической для режима информации не подавляется строго, а лишь стратегически ограничивается с точки зрения охвата аудитории (Toepfl). , 2020).

Заключение: ограничения и многообещающие направления для будущих исследований

Подробные эмпирические данные, представленные в этом исследовании, имеют большое политическое значение как минимум по двум причинам. Во-первых, быстрое распространение информации о протестах, особенно сразу после крупных событий, имеет чрезвычайно важное значение для дальнейшей протестной мобилизации.Предвзятость источников и ссылок поисковых систем, и особенно Яндекс-Новостей как «самого популярного источника новостей в рунете» (Лохов, 2019, п. 1), сразу после протестов может оказать существенное влияние на успех последующих мобилизационных усилий оппозиционного движения. Во-вторых, наши выводы, особенно в отношении предвзятости результатов в ответ на общие термины запроса, такие как «демонстрации» или «протесты», могут способствовать дальнейшему подрыву доверия российской общественности к политической нейтральности алгоритма веб-поиска Яндекса.Эти результаты делают заявление компании о том, что она не вмешивалась тайно в свои поисковые алгоритмы по политическим причинам, как минимум сомнительно (Яндекс, 2017). Даже в большей степени, чем в китайском авторитарном контексте, обеспечение общественного доверия можно считать решающим фактором коммерческого успеха Яндекса в российском авторитарном контексте, где политическая «цензура на мета-уровне» (Paltemaa et al., 2020, стр. 2067) поиска результаты официально признаны неприемлемыми и публично опровергнуты Яндексом.

Это исследование, как и любое исследование, имеет ограничения, которые, тем не менее, открывают многообещающие возможности для будущих исследований. Во-первых, это исследование основано только на одном методологическом подходе: реверс-инжиниринг, то есть систематический поиск и анализ результатов поиска. Будущие исследования могли бы подкрепить наши утверждения о предвзятости алгоритмов Яндекса и их происхождении, например, путем проведения качественных интервью или этнографических исследований с (бывшими) сотрудниками компании (см. Kitchin, 2017).Во-вторых, в этой статье проведено подробное исследование только одного инцидента — протестов 26 марта. Будущие исследования могут исследовать большее количество событий на основе большего набора запросов, потенциально также полученных из третьих стран, где Яндекс имеет большую долю на рынке поисковых систем (например, Беларусь или Казахстан). В-третьих, исследователи могут взять на себя задачу измерения предвзятости, даже в сложных наборах данных страниц результатов, не только путем ручного кодирования или категоризации уникальных источников (предвзятость источника), но и путем применения ряда методов автоматизированного анализа контента (предвзятость контента).В-четвертых, несмотря на то, что в этом исследовании мы моделировали географическое местоположение с помощью ряда настроек браузера и поисковой системы, мы по-прежнему отправляли запросы с адреса интернет-протокола (IP), который мог быть связан с местоположением за пределами России. Несмотря на то, что тесты на надежность показали, что этот выбор оказал незначительное влияние на наши результаты, мы рекомендуем в будущем направлять запросы через прокси-серверы, расположенные в целевых странах. Следуя этим направлениям изучения, будущие исследования могли бы пролить свет на сложные механизмы, с помощью которых алгоритмы поиска, контролируемые авторитарными элитами, направляют потоки политической информации как внутри, так и за пределы национальных границ.С концептуальной точки зрения кажется особенно интригующим размышление о различиях между тем, как поисковые системы работают и управляются политическими элитами, в авторитарных режимах, которые считают уместной открытую цензуру алгоритмов на метауровне (например, в Китае), и других, которые этого не делают (например, в Китае). Россия).

Google против Яндекса в России

И когда смотришь на цифры с этим трудно поспорить. Есть множество возможных причин, почему это так, но давайте перейдем к делу и рассмотрим основные различия между двумя поисковыми системами.

Чтобы объяснить, как работает Яндекс по сравнению с Google, и ответить на некоторые часто задаваемые вопросы о том, как лучше всего оптимизировать веб-сайт для Яндекса, мы разделили статью на четыре части:

  1. Факторы ранжирования
  2. Контент страницы и оптимизация на странице
  3. Создание ссылок
  4. Фильтры.

Итак, приступим.

Всякий раз, когда обсуждается SEO для российского рынка, это почти всегда приводит к дебатам Google против Яндекса. Однако большинство людей согласятся с тем, что Яндекс является ведущей поисковой системой в России.

Факторы ранжирования

По мнению российских SEO-специалистов, на ранжирование в Яндексе влияет несколько групп факторов: архитектура и код сайта, текстовое наполнение, ссылки, поведение пользователей и географическое положение.

  • Архитектура сайта относится к основным требованиям доступности сайта для роботов. Это означает, что сервер должен быть доступен в любое время; сайт должен быть достаточно быстрым и так далее. Как и Google, Яндекс хочет, чтобы его роботы имели легкий доступ к веб-сайту, поэтому лучше всего использовать роботов в поисковой оптимизации.txt и sitemap.xml в коде веб-сайта.
  • Текстовое содержимое, как и следовало ожидать, относится к реальному тексту, видимому пользователям на веб-сайте. Опять же, как и Google, Яндекс борется со спамом и хочет, чтобы текст был полезным и удобным для человека. Переоптимизированные страницы могут быть наказаны и потерять позицию в рейтинге.
  • Ссылки: некоторые из известных факторов ранжирования страниц в Google — это PR и авторитет страницы. Эти факторы определяют количество ссылочного веса или мощность, которую ссылка с конкретной страницы перейдет на ваш веб-сайт, что впоследствии повысит PR и авторитет страницы.Яндекс использует свой собственный, но очень похожий, Topical Index Citation (TIC), чтобы определить это. Проще говоря, TIC страницы — это сумма весов ссылок, которые ссылаются на эту страницу или веб-сайт, как в расчетах Google. Однако вес ссылки зависит как от тематического сходства, так и от географической близости ссылающегося веб-сайта к веб-сайту, на который он ссылается. Стоит отметить, что Яндекс учитывает только ссылки с сайтов, включенных в Каталог Яндекса, а также не учитывает ссылки, которые могли быть размещены на сайте без контроля со стороны владельцев сайта (т.грамм. форумы, некоторые блоги, доски и т.д.). ТИЦ имеет решающее значение для ранжирования веб-сайтов в каталоге Яндекса, поскольку он модерируется специалистами Яндекса из базы данных наиболее надежных веб-сайтов. Размещение в этой базе позволяет резко увеличить посещаемость российских сайтов.
  • Поведение пользователей — один из факторов ранжирования, на который труднее всего повлиять. Он учитывает, насколько интересным и полезным люди находят сайт. Он оценивает уникальных посетителей веб-сайтов, количество просмотренных страниц, среднее время, проведенное на веб-сайте, и показатель отказов.Почти невозможно контролировать все эти факторы и то, как они влияют на рейтинг сайтов. Все, что вы можете сделать, это убедиться, что ваш сайт удобен для людей и полон отличного контента.
  • Географическое положение: Яндекс очень заботится о качестве и релевантности результатов поиска в разных городах и регионах России. Чтобы результаты поиска были максимально релевантными, Яндекс учитывает местоположение сайта и позволяет пользователям искать компании и услуги, предлагаемые в их регионе.В этом случае все сайты, аффилированные с другими регионами, просто не попадут в результаты поиска. Регион пользователя определяется его IP-адресом, тогда как адрес веб-сайта определяется служебным адресом на самом веб-сайте. Есть несколько разных способов привлечь внимание Яндекса к вашему служебному адресу, и самый простой — просто убедиться, что он четко написан на вашем сайте. Однако, чтобы быть уверенным, что это учтено, лучше всего зарегистрировать свой веб-сайт или адрес компании в каталоге Яндекса или в Яндекс Вебмастере.Это крайне выгодно для компаний, имеющих офисы или представительства в России.

Контент страницы и оптимизация на странице

Общие правила для контента на странице довольно стандартны:

  • Убедитесь, что ваш текстовый контент хорошего качества и написан для пользователей, а не для поисковых систем.
  • Не пишите длинные тексты, в идеале они должны содержать от 300 до 3000 слов и не более 4000 слов (более длинные тексты все еще приемлемы, но обычно получают более низкий рейтинг).
  • Не переусердствуйте с ключевыми словами в каждой строке текста. Около 5-7% — оптимальное соотношение содержания ключевого слова, а 10% — допустимый максимум.
  • Не используйте слишком много текста полужирный или курсив ;
  • Позаботьтесь о грамматике, убедитесь, что она верна.
  • Структурируйте свою информацию, чтобы сделать ее более удобной для чтения пользователями и более заметной для поисковых систем.

Яндекс все еще не идеален в распознавании оригинального контента и в настоящее время тестирует предлагаемые им сервисы антиплагиата.В настоящее время, чтобы указать право собственности на контент веб-сайта, вам необходимо сначала загрузить контент в базу данных Яндекса для веб-мастеров, а затем опубликовать его на своем веб-сайте. Теоретически это поможет защитить ваш контент от плагиата. Линкбилдинг

Яндекс теперь заботится о ссылках гораздо больше, чем раньше, так же, как Google и недавние обновления алгоритма. Теперь он хочет, чтобы ссылки появлялись естественным образом, и борется со ссылочными фермами. При покупке ссылок вы должны тщательно выбирать веб-сайты и убедиться, что они имеют отношение к вашему сайту.Новые сайты моложе 6 месяцев не должны получать более 30-50 внешних ссылок в месяц; для сайтов возрастом около года рекомендуемое максимальное количество новых ссылок составляет 50-100 в месяц.

Что касается ссылок, которые вы размещаете на своем сайте, то Яндекс предпочитает, чтобы их было не более 5 на странице, допустимый максимум — до 25 ссылок. В целом Яндекс немного строже, чем Google, когда дело доходит до линкбилдинга.

Фильтры

Что делать, если сайт не соблюдает правила Яндекса? Если Яндекс решает, что веб-сайт не соблюдает какие-либо правила своей поисковой системы, он опускает этот сайт в свои результаты обычного поиска или, в более серьезных случаях, вообще удаляет его из своей поисковой выдачи.Фильтры, используемые Яндексом:

  • Автоматически сгенерированный контент (AGC) — этот фильтр запрещает ранжирование веб-сайтов, которые содержат автоматически сгенерированный, скопированный контент, нелогичный контент или размещено слишком много ссылок.
  • «Ты последний» — Этот фильтр ставит страницы с бесполезным контентом на последние места в рейтинге Яндекса.
  • «Вы рассылаете спам» — Этот фильтр используется для страниц с некачественным контентом, эти страницы сильно теряют в рейтинге, возможные причины: огромные тексты (более 4000 слов), слишком много ключевых слов (>10%), слишком много полужирный или курсив текст, грамматические ошибки и т.д.
  • «Взрыв ссылок» — фильтр, который используется для сайтов, которые значительно увеличивают количество внешних ссылок за короткий промежуток времени, Яндекс считает, что ссылки были куплены, и игнорирует сайт;
  • «Непот» — фильтр, предназначенный для поиска и исключения из индекса сайтов, которые используются для размещения случайных и платных ссылок;
  • «Фильтр мошенничества с поведением» — этот фильтр используется против веб-сайтов, которые пытаются повлиять на рейтинг своего поведения пользователей, отправляя роботов для посещения сайта и «повышая» его удобство использования и полезность, фильтр блокирует веб-сайты-нарушители и удаляет все страницы веб-сайта из Результаты Яндекса.
  • «Партнерский фильтр» — распознает веб-сайты, принадлежащие одной компании, которые имеют одинаковую тематику, и снижает все их рейтинги, кроме основного сайта.

Чтобы избежать наказания, старайтесь соблюдать все правила поисковой системы Яндекса и создавайте полезный контент для своих потенциальных посетителей и клиентов. Если ваш сайт уже попал под один из этих фильтров, первое, что вы должны сделать, это связаться со службой поддержки Яндекса, чтобы уточнить, что не так. Узнав о проблемах Яндекса с вашим сайтом, вы должны исправить все, из-за чего сайт упал в рейтинге, и дождаться, пока роботы Яндекса снова проиндексируют сайт.Этот процесс может занять от пары недель до года и более, так что, очевидно, лучше играть по правилам Яндекса.

В целом алгоритм Яндекса не так уж сильно отличается от алгоритма Google. Он использует те же принципы и логику, но в то же время более конкретно отражает российскую интернет-индустрию, относительно молодую, но быстро развивающуюся.

Поиск в России: Лингвистический тест Google против Яндекса

Большинство из нас, говорящих по-английски, не задумываются о той роли, которую лингвистика играет в мире SEO и SEM.Мы фокусируемся и анализируем многие другие аспекты способности поисковых систем выдавать отличные результаты поиска для пользователей, одновременно определяя пользователей, на которых пытаются ориентироваться контекстные рекламодатели.

Способность поисковой системы полностью понимать данный язык сильно влияет на то, насколько хорошо она служит своей цели. Поскольку мы привыкли к английскому языку и Yahoo, Bing и Google, мы можем не думать о чешском языке и Seznam или о том, что англоязычной поисковой системе не так просто выйти на иностранный рынок только благодаря своим языковым способностям.

Большинство знакомы с Google как с ведущей глобальной поисковой системой. В последние годы Google улучшил свои возможности, чтобы предложить пользователям и рекламодателям лучший опыт работы с региональными версиями. Тем не менее, как выразился Джанлука Фиорелли, «региональные Google не работают». В оценках Фиорелли отмечается, что отсутствие у Google обновлений в региональных версиях, геотаргетинга и возможностей понимания языка может способствовать снижению результатов поиска.

Когда поисковая система изо всех сил пытается правильно понять язык, на котором она работает, и непреднамеренно упускает из виду то, что хочет пользователь, или возвращает релевантные страницы, она также упускает ваши возможности для контекстной рекламы.Рекламодателям и любителям поисковых систем нужны наилучшие знания о возможностях поисковой системы не только для получения отличных результатов поиска, но, что более важно, для помощи платным рекламодателям в идентификации своих клиентов.

Однако некоторым может не хватать языковых навыков для проверки таких проблем или они могут вообще не распознавать их существование. По этой причине многие просто переводят и запускают кампанию AdWords за границей, надеясь увидеть те же результаты, что и на Google.com. В качестве альтернативы поисковые маркетологи могут также запустить одну и ту же кампанию в региональном Google и другом местном игроке.

Это часто случается с Google.ru и Яндексом, ведущей поисковой системой России с долей рынка 62%. По большей части простые и простые запросы дают одинаковые результаты в этих двух поисковых системах. Однако, помимо нескольких других причин, недостатки русского языка в Google.ru влияют на его способность выдавать те же результаты поиска, что и на Яндексе. Во многих случаях Google.ru не адаптирует свои результаты к местным нюансам, вызывая проблемы, связанные с языком, когда дело доходит до получения правильных результатов поиска для намерений пользователя.В конечном счете, это также влияет на то, какую рекламу показывают российской целевой аудитории.

Я провел серию тестов на Google.ru и Яндексе, чтобы лучше отобразить различия между двумя поисковыми системами. Намерения пользователя и проблемы, связанные с языком, включают орфографические ошибки, спряжения глаголов, адаптацию существительных и транслитерацию. Поэтому я использую пример из каждой категории для проверки русскоязычных возможностей Google.ru и Яндекса.

Тест 1: опечатка

В первом туре я решил проверить два русских слова с разным значением и написанием, которые звучат очень похоже при произношении.При разговоре я до сих пор не могу отличить русское слово лук?? ? а русское слово луг?? ? , но как видите разница в одну букву.

Чтобы проверить языковые способности поисковой системы, я ввел опечатку в слове «луковый суп», что по правилам русской грамматики означает, что лук превращается в прилагательное. Я ввел «луговой суп» (?? ? ???? ???) вместо «луковый суп» (?? ? ???? ???).

Яндекс прошел тест, выдав мне все результаты поиска рецептов лукового супа.Яндекс изменил прилагательное на правильное написание, что дало мне релевантные результаты для рецептов и статью в Википедии о французском луковом супе.

 

Яндекс также подсказал правильное написание, при нажатии на которое я попадал на страницу с большим количеством рекламы и еще лучшими результатами.

С другой стороны, Google пытался дать мне результаты за 2012 год по «луговому супу». Многие ссылки привели меня к рецептам грибных супов, которые, как я узнал, могли быть своего рода супом с названием, связанным с зеленью и полем.Тем не менее, немногие люди ищут это и ошиблись бы в правильном запросе для лукового супа.

При тестировании других орфографических ошибок и Google.ru, и Яндекс могут обрабатывать случайные запросы, но когда такие проблемы, связанные с языком, сохраняются, носителю языка, такому как Яндекс, будет легче понять намерение пользователя.

Тест 2: спряжения глаголов

Русские глаголы могут принимать самые разные формы, адаптируясь к временам, формам совершенного и несовершенного вида.В зависимости от подлежащего предложения глагол также принимает до шести различных спряжений в настоящем и будущем времени.

Чтобы проверить спряжение глаголов, я ввел запрос «Я иду на первое свидание», используя несовершенную форму «И» глагола «идти». Обе поисковые системы относительно хорошо понимали намерения пользователя, но были некоторые очевидные различия в количестве спряжений глаголов, которые они возвращали.

У Яндекса было 49 миллионов результатов поиска по этому запросу.Он распознал намерение пользователя и различные спряжения глаголов, что в конечном итоге привело к тому, что по этому запросу на Яндексе появилось больше страниц. Как видно ниже, Яндекс включает шесть различных форм этого глагола, предлагая пользователям советы о том, как вести себя на первом свидании и куда пойти.

Для этого теста результаты поисковой выдачи Google.ru были только для формата «я» и формата «ты-неформальный» глагола «идти». Другие спряжения глаголов не появлялись, когда я просматривал различные результаты страницы.

Google.ru дал мне 526 000 результатов поиска по сравнению с 49 миллионами Яндекса. Тем не менее, я все еще был удивлен развитием Google здесь. Google значительно улучшил свою способность распознавать различные спряжения глаголов. Не так давно на Google.ru были бы результаты точного соответствия только для определенного формата глагола. Тем не менее, очевидно, что Google можно улучшить, потому что две формы глагола вместо шести предоставят пользователю и рекламодателю другой опыт работы с Google по сравнению с Яндексом.

Тест 3: Адаптация существительного

Русское существительное бывает мужского, женского или нейтрального рода, и это может означать несколько разных окончаний для каждого рода, а также варианты единственного и множественного числа. Исходя из этого, существительное может измениться на шесть возможных окончаний как в единственном, так и во множественном числе. Чтобы еще больше усложнить ситуацию, есть исключения из этих правил, которые россиянам просто нужно запомнить.

И Google, и Яндекс хорошо разбираются в этом, и общие запросы будут возвращать соответствующие результаты.Это улучшение для Google. Раньше, когда пользователь вводил, например, «Переезд в Канаду», пользователь получал точное совпадение только с существительным, оканчивающимся на «Канада». Теперь Google возвращает несколько форм существительного Канада.

Чтобы проверить способность поисковой системы понимать морфологию существительных, я выбрал слово «ложь» или «ложь». В единственном числе его можно написать тремя разными способами в зависимости от падежа — ???? — ??? – ?????.

Ввел второй формат в поисковые поля в Яндексе и Гугле.Оба поисковика в основном давали мне результаты по фильмам со словом «ложь» в названии, но я выдавал разные результаты для Яндекса и Google.

Как видно ниже, Яндекс предоставил мне все три формата слова «ложь», и первым результатом является запись в вики о более простом формате слова.

Google.ru очень четко понял запрос и выдал похожие результаты в Яндекс. Однако, как вы видите ниже, это дало мне только точные результаты совпадения. Мне не показывали ни одной рекламы в Google.

 

Тест 4: Транслитерация

Для четвертого теста я хотел проверить лингвистическую способность соответствующих поисковых систем распознавать поиск местных жителей по слову «яблоко», потому что это бренд, но также и обычный фрукт.Русские часто транслитерируют поиск крупных международных брендов. Это означает, что они возьмут исходное слово и написание и озвучат его по-русски. Например, иногда они будут искать Gucci, а иногда — транслитерацию ?????.

Основываясь на нескольких тестах, я знаю, что и Google.ru, и Яндекс знают, что русские ищут таким образом многие крупные бренды. При этом я хотел протестировать каждую поисковую систему по слову «яблоко», чтобы убедиться, что поиск фруктов не сбивает с толку.

Яндекс знал, что я хочу фрукт, а не компьютер или айфон. Все результаты касались яблок, а не компании.

Google.ru предположил, что я говорю о компании, как и на Google.com. Русская версия здесь не адаптирована к русскому языку, как видно из Apple, Apple Store и iCloud, включенных в результаты ниже.

Хотя этот пример очень специфичен, он показывает, как Яндекс распознает локальные нюансы, которые Google.ру нет. В США эти результаты были бы уместны, потому что пользователю нужно указать, ищет ли он компанию или фрукт из-за торговой марки и популярности. В России это, очевидно, другая история, потому что люди не обязательно ассоциируют русское слово «яблоко» с брендом, производителем iPhone/Mac.

Вывод:

Яндекс понимает русский язык намного лучше, чем Google.ru. Хотя Google Россия в последнее время добился положительных результатов в улучшении результатов поисковой выдачи, ему еще предстоит пройти долгий путь, прежде чем он догонит Яндекс.Англоговорящему эти различия могут показаться незначительными, но для русскоязычного и рекламодателя они имеют большое значение, поскольку оказывают большое влияние на пользовательский опыт и цифровую рекламу.

Как видно из сообщения, платные результаты поиска в Google и Яндексе отличаются, поэтому рекомендуется проводить кампании PPC как в Google, так и в Яндексе. Однако также важно иметь представление о типах органических результатов, возвращаемых этими поисковыми системами, которые повлияют на то, как бизнес использует Google и Яндекс в своих маркетинговых кампаниях в России (PPC).

Некоторые рекламодатели могут подумать, что просто продублировав кампанию с Google.com на Google.ru, они получат те же результаты. Тем не менее, это не так. Как мы видели в этом посте, Google.ru еще предстоит проделать большую работу, прежде чем его можно будет считать на том же уровне, что и Google.com. Поэтому любой бизнес, проводящий кампании с оплатой за клик, должен понимать, что его ключевые слова будут генерировать разные показы в России.

 

Характерное изображение с Flickr

Теги

Русский поиск (1) яндекс (26) .

Добавить комментарий

Ваш адрес email не будет опубликован.