Сейчас 127 заметки.

Редактирование: Поисковые системы

Материал из ЗАметки

Внимание! Вы не авторизовались на сайте. Ваш IP-адрес будет публично видимым, если вы будете вносить любые правки. Если вы войдёте или создадите учётную запись, правки вместо этого будут связаны с вашим именем пользователя, а также у вас появятся другие преимущества.

Правка может быть отменена. Пожалуйста, просмотрите сравнение версий, чтобы убедиться, что это именно те изменения, которые вас интересуют, и нажмите «Записать страницу», чтобы ваша отмена правки была сохранена.

Текущая версия Ваш текст
Строка 20: Строка 20:
 
==== Контекстная реклама ====
 
==== Контекстная реклама ====
  
Контекстная реклама — это короткое текстовое объявление, которое размещается в выдаче поисковой системы и показывается пользователю только если он ввел в строку поиска запрос, соответствующий тематике данного объявления.
+
Контекстная реклама — это короткое текстовое объявление, которое размещается в выдаче поисковой сист емы и показывается пользователю только если он ввел в строку поиска запрос, соответствующий тематике данного объявления.
  
 
[[Файл:Contex.png]]
 
[[Файл:Contex.png]]
Строка 162: Строка 162:
 
В 2001 году был запущен сервис контекстной рекламы (Яндекс.Директ), впоследствии ставший основным способом заработка компании. За счет него
 
В 2001 году был запущен сервис контекстной рекламы (Яндекс.Директ), впоследствии ставший основным способом заработка компании. За счет него
 
и других наработок в 2002 году Яндекс вышел на самоокупаемость — на праньше, чем планировалось. В мае 2011 года компания «Яндекс»
 
и других наработок в 2002 году Яндекс вышел на самоокупаемость — на праньше, чем планировалось. В мае 2011 года компания «Яндекс»
провела первичное размещение акций на Нью-Йоркской бирже Nasdaq. По уровню [[Прибыль Яндекса|доходов Яндекс]] значительно опережает все остальные российские
+
провела первичное размещение акций на Нью-Йоркской бирже Nasdaq. По уровню доходов Яндекс значительно опережает все остальные российские
 
интернет-компании.
 
интернет-компании.
  
Строка 188: Строка 188:
 
Подробнее эти сервисы будут рассмотрены в следующих главах.
 
Подробнее эти сервисы будут рассмотрены в следующих главах.
  
This is exactly what I was looking for. Thanks for writgni!
+
==== Другие поисковые системы ====
 +
 
 +
''В числе поисковых систем для русскоязычной аудитории следует отметить:''
 +
 
 +
* '''Mail.ru''', использующую для поиска свои технологии в сочетании с технологиями Google;
 +
 
 +
* '''Rambler.ru''', который с июня 2011 года начал использовать механизмы поиска Яндекса и присоединился к его рекламной сети;
 +
 
 +
* '''Nigma.ru''', которая является поисковой системой с различными полезными наработками — табличным поиском, решением математических
 +
и химических задач, поиском музыкальных произведений, поиском по торрентам Поисковые системы, которые перестали развиваться, постепенно заменяют
 +
свои поисковые технологии альтернативными. Так, [http://www.aport.ru/ Аpоrt] и [http://www.rambler.ru/ Rambler] стали
 +
использовать поисковую технологию Яндекса, [http://www.altavista.com/ AltaVista] — технологию поиска [http://ru.yahoo.com/ Yahoo], а он, в свою очередь, — технологию [http://www.bing.com/ Bing].
 +
Помимо широко распространенных поисковых систем прямого назначения, существует большое количество специализированных, которые работают с
 +
тематическими запросами. Многие из них созданы для узконаправленного поиска различной медиаинформации: фильмов, музыки, фотографий и т.п.
 +
Среди специализированных поисковых систем можно отметить недавно созданную систему [http://solomono.ru/ Solomono.ru], осуществляющую поиск по внешним ссылкам доменов. Также к специализированным относятся следующие поисковики: [http://tagoo.ru/ Tagoo.ru] — поиск исключительно бесплатной музыки, [http://www.kinopoisk.ru/ Kinopoisk.ru] — поиск
 +
информации о фильмах.
  
 
=== Как устроены поисковые системы ===
 
=== Как устроены поисковые системы ===
Строка 205: Строка 220:
 
и высокой посещаемостью сервиса. Для примера, посещаемость только поиска Яндекса за сентябрь 2012 года составила 27,6 млн человек.
 
и высокой посещаемостью сервиса. Для примера, посещаемость только поиска Яндекса за сентябрь 2012 года составила 27,6 млн человек.
  
You Sir/Madam are the enemy of confusion evhwereyre!
+
==== Поисковые системы на логическом уровне ====
 +
 
 +
Когда пользователь хочет что-то найти, он вводит запрос. Его сначала обрабатывает «балансировщик нагрузки» — специализированное устройство,
 +
которое автоматически перенаправляет запрос пользователя в наименее загруженный на данный момент кластер. Это позволяет максимально эффективно использовать имеющиеся вычислительные мощности.
 +
 
 +
Затем поисковый запрос попадает в «метапоиск». Эта система получает все необходимые данные и узнает, к какому типу данных запрос относится. На этом же этапе запрос проверяется на орфографию. Также система определяет, из какого региона поступил запрос и стоит ли по нему показывать региональные сайты.
 +
 
 +
[[Файл:5673.png]]
 +
 
 +
Далее метапоиск проверяет, не было ли похожего запроса к системе в последнее время. Это связано с тем, что некоторые запросы становятся
 +
очень популярными в определенные моменты (значимое событие, катастрофа или даже рекламная кампания нового продукта), а другие популярны постоянно (например, связанные с социальными сетями). Чтобы снизить нагрузку, поисковая система некоторое время хранит ответы на запросы
 +
пользователей в кэше и в случае повторных обращений показывает уже готовые результаты, вместо того чтобы формировать ответы заново.
 +
Если при проверке не получилось найти уже готовый ответ в кэше, поисковая система начинает формирование нового ответа и запрос пользователя
 +
передается дальше, на серверы «базового поиска». Именно в базовом поиске находится индекс поисковой системы, разбитый на отдельные части
 +
и распределенный по серверам, поскольку поиск по частям всегда быстрее. Стоит обратить внимание, что каждый сервер имеет несколько копий. Это
 +
позволяет не только защитить информацию от потери, но и распределить нагрузку.
 +
 
 +
Если информация с конкретного сервера окажется слишком востребованной и один из серверов будет перегружен, проблема решится подключением копий этого сервера.
 +
 
 +
По результатам поиска каждый сервер базового поиска возвращает метапоиску результаты, связанные с запросом пользователя. Далее к работе
 +
подключается алгоритм ранжирования «Матрикснет», который и определяет, на каком месте в поисковой выдаче будет каждая конкретная ссылка.
  
 
=== Процессы поисковых систем ===
 
=== Процессы поисковых систем ===
Строка 307: Строка 342:
 
=== Процесс поиска связанной информации ===
 
=== Процесс поиска связанной информации ===
  
Чтобы понять, что именно ищет пользователь, поисковая система проводит тщательный лингвистический анализ запроса. Сначала определяется язык, на котором был сформулирован запрос. Например, в Яндексе индикатором языка является алфавит, используемый в запросе, а также характерные особенности сочетания букв, присущие различным языковым группам.
+
Чтобы понять, что именно ищет пользователь, поисковая система проводит
 
+
тщательный лингвистический анализ запроса. Сначала определяется язык, на
Далее проводится работа по трактовке морфологии. Поисковая система различает не только слова из запроса во всех их морфологических формах, но и синонимы, однако при ранжировании предпочтение отдается точному вхождению.
+
котором был сформулирован запрос. Например, в Яндексе индикатором языка
 
+
является алфавит, используемый в запросе, а также характерные особенности
Также поисковым системам приходится разграничивать омонимы (слова с одинаковым написанием, но разным значением). Например, одно и то жеслово может быть истолковано и как глагол, и как существительное.
+
сочетания букв, присущие различным языковым группам.
 
 
[[Файл:Info.png]]
 
  
Определиться с наиболее вероятным списком форм помогает статистика совместной встречаемости слов и грамматических признаков. Для сбора
+
Далее проводится работа по трактовке морфологии. Поисковая система
статистики Яндекс использует национальный корпус русского языка и свои собственные корпусы, в которых собрано огромнейшее количество текстов.
+
различает не только слова из запроса во всех их морфологических формах,
Следует отметить, что все действия по лингвистическому анализу запроса поисковая система успевает осуществить за доли секунды!
+
но и синонимы, однако при ранжировании предпочтение отдается точному
 +
вхождению.
 +
Также поисковым системам приходится разграничивать омонимы (слова с
 +
одинаковым написанием, но разным значением). Например, одно и то же
 +
слово может быть истолковано и как глагол, и как существительное.
  
В результате лингвистической обработки тот запрос, который вводит пользователь, и тот, который обрабатывается поисковой системой, сильно
+
Определиться с наиболее вероятным списком форм помогает статистика
 +
совместной встречаемости слов и грамматических признаков. Для сбора
 +
статистики Яндекс использует национальный корпус русского языка и свои
 +
собственные корпусы, в которых собрано огромнейшее количество текстов.
 +
Следует отметить, что все действия по лингвистическому анализу запроса
 +
поисковая система успевает осуществить за доли секунды!
 +
В результате лингвистической обработки тот запрос, который вводит
 +
пользователь, и тот, который обрабатывается поисковой системой, сильно
 
отличаются друг от друга.
 
отличаются друг от друга.
 +
Язык, на котором сформулированы запросы к поисковым машинам,
 +
называется информационно-поисковым языком, или языком поисковых
 +
запросов.
 +
Информационно-поисковый язык состоит из логических операторов,
 +
морфологии языка, регистра слов, префиксов обязательности,
 +
возможности учета расстояния между словами и расширенного поиска.
 +
Подобное представление запроса помогает быстрее ориентироваться в
 +
индексных базах.
  
Язык, на котором сформулированы запросы к поисковым машинам, называется информационно-поисковым языком, или языком поисковых запросов.
+
Набор команд языка запросов может изменяться в зависимости от
 
+
особенностей конкретной поисковой машины. Но есть определенные правила,
Информационно-поисковый язык состоит из логических операторов, морфологии языка, регистра слов, префиксов обязательности, возможности учета расстояния между словами и расширенного поиска.
+
которые используют все. Рассмотрим наиболее распространенные из них:
 
 
Подобное представление запроса помогает быстрее ориентироваться в индексных базах.
 
 
 
Набор команд языка запросов может изменяться в зависимости от особенностей конкретной поисковой машины. Но есть определенные правила, которые используют все. Рассмотрим наиболее распространенные из них:
 
  
  
  
  
1. '''Команды логического объединения и исключения'''.
+
1. Команды логического объединения и исключения.
Символы «+» и «-» в запросе позволяют добавлять или исключать какие-либо слова из текста. Слово, помеченное «+», будет обязательно присутствовать в документах, которые найдет поисковая система по запросу. Слово, помеченное «-», будет отсутствовать в выдаче.
+
Символы «+» и «-» в запросе позволяют добавлять или исключать какие-либо
 
+
слова из текста. Слово, помеченное «+», будет обязательно присутствовать
Команды «+» и «-» должны быть написаны слитно со словом, к которому они относятся. В противном случае поисковая машина начнет рассматривать их
+
в документах, которые найдет поисковая система по запросу. Слово,
 +
помеченное «-», будет отсутствовать в выдаче.
 +
Команды «+» и «-» должны быть написаны слитно со словом, к которому они
 +
относятся. В противном случае поисковая машина начнет рассматривать их
 
как элементы запроса, а не как команды.
 
как элементы запроса, а не как команды.
 +
2. «Логическое И» (обозначается как амперсанд (&)).
 +
Позволяет перечислить слова, которые обязательно должны встречаться
 +
в пределах одного предложения в искомом документе.
 +
3. «Логическое ИЛИ » (обозначается символом «|»).
 +
Дает возможность осуществлять поиск по документам, в тексте которых
 +
присутствует только одно из перечисленных слов.
  
2. '''«Логическое И» (обозначается как амперсанд (&))'''.
+
Если правило необходимо распространить не только на одно предложение,
Позволяет перечислить слова, которые обязательно должны встречаться в пределах одного предложения в искомом документе.
+
но и на весь документ, используется удвоение команды. Чтобы применить
 +
несколько команд в одном запросе, следует использовать символы
 +
открывающей и закрывающей скобки. Допускается комбинирование
 +
логических операторов и без использования скобок.
 +
Также поисковые системы могут производить поиск по точному вхождению.
 +
Для этого используются кавычки.
 +
Как правило, поисковые системы учитывают все словоформы исходного
 +
запроса согласно правилам русского языка. Поэтому в выдаче можно
 +
увидеть документы, в которых встречаются не только точные вхождения
 +
запроса, но и различные его формы. Для того чтобы осуществить поиск
 +
по точной словоформе, в Яндексе перед запросом необходимо поставить
 +
восклицательный знак. Если запрос состоит из 2 и более слов, можно
 +
использовать уже знакомые нам кавычки или поставить «!» перед скобками,
 +
в которых заключена фраза.
 +
Меняя местами слова в тексте запроса, можно заметить следующее: если
 +
слова располагаются в разных предложениях, в одном случае поисковая
 +
система не считает страницу со всеми словами в тексте релевантной запросу,
 +
а в другом случае считает. Расположение ключевых слов в тексте можно
 +
оценить, посмотрев сохраненную копию страницы из поисковой выдачи
 +
Яндекса. В ней подсвечиваются все учитывающиеся ключевики. Также Яндекс
 +
подсвечивает ключевые слова в сниппетах и заголовках страниц.
  
3. «'''Логическое ИЛИ » (обозначается символом «|»)'''.
+
Поисковые системы постоянно развиваются и, конечно, не ограничиваются
Дает возможность осуществлять поиск по документам, в тексте которых присутствует только одно из перечисленных слов.
+
поиском только по словам из запроса. Чтобы учесть все возможные варианты
 +
ответа на запрос пользователя, Яндекс расширяет исходный текст, введенный
 +
в строку поиска. Он добавляет другие формулировки с тем же значением
 +
и ведет поиск уже по новому запросу.
 +
Используя информационно-поисковый язык запросов, можно находить
 +
необходимую информацию за максимально короткое время. Знание языка
 +
запросов также дает возможность анализировать выдачу с различных сторон.
 +
Это помогает написать текст, который будет влиять на позиции и станет
 +
интересен пользователям.
  
Если правило необходимо распространить не только на одно предложение, но и на весь документ, используется удвоение команды. Чтобы применить
+
=== Поиск релевантной информации ===
несколько команд в одном запросе, следует использовать символы открывающей и закрывающей скобки. Допускается комбинирование логических операторов и без использования скобок. Также поисковые системы могут производить поиск по точному вхождению.Для этого используются кавычки.
 
  
Как правило, поисковые системы учитывают все словоформы исходного запроса согласно правилам русского языка. Поэтому в выдаче можно увидеть документы, в которых встречаются не только точные вхождения запроса, но и различные его формы. Для того чтобы осуществить поиск по точной словоформе, в Яндексе перед запросом необходимо поставить восклицательный знак. Если запрос состоит из 2 и более слов, можно использовать уже знакомые нам кавычки или поставить «!» перед скобками, в которых заключена фраза.
+
Сегодня почти невозможно придумать запрос, по которому поисковая система сможет найти менее 10 источников. Для большинства осмысленных запросов результат поиска — сотни, тысячи, миллионы страниц. Интернет растет, а следовательно, и страниц становится все больше. Поэтому основная цель поисковой системы — показать наиболее релевантную информацию, только те страницы, которые соответствуют запросу.
 
 
''Меняя местами слова в тексте запроса, можно заметить следующее:'' если слова располагаются в разных предложениях, в одном случае поисковая система не считает страницу со всеми словами в тексте релевантной запросу, а в другом случае считает. Расположение ключевых слов в тексте можно оценить, посмотрев сохраненную копию страницы из поисковой выдачи Яндекса. В ней подсвечиваются все учитывающиеся ключевики. Также Яндекс подсвечивает ключевые слова в сниппетах и заголовках страниц.
 
 
 
Поисковые системы постоянно развиваются и, конечно, не ограничиваются поиском только по словам из запроса. Чтобы учесть все возможные варианты ответа на запрос пользователя, Яндекс расширяет исходный текст, введенный в строку поиска. Он добавляет другие формулировки с тем же значением и ведет поиск уже по новому запросу.
 
 
 
Используя информационно-поисковый язык запросов, можно находить необходимую информацию за максимально короткое время. Знание языка запросов также дает возможность анализировать выдачу с различных сторон.
 
Это помогает написать текст, который будет влиять на позиции и станет интересен пользователям.
 
  
=== Поиск релевантной информации ===
+
==== Как происходит поиск релевантной информации? ====
  
Сегодня почти невозможно придумать запрос, по которому поисковая система сможет найти менее 10 источников. Для большинства осмысленных запросов результат поиска сотни, тысячи, миллионы страниц. Интернет растет, а следовательно, и страниц становится все больше. Поэтому основная цель поисковой системы — показать наиболее релевантную информацию, только те страницы, которые соответствуют запросу.
+
Сначала пользователь вводит запрос в поисковую строку. Роботы поисковой системы переформировывают запрос и осуществляют поиск в индексных
 +
базах, которые созданы при индексации сайтов. Все страницы, которые робот найдет по данному запросу, будут считаться релевантными. Заключительный шаг процесс ранжирования найденных страниц (выстраивание их в порядке убывания от наиболее релевантных к наименее релевантным).
 +
Отранжированный список сайтов, а точнее, ссылок на конкретные страницы сайта, будет показан на страницах результатов поиска.
  
Thanks for spending time on the computer (wgnriit) so others don't have to.
+
[[Файл:Search.png]]
  
 
==== Как определить релевантные запросы страницы на своем сайте? ====
 
==== Как определить релевантные запросы страницы на своем сайте? ====
Строка 482: Строка 561:
  
 
----
 
----
Источник http://www.ingate.ru/
+
http://www.ingate.ru/

Пожалуйста, учтите, что любой ваш вклад в проект «ЗАметки» может быть отредактирован или удалён другими участниками. Если вы не хотите, чтобы кто-либо изменял ваши тексты, не помещайте их сюда.
Вы также подтверждаете, что являетесь автором вносимых дополнений, или скопировали их из источника, допускающего свободное распространение и изменение своего содержимого (см. ЗАметки:Авторские права). НЕ РАЗМЕЩАЙТЕ БЕЗ РАЗРЕШЕНИЯ ОХРАНЯЕМЫЕ АВТОРСКИМ ПРАВОМ МАТЕРИАЛЫ!