Сейчас 127 заметки.
Редактирование: Поисковые системы
Материал из ЗАметки
Внимание! Вы не авторизовались на сайте. Ваш IP-адрес будет публично видимым, если вы будете вносить любые правки. Если вы войдёте или создадите учётную запись, правки вместо этого будут связаны с вашим именем пользователя, а также у вас появятся другие преимущества.
Правка может быть отменена. Пожалуйста, просмотрите сравнение версий, чтобы убедиться, что это именно те изменения, которые вас интересуют, и нажмите «Записать страницу», чтобы ваша отмена правки была сохранена.
Текущая версия | Ваш текст | ||
Строка 20: | Строка 20: | ||
==== Контекстная реклама ==== | ==== Контекстная реклама ==== | ||
− | Контекстная реклама — это короткое текстовое объявление, которое размещается в выдаче поисковой | + | Контекстная реклама — это короткое текстовое объявление, которое размещается в выдаче поисковой сист емы и показывается пользователю только если он ввел в строку поиска запрос, соответствующий тематике данного объявления. |
[[Файл:Contex.png]] | [[Файл:Contex.png]] | ||
Строка 188: | Строка 188: | ||
Подробнее эти сервисы будут рассмотрены в следующих главах. | Подробнее эти сервисы будут рассмотрены в следующих главах. | ||
− | + | ==== Другие поисковые системы ==== | |
+ | |||
+ | ''В числе поисковых систем для русскоязычной аудитории следует отметить:'' | ||
+ | |||
+ | * '''Mail.ru''', использующую для поиска свои технологии в сочетании с технологиями Google; | ||
+ | |||
+ | * '''Rambler.ru''', который с июня 2011 года начал использовать механизмы поиска Яндекса и присоединился к его рекламной сети; | ||
+ | |||
+ | * '''Nigma.ru''', которая является поисковой системой с различными полезными наработками — табличным поиском, решением математических | ||
+ | и химических задач, поиском музыкальных произведений, поиском по торрентам Поисковые системы, которые перестали развиваться, постепенно заменяют | ||
+ | свои поисковые технологии альтернативными. Так, [http://www.aport.ru/ Аpоrt] и [http://www.rambler.ru/ Rambler] стали | ||
+ | использовать поисковую технологию Яндекса, [http://www.altavista.com/ AltaVista] — технологию поиска [http://ru.yahoo.com/ Yahoo], а он, в свою очередь, — технологию [http://www.bing.com/ Bing]. | ||
+ | Помимо широко распространенных поисковых систем прямого назначения, существует большое количество специализированных, которые работают с | ||
+ | тематическими запросами. Многие из них созданы для узконаправленного поиска различной медиаинформации: фильмов, музыки, фотографий и т.п. | ||
+ | Среди специализированных поисковых систем можно отметить недавно созданную систему [http://solomono.ru/ Solomono.ru], осуществляющую поиск по внешним ссылкам доменов. Также к специализированным относятся следующие поисковики: [http://tagoo.ru/ Tagoo.ru] — поиск исключительно бесплатной музыки, [http://www.kinopoisk.ru/ Kinopoisk.ru] — поиск | ||
+ | информации о фильмах. | ||
=== Как устроены поисковые системы === | === Как устроены поисковые системы === | ||
Строка 205: | Строка 220: | ||
и высокой посещаемостью сервиса. Для примера, посещаемость только поиска Яндекса за сентябрь 2012 года составила 27,6 млн человек. | и высокой посещаемостью сервиса. Для примера, посещаемость только поиска Яндекса за сентябрь 2012 года составила 27,6 млн человек. | ||
− | + | ==== Поисковые системы на логическом уровне ==== | |
+ | |||
+ | Когда пользователь хочет что-то найти, он вводит запрос. Его сначала обрабатывает «балансировщик нагрузки» — специализированное устройство, | ||
+ | которое автоматически перенаправляет запрос пользователя в наименее загруженный на данный момент кластер. Это позволяет максимально эффективно использовать имеющиеся вычислительные мощности. | ||
+ | |||
+ | Затем поисковый запрос попадает в «метапоиск». Эта система получает все необходимые данные и узнает, к какому типу данных запрос относится. На этом же этапе запрос проверяется на орфографию. Также система определяет, из какого региона поступил запрос и стоит ли по нему показывать региональные сайты. | ||
+ | |||
+ | [[Файл:5673.png]] | ||
+ | |||
+ | Далее метапоиск проверяет, не было ли похожего запроса к системе в последнее время. Это связано с тем, что некоторые запросы становятся | ||
+ | очень популярными в определенные моменты (значимое событие, катастрофа или даже рекламная кампания нового продукта), а другие популярны постоянно (например, связанные с социальными сетями). Чтобы снизить нагрузку, поисковая система некоторое время хранит ответы на запросы | ||
+ | пользователей в кэше и в случае повторных обращений показывает уже готовые результаты, вместо того чтобы формировать ответы заново. | ||
+ | Если при проверке не получилось найти уже готовый ответ в кэше, поисковая система начинает формирование нового ответа и запрос пользователя | ||
+ | передается дальше, на серверы «базового поиска». Именно в базовом поиске находится индекс поисковой системы, разбитый на отдельные части | ||
+ | и распределенный по серверам, поскольку поиск по частям всегда быстрее. Стоит обратить внимание, что каждый сервер имеет несколько копий. Это | ||
+ | позволяет не только защитить информацию от потери, но и распределить нагрузку. | ||
+ | |||
+ | Если информация с конкретного сервера окажется слишком востребованной и один из серверов будет перегружен, проблема решится подключением копий этого сервера. | ||
+ | |||
+ | По результатам поиска каждый сервер базового поиска возвращает метапоиску результаты, связанные с запросом пользователя. Далее к работе | ||
+ | подключается алгоритм ранжирования «Матрикснет», который и определяет, на каком месте в поисковой выдаче будет каждая конкретная ссылка. | ||
=== Процессы поисковых систем === | === Процессы поисковых систем === | ||
Строка 361: | Строка 396: | ||
Сегодня почти невозможно придумать запрос, по которому поисковая система сможет найти менее 10 источников. Для большинства осмысленных запросов результат поиска — сотни, тысячи, миллионы страниц. Интернет растет, а следовательно, и страниц становится все больше. Поэтому основная цель поисковой системы — показать наиболее релевантную информацию, только те страницы, которые соответствуют запросу. | Сегодня почти невозможно придумать запрос, по которому поисковая система сможет найти менее 10 источников. Для большинства осмысленных запросов результат поиска — сотни, тысячи, миллионы страниц. Интернет растет, а следовательно, и страниц становится все больше. Поэтому основная цель поисковой системы — показать наиболее релевантную информацию, только те страницы, которые соответствуют запросу. | ||
− | + | ==== Как происходит поиск релевантной информации? ==== | |
+ | |||
+ | Сначала пользователь вводит запрос в поисковую строку. Роботы поисковой системы переформировывают запрос и осуществляют поиск в индексных | ||
+ | базах, которые созданы при индексации сайтов. Все страницы, которые робот найдет по данному запросу, будут считаться релевантными. Заключительный шаг — процесс ранжирования найденных страниц (выстраивание их в порядке убывания от наиболее релевантных к наименее релевантным). | ||
+ | Отранжированный список сайтов, а точнее, ссылок на конкретные страницы сайта, будет показан на страницах результатов поиска. | ||
+ | |||
+ | [[Файл:Search.png]] | ||
==== Как определить релевантные запросы страницы на своем сайте? ==== | ==== Как определить релевантные запросы страницы на своем сайте? ==== | ||
Строка 482: | Строка 523: | ||
---- | ---- | ||
− | + | http://www.ingate.ru/ |