Сейчас 127 заметки.
Редактирование: Поисковые системы
Материал из ЗАметки
Внимание! Вы не авторизовались на сайте. Ваш IP-адрес будет публично видимым, если вы будете вносить любые правки. Если вы войдёте или создадите учётную запись, правки вместо этого будут связаны с вашим именем пользователя, а также у вас появятся другие преимущества.
Правка может быть отменена. Пожалуйста, просмотрите сравнение версий, чтобы убедиться, что это именно те изменения, которые вас интересуют, и нажмите «Записать страницу», чтобы ваша отмена правки была сохранена.
Текущая версия | Ваш текст | ||
Строка 307: | Строка 307: | ||
=== Процесс поиска связанной информации === | === Процесс поиска связанной информации === | ||
− | Чтобы понять, что именно ищет пользователь, поисковая система проводит тщательный лингвистический анализ запроса. Сначала определяется язык, на котором был сформулирован запрос. Например, в Яндексе индикатором языка является алфавит, используемый в запросе, а также характерные особенности сочетания букв, присущие различным языковым группам. | + | Чтобы понять, что именно ищет пользователь, поисковая система проводит |
+ | тщательный лингвистический анализ запроса. Сначала определяется язык, на | ||
+ | котором был сформулирован запрос. Например, в Яндексе индикатором языка | ||
+ | является алфавит, используемый в запросе, а также характерные особенности | ||
+ | сочетания букв, присущие различным языковым группам. | ||
− | Далее проводится работа по трактовке морфологии. Поисковая система различает не только слова из запроса во всех их морфологических формах, но и синонимы, однако при ранжировании предпочтение отдается точному вхождению. | + | Далее проводится работа по трактовке морфологии. Поисковая система |
+ | различает не только слова из запроса во всех их морфологических формах, | ||
+ | но и синонимы, однако при ранжировании предпочтение отдается точному | ||
+ | вхождению. | ||
+ | Также поисковым системам приходится разграничивать омонимы (слова с | ||
+ | одинаковым написанием, но разным значением). Например, одно и то же | ||
+ | слово может быть истолковано и как глагол, и как существительное. | ||
− | + | Определиться с наиболее вероятным списком форм помогает статистика | |
− | + | совместной встречаемости слов и грамматических признаков. Для сбора | |
− | + | статистики Яндекс использует национальный корпус русского языка и свои | |
− | + | собственные корпусы, в которых собрано огромнейшее количество текстов. | |
− | Определиться с наиболее вероятным списком форм помогает статистика совместной встречаемости слов и грамматических признаков. Для сбора | + | Следует отметить, что все действия по лингвистическому анализу запроса |
− | статистики Яндекс использует национальный корпус русского языка и свои собственные корпусы, в которых собрано огромнейшее количество текстов. | + | поисковая система успевает осуществить за доли секунды! |
− | Следует отметить, что все действия по лингвистическому анализу запроса поисковая система успевает осуществить за доли секунды! | + | В результате лингвистической обработки тот запрос, который вводит |
− | + | пользователь, и тот, который обрабатывается поисковой системой, сильно | |
− | В результате лингвистической обработки тот запрос, который вводит пользователь, и тот, который обрабатывается поисковой системой, сильно | ||
отличаются друг от друга. | отличаются друг от друга. | ||
+ | Язык, на котором сформулированы запросы к поисковым машинам, | ||
+ | называется информационно-поисковым языком, или языком поисковых | ||
+ | запросов. | ||
+ | Информационно-поисковый язык состоит из логических операторов, | ||
+ | морфологии языка, регистра слов, префиксов обязательности, | ||
+ | возможности учета расстояния между словами и расширенного поиска. | ||
+ | Подобное представление запроса помогает быстрее ориентироваться в | ||
+ | индексных базах. | ||
− | + | Набор команд языка запросов может изменяться в зависимости от | |
− | + | особенностей конкретной поисковой машины. Но есть определенные правила, | |
− | + | которые используют все. Рассмотрим наиболее распространенные из них: | |
− | |||
− | |||
− | |||
− | Набор команд языка запросов может изменяться в зависимости от особенностей конкретной поисковой машины. Но есть определенные правила, которые используют все. Рассмотрим наиболее распространенные из них: | ||
− | |||
− | |||
− | |||
− | Команды «+» и «-» должны быть написаны слитно со словом, к которому они относятся. В противном случае поисковая машина начнет рассматривать их | + | 1. Команды логического объединения и исключения. |
+ | Символы «+» и «-» в запросе позволяют добавлять или исключать какие-либо | ||
+ | слова из текста. Слово, помеченное «+», будет обязательно присутствовать | ||
+ | в документах, которые найдет поисковая система по запросу. Слово, | ||
+ | помеченное «-», будет отсутствовать в выдаче. | ||
+ | Команды «+» и «-» должны быть написаны слитно со словом, к которому они | ||
+ | относятся. В противном случае поисковая машина начнет рассматривать их | ||
как элементы запроса, а не как команды. | как элементы запроса, а не как команды. | ||
+ | 2. «Логическое И» (обозначается как амперсанд (&)). | ||
+ | Позволяет перечислить слова, которые обязательно должны встречаться | ||
+ | в пределах одного предложения в искомом документе. | ||
+ | 3. «Логическое ИЛИ » (обозначается символом «|»). | ||
+ | Дает возможность осуществлять поиск по документам, в тексте которых | ||
+ | присутствует только одно из перечисленных слов. | ||
− | + | Если правило необходимо распространить не только на одно предложение, | |
− | + | но и на весь документ, используется удвоение команды. Чтобы применить | |
− | + | несколько команд в одном запросе, следует использовать символы | |
− | + | открывающей и закрывающей скобки. Допускается комбинирование | |
− | + | логических операторов и без использования скобок. | |
− | + | Также поисковые системы могут производить поиск по точному вхождению. | |
− | Если правило необходимо распространить не только на одно предложение, но и на весь документ, используется удвоение команды. Чтобы применить | + | Для этого используются кавычки. |
− | несколько команд в одном запросе, следует использовать символы открывающей и закрывающей скобки. Допускается комбинирование логических операторов и без использования скобок. Также поисковые системы могут производить поиск по точному вхождению.Для этого используются кавычки. | + | Как правило, поисковые системы учитывают все словоформы исходного |
− | + | запроса согласно правилам русского языка. Поэтому в выдаче можно | |
− | Как правило, поисковые системы учитывают все словоформы исходного запроса согласно правилам русского языка. Поэтому в выдаче можно увидеть документы, в которых встречаются не только точные вхождения запроса, но и различные его формы. Для того чтобы осуществить поиск по точной словоформе, в Яндексе перед запросом необходимо поставить восклицательный знак. Если запрос состоит из 2 и более слов, можно использовать уже знакомые нам кавычки или поставить «!» перед скобками, в которых заключена фраза. | + | увидеть документы, в которых встречаются не только точные вхождения |
− | + | запроса, но и различные его формы. Для того чтобы осуществить поиск | |
− | + | по точной словоформе, в Яндексе перед запросом необходимо поставить | |
− | + | восклицательный знак. Если запрос состоит из 2 и более слов, можно | |
− | + | использовать уже знакомые нам кавычки или поставить «!» перед скобками, | |
+ | в которых заключена фраза. | ||
+ | Меняя местами слова в тексте запроса, можно заметить следующее: если | ||
+ | слова располагаются в разных предложениях, в одном случае поисковая | ||
+ | система не считает страницу со всеми словами в тексте релевантной запросу, | ||
+ | а в другом случае считает. Расположение ключевых слов в тексте можно | ||
+ | оценить, посмотрев сохраненную копию страницы из поисковой выдачи | ||
+ | Яндекса. В ней подсвечиваются все учитывающиеся ключевики. Также Яндекс | ||
+ | подсвечивает ключевые слова в сниппетах и заголовках страниц. | ||
− | Используя информационно-поисковый язык запросов, можно находить необходимую информацию за максимально короткое время. Знание языка запросов также дает возможность анализировать выдачу с различных сторон. | + | Поисковые системы постоянно развиваются и, конечно, не ограничиваются |
− | Это помогает написать текст, который будет влиять на позиции и станет интересен пользователям. | + | поиском только по словам из запроса. Чтобы учесть все возможные варианты |
+ | ответа на запрос пользователя, Яндекс расширяет исходный текст, введенный | ||
+ | в строку поиска. Он добавляет другие формулировки с тем же значением | ||
+ | и ведет поиск уже по новому запросу. | ||
+ | Используя информационно-поисковый язык запросов, можно находить | ||
+ | необходимую информацию за максимально короткое время. Знание языка | ||
+ | запросов также дает возможность анализировать выдачу с различных сторон. | ||
+ | Это помогает написать текст, который будет влиять на позиции и станет | ||
+ | интересен пользователям. | ||
=== Поиск релевантной информации === | === Поиск релевантной информации === |