Например интересует какая то тема...
Вопрос...
Человек набирает текст...
И вот вопрос в том, КАК происходит поиск?
По тегам, или по совпадению слов в набранном им тексте?
На эту тему, вообще-то, целые лекции читают. Не содержащие ничего, кроме ответа на вопрос "как происходит поиск?".:)
Если интересно, можно посмотреть здесь: http://tech.yandex.ru/education/m/shad/
На эту лекцию, например, я даже ходила ногами: http://tech.yandex.ru/education/m/shad/talks/894/
Ну а если своими словами и очень кратко -- сайты интернета индексируются, то есть заносятся в список, непосредственно по которому происходит поиск; все слова на интернет-страничках приводятся к начальной форме (если мне память не изменяет, в качестве оной вообще берётся только основа слова, но не суть), слова запроса тоже приводятся к начальной форме (причём иногда бывает по несколько вариантов -- рассматриваются все) и начинается сравнение со страницами из индекса на предмет совпадения.
После анализа вопроса происходит поиск информации. Все играет роль.
Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).
Тэги, в которых эти слова располагаются.
Местоположение искомых слов в документе. Расстояние между словами.
Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа. Время — как долго страница находится в базе поискового сервера.
Индекс цитирования — как много ссылок на данную страницу ведет с других страниц.
Смысловой контент-анализ, выполненный при помощи нейронной сети.
Причем сразу же определяется степень релевантности запросу пользователя, выраженная в процентной форме.
Добавить комментарий