Реферат: Язык запросов русскоязычных поисковых систем

Название: Язык запросов русскоязычных поисковых систем
Раздел: Рефераты по информатике
Тип: реферат

Реферат подготовила ученица 11 класса Зимина Марина

МОУ Коробовская СОШ

Управления образования Администрации Шатурского района Московской области

2005 год

Введение.

При проведении поиска информации в службе www, когда тема задана достаточно широко, целесообразно использовать поисковые каталоги и поисковые указатели. Знание основных понятий и терминов позволяет провести углубленный поиск с применением ключевых слов, наиболее точно характеризующих искомую тему. При этом следует различать приемы простого, расширенного и контекстного поиска.

Под простым поиском понимается поиск Web-ресурсов по ключевому слову. Недостаток этого вида поиска заключается в том, что обычно он выдает слишком много документов, причем наряду с ценной информацией попадается много «мусора».

При использовании расширенного поиска ключевые слова связываются между собою операторами логических отношений(так называемый язык запросов). При помощи логических отношений поисковое задание формулируется так, чтобы более точно детализировать задание и ограничить область отбора.

Контекстный поиск – это поиск по точной фразе. К сожалению доступен не во всех поисковых системах. К тому же эта операции достаточно медленная.

Язык запросов – язык манипулирования данными, позволяющий описывать условия поиска информации, не задавая для этого последовательность действий, нужных для получения ответа.

Порядок действий логических операторов: сначала выполняются действия в скобках ( ), потом операторы AND, NOT и лишь потом OR.

В разных поисковых системах используются различные приемы связывания между собой ключевых слов при помощи логических операторов. В дальнейшем будут приведены правила построения запросов в трех наиболее распространенных русскоязычных системах.

Язык запросов в поисковой системе РАМБЛЕР [1]

Написано Результат поиска Примечания и примеры
идти Все формы по правилам русского языка найдётся идти, идёт, шёл, шла и т.д.
Регистр (shift) Если подряд идёт не менее чем два, три или четыре слова с большой буквы, то будет производиться только по имени собственному ДОМ и дом, nOt и Not воспринимаются одинаково

слово1 пробел слово 2

слово 1 & слово 2

слово 1 AND слово 2

Будут найдены все документы, где в одном предложении есть оба слова

машина самолёт

машина & самолёт

машина AND самолёт

Слово 1 or слово 2

Слово 1 | слово 2

Будут найдены документы, содержащие или одно слово, или другое

самолёт or аэродром

самолет | аэродром

Слово 1 not слово 2

Слово 1! слово 2

Будут найдены документы, содержащие первое слово, но без второго

машина not самолёт

машина! самолёт

" " Слова, заключенные в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они указаны в запросе* самолёт "заправился" посадка не будет найдено: самолёт совершил посадку, чтобы заправиться
(X,Y) Будут найдены документы, в которых расстояние между словами не более Х слов (2,красная армия) между словами не стоит ни одного слова, поскольку лишь в случае непосредственного их соседства разница в порядковых номерах слов меньше 2, по умолчанию максимальное расстояние – 40 слов

Оформление запросов в поисковой системе Яндекс [2]

Написано Результат поиска Примечания и примеры
идти Все формы по правилам русского языка найдётся идти, идёт, шёл, шла и т.д.

Путина

путина

Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы, в противном случае будут найдены как слова с большой, так и с маленькой буквы по запросу ‘путина’ найдется и президент, и сезон интенсивного рыболовства. А по запросу ‘Путина’ – президент и те случаи рыболовного сезона, когда он написан с большой буквы.

слово 1 && слово 2

слово 1 & слово 2

+слово 1 +слово 2

Будут найдены документы, в которых есть оба слова

лечебная & физкультура

+лечебная +физкультура

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

слово 1 ~~ слово 2

слово 1 ~ слово 2

слово 1 –слово 2

Будут найдены документы с первым словом, но без второго

руководство Visual C ~~ цена

рак -гороскоп

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

именно знак минус, а не тире и не дефис через пробел от предыдущего и слитно с последующим словом

слово 1 пробел слово 2 пробел слово 3 Будет найдено много документов с этими словами

частные объявления продажа

велосипедов

несколько слов, разделённые пробелами, означают, что все они должны входить в одно предложение искомого документа

слово 1 | слово 2 Будут найдены документы либо с первым словом, либо со вторым фото | фотография
Таблица «Оформление запросов в поисковой системе «Яндекс» (продолжение)
" " Будут найдены документы, в которых слова, заключенные в кавычки, идут подряд

"красная шапочка"

контекст "а шапочка у неё была красная" найден не будет

!слово Будут найдены документы, содержащие это слово !Лужкову
слово 1 /число слово 2 Будут найдены документы, в которых первое слово находится на расстоянии заданного числа от второго

поставщики /2 кофе

найдутся "поставщики колумбийского кофе", "поставщики кофе из Колумбии" и т.д.

слово 1 /(+n –n)

слово 2

Будут найдены документы, в которых известны расстояния между словами

+n – это минимальное число слов, а –n – максимальное

музыкальное /(-2 4) образование

музыкальное должно находиться от образования в интервале от 2 слов слева до 4 слов справа

если знаки ограничения стоят после двойных операторов, то употреблённые там числа – это расстояние не в словах, а в предложениях

$title X Будут найдены документы с заголовком Х

$title Comp Tek

ищет в заголовках документов слово Comp Tek

$anchor (X | Y) Будут найдены документы, в ссылках которых есть одно из слов Х или Y

$anchor (Comp Tek | Dialogic)

#url="www.X.ru" Ограничить поиск информации сервером Х

Comp Tek

#url=www.comptek.ru

упоминание компании Comp Tek на сервере www.comptek.ru и в адресах начинающихся с данной последовательности символов

#linkl="http://www.x.ru/*" Будут найдены документы, содержащие ссылки на определённые URL

#linkl=www.comptek.ru*

найдутся документы, которые сослались на сервер компании

#image="X*" Будут найдены документы, содержащие ссылки на документы с изображениями Х

#image="tort*"

найдутся ссылки на документы с изображением тортов

возможно, найдётся и портрет черепахи Тортиллы

#hint=(X) Будут найдены документы, содержащие изображение с подписью Х

#hint=(кино)

документы, содержащие изображение с подписью кино

Таблица. «Оформление запросов в поисковой системе Яндекс» (окончание)

#keywords=(X Y Z)

#abstrakt=(X Y Z)

Будут найдены документы по ключевым словам и аннотациям X Y Z keywords – краткое описание содержания страницы. Эта служебная информация и она не видима на странице
Х <- Y Будут найдены документы, содержащие слова Х и Y, при этом будут выданы первыми документы, содержащие слово Y

компьютер <- телефон

первыми будут выданы документы, содержащие слово телефон

Оформление запросов в поисковой системе Апорт [3]

Написано Результат поиска Примечания и примеры
идти

Все формы по правилам

русского языка

найдётся идти, идёт, шёл,

шла и т.д.

Регистр(shift) Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы красная площадь

слово 1 AND слово 2

слово 1 + слово 2

слово 1 и слово 2

слово 1 & слово 2

Будут найдены документы, в которых есть оба слова

лечебная & физкультура

лечебная и физкультура

лечебная + физкультура

лечебная AND физкультура

слово 1оr слово 2

слово 1│ слово 2

слово 1 или слово 2

Будут найдены документы, содержащие любое из указанных слов или оба слова одновременно фото | фотография

слово 1 не слово 2

слово 1 not слово 2

слово 1 - слово 2

Будут найдены документы с первым словом, но без второго

рак - гороскоп

рак не гороскоп

рак not гороскоп

” ” Будут найдены документы с данными словосочетанием или близкое к нему

”яблоки на снегу ”

будут найдены ”яблоки на снегу”, ”яблоки и снег”, ”яблокам под снегом”, ”яблоко снег”

слХ(слова)

сХ(слова)

wX(слова)

[Х, слова]

Будут найдены документы, где между словами стоит не более двух других слов

сл5(папа мама сын)

между словами ”папа”, ”мама” и ”сын” стоит не более двух других слов, т.е. общее число слов во фрагменте не более 5

Таблица «Оформление запросов в поисковой системе Апорт» (продолжение)

url:

url=

Ограничение поиска одним или несколькими серверами, или даже частью сервера

url=www.intel.ru

документы, на сервере www.intel.ru. В случайном порядке

url=www.intel.ru & soft & условия

все документы, сервера www.intel.ru, содержащие слова ”soft” и ”условия”

url=www.intel.ru/soft/*

все документы, на сервере www.intel.ru в каталоге soft и его подкаталогах

url=*.agama.com

все документы, на серверах www.agama.com, russia.agama.com и т.д.

дата:

дата=

date=

date:

Поиск по датам

папа дата=01/01/97-01/02/97

документы, содержащие слово папа, и имеющие дату от 1 января 1997 года до 1 февраля 1997 года

date=01/01/97 папа

документы, содержащие слово папа, и имеющие дату 1 января 1997 года

дата:<01/02/97 папа

дата:-01/02/97 папа

все документы, содержащие слово папа, и имеющие дату не позже 1 февраля 1997 года

title=

t=

title( )

заг=

з=

Поиск в заголовках

title(папа │мама)

будут найдены документы, содержащие в заголовке слово папа или слово мама, или оба одновременно

перед круглыми скоками знак равенства можно опустить

keywords=

kw=

клсл=

кл=

Поиск в поле МЕТА KEYWORDS

kw(папа мама)

будут найдены документы, для которых автор в ключевых словах указал оба слова: папа и мама

Таблица «Оформление запросов в поисковой системе Апорт» (окончание)

alt=

a=

рис=

р=

Поиск в комментариях к картинкам

alt=(Билл Гейтс)

документы, в которых есть картинка с комментарием, содержащим как минимум два слова: Билл и Гейтс

anchor= Поиск в тексте ссылок

anchor=(ненавижу Интернет)

документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и Интернет

description= Поиск в тексте описаний сайтов и в поле DESRIPTION

description=(”уксусная кислота”)

будут найдены корневые документы сайтов, в тексте описаний которых встречается словосочетание уксусная кислота

text=(оглавление или содержание)

x=(оглавление или содержание)

текст=(оглавление или содержание)

т=(оглавление или содержание)

Поиск в обычном тексте.

Будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа

текст=(Последний звонок)
* Произвольное число любых букв

зелен*

найдутся: зеленка, зелень, зеленый, Зеленоград

!слово Будут найдены документы, содержащие это слово !Лужкову

Список литературы

1. http://www.rambler.ru/doc

2. http://www.yandex.ru/info/syntax

3. http://www.glossary.ru