Реферат: Поиск информации в www
t: solar system
Система Lycos разыскивает заголовки только в режиме расширенного поиска.
Поисковая система Aport 2000 имеет несколько альтернативных команд для поиска заголовков. Основная команда — title = . Примеры:
title = Солнечная система
t = Солнечная система
заг = Солнечная система
з = Солнечная система В поисковой системе Япс1ех команда поиска в заголовке записывается так:
$title (Солнечная система) а в поисковой системе Rambler — похоже, но без скобок, через двоеточие:
$title:Солнечная система
Поиск Web-узлов
Сам по себе поиск Web-узлов используется достаточно редко, но команды этого поиска часто применяют для сокращения числа ссылок, возвращенных другими методами и ограничения их одним Web-узлом или, наоборот, исключения некоего Web-узла из результатов поиска.
Одной из команд такого поиска является команда host:.Например, на поисковой системе Alta Vista команда host: microsoft.ru разыщет все Web-страницы, принадлежащие доменному имени mycrosoft.ru.
Эту команду обычно комбинируют с другими. Если, например, нас интересуют планеты солнечной системы, но мы уже сыты по горло трудами Национального управления по исследованию космического пространства
США (NASA), то сервер NASA можно исключить из поиска командой:
+solar + system -host: nasa .:
В команду можно включать не полное доменное имя сервера, а только его часть, например только имя домена. Так, если мы хотим обыскать только российские серверы, то можно использовать имя домена ru, например:
+cookies +host: ru
По этой команде мы узнаем, что пишут о маркерах cookies на российских Web-узлах.
Не все поисковые системы позволяют проводить поиск по Web-узлам, да
и команда поиска у них может быть различной. Вот список систем, которые такой поиск выполняют:
Alta Vista host:
Hot Bot domain:
& f InfoSeek site:
MSN Search domain:
GoTo domain:
Snap domain:
Поисковая система Lycos выполняет поиск Web-узлов только в режиме расширенного поиска.
Поиск URL-адресов
Этот поиск очень похож на поиск Web-узлов. Суть и смысл его те же, только Команда другая — uri:. Эту команду поддерживают следующие поисковые службы:
AltaVista Infoseek
Northern Light
Поисковый каталог Yahoo! использует команду u:, а система Lycos реализует поиск URL-адресов с помощью команд расширенного режима. В России поисковая система Яndex использует команду #url=, после которой следует записать URL-адрес в кавычках. Поисковая система Апорт 2000 , обходится более простым синтаксисом, например url=www.intel.ru, а в поисковой системе Rambler команда должна начинаться с символа <$>, например так:
$uri: www.intel.ru
Поиск ссылок
Поиск ссылок бывает полезен владельцам Web-страниц и Web-мастерам. Он позволяет, к примеру, количественно оценить динамику популярности своей страницы регулярным контролем числа ссылок, которые к ней ведут. Типовая команда для такого поиска — link:.
Например, команда link: http://www.mywebsite.com/mypage/index.htm позволит выявить ссылки, которые ведут к титульной странице index, htm на Web-узле mypage, размещенном на Web-сервере www.mywebsite.com.
Команду link: поддерживают следующие поисковые службы:
AltaVista Infoseek Google
Некоторые поисковые службы поддерживают команду linkpage:
GoTo HotBot S MSN Search Snap
Как обычно, российские поисковые системы имеют свои особенности. Например. Апорт 2000 поддерживает четыре разных представления команды:
Link=
L=
Ссылка=
Сс=
Система Яndex поддерживает команду #link:, после которой адрес ссылки должен записываться в кавычках.
Средства расширенного поиска
Выше мы рассмотрели лишь десять методов формулирования задания на поиск, однако их достаточно для проведения 90% поисковых работ в 90% поисковых служб. Все рассмотренные выше методы являются методами простого поиска. Кроме средства простого поиска обычно поисковые службы предоставляют средства расширенного поиска. Эти средства позволяют более точно формулировать поисковое задание, но требуют определенного опыта и работают заметно медленнее. В большинстве поисковых систем команды расширенного поиска формируются с помощью логических команд и рассчитаны на профессионалов. Удобство использования логических команд в частности связано с тем, что команды простого поиска у многих поисковых систем реализованы по-разному. Каждая система стремится сделать средства простого поиска наиболее удобными, а средства расширенного поиска — наиболее стандартными.
Команда OR
Логическая команда OR (ИЛИ) служит для формирования поискового задания, состоящего из нескольких ключевых слов, если надо, чтобы разыскиваемый документ содержал любые из этих слов в любой комбинации. Например, по команде solutions OR hints будут разысканы Web-страницы, содержащие решения к компьютерным играм (solutions) или подсказки к ним (hints).
Команду OR поддерживают абсолютное большинство основных поисковых служб, за исключением следующих:
Google Infoseek LookSmart Yahoo!
Службы Infoseek, LookSmart и Yahoo! по умолчанию выполняют поиск по принципу ИЛИ, если через пробел задано несколько ключевых слов, и поэтому нс нуждаются в этой команде. Лишь поисковая система Google вообще не имеет таких средств.
«Апорт 2000» позволяет использовать как английское ключевое слово OR, так н русское ИЛИ. Можно также использовать знак « | ». Система Rambler использует или слово OR, или знак « | », а система Яndeх — только знак « | ».
Команда AND
Логическая команда AND (И) служит для формирования поискового задания, когда надо, чтобы разыскиваемый документ содержал одновременно все слова, введенные пользователем. Это аналог команды «+» простого поиска. Например, по команде свет AND луч будут разысканы все Web-страницы, содержащие оба эти слова.
Команду AND поддерживают абсолютное большинство основных поисковых служб, за исключением следующих, которые используют знак «+»:
Google Infoseek LookSmart Yahoo!
Апорт 2000 позволяет использовать как английское ключевое слово AND, так и русское И, а также знаки «&» и «+». Система Rambler использует ключевое слово AND или знак «&», а система Япс1ех — знак «&» или пробел, если требуется одновременное присутствие слов в одном предложении, или пару знаков «&&», если требуется одновременное присутствие слов во всем документе.
Команда NOT
Логической командой NOT (HE) устанавливают исключения из результатов поиска, то есть это аналог рассмотренной выше команды простого поиска <• - ». Эту команду поддерживает большинство служб, за исключением:
Google Infoseek LookSmart Yahoo!
Системы AltaVista, Excite, Snap требуют специальной формы записи этой команды: вместо NOT в них следует давать команду AND NOT.
Наряду с командой NOT в системе Апорт 2000 разрешается использовать команду «НЕ», а в системе Rambler — команду «!». Интересна особенность системы Яndех. Она реализует логическую команду И НЕ, которая записывается значком «~», если относится к одному предложению и парой значков «~~», если относится ко всему документу.
Команда NEAR
Это одна из самых удобных команд расширенного поиска. Она позволяет совместить достоинства поиска по ключевым словам и контекстного поиска при глубоком поиске самые лучшие результаты возвращаются с помощью этой команды. Пример: поисковая команда Quake NEAR hints позволит разыскать документы, в которых присутствуют слова Quake и hints одновременна причем находятся поблизости друг от друга.
К сожалению, редкие поисковые службы поддерживают поиск с помощью команды NEAR. При этом у разных служб разное представление о том, что значит «близкое» размещение слов друг к другу:
AltaVista (в пределах 10 слов, жестко); Lycos (в пределах 25 слов, гибко); WebCrawler (в пределах 2 слов, гибко);
И Lycos, и WebCrawler позволяют управлять размером интервала, в котором разыскиваются ключевые слова. Для этого команду NEAR задают(параметром /#. Например, команда ночь NEAR/10 река позволит разыскат произведения, в которых есть описание реки ночью, если слова ночь и река отстоят друг от друга не более, чем на десять слов.
В российской поисковой системе Rambler аналогичная команда начинается со знака «$» и заканчивается двоеточием ($NEAR:). В поисковой системе Апорт 2000 расстояние между словами задается командой СЛ# (..., ..., ...), где вместо знака « # » следует подставить цифру или число, обозначающее предельное расстояние, а вместо многоточий — список ключевых слов. В поисковой системе Яndех расстояние задается в круглых скобках после дробной черты. При этом указать расстояния можно как «вперед», так и «назад» :
средство поиск/ (-2 4)
Такая команда позволит разыскать на только средства расширенного поиска, но и поисковые средства.
Вложение команд
Вложение команд позволяет создавать весьма сложные запросы. Оно выполняется с помощью круглых скобок ( ). Команда, стоящая в скобках, выполняется в первую очередь. Рассмотрим пример поиска решений или подсказок к компьютерной игре Diablo:
Страницы: 1, 2, 3, 4, 5, 6, 7, 8