Это такой инструмент, который помогает искать информацию в сети Интернет - umotnas.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Это такой инструмент, который помогает искать информацию в сети Интернет - страница №1/1

Поисковая система (ПС) - это такой инструмент, который помогает искать информацию в сети Интернет.

Поисковых систем в Интернете очень много (несколько тысяч и даже больше), каждая из них основана на своем алгоритме и тематике поиска. Например, существуют ПС, область поиска которых музыкальные файлы, или же производят поиск вакансий для ищущих работу, медицинские, новостные, связанные с недвижимостью и так далее.

Также можно посмотреть определение поисковой системы на Википедии.

Поисковая система (ПС) — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс системы. Программной частью поисковой системы является поисковая машина — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.

Одним из первых инструментов поиска в интернете (до Всемирной паутины) был Archie.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.

Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины «Рамблер» и «Апорт». 23 сентября 1997 была открыта поисковая машина Яндекс.

В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[2] с визуальной кластеризацией.

Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.



Все поисковые системы условно можно разбить на три больших класса:

  1. Поисковые машины (анг. - search engines). Иначе их еще называют программы - червяки и программы - пауки. Такие программы ползают от одного сайта к другому методично индексируя контент. Все, что находит такой червяк попадает в базу данных, куда любой пользователь может обратиться с запросом. Достоинство таких программ обширная база данных - практически вся сеть. Недостаток - это то, что в ответ на любой запрос вы получаете тысячи адресов веб-страниц.

  2. Веб-каталоги или поисковые порталы (directories). Информация в них организуется в виде древовидной структуры, обычно по тематическому признаку и в соответствии с рейтингом. Адреса и описания веб-сайтов заносятся в каталог по заявке. Записи редактируются вручную web-мастером, модератором. Во многие каталоги попасть трудно, некоторые эту услугу делают платной. стремление хозяев сайтов попасть в любой каталог (чем больше, тем лучше) вызвано желанием разместить свою ссылку на чужом сайте и следовательно повысить рейтинг в метапоисковых системах о чем будет сказано ниже. Если вы стремитесь увеличить количество посетителей на своем сайте, то выбирайте такой каталог в котором вас будет видно. Эффект от размещения ссылки в небольшом каталоге и при наличии интересного контента может оказаться довольно высоким, т.к. с таких сайтов посетители уходят в основном по какой-нибудь ссылке. Тем не менее регистрация в таких каталогах как Yahoo! и Open Directory желательна, т.к. их базы данных используются метапоисковыми системами при определении рейтинга.

  3. Метапоисковые системы - это поисковые системы у которых отсутствует своя база данных с адресами и описанием ресурсов. Они используют базы данных каталогов. В собственной базе данных хранятся только адреса ресурсов. Поиск с помощью этих систем в настоящее время наиболее популярен.

Есть и другая классификация:





ЯНДЕКС - Сайт Яndex, принадлежащий компании CompNet, является одним из самых динамично развивающихся порталов в русской части Интернета. В нем проиндексировано более двух миллионов документов, и этот показатель постоянно растет. Основным достоинством системы Яndex является способность находить заданные слова независимо от формы, в которой они употребляются в документах. Интересно, что система способна "склонять" или "спрягать" даже те слова, которых нет в словаре, причем поиск может вестись как по всем формам ключевых слов, так и по конкретно заданной словоформе. Поисковая машина Яndex позволяет устанавливать расстояние между фрагментами ключевой фразы с учетом их порядка, усиливать значимость того или иного слова, использовать уточняющие слова. Поиск можно также вести по заголовкам документов и по встречающимся на страницах ссылкам. Кроме того, в Яndex легко найти документы, похожие по смыслу на те, что заинтересовали вас по предыдущему запросу. К тому же можно ограничивать поиск уже в найденных документах, то есть производить своеобразную "чистку" результатов запроса. При упорядочивании списка ссылок, получаемого пользователем, учитывается число встретившихся в документе ключевых слов, их положение и расстояние между ними, кроме того, каждый из адресов URL содержит краткую аннотацию найденного документа.

RAMBLER - Сервер Rambler компании Stack является одной из самых больших и наиболее известных поисковых систем в русской части Интернета. Ее база данных содержат миллионы документов, а над поддержкой всего этого проекта трудятся более сотни специалистов. Недостатком данной поисковой системы является то, что спайдер индексирует главным образом сайты, расположенные в доменах СНГ, и если даже ваша страница русскоязычная, но ее доменное имя заканчивается не на .ru, а на .com, то ее индексирование в базе данных Rambler весьма проблематично (для этого надо по меньшей мере уведомить разработчиков). На многих российских сайтах можно встретить характерную пиктограмму счетчика Rambler. Рейтинг Rambler Top 100 весьма популярен в русской части Интернета и часто используется многими компаниями как показатель авторитетности тех или иных ресурсов. Кроме того, Rambler предоставляет посетителям множество услуг: позволяет, например, увеличивать или уменьшать значимость отдельных слов в ключевой фразе с помощью символов "+" и "?", облегчает поиск в адресах URL, заголовках страниц и даже в нескольких абзацах в начале документа. С помощью данной системы можно легко находить "похожие" по тематике страницы и осуществлять повторный поиск адресов среди уже найденных. В ответ на запрос Rambler выдает пользователям список ссылок, снабжая каждую из них небольшой аннотацией, из которой можно узнать кодировку документа, его размер, дату создания/обновления, а также увидеть фрагмент предложения с искомой ключевой фразой.

RUSSIAN FTP SEARCH - Система Filez осуществляет поиск файлов на российских FTP-серверах. Русский FTP Search содержит информацию о 2 тыс. серверов в России, где представлено свыше 7 млн. файлов.

АПОРТ - Поисковая система "Апорт!" компании "Агама" разрабатывается при поддержке Intel. Поиск в "Апорт!" ведется по базе данных, содержащей свыше 2 млн. документов. Система может искать необходимую информацию по различным словоформам введенных слов, исправлять в них ошибки, поддерживает поиск по фразам, в ней легко ограничить расстояние между фрагментами текста, заданное нужным количеством слов или фраз, а также указать допустимый временной период создания документов. Возможен поиск по адресам URL, заголовкам документов, подписям к картинкам, ссылкам и комментариям. Более того, система может осуществлять автоматический перевод с русского на английский и с английского на русский, причем не только ключевой фразы при запросе, но и полученной в результате информации. Итоги поиска упорядочиваются по частоте использования искомых терминов в документе. Вместе со ссылкой отображается фрагмент текста, где встречаются ключевые слова, а также дата и время последней модификации файла. Это позволяет определить, насколько документ по смыслу соответствует заданной ключевой фразе. Среди других возможностей этого сайта можно отметить индикатор загрузки, рейтинги самых употребляемых ключевых слов и наиболее популярных серверов.


На сайте О контекстной рекламе представлена популярность поисковых систем (I квартал 2008, данные Spylog)