В. П. Захаров Информационные системы (документальный поиск) спб 2001 ббк … з захаров В. П. Информационные системы (документальный по - umotnas.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Название работы Кол-во страниц Размер
График приема академических задолженностей преподавателями кафедры... 1 27.74kb.
Программа дисциплины "информационные технологии" Рекомендуется Министерством... 1 101.22kb.
Программа «Высокотехнологичные информационные системы» 1 25.23kb.
Программа дисциплины "мультимедиа технология" Рекомендуется Министерством... 1 98.84kb.
Программа дисциплины "теория информационных процессов и систем" Рекомендуется... 1 116.92kb.
Информационный поиск 1 126.38kb.
6М070300- информационные системы: Алгоритмизация и языки программирования 1 27.55kb.
Гуманитарный, социальный и экономический цикл. Базовая часть 4 1151.88kb.
Митинг на месте Ипатьевского дома (документальный видеосюжет) 1 25.95kb.
Психология: Учеб./ Под ред. А. А. Крылова. М.: Изд-во М. А. 1 63.67kb.
Рабочая программа учебной дисциплинЫ «Интеллектуальные информационные... 1 148.62kb.
Тезисы фрагмента выступления представителя ООО 1 40.46kb.
Викторина для любознательных: «Занимательная биология» 1 9.92kb.

В. П. Захаров Информационные системы (документальный поиск) спб 2001 ббк … з захаров - страница №1/1

Санкт-Петербургский государственный университет

В.П.Захаров

Информационные системы (документальный поиск)

СПб 2001


ББК …

З...


Захаров В.П.

Информационные системы (документальный поиск): Учебное пособие. – СПб.: Изд-во СПбГУ, 2002. – 188 с.

Рецензенты:

канд.филол.наук П.А.Клубков

канд.филол.наук Е.Н.Пименов

В монографии определяются основные понятия автоматизированного документального поиска. Особое внимание уделяется лингвистическому обеспечению информационно-поисковых систем. Также описываются языки представления информации и особенности документального поиска в сети Интернет. Дается типология и краткая характеристика современных систем. Обобщен предшествующий период развития автоматизированных информационно-поисковых систем и предлагается его периодизация. Делается вывод, что будущее информационного поиска находится прежде всего на путях интеллектуализации поисковых систем.

Для специалистов по информационному поиску, для студентов и аспирантов, специализирующихся в области прикладной лингвистики, информационных систем и автоматизированных систем обработки текста.
ББК…

ISBN ...
Введение*

Так называемый век информации начался с кризиса научной литературы. «Издание массы книг и научных трудов становится бедствием, так как солидное, ценное и необходимое все чаще исчезает в огромном потоке ненужных изданий, и надвигается такая угроза, что все достойные внимания издания захлебнутся в этом потоке», – писал немецкий исследователь Адольф фон Харнак еще в 1911-м годуi. Уже давно известно, что выпуск научной литературы нарастает по возрастающей. Столь резкий рост объемов печатной продукции в свое время был охарактеризован как «информационный взрыв». Последние десятилетия характеризуются особенно резким ростом объемов машиночитаемой информацииii. Мир вступил в эру безбумажной, электронной информации.

Особенную актуальность в наши дни приобретает задача информационного поиска, для реализации которой разрабатываются автоматизированные информационно-поисковые системы (ИПС, АИПС). Их отличие от других информационных систем заключается, в частности, в том, что они не выполняют никакой завершающей обработки, связанной с осмыслением (пониманием) полученных результатов или с принятием решений.

Современные ИПС впечатляют своей простотой: пользователь вводит ключевые слова и получает в ответ все документы на заданную тему. Однако эта простота кажущаяся: за всем этим стоят специальные сложные методы и алгоритмы поиска.
Темой настоящей книги являются документальные информационно-поисковые системы. При этом особое внимание уделяется языковым средствам ИПС и поиску в сети Интернет.

В главе 1 даются основные понятия информационного поиска, такие, как информация, информационная система, информационная потребность, релевантность. Вводится понятие документального информационного поиска. Рассматриваются также понятия документа, запроса, поискового предписания, информационно-поискового языка, критерия соответствия. Описаны принципы построения систем, их типология. Эту главу можно оценить как общетеоретическую. В ней также рассматриваются различные типы критериев смыслового соответствия, описываются основные технические характеристики ИПС, полнота и точность.

Глава 2 посвящена углубленному изложению вопросов лингвистического обеспечения. Рассматриваются не только информационно-поисковые языки, но и весь спектр языковых средств, используемых в информационных системах, включая языки библиографического описания данных, коммуникативные форматы, языки представления электронных документов и др. Также уделено внимание автоматизации основных лингвистических процедур обработки текстов на естественных языках. Почти повсеместный отказ от дескрипторных систем, исторически оправданный, и преобладание среди электронных ресурсов неструктурированных текстов на естественных языках, требуют специальных процессоров как на стороне составителя запросов, так и в собственно автоматизированных поисковых процедурах на сервере. На сегодняшний день крайне актуальна не решенная до сих пор задача автоматизации процессов отладки поисковых предписаний. Таким образом, можно сказать, что успехи в информационном поиске, как никогда, зависят от лингвистических средств.

В главе 3 рассматриваются языки создания и описания документов в сети Интернет. Глава начинается с общей характеристики сети и ее информационного наполнения. Дается краткий обзор основных сетевых технологий, получивших название "сервисов". В следующих разделах описываются языки представления электронных документов HTML и XML, а также язык описания метаданных Дублинское ядро (Dublin Core).

Глава 4 посвящена современным информационно-поисковым системам. Дается типология ИПС в сети Интернет. Рассматриваются особенности построения и функционирования основных типов систем (классификационные, вербальные, метапоисковые). Приведены сравнительные данные наиболее популярных систем. Прежде всего анализируется уровень пользователя, выражающийся в языках запросов и в запросно-ответных интерфейсах. Производится сравнительный анализ языков запросов ИПС сети Интернет.
Учебное пособие базируется на практической, исследовательской и преподавательской деятельности автора.

Автор выражает искреннюю признательность всем коллегам, с кем жизнь свела его на информационно-поисковой и лингвистической «ниве»: П.Г.Мордовченко, Л.В.Сахарный, В.Д.Буторов, В.Г.Войскунский, Е.М.Беркович, Д.Г.Лахути, В.Ф.Пархоменко, Ю.И.Полюсук, Л.М.Фрид, Н.Я.Бирман, С.П.Толбаст, В.А.Глухов, Е.Н.Пименов, С.Я.Фитиалов, М.И.Откупщикова, Л.Н.Беляева и другие. Они суть и учителя. Общение с коллегами в области автоматизированных библиотечных систем – В.П.Леоновым, А.Ц.Масевичем, М.А.Аветисовым, Н.К.Каленовым, Я.Л.Шрайбергом и др. – позволило автору расширить свой кругозор и парадигму анализа и по-новому взглянуть на многие вещи. Большое значение имели профессиональные контакты и просто дружеское участие со стороны коллектива кафедры математической лингвистики СПбГУ. Не сомневаюсь также, что этой книги не было бы без разносторонней помощи В.Ш.Рубашкина и А.С.Герда.





**Введение

i Цит. по: Фабиан Б. Книги, библиотеки и гуманитарные исследования /Отв. ред. В.П.Леонов. СПб., 1996. – С. 258.

ii См., например, Berghel H. Cyberspace 2000: Dealing with information overload // Communications of the ACM. 1997. Vol. 40. № 2. P. 19–24.