Обработка разнородной информации на основе структур знаний в виде расширенных семантических сетей - umotnas.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Название работы Кол-во страниц Размер
Условия и порядок получения информации Федеральной информационной... 1 14.96kb.
Примерные билеты 1 47.88kb.
Мбоу «Европейский лицей» п. Пригородный 1 59.08kb.
Нейрокомпьютинг, нейросети и нейрокомпьютеры 2 524.6kb.
Билеты по информатике 9 класс (теория кратко) 1 418.21kb.
Билеты по информатике для сдачи экзамена по выбору выпускниками 9... 1 50.04kb.
Соколовская Т. Б., вед библиотекарь хнтусх им. П. Василенко Лингвистическое... 1 29.66kb.
Проект Система стандартизации 1 62.82kb.
Информация о материальном мире. Сигналы и данные. Данные и методы. 1 29.26kb.
Лекция № Матрицы и действия над ними 1 105.16kb.
Обработка информации в Мюнстерском университете 1Значение процессов... 1 143.73kb.
Лекции 68 час экзамен 1 22.18kb.
Викторина для любознательных: «Занимательная биология» 1 9.92kb.

Обработка разнородной информации на основе структур знаний в виде расширенных семантических - страница №1/1

ОБРАБОТКА РАЗНОРОДНОЙ ИНФОРМАЦИИ НА ОСНОВЕ СТРУКТУР ЗНАНИЙ В ВИДЕ РАСШИРЕННЫХ СЕМАНТИЧЕСКИХ СЕТЕЙ
Рабинович Борис Ильич
ЗАО «Делойт и Туш»

Москва, Россия

eagman@mail.ru
Многие задачи пользователей связаны со сбором и обработкой информации из различных источников. Такая информация достаточно разнородна. Например, в криминальной милиции это тексты на естественном языке (сводки происшествий, обвинительные заключения, справки по уголовным делам), информация из различных справочников (телефоны, адреса), биллинги телефонных переговоров и др. Информация может храниться в виде файлов, в различных БД или извлекаться из сети Интернет. Обработка должна быть максимально автоматизирована, что предполагает решение сложных логико-аналитических задач (поиск объектов, анализ их связей и др.). Сказанное относится и к другим областям. Перспективным является разработка технологий и систем, позволяющих осуществить на единой основе агрегацию, хранение и аналитическую обработку разнородной информации достаточно унифицированными средствами.
Такая система, ориентированная на обработку текстов естественного языка (ЕЯ), разработана в ИПИ РАН в рамках проектов «Аналитик» [2] и связанных проектов «Диес», «Икс», «Поток». Созданная система «Аналитик» нашла широкое применение в различных предметных областях. Уровень полученных результатов сопоставим с передовыми научными исследованиями за рубежом [1].
Необходимо обеспечить на единой основе обработку различного рода текстовой информации на естественном языке, биллингов телефонных переговоров, информации из БД. В этом случае пользователь-аналитик будет получать из одного источника полную информацию в наиболее удобном виде. Кроме этого на сегодняшний день актуальной задачей в государственных органах и бизнес структурах является задача создания электронных хранилищ и библиотек, позволяющих помимо обработки перечисленных типов данных выявлять информацию из статических и динамических изображений (графические образы рукописных текстов, фотографии, видео файлы и т.п.), звуковых файлы. Актуальный пример – «Государственная автоматизированная система управления приоритетными национальными проектами» [3]. В данной работе раскрыты некоторые аспекты решения указанных проблем.

ЛИТЕРАТУРА


FASTUS:a Cascaded Finite-State Trasducerfor Extracting Information from Natural-Language Text. AIC, SRI International. Menlo Park. California, 1996.
Кузнецов И.П., Мацкевич А.Г. Особенности организации базы предметных и лингвистических знаний в системе АНАЛИТИК. Труды международной конференции Диалог'2003 - М.: Изд-во «Наука», 2003.
ФЦП «Электронная Россия». – Режим доступа: http://www.elrussia.ru/ – Загл. с экрана. – Яз. рус., англ.