страница 1
|
|||||||||||||||||||||||||||||||||||||||||||
Похожие работы
|
Обработка разнородной информации на основе структур знаний в виде расширенных семантических - страница №1/1
ОБРАБОТКА РАЗНОРОДНОЙ ИНФОРМАЦИИ НА ОСНОВЕ СТРУКТУР ЗНАНИЙ В ВИДЕ РАСШИРЕННЫХ СЕМАНТИЧЕСКИХ СЕТЕЙ Рабинович Борис Ильич ЗАО «Делойт и Туш» Москва, Россия eagman@mail.ru Многие задачи пользователей связаны со сбором и обработкой информации из различных источников. Такая информация достаточно разнородна. Например, в криминальной милиции это тексты на естественном языке (сводки происшествий, обвинительные заключения, справки по уголовным делам), информация из различных справочников (телефоны, адреса), биллинги телефонных переговоров и др. Информация может храниться в виде файлов, в различных БД или извлекаться из сети Интернет. Обработка должна быть максимально автоматизирована, что предполагает решение сложных логико-аналитических задач (поиск объектов, анализ их связей и др.). Сказанное относится и к другим областям. Перспективным является разработка технологий и систем, позволяющих осуществить на единой основе агрегацию, хранение и аналитическую обработку разнородной информации достаточно унифицированными средствами. Такая система, ориентированная на обработку текстов естественного языка (ЕЯ), разработана в ИПИ РАН в рамках проектов «Аналитик» [2] и связанных проектов «Диес», «Икс», «Поток». Созданная система «Аналитик» нашла широкое применение в различных предметных областях. Уровень полученных результатов сопоставим с передовыми научными исследованиями за рубежом [1]. Необходимо обеспечить на единой основе обработку различного рода текстовой информации на естественном языке, биллингов телефонных переговоров, информации из БД. В этом случае пользователь-аналитик будет получать из одного источника полную информацию в наиболее удобном виде. Кроме этого на сегодняшний день актуальной задачей в государственных органах и бизнес структурах является задача создания электронных хранилищ и библиотек, позволяющих помимо обработки перечисленных типов данных выявлять информацию из статических и динамических изображений (графические образы рукописных текстов, фотографии, видео файлы и т.п.), звуковых файлы. Актуальный пример – «Государственная автоматизированная система управления приоритетными национальными проектами» [3]. В данной работе раскрыты некоторые аспекты решения указанных проблем. ЛИТЕРАТУРА FASTUS:a Cascaded Finite-State Trasducerfor Extracting Information from Natural-Language Text. AIC, SRI International. Menlo Park. California, 1996. Кузнецов И.П., Мацкевич А.Г. Особенности организации базы предметных и лингвистических знаний в системе АНАЛИТИК. Труды международной конференции Диалог'2003 - М.: Изд-во «Наука», 2003. ФЦП «Электронная Россия». – Режим доступа: http://www.elrussia.ru/ – Загл. с экрана. – Яз. рус., англ. |
|