Об одном проекте формирования универсальной системы декларативных знаний




Скачать 35.67 Kb.
Дата 02.10.2016
Размер 35.67 Kb.
ОБ ОДНОМ ПРОЕКТЕ ФОРМИРОВАНИЯ УНИВЕРСАЛЬНОЙ СИСТЕМЫ ДЕКЛАРАТИВНЫХ ЗНАНИЙ
М.Г. Мальковский

МГУ им.М.В.Ломоносова, Москва


[email protected]

С.Ю. Соловьев

МСЦ РАН, Москва

[email protected]
Теоретически в сети Интернет можно найти ответ практически на любой разумный вопрос. Проблему составляет даже не поиск информации, а отсутствие системы ее организации. Сегодня остро ощущается дефицит конструктивных идей глобальной организации знаний. Однако по отдельным видам знаний прикладные теории уже разрабатываются.

Во многих случаях недостаток знаний человек компенсирует обращением к терминологическим словарям, содержащим, вообще говоря, слабо структурированный набор статей, каждая из которых представляет собой определение одного термина. Особый интерес представляют глоссарии - терминологические словари по частным вопросам; статьи глоссария в совокупности описывают ту или иную предметную область. Познавательная сила глоссария состоит в том, что расположенные рядом статьи человек может читать подряд, не выходя за пределы интересующей его темы.

Обычно статьи глоссария в явном виде содержат указания на семантические связи с другими статьями того же глоссария или с понятиями, выходящим за его рамки. Рассмотрим, например, определение потребительского кредита:

Потребительский кредит - кредит, предоставляемый физическим лицам для приобретения предметов личного потребления.. По форме погашения различают потребительские кредиты с разовым погашением и потребительские кредиты с рассрочкой платежа.

Понятно, что человек способен выделить из этого определения по крайней мере шесть понятий:

1. Кредит

2. Потребительский кредит

3. Потребительский кредит с разовым погашением

4. Потребительский кредит с рассрочкой платежа

5. Предметы личного потребления

6. Физические лица

и пять бинарных семантических отношений:

1. Потребительский кредит есть Кредит.

2. Потребительский кредит с разовым погашением есть Потребительский кредит

3. Потребительский кредит с рассрочкой платежа есть Потребительский кредит

4. Потребительский кредит относится-к Предметы личного потребления

5. Потребительский кредит относится-к Физические лица

По определению универсальное терминологическое пространство (УТП) есть абстрактное хранилище всех терминологических статей, связанных семантическими отношениями. Фактически УТП - семантическая сеть на множестве абсолютно всех терминов, выработанных человечеством.

Исходя из определения УТП и реальных возможностей программных систем понимания текстов, реализация УТП возможна только в виде юридического лица, обеспечивающего непрерывное пополнение и развитие семантической сети. Не останавливаясь на вопросах прибыльности такого бизнеса, отметим, что даже простая самоокупаемость возможно только в том случае, когда построенная часть УТП становится доступной пользователям. С технической точки зрения, для формирования УТП необходимо иметь технологию формирования с предсказуемой производительностью.

Исходными данными для построения семантической сети являются специально отобранные исходные глоссарии, соответствующие тактическим целям развития УТП.

Формированием семантической сети занимаются редакторы-эксперты, деятельность которых поддерживается программным инструментарием, восходящим к системам извлечения знаний. Работа редактора-эксперта по обработке исходного глоссария состоит в выделении и документировании понятий и семантических связей между ними. Группировка осуществляется посредством бинарных семантических связей типа "это-есть" и "относится-к". При этом каждый термин, в том числе и понятийный, может иметь произвольное количество семантических связей.

При формировании семантической сети особый вид работы составляет интеграция вновь поступившего и структурированного глоссария в ранее построенную семантическую сеть. В процессе интеграции исходный глоссарий прекращает свое существование, как самостоятельная информационная единица, и распределяется согласно семантическим отношениям между понятийными терминами.

Часть семантической сети, удовлетворяющая условиям готовности, автоматически транслируется в Интернет-ресурс, объединяющий в рамках единой навигационной и управляющей системы тысячи относительно компактных глоссариев. Эти глоссарии формируются вокруг понятийных терминов, которые и определяют темы (названия) глоссариев.

Описанная технология [1] реализована в виде Интернет-ресурса www.glossary.ru. Статистика посещаемости свидетельствует о востребованности ресурса. Топология текущей версии семантической сети с указанием терминов и понятий, приписанных вершинам, также выложена на www.glossary.ru и доступна в формализованном электронном виде всем исследователям без ограничений.


Литература:

Мальковский М.Г., Соловьев С.Ю. Универсальное терминологическое пространство. Труды Международного семинара Диалог'2002 "Компьютерная лингвистика и интеллектуальные технологии", т.1. М.: Наука, 2002, С. 266-270.


База данных защищена авторским правом ©infoeto.ru 2022
обратиться к администрации
Как написать курсовую работу | Как написать хороший реферат
    Главная страница