Транслятор знаний
Проект направлен на решение следующих фундаментальных проблем:
- проблемы терминологического барьера в процессах научной коммуникации ученых, инженеров, исследователей;
- проблемы извлечения универсальных смысловых отношений из специализированных научных предметных областей;
- проблемы передачи знаний из одной предметной области в другую.

При этом, в рамках проблемы, на решение которой направлен проект, решается конкретная фундаментальная задача:
- создания междисциплинарного языка-транслятора знаний для экспертных систем и компьютерных систем поддержки научных исследований.

Этот проект поддержан грантом РФФИ № 06-01-00538.
 

В математическом плане проект опирается на разработанную алгебру Y-чисел и теорию лингвистических супероператоров.

Исходная Y-алгебра является множеством из двух противоположных (по определению) элементов с двумя операциями умножения, одна из которых переводит элемент в себя (прямое умножение), а другая в противоположный элемент множества (инверсное умножение), и операцией взятия скобок. Инверсное умножение является некоммутативной и неассоциативной операцией. Скобочная операция предназначена для расширения множества исходных Y-чисел. Образование новых элементов множества осуществляется при помощи взятия скобок от произведения двух противоположных элементов. Расширение множества и обобщение Y-алгебры позволило получить достаточно богатые свойства и создать элементарную теорию функций от Y-чисел.

Лингвистическими супероператорами названы объекты являющиеся обобщением Y-чисел. В системе супероператоров (в отличие от Y-чисел) все элементы, в том числе операции, скобки, знаки равенства, обладают самоприменимостью и, действуя на себя и друг на друга, образовывают новые объекты (понятия). Система лингвистических супероператоров обладает предельной комбинаторной свободой, позволяющей синтезировать и образовывать любые понятия, что является необходимым условием описания понятий естественного языка для произвольно взятой предметной области. Этот символический аппарат позволяет описывать процесс синтеза и взаимодействия понятий аналогично тому, как они формировались и взаимодействовали в процессе своего исторического развития.

На базе Y-чисел и лингвистических супероператоров разработан открытый семантический язык SL. Он имеет иерархическую структуру, которая возникает в процессе синтеза понятий (философских категорий), от самых абстрактных к конкретным. Алгоритм синтеза заключается в соединении противоположных понятий в одно новое понятие, при этом значения исходных понятий снимаются (архивируются). Вслед за синтезом, новому понятию подбирается понятие противоположное по смыслу. В формальном плане  синтез понятия противоположного новому понятию производится после перестановки двух исходных понятий предыдущего уровня.

Множество фундаментальных понятий языка SL имеет универсальный характер - они применимы к максимально большому числу научных областей, существуя в них явно (под теми же именами) или в виде терминов. Производные понятия образуются от пересечения и соединения фундаментальных понятий с использованием операции умножения и скобочной операции. Множество фундаментальных понятий образует словарь первого порядка. Словари второго и следующих порядков образуются с помощью морфологической таблицы, в которой по столбцам и строкам стоят слова из словарей порядком ниже, чем те которые образуются на пересечении строк и столбцов. Метод морфологической таблицы позволяет наиболее полно «накрыть» множество понятий в конкретной предметной области, с одной стороны ничего не пропустив, а с другой наличие пустых клеток в таблице может служить индикатором для обнаружения смысловых лакун.

Разработана общая методология преобразования знаний одной предметной области (источника) в другую предметную область (цель), используя универсальные морфосемантические структуры (слова) языка SL. Процесс передачи исходного предложения (аксиомы, определения, теоремы) в универсальные структуры состоит из следующих основных этапов машиной обработки:

1. морфологического анализа, в результате которого на выходе должна быть строка из нормальных форм со списками морфологических параметров;

2. синтаксического анализа, на выходе которого должен быть набор «деревьев» в вершинах которых находятся  списки нормальных формы со списками синтаксических и морфологических параметров;

3. семантического анализа, на выходе которого должно быть единственное «дерево» в вершинах которого находятся  нормальные формы со списками синтаксических и морфологических параметров;

4. перевода в универсальную запись, на выходе которого должно быть «дерево» в вершинах которого находятся слова языка SL со списками синтаксических и морфологических параметров.

Восстановление знаний из этих алгебраических структур необходимо осуществлять в обратном порядке  с  учетом контекста целевой предметной области. Всего разработано 17 этапов обработки исходного текста при передаче из одной предметной области в другую.

По результатам работ 2006 года подготовлены четыре публикации: 


1. С.В. Ёлкин, В.В. Куликов. Проблемы трансляции знаний между различными предметными областями / НТИ сер. 2, 2007, №2. (принята в печать)

2. С.В. Ёлкин, С.Ю. Игашов. Алгебра y-чисел: возможности в области построения функций и множеств // Математический сборник. (отправлена в журнал)

3. С.В. Ёлкин. Использование Y- чисел и их интерпретация / Сборник докладов. Григорьевские чтения. Москва, 2006г. (принята в печать)

4. С.В. Ёлкин, В.В. Куликов, Э.С. Клышинский, В.Ю. Максимов, С.Н. Аминева. Основы методологии трансляции знаний между различными предметными областями / Препринт ИПМ им. Келдыша М.В. РАН № 73, 2006.


По итогам выполнения проекта в  2007 году подготовлены четыре публикации: 

1. Куликов В. В., Елкин С. В., Мансурова О. Ю. Пространственные отношения в семантическом языке SL и его прототипе универсальном языке Диал // НТИ сер. 2, 2007, № 2, с.16-20.

2. Куликов В.В., Елкин С.В., Мансурова О.Ю. Пространственные отношения в семантическом языке SL / Новые информационные технологии в автоматизированных системах. Материалы десятого научно-практического семинара, Москва, 2007, c. 127-137.

3. Галактионов В.А., Мусатов А.М., Мансурова О.Ю., Ёлкин С.В., Клышинский Э.С., Максимов В.Ю., Аминева С.Н., Мусаева Т.Н. Система машинного перевода «Кросслятор 2.0» и анализ ее функциональности для задачи трансляции знаний / Препринт ИПМ им. М.В. Келдыша РАН № 89, 2007.

4. Елкин С. В., Куликов В. В., Клышинский Э.С., Мансурова О. Ю., Максимов В. Ю., Мусаева Т. Н., Аминева С.Н. Многомодельность времени и временные отношения в семантическом языке SL // НТИ сер. 2, 2008, № 2 (принята в печать).