система для работы с интеллектуальной электронной книгой - элингой
Классы МПК: | G06N5/00 Компьютерные системы, использующие модели, основанные на знаниях |
Патентообладатель(и): | Бронфельд Геннадий Борисович (RU) |
Приоритеты: |
подача заявки:
2010-06-21 публикация патента:
20.01.2012 |
Изобретение относится к компьютерным системам, использующим модели, основанные на знаниях, а именно к системам, синтезирующим интеллектуальные решения и новые знания по запросу пользователя. Техническим результатом является обеспечение ускоренного доступа к знаниям для массового пользователя. Указанный технический результат достигается прямым моделированием по предложениям и интеграцией знаний, находящихся в исходных текстах, без дублирования знаний. Попутно решается проблемы синонимов, омонимов, диалектных слов, фразеологизмов за счет предварительного моделирования знаний экспертом-редактором. С целью защиты базы знаний и машины логического вывода от несанкционированного копирования элинги используются специальное устройство считывания, механические изменения в машиночитаемом носителе, специальные изменения в каждой версии средств кодирования базы знаний и машины логического вывода. 8 з.п. ф-лы, 7 ил., 2 табл.
Формула изобретения
1. Система для работы с интеллектуальной электронной книгой - элингой - носителем знаний, состоящая из компьютера, устройства считывания элинги, соединяющих разъемов, машиночитаемого носителя с машиной логического вывода, блоком базы знаний, блоком базы данных словарей, блоком сохраненной части диалога, программного средства для подключения машиночитаемого носителя, запуска его блоков с визуализацией для пользователя получаемых результатов, отличающаяся тем, что на машиночитаемом носителе блок машины логического вывода, с одной стороны, соединен через блок распределения заданий, шифратор/дешифратор с разъемом, с другой стороны, соединен с блоком базы знаний, соединенной с отдельными блоками - блоком базы данных словарей, блоком расчетных моделей, блоком визуальных и графических образов, блоком рабочей части диалога и блоком ввода знаний, с третьей стороны, соединенной с блоком рабочей части диалога, соединенного также с блоком распределения заданий, блоком баз данных словарей, блоком сохраненной части диалога, который соединен с блоком распределения заданий, блоками расчетных моделей и визуальных и графических образов, причем блок ввода знаний соединен с блоком распределения заданий, блоком баз данных словарей, блоком расчетных моделей и блоком визуальных и графических образов.
2. Система по п.1, отличающаяся тем, что исходный текст разбивается экспертом-редактором как правило на простые предложения длиной 3-15 слова, выделяются расчетные модели и визуальные и графические образы, причем простые предложения преобразуются в модели знаний - молинги в моделях текста, которые имеют структуру:
код 1; код 2; код 3; код 4; код 5; код 6,
где код 1 - множество идентификаторов простых предложений, указывающих все места исходных текстов, где они упоминаются, в том числе в семантически эквивалентном виде,
код 2 - условие применимости ядра молинги,
код 3 - ядро молинги, где помещается простое предложение, как правило, длиной 3-15 слова,
код 4 - последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей,
код 5 - уровень достоверности молинг в виде факторов уверенности в пределах от -1 до +1,
код 6 - постусловия молинги, которые активизируются в случае, если ядро молинги реализовалось, в т.ч. и ничего не делать (если код 6 равен нулю), при этом постусловия молинги описывают действия и процедуры, которые необходимо выполнить, в их числе - переход к другой молинге, ввод в действие расчетных моделей введенных в блок расчетных моделей или актуализация визуальных или графических образов из блока или графических образов, затем посредством блока ввода знаний молинги из моделей текстов вводятся в блок базы знаний в виде объединенной базы знаний посредством наложения моделей знаний - молинг, при этом расчетные модели в виде программ заносятся в блок расчетных моделей, визуальные и графические образы в блок визуальных и графических образов, словари терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей и номеров исходных текстов в блок баз данных словарей, причем сами молинги, словари, расчетные модели, визуальные и графические образы вводятся в режиме ввода знаний, задаваемых через блок распределения заданий, экспертом-редактором через компьютер, устройство считывания элинги, разъемы, шифратор/дешифратор, блок распределения заданий, блок ввода знаний и соответственно в блок базы знаний, блок базы данных словарей, блок расчетных моделей и блок визуальных и графических образов.
3. Система по п.1, отличающаяся тем, что логический вывод осуществляется блоком машины логического вывода в режиме логического вывода по заданию блока распределения заданий или блока рабочей части диалога, которые активизируются пользователем по его запросу - заданию им, как минимум, двух разных терминов для проведения логического вывода на основе прямого вывода с ограниченным перебором (с количеством промежуточных терминов не более шести), при этом вначале ищутся ядра молинг в блоке базы знаний, где они присутствуют вместе и если есть, - передаются в блок рабочей части диалога по порядку уменьшения уровня достоверности, потом ищется первая (i-я) молинга с первым термином (или его синонимом) с самым высоким уровнем достоверности, и есть другие термины, тогда молинга срабатывает, и выбираются другие термины (или их синонимы), находящиеся в молинге для дальнейшего поиска, вначале первый из них (или его синоним), потом последующие посредством ограниченного перебора вариантов, при этом выбирается (i+k)-я молинга, где имеется этот первый из других термин (или последующий и их синонимы), в ней ищется новый следующий ближайший термин, а далее ищется (i+k+r)-я молинга, которая имеет и следующий ближайший термин и искомый для логического вывода второй термин, при этом последовательность ядер молинг, удовлетворяющих условиям вывода с порядковыми номерами (i), (i+k) (i+k+r) помещаются в блок рабочей части диалога ограниченными наборами, причем сам поиск последовательностей логического вывода машиной логического вывода и блоком базы знаний продолжается, пока пользователь не просмотрит уже полученный ограниченный набор последовательностей ядер молинг, переданный ему из блока рабочей части диалога в компьютер и не решит, устраивает его результат или нет, просматривать ли ему новый ограниченный набор последовательностей ядер молинг или нет, причем сами последовательности ядер молинг имеют вид семантически связанного текста из простых предложений, при этом пользователь, исходя из полученных результатов, может задать новые термины для нового запроса логического вывода машине логического вывода или перейти к режиму когезии для выбранного им самим ядра молинги (простого предложения) или режиму вывода исходных текстов, причем последовательности ядер молинг подаются пользователю в порядке уменьшения расчетного уровня достоверности, который рассчитывается для последовательностей ядер молинг, причем ко всем ядрам молинг соответственно пользователю выдается активированные постусловия молинг, - из блока расчетных моделей - расчетные модели, из блока визуальных и графических образов - визуальные и графические образы.
4. Система по п.1, отличающаяся тем, что в режиме когезии и режиме вывода текста происходит вывод текста, близкого к исходному, по запросу пользователя блоком рабочей части диалога или блоком сохраненной части диалога в виде последовательностей ядер молинг из всей базы знаний, имеющих как минимум один одинаковый элемент идентификатора, соответствующий заданному пользователем (через представленный ему перечень исходных текстов, их глав, параграфов из словаря введенных исходных текстов из блока базы данных словарей), если задан код 1.1.х.х.х - находятся все простые предложения в виде ядер молинг заданного исходного текста, если задан код 1.1. код 1.2.х.х - находятся все простые предложения всех ядер молинг главы код 1.2 текста код 1.1, если задан код 1.1. код 1.2. код 1.3.х - находятся все простые предложения параграфа код 1.3 главы 1.2 текста 1.1, если задан код 1.1. код 1.2. код 1.3. код 1.4 - находятся все простые предложения абзаца 1.4 параграфа код 1.3 главы 1.2 текста 1.1, причем последний и есть режим когезии, причем эти последовательности ядер молинг в виде семантически связанного текста, близкого к исходному, передаются в компьютер пользователю.
5. Система по п.1, отличающаяся тем, что машиночитаемый носитель имеет механические изменения, препятствующие его подключению и считыванию на иных устройствах считывания (отличных от устройств считывания элинг) - их разъемы имеют размеры, отличные от существующих стандартных.
6. Система по п.1, отличающаяся тем, что все содержимое блоков на машиночитаемый носителе с каждой новой версией элинги зашифровано с помощью шифратора/дешифратора, препятствуя считыванию элинг, используя возможности предыдущих версий элинг, а также на иных устройствах считывания, отличных от устройств считывания элинг.
7. Система по п.1, отличающаяся тем, что в наборе молинг в блоке базы знаний каждой новой версии элинги для препятствия работе с машиной логического вывода старой версии изменяются разделители кодов молинг и их последовательность.
8. Система по п.1, отличающаяся тем, что машина логического вывода каждой новой версии элинги имеет изменения, препятствующие работе с наборами молинг в блоках базах знаний предыдущих версий, в частности, в новой версии машины логического вывода, в блоке рабочей части диалога, в блоке сохраненной части диалога изменены элементы работы с базой знаний в связи с новыми разделителями кодов молинг и их последовательностью.
Описание изобретения к патенту
1. Область техники, к которой относится изобретение
Изобретение относится к компьютерным системам, использующим модели, основанные на знаниях, а именно к системам, синтезирующим интеллектуальные решения и новые знания по запросу пользователя.
2. Уровень техники
1 аналог
Известна компьютерная система «Изобретающая машина» для решения изобретательских задач см. Конспект научно-практической конференции «Теория и практика обучения техническому творчеству», Миасс, 23-27 мая 1988 г. ПРОЕКТ "ИЗОБРЕТАЮЩАЯ МАШИНА". Современное состояние и реальные перспективы. В.М.Цуриков, 1988 г. Последний вариант системы известен как Invention Machine Goldfire. См. информационный буклет «Invention Machine Goldfire. Data sheet/». 2009).
Используется в компьютерной системе - компьютер - машиночитаемый носитель - программное средство (ПС) - пользователь для решения интеллектуальных задач для одного направления - решения технических задач. Представляет собой гибридную экспертную систему (ЭС) с использованием моделей знаний, объединенных в базу знаний, и имеющей машину логического вывода. Имеется возможность искать подходящие документы по запросам на основе семантического анализа, как в локальных базах данных (БД), так и в сети Интернет.
«Изобретающая машина» обладает знаниями (и выдает ответы), в своей части превосходящими знания наиболее квалифицированных специалистов. В ней содержатся мощные информационные базы - технических спецэффектов из разных областей знаний, каталог методов решения задач, используются некоторые расчетные модели, в частности, функционально-стоимостного анализа. Некоторые из этих баз построены с использованием моделей знаний, в частности семантических сетей, продукционных моделей и моделей «субъект - акция - объект» (САО-модели). Также применяются визуальные и графические образы - графики, изображения, чертежи для повышения эффективности работы, подключенные к некоторым моделям знаний.
Поставляется пользователю на стандартных машиночитаемых носителях, защищенных от копирования кодами доступа. Поскольку нет массовой продажи, нет необходимости в специальных устройствах чтения машиночитаемых носителей и специальных средствах для их защиты.
Традиционно подобные системы продаются на машиночитаемых носителях, которые для эксплуатации подключаются к компьютерам через устройства считывания. При работе ядро ПС считывается в компьютер и работа выполняется в оперативной памяти компьютера с подкачкой объемов информации с машиночитаемого носителя.
Недостатки системы заключаются в следующем:
- сфера применения узкоспециальная;
- ограниченные возможности получения новых знаний;
- имеются возможности несанкционированного копирования ПС и информации непосредственно из оперативной памяти компьютера;
- при обработке больших объемов информации происходят постоянные потери времени на подкачку информации с машиночитаемого носителя;
- кроме того, «Изобретающая машина» работает только в рамках технологии ТРИЗ (теория решения изобретательских задач) для нахождения новых технических решений на собственных информационных базах - базах знаний и БД;
- не предназначена для нахождения уже известных и отработанных технологий, поскольку для этих целей нужны иные базы знаний.
2 аналог
«Электронная книга» по заявке US 2008/0076103.
Компьютерная система состоит из портативного компьютера со стандартным набором устройств, в частности, дисплея (с применением двух экранов), устройства печати, устройств для воспроизведения звука, клавиатуры, центрального процессора с оперативной памятью, устройства считывания машиночитаемых носителей, машиночитаемых носителей с ядром ПС, которое управляет работой системы, переводчиком, и системой записи текстов на машиночитаемые носители и воспроизведения для пользователя, в т.ч. с переводом. При этом также запоминаются графические и визуальные образы совместно с текстом. Также применяется звуковой вариант воспроизведения. Тексты запоминаются в БД на машиночитаемом носителе в исходном формате.
Недостатки системы заключаются в следующем:
- поскольку текстовых документов много и число их постоянно растет, в т.ч. во многих узких предметных областях, знания в них дублируются, вплоть до простого дублирования исходных текстов, а технические возможности ограничены, то подобное устройство не решает проблему в принципе, лишь помогая немного пользователю, в частности, в дороге;
- проблема анализа исходных текстов и знаний, содержащихся в них, поиск связей между ними остаются полностью за пользователем;
- не может находить решения для пользователя, из анализа имеющихся больших информационных баз;
- не имеет особых специальных возможностей для защиты информационных баз на машиночитаемом носителе.
3 аналог, который является прототипом.
К предлагаемому изобретению наиболее близка система семантического анализа и отбора документов со способностью получения знаний, «DOCUMENT SEMANTIC ANALYSIS/SELECTION WITH KNOWLEDGE CREATIVITY CAPABILITY», пат. US 2001/0014852. Система состоит из компьютера, машиночитаемого носителя знаний, устройства считывания, средства связи с локальными сетями и Интернет и машины логического вывода в виде отдельного семантического процессора. Последний включает блок подготовки текстов для моделирования, блок получения анализируемых САО-структур, блок синтеза ключевых слов/фраз для рефератов на естественном языке, блок синтеза рефератов, а также, блок базы знаний для САО-структур, блок БД исходных текстов, блок БД обобщений текстов на естественном языке, блок БД новых концептов на естественном языке, блок БД ключевых слов и фраз для рефератов.
Пользователь, используя принятые термины, вводит в систему запросы с клавиатуры компьютера. Система моделирует запросы пользователя в виде САО-структур с выделением ключевых слов и фраз, на основе которых в локальных БД и Интернет подбирает подходящие исходные тексты-кандидаты. В текстах-кандидатах также выделяются САО-структуры. Если они соответствуют САО-структурам запросов пользователя, то тексты-кандидаты запоминаются для просмотра в БД текстов на естественном языке. Тексты-кандидаты, не имеющие запрашиваемых САО-структур, удаляются. На основе наиболее частых ключевых слов, фраз и грамматических правил составляются рефераты отобранных текстов. Имеется возможность синтеза новых концептов знаний на основе синтеза подобранных САО-структур с учетом словарей синонимов компонентов САО-структур.
Недостатки последней системы заключаются в следующем:
- при каждом запросе пользователя система последовательно рассматривает весь объем доступных текстов во внешних и внутренних сетях, без исключения повторов или весьма похожих источников. Последовательный перебор всех текстов требует значительных затрат машинного времени;
- возможности системы ограничены доступными источниками, а в ряде областей знаний тексты на бумажных носителях слишком велики, засекречены или продаются по высокой цене;
- разбиение предложений исходных текстов на САО-структуры приводит к разрыву весьма сложных семантических структур, которые присутствуют внутри предложений и разделов текста. Попытка нового синтеза на их основе приведет во многих случаях к утере исходного семантического смысла;
- система удовлетворительно синтезирует рефераты, но синтез новых концептов знания достигается лишь в редких случаях;
- при получении САО-структур не решается задача выделения синонимов, фразеологизмов, метафор, профессиональных и заимствованные слов, неологизмов, диалектизмов, архаизмов, которые также имеют семантический смысл;
- отсутствует оценка уровня соответствия удаляемых текстов-кандидатов. Достаточно одного не очень удачного или нового термина, и исходный текст, содержащий необходимую информацию, будет снят с рассмотрения;
- система применяется только подготовленным экспертом-пользователем. Корректность САО-структур и достоверность рефератов, подготовленных без участия эксперта, остается неподтвержденной.
3. Раскрытие изобретения
Настоящее изобретение решает задачу предварительной систематизации знаний и данных на специальном машиночитаемом носителе, выполненном в виде интеллектуальной электронной книги-элинги. Интеллектуальная электронная книга-элинга готовится группой экспертов-редакторов в отдельной области знаний, на основе опубликованных печатных изданий, а также других достоверных источников информации. В отличие от печатных изданий и их электронных версий, интеллектуальная электронная книга-элинга читается только в компьютерной системе, способна распознавать вопросы пользователя и синтезировать достоверные ответы, которые могут не содержаться в исходных источниках. Для интеллектуальной электронной книги-элинги, располагающих такими возможностями, в тексте далее применяется термин «элинга». Изобретение также решает задачу повышения эффективности семантического анализа, повышения достоверности результатов, улучшения зашиты элинг от незаконного копирования, а также повышения скорости нахождения обоснованных решений.
Технический результат от использования изобретения заключается в создании и использовании - элинги, как доступного продукта массового спроса, содержащего систематизированные знания и способного формулировать новые знания по запросам пользователей. Централизованное создание и тиражирование элинг обеспечивает их умеренную стоимость и доступность широкому кругу пользователей.
Изобретение реализуется компьютерной системой (фиг.1), которая состоит из компьютера 1, связанного с устройством считывания элинги 2, имеющей разъем 3. Пользователь 4 имеет доступ к элинге и результатам работы с ней через технические возможности компьютера 1.
Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).
На машиночитаемом носителе 5 находятся шифратор/дешифратор 7, блок распределения заданий 8, блок машины логического вывода 9, блок базы знаний 10, блок ввода знаний 11, блок БД словарей 12 (здесь содержатся словари терминов, отношений, качественных признаков, количественных признаков, лингвистических и логических связей (все с их синонимами), вместе со словарем введенных исходных текстов), блок расчетных моделей 13, блок графических и визуальных образов 14, блока рабочей части диалога 15, блока сохраненной части диалога 16.
Физически элинга представят собой машиночитаемый носитель 5 с блоками, реализованными на базе электронных компонентов. Функционирует только в рамках компьютерной системы на базе компьютер 1 для работы с машиночитаемым носителем 5 с элингой..
Базовые режимы работы элинги 17 представлены на фиг.3. Основные два - режим ввода знаний 18 и режим рабочий 19. В состав рабочих режимов 19 входят режим вывода текстов 20, режим работы с диалогом 21 и режим логического вывода 22. В свою очередь, в режим вывода текстов 20 входят режим вывода исходных текстов 23 и режим когезии 24.
В режиме работы с диалогом 21 возможен также переход к режимам вывода исходных текстов 23 и режиму когезии 24.
Режим ввода знаний 18 резко отличается от прототипа. В прототипе он один из текущих оперативных режимов работы компьютерной системы. В настоящем изобретении ввод знаний резко отделен от оперативной работы пользователя 4. Ввод знаний в режиме ввода знаний 18 производит, как минимум, один (может быть более) подготовленный эксперт-редактор 4, который у производителя элинги заполняет блок базы знаний достаточно долго, но качественно,
А оперативная работа пользователя 4 уже происходит быстро без дополнительных потерь времени на преобразование исходных текстов, баз знаний, поиска исходных текстов во внешних БД и каких-то их отборов, как в прототипе. А именно скорость в оперативной работе и качественный результат одно из главный требований пользователя к компьютерной системе, в т.ч. при работе со знаниями.
Режим ввода знаний 18 происходит через блок ввода знаний 11 в блок базы знаний 10, блок БД словарей 12, блок расчетных моделей 13, блок графических и визуальных образов 14.
Сам ввод знаний в элингу в режиме ввода знаний 18 производится экспертом-редактором 4 следующим образом. Имеется множество специально подобранных исходных текстов определенной предметной области, они разбиваются на простые предложения преимущественно длиной 3-15 слова. Это простые предложения превращаются в специальные модели знаний - молинги, имеющие следующую структуру (табл.1)
Табл.1 | |||||
Код 1 | Код 2 | Код 3 | Код 4 | Код 5 | Код 6 |
Множество идентификаторов простых предложений | Условие применимости ядра молинги | Ядро молинги | Последовательность номеров словарей | Уровень достоверности молинг | Постусловия молинги |
Они не только ускоряют и упрощают моделирование знаний из исходных текстов, в частности, по сравнению с САО-структурами у прототипа, но и значительно упрощают получение результатов логического вывода для элинги, позволяя выдавать пользователю 4 связный осмысленный текст, весьма удобный для чтения и понимания.
Код 1 - это множество идентификаторов, с помощью которого данная молинга выделяется из всего множества молинг, хотя для некоторых молинг они могут быть и одинаковы (поскольку находятся в одном абзаце исходного текста). В качестве идентификатора выступает составной номер, включающий номер ссылки на текст в словаре исходных текстов (обозначим код 1.1), номер главы (код 1.2), номер параграфа внутри конкретной главы (код 1.3) и номер абзаца внутри конкретного параграфа (где молинга находится - код 1.4). Заголовок параграфа имеет код абзаца, равный нулю. Каждый идентификатор молинги, в целом, имеет вид - код 1.1. код 1.2. код 1.3. код 1.4.
Указываются все идентификаторы для этой молинги всех исходных текстов (или разделы внутри них), где встречались одинаковые знания.
Код 2 - это условие применимости ядра молинги. Обычно представляет собой логическое выражение. Когда оно принимает значение «истина», ядро молинги активизируется.
Код 3 - основной элемент молинги - ядро молинги. Ядро молинги вводится после обработки экспертом-редактором простых и сложных предложений (которые превращает в простые) исходных текстов. При вводе ядер молинг выявляются и вводятся в состав словаря терминов (обозначаемый 1), находящегося в блоке БД словарей 12, - все термины, их синонимы, фразеологизмы, метафоры, профессиональные слова, заимствованные слова, неологизмы, диалектизмы, архаизмы. В молинги вводятся, в основном, базовое значение терминов (определяемое экспертом-редактором). Соответственно таким же образом при вводе ядер молинг выявляются и вводятся в состав словаря отношений (обозначаемый 2), находящегося в блоке БД словарей 12, - все отношения с их синонимами. Так же при вводе ядер молинг выявляются и вводятся в состав словаря качественных признаков (обозначаемый 3), находящегося в блоке БД словарей 12, - все качественные признаки с их синонимами, в состав словаря количественных признаков (обозначаемый 4), находящегося в блоке БД словарей 12, - все количественные признаки с их синонимами, в состав словаря лингвистических и логических связей (обозначаемый 5), находящегося в блоке БД словарей 12, - все лингвистические и логические связи с их синонимами.
В коде 4 указаны последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью номеров словарей терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей.
В коде 5 указываются уровни достоверности молинг в виде факторов уверенности, впервые примененных в ЭС MYCIN.
В коде 6 описываются постусловия молинги. Они актуализируются только в том случае, если ядро молинги реализовалось, в т.ч. и ничего не делать (если код 6 равен нулю). Постусловия молинги описывают действия и процедуры, которые необходимо выполнить после реализации ядра молинги. В их числе может быть - переход к другой молинге, ввод в действие расчетных моделей, введенных в блок расчетных моделей 13, или актуализация визуальных или графических образов из блока визульных и графических образов 14.
Фиксация элементов ядра молинги последовательностью номеров словарей, фиксирующих положение слов и элементов простых предложений, означает фиксацию представления ядра молинги в виде короткой семантический сети. В результате блок базы знаний 10 содержит огромный набор коротких семантических сетей.
Далее процедура происходит в соответствии с фиг.4.
Имеются, например, исходные тексты 1, 2, , n - блоки 25, 26, 27, которые предполагается ввести в блок БЗ 10 элинги. Ввод производится в рамках компьютерной системы, представленной на фиг.1. Тексты разбиваются на простые предложения и привязанные к ним расчетные модели и визуальные, и графические образы. Простые предложения превращаются в молинги, а тексты в модели текстов (фиг.4, блоки - 28, 29, 30), с кодированием порядка элементов в ядрах молинг с занесением соответствующих элементов в блок БД словарей 12, если они или их синонимы в словарях отсутствуют. При моделировании эксперт-редактор задает значение уровня достоверности в виде фактора уверенности со значениями в пределах от -1 (совершенно недостоверная) до +1 (полностью достоверная).
Расчетные модели (запрограммированные стандартным образом или реализуемые с использованием уже разработанных ПС, находящихся в блоке расчетных моделей 13 или в оперативной памяти компьютера 1) и визуальные, и графические образы привязываются в качестве постусловий к молингам и заносятся непосредственно соответственно в блок расчетных моделей 13 и блок визуальных и графических образов 14.
На фиг.4 показано на первом этапе в исходных текстах 1, 2, , n (блоки 25, 26, 27) по 6 простых предложений. На втором этапе (блоки 28, 29, 30) после моделирования в модели текста 1 (блок 28) - 6 молинг, а во второй группе моделей текста 2, , n (блоки 29, 30) уже по пять. Это связано с тем, что если предложения или их синонимические представления являются повторами и находятся в том же абзаце, то они повторно не вводятся. Также не вводятся предложения, которые с точки зрения эксперта-редактора 4 не имеют значения для ввода.
Затем молинги (с их базовыми идентификаторами, определяющие их положение в исходном тексте) вводятся в базу знаний элинги, находящейся в блоке базы знаний 10 по порядку ввода исходных текстов, определяемого экспертом-редактором 4. Если ядра молинг одинаковы или синонимичны той молинге, которая уже находится в блоке БЗ 10, то добавляется ее идентификатор во множество идентификаторов данной молинги. Подобное построение БЗ обеспечивает декларативный подход к моделям знаний. На первом этапе в исходных текстах на фиг.3 было 18 простых предложений, в блоке БЗ 10 их уже всего восемь.
Известно - знания в исходных текстах повторяются. При вводе знаний в виде моделей знаний в блок базы знаний элинги 10 делаются пометки (идентификаторы), из какого исходного текста ввод. Повторение знаний, имеющихся в базе знаний, повышает их достоверность (пометки дублированных знаний из разных источников в виде набора идентификаторов сохраняются). А то, чего нет, - вводится и увеличивает объем базы знаний. Т.е. с каждым новым исходным текстом база знаний представляет собой новую версию, монотонно возрастающую в объеме.
Т.е. база знаний элинги представляет собой постепенно увеличивающуюся «паутину» - все более расширяющуюся и сгущающуюся в местах «горбов» знаний, где они или полностью оказываются дублированными (указывается только еще один их новый идентификатор), или все более уточняют эту фокусную область знаний конкретной предметной области. Этот и есть «эффект гребня»
Такое построение базы знаний обеспечивает возможность вывода необходимого источника в виде, близком к исходному тексту, достаточно задать номер исходного текста из словаря введенных исходных текстов.
Режим логического вывода 22 реализуется машиной логического вывода 9 с участием блока базы знаний 10 и блока рабочей части диалога 11, - приведен на фиг.5.
Машина логического вывода 9 выполняет две функции:
- просмотр существующих фактов (у нас - терминов) из рабочей памяти 31 машины логического вывода 9 и молинг из блока базы знаний 10 и добавление (при возможности) в рабочую память 31 новых терминов (для вывода);
- определение порядка просмотра и применения молинг. Этот механизм управляет процессом вывода, сохраняя для пользователя информацию о полученных заключениях в блоке рабочей части диалога 15.
Логический вывод основан на правиле modus ponens, - «если известно, что истинно утверждение А и истинно правило вида «ЕСЛИ А, ТО В», тогда утверждение В также истинно». Применительно к молингам, которые представимы короткой семантической сетью в виде связанного графа (где вершинами являются термины из блока БД словарей 12), оно имеет вид, - «если имеет место определенный уровень истинности утверждения (термина) А и существует цепь в молинге, связывающая А с утверждением (термином) В, то имеет место определенный уровень истинности (достоверности) утверждения (термина) В». Этот уровень достоверности определяется уровнем достоверности (код 5) молинги.
Пример вывода показан на фиг.6. Предположим, пользователь задал запрос - найти связь между двумя разными терминами - термин 1 и термин 9. Ищется на основе прямого вывода с ограниченным перебором (с количеством промежуточных терминов не более шести). Вводится вначале исходный термин 1, ищется какая-то первая молинга с ядром молинги, где есть термин 1 (или его синоним) и термин 9 (или его синоним) одновременно. Если находится, то вводится в блок рабочей части диалога 15, где выстраиваются по мере уменьшения уровня достоверности найденных молинг. Если не находится, ищется некая (i-я) молинга с термином 1 с самым высоким уровнем достоверности и есть другие термины. Молинга срабатывает и выбираются другие термины, находящиеся в молинге для дальнейшего поиска, - это термины - термин 2 и термин 3. Вначале ищется цепочка связи с термином 9 по первому термину 2 (и его синониму), выбирается (i+k)-я молинга, в ней ищется следующий ближайший термин - термин 6. Ищется следующая молинга, имеющая термин 6 (или его синоним) и термин 9, и она находится (i+k+r)-я молинга. Результат вывода - последовательность молинг с порядковыми номерами (i), (i+k) (i+k+r) помещается блок рабочей части диалога 15.
Машина логического вывода должна функционировать даже при недостатке информации. Полученное решение может и не быть точным, однако система не должна останавливаться из-за того, что отсутствует какая-либо часть входной информации.
Машина логического вывода определяет порядок применения правил и выполняет четыре функции (см. фиг.5.).
1. Сопоставление (блок программы 32 машины логического вывода 9) - выбранная молинга сопоставляется с имеющимися терминами, выбранные поступают в конфликтное множество - блок программы 33.
2. Выбор (блок программы 34) - если в конкретной ситуации может быть применено сразу несколько молинг, то из них выбирается одна, наиболее подходящая по заданному критерию выбора молинг (блок программы 35), и происходит разрешение конфликта. Этим критерием является более высокий уровень достоверности и при равных величинах - первая по порядку.
3. Срабатывание (блок программы 36) - если молинга при сопоставлении совпала с какими-либо терминами из блока рабочей части диалога 15, то молинга срабатывает.
4. Действие (блок программы 37) - блок рабочей части диалога 15 подвергается изменению путем добавления в него сработавшей молинги и новых терминов для дальнейшего вывода. Если в правой части молинги содержится указание на какое-либо действие - постусловие, то оно выполняется.
Машина логического вывода 9 циклична. В каждом цикле просматриваются молинги, чтобы выявить те, где термины совпадают с известными на данный момент терминами из блока рабочей памяти 31 (кроме уже просмотренных). После выбора (блок программы 34) молинга срабатывает, и новый термин заносится в блок рабочей части диалога 15 для дальнейшего вывода, и цикл повторяется.
В одном цикле может сработать только одна молинга. Если несколько молинг успешно сопоставлены с терминами, то машина логического вывода 9 производит выбор по заданным критериям единственной молинги, которая срабатывает в данном цикле.
В режиме работы с диалогом 21, реализуемым блоком рабочей части диалога 15, всю необходимую информацию выдают пользователю 4 через компьютер 1. Пользователю 4 поступают по группам все последовательности логического вывода ядер молинг с номерами (i), (i+k), (i+k+r) разной длины в порядке убывания уровня достоверности (код 5) при заданном запросе для вывода на основе термин 1 - термин 9.
Уровень достоверности последовательности молинг у посл рассчитывается следующим образом.
Пусть
yi - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для начальной i-й молинги (где 1 i n);
yi+k - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой промежуточной i+k-й молинги (где 1<k<n);
yi+k+r - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой конечной i+k+r-й молинги (где i+k<r<n - (i+k)). Тогда
Если какое-то из значений yi , yi+k, yi+k+r окажется 0, то и все значение yпосл указывается сразу равным=0 без дальнейшего расчета.
Пользователь, читая последовательность этих ядер молинг, а фактически это группы последовательностей простых предложений, семантически связанных между собой, сам решает, удовлетворяет его этот результат - текст или нет. Выбирает необходимую ему группу (или группы) и фиксирует ее (или их) в блок сохраненной части диалога (вместе с терминами запроса) 16, вместе с со всеми результатами постусловий при запуске расчетных моделей из блока расчетных моделей 13 или визуальных и графических образов из блока визуальных и графических образов 14. Если ответ его полностью не устраивает, пользователь имеет возможность или снова повторить логический вывод (режим логического вывода 22) с новыми вариантами запроса (с новыми терминами для логического вывода) или по какому-то ядру молинги запустить режим когезии 24 (локальной связанности текста относительного конкретного исходного текста (одного из используемых для конкретной молинги идентификаторов исходного текста, соответствует абзацу исходного текста) на небольшом расстоянии от исходного предложения) или когерентности (глобальной связанности текста через одинаковые термины (заголовки), относительного конкретного упомянутого и выбранного исходного текста из нескольких идентификаторов),
Режим когезии 24 обеспечивает вывод в блок рабочей части диалога 15 из блока базы знаний 10 последовательностей ядер молинг, имеющих, как минимум, один идентификатор, соответствующий заданному пользователем (через представленный ему перечню исходных текстов, их глав, параграфов из словаря введенных исходных текстов из блока БД словарей 12). Вывод ядер молинг в режиме когезии при одинаковом идентификаторе соответствует выводу абзаца исходного текста (блоки 25 или 26 или 27). Запрос пользователя о выводе всего исходного текста, соответствующего интересующему его ядра молинги (простого предложения) соответствует использованию эффекта когерентности исходного текста или режима вывода исходного текста 23. Объем может задаваться пользователем 4 - или в объеме параграфа, или в объеме главы, или в объеме всего исходного текста со всеми главами и параграфами.
Весь необходимый пользователю текст, который оказался необходим пользователю и полученный им в режиме работы с диалогом 21 в блоке рабочая часть диалога 15, может быть сохранен пользователем в блоке сохраненной части диалога 16. Причем блоки исходного текста (в виде последовательностей ядер молинг), полученные в режиме когезии 24, могут непосредственно в блоке сохраненной части диалога 16 запоминаться, а также полученные в режиме вывода исходных текстов (обеспечения когерентности) 23, только с указанием выделенных пользователем необходимых идентификаторов.
В дальнейшем при работе пользователя с блоком сохраненной части диалога 16 необходимые последовательности ядер молинг будут подгружаться в блок сохраненной части диалога 16 из блока базы знаний 10, также как и необходимые расчетные модели из блока 13 и визуальные, и графические образы - блок 14. Соответственно, все это будет выводиться по запросу пользователя в компьютер 1 для пользователя.
Режим вывода текстов 23 может задаваться пользователем через блок распределения заданий 8. Последний активизирует блок рабочей части диалога 15 и по запросу пользователя производится вывод из блока базы знаний 10 тех или иных исходных текстов в виде последовательности ядер молинг по подобранным идентификаторам, начиная с одинакового номера ссылки в словаре исходных текстов в коде 1. Все это передается в компьютер 1 для пользователя.
Подробнее программная реализация режима вывода текстов 23 и режима когезии 24 в машине логического вывода 9 рассмотрены на фиг.7.
В режиме когезии 24 пользователь при работе с результатами, выдаваемыми элингой в блок рабочей части диалога 15, может выбрать интересующее его простое предложение (ядро некоторой молинги) и для уточнения выбрать поясняющий абзац, выбрав один из идентификаторов молинги, в виде - код 1.1. код 1.2. код 1.3. код 1.4. Он поступает в машину логического вывода 9 в блок программы 38, а из него в блок программы 39, который ищет все молинги, находящиеся в блоке базы знаний 10 с заданным идентификатором. Если молинга найдена, то блоком программы 40 копия молинги отправляется в блок рабочей части диалога 15, если "нет" - проверяется блоком программы 41, все ли просмотрено. Если "нет", просмотр продолжается, если "да", то проверяют в блоке программы 42 - это был запущен режим когезии 24 или нет. Если "да", то сообщают в блок рабочей части диалога 15, что задание выполнено.
Если "нет", то - машина логического вывода 9 инициирована или блоком распределения заданий 8, или блоком рабочей части диалога 15 (в обоих случаях пользователем) в режиме вывода исходных текстов 23.
Режим вывода исходных текстов 23 задается или из блока распределения заданий 8, или блока рабочей части диалога 15. В блок программы 43 машины логического вывода 9 в виде запроса текста, который надо вывести - код 1.1.x.x.x, т.е. надо вывести весь текст, близкий к исходному тексту, который содержится в блоке БЗ 10 в форме молинг. Код 1.1 соответствует номеру исходного текста из словаря исходных текстов, который находится в блоке БД словарей 12. Возможны варианты задания в виде код 1.1. код 1.2.х.х, когда задается вывод только конкретной главы конкретного исходного текста, и код 1.1. код 1.2. код 1.3.х - когда задается вывод только конкретного параграфа конкретной главы.
Поиск молинг начинается с задания поиска главы с номером 1 в виде задания
код 1.1.х.х.х=код 1.1.1.х.х.
Задается начальный код параграфа, который ищется с номером 1 в виде код 1.1.х.код 1.3..х=код 1.1.x.1.x
в блоке программы 45.
Далее задается начальный номер абзаца с номером 0 (это - заголовок) в начальном параграфе начальной главы в блоке программы 46 в виде код 1.1.х.х.х=код 1.1.х.х.0.
И затем начинается поиск молинг для 0-го абзаца. Дальше все проходит, как и в режиме когезии 24. Если в блоке программы 42 идет выход "нет", то происходит переход к блоку программы 47, в котором определяется, все ли абзацы в параграфе просмотрены. Если выход блока программы 47 - "нет", то в блоке 48 увеличивается номер кода для поиска нового абзаца
код 1.1.х.х.код 1.4=код 1.1.х.х. (код 1.4+1).
Если в качестве выхода блока программы 47 используется "да", то идет переход к блоку программы 49. При этом проверяются, все ли номера параграфов просмотрены, если "нет", то идет присвоение нового номера параграфа в блоке программы 50 в виде
код 1.1.х.код 1.3.х=код 1.1.х.(код 1.3+1).х
и далее по циклу.
Если в блоке программы 49 был выход "да", то означает, что просмотрены все параграфы заданной главы заданного исходного текста и идет переход к блоку программы 51. Если из него выход "нет", т.е. не просмотрены все главы заданного исходного текста, то номер главы в блоке программы 52 увеличивается
код 1.1. код 1.2.х.х=код 1.1.(код 1.2+1).х.х.
Если выход из блока программы 51 "да", то это означает, что все молинги данного номера текста с кодом код 1.1. выбраны и отправлены в блок рабочей части диалога 15. При этом происходит возврат к блокам распределения заданий 8 или блоку рабочей части диалога 15 с сообщением, что задание по блоку 43 закончено.
Для снижения опасности копирования элинг и времени реакции на задаваемые вопросы (в процессе эксплуатации) используется специальное устройство считывания эллинг 2 для запуска машиночитаемых носителей 5 с элингами и специальные методы защиты машиночитаемых носителей, - как механическим путем, программным, так и организационным.
А именно:
- с целью затруднения копирования, - машиночитаемый носитель 5 имеет механические изменения, препятствующие его считыванию на иных устройствах считывания (отличных от устройств считывания 2) - разъемы 3, 6 имеют размеры, отличные от стандартных;
- все содержимое блоков на машиночитаемом носителе 5 с каждой новой версией шифруется с использованием блоков шифратор/дешифратор 7, препятствуя считыванию элинг, в т.ч. на иных устройствах считывания, отличных от устройств считывания 2;
- набор молинг в блоке базы знаний 10 каждой новой версии имеет небольшие изменения, препятствующие работе со старой машиной логического вывода 9, в частности, изменяются разделители кодов молинг и их последовательность;
- машина логического вывода 9 каждой новой версии имеет небольшие изменения, препятствующие работе с наборами молинг в старых базах знаний, в частности, в новой версии машины логического вывода 9, в блоке рабочей части диалога 15, в блоке сохраненной части диалога 16 изменены элементы работы с блоком базы знаний 10 в связи с новыми разделителями кодов молинг и их последовательностью.
Итак, основные отличия от прототипа:
- иная техническая реализация поставленных целей, в частности, совсем иная реализация машиночитаемого носителя и его роль;
- использование объединенной базы знаний текстов, причем специально отобранных, обеспечивает более качественный отбор знаний, меньший объем объединенной базы знаний (по сравнению с традиционными системами управления знаниями), что затем приводит к резкому ускорению нахождения решений даже того же уровня и возможности «свободного плавания» по предметному «морю» знаний (объединенной базе знаний), что практически невозможно у прототипа;
- использование в качестве моделей знаний молинг приводит, по сравнению с САО-структурами, к намного более точному отражению семантики знаний уже на уровне предложений, ликвидации проблем синтеза на уровне предложений и возможности применения намного более простых и более быстродействующих методов синтезов текстов, в т.ч. реального синтеза текстов, близких к исходным текстам, что фактически на базе САО-структур в удовлетворительном варианте реализовать нельзя;
- жесткое разделение на режимы ввода знаний 18 и рабочий режим 19, причем в режиме ввода знаний 18 производителем элинг возможно медленное (казалось бы, но качественное и множеством экспертов-редакторов, причем даже параллельно) заполнение объединенной базы знаний, но в рабочем режиме 19 намного более быстрое нахождение результатов по уже находящейся в элинге объединенной базы знаний (в т.ч. не надо потерь времени на каналы передачи информации по Интернету и внутри компьютерной системы);
- более качественное нахождение результатов логического вывода, поскольку ядра молинг по сравнению с САО-структурами более качественно отражают семантическую сущность используемых элементов знаний.
Более конкретно ниже.
Основными существенными признаками являются нижеследующие.
Система для работы с интеллектуальной электронной книгой - элингой - носителем знаний, состоящая из компьютера 1, устройства считывания эллинги 2 и машиночитаемого носителя 5, соединяемые через разъемы 3, 6, ПС компьютера для подключения машиночитаемого носителя 5, с машиной логического вывода 9, блоком базы знаний 10, ПС запуска его блоков с визуализацией для пользователя получаемых результатов, отличающаяся тем:
1. что на машиночитаемом носителе 5 машина логического вывода 9, с одной стороны, соединена через блок распределения заданий 8, шифратор/дешифратор 7 с разъемом 6, с другой стороны, соединена с блоком базы знаний 10, соединенной с отдельными блоками - блоком БД словарей 12, блоком расчетных моделей 13, блоком визуальных и графических образов 14 и блоками рабочей части диалога 15, блоком ввода знаний 11, с третьей стороны, соединенной с блоком рабочей части диалога 15, соединенного также с блоком распределения заданий 8, блоком БД словарей 12, блоком сохраненной части диалога 16, который соединен с блоком распределения заданий 8, блоком расчетных моделей 13 и блоком визуальных и графических образов 14, причем блок ввода знаний 11 соединен с блоком распределения заданий 8, блоком БД словарей 12, блоком расчетных моделей 13 и блоком визуальных и графических образов 14;
2. Система по п.1. отличающаяся тем, что исходный текст 25-27 (вводимый в блок базы знаний 10) разбит экспертом-редактором 4 на простые предложения длиной 3-15 слов, выделяются расчетные модели и визуальные и графические образы, причем простые предложения преобразуются в модели знаний - молинги в моделях текста 28-30, которые имеют структуру, где код 1 - множество идентификаторов простых предложений, указывающих все места исходных текстов, где они упоминаются, в том числе в семантически эквивалентном виде; код 2 - условие применимости ядра молинги; код 3 - ядро молинги, где помещается простое предложение, как правило, длиной 3-15 слов; код4 - последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей; код 5 - уровень достоверности молинг в виде факторов уверенности в пределах от -1 до +1; код 6 - постусловия молинги, которые активизируются в случае, если ядро молинги реализовалось, при этом постусловия молинги описывают действия и процедуры, которые необходимо выполнить, в их числе - переход к другой молинге, ввод в действие расчетных моделей введенных в блок расчетных моделей 13 или актуализация визуальных или графических образов из блока визуальных или графических образов 14, затем молинги из моделей текстов 28-30 вводятся в блок базы знаний 10 посредством наложения моделей знаний - молинг, при этом расчетные модели в виде программ заносятся в блок расчетных моделей 13, визуальные и графические образы в блок визуальных или графических образов 14, словари терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей и номеров исходных текстов в блок БД словарей 12, причем сами молинги, словари, расчетные модели, визуальные и графические образы вводятся в режиме ввода знаний 18 задаваемым блоком распределения заданий 8 - экспертом-редактором 4 через компьютер 1, устройство считывания элинги 3, разъемы 3,6, шифратор/дешифратор 7, блок распределения заданий 8, блок ввода знаний 11 в блок базы знаний 10, блок БД словарей 12, блок расчетных моделей 13 и блок визуальных и графических образов 14;
3. Система по п.1. отличающаяся тем, логический вывод осуществляется машиной логического вывода 9 в режиме логического вывода 22 по заданию блока распределения заданий 8 или блока рабочей части диалога 15, которые активизируются пользователем 4 по его запросу - заданию им, как минимум, двух разных терминов: термин 1 и термин 2 для проведения логического вывода на основе прямого вывода с ограниченным перебором (с количеством промежуточных терминов не более шести), при этом вначале ищутся ядра молинг в блоке базы знаний 9, где они присутствуют вместе и если есть, - передаются в блок рабочей части диалога 15 по порядку уменьшения уровня достоверности, потом ищется первая (i-я) молинга с первым термином термин 1 (или его синонимом) с самым высоким уровнем достоверности и есть другие термины, тогда молинги срабатывают и выбираются другие термины (или их синонимы), находящиеся в молинге для дальнейшего поиска, вначале первый из них (или его синоним), потом последующие посредством ограниченного перебора вариантов, при этом выбирается (i+k)-я молинга, где имеется этот первый из других термин (или последующий и их синонимы), в ней ищется новый следующий ближайший термин, а далее ищется (i+k+r)-я молинга, которая имеет и следующий ближайший термин и искомый для логического вывода второй термин термин2, при этом последовательность ядер молинг, удовлетворяющих условиям вывода с порядковыми номерами (i), (i+k) (i+k+r), помещаются в блок рабочей части диалога 15 ограниченными наборами, причем сам поиск последовательностей логического вывода машиной логического вывода 9 и блоком базы знаний 10 продолжается, пока пользователь не просмотрит уже полученный ограниченный набор последовательностей ядер молинг, переданный ему из блока рабочей части диалога 15, в компьютер 1 и не решит, - устраивает его результат или нет, просматривать ли ему новый ограниченный набор последовательностей ядер молинг или нет, причем сами последовательности ядер молинг имеют вид семантически связанного текста из простых предложений, при этом пользователь 4, исходя из полученных результатов, может задать новые термины для нового запроса логического вывода машине логического вывода 9 или перейти к режиму когезии 24 для выбранного им самим ядра молинги (простого предложения) или режиму вывода текстов 20, причем последовательности ядер молинг подаются пользователю в порядке уменьшения расчетного уровня достоверности, который рассчитывается для последовательностей ядер молинг, причем ко всем ядрам молинг соответственно пользователю выдаются активированные постусловия молинг, - из блока расчетных моделей 13 - расчетные модели или из блока визуальных и графических образов 14 - визуальные и графические образы;
4. Система по п.1. отличающаяся тем, что в режим когезии 24 и режиме вывода исходного текста 23 происходит вывод текста, близкого к исходному по запросу пользователя блоком рабочей части диалога 15 или блоком сохраненной части диалога 16 в виде последовательности ядер молинг из блока базы знаний 10, имеющих, как минимум один одинаковый элемент идентификатора, соответствующий заданному пользователем (через представленный ему перечень исходных текстов, их глав, параграфов из словаря, введенных исходных текстов из блока БД словарей 12), если задан код 1.1.x.x.x - находятся все простые предложения в виде последовательностей ядер молинг заданного исходного текста, если задан код 1.1.код 1.2.х.х, находятся все простые предложения в виде последовательностей всех ядер молинг главы код. 1.2 текста код 1.1, если задан код 1.1. код 1.2. код 1.3.х, находятся все простые предложения параграфа код 1.3 главы 1.2 текста 1.1, если задан код 1.1. код 1.2. код 1.3. код 1.4, находятся все простые предложения абзаца 1.4 параграфа код 1.3 главы 1.2 текста 1.1, причем последний и есть режим когезии 24, причем эти последовательности ядер молинг в виде семантически связанного текста, близкого к исходному, передаются в компьютер 1 пользователю 4;
5. Система по п.1. отличающаяся тем, что машиночитаемый носитель 5 имеет механические изменения, препятствующие его подключению и считыванию на иных устройствах считывания (отличных от устройств считывания элинг 2) - их разъемы 3,6 имеют размеры, отличные от существующих стандартных.
6. Система по п.1. отличающаяся тем, что все содержимое блоков на машиночитаемый носителе 5 с каждой новой версией элинги зашифровано с помощью шифратора/дешифратора 7, препятствуя считыванию элинг, используя возможности предыдущих версий элинг, а также на иных устройствах считывания, отличных от устройств считывания эллинг 2;
7. Система по п.1, отличающаяся тем, что в наборе молинг в блоке базы знаний 10 каждой новой версии элинги для препятствия работе с машиной логического вывода 9 старой версии изменяются разделители кодов молинг и их последовательность.
8. Система по п.1, отличающаяся тем, что машина логического вывода 9 каждой новой версии элинги имеет изменения, препятствующие работе с наборами молинг в блоках баз знаний 10 предыдущих версий, как минимум, в новой версии машины логического вывода 9, в блоке рабочей части диалога 15, в блоке сохраненной части диалога 16, изменены элементы работы с базой знаний 10 в связи с новыми разделителями кодов молинг и их последовательностью.
4. Краткое описание чертежей
Фиг.1 - обобщенная структурная схема, в которой функционирует изобретение
Фиг.2 - структурная схема связей блоков на машиночитаемом носителе 5
Фиг.3 - базовые режимы работы элинги 17
Фиг.4 - порядок семантического анализа исходных текстов и заполнения базы знаний в режиме ввода знаний 18
Фиг.5 - структура работы машины логического вывода 9 в режиме логического вывода 22
Фиг.6 - вариант логического вывода на базе знаний из молинг
Фиг.7 - блок-схема программы машины логического вывода 9 и связи блоков при этом в режиме вывода исходных текстов 23 и режима когезии 24
5. Осуществление изобретения
В принципе, технологии реализации изобретения и его использования полностью находятся в рамках создания интеллектуальных систем, в частности, ЭС, и их использования.
Однако ряд указанных технических особенностей реализации такой технологии для системы для работы с элингами обеспечивает новые возможности, которые ранее были недостижимы.
Например, ЭС могут работать только в узкой области и для не слишком сложных задач, поскольку все выдаваемые результаты должны быть отлажены с участием экспертов, а базы знаний вводятся только с участием экспертов и заполняются и отлаживаются весьма медленно.
А при работе с элингой - база знаний может быть намного больше, т.е. время отладки для ЭС, с подобной базой знаний, - просто ушло бы в бесконечность. Решаемые задачи для элинги гораздо более сложные, а предметная область намного шире, - все оказывается по-иному.
Полная отладка не делается из-за отсутствия необходимости и невозможности. Используется то, что вводятся исходные тексты, уже прошедшие редактирование, экспертизу и нередко весьма тщательную (например, патенты, стандарты, учебники и т.п.). При этом отладка элинги проводится только локальная. Если возникают при вводе разные варианты молинг (разные варианты знаний), то они фиксируются, как разные, с разным уровнем достоверными, оцениваемыми факторами уверенности. Способ их расчета, такой, какой применялся в ЭС MYCIN.
Остается ситуация, традиционная для чтения текстов тысячелетиями, - возможны какие-то мелкие ошибки или нестыковки при подготовке текста автором или подготовке к печати. Что не мешает, как правило, восприятию текста и знаний вообще.
Если при чтении одного текста пользователь имеет дело с одним текстом, то в данном случае он имеет дело действительно фактически с «морем» знаний (присутствуют интегрированные знания из многих книг), в котором он перемещается по своему желанию. Возникает тот же эффект, который уже давно зафиксирован для гипертекстовых систем, когда пользователь имеет дело с нелинейной организацией текста. Обычный текст пользователь читает последовательно (линейно), а для гипертекстовых систем идет постоянный переход от одних частей текста к другим, в т.ч. разных источниках. В элинге это происходит в связи с логическим выводом по базе знаний элинги.
За счет использования эффектов когезии или когерентности, - связанный текст, получаемый при работе машины логического вывода элинги, представляется пользователю весьма осмысленным и связным текстом, имеющим для пользователя совершенно новое звучание. Эффекты когезии и когерентности хорошо известны в лингвистике.
Оценим размер баз знаний элинги с точки зрения реализуемости. Элинга с хорошим уровнем знаний будет иметь знания, где-то от 100 исходных текстов конкретной предметной области, например, книг. Средняя книга - объем 300 стр., средний объем страницы около 30 Кбайт, средний объем 1 рисунка (чертежа) на 1 стр.- около 70 Кбайт. Итого получается 30 Мбайт на 1 книгу или 3 Гбайта на весь объем. Однако не менее 50% знаний окажется дублированным, т.е. в разных книгах или даже разных частях одной книги совпадающим, то объем окажется уже 1,5 Гбайта. Поскольку в молинге, кроме ядра есть еще информация, а кроме того, еще есть информация о кодировании структуры самого ядра, как маленькой семантической сети, то общий объем возрастает теперь в среднем в 1,5 раза, т.е. до 2,25 Гбайт. Словари терминов (и их синонимов), отношений, качественных признаков и иного, займут относительно немного места.
ПС машины вывода займет не более 300 М байт. Т.о. общий объем такой элинги вполне мог бы записывается на обычный диск формата DVD объемом около 4 Гбайт или небольшую флэшку (которые имеют тоже сложную внутреннюю структуру), а тем более специально разработанный машиночитаемый носитель 5 для создания элинги.
Теперь оценим с точки зрения уровня знаний с учетом «эффекта гребня».
Предположим, около 50% молинг (полученных из отдельных предложений) находятся в достаточно широкой предметной области, а 50% сосредоточены в фокусных местах, где появились «горбы» знаний (о чем мы говорили при объяснении «эффекта гребня»). В исходном тексте - тексте - книге, предположим, на странице - 20 предложений (или получается 25 молинг - излагается исходный текст более четко).
Общее число молинг получается - 100 книг × 300 страниц × 25 молинг=750000 молинг. Из них около 400000 относится к фокусным группам. Если фокусных групп около 100, в среднем по 1 на книгу, большинство из них фактически будут в первых книгах, причем некоторые из последних вводимых вообще никаких фокусных групп не добавят. У нас выходит, что, в среднем, на 1 фокусную группу приходится около 4000 молинг. Из 30-летней практики применения ЭС известно, что при увеличении базы знаний ЭС до 10000 продукционных правил (в среднем), ЭС превосходит наиболее квалифицированных специалистов по уровню выдаваемых результатов. Здесь молинги вполне можно сравнивать с продукционными правилами, они еще более мощные и гибкие средства моделирования знаний по сравнению с ними. Этот же предел в 10000 продукционных правил (как ориентировочный барьер интеллектуальности) указан в проекте создания ЭВМ 5-го поколения.
Увеличение базы знаний элинги еще в 3-4 раза приведет к тому, что элинги в широкой предметной области способны выдавать ответы с уровнем знаний, превышающим лучших специалистов конкретных предметных областей. Заметим, что не для всех предметных областей с ходу возможно создание элинг с таким уровнем результатов.
Изобретение реализуется компьютерной системой (фиг.1), которая состоит из компьютера 1, связаного с устройством считывания элинги 2, имеющей разъем 3. Пользователь 4 имеет доступ к элинге и результатам работы с ней через технические возможности компьютера 1. Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).
Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).
На машиночитаемом носителе 5 находятся шифратор/дешифратор 7, блок распределения заданий 8, блок машины логического вывода 9, блок базы знаний 10, блок ввода знаний 11, блок БД словарей 12, блок расчетных моделей 13, блок графических и визуальных образов 14, блок рабочей части диалога 15, блок сохраненной части диалога 16.
Физически элинга представят собой - машиночитаемый носитель 5 с блоками, реализованными на базе электронных компонентов, который и будет выступать в качестве носителя знаний.
Режим ввода знаний 18 (фиг.3) резко отличается от прототипа. В прототипе он - текущий оперативный. В настоящем изобретении ввод знаний резко отделен от оперативной работы пользователя 4. Ввод знаний в режиме ввода знаний 18 производит подготовленный эксперт-редактор 4, который у производителя элинги заполняет блок базы знаний достаточно долго, но качественно.
Оперативная работа пользователя 4 уже происходит быстро без дополнительных потерь времени на преобразования исходных текстов и поиска исходных текстов во внешних БД, как в прототипе.
Сам ввод знаний в элингу в режиме ввода знаний 18 производится экспертом-редактором 4 следующим образом. Имеется множество специально подобранных исходных текстов определенной предметной области, они разбиваются на простые предложения преимущественно длиной 3-15 слов. Эти простые предложения превращаются в специальные модели знаний - молинги, имеющие структуру - код 1; код 2; код 3; код 4; код 3; код 6, описанную ранее.
Это не только ускоряет и упрощает моделирование знаний из исходных текстов, в частности, по сравнению с САО-структурами у прототипа, но и значительно упрощает получение результатов логического вывода для элинги, позволяя выдавать пользователю 4 связный осмысленный текст блоками, весьма удобный для чтения и понимания, и позволяя ему управлять этим процессом в диалоге с компьютером 1.
При моделировании эксперт-редактор 4 задает значения уровня достоверности в виде фактора уверенности со значениями в пределах от -1 (совершенно недостоверная) до +1 (полностью достоверная), что потом используется при логическом выводе с целью выстраивания иерархии ответов по степени их достоверности. Вначале выдаются цепочки молинг с большим уровнем факторов уверенности.
Расчетные модели (запрограммированные стандартным образом или реализуемые с использованием уже разработанных ПС, находящихся в блоке расчетных моделей 13 или в оперативной памяти компьютера 1) и визуальные, и графические образы привязываются в качестве постусловий к молингам и заносятся непосредственно соответственно в блок расчетных моделей 13 и блок визуальных и графических образов 14. Т.е. элинги представляют собой гибридные системы, где связаны часть, работающая на основе методов направления искусственный интеллект, и стандартные подсистемы на основе методов математического моделирования, подсистемы численных расчетных моделей при использовании визуальных и графических образов.
Моделирование отдельных предложений молингами обеспечивает декларативное представление базы знаний.
Уже отмечалось, - знания в исходных текстах повторяются. При вводе знаний в виде молинг в блок базы знаний 10 (фиг.4), делаются пометки (идентификаторы), из какого исходного текста ввод. Повторение знаний, имеющихся в базе знаний, повышает их достоверность (пометки дублированных знаний в виде набора идентификаторов сохраняются). А то, чего нет, - вводится и увеличивает объем базы знаний в блоке базы знаний 10. Т.е. каждая новая версия эллинги с дополнительно введенными текстами имеет монотонно возрастающую в объеме базу знаний.
Таким образом, база знаний элинги представляет собой «паутину» - все расширяющуюся и сгущающуюся в местах «горбов» знаний, где они или полностью оказываются дублированными, или все более уточняют эту фокусную область знаний конкретной предметной области, что и есть «эффект гребня»
Одновременно такое построение базы знаний обеспечивает возможность вывода необходимого источника в виде, близком к исходному тексту, достаточно задать номер исходного текста из словаря введенных исходных текстов.
Режим логического вывода 22 реализуется машиной логического вывода 9 и приведен на фиг.5.
Машина логического вывода 9 выполняет две основные функции:
- просмотр терминов из рабочей памяти 31 машины логического вывода 9 и молинг из блока базы знаний 10 и добавление (при возможности) в рабочую память 31 новых терминов (для вывода);
- определение порядка просмотра и применения молинг. Этот механизм управляет процессом вывода, сохраняя для пользователя информацию о полученных заключениях в блоке рабочей части диалога 15.
Логический вывод основан на правиле - «если известно, что истинно утверждение А и истинно правило вида «ЕСЛИ А, ТО В», тогда утверждение В также истинно». Применительно к молингам, которые представимы короткой семантической сетью в виде связанного графа (где вершинами являются термины из блока БД словарей 12), оно имеет вид, - «если имеет место определенный уровень истинности утверждения (термина) А и существует цепь в молинге, связывающая А с утверждением (термином) В, то имеет место определенный уровень истинности (достоверности) утверждения (термина) В». Этот уровень достоверности определяется факторами уверенности (код 5) молинги.
Пример вывода показан на фиг.6, где пользователь 4 задал запрос - найти связь между двумя разными терминами - термин 1 и термин 9. Ищется на основе прямого вывода по указанному выше правилу с ограниченным перебором (количество промежуточных терминов не более шести). Результат вывода - последовательность молинг с порядковыми номерами (i), (i+k) (i+k+r) помещается блок рабочей части диалога 15.
Машина логического вывода 9 (фиг.5) циклична. В одном цикле может сработать только одна молинга. Если несколько молинг успешно сопоставлены с терминами, то машина логического вывода 9 производит выбор по заданным критериям единственной молинги, которая срабатывает в данном цикле.
В режиме работы с диалогом 21, реализуемым блоком рабочей части диалога 15, всю необходимую информацию и результаты вывода в виде групп последовательностей ядер молинг выдают пользователю 4 через компьютер 1. Пользователю 4 поступают по группам все последовательности логического вывода ядер молинг с номерами (i), (i+k), (i+k+r) разной длины в порядке убывания фактора уверенности (код 5) при заданном запросе для вывода на основе термин 1 - термин 9 Пользователь 4, читая группы последовательность ядер молинг, а фактически группы последовательностей простых предложений, семантически связанных между собой, сам решает, удовлетворяет его этот результат - вновь синтезированный текст или нет. И может фиксировать необходимую ему группу (или группы) в блок сохраненной части диалога (вместе с терминами запроса) 16, вместе со всеми результатами постусловий при запуске расчетных моделей из блока расчетных моделей 13 или визуальных и графических образов из блока визуальных и графических образов 14. Если ответ его полностью не устраивает, пользователь 4 имеет возможность или снова повторить режим логического вывода 22 с новыми вариантами запроса или по какому-то ядру молинги запустить режим когезии 24 (локальной связанности текста) или когерентности (глобальной связанности текста, который реализуется как расширенный вариант режима когезии 24).
Режим когезии 24 обеспечивает вывод в блок рабочей части диалога 15 из блока базы знаний 10 последовательностей ядер молинг, имеющих, как минимум, один идентификатор, соответствующий заданному пользователем, что соответствует выводу абзаца исходного текста (блоки 25 или 26, или 27). Запрос пользователя о выводе всего исходного текста, соответствующего интересующему его ядру молинги (простого предложения), равнозначен использованию эффекта когерентности исходного текста или режима вывода исходного текста 23. Объем может задаваться пользователем 4 - в объеме параграфа, в объеме главы, в объеме всего исходного текста.
Режим вывода текстов 23 может задаваться пользователем 4 через блок распределения заданий 8. Последний активизирует блок рабочей части диалога 15 и по запросу пользователя 4 производится вывод из блока базы знаний 10 тех или иных исходных текстов в виде последовательности ядер молинг по подобранным идентификаторам. Все это передается в компьютер 1 для пользователя 4.
Программная реализация режима вывода текстов 23 и режима когезии 24 в машине логического вывода 9 представлены на фиг.7. Это позволяет в любой момент пользователю 4 вывести любой текст (или его часть), вызвать выизуальные и графические образы, запустить через постусловия необходимые ему расчетные модели.
Иначе (обобщенно) в элинге создается специальная среда для ускоренного и эффективного нахождения рациональных решений. Она заключается в следующих этапах:
1. Задание запроса пользователем 4 по интересующему его вопросу;
2. Элинга быстро выдает пользователю 4 взаимосвязанный поток текста (блоками), который логический вывод может за заданный короткий промежуток времени обеспечить, причем упорядоченный по уровню достоверности выводов. При первом запросе - такой ответ системой называется «начальным», далее уточняемым и развиваемым;
3. Пользователь анализирует получаемые результаты и, если необходимо, продолжает вывод (блоками) подготовленного результата, или уточняет интересующие его детали, или делает новый запрос, т.е. переходит к пункту 1;
4. Когда пользователь 4 убеждается, что он получил от системы, то, что ему надо, или удовлетворительного ответа получить невозможно, он заканчивает поиск.
Здесь также, как и в ТРИЗ, и при «мозговом штурме», создаются условия для возникновения у пользователя 4 новых ассоциаций, которые ведут к ускоренному нахождению решений с высокой оригинальностью и эффективностью. Этот процесс соответствует изложенному у М.Желены процессу поиска решения на основе самовоспроизводства. В этом процессе все аспекты решения (критерии, альтернативы, представления и оценки) непрерывно исследуются и приспосабливаются в течение всего процесса. При этом возникает круговой и рекурсивный, но постепенно сужающийся поиск устойчивой конфигурации решения, начиная с «начального».
Применяемый в элинге подход назовем диалого-ассоциативным поиском. Каждый раз при подаче запроса сложно сказать, найдет ли пользователь необходимый ответ и каков он будет, но зато можно уверенно утверждать, что пользователь разберется в интересующем его вопросе намного лучше. И, одна из главных особенностей, - быстро, поскольку, не надо обращаться вначале - ни в другие книги, ни в другие библиотеки, ни к другим специалистам, ни в другие отделы, ни в другие организации (конечно при достаточной развитости базы знаний элинги).
Для снижения опасности копирования элинг и времени реакции на задаваемые вопросы (в процессе эксплуатации) используется специальное устройство считывания для запуска машиночитаемых носителей 5 с элингами и специальные методы защиты машиночитаемых носителей 5, - как механическим путем, программным, так и организационным.
А именно:
- с целью затруднения копирования, - машиночитаемый носитель 5 имеет механические изменения, препятствующие его считыванию на другого типа устройствах считывания, причем разъемы 3, 6 имеют размеры, отличные от стандартных;
- все содержимое блоков на машиночитаемом носителе 5 с каждой новой версией шифруется с использованием блоков шифратор/дешифратор 7, препятствуя считыванию элинг;
- набор молинг в блоке базы знаний 10 каждой новой версии имеет изменения, препятствующие работе со старой машиной логического вывода 9, в частности, изменяются разделители кодов молинг и их последовательность;
- машина логического вывода 9 каждой новой версии имеет изменения, препятствующие работе с наборами молинг в старых базах знаний, в частности, изменены элементы работы с блоком базы знаний 10 в связи с новыми разделителями кодов молинг и их последовательностью.
Ядро ПС, которое обеспечивает работу с элингой, считывается в оперативную память компьютера 1 с машиночитаемого носителя 5 и оно находится в самом начале в блоке распределения заданий 8 машиночитаемого носителя 5.
Класс G06N5/00 Компьютерные системы, использующие модели, основанные на знаниях