Курс Управление знаниями - продолжение и окончание

Лекция 6 - 24 и 26 марта 2010 г - окончание

...

Лекция 6

24 и 26 марта 2010 г


- окончание

Примеры –

- ПО программы GEOBASE
- ПО простейших видов деятельности (заварка чая, колка дров)
- ПО более сложных видов деятельности - индустриального строительства

Какие материальные, ментальные, знаковые объекты входят в эту ПО


Локальные системы обработки знаний.

Мы их изучали на примере экспертных систем – ЭС.

ЭС – это программа, заменяющая пользователю эксперта (его знания) в определенной ПО. Значит, ЭС содержит некоторую сумму знаний о ПО. Но, для того, чтобы их обработать, нужен КР. Все это управляется оболочкой (shell), отвечающей также и за диалог с «юзером» и за другое, что будем изучать позже.

Пока же мы отметим относительность этого определения. Для многих юзеров век назад калькулятор был бы ЭС.
Поэтому различают ЭС 1-го и 2-го рода.

ЭС 1-го рода – это по сути эл. справочник. В диалоге с пользователем ЭС выясняет какая часть справочника ему нужна и выдает ему под видом знания.

Только ЭС 2-го рода могут порождать новые знания в ответ на запрос пользователя. Они устроены гораздо сложнее.

Это не умаляет пользы и значимости ЭС 1-го рода.

Динамические и статические ЭС


Построение и функционирование ЭС

Первый шаг – определение и построение ПО, так как ЭС именно заменяет знания эксперта в определенной ПО.

Какие знания представляет пользователю ЭС – как научные (НЗ), так и обыденные (ОЗ). Действительно, про ЭС, диагностирующую неисправности автомобилей, трудно сказать, что она дает пользователю научные знания.

Типовая схема ЭС.

ЭС содержит следующие компоненты –

КВ – база знаний
И
КР – когнитивный процессор или машина вывода
Являются ее основными частями.

Этими двумя компонентами, являющимися ядром ЭС управляет управляющая программа, осуществляющая также связь этих двух главных компонент с другими блоками.
В числе этих (в общем-то вторичных) компонент следует назвать интерфейс с пользователем.

Есть еще другой интерфейс – у ЭС, отвечающий за наполнение ее базы знаний (КВ). С этим интерфейсом работают как минимум два человека – эксперт (носитель знаний, которые будет представлять для пользователя эта ЭС) и инженер знаний, который эти знания выявляет и кодирует.

Здесь мы впервые встречаемся с термином инженерия знаний, введенным Фейгенбаумом в 70-е годы ХХ века.
Способов выявления и кодирования З много и о них мы уже начали говорить и будем говорить ниже.

Можно заметить, что ЭС Мицар, которая есть лабораторная работа может рассматриваться как структурированное интервью эксперта при помощи самой ЭС.

Блок объяснений – очень важная и обязательная, но незаметная компонента ЭС.

Действительно, чем сложнее знания и ПО, тем ответственнее ответ ЭС. Не всегда он очевиден и сама ЭС может ошибаться или неправильно понять вопрос пользователя.

Поэтому пользователь через блок объяснений вправе затребовать протокол рассуждений ЭС. Который привел к данному решению.

ЭС Мицар – см. на сайте и в курсе лекций.

Функциональная классификация ЭС

см. в курсе лекций.





ЭС – определение, структура, классификация


см. в курсе лекций.

Концептуализация - это процесс формирования знания, исходя из известной предметной области

Язык описания знаний KNOW

см. в курсе лекций.

...



Когда мы говорим КС - кибернетическая система - то подразумеваем неживую кибернетическую систему - например - компьютер. Хотя, строго говоря, человек - это тоже КС.


Итак – мы продолжаем изучать и развивать следующие тезисы –

1. Знание расположено в нашем сознании и мы пытаемся поместить его в КС.
2. Обмен знаниями и генерация новых знаний требуют определенной степени доверия и специальной программной поддержки.
3. Новые технологии развивают новые виды когнитивного поведения и новые когнитивные механизмы, работающие в КС.
4. Обмен знаниями и генерация новых знаний должны быть стимулированы и вознаграждены различными способами.
5. Необходима и важна поддержка этого процесса в форме специальных когнитивных процедур управления, программных и аппаратных ресурсов
6. Знание, генерация новых знаний, разработка процедур генерации новых знаний есть творчество и должно быть поддержано и стимулировано к развитию даже самыми неожиданными способами.

Ниже будут описаны модели, которые различным образом реализуют эти тезисы.

Темы последних лекций

1. Извлечение знаний из знаковых произведений (текста)

2. Локальные когнитивные системы.

Модель 1 - локальная -

Экспертная система.

На ее примере мы отработали и изучили функционирование основных элементов когнитивной системы -

КР - когнитивный процессор

и

КВ - базу знаний

Go Global!

Глобальные КС

Сначала – определение – как мы уточняем определение З в глобальной модели.


Что здесь будет -

КР - когнитивный процессор

и что

КВ - база знаний?

Прототип КР - агент. Подробнее о нем позже.

Прототип КВ - это онтологии

Эти два компонента формируют саму основу любой глобальной системы обработки знаний (ГСЗ)

Итак -

В глобальной модели когнитивный процессор - это агент.

В глобальной модели знания – это онтология.

Как и почему к этому пришли?

Определения

Онтология – это точная спецификация концептуализации предметной области, позволяющая формировать модель знаний специалиста с помощью множества понятий и отношений, описывающих эту предметную область, а также правил и аксиом, определяющих их интерпретацию.

Подробнее см на сайте

http://dp-beg.narod.ru/stat3.html

Go Global – 1.

Semantic Web - первая глобальная распределенная когнитивеая модель.

Ее особенности и проблемы, которые пришлось решить при ее реализации.


Go Global – 2.


Web 2.0

Когнитивная социальная сеть.

Ее структура и проблемы, которые пришлось решить при ее реализации.

Go Global – 3.

BI - Business Intelligence

Бизнес моделирование

Локальный и глобальный варианты.


Структура этой модели и проблемы, которые пришлось решить при ее реализации.

-----

Эти модели пытаются решить основную проблему -

Проблема понимания знакового произведения (текста) кибернетичекой системой (КС) и донесения этого понимания пользователю.


Процесс понимания можно рассматривать по-разному

Мы здесь, исходя из ранее изученного материала будем его рассматривать как последовательность трех этапов (хотя это деление может быть сделано – возможно – и по другим критериям)

1. Слабый критерий понимания. Переход от знака к денотату – то есть это означает только то, о чем говорится в тексте. – Иными словами – результатом понимания будет денотатная структура, отражающая то, о чем говорится в тексте. После этого можно ответить на вопросы, ответы на которые явно сформулированы в тексте. На этом принципе работают современные «искалки» в Web 1.0. Они «выдают» только релевантные (относящиеся по их «мнению» к теме запроса) куски текста (сайта)

2. Сильный критерий понимания. Это то, что проверяют учителя после того как зададут классу читать учебник «от сих до сих». Нужно уметь ответить на вопросы, явно не сформулированные в тексте. То есть – снова - используя известный пример – если в тексте содержатся предложения – «Петров учится в МФТИ» и «Иванов и Петров учатся вместе», то считается что КС поняла этот текст в сильном смысле этого слова, если она способна ответить на вопрос – «Где учится Иванов?». Ответ на такой вопрос требует преобразования денотатной структуры текста в КВ – то есть в когнитивную базу знаний, после чего КР (когнитивный процессор), обращаясь к КВ, может генерировать свои ответы. Что-то похожее на работу с программой на Прологе- и не «что-то» - а на самом деле так.

Но! – Выдавая ответ о том где учился Иванов – КС все равно не понимает – ни что такое «учиться» ни кто такой Иванов и т п. А это бывает и не важно пользователю – как возможно и в первом случае.

3. Онтологический критерий понимания. Это когда КС понимает смысл денотатов – т е может их разъяснить. Этот критерий впервые был сформулирован в концепции Semantic Web – см ниже – модель 2. Для этого надо строить ОНТОЛОГИЮ соответствующих понятий. Подробнее об этом – в разделе про онтологии и Semantic Web.


Сейчас мы разберем подробнее слабый критерий. Сильный критерий (построение КБ и КР, их работа на примере ЭС) мы обсуждали раньше.

Основные проблемы

1. Проблемы перехода по связи «знак-денотат». Здесь переход прежде всего (это не все проблемы) не одно-однозначен в ту и другую сторону.

Самые частотные случаи –

- Полисемия – один знак- два и более денотата. Например – русское слово «решить» имеет два денотата – решить что-то делать и решить задачу. Кстати – на английский это переводится соответственно разными словами – “decision” и “solution”. Ясно, что это затрудняет переход к нужному денотату. Требуются специальные методы.
- Синонимия – наоборот – много знаков – один денотат. И попробуй понять, что денотат один, если в тексте употребляются слова «ПК», «компьютер», «ЭВМ».

2. Варьирование связи «знак-денотат».

Разберем три случая.

Метафора. Перенос значения (буквальный перевод с др. греческого). «Он получил хорошую оценку и вылетел из класса». Понятно, что он не вылетел – но как тогда установить денотат?

Метонимия. «Белый дом угрожает – Кремль молчит». Другая вариация (сдвиг) связи.

Анафора. – «Он ей это сказал» - для того, чтобы «выйти» на денотаты, на которые указывают «он», «ей», и «это», нужно обратиться к предыдущему тексту и найти сами первичные знаки, указывающие на денотаты, а это уже отдельная работа – “Anaphora resolution”.

К счастью, такие явления не часты в нехудожественных текстах и особенно на Web сайтах. И это не все проблемы, но важно знать их характер и свойства.


Более подробно о понимании см. на сайте ниже. Здесь мы обозначили только структуру и характер проблемы понимания в расчете на то, что это пригодится нам впоследствии.


...

Последние лекции




Лекции 7 и 8 –

Лабораторные работы – см на сайте

Лекции 9 и 10 – 14/16 и 21/23 апреля

Глобальные когнитивные системы ГКС

1. Semantic Web (SW)
2. Социальные сети
3. Global BI – производственные сети в глобальных сетях



Основные понятия

Агенты


Метаданные


Пирамида понятий SW и других ГКС -



Истина – вывод согласно запросу пользователя


Логика работы с онтологиями
Онтологии
RDF
URI

Как они используются в этих трех моделях

ПОСТ нотация как способ описания бизнес процессов


См также в тексте курса и в конспектах пред годов


Вопросы по выбору желательно брать именно по этой последней теме

Например – что такое RDF

Прочитать курс, сделать поиск в Сети и -

- Описать роль этого понятия в трех ГКС
- Описать его структуру (синтактику), семантику и прагматику.

Вот пример RDF – уметь все объяснить –

http://www.w3schools.com/rdf/rdf_example.asp





В начало



Сайт управляется системой uCoz