s
Sesiya.ru

Информационный процесс представления знаний

Информация о работе

Тема
Информационный процесс представления знаний
Тип Статьи
Предмет Информатика
Количество страниц 8
Язык работы Русский язык
Дата загрузки 2014-12-23 14:06:44
Размер файла 39.61 кб
Количество скачиваний 18
Скидка 15%

Поможем подготовить работу любой сложности

Заполнение заявки не обязывает Вас к заказу


Скачать файл с работой

Помогла работа? Поделись ссылкой

Информационный процесс представления знаний.


1. Понятие знания.
Определяющим фактором, который снижает эффективность существующих АИТ, является применение жестких (формали¬зованных) моделей, неадекватных реальным объектам и про¬цессам, для синтеза которых используется только количествен¬ная информация предметной области. Строгий математичес¬кий аппарат, применяемый для синтеза формальных моделей, не позволяет учесть все многообразие факторов, влияющих на состояние или поведение объекта управления. Поэтому на прак¬тике большинство лиц, принимающих решения, как правило, дополнительно используют собственные эвристические, инту¬итивные модели и алгоритмы решения прикладных задач. Ре¬шения, получаемые при этом, неоптимальные в математичес¬ком смысле, тем не менее учитывают сложную природу взаи¬мосвязи реальных объектов, процессов и их элементов между собой и внешней средой. Поэтому синтез моделей объектов или процессов, которые учитывают еще и профессиональные знания (опыт, интуицию) ЛПР, позволяет повысить обосно¬ванность принимаемых решений и добиться нового качества управления сложными организационными системами.
Одним из основных путей повышения качества управления сложными организационными системами является создание интеллектуальных информационных технологий (ИИТ).
Создание ИИТ связано с решением комплекса проблем син¬теза базы знаний (БЗ) в экспертных системах. Синтез БЗ является не только сложной научной пробле¬мой, но и длительным, трудоемким и слабоструктурирован¬ным процессом. До 90 % времени при создании систем с БЗ идет на процесс приобретения и формализации знаний. Эффективность экспертных систем в значительной степени опре¬деляется знаниями, введенными в БЗ. Экспертная система яв¬ляется средством информационной технологии, автоматизи¬рующим процесс представления знаний и его процедур - по¬лучения и генерации (вывода) знаний.
Создание и модификация базы знаний осуществляются со¬вместными усилиями эксперта и инженера по знаниям. Для этой цели создается интеллектуальный редактор БЗ, представляющий собой программу диалогового взаимодействия, облегчающую работу с базой знаний. Решатель (блок логического вывода) производит вывод (генерацию) нового знания, т. е. решает поставленную задачу на основе имеющихся в базе зна¬ний. При желании пользователь ЭС может получить объяснение того, как была решена задача. Для этого в ЭС включают блок объяснений. Взаимодействие с экспертной системой пользователя происходит при помощи интерфейса пользователя. Центральным блоком экспертной системы является база знаний.
Обязательным элементом, определяющим эффективность фун¬кционирования любой системы искусственного интеллекта (СИИ), являются знания. В таких системах, в частности в об¬ласти интеллектуальных автоматизированных информационных технологий, нет общепризнанного формального опреде¬ления понятию "знания". Определение термина "знания" вклю¬чает в себя большей частью философские элементы. Часто зна¬ния рассматривают как данные, имеющие развитую и более сложную структуру. Наиболее близко к рассматриваемой про¬блеме приобретения и представления знаний находится следу¬ющее определение: знания – это специальная форма представ¬ления информации, позволяющая человеческому мозгу хра¬нить, воспроизводить и понимать ее.
Однако далеко не вся информация выступает в виде зна¬ния, которое рассматривается как ее высшая и притом совершенно особая форма. Знания есть особая информация, зафик¬сированная и выраженная в языке. Поэтому основные типы отношений, определяющие связь знаний с внеязыковым ми¬ром, друг с другом и системой человеческих действий, долж¬ны подчиняться особым закономерностям (правилам) семан-тики, синтаксиса и прагматики.
Таким образом, знания - это не только особая форма ин¬формации, но и особая система отношений.
В качестве рабочего можно принять следующее определе¬ние: знания - это особая форма информации, представляю¬щая собой совокупность структурированных теоретических и эмпирических положений предметной области, которые представлены в различной форме, обладают определенными свойствами, связаны синтаксическими, семантическими и праг¬матическими отношениями и позволяют решать прикладные задачи.
Грань, отделяющая информацию от знаний, условна.
Знания существуют в следующих формах: в памяти чело¬века (эксперта); материализованные (канонизированные) зна¬ния (учебники, монографии и т.п.); полуформализованная структурированная модель (поле) знаний; формализованное знание на некотором языке представления и в БЗ. Знания в СИИ представлены на уровнях: концептуальном, логическом и фи¬зическом.
Содержание знаний является основой для выбора структуры их представления.
Наибольший интерес для построения баз знаний СИИ пред¬ставляют концептуальные и экспертные знания.
Концептуальные знания выражают свойства объектов, процессов и ситуа¬ций через понятия (базовые элементы) соответствующей об¬ласти. Описание понятия включает описание его компонен¬тов, указания взаимосвязи с другими понятиями, а также операциональную часть, содержащую зависимости между компо¬нентами понятий. Применять их целесообразнее при решении задач анализа.
Экспертные знания - это знания специалистов предметной области. Они аккумулируют накопленный практический опыт, навыки и приемы в соответствующей области. Этот тип знаний играет наиболее важную роль в слабоструктурированных предметных областях, в которых отсутствуют формальные модели. Их роль также велика в тех областях, где применимы формальные методы, но при этом необходимо принимать ре¬шения и делать выбор в первую очередь на основе опыта. Совместное использование концептуальных и экспертных знаний являет¬ся крайне важным и перспективным, ибо они вместе покрыва¬ют значительную часть плоскости знаний СИИ и позволяют сочетать ассоциативные и логические рассуждения для реше¬ния задач при низких вычислительных затратах.
Синтаксические знания характеризуют синтаксическую структуру описываемого объекта или процесса, которая не зависит от смысла и содержания используемых при этом по¬нятий. Семантические знания содержат информацию, непос¬редственно связанную со знанием и смыслом описываемых объектов и процессов. Прагматические знания описывают объек¬ты и процессы относительно целей решаемой задачи.
К понятию знание близко примыкает понятие предметной об¬ласти. Предметной области (ПрО) как совокупности элементов, S объектов, явлений, процессов, их количественных и качественных характеристик, а также связей между ними, объединенных общей идеей, определенным смыслом или понятием более высо¬кого уровня. Эта область может быть описана в виде некоторой совокупности сведений о ее структуре, основных характеристи¬ках, процессах, протекающих в ней, а также способов решения задач. Значительная роль принадлежит отношениям. Именно они определяют смысловую сторону, окончательно формиру¬ют конкретную ПрО, выделяя ее из других областей или слу¬чайного скопления фактов. Упорядоченная и систематизиро¬ванная совокупность знаний образует модель знаний ПрО.

2. Модели представления знаний
Представление знаний в СИИ является не только фундамен¬тальным понятием, но и решающим аспектом их разработки. Выбор модели представления знаний (МПЗ) важен ввиду их многообразия и размытости критериев выбора, ибо он оказы¬вает огромное влияние на любую часть СИИ и предопределя¬ет их возможности (свойства и характеристики). Последствия неудачного решения проблемы представления знаний могут быть катастрофическими. Кроме того, используемый в СИИ формализм представления знаний определяет характер их по¬лучения и накопления, в результате которого создается БЗ, ориентированная на определенную структуру представления, а не на сущность самих знаний. Выбор модели, неадекватной типам знаний, приводит к потере многих существенных де¬талей прикладной задачи и порождает тривиальный интел¬лект.
Проблемы представления знаний в компьютерных системах решаются на трех уровнях:
• техническом(физическом) - реализация сложных представлений зна¬ний, требующая ЭВТ с чрезвычайно сложной функциональ¬ной архитектурой, обеспечивающей параллельные вычисления и гарантирующей протекание процесса представления в режи¬ме реального времени, а также мощными запоминающими ус-тройствами;
• программном (логическом) - создание программ, которые обеспечивают выполнение всех алгоритмов, необходимых для представления знаний;
• концептуальном - выработка концепций, моделей, обра¬зующих методологию искусственного интеллекта.
Под представлением знаний подразумевают соглашение о том, как описывать реальную ПрО (понятия и отношения). Иногда такое соглашение называют нотацией. Каждая модель знаний определяет форму представления знаний и является формализмом, призванным отобразить объекты, связи между ними и отношения, иерархию понятий ПрО и изменение отно¬шений между объектами.
Для решения проблемы представления знаний разработа¬ны разнообразные МПЗ. В системах искусственного интеллек¬та используются в основном четыре их типа: логические, про¬дукционные, семантические сети и фреймы.
Логические схемы представляют знания в виде формул, ко¬торые состоят из констант, переменных, функций, предикатов, логических связок и кванторов. Каждая логическая формула дает частичное описание состояния предметной области.
Обычно они используются в сочетании с другими МПЗ.
Продукции (правила) задаются в виде выражений:
ЕСЛИ условие ТО действие;
ЕСЛИ причина ТО следствие;
ЕСЛИ ситуации ТО решение.
Суть этих выражений заключается в том, что если выполня¬ется условие, то нужно произвести некоторое действие. В процедурных системах присутствуют три ком¬понента: база данных, некоторое число продукционных правил, состоящих из условий и действий, а также интерпретатор, кото¬рый последовательно определяет, какие продукции могут быть активированы в зависимости от содержащихся в них условий. В базе данных хранятся известные факты выбранной ПрО. Про¬дукционные правила (продукции) содержат специфические знания ПрО о том, какие еще дополнительные факты могут быть учтены, есть ли специфические данные в базе данных. В СИИ, построенных на использовании продукционных МПЗ, база дан¬ных представляет собой переменную часть, а правила и интер¬претатор не изменяются. Благодаря свойству модульности, присущему продукционным МПЗ, можно добавлять и изме¬нять знания (правила, факты). Поэтому продукционные МПЗ применяются в ПрО, где нет четкой логики и задачи решают¬ся на основе независимых правил (эвристик).
Следующим шагом на пути выявления структуры, присущей знаниям, являются модели, в которых в явной форме выделяются все отношения, образующие эту структуру, с описанием их семантики.
Семантические сети основываются на результатах изуче¬ния организации долговременной памяти человека. Характер¬ной особенностью для семантических сетей является то, что они для образования своей структуры используют два компо¬нента - вершинам сети соответствуют понятия (объекты, события, процессы, явления), а дугам, их соединяющим, - отно¬шения между понятиями.
В семантических сетях знания представлены в терминах ес¬тественного языка и отношений между ними (элемент-класс; класс-подкласс, функциональные дуги). Основными общими характеристиками сетей являются сле¬дующие: описание объектов производится на естественном языке; все знания накапливаются в относительно однородной структуре памяти; на сетях определяются унифицированные отношения между объектами, которым соответствуют унифи¬цированные методы вывода; методы вывода в соответствии с запросами определяют участки семантического знания, имеющего отношение к поставленной задаче, формулируя акт понимания запроса и некоторую цепь выводов, соответствующих решению задачи.
В целом семантические сети позволяют представлять семан¬тику ПрО, а также осуществлять за счет наличия связей и от¬ношений между понятиями целевую ориентацию и, таким об¬разом, отражать прагматическую составляющую знаний.
Фреймы - это особые познавательные структуры, дающие целостное представление об явлениях и их типах.
Фреймы отражают концептуальную основу организации памяти человека.
Рассмотренные МПЗ наследуют ряд структур данных и являются в некотором смысле их разновидностями, хотя и используются в СИИ для обработки знаний.
Общими слабыми сторонами МПЗ являются ограниченные! выразительные возможности для описания экспертных знаний, невозможность описания знаний сложной структуры, недостаточная вычислительная эффектив¬ность.
Сейчас ведется поиск новых МПЗ, базирующихся на идеях, отличных от формальной системы или сети понятий, ориен¬тирующихся на языковые конструкции (семантику естествен¬ного языка).


3. Приобретение и формализация знаний
Ключевой проблемой при построении СИИ является приоб¬ретение знаний. От качества и полноты знаний, введенных в БЗ, в решающей степени зависят эффективность работы СИИ и качество решения задач.
В теории ЭС принята методология постепенно нарастающей разработки, которая базируется на концепции быстрого про¬тотипа.
Прототип ЭС представляет собой один или несколько ва¬риантов усеченной версии ЭС, демонстрирующих жизнеспо¬собность выбранного подхода и правильность принятых ре¬шений. В условиях отсутствия формальных методов работы со знаниями технология быстрого прототипа позволяет эмпи¬рически проверить правильность принятых проектных реше¬ний на каждом этапе создания ЭС и считается эффективной.
Особую важность имеет процедура приобретения знаний (рис. 1), так как мощность ЭС зависит в первую очередь от количества и качества знаний, хранимых в ней.
Процессу приобретения знаний присущи проблемы психо¬логического, гносеологического и лингвистического свойства.
Указанные проблемы рассматриваются в плане облегчения и повышения эффективности взаимодействия эксперта и инженера по знаниям, повышения степени адекватности модели знаний ПрО реальной ПрО, построения языка структуризации и формализации относительно синтаксиса, семантики и прагма¬тики МПЗ.
В осуществлении данного процесса принимают участие инженеры по знаниям, программисты и источники знаний, в качестве которых могут выступать эксперты, материализованные источники (учебники, монографии, статьи, инструкции и т.п.) и (или) эмпирические факты, примеры и данные ПрО.
Инженеры по знаниям и эксперты в процессе приобретения знаний могут выполнять различные функции в зависимости от применяемых методов извлечения, получения и форми¬рования знаний, а также наличия и степени развитости средств автоматизации.
В общем случае инженер по знаниям в процессе получения знаний выполняет следующие основные взаимосвязанные функции: управления процессом коммуникации в форме последовательности содержательных сообщений; переработки, включающей все возможные способы, процедуры анализа и синтеза информации, идентификации и конструирования понятий, выяснения и фиксации их смысла, а также установления отношений между ними и когнитивными элементами; хранения инфор¬мации путем запоминания, выборки и документирования.
















Рис. 1. Процедура приобретения знаний
Процесс приобретения знаний и разработки прототипа ЭС стремятся максимально автоматизировать. Основная задача автоматизации приобретения знаний состоит в облегчении труда эксперта и инженеров по знаниям - разработчиков СИИ. Эта задача может быть решена двумя путями:
• передача части функций, выполняемых инженерами по знаниям в процессе приобретения знаний, автоматизирован¬ной системе;
• полное исключение экспертов и инженеров по знаниям из процесса путем создания автоматизированных систем приоб¬ретения знаний.
Применение автоматизированных систем приобретения знаний позволяет реализовать три стратегии получения зна¬ний. В рамках первой стратегии основные функции по акту¬ализации и формированию знаний выполняет эксперт, обра¬щаясь при этом за помощью к СИИ. Благодаря этой помощи эксперт структурирует, систематизирует и формализует свои знания, используя некоторый формализм. В результате полу¬чаются готовые формы знания для непосредственного коди¬рования и ввода в БЗ. Такая стратегия позволяет исключить инженеров по знаниям из технологической цепочки приобре¬тения знаний и все его функции возложить на автоматизиро¬ванную систему.
В рамках второй стратегии получения знаний ведущей стороной в диалоге является автоматизированная система. По ответам эксперта СИИ конструирует готовые формы знания и затем передает их в другие компоненты СИИ для включения в состав БЗ. Инженер по знаниям полностью исключается из рассмотренной технологической цепочки получения знаний.
Третья стратегия приобретения знаний связана с исклю¬чением из классической технологии и инженера по знаниям, и программиста. Заполнение знаниями таких СИИ может быть осуществлено без изменения механизма логического вывода с помощью редактора знаний. Основная функция редактора знаний - заполнение БЗ нужными знаниями самим экспертом.
В технологическом плане крайне необходимым является решение проблемы работы со знаниями в рамках единого под¬хода, реализующего выбор МПЗ, формализацию знаний и со¬здание СИИ, реализующей идею автоформализации знаний самим экспертом.
Рассматривая методы приобретения знаний, будем использо¬вать следующие термины: извлечение, получение, формирова¬ние, приобретение знаний и обучение БЗ. Определим сущность указанных терминов. Под извлечением знании понимают процесс приобретения материализованных знаний из тексто¬логических источников информации при помощи совокупности методов и процедур, которые позволяют переходить от знаний в текстовой форме к их аналогам для ввода в базу знаний СИИ.
Получение знаний – это процесс приобретения вербализуемых и невербализуемых знаний эксперта, основан¬ный на использовании непосредственно им самим или инже-нером по знаниям приемов, процедур, методов и инструмен¬тальных средств.
Формирование знании - это процесс автоматического при¬обретения (порождения) системой искусственного интеллекта или инструментальным средством нового и полезного знания, из исходной и текущей информации, которое в явном виде не формируют эксперты, в целях освоения новых процедур ре¬шения прикладных задач на основе использования различных моделей машинного обучения.
Под приобретением знании бу¬дем понимать процесс, основанный на переносе знаний из раз¬личных источников в базу знаний путем использования раз¬личных методов, моделей, алгоритмов и инструментальных средств.
Понятие получение знаний соотносится с понятиями извле¬чение, приобретение, формирование знаний как часть-целое.
Обучение базы знаний - это процесс ввода (переноса) приоб¬ретенных знаний в СИИ на основе применения совокупности методов, приемов и процедур в целях ее заполнения, расширения и модификации. Термин обучение рассматривается как свойство БЗ, как совокупность методов, приемов и процедур ввода знаний в БЗ и как процесс переноса знаний в СИИ.
Большинство методов извлечения и получения знаний ос¬новано на прямом диалоге с экспертом.
Методы извлечения знаний.
Они состоят из текстологичес¬ких методов и методов автоматической обработки текстов.
Текстологические методы предназначены для получения знаний из материализованных источ¬ников, в качестве которых выступают монографии, учебники, статьи, методики, инструкции и другие носители профессио¬нальных знаний. Текстологические методы являются наименее разработанны¬ми. Эти методы основываются не только на выявлении и по¬нимании смысла текста, но и на выделении базовых понятий и отношений, т. е. формировании семантической (понятийной) структуры ПрО.
На процесс понимания существенно влияют когнитивный стиль инженера по знаниям и его интеллектуальные характеристики. В инжене¬рии знаний разработана методика анализа текстов в целях из¬влечения и структурирования знаний. Методика предусмат¬ривает овладение инженером по знаниям микроструктурой текста, вычленение ключевых слов (компрессию или сжатие текста) и последующее формирование поля знаний.
Сжатие текста служит методологической основой для ис¬пользования текстологических процедур извлечения знаний. Текстологические методы применяются, как правило, на начальном этапе создания СИИ.
Значительное развитие получили методы извлечения зна¬ний при применении современных информационных техноло¬гий, в частности гипертекстовой технологии.
Гипертекст - это организация нелинейной последователь¬ности записи и чтения информации, объединенной на основе ассоциативной связи.
Метод автоматической обработки текстов разработан на основе статистической обработки семантических единиц. Метод и программные средства автоматизированного извлечения знаний из текстов базируются на формальных про¬цедурах обнаружения в текстах семантических единиц различ¬ной выраженности.
Семантические единицы получаются путем статистической обработки текстов, в основе которой лежат универсальные ме¬ханизмы определения частотных характеристик терминов. За¬дача извлечения знаний решается в два этапа: сначала форми¬руется терминологическая сеть (поле знаний), а затем опреде¬ляется ассоциативная близость терминов на основе статисти¬чески определенной меры ассоциации. Достоинство рассмотренного метода состоит в автоматическом выявлении значи¬мых слов и связей с учетом статистической информации о ги¬пертексте в целом.
Указанные новые подходы к автоматизации извлечения знаний пока находятся на стадии исследований и не нашли применения в практике создания СИИ.
Методы получения экспертных знаний.
К ним относятся, например, коммуникативные методы, основанные на прямом диалоге экспертов и инженеров по зна¬ниям как без использования СИИ, так и с применением СИИ (технологии окон, меню).
Коммуникативные методы получения знаний рассматрива¬ются как разновидности интервьюирования. Для них харак¬терны следующие основные особенности:
1. Не имеют формального определения и носят качествен¬ный характер. Полученные с их помощью знания несут на себе отпечаток самонаблюдений эксперта и субъективную интер¬претацию инженера по знаниям.
2. Требуют словесного выражения экспертом своих знаний, что является непростой задачей. Неточность и неадекватность словесных описаний мыслительных процессов и применяемых эвристических приемов, используемых при решении задач, ведут к серьезным последствиям.
3. Сложность выражения процедурных знаний при их сло¬весном описании.
4. Крайняя сложность явного описания знаний, которые являются результатом компиляции и автоматизма процессов мышления, а также интуиции эксперта. В психологии доказа¬но, что интуиция на самом деле является способностью рас¬познавать образы. Однако словесное описание способности к распознаванию образов дать крайне трудно.
5. Трудоемкость организации и неэффективность взаимо¬действия инженера по знаниям и эксперта. На них приходятся большие интеллектуальные нагрузки, связанные с вербализа¬цией знаний, управлением процессом коммуникации и необ¬ходимостью освоения, анализа и документирования больших объемов новых знаний.
Коммуникативные методы получения знаний отличаются своей низкой эффективностью. Так, при непосредственном взаимодействии инженера по знаниям и эксперта теряется до 76 % информации.
Один из путей совершенствования процесса приобретения знаний состоит в разработке методов, позволяющих передать часть функций, выполняемых инженером по знаниям, самому эксперту или СИИ.
Методы формирования знаний.
Трудности извлечения зна¬ний из текстовых источников и получения их от экспертов сти¬мулировали развитие методов формирования знаний, извест¬ных, как методы "машинного обучения".
Для развитых СИИ способность обучаться, т.е. самостоятель¬но формировать новые знания на основе текущих знаний, собственного опыта решения прикладных задач, является их существенной характеристикой. Методы формирования знаний лежат в основе автоматических систем приобретения знаний.
Автоматические системы формирования знаний являются более предпочтительными, так как уменьшается вероятность ошибок в приобретаемых знаниях и снижается время их приобретения.
Главный вопрос, на который должны ответить методы формирования знаний, состоит в следующем: как от частного перейти к общему? Базисом всех методов формирования знаний является индукция, которая лежит в основе получения общих выводов из совокупности частных утверждений.
Вывод. Основным направлением повышения эффективности процесса представления знаний, является его автоматизация.
В настоящее время ведется интенсивная разработка разно¬образных средств автоматизации приобретения знаний. Выделяют следующие средства автоматизации, которые получи¬ли наименование инструментальных средств: языки програм-мирования, языки символьной обработки, языки инженерии (представления) знаний, средства автоматизации проектиро¬вания ЭС (интегрированные гибридные среды или комплек¬сы) и оболочки ЭС (пустые или инструментальные ЭС).
Все многообразие существующих СИИ используется для создания быстрого прототипа. Некоторые СИИ являются де¬монстрационными и иллюстрируют границы ведущихся иссле¬дований.
Тенденция качественного совершенствования СИИ связа¬на с возможностью реализации в них совокупности автомати¬зируемых функций управления процессом приобретения зна¬ний, переработки знаний и их хранения.
Для эффективного ис¬пользования в системах управления интеллектуальная инфор-мационная технология должна быть способной выполнять следующие функции:
• описывать знания с помощью языков представления зна¬ний;
• организовывать накопление, хранение, анализ, обобще¬ние и структурирование знаний;
• вводить новые знания и объединять их с существующими знаниями в СИИ;
• выводить новые знания из имеющихся знаний, оперировать с не¬полными и неточными знаниями;
• устранять устаревшие знания, быстро находить требуемые, проверять непротиворечивость накопленных знаний;
• осуществлять интеллектуальный интерфейс между пользо¬вателем и знаниями.
Вопросы для самоконтроля.
1. Определение и виды знаний.
2. Модели представления знаний.
3. Основные этапы приобретения знаний.
4. Основные этапы формирования знаний.
5. Методы извлечения знаний.
6. Методы получения экспертных знаний.
7. Примеры интеллектуальных информационных технологий.

© Copyright 2012-2020, Все права защищены.