Информационный процесс представления знаний.
1. Понятие знания.
Определяющим фактором, который снижает эффективность существующих АИТ, является применение жестких (формали¬зованных) моделей, неадекватных реальным объектам и про¬цессам, для синтеза которых используется только количествен¬ная информация предметной области. Строгий математичес¬кий аппарат, применяемый для синтеза формальных моделей, не позволяет учесть все многообразие факторов, влияющих на состояние или поведение объекта управления. Поэтому на прак¬тике большинство лиц, принимающих решения, как правило, дополнительно используют собственные эвристические, инту¬итивные модели и алгоритмы решения прикладных задач. Ре¬шения, получаемые при этом, неоптимальные в математичес¬ком смысле, тем не менее учитывают сложную природу взаи¬мосвязи реальных объектов, процессов и их элементов между собой и внешней средой. Поэтому синтез моделей объектов или процессов, которые учитывают еще и профессиональные знания (опыт, интуицию) ЛПР, позволяет повысить обосно¬ванность принимаемых решений и добиться нового качества управления сложными организационными системами.
Одним из основных путей повышения качества управления сложными организационными системами является создание интеллектуальных информационных технологий (ИИТ).
Создание ИИТ связано с решением комплекса проблем син¬теза базы знаний (БЗ) в экспертных системах. Синтез БЗ является не только сложной научной пробле¬мой, но и длительным, трудоемким и слабоструктурирован¬ным процессом. До 90 % времени при создании систем с БЗ идет на процесс приобретения и формализации знаний. Эффективность экспертных систем в значительной степени опре¬деляется знаниями, введенными в БЗ. Экспертная система яв¬ляется средством информационной технологии, автоматизи¬рующим процесс представления знаний и его процедур - по¬лучения и генерации (вывода) знаний.
Создание и модификация базы знаний осуществляются со¬вместными усилиями эксперта и инженера по знаниям. Для этой цели создается интеллектуальный редактор БЗ, представляющий собой программу диалогового взаимодействия, облегчающую работу с базой знаний. Решатель (блок логического вывода) производит вывод (генерацию) нового знания, т. е. решает поставленную задачу на основе имеющихся в базе зна¬ний. При желании пользователь ЭС может получить объяснение того, как была решена задача. Для этого в ЭС включают блок объяснений. Взаимодействие с экспертной системой пользователя происходит при помощи интерфейса пользователя. Центральным блоком экспертной системы является база знаний.
Обязательным элементом, определяющим эффективность фун¬кционирования любой системы искусственного интеллекта (СИИ), являются знания. В таких системах, в частности в об¬ласти интеллектуальных автоматизированных информационных технологий, нет общепризнанного формального опреде¬ления понятию "знания". Определение термина "знания" вклю¬чает в себя большей частью философские элементы. Часто зна¬ния рассматривают как данные, имеющие развитую и более сложную структуру. Наиболее близко к рассматриваемой про¬блеме приобретения и представления знаний находится следу¬ющее определение: знания – это специальная форма представ¬ления информации, позволяющая человеческому мозгу хра¬нить, воспроизводить и понимать ее.
Однако далеко не вся информация выступает в виде зна¬ния, которое рассматривается как ее высшая и притом совершенно особая форма. Знания есть особая информация, зафик¬сированная и выраженная в языке. Поэтому основные типы отношений, определяющие связь знаний с внеязыковым ми¬ром, друг с другом и системой человеческих действий, долж¬ны подчиняться особым закономерностям (правилам) семан-тики, синтаксиса и прагматики.
Таким образом, знания - это не только особая форма ин¬формации, но и особая система отношений.
В качестве рабочего можно принять следующее определе¬ние: знания - это особая форма информации, представляю¬щая собой совокупность структурированных теоретических и эмпирических положений предметной области, которые представлены в различной форме, обладают определенными свойствами, связаны синтаксическими, семантическими и праг¬матическими отношениями и позволяют решать прикладные задачи.
Грань, отделяющая информацию от знаний, условна.
Знания существуют в следующих формах: в памяти чело¬века (эксперта); материализованные (канонизированные) зна¬ния (учебники, монографии и т.п.); полуформализованная структурированная модель (поле) знаний; формализованное знание на некотором языке представления и в БЗ. Знания в СИИ представлены на уровнях: концептуальном, логическом и фи¬зическом.
Содержание знаний является основой для выбора структуры их представления.
Наибольший интерес для построения баз знаний СИИ пред¬ставляют концептуальные и экспертные знания.
Концептуальные знания выражают свойства объектов, процессов и ситуа¬ций через понятия (базовые элементы) соответствующей об¬ласти. Описание понятия включает описание его компонен¬тов, указания взаимосвязи с другими понятиями, а также операциональную часть, содержащую зависимости между компо¬нентами понятий. Применять их целесообразнее при решении задач анализа.
Экспертные знания - это знания специалистов предметной области. Они аккумулируют накопленный практический опыт, навыки и приемы в соответствующей области. Этот тип знаний играет наиболее важную роль в слабоструктурированных предметных областях, в которых отсутствуют формальные модели. Их роль также велика в тех областях, где применимы формальные методы, но при этом необходимо принимать ре¬шения и делать выбор в первую очередь на основе опыта. Совместное использование концептуальных и экспертных знаний являет¬ся крайне важным и перспективным, ибо они вместе покрыва¬ют значительную часть плоскости знаний СИИ и позволяют сочетать ассоциативные и логические рассуждения для реше¬ния задач при низких вычислительных затратах.
Синтаксические знания характеризуют синтаксическую структуру описываемого объекта или процесса, которая не зависит от смысла и содержания используемых при этом по¬нятий. Семантические знания содержат информацию, непос¬редственно связанную со знанием и смыслом описываемых объектов и процессов. Прагматические знания описывают объек¬ты и процессы относительно целей решаемой задачи.
К понятию знание близко примыкает понятие предметной об¬ласти. Предметной области (ПрО) как совокупности элементов, S объектов, явлений, процессов, их количественных и качественных характеристик, а также связей между ними, объединенных общей идеей, определенным смыслом или понятием более высо¬кого уровня. Эта область может быть описана в виде некоторой совокупности сведений о ее структуре, основных характеристи¬ках, процессах, протекающих в ней, а также способов решения задач. Значительная роль принадлежит отношениям. Именно они определяют смысловую сторону, окончательно формиру¬ют конкретную ПрО, выделяя ее из других областей или слу¬чайного скопления фактов. Упорядоченная и систематизиро¬ванная совокупность знаний образует модель знаний ПрО.
2. Модели представления знаний
Представление знаний в СИИ является не только фундамен¬тальным понятием, но и решающим аспектом их разработки. Выбор модели представления знаний (МПЗ) важен ввиду их многообразия и размытости критериев выбора, ибо он оказы¬вает огромное влияние на любую часть СИИ и предопределя¬ет их возможности (свойства и характеристики). Последствия неудачного решения проблемы представления знаний могут быть катастрофическими. Кроме того, используемый в СИИ формализм представления знаний определяет характер их по¬лучения и накопления, в результате которого создается БЗ, ориентированная на определенную структуру представления, а не на сущность самих знаний. Выбор модели, неадекватной типам знаний, приводит к потере многих существенных де¬талей прикладной задачи и порождает тривиальный интел¬лект.
Проблемы представления знаний в компьютерных системах решаются на трех уровнях:
• техническом(физическом) - реализация сложных представлений зна¬ний, требующая ЭВТ с чрезвычайно сложной функциональ¬ной архитектурой, обеспечивающей параллельные вычисления и гарантирующей протекание процесса представления в режи¬ме реального времени, а также мощными запоминающими ус-тройствами;
• программном (логическом) - создание программ, которые обеспечивают выполнение всех алгоритмов, необходимых для представления знаний;
• концептуальном - выработка концепций, моделей, обра¬зующих методологию искусственного интеллекта.
Под представлением знаний подразумевают соглашение о том, как описывать реальную ПрО (понятия и отношения). Иногда такое соглашение называют нотацией. Каждая модель знаний определяет форму представления знаний и является формализмом, призванным отобразить объекты, связи между ними и отношения, иерархию понятий ПрО и изменение отно¬шений между объектами.
Для решения проблемы представления знаний разработа¬ны разнообразные МПЗ. В системах искусственного интеллек¬та используются в основном четыре их типа: логические, про¬дукционные, семантические сети и фреймы.
Логические схемы представляют знания в виде формул, ко¬торые состоят из констант, переменных, функций, предикатов, логических связок и кванторов. Каждая логическая формула дает частичное описание состояния предметной области.
Обычно они используются в сочетании с другими МПЗ.
Продукции (правила) задаются в виде выражений:
ЕСЛИ условие ТО действие;
ЕСЛИ причина ТО следствие;
ЕСЛИ ситуации ТО решение.
Суть этих выражений заключается в том, что если выполня¬ется условие, то нужно произвести некоторое действие. В процедурных системах присутствуют три ком¬понента: база данных, некоторое число продукционных правил, состоящих из условий и действий, а также интерпретатор, кото¬рый последовательно определяет, какие продукции могут быть активированы в зависимости от содержащихся в них условий. В базе данных хранятся известные факты выбранной ПрО. Про¬дукционные правила (продукции) содержат специфические знания ПрО о том, какие еще дополнительные факты могут быть учтены, есть ли специфические данные в базе данных. В СИИ, построенных на использовании продукционных МПЗ, база дан¬ных представляет собой переменную часть, а правила и интер¬претатор не изменяются. Благодаря свойству модульности, присущему продукционным МПЗ, можно добавлять и изме¬нять знания (правила, факты). Поэтому продукционные МПЗ применяются в ПрО, где нет четкой логики и задачи решают¬ся на основе независимых правил (эвристик).
Следующим шагом на пути выявления структуры, присущей знаниям, являются модели, в которых в явной форме выделяются все отношения, образующие эту структуру, с описанием их семантики.
Семантические сети основываются на результатах изуче¬ния организации долговременной памяти человека. Характер¬ной особенностью для семантических сетей является то, что они для образования своей структуры используют два компо¬нента - вершинам сети соответствуют понятия (объекты, события, процессы, явления), а дугам, их соединяющим, - отно¬шения между понятиями.
В семантических сетях знания представлены в терминах ес¬тественного языка и отношений между ними (элемент-класс; класс-подкласс, функциональные дуги). Основными общими характеристиками сетей являются сле¬дующие: описание объектов производится на естественном языке; все знания накапливаются в относительно однородной структуре памяти; на сетях определяются унифицированные отношения между объектами, которым соответствуют унифи¬цированные методы вывода; методы вывода в соответствии с запросами определяют участки семантического знания, имеющего отношение к поставленной задаче, формулируя акт понимания запроса и некоторую цепь выводов, соответствующих решению задачи.
В целом семантические сети позволяют представлять семан¬тику ПрО, а также осуществлять за счет наличия связей и от¬ношений между понятиями целевую ориентацию и, таким об¬разом, отражать прагматическую составляющую знаний.
Фреймы - это особые познавательные структуры, дающие целостное представление об явлениях и их типах.
Фреймы отражают концептуальную основу организации памяти человека.
Рассмотренные МПЗ наследуют ряд структур данных и являются в некотором смысле их разновидностями, хотя и используются в СИИ для обработки знаний.
Общими слабыми сторонами МПЗ являются ограниченные! выразительные возможности для описания экспертных знаний, невозможность описания знаний сложной структуры, недостаточная вычислительная эффектив¬ность.
Сейчас ведется поиск новых МПЗ, базирующихся на идеях, отличных от формальной системы или сети понятий, ориен¬тирующихся на языковые конструкции (семантику естествен¬ного языка).
3. Приобретение и формализация знаний
Ключевой проблемой при построении СИИ является приоб¬ретение знаний. От качества и полноты знаний, введенных в БЗ, в решающей степени зависят эффективность работы СИИ и качество решения задач.
В теории ЭС принята методология постепенно нарастающей разработки, которая базируется на концепции быстрого про¬тотипа.
Прототип ЭС представляет собой один или несколько ва¬риантов усеченной версии ЭС, демонстрирующих жизнеспо¬собность выбранного подхода и правильность принятых ре¬шений. В условиях отсутствия формальных методов работы со знаниями технология быстрого прототипа позволяет эмпи¬рически проверить правильность принятых проектных реше¬ний на каждом этапе создания ЭС и считается эффективной.
Особую важность имеет процедура приобретения знаний (рис. 1), так как мощность ЭС зависит в первую очередь от количества и качества знаний, хранимых в ней.
Процессу приобретения знаний присущи проблемы психо¬логического, гносеологического и лингвистического свойства.
Указанные проблемы рассматриваются в плане облегчения и повышения эффективности взаимодействия эксперта и инженера по знаниям, повышения степени адекватности модели знаний ПрО реальной ПрО, построения языка структуризации и формализации относительно синтаксиса, семантики и прагма¬тики МПЗ.
В осуществлении данного процесса принимают участие инженеры по знаниям, программисты и источники знаний, в качестве которых могут выступать эксперты, материализованные источники (учебники, монографии, статьи, инструкции и т.п.) и (или) эмпирические факты, примеры и данные ПрО.
Инженеры по знаниям и эксперты в процессе приобретения знаний могут выполнять различные функции в зависимости от применяемых методов извлечения, получения и форми¬рования знаний, а также наличия и степени развитости средств автоматизации.
В общем случае инженер по знаниям в процессе получения знаний выполняет следующие основные взаимосвязанные функции: управления процессом коммуникации в форме последовательности содержательных сообщений; переработки, включающей все возможные способы, процедуры анализа и синтеза информации, идентификации и конструирования понятий, выяснения и фиксации их смысла, а также установления отношений между ними и когнитивными элементами; хранения инфор¬мации путем запоминания, выборки и документирования.
Рис. 1. Процедура приобретения знаний
Процесс приобретения знаний и разработки прототипа ЭС стремятся максимально автоматизировать. Основная задача автоматизации приобретения знаний состоит в облегчении труда эксперта и инженеров по знаниям - разработчиков СИИ. Эта задача может быть решена двумя путями:
• передача части функций, выполняемых инженерами по знаниям в процессе приобретения знаний, автоматизирован¬ной системе;
• полное исключение экспертов и инженеров по знаниям из процесса путем создания автоматизированных систем приоб¬ретения знаний.
Применение автоматизированных систем приобретения знаний позволяет реализовать три стратегии получения зна¬ний. В рамках первой стратегии основные функции по акту¬ализации и формированию знаний выполняет эксперт, обра¬щаясь при этом за помощью к СИИ. Благодаря этой помощи эксперт структурирует, систематизирует и формализует свои знания, используя некоторый формализм. В результате полу¬чаются готовые формы знания для непосредственного коди¬рования и ввода в БЗ. Такая стратегия позволяет исключить инженеров по знаниям из технологической цепочки приобре¬тения знаний и все его функции возложить на автоматизиро¬ванную систему.
В рамках второй стратегии получения знаний ведущей стороной в диалоге является автоматизированная система. По ответам эксперта СИИ конструирует готовые формы знания и затем передает их в другие компоненты СИИ для включения в состав БЗ. Инженер по знаниям полностью исключается из рассмотренной технологической цепочки получения знаний.
Третья стратегия приобретения знаний связана с исклю¬чением из классической технологии и инженера по знаниям, и программиста. Заполнение знаниями таких СИИ может быть осуществлено без изменения механизма логического вывода с помощью редактора знаний. Основная функция редактора знаний - заполнение БЗ нужными знаниями самим экспертом.
В технологическом плане крайне необходимым является решение проблемы работы со знаниями в рамках единого под¬хода, реализующего выбор МПЗ, формализацию знаний и со¬здание СИИ, реализующей идею автоформализации знаний самим экспертом.
Рассматривая методы приобретения знаний, будем использо¬вать следующие термины: извлечение, получение, формирова¬ние, приобретение знаний и обучение БЗ. Определим сущность указанных терминов. Под извлечением знании понимают процесс приобретения материализованных знаний из тексто¬логических источников информации при помощи совокупности методов и процедур, которые позволяют переходить от знаний в текстовой форме к их аналогам для ввода в базу знаний СИИ.
Получение знаний – это процесс приобретения вербализуемых и невербализуемых знаний эксперта, основан¬ный на использовании непосредственно им самим или инже-нером по знаниям приемов, процедур, методов и инструмен¬тальных средств.
Формирование знании - это процесс автоматического при¬обретения (порождения) системой искусственного интеллекта или инструментальным средством нового и полезного знания, из исходной и текущей информации, которое в явном виде не формируют эксперты, в целях освоения новых процедур ре¬шения прикладных задач на основе использования различных моделей машинного обучения.
Под приобретением знании бу¬дем понимать процесс, основанный на переносе знаний из раз¬личных источников в базу знаний путем использования раз¬личных методов, моделей, алгоритмов и инструментальных средств.
Понятие получение знаний соотносится с понятиями извле¬чение, приобретение, формирование знаний как часть-целое.
Обучение базы знаний - это процесс ввода (переноса) приоб¬ретенных знаний в СИИ на основе применения совокупности методов, приемов и процедур в целях ее заполнения, расширения и модификации. Термин обучение рассматривается как свойство БЗ, как совокупность методов, приемов и процедур ввода знаний в БЗ и как процесс переноса знаний в СИИ.
Большинство методов извлечения и получения знаний ос¬новано на прямом диалоге с экспертом.
Методы извлечения знаний.
Они состоят из текстологичес¬ких методов и методов автоматической обработки текстов.
Текстологические методы предназначены для получения знаний из материализованных источ¬ников, в качестве которых выступают монографии, учебники, статьи, методики, инструкции и другие носители профессио¬нальных знаний. Текстологические методы являются наименее разработанны¬ми. Эти методы основываются не только на выявлении и по¬нимании смысла текста, но и на выделении базовых понятий и отношений, т. е. формировании семантической (понятийной) структуры ПрО.
На процесс понимания существенно влияют когнитивный стиль инженера по знаниям и его интеллектуальные характеристики. В инжене¬рии знаний разработана методика анализа текстов в целях из¬влечения и структурирования знаний. Методика предусмат¬ривает овладение инженером по знаниям микроструктурой текста, вычленение ключевых слов (компрессию или сжатие текста) и последующее формирование поля знаний.
Сжатие текста служит методологической основой для ис¬пользования текстологических процедур извлечения знаний. Текстологические методы применяются, как правило, на начальном этапе создания СИИ.
Значительное развитие получили методы извлечения зна¬ний при применении современных информационных техноло¬гий, в частности гипертекстовой технологии.
Гипертекст - это организация нелинейной последователь¬ности записи и чтения информации, объединенной на основе ассоциативной связи.
Метод автоматической обработки текстов разработан на основе статистической обработки семантических единиц. Метод и программные средства автоматизированного извлечения знаний из текстов базируются на формальных про¬цедурах обнаружения в текстах семантических единиц различ¬ной выраженности.
Семантические единицы получаются путем статистической обработки текстов, в основе которой лежат универсальные ме¬ханизмы определения частотных характеристик терминов. За¬дача извлечения знаний решается в два этапа: сначала форми¬руется терминологическая сеть (поле знаний), а затем опреде¬ляется ассоциативная близость терминов на основе статисти¬чески определенной меры ассоциации. Достоинство рассмотренного метода состоит в автоматическом выявлении значи¬мых слов и связей с учетом статистической информации о ги¬пертексте в целом.
Указанные новые подходы к автоматизации извлечения знаний пока находятся на стадии исследований и не нашли применения в практике создания СИИ.
Методы получения экспертных знаний.
К ним относятся, например, коммуникативные методы, основанные на прямом диалоге экспертов и инженеров по зна¬ниям как без использования СИИ, так и с применением СИИ (технологии окон, меню).
Коммуникативные методы получения знаний рассматрива¬ются как разновидности интервьюирования. Для них харак¬терны следующие основные особенности:
1. Не имеют формального определения и носят качествен¬ный характер. Полученные с их помощью знания несут на себе отпечаток самонаблюдений эксперта и субъективную интер¬претацию инженера по знаниям.
2. Требуют словесного выражения экспертом своих знаний, что является непростой задачей. Неточность и неадекватность словесных описаний мыслительных процессов и применяемых эвристических приемов, используемых при решении задач, ведут к серьезным последствиям.
3. Сложность выражения процедурных знаний при их сло¬весном описании.
4. Крайняя сложность явного описания знаний, которые являются результатом компиляции и автоматизма процессов мышления, а также интуиции эксперта. В психологии доказа¬но, что интуиция на самом деле является способностью рас¬познавать образы. Однако словесное описание способности к распознаванию образов дать крайне трудно.
5. Трудоемкость организации и неэффективность взаимо¬действия инженера по знаниям и эксперта. На них приходятся большие интеллектуальные нагрузки, связанные с вербализа¬цией знаний, управлением процессом коммуникации и необ¬ходимостью освоения, анализа и документирования больших объемов новых знаний.
Коммуникативные методы получения знаний отличаются своей низкой эффективностью. Так, при непосредственном взаимодействии инженера по знаниям и эксперта теряется до 76 % информации.
Один из путей совершенствования процесса приобретения знаний состоит в разработке методов, позволяющих передать часть функций, выполняемых инженером по знаниям, самому эксперту или СИИ.
Методы формирования знаний.
Трудности извлечения зна¬ний из текстовых источников и получения их от экспертов сти¬мулировали развитие методов формирования знаний, извест¬ных, как методы "машинного обучения".
Для развитых СИИ способность обучаться, т.е. самостоятель¬но формировать новые знания на основе текущих знаний, собственного опыта решения прикладных задач, является их существенной характеристикой. Методы формирования знаний лежат в основе автоматических систем приобретения знаний.
Автоматические системы формирования знаний являются более предпочтительными, так как уменьшается вероятность ошибок в приобретаемых знаниях и снижается время их приобретения.
Главный вопрос, на который должны ответить методы формирования знаний, состоит в следующем: как от частного перейти к общему? Базисом всех методов формирования знаний является индукция, которая лежит в основе получения общих выводов из совокупности частных утверждений.
Вывод. Основным направлением повышения эффективности процесса представления знаний, является его автоматизация.
В настоящее время ведется интенсивная разработка разно¬образных средств автоматизации приобретения знаний. Выделяют следующие средства автоматизации, которые получи¬ли наименование инструментальных средств: языки програм-мирования, языки символьной обработки, языки инженерии (представления) знаний, средства автоматизации проектиро¬вания ЭС (интегрированные гибридные среды или комплек¬сы) и оболочки ЭС (пустые или инструментальные ЭС).
Все многообразие существующих СИИ используется для создания быстрого прототипа. Некоторые СИИ являются де¬монстрационными и иллюстрируют границы ведущихся иссле¬дований.
Тенденция качественного совершенствования СИИ связа¬на с возможностью реализации в них совокупности автомати¬зируемых функций управления процессом приобретения зна¬ний, переработки знаний и их хранения.
Для эффективного ис¬пользования в системах управления интеллектуальная инфор-мационная технология должна быть способной выполнять следующие функции:
• описывать знания с помощью языков представления зна¬ний;
• организовывать накопление, хранение, анализ, обобще¬ние и структурирование знаний;
• вводить новые знания и объединять их с существующими знаниями в СИИ;
• выводить новые знания из имеющихся знаний, оперировать с не¬полными и неточными знаниями;
• устранять устаревшие знания, быстро находить требуемые, проверять непротиворечивость накопленных знаний;
• осуществлять интеллектуальный интерфейс между пользо¬вателем и знаниями.
Вопросы для самоконтроля.
1. Определение и виды знаний.
2. Модели представления знаний.
3. Основные этапы приобретения знаний.
4. Основные этапы формирования знаний.
5. Методы извлечения знаний.
6. Методы получения экспертных знаний.
7. Примеры интеллектуальных информационных технологий.
Информационный процесс представления знаний
Статьи по предмету «Информатика»