Что такое онтологии и зачем они нужны?

Что такое онтологии и зачем они нужны? (1999)

B. Chandrasekaran and John R. Josephson, Ohio State University V. Richard Benjamins, University of Amsterdam

https://www.researchgate.net/publication/3420451_What_Are_Ontologies_and_Why_Do_We_Need_Them

Этот аналитический обзор представляет собой концептуальное введение в онтологии и их роль в информационных системах и искусственном интеллекте. Авторы также обсуждают, как онтологии проясняют структуру каждой конкретной предметной области знания и создают возможность обмена знаниями.

Теории в области искусственного интеллекта делятся на две широкие категории: теории механизмов действия и теории информационного наполнения. Онтологии — это теории информационного наполнения, относящиеся к типам объектов, их свойствам и отношениям между объектами, возможными в определённой области знаний. Они дают потенциальные понятия для описания наших знаний о конкретной предметной области.

В этой статье мы рассматриваем последние разработки в области онтологий в сфере искусственного интеллекта. Мы обращаем внимание на в какой-то степени разные роли, которые онтологии играют в информационных системах, понимании естественного языка и системах, основанных на знании. Большинство исследований онтологий сосредоточено на том, что можно охарактеризовать как фактическое знание предметной области, потому что знание этого типа особенно полезно для понимания естественного языка. Есть ещё один класс онтологий, который важен в системе знаний, — тот, который помогает в обмене знаниями о стратегиях логичного и обоснованного рассуждения или методах решения проблем. В следующей статье мы сосредоточимся на онтологиях методов.

Онтология как указатель репрезентаций

В философии онтология — это изучение видов существующих вещей. Часто говорят, что онтологии «рассекают мир на стыках». В сфере искусственного интеллекта термин онтология во многом стал означать одну из двух взаимосвязанных вещей. Прежде всего, онтология — это указатель репрезентаций, часто специализирующийся на какой-либо области или предмете. Точнее говоря, в качестве онтологии квалифицируется не сам такой словарь, а те концептуальные представления, для охвата которых предназначены конкретные термины в этом словаре. Таким образом, перевод терминов в онтологии с одного языка на другой, например с английского на французский, не меняет данную онтологию концептуально. В инженерном проектировании вы можете обсудить онтологию области электронных устройств, которая может включать в себя словарь, описывающий концептуальные элементы — транзисторы, оперативные усилители и напряжения — и отношения между этими элементами — оперативные усилители представляют собой тип электронного устройства, а транзисторы — составные части оперативных усилителей. Определение такого словаря — и лежащих в его основе концептуальных представлений — обычно требует тщательного анализа типов объектов и отношений, которые могут существовать в данной предметной области.

Во втором смысле термин онтология иногда используется для обозначения совокупности знаний, описывающих некую область, обычно область знаний, основанных на здравом смысле, с использованием указателя репрезентаций. Например, CYC (проект по сбору основанных на здравом смысле утверждений) часто даёт ссылки на предлагаемую репрезентацию знаний о какой-либо области знаний как на онтологию этой области.

Другими словами, указатель репрезентаций предоставляет некий набор терминов, с помощью которых можно описать факты в той или иной области, в то время как совокупность знаний, где применяется этот указатель, является набором фактов о предметной области. Однако это различие не так очевидно, как может показаться на первый взгляд. В примере с электронным устройством то, что этот транзистор — компонент оперативного усилителя или то, что последний является типом электронного устройства, является таким же фактом о своей области, как и факт CYC о том или ином аспекте пространства, времени или чисел. Различие состоит в том, что первое подчёркивает применение онтологии как набора терминов для представления конкретных фактов в частном случае данной предметной области, тогда как второе акцентирует взгляд на онтологию как на общий набор фактов, подлежащих совместному использованию.

По-прежнему существуют несоответствия в применении термина онтология. Теоретики периодически пользуются данным своеобразным названием для обозначения определённого набора терминов, предназначенных для описания конкретной сущности и типов отношений в той или иной области. Таким образом, мы можем говорить об онтологии для «жидкостей» или «частей и целого». Здесь этот своеобразный термин обозначает весь набор концептов и терминов, необходимых для описания феноменов, связанных с жидкостями, частями и целым.

Когда разные теоретики делают разные предложения по онтологии или когда мы говорим о предложениях онтологий для разных областей знания, мы воспользовались бы термином «онтологии» во множественном числе для обозначения их в совокупности. В литературе по искусственному интеллекту и информационным системам, однако, есть несогласованность: иногда мы видим ссылки на «онтологию предметной области», а иногда — на «онтологии предметной области», причём то и другое относится к набору концептуализаций данной предметной области. Первое больше соответствует первоначальному (и нынешнему) использованию в философии.

Онтология как контент-теория

Текущий интерес к онтологиям — это новейшая версия периодической смены объекта основного внимания средств искусственного интеллекта от контент-теорий к механизм-теориям. Иногда сообщество специалистов по средствам искусственного интеллекта проникается интересом к какому-то механизму типа системы правил, языков фреймов, нейронных сетей, размытой логики, распространения ограничений или соблюдения единообразия. Данные механизмы предлагаются как секрет создания интеллектуальных машин. В других случаях мы понимаем, что, каким бы прекрасным ни был механизм, он мало что может сделать без хорошей контент-теории той области, в которой должен работать. Более того, мы часто признаём, что, как только появляется хорошая контент-теория, можно с одинаковым успехом воспользоваться многими разными механизмами для осуществления на практике эффективных систем, и во всех будет применяться, по сути, один и тот же контент2.

Исследователи искусственного интеллекта предприняли несколько попыток охарактеризовать суть того, что значит иметь контент-теорию. Теория Маккарти и Хейса (различие между эпистемологическим и эвристическим) 3, трёхуровневая теория Марра (обработка информации, уровень стратегии, уровень алгоритмов и структур данных и уровень физических механизмов) 4 и теория Ньюэлла (уровень знаний против уровня символов) 5 вместе взятые по-своему стремятся разрешить задачу характеристики контента. Онтологии — это, по своей сути, контент-теории, потому что их основной вклад заключается в выявлении определённых классов объектов и отношений, существующих в той или иной сфере. Контент-теории, разумеется, нуждаются в каком-то языке представления. Чаще всего, по состоянию на текущий момент, для описания самих онтологий применялись исчисления предикатов типа представлений потока данных, скомбинированные с отношениями типов (которые могут использоваться для создания иерархий классов).

Почему важны онтологии?

Онтологический анализ проясняет конкретную структуру знания. Для той или иной данной предметной области её онтология составляет основу любой системы представления знаний именно этой предметной области. Без онтологий или концептуализаций, лежащих в основе знания, не может быть указателя для презентации знаний. По этой причине первым шагом в разработке дающей нужный результат системы представления знаний и указателя является выполнение эффективного онтологического анализа данной сферы или предметной области. Необоснованный анализ ведёт к внутренней противоречивости баз знаний.

Пример того, почему необходимо выполнение хорошего анализа, диктуется каждой данной сферой баз данных.6 Рассмотрим некий домен, состоящий из нескольких классов людей (например, студенты, профессора, сотрудники, женщины и мужчины). В этом исследовании сначала изучалось, как эту базу данных следовало бы типично организовать: студенты, сотрудники, профессора, мужчины и женщины были бы представлены как типы класса людей. Однако некоторые из проблем, возникающие в связи с этой онтологией, заключаются в том, что студенты могут иногда быть и сотрудниками, а также могут перестать быть студентами. Дальнейший анализ показал, что термины «студенты» и «служащие» не описывают категории людей, а представляют собой роли, которые люди могут играть, в то время как такие термины, как «женщины» и «мужчины», более подходящим образом представляют подкатегории людей. Таким образом, уточнение терминологии позволяет онтологии работать в целях последовательного и связного рассуждения.

Во-вторых, онтологии позволяют обмениваться знаниями. Предположим, мы выполняем анализ и приходим к удовлетворительному набору концептуальных представлений и их типических терминов для какой-либо области знаний, например, сферы электронных устройств. Вполне вероятно, что итоговая онтология включала бы в себя такие предметно-ориентированные термины, как транзисторы и диоды; неспециализированные термины типа функций, выражающие причинно-следственную связь технологические процессы и режимы; и термины, описывающие функционирование, вроде напряжения. Такая онтология отражает внутреннюю концептуальную структуру данной предметной области. Чтобы построить язык представления знаний на основе этого анализа, необходимо связать термины с концептами и отношениями в этой онтологии и разработать синтаксис для кодирования знаний в терминах этих концептов и отношений. Мы можем поделиться этим языком представления знаний с другими, у которых есть аналогичные потребности в представлении знаний в этой области, тем самым устраняя необходимость воспроизведения процесса анализа знаний. Общие онтологии, следовательно, могут формировать основу для языков представления знаний, связанных с данной предметной областью. В отличие от языков представления знаний предыдущего поколения (таких как KL-One), эти языки богаты содержанием; у них есть большое количество терминов, которые воплощают сложную контент-теорию данной предметной области.

Общие онтологии позволяют создавать конкретные базы знаний, описывающие конкретные ситуации. Разные производители электронных устройств, например, могут применять общий словарь и синтаксис для создания каталогов, описывающих их продукты. Эти производители могли бы потом поделиться каталогами и использовать их в системах автоматизированного проектирования. Такой обмен значительно увеличивает потенциал повторного применения знаний.

Рассматривая мир

Мы можем пользоваться терминами, предлагаемыми онтологией данной предметной области, чтобы высказывать конкретные утверждения о той или иной предметной области или ситуации в такой предметной области. Например, в области электронных устройств мы можем представить факт о какой-нибудь конкретной схеме: в схеме 35 имеется транзистор 22 в качестве компонента, где схема 35 является образцом концепта схемы, а транзистор 22 является образцом концепта транзистора. Раз у нас имеется основа для представления утверждений, мы можем также представлять знания, включающие пропозициональные аттитьюды (такие как гипотеза, вера, ожидание, надежда, желание и страх). Термины пропозиционального аттитьюда воспринимают утверждения как аргументы. Продолжая тему области электронных устройств, мы можем утверждать, например: специалист по диагностике предполагает или считает, что часть 2 неисправна, или разработчик ожидает или желает, чтобы мощность силовой установки составляла 20 мегаватт. Таким образом, онтология может представлять верования, цели, гипотезы и прогнозы относительно предметной области в дополнение к простым фактам. Данная онтология также играет роль в описании таких вещей, как планы и действия, потому что они также требуют спецификации объектов и отношений предметной области. Термины пропозиционального аттитьюда также являются частью более крупной онтологии мира, особенно полезной при описании действий и свойств особого класса объектов в мире, называемых «интенциональными концептуальными сущностями или классами-сущностями» — например, факторы типа людей, у которых есть какие-то психические состояния.

Существуют, с одной стороны, такие концептуальные сущности и классы-сущности, как процессы и события, в которых имеются временные части… С другой стороны, существуют и такие концептуальные сущности и классы-сущности, как материальные объекты, которые всегда присутствуют полностью, в любое время, когда они вообще существуют. Категориальное различие между сущностями, имеющими и не имеющими временных частей, основано на здравом смысле. Однако некоторые философы были склонны выступать против этого. Ряд из них… защищали онтологию, состоящую исключительно из вещей без временных частей. Сторонники Уайтхеда предпочитают онтологии, включающие только процессы, протяжённые во времени. Куайн поддерживает четырёхмерную онтологию, в которой различие между объектами и процессами исчезает, и каждая сущность представляет собой просто содержание некоторой произвольно разграниченной части пространства-времени.

Ещё один вариант, принятый такими философами, как Дэвид Льюис, допускает противопоставление объектов и процессов, но при этом находит способ сделать возможным, чтобы все сущности имели как пространственную, так и временную части.

Рисунок 1. Запрос статей для специального выпуска, посвящённого временным частям, для The Monist, Международного ежеквартального журнала общих философских исследований. В этой цитате высказывается предположение, что онтология всегда была предметом глубокого беспокойства в философии и что эти вопросы продолжают занимать современных философов.

Построение онтологий — это непрекращающееся исследовательское предприятие. Онтологии варьируются в абстрагировании от очень общих терминов, формирующих основу для представления знаний во всех областях, до терминов, ограниченных конкретными областями знаний. Например, пространство, время, части и подразделы — это термины, применимые ко всем доменам; нарушение нормальной работы относится к инженерным или биологическим областям; а гепатит относится только к медицине.

Даже в тех случаях, когда задача может показаться более или менее специфичной для предметной области, представление знаний может потребовать онтологии, описывающей знания на более высоких уровнях обобщённости. Решение проблем, например, в области турбин может потребовать знаний, выраженных с использованием универсальных терминов предметной области типа потоков и причинно-следственной связи. Такие описательные термины общего уровня называются онтологией более высокого уровня или онтологией верхнего уровня. Существует много открытых исследовательских аспектов, касающихся правильных способов анализа знаний на данном более высоком уровне. Чтобы дать некоторое представление о возникающих проблемах, на рисунке 1 приведена цитата из недавнего запроса статей.

Сегодня онтология вышла за рамки философии и теперь имеет много связей с информационными технологиями. Вследствие этого исследования онтологии в средствах искусственного интеллекта и информационных системах должны были дать прагматично полезные предложения для онтологий верхнего уровня. Такая организация онтологии верхнего уровня содержит ряд проблем, похожих на проблемы, окружающие онтологию в философии. Во многих онтологиях корневым классом является вещь или сущность. Однако на рисунке 2 показано, что вещь и сущность начинают расходиться на следующем уровне.

Например, объект CYC (проект по созданию объёмной онтологической базы знаний) имеет подкатегории индивидуальный объект, нечто неосязаемое и представленная вещь; um-объект обобщённой верхней модели 7 (GUM) имеет подкатегории конфигурация, элемент и последовательность; в Wordnet 8 (лексическая база данных английского языка) имеются подкатегории «живое» и «неживое», а в root T Sowa — подкатегории «конкретный», «процесс», «объект» и «абстрактный». (В статье Натальи Фридман Ной и Кэрол Хафнер эти различия обсуждаются более полно.9) Некоторые из этих различий возникают из-за того, что не все эти онтологии предназначены для использования в качестве инструментов общего назначения или даже в явном виде как онтологии. Другая причина различий заключается в том, что в принципе существует множество различных таксономий.

Хотя внутри онтологий существуют различия, между онтологиями существует совпадение по многим пунктам:

• В мире существуют объекты.

• Объекты имеют свойства или атрибуты, которые могут принимать те или иные значения.

• Объекты могут существовать в разнообразных отношениях друг с другом.

• Свойства и отношения могут меняться со временем.

• Существуют события, которые происходят в разные моменты времени.

• Существуют процессы, в которых участвуют объекты и которые происходят во времени.

• Этот мир и его объекты могут находиться в разных состояниях.

• События могут вызывать другие события или состояния в качестве следствий.

• Объекты могут состоять из частей.

Данный репрезентирующий набор объектов, отношений, состояний, событий и процессов ничего не говорит о том, какие классы этих вещей существуют. Эти связанности создаёт разработчик моделей доменов. Когда мы переходим от вершины онтологии к более низким таксономическим уровням, возникают связанности, специфичные для областей и явлений. При моделировании объектов на Земле мы можем создавать определённые связанности. Например, животные, минералы и растения — это подкатегории объектов; обладает-жизнью (x) и содержит-углерод (x) — свойства объекта; и может-есть (x, y) — это возможное отношение между любыми двумя объектами. Эти связанности являются специфичными для объектов и явлений в этой области. Данные связанности, кроме того, не являются произвольными. Чтобы они были полезными, они должны отражать некую лежащую в их основе реальность.

Для представления знаний нет чёткого разделения между зависящими и не зависящими от домена онтологиями. Термины «объект», «физический объект», «устройство», «двигатель» и «дизельный двигатель», например, все описывают объекты, но в порядке возрастания специфичности предметной области. Точно так же термины для отношений между объектами могут охватывать диапазон специфичности, например, связанный, электрически подключенный и припаянный.

Подвиды концептов. Онтологии обычно представляют собой таксономическое дерево концептуализаций, от очень общих и независимых от предметной области на верхних уровнях до всё более специфичных для предметной области ниже по иерархии. Мы упоминали ранее, что разные онтологии предлагают разные подвиды даже очень общих концептов. Это связано с тем, что, как правило, разные наборы подкатегорий являются результатом разных критериев распределения по категориям. Два общих концептуальных объекта из множества альтернативных подкатегорий — это физическое и абстрактное, а также живое и неживое. В некоторых культурах и языках слова, обозначающие предметы, имеют пол, что создает еще одну классификацию верхнего уровня по гендерной оси. Мы можем легко придумать дополнительные подкатегории на основе других критериев. Существование альтернативных категорий становится более очевидным, когда мы начинаем моделировать конкретные области знания. Мы можем, например, подразделить по категориям причинно обусловленный процесс на непрерывный и дискретный выражающие причинную обусловленность процессы в соответствии с тем, как представлено время, и на механические, химические, биологические, когнитивные и социальные процессы соответственно видам объектов и отношений, участвующих в данном описании.

По сути дела, количество критериев классификации и отдельных подвидов не ограничено, потому что количество возможных параметров, по которым будут появляться и совершенствоваться подкатегории, не может быть исчерпывающим образом определено. Этот факт часто неочевиден в онтологиях общего назначения, потому что верхние уровни таких онтологий относятся к наиболее часто используемым подвидам. Онтологии, специфичные для предметной области, тем не менее, могут содержать распределения по категориям в соответствии с измерениями, которые обычно находятся за пределами общей онтологии.

Зависимость онтологий от задач. Насколько онтологии зависят от задач? Можно предположить, что виды действительно существующих вещей не зависят от наших целей. В этом смысле онтологии не зависят от задач. С другой стороны, какие аспекты реальности выбираются для кодирования в онтологии, действительно зависит от задачи. Например, в области фруктов мы бы сосредоточились на определённых аспектах реальности, если бы разрабатывали онтологию для выбора пестицидов; мы обратили бы внимание на другие аспекты реальности, если бы разрабатывали онтологию для помощи поварам в выборе фруктов для приготовления пищи. В онтологиях для инженерных сфер применения может оказаться полезной группировка причинных процессов как вызывающих и не вызывающих опасные побочные эффекты. Инженеры-конструкторы и аналитики по безопасности могут найти такое распределение по категориям очень полезным, хотя вряд ли оно было бы частью общей онтологической точки зрения на концепт причинного процесса.

С практической точки зрения та или иная онтология вряд ли сможет охватить все возможные варианты использования. В этом смысле как онтология для предметной области, так и база знаний, написанная с использованием такой онтологии, вероятно, будут более подходящими для определённых целей, чем другие, и вряд ли будут применимы для решения широко расходящихся задач. На данный момент это нечто общеизвестное в исследованиях KBS (система знаний, основанная на знаниях система) и основная идея, которая привела к тому, что в настоящее время внимание сосредоточено на взаимосвязи между задачами и типами знаний. Исходные посылки или требования могут быть связаны с методами решения проблем для различных задач, так что они могут явно фиксировать способ, которым онтологии зависят от задач. Например, у метода может быть исходная посылка (или допущение 10) о том, что он работает правильно только в том случае, если онтология позволяет моделировать причинные процессы дискретно. Следовательно, допущения являются ключевым фактором в практическом совместном применении онтологий.

Технология совместного применения онтологий

В последнее время было предпринято несколько попыток создать инженерные структурные схемы для построения онтологий. Майкл Р. Дженесерет и Ричард Э. Файкс описывают KIF (формат обмена знаниями), технологию, которая создаёт условия для выражения фактических знаний в предметной области с использованием формальной системы, основанной на расширенном исчислении предикатов.11 Роберт Нечес и его коллеги описывают некую программу по обмену знаниями, 12 в то время как Томас Р. Грубер предложил язык под названием Ontolingua для помощи в создании мобильных онтологий.13 В Европе в проекте CommonKADS (общая система данных по приобретению знаний) использовался аналогичный подход к моделированию знаний по той или иной предметной области 14.

В этих языках применяются разные варианты исчисления предикатов в качестве фундаментальной формальной системы. Исчисление предикатов облегчает представление объектов, свойств и отношений. Варианты типа ситуационного исчисления вводят время для представления состояний, событий и процессов. Если мы расширим данную идею знания, включив в неё образы и другие качества ощущения, нам могут потребоваться совершенно иные виды репрезентации. На данный момент исчисление предикатов является хорошей отправной точкой для технологий совместного использования онтологий.

Использование логического обозначения для написания и совместного использования онтологий не подразумевает каких-либо обязательств по реализации зависимой системы знаний или зависимой логики. Мы просто занимаем позицию того или иного уровня знаний 5 при описании конкретной системы знаний, независимо от средств практической реализации. С этой точки зрения мы можем спросить любую интеллектуальную систему, даже реализованную в виде нейронной сети: «Что данная система знает?»

Проект по созданию объёмной онтологической базы знаний

Лексическая база данных английского языка

Вещь

Вещь

Индивидуальный объект

Неосязаемое

Показанное

Живое

Неживое

Обобщённая верхняя модель

?

Um-вещь

Вещь

Конфигурация

Элемент

Последовательность

Нечто конкретное

Процесс

Объект

Абстракция

Рисунок 2. Иллюстрация того, как онтологии отличаются в своём анализе наиболее общих концептов.

Применение онтологий

В сфере применения средств искусственного интеллекта знания в компьютерных системах считаются чем-то явно выраженным и приводимым в действие технологическими процессами умозаключений. Однако это слишком узкая точка зрения. Все информационные системы обмениваются знаниями. Любое программное обеспечение, которое делает что-либо полезное, не может быть написано без привязки к модели того или иного релевантного мира — сущностей, свойств и отношений в этом мире. Структуры данных и технологические процессы неявно или явно создают привязки к онтологии той или иной предметной области. Обычно возникают запросы, «знает» ли система расчета заработной платы о новом налоговом законодательстве или «известно ли» той или иной системе баз данных о заработной плате сотрудников. Информационно-поисковые системы, электронные библиотеки, интеграция разнородных источников информации и поисковые системы в Интернете нуждаются в онтологиях предметной области для организации информации и управления процессами поиска. Например, в поисковой системе есть категории и подкатегории, которые помогают организовать поиск. Люди, занимающиеся поисковыми системами, обычно называют эти категории и подкатегории онтологиями.

Объектно-ориентированная структура проекта программных систем аналогичным образом зависит от соответствующей онтологии предметной области. Объекты, их атрибуты и алгоритмы вычислений более или менее отражают аспекты данного домена, релевантные относительно конкретного приложения. Системы объектов, представляющие полезный анализ той или иной предметной области, как правило, могут многократно использоваться для какой-нибудь другой прикладной программы. Системы объектов и онтологии акцентируют внимание на различных аспектах, но мы предугадываем, что со временем конвергентность этих технологий будет увеличиваться. Поскольку информационные системы моделируют большие области знаний, онтологии предметных областей станут столь же важными в общих программных системах, как и во многих областях сферы искусственного интеллекта.

В сфере искусственного интеллекта при том, что представление знаний пронизывает всю данную область, две прикладные области в особенности зависят от обширного объема знаний. Одна из них — понимание естественного языка. Онтологии полезны в сфере понимания естественного языка (NLU) двояко. Во-первых, знание предметной области часто играет решающую роль в устранении неоднозначности. Хорошо спроектированная онтология предметной области обеспечивает конкретную основу для представления знаний предметной области. Кроме того, онтология предметной области помогает идентифицировать семантические категории, которые участвуют в понимании языкового общения в данной предметной области. Для такого применения онтология играет роль словаря концептов. Нам, вообще говоря, для понимания естественного языка (NLU) нужны как универсальная верхняя онтология, так и предметно-ориентированная онтология, которая фокусируется на данной области понимания языкового общения (например, на военных коммуникациях или на деловых газетных материалах). CYC, Wordnet, 8 и Sensus15 являются примерами разделяемых онтологий, которые применялись и применяются для понимания языка.

Решение проблем, подключённое к базе знаний (KBPS), — вторая область сферы искусственного интеллекта, которая является крупным потребителем знаний. Системы KBPS решают множество проблем, таких как диагностика, планирование и проектирование, с использованием обширных знаний. В настоящее время системы KBPS используют предметно-ориентированные знания, которых обычно достаточно для построения систем знаний, ориентированных на конкретные прикладные области и задачи. Даже в конкретных прикладных областях системы знаний, тем не менее, могут катастрофически не справляться, когда будут доведены до предела возможностей предметно-ориентированных знаний. В качестве реакции на этот конкретный недостаток исследователи предположили, что системы решения проблем нуждаются в общепринятых знаниях в дополнение к предметно ориентированным знаниям. Первоначальная мотивация для CYC заключалась в обеспечении таким корпусом отвечающих здравому смыслу совместно используемых знаний для подключённых к базе знаний систем. Существует аналогичная потребность в разработке предметно-ориентированных знаний. Из этого следует, что разработка базы знаний на основе онтологий даёт двойное преимущество. Сами онтологии доступны для совместного использования. С помощью этих онтологий мы можем создавать базы знаний, беря за основу структуру концептуализаций для кодирования определённых фрагментов знаний. Базами знаний, которые мы разрабатываем с привлечением этих онтологий, можно совместно пользоваться более надежно, потому что формальная онтология, лежащая в их основе, способна помогать прояснять семантику данного конкретного представления.

Информационные системы и системы NLU нуждаются в фактических знаниях об областях своего языкового общения. Конкретные логические заключения, которые они делают, обычно просты. Системы решения проблем, напротив, участвуют в сложной последовательности умозаключений для достижения своих целей. В таких системах должны быть в наличии стратегии рассуждения, позволяющие делать выбор среди альтернативных путей рассуждения. Онтологические функциональные требования в системах знаний имеют два измерения:

• Фактические знания предметной области предоставляют знания об объективных реальностях в интересующей предметной области (объекты, отношения, события, состояния, причинные отношения и т.д.).

• Знания области решения проблем дают знания о том, как достичь различных целей. Часть этих знаний может быть в форме некоего метода решения проблем, определяющего — независимым от предметной области способом — как осуществлять тот или иной класс целей.

Самые ранние исследования в KBPS соединяли фактические знания и знания области решения проблем в существенно отражающие специфику предметной области правила, получившие название предметных знаний. По ходу исследований стало ясно, что существовали системные общие черты в стратегиях логического мышления у целей похожих типов. Эти стратегии логического мышления также характеризовались потребностью в конкретных типах фактических знаний предметной области. Вскоре стало ясно, что стратегические знания можно было бы рассматривать отвлечённо и использовать повторно.

За редким исключением 16,17 сфера деятельности фактуальных знаний данной предметной области является основным направлением большинства исследований средств искусственного интеллекта по онтологиям. Это обусловлено тем, что информационные системы понимания языка являются движущей силой большей части работы над онтологиями. Даже CYC, изначально обоснованный необходимостью того, чтобы системы накопления знаний имели в своём распоряжении знания о мире, проходил проверку скорее на естественном языке, чем в сфере информационных систем знаний.

Исследователи KBPS понимали, что помимо фактуальных знаний существуют знания о том, как достичь целей по решению проблем. Получается, что это акцентирование методов, подходящих для различных типов проблем, дало толчок второму поколению исследований в области систем знаний 18. Большая часть работы сообщества KBPS по представлению знаний малоизвестна тем, кто вообще занимается представлением знаний в сфере искусственного интеллекта. В ближайшие годы мы ожидаем повышенного внимания к методическим онтологиям как к общему ресурсу знаний.

Благодарности

Эта статья базируется на работе, поддержанной Управлением военно-морских исследований в рамках гранта N00014-96-1-0701. Мы благодарны за поддержку ONR и программе DARPA RaDEO. Любые мнения, выводы, заключения или рекомендации, выраженные в этой публикации, принадлежат авторам и необязательно отражают точку зрения ONR. Нидерландский фонд исследований в области компьютерных наук поддержал Ричарда Бенджамина при финансовой поддержке Нидерландской организации научных исследований (NWO).

Смежные направления исследований

Область онтологии привлекает междисциплинарных исследователей как из академических кругов, так и из промышленной сферы. Здесь мы даём подборку ссылок, которые описывают смежную онтологическую работу. Поскольку литературы очень много, составить полный список невозможно. Для получения развёрнутой подборки (в алфавитном порядке) ссылок на онтологические работы, включая материалы и события, см. http://www.cs.utexas.edu/users/mfkb/related.html

Онтологические совещания

• Applications of Ontologies and Problem-Solving Methods, ECAI ’98 (European Conf. AI), http://delicias.dia.fi.upm.es/WORKSHOP/ ECAI98/index.html

• Building, Maintaining, and Using Organizational Memories, ECAI ’98, http://www.aifb.uni-karlsruhe.de/WBS/ECAI98OM/

• Formal Ontologies in Information Systems (FOIS ’98), http://krr.irst. itc.it:1024/fois98/program.html

• Intelligent Information Integration, ECAI ’98, http://www.tzi.de/ grp/i3/ws-ecai98/

• Sharable and Reusable Components for Knowledge Systems, KAW ’98 (Workshop on Knowledge Acquisition, Modeling, and Management), http://ksi.cpsc.ucalgary. ca/KAW/KAW98/KAW98Proc.htm

• Ontological Engineering, AAAI Spring Symp. Series, Stanford, Calif., 1997, http://www.aaai.org/Symposia/Spring/1997/sss-97.html

• Problem-Solving Methods, IJCAI ’97 (Int’l Joint Conf. AI), http:// www. aifb. uni-karlsruhe. de/WBS/dfe/PSM/main.html

• Ontological Engineering, ECAI ’96, http://wwwis.cs.utwente.nl: 8080/kbs/EcaiWorkshop/homepage.html

• Practical Aspects of Ontology Development, AAAI ’96

• Sharable and Reusable Ontologies, KAW ’96, http://ksi.cpsc. ucalgary. ca/KAW/KAW96/KAW96Proc.html

• Sharable and Reusable Problem-Solving Methods, KAW ’96, http:// ksi.cpsc.ucalgary. ca/KAW/KAW96/KAW96Proc.html

• A. Tate, “Roots of SPAR—Shared Planning and Activity Representation,” Knowledge Eng. Rev., Vol. 13,No. 1, Mar. 1998, pp. 121-128.

• Y.A. Tijerino and R. Mizoguchi, “Multis II: Enabling End-Users to Design Problem-Solving Engines via Two-Level Task Ontologies,” Proc. EKAW ’93: Seventh European Workshop on Knowledge Acquisition for Knowledge-Based Systems, Lecture Notes in Artificial Intelligence No. 723, Springer-Verlag, 1993, pp. 340-359.

Онтологии задач и методов

• D. Fensel et al., “Using Ontologies for Defining Tasks, ProblemSolving Methods, and Their Mappings,” Knowledge Acquisition, Modeling, and Management, E. Plaza and V.R. Benjamins, eds., Springer-Verlag, Berlin, 1997, pp. 113-128.

• J.H. Gennari et al., “Mapping Domains to Methods in Support of Reuse,” Int’l J. Human-Computer Studies, Vol. 41, No. 3, Sept. 1994, pp. 399-424.

Онтологии и менеджмент знаний

• A. Abecker et al., “Toward a Technology for Organizational Memories,” IEEE Intelligent Systems, Vol. 13,No. 3, May/June 1998, pp. 40-48.

• V.R. Benjamins and D. Fensel, “The Ontological Engineering Initiative (KA)2,” Formal Ontology in Information Systems, N. Guarino, ed., IOS Press, Amsterdam, 1998, pp. 287-301.

• M.S. Fox, J. Chionglo, and F. Fadel, “A Common-Sense Model of the Enterprise,” Proc. Industrial Eng. Research Conf., Inst. for Industrial Engineers, Norcross, Ga., 1993, pp. 425-429.

• Manual of the Toronto Virtual Enterprise, tech. report, Enterprise Integration Laboratory, Dept. of Industrial Eng., Univ. of Toronto, Toronto, 1995.

• M. Uschold et al., “The Enterprise Ontology,” Knowledge Eng. Rev., Vol. 13, No. 1, Mar. 1998.

• S. Luke et al., “Ontology-Based Web Agents,” Proc. First Int’l Conf. Autonomous Agents, ACM Press, New York, 1997, pp. 59-66; http://www.cs.umd.edu/projects/plus/SHOE/ 1997.

• S.T. Polyak et al., “Applying the Process Interchange Format (PIF) to a Supply Chain Process Interoperability Scenario,” Proc. 1998 European Conf. Artificial Intelligence (ECAI ’98) Workshop on Applications of Ontologies and Problem-Solving Methods, ECCAI, Brighton, England, 1998, pp. 88-96.

• G. Wiederhold, “Intelligent Integration of Information,” J. Intelligent Information Systems, Vol. 6,Nos. 2/3, 1996.

• G. Wiederhold and M. Genesereth, “The Conceptual Basis for Mediation Services,” IEEE Intelligent Systems, Vol. 12, No. 5, Sept./Oct. 1997, pp. 38-47.

Онтологии и информационные источники

• Y. Arens et al., “Retrieving and Integrating Data from Multiple Information Sources,” Int’l J. Intelligent and Cooperative Information Systems, Vol. 2, No. 2, 1993, pp. 127-158.

• S. Chawathe, H. Garcia-Molina, and J. Widom, “Flexible Constraint Management for Autonomous Distributed Databases,” IEEE Data Eng. Bulletin, Vol. 17, No. 2, 1994, pp. 23-27.

• S. Decker et al., “Ontobroker: Ontology-Based Access to Distributed and Semi-Structured Information,” Semantic Issues in Multimedia Systems, R. Meersman et al., eds., Kluwer Academic Publishers, Boston, 1999.

Онтология естественного языка

• J.A. Bateman, B. Magini, and F. Rinaldi, “The Generalized Upper Model,” Working Papers 1994 European Conf Artificial Intelligence (ECAI ’94) Workshop on Implemented Ontologies, 1994, pp. 34-45; http://www.darmstadt.gmd.de/publish/komet/papers/ecai94.ps.

• K. Knight and S. Luk, “Building a Large-Scale Knowledge Base for Machine Translation,” Proc. AAAI ’94, AAAI Press, Menlo Park, Calif. 1994.

• G.A. Miller, “Wordnet: An Online Lexical Database,” Int’l J. Lexicography, Vol. 3, No. 4, 1990, pp. 235-312.

• P.E. Van de Vet, P.H. Speel, and N.J.I. Mars, “The Plinius Ontology of Ceramic Materials,” Working Papers 1994 European Conf. Artificial Intelligence (ECAI ’94) Workshop on Implemented Ontologies, ECCAI, Amsterdam, 1994,pp. 187-206.

• R. Studer, V.R. Benjamins, and D. Fensel, “Knowledge Engineering, Principles, and Methods,” Data and Knowledge Eng., Vol. 25, Mar. 1998, pp. 161-197.

• M. Uschold and M. Gruninger, “Ontologies: Principles, Methods, and Applications,” Knowledge Eng. Rev., Vol. 11,No. 2, Mar. 1996, pp. 93-155.

Специальные публикации по онтологии

• N. Guarino and R. Poli, “The Role of Ontology in the Information Technology,” Int’l J. Human-Computer Studies, Vol. 43, Nos. 5/6, Nov.-Dec. 1995, pp. 623-965.

• G. Van Heijst, A.T. Schreiber, and B.J. Wielinga, “Using Explicit Ontologies in KBS Development,” Int’l J. Human-Computer Studies, Vol. 46, Nos. 2/3, Feb.-Mar. 1997, pp. 183-292.

• M. Uschold and A. Tate, “Putting Ontologies to Use,” Knowledge Eng. Rev., Vol. 13, No. 1, Mar. 1998, pp. 1-3.

Разработка онтологий

• J. Benjamin et al., “Ontology Construction for Technical Domains,” Proc. EKAW ’96: European Knowledge Acquisition Workshop, Lecture Notes in Artificial Intelligence No. 1076, Springer-Verlag, Berlin, 1996, pp. 98-114.

• W.N. Borst and J.M. Akkermans, “Engineering Ontologies,” Int’l J. Human-Computer Studies, Vol. 46, Nos. 2/3, Feb.-Mar. 1997, pp. 365-406.

• A. Farquhar, R. Fikes, and J. Rice, “The Ontolingua Server: A Tool for Collaborative Ontology Construction,” Int’l J. Human-Computer Studies, Vol. 46, No. 6, June 1997, pp. 707-728.

• A. Gomez-Perez, A. Fernandez, and M.D. Vicente, “Towards a Method to Conceptualize Domain Ontologies,” Working Notes 1996 European Conf. Artificial Intelligence (ECAI ’96) Workshop on Ontological Eng., ECCAI, Budapest, Hungary, 1996, pp. 41-52.

• T.R. Gruber, “Towards Principles for the Design of Ontologies Used for Knowledge Sharing,” Int’l J. Human-Computer Studies, Vol. 43, Nos. 5/6, Nov.-Dec. 1995, pp. 907-928.

Ссылки

1. D.B. Lenat and R.V. Guha, Building Large Knowledge-Based Systems: Representation and Inference in the CYC Project, Addison- Wesley, Reading, Mass., 1990.

2. B. Chandrasekaran, “AI, Knowledge, and the Quest for Smart Systems,” IEEE Expert, Vol. 9, No. 6, Dec. 1994, pp. 2-6.

3. J. McCarthy and P.J. Hayes, “Some Philosophical Problems from the Standpoint of Artificial Intelligence,” Machine Intelligence Vol. 4, B. Meltzer and D. Michie, eds., Edinburgh University Press, Edinburgh, 1969, pp. 463-502.

4. D. Marr, Vision:A Computational Investigation into the Human Representation and Processing of Visual Information, W.H. Freeman, San Francisco, 1982.

5. A. Newell, “The Knowledge Level,” Artificial Intelligence, Vol. 18, 1982, pp. 87-127.

6. R. Wieringa and W. de Jonge, “Object Identifiers, Keys and Surrogates: Object Identifiers Revisited,” Theory and Practice of Object Systems (TAPOS), Vol. 1, No. 2,1995, pp. 101-114.

7. J.A. Bateman, B. Magini, and F. Rinaldi, “The Generalized Upper Model,” Working Papers 1994 European Conf. Artificial Intelligence (ECAI ’94) Workshop on Implemented Ontologies, 1994, pp. 34-45; http://www.darmstadt .gmd.de/publish/komet/papers/ecai94.ps

8. G.A. Miller, “Wordnet: An Online Lexical Database,” Int’l J. Lexicography,Vol. 3, No. 4,1990, pp. 235-312.

9. N. Fridman Noy and C.D. Hafner, “The State of the Art in Ontology Design,” AI Magazine, Vol. 18, No. 3, 1997, pp. 53-74.

10. D. Fensel and V.R. Benjamins, “The Role of Assumptions in Knowledge Engineering,” Int’l J. Intelligent Systems, Vol. 13, No. 7, 1998, pp. 715-747.

11. M.R. Genesereth and R.E. Fikes, Knowledge Interchange Format, Version 0.3, Knowledge Systems Lab., Stanford Univ., Stanford, Calif. 1992.

12. R. Neches et al., “Enabling Technology for Knowledge Sharing,” AI Magazine, Vol. 12, No. 3, 1991, pp. 36-56.

13. T.R. Gruber, “A Translation Approach to Portable Ontology Specifications,” Knowledge Acquisition, Vol. 5, 1993,pp. 199-220.

14. G. Schreiber et al., “CommonKADS: A Comprehensive Methodology for KBS Development,” IEEE Expert, Vol. 9, No. 6, Dec. 1994, pp. 28-37.

15. K. Knight and S. Luk. “Building a Large- Scale Knowledge Base for Machine Translation,” Proc. Am. Assoc. Artificial Intelligence, AAAI Press, Menlo Park, Calif., 1994.

16. D. Fensel et al., “Using Ontologies for Defining Tasks, Problem-Solving Methods and Their Mappings,” Knowledge Acquisition, Modeling and Management, E. Plaza and V.R. Benjamins, eds., Springer-Verlag, New York, 1997, pp. 113-128.

17. R. Mizoguchi, J. Van Welkenhuysen, and M. Ikeda, “Task Ontology for Reuse of Problem Solving Knowledge,” Towards Very Large Knowledge Bases, N.J.I. Mars, ed., IOS Press, Amsterdam, 1995.

18. J.M. David, J.P Krivine, and R. Simmons, Second Generation Expert Systems, Springer-Verlag, 1993.

Авторы

B. Chandrasekaran — заслуженный профессор, старший научный сотрудник и директор Лаборатории исследований искусственного интеллекта (LAIR) на факультете компьютерных и информационных наук Университета штата Огайо. В его исследованиях особое внимание уделяется системам баз знаний, пониманию причинно-следственных связей, визуальному структурному мышлению и когнитивным архитектурам. Он получил степень бакалавра в Мадрасском университете и докторскую степень в Пенсильванском университете, то и другое в области проектирования электрических систем. Он был главным редактором IEEE Expert с 1990 по 1994 год и входит в редакционные советы многих международных журналов. Он член IEEE, AAAI и ACM. Связывайтесь с ним через Лабораторию исследований искусственного интеллекта, Университет штата Огайо, Колумбус, штат Огайо, 43210; chandra@cis.ohio-state.edu; http: // www. cis.ohio-state.edu/lair/.

John R. Josephson — научный сотрудник и заместитель директора Лаборатории исследований искусственного интеллекта Департамента компьютерных и информационных наук Университета штата Огайо. Его основные исследовательские интересы — системы баз знаний, абдуктивный вывод, причинное осмысление, формирование теории, распознавание речи, восприятие, диагностика, логика исследования и основы науки. Он получил степень бакалавра и магистра математики и докторскую степень по философии в Университете штата Огайо. Он работал в нескольких прикладных областях, включая медицинскую диагностику, объяснение результатов медицинских тестов, диагностику инженерных систем, планирование логистики, распознавание речи, молекулярную биологию, проектирование электромеханических систем и расшифровка аэрофотоснимков. Он является соредактором со Сьюзен Джозефсон из Abductive Inference: Computing, Philosophy, Technology, Cambridge Univ. Press, 1994. Связывайтесь с ним через Лабораторию исследований искусственного интеллекта, Университет штата Огайо, Колумбус, штат Огайо, 43210; jj@cis.ohio-state.edu; http://www.cis.ohio-state.edu/lair/.

Richard Benjamins — старший научный сотрудник и преподаватель кафедры информатики социальных наук Амстердамского университета. Его исследовательские интересы включают технику представления знаний, методы и онтологии решения проблем, диагностику и планирование, а также искусственный интеллект и Интернет. Он получил степень бакалавра в области когнитивной психологии и докторскую степень в области искусственного интеллекта в Амстердамском университете. Связывайтесь с ним через кафедру информатики социальных наук Univ. Амстердама, Roetersstraat 15, 1018 WB Амстердам, Нидерланды; richard@swi.psy.uva.nl; http: //www.swi.psy.uva. nl / usr / richard / home.html.