4.4 セマンティックモデル(タクソノミとオントロジ)

 

 このごろ、’ontology’という言葉を使うことができるようになり、人々はそれが何を意味しているか知っている。

 Michael Daconta

 

組織、情報実体もしくはその他の知識領域空間の中に於ける関係の膨大な配列を充分かつ正確に記述可能にするデータモデルの研究が現在進行中である。その挑戦は、機械計算処理可能であり、且つ、意味モデルを用いてコンピュータにより大規模に自律的且つ決定可能に成った時、より高度なものとなる。これまで、多くの知識記述技術が考案されてきた。そのあるものは成功し、また、あるものは成功しなかった。これらの努力の結果として、コンピュータ科学者は、ビジネス環境、組織的相互関係、更に言えば、日常社会の中に於ける関係概念及び論理的概念を高度に記述するのに最も適切な方法を見つけ出すという点において重大な進歩を得た。

 

沢山の語彙群の信頼性に起因するコミュニケーションギャップの克服が挑戦すべきものとして残されている。最近まで重複や冗長な用語上の一貫性の欠如を克服する事が技術的挑戦であった。その様な問題を認識する事無しに、ビジネスユニット、個人あるいはその他のものは、異なる色々な用語や異なる関係モデルを用いて同一の要素を参照することに乏しい資源を費やし、その結果、混乱を惹き起こしコミュニケーションの可能性を限定していた。

この様な意味の違いを識別したり、調和させたりする事が、セマンティックモデルを使う基本的な理由である。図7は、一般的に使われているセマンティックモデルのスペクトルである。

 

 

 

 


7: オントロジスペクトラム

(From Daconta, Orbst, and Smith, 2003)

この図は、左下の表現力の乏しい或は意味の弱いモデルから、右上に向ってより表現力の豊かな或は意味の強いモデルの位置を示している。概略的には、左下から右上への並びは、それらのモデルが表現する構造の複雑さが増加する事を示している。すなわち、最も表現力の豊富な意味モデルは最も複雑な構造を有している。この図にはモデルと言語とが示されており、それらは、左下に示されている関係データベースモデルやXML等で読者は良くご存知であろう。以下、XMLスキーマ、実体関連モデル(ER)XTM(The XML Topic Map standard)RDFスキーマ(RDF/S)UML(Unified Modeling Language)OWL(Web Ontology Language)そして、一階述語論理(First Order Logic)まで続き、更に、上に続いている。実際には、このスペクトラムは、様相論理(Modal Logic)より上に広がっているが、それらは未だ高度に理論上の話題であり、本書の対象範囲外である。

 

セマンティックモデルの中で最も簡単なものはタクソノミである。タクソノミとは、合理的に綺麗に定義された関係構造を用いた情報の分類或はクラス分けの一つの方法と考える事ができるであろう。二つのアイテム間の関係の形は、それらアイテム間の構造やコネクションに固有なものである。タクソノミは用語間の結合関係を捉えているが、その結合関係の性質は定義していない。総ての関係は-リンクから成る階層構造である。しばしば、この様な階層構造はツリーと呼ばれ、最上位の根から下に向って枝分かれする。階層構造の中には、特定のアイテム若しくは下位のアイテムと各アイテムとの間に向きの揃った結合関係が存在する。タクソノミの良くある例は、生物学における動物相や植物相を記述するのに用いられる階層構造である。

 

8は連邦エンタープライズアーキテクチャ(Federal Enterprise Architecture (FEA))の一部で行政概念タクソノミの一部分を示している。タクソノミの階層構造性により、幾つかの概念は、一つ以上のカテゴリ下にグループ分けされている。例えば、プログラムは二回現れ、一つは部局(Agencies)”の下にあり、他の一つは協力関係(Partnerships)”の下にある。タクソノミは物事をクラス分けするのに有効であるが、しかし、物事の意味をモデル化するのには有効ではない。

 

 

 

 

 

 

 

 

 

 


8:電子政府に於けるタクソノミの例

 

シソーラスは、固有の意味をその構成の中に含み得るのでタクソノミより高次なセマンティックモデルである。言い換えると、シソーラスとは、タクソノミに規定された語彙を用いて何等かの関係の意味を付け加えたものである。シソーラスのノードは言葉若しくは文章を意味する用語(terms)”である。これ等の用語は、他のものに対して、より広い又はより狭い関係を有する。シソーラスは、同義語(synonyms)の様に、用語間の前記以外の関係の意味を持たせる事ができる。

 

タクソノミ及びシソーラスの意味表現力は限られており、関係定義における一次元の公理だけしか提供できない。それ故、これ等は、通常クラス分け体系を作成するのに用いられるが、多次元概念領域や異なる概念領域を表現するのには有効ではない。概念とは、意味の替りを示すものでは無く意味を帯びている物である。その概念は非常に抽象的であり、そのモデル化はより複雑である。或る概念群と他の概念群、そのプロパティ、属性及び概念間のルールとの関係性は、タクソノミを用いてモデル化することは出来ない。しかし、より洗練された形式のモデルを用いればこれ等の関係を表わす事が出来るであろう。

 

(アイテム間の関係)関係に明示的に名前が付けられ、また、区別するセマンティックモデルは、オントロジと呼ばれる。(7の中の概念モデルと論理学とはオントロジと考える事ができ、前者は弱いオントロジであり、後者は強いオントロジである。) 何故なら、関係性が指定されるので、関係性を定義若しくは包含する厳密な構造を最早必要としないからである。モデルは本質的にコネクションのネットワークになり、各コネクションは、任意の他のコネクションとは無関係の関係を有する。通常ツリー構造で示されるタクソノミとは異なり、オントロジは、一般的にグラフの形式で表される。すなわち、ネットワークでは、ノードに対する交差する枝(他の関係性を表す)を持つ事も、また、幾つかの子ノードは複数の親からリンクされる事もある。この様な豊富な結合性は、観念を表すのに非常に高度な柔軟性を提供する。何故なら、多くの概念領域はタクソノミやシソーラスで適切に表現する事はできないからである。維持不可能な辻褄合わせを強引に行う事により非常に多くの特異性や矛盾が起きる。更に、似ていない概念間の移動は、しばしば保守や拡張を行う事が難しいもろい結合機構を必要とする。

 

前に述べたゲティスバーグの地図を例にとると、日付の範囲を推論する為にゲティスバーグの戦い南北戦争といった概念を使うアイデアは、タクソノミを使って実現する事が不可能ではないが難しい。関係によって規定される関係は、ゲティスバーグの戦い“186371-3との間の日付または日付の範囲関係を包含する事を可能にする順序だった関係性構造とは無関係に定義する事ができる。結果的に、日付に関する概念のオントロジの中の任意の関係を辿る事が出来るならば、サーチエンジンは、日付の範囲に関し推論を実行する事が出来る。前に述べた様に、これは、人間がもごもご言っているのを理解する様なマジック的な人工知能を意味しているものではない。それは、ただ単に存在している良く定義されたデータに対して良く定義された操作を行なう事により良く定義された問題を解く機械の機能を示しているに過ぎない。

 

9は、TopQuadrant社によって作られたFEA Capabilities Managerの一部の為のオントロジを示している。下記のモデルは或る特別なITコンポーネントが大統領府の支援の為に開発されている事を推論する事を可能にする。更に、このモデルはある特別なコンポーネントを開発する協力関係にある部門を特定できる。


 

 

 

 

 


9: FEA Capabilities Managerのオントロジモデルの一部

(TopQuadrant提供)

 

単純なオントロジは、単なるコネクションのネットワークである、例えば、より豊富なオントロジは、これらの結合を規定するルールと束縛を含み得る。言語とモデルベースプログラミングのアプローチとの改良が、人間によるコーディングステップを必要とすること無しに概念モデルから実用モデルに移行する能力を強化させたのと同様な事が、オントロジ開発の中にも起こり得る。かつて、オントロジは人間の為にだけ作られたが、その様なモデルをサポートする基盤の発展に伴ったオントロジを表現する為の強化プロトコルの開発は、これ等の関係と規則とに基づいて基礎を成す文脈の演繹や論理的な帰結を得る為のモデルの能力強化をもたらした。

 

4.4.1 オントロジ記述標準

オントロジ記述と利用とに関する現在の状況は1980年代に始まった色々な努力が実を結んだ結果である。初期のセマンティックシステムは、ユビキタスネットワーク基盤が無かった事と知識記述の為の標準の欠如とから当初は苦闘した。WWWの出現とウェブ上の情報交換用のデファクト標準としてのXMLの普及とで、オントロジの研究は収斂し、そして、実を結び始めた。RDFOWL及びトピックマップ(コンテントリソース上に重ね合わせられるべき概念網記述の為のISO標準の一つ)は、総てXMLを用いている。(標準プロパティと順次形式の中のフィールドを持つ)強く型付けされた記述であるRDFOWL及びトピックマップは、ウェブ上でこれ等のモデルを転送したり、蓄積したり、また、Webサービスの様な他のウェブ標準とそれらのモデルを統合する事を容易にした。

 

知識管理コミュニティの幾人かから表明されている警告がある。それは、同じ様な競合するオントロジが沢山出現するのではないかと言う事である。それはシステム横断的な構造や意味のシームレスな共有を達成する阻害要因に成るかも知れない。異なるオントロジがあるモデルから他のモデルに自動形式変換する用に作られ得るけれども、通常、その様な状態に至るには多量の人間によるモデリングが必要となる。(あるサイズのオントロジの整備は、大規模なデータベースの整備に例える事ができ、その様な仕事は、しばしば多くの計画の立案と開発努力とを必要とする。) 「広く共有されたオントロジを用いる事で大いなる成果が得られる」と言う知識管理の専門家の警告の問題は後の節で議論される。

 

目次へ