5.2 言語

5.2.1 XML(eXtensible markup Language)

XMLeXtensible Markup Languageの略称で、1990年代後半にW3Cによって開発されたデータ記述、データ転送及びデー タ交換の標準的な方式である。XMLは、データを記述する一つの方法として、カスタマイ ズされたタグを用いてマークアップデータを作り上げる為の仕組み を提供する。XMLHTMLに関する限り必要では無い、事実、これら二つは全く 異なる目的の為に設計されている。この様な事実にも拘らず、この二つは、利用者のニーズに則して、色々な局面でお互いを補完できる関係にある。

 

タグは、通常、姓名街路番地のようなデータに対するラベルである。ある標準的な 交換形式を定義するのにXMLを用いる場合、タグに関する合意を得る事が重要であ る。例えば、二つの出版社がデータ交換を含むパートナシップを形成する事を望むかも知れない、この場合、出版社A著者の定義は出版社Bライタの定義と同一である事を最初に定義し、その後、XMLを用いて、その他の合意した部分を定義する。重複し た用語や同じ意味の用語が、通常DTDXMLスキーマ等を用いて定義される。(XMLスキーマは形式的な方法でXML文書を定義する仕組みであり、正確な情報交換を可能 にする。)

 

XMLスキーマの実例を沢山の政府や実業界の中に見出す事 ができる。U.S. CIO諮問委員会のXML作業部会によれば、組織が同一要素の定義を行ない、且つ、これ等の定義 をパートナが検索やサービス発見に使える様になって、XMLの最高の利益を穫得する事ができる。レジストリ/リポジトリは、インターネットを介して文書、テンプレート 及びソフトウェア(すなわち、オブジェクト及びリソース)を検索したり見つけ出したりする為の手段である。レ ジストリはオブジェクト発見の為に用いられ、場所等の発見したオブジェクトに関する情報を提供する。リポジトリはそのオブジェクトの存在する場所である。

 

セマンティックス及びセマンティック Webの文脈の中では、XMLは特定の領域の中で意味的に豊富なマークアップ言語 を創るための構文規則のセットである。XMLは文書の任意の構造を規定する事を可能にするが、そ の構造の持つ意味に関しては何も述べていない。(Berners-Lee, Hendler, and Lassila, 2001) 言い換えると、ITシステム、データベース及びコンテント管理システム は物事を記述するには良くなったけれども、関係を記述するのにはそれ程良いものとは言えない。より強固且つ忠実な記述方式が語句、用語及び領域の意味を表 すのに必要である。

 

5.2.2 RDF(Resource Description Framework)

RDFResource Description Frameworkの略称で、特にこの種の関係情報を記述するために設 計されたものである。RDFは、豊富かつ柔軟なデータを作成する手段を提供す る、故に、システムプログラマやデータモデル設計者により明示的に定義されたものを、当該環境の外に置く事が可能である。RDFは、主語、述語、目的語からなるトリプルの集合を用 いて情報をコード化する。(このモデルはリソース、プロパティ、バリューの構造でも表せる)

RDFは、分散されたメタデータをリンクする為の基盤を提 供し、OWLと共にオントロジを記述したり表現したりするコア言 語でもある。

 

データの関係記述にRDFを用いる第一の利点は、スケーラビリティと柔軟性と である。データベーステーブルを用いて、RDFと同じ様なものを作る事が出来る事は明白であるが、RDFのユニークな点は、高度な関係記述機能の為の柔軟な 仕組みを提供している事である。それを用いて、問合せの機能の高度化を図ったり、また、テーブルの中に明示的に記述されていないトピックの様なものを推論 する事ができる。この利点は、新たなデータソースの統合を図る時にのみ増大する。特に、それらが異なる構造若しくは意味を持つ時、又は、より重要な事に は、概念領域をまたがった時、特に顕著となる。(環境データと健康データとの統合、又は、法執行デー タと諜報データとの統合等の場合)

 

RDFトリプルはXML形式で記述され、XMLタグ、又は、機械処理し易い形式の構文を用いてデー タ要素間の関係を記述する一つの方法を提供する。疎結合及び/又は仮想アーキテクチャをサポートする為に、そのト リプルの要素を特定するのにURIが用いられる。URIの目的は、主語、動詞、若しくは、目的語の形式の中 で、夫々に該当する概念を定義している大元の場所にリンクする事により対応する概念を曖昧無く識別する事である。

 

RDFスキーマ(RDFS又はRDF-Sと記述されることもある)は、RDFの意味の記述やRDFの拡張を行う為のものである。関連するリソースのグ ループやリソース間の関係を記述する仕組みも提供する。RDFスキーマは、XMLに対してDTDXMLスキーマが行なうのと同様な事をRDFに対して行なう。

 

RDFデータに対する問合せ言語が、研究者や産業界で沢山 開発された。200410月にW3CData Access Working Groupは、SPARQL(“スパークルと発音する)の仕様書の草稿をリリースした。これは、RDFの問合せ言語の一つであり、開発者やエンドユーザが 書くべき言語の統一化を模索したものであり、且つ、広範囲の情報からの検索結果を使える様にする事を目指したものである。

 

5.2.3 OWL(Web Ontology Language)

OWLは、Web Ontology Languageの略である。(この頭字語は、Winnie the Poohの本に出てくるowl(フクロウ)の名前を連想するように、本当の名前WOLから意図的にOWLへ変更された)RDFの主要な価値が分散データの結合と統合を可能にする 事であるのに対して、OWLの主要な価値は、分散データの推論を可能にする事で ある。

 

OWLは高度な表現力を有するモデリング言語であり、既存 のデータ格納機能やXMLや関係及びオブジェクト指向アプローチ等のモデル構 築機能との互換性を有している。更に、OWLは、簡単に構築でき且つ発展可能な複数の知識ベース から成るデータの疎結合ビューを提供する。最も重要な事は、OWLが機械処理可能なセマンティックス(machine-actionable semantics)を持っていることである。実行時および設計時に、ソ フトウェアツールは、人間の助けや高度に特殊なアプリケーション命令を必要とせずにモデル、データ、メタデータ、規則(rules)或はロジックを用いてある事を行なう事が可能となる。(Pollock, 2004)

OWLは、柔軟且つ計算可能な論理構造のセットを開発しよ うとした数多くの開発努力から発展したものである。その開発努力の多くのものは数年前に始まったものである。OWLは、DAML+OILと呼ばれるオントロジ言語の次の世代のものであり、DAML+OILは、米国のDAML(the DARPA Markup Language)とヨーロッパのOIL(the Ontology Inference Layer (又はLanguage))と言う二つの開発努力を統合したものである。また、OWLSHOE(Simple HTML Ontology Extensions)にもルーツを持っている。SHOEは知的エージェント機能を実現する事を目的として、 マシンリーダブルな知識をWeb文書と連携させる為に、メリーランド大学のJames Hendlerをリーダとして開発されたものである。OWLには、(OWL Lite, OWL DL及びOWL Full3つのレベルが定義されており、漸次、表現力と推論の 能力とが高度になる。これらのレベル分けは、ツールベンダがOWLの特定機能範囲のツールを開発するのをより容易にす るために作られた。

 

RDFOWLとは一緒に使うことも出来るし、別々に使うことも出 来る。ある場合、分散データをサポートすることが主な目的かも知れない、その様な場合は、RDFのみが使われるかも知れない。また他の場合、分散と 推論機能とが必要とされるかも知れない。この場合、RDFOWLとの両方が利用されるかもしれない。他の場合、推論 機能だけが要求とされるなら、この様な場合、OWLだけで充分であろう。

 

5.2.4 その他の言語開発の為の努力

前記以外の言語の開発が、セマンティックWebビジョンの中の上位層に対応するために現在進行中で ある。例えば、ルール言語は、機械処理に適した形式である論理関係を表現するための機能を提供するであろう。この言語はビジネスルールの表現を可能にし、 より高度な推理や推論能力を提供するであろう。RuleMLが最初ルール言語として提案されたが、Semantic Web Rules Language(SWRL)を形成する努力が現在W3Cで進行中である。ロジック言語は、単調論理を表現し たり、証明を検証したりするための普遍的な機構を提供するものと考えられている。

長期的な野望は、最終的にウェブなどから新しい知識 を引き出して何等かの事実を利用可能にする事である。(ここでの問題は、演繹システムが恐ろしく相互互換で なければならないと言う事ではない。何でも出来る唯一の推論システムを設計するというより、むしろ、現在の活動は、証明を記述するための普遍的言語を定義 する事に集約されている。それが実現すれば、色々なシステムが、他のシステムで利用したり組み込んだりする為に、これ等の証明をデジタル的に署名したりこ れらの証明をエキスポートしたりする事が可能になる。)

同様に、評判や信用を推論する為の構造、スキーマ及 びアーキテクチャが、W3Cの中や、より大きなWebコミュニティの中で開発されつつある。これらのアプ ローチは、個人や人々との間の評判や信頼を推論するだけでなく、人々のグループ(会社、メディアソース、NGO及び政治的動向など)や無生物(本、映画、音楽、研究論文及び消費物資など)やアイデア(信用システム、政策上のアイデア及び政策提案など)を推論するための手段として注目されている。(Masum and Zhang, 2004

 

 この分野の技術者が直面した1つの問題は、あいまい な人間の言葉で述べる事が可能な知識を把握するのに充分な記述力を有するフレームワークと言語とを開発する事である。問題は、複雑な事を表現するのを可能 にしつつ、単純な事を簡単に表現する事を可能にする言語、ツール及びシステムを如何にして作るかである。もう1つの問題は、構文に対する人間の可読性や扱 い易さを勘案しながらHTMLXML及びRDFの様な既存の構文標準といかに互換性を保持するかで ある。最終的には、これらの問題を極小化する様なより良いツールが開発されるであろう、しかし、暫くすると、何等かのより高次の言語における複雑さが、現 在のエディットツールやモデリングツールを用いた完全準拠の実装開発をより困難にするかも知れない。

 

目次へ