従来のWebは、利用者である人間が、その内容を読み、理解し、操作する事を前提としたWebであり、ヒューマンリーダブルなWebであると呼ばれている。従来のWebは大成功を収め、既に膨大な情報がWeb上に蓄積されており、更に、
日々新たな情報が附加されつつあり、日常生活に於いても、欠く事のできないものとなっている。
Webの利用が広がるにつれ、次の様な問題点が顕在化して来た。
- 必要な情報が探せない。
- 検索サイトで検索しても不必要な情報がヒットする。
- 読んで、理解し、利用するのに時間が掛かる。
- 情報を発信しても、中々読んで貰えない。
- 貴重な情報が活用されない。
W3Cは、この様な問題を解決し、且つ、新たな可能性を拓くものとして、セマンティックWebを提唱した。
従来のWebが、ヒューマンリーダブルなWebであるのに対して、セマンティックWebは、マシンリーダブルなWebである。
セマンティックWebの要点を述べると次の様になる。
- セマンティックWebを実現する為には、Webの意味を記述したデータが必要であり、そのデータをセマンティック(意味)データと言う。
- 従来のWebデータ(HTMLデータ)をセマンティックデータで置換してしまうと、従来のWebが成り立たなくなるので、メタデータとしてセマンティックデータを記述する。
- セマンティック記述を可能にするメタデータ記述言語として、W3Cは、RDF(Reource Description Framwork)を開発した。
- RDFで記述されたデータの意味の解釈にブレが有っては困るので、RDFの仕様書では、言語の構文(シンタックス)と共に各構文の意味モデルを定義している。
- それでは、セマンティック(意味)とはどの様なものであろうか? セマンティックWebでは、意味とは、「物事の関係性」であると規定している。
- この為、RDFの意味モデルの基本構成要素は、「主語」、「述語」、「目的語」の3要素により構成され、「述語」により「主語」と「目的語」との関係を示す。
- 尚、「主語」、「述語」、「目的語」の3要素を「トリプル」と呼ぶ。
- RDFには、必要最小限の意味記述語彙しか定義されていないので、RDFを自由に拡張できるようにする為、RDFS(RDF Schema)の仕様が別途規定されている。
- セマンティックWebでは、知識や意味をオントロジに依って記述する事を目指しており、オントロジ用の記述言語として、RDFを拡張したOWL(Web Ontology Language)が定義されている。
- セマンティックWebでは、「オントロジとは、語彙間の関係」であると定義しており、RDFで記述された情報は簡素なオントロジである。(以下、本サイトでは、セマンティックWebのオントロジを単にオントロジと記述する)
- オントロジでは、関係の性質(すなわち、述語の性質)が重要である。この為、オントロジはプロパティ中心アプローチ(プロパティセントリックアプローチ)であると言われている。
- OWLで規定されている関係の性質には、「等価関係」、「逆関係」、「遷移的関係」、「対称的関係」、「関数的関係」、「逆関数的関係」等がある。
- また、オントロジでは、クラスやサブクラスやタイプにより情報をグループ化したり、或る性質を有する物の無名集合を定義する事が可能である。
- これらのグループ分けや関係の性質を上手に活用することにより、明示的事実から黙示的事実を把握したり、効率的な記述を行う事が可能となる。
- (最近は余り重要視されていないが)OWLは、OWL Lite、OWL DL、OWL Fullの3種類のサブセットに分類されている。(注、DLは記述論理(Description Logic)の略称である)
- OWL Liteは、最も簡素なOWLのサブセットであり、実装のし易さを重視したものであり、OWL DLは、DLに基づいた推論を可能にするサブセットであり、定義矛盾生じ得る機能を排除している。OWL Fullは、制約のないOWLであり、OWL Fullを用いた場合の推論の可否は、実装に依存する(すなわち、或るシステムでは推論が成り立つがが、他のあるシステムでは推論が成り立たないと言ったことが起こり得る)。
上述のセマンティックWeb技術を活用する為には、次のツールが必要となる。
- セマンティックデータを作る為のツール
- HTMLやXMLや平文(プレーンテキスト)の意味をOWL/RDF記述データに変換する為のツール
- 知識が総てHTML等の電子データになっている訳では無いので、知識をOWL/RDF記述する為のツール
- セマンティックデータ(OWL/RDF記述データ)の意味をセマンティックWebの意味モデルに則して解釈するツール
- セマンティックデータを管理するツール(セマンティックデータベース)
セマンティックデータベースを大別すると次の二つのタイプがある。
- 既存のRDBを活用したセマンティックデータベース
- セマンティックデータ用に新たに開発されたセマンティックデータベース
- 意味検索ツール(意味検索エンジン)
- 意味をビューイングする為のツール
- インターネットを介して意味検索を可能にする為の意味処理用のサーバシステムツールとAPI
(株)サイバーエッヂは、スクラッチから独自に開発した次の製品を開発し、販売している。
- セマンティックデータを作る為のツール
- HTMLやXMLや平文の意味をOWL/RDF記述データに変換する為のツールとして、TextSemanticsAnalyzerとWikiPageAnalyzer
- 知識が総てHTML等の電子データになっている訳では無いので、知識をOWL/RDF記述する為のツールして、OntologyGenerator
- セマンティックデータ(OWL/RDF記述データ)の意味をセマンティックWebの意味モデルに則して解釈するツールとして、RDFAnalyzer
- セマンティックデータを管理するツール(セマンティックデータベース)として、セマンティックWebエンジン(SemanticWebEngine)
(注)SemanticWebEngineは、セマンティックデータ用に新たに開発された効率的なセマンティックデータベースシステムであり、RDBを利用していない。
- 意味検索ツール(意味検索エンジン)として、セマンティックWebエンジン(SemanticWebEngine)
- 意味をビューイングする為のツールとして、オントロジビューワ(OntologyViewer)とグラフビューワ(GraphViewer)
- インターネットを介して意味検索を可能にする為の意味処理用のサーバシステムツールとAPIとして、セマンティックWebエンジンサーバ(SemanticWebEngine Server)
セマンティックWeb用のツールには、米国のスターフォード大学が開発したものとか、HPの英国の研究所が開発したものとかがあるが、(株)サイバーエッヂの製品とそれらと比較すると次の様なメリットがある。
- 日本語データを扱えることを前提に設計されている。
- 権利関係が明確である。
- 木目細かな対応が可能。
- 新たな機能要求に迅速に対応可能。
- 説明やマニュアルが日本語なので理解が容易。
|
セマンティックWebが普及する為には、次の三つの隘路がある。
- セマンティックデータが少ない。
- セマンティックWeb用のツールが少ない。
- セマンティックデータを活用したアプリケーションが少ない。
これらは、相互に関係しており、セマンティックデータが少ないので、ツールも出来ず、アプリケーションも生まれないと言えるし、有用なアプリケーションが無いので、セマンティックデータが作られず、ツールも開発されないとも言える。
正に、鶏が先か、卵が先かの関係であり、三すくみ状態である。
欧米の状況をウォッチしてみると、この状態に変化の兆しが生じている。
それは、先ず皆が利用可能なセマンティックデータを作成し、広く公開しようと言う動きである。
この動きは、LOD(Linking Open data)活動と呼ばれている。
LOD活動の基に、従来、PDFや表データ形式で公開されていた政府や公共機関の情報が、マシンリーダブルなセマンティックデータとして続々と公開されつつある。
|