原文のページ:http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
LINKING OPEN DATA W3C SWEO Community Project
目次
1.ニュース
2.プロジェクトの説明
3.1 会議と集会
3.1.1 LODコミュニティ集会
3.1.2 リンクトデータコンファレンス、ワークショップ及びチュートリアル
3.2 関連情報
3.2.1 チュートリアルと論文概略
3.2.2 講演
3.2.3 歴史的展望
3.2.4 デモ
3.3 メーリングリスト(メール先名簿)
4.よくある質問と回答
5.コミットメント(参加)
6.プロジェクトへの参加の方法
News:ニュース
・2010-05-28 Newsweek社は、ウェブサイト上の記事にRDFa、DUBLIN Core、FOAF及びSIOCを使った注釈を付与しています。
・2010-05-28 W3Cは、ウェブ上の図書データの世界的な相互互換性を増大させる為にLibrary Linked Data Incubator Groupの活動を開始しました。
・2010-05-14 米国政府のポータルであるData.govは、リンクトデータとして約400のデータセットを利用可能にしました。そのデータセットの総トリプル数は、64億トリプルになります。
・2010-04-27 米国の北カロライナ州のラレー市にて行われるワールド・ワイド・ウェブ・コンファレンスで3rd Linked Data on the Web workshopとW3C LOD Campとを開催します。
・2010-04-19 ドイツ国立図書館(DNB)は、ウェブ上のリンクトデータとして、関係者データ(PNDデータセットには180万人の記述があります)と件名標目(Subject Heading)(SWD; 16万4千件)とを公開しました。詳細はここを参照, そのビジョンとリンクトデータの経緯に付いてはここを参照
・2010-04-12 ハンガリー国立図書館は、全OPACとデジタルライブラリとをリンクトデータとして公開しました。詳細に付いてはここを参照
・2010-01-21 BBCニース - ティム・バーナーズ・リーは、英国政府のデータプロジェクトが進行中である事を明らかにしました。このプロジェクトのウェブサイトはdata.gov.ukです。
・2010-01-12 このページの日本語翻訳版が出来ました。このページの翻訳版の作成と日本でのリンクトデータの普及とに関し清水昇氏と高島周二氏とに感謝します。また、(繁体字の)中国語の翻訳版が2月10日に出来ました。より多くの翻訳を歓迎致します。
・2009-12-09 今やsameAs.orgは1000万個を超えるURIを保有しています。
・2009-11-19 ホワイトハウスは、ウェブ上でRDFの構造化データを公開する計画を発表しました。
・2009-10-30 ニューヨークタイムズ紙は、CC BYライセンスの下にリンクドデータであるサブジェクトヘッディングの公開を開始しました。詳細に付いては、data.nytimes.comを参照して下さい。
・2009-10-15 Data-gov Wikiは、オバマ政権によって策定されたeGovermentデータのリンクドデータ版を公開しました。全体のデータは巨大で、50億トリプル程度のリンクドデータのクラウドになっている。詳細に付いては、ここを参照して下さい。
・2009-09-15 ウェブサイトLinkedGeoDataは、OpenStreetMapのリンクドデータ版の公開を開始しました。そのデータ量は約2億トリプルである。詳細に付いては、ここを参照して下さい。
・2009-06-18 ティム・バーナーズ・リーは、米国及び英国の政府主導による「LODクラウドに政府情報を加えること」に関し、BBCのインタビューを受けました。
・2009-06-17 CNET社はWeb上にリンクトデータとして製品情報の一部を掲載すること、及びCNETのWeb資産全体のトピックページを作成する為に、テキストコンテンツとデータとを相互リンクする事に関してオープン・カレーとパートナーになる事とを発表しました。
・2009-06-03 http://sameas.org/は、URIの相互参照を見つけるサービスを開始しました。
・2009-06-02 ESWC 2009でエンドユーザ向けリンクトデータ・アプリを配備しました。
・2009-04-30 ティム・バーナーズ・リーは、国民対話の際にはリンクト・オープンデータを活用することを提案しました。
・2009-04-20〜2009-04-22 WWW09に於いて、リンクドデータの研究計画に関するミーティング及びツールとアプリケーションとに関するセッションが開催されました。
・2009-03-03 Silk - Link Discovery Framework for the Web of Dataがリリーズされました。そのSilkフレームワークは、異なるリンクトデータ情報源の中に存在するデータアイテム間の関係を見つけ出す為のツールです。データの提供者は、ウェブ上で、彼らのデータソースから他のデータソースにRDFリンクを設定するのにSilkを利用できます。
・2009-02-06 ティム・バーナーズ・リーはTED2009会議でLODデータクラウドを用いたリンクドデータに付いて講演し、事例として、リンキングオープン薬剤データ(Linking Open Drug Data)クラウドを取り上げました。講演のビデオと彼のスライドとを参照して下さい。
・2009-01-29 相互リンクされたデーターセットの語彙集:voiD 1.0のリリーズが発表されました。
・2009-01-28 Calais;トムソン・ロイター ウェブ サービスは、コンテンツ用のセマンティックメタデータを自動的に生成するが、今や、総ての識別可能なエンティティの為のリンクドデータをサポートすると共に、DBpedia、Geonames及びその他のデータ資産に対するリンク付けによりクラウドと一体となる。例えば、URI: IBMです。
Calaisは、発行者が、彼らのコンテンツの価値を高める事や読者の経験を利用する事や出現しつつあるリンクド・コンテント・エコノミーに結び付ける事を容易にします。
・ LODの記事書庫は2007年及び2008年からの総てのニュースを有しています。
Project Description:プロジェクトの説明
オープンデータ活動は、すべての人が自由に利用できるデータを作る事を目指しています。既に多くの興味深いオープンデータがウェブ上に存在しています。例にとれば、クリエイティブ・コモンズまたはTalisライセンスに基づいて公開されているWikipedia、Wikibooks、Geonames、MusicBrainz、WordNet、DBLP bibliographyやその他の多くのものがあります。
W3C SWEO Linking Open Data communityプロジェクトの目標は、ウェブ上にRDFの色々なデータセットを公開する事と異なるデータソースのデータアイテム間にRDFリンクを設定する事とにより、データを共有し、ウェブを拡張することです。
RDFリンクは、セマンティックWebブラウザを用いる事により、或るデータソースの中に存在するデータアイテムから他のソースの中に存在している関連データアイテムに導く事を可能にします。
更に、RDFリンクは、クロールされるデータに対して、洗練された検索と問合せ機能を提供するセマンティックWeb検索エンジンのクローラよる追跡を可能にします。
その問合せの結果は、HTMLページ群に対する単なるリンクでは無く、構造化されたデータとなり、他のアプリケーションの中で使う事が可能となります。
下の図は、之までに、このプロジェクトにより公開され又相互リンクされたデータセットを示しています。合計すると、380億強のRDFトリプルのデータセットから成り(データセット統計)、それらは、3億89百万個のRDFリンクにより相互リンクされています(リンクセット統計)。(2010年8月時点)。
この図のクリック可能版. この図のSVG版. この図のPDF版. この図のトピック毎に色付けした版 (SVG, PDF).
総ての公開されているデータセットの最新の更新版であるData Setsページもご参照下さい。
次の図は、上の図のデータセットの一つであるUMBELプロジェクトから提供されたものであり、データ辞書(共通語彙、スキーマ、オントロジ)のクラス間の相互リンクを示しています。
ノードクリック可能版なのでこのイメージをクリックして見て下さい。
(注)この翻訳版のページではクリック可能にしていません。
Project Pages:プロジェクトの頁
本プロジェクトは、色々なwikiページ上に存在していて、且つ、関連している情報を収集しています。どうぞご自由に追加を行って下さい、そうすれば、何が既にあるのかや、今何が起こっているのかを知る事が出来ます。
・ Data Sets : データセット
・ RDFizers and ConverterToRdf : RDF化とRDFへの変換ツール
・ Publishing Tools : 公開ツール
・ Semantic Web Browsers and Client Libraries : セマンティックWebブラウザとクラ イアント ライブラリ
・ Semantic Web Search Engines : セマンティックWeb検索エンジン
・ Applications : アプリケーション
・ Discovery and Usage (voiD) : 発見と利用(voiD)
・ Equivalence Mining and Matching Frameworks : 等価性検知と照合のフレームワーク
・ Common Vocabularies / Ontologies / Micromodels : 共通語彙集/オントロジ/マイクロモデル
・ THALIA testbed : THALIAテストベッド
・ OLTP Benchmarks for Triplestores : トリプル格納機能のOLTPベンチマーク(性能比較基準)
・ Broken Links in LOD : LODに於ける壊れたリンク
・ Linking Open Drug Data : 薬剤情報のLOD
・ [DataSets] :リンクトデータのデータセットの一覧ページ
・ [RDF Dumps] :リンクトデータのRDF、OWL若しくはトリプルのデータへのリンク一覧
・ [SPARQL endpoints] :リンクトデータのSPARQLエンドポイントの一覧ページ
・ [Link Statistics] :リンクトデータの統計データページ
Meetings & Gatherings:会議と集会
LODコミュニティ集会
・ Semtech 2010 (サンフランシスコ) (対面会議)
・ ギリシャのヘラクリオン(ESWC 2010)集会 (対面会議)
・ 米国北カロライナ州ラレー市(WWW2010)集会 (対面会議)
・ 第二回リンクトデータ ロンドン会議(対面会議、2010年2月)
・ 米国ヴァージニア(ISWC09)集会(ISWC09)(対面会議)
・ 第一回リンクトデータ ロンドン会議(対面会議、2009年11月)
・ ギリシャ・クレタ島のヘラクリオン(ESWC09)集会(対面会議)
・ WWW2009のリンクデータに関する研究集会に於けるBOF(対面会議)
・ スペインのマドリッド(WWW2009)集会(対面会議)
・ ドイツのカールスルーエ(ISWC08)集会(対面会議)
・ スペイン領テネリフェ島(ESWC08)集会(対面会議)
・ WWW2008に於けるセマンティックWeb検索エンジンのBOF(対面会議)
・ 北京(WWW2008)集会(対面会議/誕生祝い)
・ 釜山(ISWC07)集会(対面会議)
・ ロンドン(2007年8月)集会(対面会議)
・ オーストリアのインスブルック(ESWC07)集会(対面会議)
・ カナダのバンフ(WWW2007)集会(対面会議)
リンクトデータコンファレンス、ワークショップ及びチュートリアル
・ ISWC2010に於ける劇的に進化するリンクトデータに関する第一回ワークショップ(COLD 2010) (2010年9月, 中国上海市)
・ WWW2010でのウェブワークショップに於けるリンクトデータ(LDOW2010) (2010年4月、米国北カロライナ州ラレー市)
・ ウェブ及びデータベースに関する第13回国際ワークショップ(WebDB2010)2010年6月、米国、インディアナポリス
・ AAAI2009に於けるLinked AI: リンクドデータと人口知能との関係 (2010年3月米国スタンフォード)
・ WWW009に於けるウェブワークショップでのリンクドデータ(LDOW2009)(2009年4月スペインのマドリッド)
・ ISWC2008に於けるウェブ上でリンクドデータを公開する方法のチュートリアル (2008年10月ドイツのカールスルーエ)
・ ニューヨーク市(2008年6月開催)リンクトデータプラネット(会議方式:コンファレンス及び博覧会)(非公式に設定した会合)
・ WWW2008に於けるWebワークショップ(LDOW2008)でのリンクトデータ
See Also:関連情報
チュートリアルと記事の概略
・ クリスチャン・バイザー、トム・ヒース、ティム・バーナーズ・リー著「リンクトデータ−これまでの物語」IJSWIS、第5巻、第3号、1-22頁、2009年発行
・ クリスチャン・バイザー他著「Web上にリンクトデータを発信する方法」
・ ティム・バーナーズ・リー著「オンラインでの政府データの公開」Webアーキテクチャデザインノート2009
・ ジョアブ・ジャクソン著「ウェブの次の動向:ワールドワイド データベース」リンクドデータに付いてのガバメントコンピュータニュースの記事
・ クリスチャン・バイザー著「リンクトデータのWebの出現」IEEE知的システム、24巻、第5号、87-92ページ、2009年発行
・ リチャード・サィガニアック著「cURLを使ってセマンティックWebサイトのデバッグを行う−セマンティックWebサイトを検証する1つの方法」
・ セーエルマン他著「セマンティックWebのためのすばらしいURI」 −URIの非参照とコンテントネゴシエーション
・ オープンリンク・ソフトウェア:「Virtuoso Universalサーバを使ったリンクトデータの展開」
・ オープンリンク・ソフトウェア:「Virtuoso Spongerによる非RDFデータソースからのリンクトデータの生成」
・ ミシェル・ハウゼンブラス著「slideshareを用いたリンクトデータのチュートリアル」
・ トム・ヒース、ミシェル・ハウゼンブラス、クリス・バイザー、リチャード・サイガニアック、オラーフ・ハーティグ著「Web上でリンクトデータを公開する方法」ISWC08ビデオ
・ セーレン・アウアー著「リンクトデータのチュートリアル:ドキュメントのWebからリンクトデータのWebへ」
Presentations:講演
・ ティム・バーナーズ・リー:「オープン且つリンクドデータの次のウェブ」TED2009でティムが講演したビデオ、また、スライドも有り。
・ クリス・バイザー、トム・ヒース、ティム・バーナーズ・リー:「リンクトデータ:原理と最新の状況」WWW2008のW3Cトラックでの講演。
・ ティム・バーナーズ・リー発表「ブラウズ可能なデータ」
・ キングスレー・アイデヘン及びOpenLink Software社による色々なプレゼンテーション
Historical Perspective:歴史的展望
・ ティム・バーナーズ・リー「リンクトデータ」(リンクトデータの基本的アイデアの概要に関するアーキテクチャノート)
・ クリスチャン・バイザー他「Web上で相互リンクされているオープンデータ」(リンキングオープンデータ計画の概要が書かれた2ページの文書)
・ アリスティア・マイルズ他「RDF語彙集を発行する為の最善の実践指針」(リンクトデータ原理に則ったRDF語彙集提供のW3C原案)
・ デイング、フィニン「Web上に於けるセマンティックWebの特徴」(時代遅れだが今なお興味深いWeb上のRDFデータに関する文書)
・ ミシェル・K・バーグマン「より構造的に、より用語論的に、(望むべくは)より明確に」(Webの一般的な発達の中でのリンクトデータの意味)
・ ネットワーク化されたデータ(本題に関する古いページ)
・ RdfLite(ブランクノード無、等)
・ 「データのWebへ行こう」リンクトデータ及びLODプロジェクトについての「情報標準誌の四半期号の記事の草稿。
・ マイク・バーグマン「リンクトデータの時代−リンクトデータ惑星とLDOWの2008年の動向」
・ ウチェ・オグブジ「実際のWeb2.0:リンキングオープンデータ−Web上の情報の改革する方法の一つとしてWeb2.0を見ているコミュニティに注目しよう」IBMデベロッパーズネットワーク 2008年2月発行
・ トム・ヒース「もう、おもちゃのサンプルはいらない−リンキングオープンデータプロジェクトの一年」タリス・プラットホーム・ニュース、2008年2月号
Demos:実例
・ キングスレー・アイデヘン及びOpenLink Software社から提供された色々なデモ。
Mailing List:メーリングリスト
このプロジェクトに関して、色々な興味深いメールのやり取りがありますので、メーリングリストを作成することにしました。
このリストはW3Cによって運用されています、そして、あなたもhttp://lists.w3.org/Archives/Public/public-lod/で参加できます。
このプロジェクトのメーリングリストは2008年春迄、MITのSIMILEプロジェクトによって運用されていました。また、MITは、このリストの履歴もその時まで保管していました。
FAQ:よくある質問と回答
1. 本提案プロジェクトの概要を説明して下さい。
この公開データ活動の目的は、誰もが自由に利用可能なデータを作り上げることです。既にWeb上には利用可能な色々な興味深い公開データ源が存在しています。その例には、クリエイティブ・コモンズ若しくはタリス・ライセンスに基づいて公開されているWikiペディア(Wikipedia), Wikiブックス(Wikibooks), ジオネームズ(Geonames), 音楽ブレインズ(MusicBrainz), 単語ネット(WordNet), DBLP文献目録(the DBLP bibliography)など多くのものがあります。
リンキングオープンデータプロジェクト(the Linking Open Data project)の目標は、RDFデータとしてウェブ上で利用可能な色々なオープンデータソースを作る事と、異なるデータソースのデータアイテム間にRDFリンクを設定する事とにより、一体化された共有データを構築する事です。
RDFリンクは、セマンティック・ブラウザを使用することによって、あるデータソースの中のあるデータアイテムから別のデータソースの中に存在している関連したデータアイテムにナビゲートする事を可能にします。またRDFリンクは、セマンティックWebサーチエンジンのクローラにより関係を辿ることを可能にします。そのセマンティックWebサーチエンジンは、クロールされたデータに対して、洗練された検索や問合せ機能を提供するかも知れません。問合せ結果は、単なるHTMLページに対するリンク等では無く、構造化データなので、他のアプリケーションの中で活用することが出来ます。
既に幾つかのデータ発信活動が存在する。例えば、DBペディア(DBpedia.org project)、ジオネームオントロジ(the Geonames Ontology)、 DBLP文献目録を発信しているD2Rサーバ(the D2R Server publishing the DBLP bibliography) 及びdbtuneの音楽サーバ (the dbtune music server)などです。更に、これ等のデータソース間を相互リンクする為の活動が始まりつつある。例えば、都市に関するDBペディアのRDF記述は、該当する都市のジオネームのデータに対するowl:sameAsを含んでいる(1)。この他の例には、書籍の著者をDBLP文献目録の中の論文の著者にリンク付けしているRDF Book Mashupがあります(2)。
2. 何故この特別なプロジェクトを選択したのですか?
実世界のデータをよりオンライン化するのに必須であるセマンティックWebの価値を実証する為です。
3. 何故、このプロジェクトが広い範囲に衝撃を与えると考えているのでしょうか?
大規模に相互リンクされたデータセットは、セマンティックWebブラウザ、他の利用者インターフェース、セマンティックWebクローラ、RDFリボジットリ及び推論エンジンなどのセマンティックWebの色々な開発分野に有益でしょう。
バラエティに富んだ有益なデータのオンライン化は、それにリンクすることを人々に促し、大局的に見るとセマンティックWebの立ち上がりを助ける事になります。
4.このプロジェクトは他の広く普及したシステムと簡単に統合できますか?もし出来るならば、どのシステムとどんな風に?
このデータは、タビュレータ(Tabulator)またはデスコ(Disco)またはオープンリンクRDFブラウザ(OpenLink RDF Browser)またはオープンリンクデータエクスプローラ(OpenLink Data Explorer)の様なセマンティックWebブラウザにより簡便にブラウズ可能です。既存のセマンティックWebクローラであるSWSEやSwoogleは、データの統合ビユーや洗練された検索インターフェースを提供可能です。
5.このプロジェクトが何故今進められなければならないのですか即ち、何故、皆が他のプロジェクトより優先的に進めるべきなのですか?
多くのセマンティックWebプロジェクトがやっているおもちゃの例題を使った様な遊びにはうんざりしているからです。
6.貴方はこのプロジェクトに何の貢献ができますか?
我々は、DBペディアの仕事をしながら2週間の内にWikiペディアの中の総てである1.6百万個の概念にRDFを提供する仕事をスタートさせます。Wikiペディアは色々な領域の情報を含んでいるので、我々は、DBペディアのURI群は色々なデータ源を相互に連結する為の価値のある結合ハブとして機能すると考えています。
我々が、過去にジオネームにリンクをしたのと同様に、DBペディアから関連データへのリンク付けが出来ました。
7.他の人からのどんな貢献を望みますか?
・RDFに写しかえる事の可能な追加のオープンデータソースの提案。
・データソースをRDFに変換し、そしてリンクトデータ又はWeb上でSPAQLエンドポイントとして提供すること。
・異なるデータソースのデータ項目間のリンクを自動で生成する為に、新たな自己学習的手段を開発すること。
8.このプロジェクトを大きく下支えする為には、セマンティックWebコミュニティはどの様な標準化が必要ですか?
既にSWBP作業グループの中で標準化作業が進行中です:「RDF語彙を発行するための最善の実践レシピ(Best Practice Recipes for Publishing RDF Vocabularies.)」があります。これはティムの「リンクトデータ(linked data)」のアイデアを伝えるのにも有用です。
9.今はセマンティックWeb技術に関与していない人々を、どうやってこのプロジェクトに参加を奨励するのですか(情報を提供することによってですか。プログラムを作る約束をすることによってですか)?
利用価値のあるオンライン情報を持つことはネットワークの効果を初期化するかもしれない。このプロジェクトは、セマンティックWebコミュニティの中で、共有データモデルとしてのRDFの利益に付いての認識を高める。よりリッチな相互にリンクされたオンラインデータを持つ事は、興味あるマシュアップや他のRDFを意識したアプリケーションを創る事を喚起する可能性があります。
10,本プロジェクトの目標を達成する為に、他の技術ではなく、セマンティックWeb技術を用いる主要な利点は何ですか?
RDFは異なるソースの情報を統合する為に柔軟なデータモデルを提供します。特に、リンク付け機能は、他の如何なるデータモデルでも提供し得ないものです。
Commitments:コミットメント(参加)
このプロジェクトが気に入ったならば、下にあなたの名前を追加して下さい。そして、このプロジェクトにどの様な貢献ができるのかもお示し下さい。
参加の形態は次の何れかです:
・ このプロジェクトは良いアイデアです。また、これが実現すると有益と考えます。
・ RDFとして発信されるべきデータソースを提案したい。
・ 或るデータソースをRDFに変換したい。
・ 私のサーバからデータを提供したい。(もしも、データを提供してくれる場合)
・ 異なるソースのデータ項目間のリンクを自己学習的に自動生成する機能の開発に従事したい。
・ このプロジェクトに貢献したいと思っている人達に連絡が出来ます。
・クリス・バイザー(Chris Bizer)とリチャード・サイガニアック(Richard Cyganiak)とは、W3CのSWEOにこのプロジェクトを提案した。私達は、DBペディア、DBLPベルリン、CIAファクトブック、ブックマッシュアップ及びユロスタットを含む幾つかのリンクトデータソースを保守することと、このプロジェクトの普及と調整とを行います。
・ゼーレン・アウアー(Sören Auer):私は、データの変換とデータソースの提供と人々との連絡とに関して貢献するつもりです。
・ベルナルド・バタント(Bernard Vatant):既にジオネームオントロジに参加しており、ジオネームのデータ及び概念をINSEEデータ等の他のソースにリンク付けする作業に参加している。更に、GEMETの概念やWikiペディアのカテゴリ等へのリンク付けプロジェクトに参加して見たい。
・ジョシュ・タウベラー(Josh Tauberer):近々700百万トリプルの米国国勢調査のデータが出来上がります。(丁度それをMYSQLに搭載する空きディスク容量があります)これをジオナームに結びつけることは、新たなプロジェクトを捜し求めている人に取っては、興味深く/有益なプロジェクトとなるでしょう。
・トム・ヒース(Tom Heath):素晴らしいアイデアだ。 (知る限りでは、)実用化されている唯一のRDFベースのレビューし、レイティングするサイトであるRevyu.comに参加する事で貢献できます。このサイトはFOAF、Review Vocab及びリチャードニューマンのTag Ontologyを用いてデータを公開し、そして、その全ては、非参照型のURIs有している。このデータセットは地味ではあるが成長している。私は、Revyu及びその他のURIsの間の自動的にsameAsリンクを生成する為の自己学習機能を開発することや、レビューやタグから物の位置を推論する方法やジオネームに貼り付ける方法に興味があります。
・キングスレー・アイデヘン(Kingsley Idehen)とオリ・アーリング(Orri Erling)とフレデリック・ガイアソン(Frederick Giasson):PingTheSemanticWeb、 SearchTheSemanticWeb及び OpenLink Data Spaces等のプロジェクトを通じて、リンクトデータの原則に則った付加的且つ補助的なRDFデータソースに加えて、スケーラビリティの検証、研究活動等の為のRDFデータソースとして使用可能なVirtuosoを開発する予定です。
・マーク・ウィック(Marc Wick):ジオネームのRDFのWebサービスの実装をしています。
・フェリック・バン・デ・メール(Felix Van de Maele):非常に興味深いプロジェクトだ。私はオントロジ用のクローラを開発した、そして今は、コミュニティドリブンのオントロジマッチヤーとメディエータとに関する仕事を行っている。それらは、RDFデータソース間の相互リンクを行うのに便利であると思います。
・ステファーノ・マゾッキ(Stefano Mazzocchi):MIT大学のSimileプロジェクトの一員として、幾年もの間大きなデータのRDF化(申し訳ないことに、これらの情報の多くは公開出来ない情報です)を行なってきました。我々は、我々のRDFブラウズイングツールの総てからRDFデータにエキスポートする方法を提供します。しかし、我々は、それらのデータに対するURI非参照を提供する事を意図していません。そして、それを行う事が重要であることには同感です。我々が提供する非常に面白いデータセットは、約百万冊をカバーしているMIT大学図書館のカタログの5,000万トリプルのものです。私は、現在、owl:sameAs ベースのRDF smoosher(既に、コマンドラインでは動いている)の開発を行っています。そして、次には、等価概念のマイニングを開発する事を計画しています。更に、注目に値すべき事は、SIMILEプロジェクトが、既存のデータから大量のRDFを生成するのに用いる事が可能な、如何に色々なRDF化のプログラムを保有しているかです。
・ダニー・エイヤーズ(DannyAyers):ConverterFromRdfの可能性を調べる事、semwebシステムのアウトプットをレガシーデータ利の用者にリンク付けする事、更には、データセットを記述する為の低コストのリンク/自己学習機能に驚く事。
・エド・サマーズ(Ed Summers):私は米国国会図書館のソフトウェア開発者で、セマンティックWebで利用できる書誌学と関係官庁とのデータセットを創ることに興味があります。
・イブス・レイモンド(Yves Raimond):ロンドン大学のクィーンメリー校のデジタル音楽センターの博士課程の学生で、音楽に関連したオープンデータ(ミュージックブレインズ(Musicbrainz)、マグナトーン(Magnatune)、ジェーモンド(Jamendo)、ドッグマジック(Dogmazic)、ムートピア(Mutopia)、その他の間の)のリンク付けに関心があります。更に、私は、その様なアプローチを推進する為に、EASAIER(付加価値と検索とにより音楽アーカイブにアクセスを可能にする)とOMRAS2(Online Music Recognition and Searching:オンラインでの音楽認識と検索)の二つのプロジェクトに参加しています。
・ファンゲリス・ファシリアヂス(Vangelis Vassiliadis):私は異なるソースのデータ項目間のリンクを自動生成するのに必要な自己学習機能の開発を行いたい、また、OWLの意味を用いて、異なるデータセットにドメイン知識を付加する事に従事したいです。
・デミトリ・ウラノフ(Dmitry Ulanov):私はTHALIA testbedの開発者です。これは、関係DBをRDFに移し変えるツールのベンチマーク試験をする為に用いる事が可能です。
・ジョージ・コビラロフ(Georgi Kobilarov):私はDBペディアの抽出フレームワークを保守しています。私はデータを発信する人々が、彼らのデータベースの相互リンクを行う事を手助けするツールの開発とエンドユーザのUIを構築する事とに関心があります。
・ヒュージュン・チェン(Huajun Chen):セマンティックWebテクノロジを使った関係DB統合ツールキットであるDartGridの開発者です。DartGridは、ビジュアライズされた意味マッピイングツールと、見ることを基本とした(又はより一般的な規則に基づく)SPARQL-SQLクエリ再書き込みコンポーネントとの二つの主要なコンポーネントから構成されています。詳細はISWC2006文書で紹介しております。
・クリスウィルパー(Chris Wilper) :私はFedoraの開発者であり、また、コーネル大学の国立科学デジタル図書館(National Science Digital Library)クループで働いています。トリプルの格納機能のOLTPベンチマークの共同開発に興味があります。
・ジョバンニ・タマレロ(Giovanni Tummarello):私はSindiceをイアール・オレン(Eyal Oren)と共に開発しました。Sindiceはリンクトデータ検索エンジンで、指示されたURIに関する情報を含んだ「SeeAlso」URLsの順位付けされたリストを返します。これは、(我々自身に対して若しくはPTSW(Ping the Semantic Web)に対して、人間が直接Pingを行う事により、又は、swseのボットのアレイにより)Web上の任意の場所を調べる事で、"SeeAlso"ステートメント必須の必要性の問題をある程度解決します。"SeeAlso"ステートメントは、格付けの為に有用と考えています。このサービスは、簡単なAPIを有しています。例として、Sindiceが把握しているティム・バーナーズ・リーに付いての話題の全リンクをここに示します。
・シャーマン・D・モンロー(Sherman D. Monroe):私はCypher,の著者です。Cypherは、自然言語の文節若しくは文章の記述からRDF及びSeRQL(SPARQLポートで動作する)を生成するコード変換器です。 当プロジェクトのページは此処にあります。Cypherプロジェクトの目的は、WordNet、FrameNet、PropBank及び注釈付けされたコーパス等のNLPで使われている色々なソースを収集し、統一する事とスピーチの一部にタグ付けする為の標準オントロジを提供する事とが目的です。我々は、NLPアプリケーションがこの種のデータをより有効に活用する為の単一リソースを提供する事を望んでいます。また、私は、overdogg(未だα版ですが)と言うセマンティックWebサービスの開発も行っています。Overdoggは、サービスの為のリバースオークションに基づいた新しいタイプのマーケットプレースです。この他、利用者のFOAFデータベースを構成するサービスが近々発表になります。
・アダム・ソビエスキー(Adam Sobieski):イベントオントロジとWikiオントロジとに関心があります。私は、利用者が述語を選択したり作成したりし、また、文章から述語スロットの中へ名詞(名詞句)をドラッグ・アンド・ドロップしたりする事を可能にするウェブサイトを創っています。そのインターフェースは、訪問者が読む事で、代名詞の分解と意味の把握を行う様になっています。当該文章は、記事から文脈情報を取得する為の順番で表示されます。ダウンロード可能なリソースは、一つのコーパス(Penn treebank及びRedwoodsとして有用だと思います)と実世界の百科事典の記事に関係付けられた名詞の協調オントロジ(collaborative ontology)との二つです。
・ファビアン・M・スチャネック(Fabian M. Suchanek)とジェルジィ・カスネシー(Gjergji Kasneci):私達はYAGOを提供します。大きなオントロジです。YAGOは問合せに利用でき、異なった様式(RDFS、XML、データベース、テキスト)でもダウンロードが可能です。
・トロイ・セルフ(Troy Self):私はSemWebCentralを保守しています。SemWebCentralは、オープンソースのセマンティックWebツールの為の開発用サイトです。私は、RDF browser、ObjectViewer、ontology summarizer、Ocelotを保守しています。また、セマンティックWeb開発環境であるSWeDEの主要な開発者の1人です。
・ベルンハルト・ハスルホファー(Bernhard Haslhofer):私はデジタル図書館と公文書ドメインの中でセマンティックWebの研究に従事しています。数百のデータソースにリンクを簡単に付ける方法は、Open Archives Protocol for Metadata Harvesting (OAI-PMH)の為のラッパーを構築する事だと思い、この方向性に沿った仕事をする事を試みでいます。
・デイビッド・ピーターソン(David Peterson):私は大量のオーストラリアの科学情報群をRDFに変換してSPARQLを介してアクセス出来る様にする仕事に従事しています。私達は13以上の広範囲の色々な科学組織と共同で作業しており、私は、これは価値のある貢献になると信じています。
ジョージ・ヂーデリッチ(Joerg Diederich):私はデジタル図書館でセマンティックWebの研究をしています。また、FacetedDBLP.の保守もしています。私は、近々FUBerlin発のD2R技術の手法により、私のローカルなDBLPデータ(毎週更新)で貢献しようと計画しています。
・ダニー・ガグネ(Danny Gagne):これはすばらしいアイデアだと思います。私は、小さなデータセットを創る為の幾つかのツールを開発中です。「誰が何か他の事を知っている」
・ミッシェル・ハウゼンブラス(MichaelHausenblas):私は、クリス・バイザーがこの壮大なアイデアを私に話してくれた後、2007年6月にLODコミュニティ・プロジェクトに参加しました。そうこうする内に、色々な事が発生して、トレースをすることを忘れてしまいました。最初の頃、私は、リンク付けされたデータセットを創ることに関心がありました、Eurostatの統計データのRDF化版で相互リンクされたrieseを実際に創りました。副産物として、私達はUCI(User-Contributed Inerlinking)と呼ばれる手作業で相互リンクする為のパラダイムを開発しました。その時、私の関心は移って、リンクトデータのトップのアプリケーションを作りたかった、これはvoiD(リンク付けされたデータセットの語彙集)を製作する切っ掛けとなりました。現在、私は心の中ではマルチメディアの人なので、リンクトデータの原則をマルチメディアのコンテンツに応用することを始めました。最後に、私はISWC08の中でトム、クリス、リチャード、オラフとでLOD tutorialを行いました。(私のリンクトデータ早分りを見てください)私はいくつかのLOD集会に参加(及び開催)しましたし、今後もその様にするつもりです。
・ジョナサン・グレー(Jonathan Gray):私はOpen Knowledge Foundationから来ました。オープンデータのライセンシングとオープンデータセットの位置決めや一覧表作りとに関心があります。
・バーナード・シャンドル(Bernhard Schandl):私は利用者のディスクトップ及びファイル・システムの中にマンティック・データを統合する作業に従事しています。この種のデータをWeb上で公開する事の可能性に関心があります。
・デービッド・ヒューン(David Huynh):私は収集されたデータをブラウジングや表示する為のUIsを構築する事に関心があります。私はSPARQLのインターフェースが一般大衆に気に入られるとは思わないし、グーグル流の純粋な検索テキストボックスがデータのグラフの性質に適しているとも思わない。
・ダニエル・ロイス(Daniel Lewis):私はOpenLink Softwareのテクノロジエバンジェリストでして、よりセマンティックなソーシャルWebを作り上げる事やより利用者にフレンドリなセマンティックWebを作り上げる事やより知的なWebを作り上げる事に関心があります。先進的なWebアプリケーションの為には、各領域の間でデータの公開とリンク付けを行う事が必要で、セマンティックWebのテクノロジはそれができます。私のブログはここで利用可能になっており、色々な課題(セマンティックWebに限定されない)について議論したいと思います。
・アンドリアス・ランゲガー(Andreas Langegger):私は現在セマンティックウェブ・テクノロジを基盤とした仮想データ統合のミドルウェアを開発しています。このミドルウェアは構造化された科学データを共有するためのオーストラリアン・グリッドの中で使用される予定です。セマンティックWebコミュニティと関係があるので、このミドルウェアは2008年の中頃にSemWIQ(セマンティックウェブの統合と問合せエンジン)として発表される予定です。この他に、据付と構成は出来るだけ簡単にするように心がけています。現在、性能向上を行っています(現在、最適化が最優先課題です)。
・セルゲイ・クリニシェフ(Sergey Chernyshev):私は、Semantic MediaWiki(SMW) 技術をベースとしているTechPresentations.orgプロジェクトを推進しています。また、SMW関連の開発コミュニティに参加しています。私の目標は、TechPresentationsのデータをLODデータセットに結びつける事と、他のLODデータセットと相互結合されたデータのクラウドソース化を実現するのにSMW関連の技術を活用する事です。
・ロブ・ケークブレッド(Rob Cakebread):私はDoapspace.orgを運用しています。そして、私の主な関心は、DOAPとDOAPをFOAF、BEATLe、SIOCにリンク付けする事とにあります。私はGentoo Linuxの開発者で、私は、利用者の為のツールの開発とDOAPや関連オントロジによって提供されるメタデータのメリットを活用したパッケージ保守者の為のツールの開発とに従事しています。
・フランソワ・シャーフ(Francois Scharffe):私は、オントロジ調整(ontology alignment)の分野の研究を行っているSTI Innsbruckの研究者です。私は、EASAIERプロジェクトに参加しています。「EASAIER」プロジェクトでは、音楽オントロジを使った音楽関連のデータセットを発信します。私は、SPARQL++(あるオントロジから別のオントロジへRDFデータを転送する事を可能にするSPARQLの拡張版)の開発に従事した事があります。私は、データの融合技術に関心があります。更に、私は、古典音楽データセットを発信する為のアンカーと成り得る古典音楽の標準知識基盤を作ることに関心があります。
・オクテー・ハッサンザデ(Oktie Hassanzadeh):私はトロント大学のコンピュータ科学部の研究助手の大学院生で、Database Groupの一員です。Mariano Consensと一緒にLinked Movie DataBase (LinkedMDB)を開発しました、これは映画用の最初のオープン・リンクトデータを発信することを目指したものでした。LinkedMDBは、異なるデータセット間のリンクを見出す為に最新の類似結合手法(similarity join techniques)を用いた(開発中のツールである)"ODDLinker"の機能を他の人に見てもらうつもりのものでした。
・ダニエル・シュワブ(Daniel Schwabe):私は、リオ・デ・ジャネイロのカトリック大学の情報学部の教授で、TecWeb Laboratoryの所長をしています。私は、マン−マシン・チームの一部分と見られている(セマンティック)ウェブアプリケーション用のデザイン方法の研究に従事しています。私達は、セマンティックWikiオーサリング環境を開発しました。また、Portinari ProjectのデータをLoDクラウドにリンクする事を試みています。私達は、RDFデータセットの探査を利用者に可能とする直接操作インターフェース(クエリ言語の知識が無くても問合せが出来る機能を含む)の研究に従事しています。
・アンドラッツ・トリ(Andraz Tori):私は、Zemanta社の最高技術責任者(CTO)です。私はリンキング・オープン・データのエンティティの曖昧さを除去するゼマンタエンジンのアーキテクチャの開発に従事しています。LODのどの構成要素が、ゼマンダに包含される候補となるのか見たいし、LODのマッシュアップを可能にする最も有用なものを返す為には、どの様なAPIが必要かをフィードバックとして取得したい。
・テッド・タイボヂュJr(Ted Thibodeau Jr):私は2000年12月からOpenLink Softwareで働いています。データアクセス及び以下のもの(リンキングオープンデータプロジェクトに参加し、Virtuoso Universal Serverの多くに関与し、RDFとしてより構造化されたデータ及び非構造化データ(RDBコンテンツからプレーンテキストまで)の開示、リンクとデータの機能とアプリケーションとの為の望ましい機能の一覧の検討、人とプロジェクトとの関係付け、等)の仕事を行っている。私の夢の一部は、Knowledge Navigatorの構想,完璧に展開されたスクリーン、音声指示、知的エージェント、等を実現する事です。OpenLinkに入社する前には、色々な会社で色々な職務をこなして来ました。それらは、LODプロジェクトから恩恵を受けていまして、これらの経験が今日の私の努力を導いています。
・アンドレアス・ハース(Andreas Harth):私はDERIゴールウェイの研究者で、スキーマを使用した仮説を行なう事無しにウェブ・データの統合を行う研究に従事しています。私は、現在(少なくとも週毎に)LODの一部をクロールしており、VisiNavの中のLODデータに対する検索や閲覧やナビゲーション機能を提供しています。このサイトは、LODクラウド(LOD cloud)の中に発信されたデータにチョットした問題がある場合、LODデータを調べる事(出所を追跡する機能を含む)を可能にするので、LODクラウド(LOD crowd)の為には有用です。
・ハイドラシ(Hydrasi)会社:私はJohnMettaです。私は科学者で、20年以上のオープンソース・ソフトウェアの開発を行っており、Hydrasiの創設者です。Hydrasiは水及び気候科学に特化した会社で、水及び気候のデータに関するオープンデータ・ネットワークである気候クラウド・イニシアティブ(the Climate Cloud Initiative)と言う非営利団体を作る計画をしています。この様に、多くの分野から成る多様で活動的なオープンデータのクラウドを見出せて幸せです。
・トビィ・イクスター(TobyInkster):私はトビィ・インクスターです。何故、私がこんなに遅れてこの名簿に加わったのか分りません。誇張では無く、私はリンクトデータが21世紀に於ける最も大きな問題の幾つかを解く役割の一端を演じることが出来ると思っています。我々は、如何なる情報が世界を救うのに必要とされるか前もって知る事はできない。- 凧で雷を捕らえた昔の科学者は、電気及び電子機器が現代に於いて、この様に重要になるとは知る事が出来なかった。- 従って、出来るだけ多くのデータを一緒にリンク付けすることが重要なことである。
・マリアーノ・リコ(Mariano Rico):私はVPOETを開発しました。VPOETは、セマンティックデータを容易に操作する為のプレゼンテーションテンプレートを開発することを志向しています。例として、ここをクリックする事で、テンプレート下のテティムバーナーズリーのFOAFプロファイルをブラウズできます。これらのテンプレートは、HTTPメッセージを介してウェブ開発者が利用する事が可能であり、また、エンドユーザは、グーグルガゼットであるGG-VPOETを使う事によりこれらのテンプレートを利用可能です。貴方のテンプレートを作成したり、他のテンプレートを再利用したり、貴方自身のテンプレートリポジトリを作成(コードがここにあります)したりすることを歓迎します。私は、LODに夢中になっており、セマンティックテンプレートは、通常のウェブ開発者やエンドユーザに対するセマンティックデータを付与する為の障害を軽減できるものと思っております。
参加の方法
このプロジェクトに参加するために、どうぞ以下の操作を行ってください
1. メーリングリストへのサインナップ。
2. メーリングリストにちょっとした自己紹介を送ってください。(あなたのプロジェクトの紹介、及び、存在する若しくは計画中の関連するRDFデータセットを含めてください)
3. http://community.linkeddata.org/ods/index.htmlで登録して下さい。自動的にリンクトデータWebのURI(例、キングスレー・アイデヘンのURI、及び、エンティティタイプ:Person)とオープンIDとを貴方に付与します。そして、同義語("Synonyms")入力フィールドにより、貴方の他のURI群(もしも存在するならば)に対するリンクの為にそのプロファイルページをお使い下さい。
4. あなたの自身(例:キングスレー・アイデンヘン)の為のWikiword(Topic)を作成して下さい。そして、そこにあなたの個人エンティティのURIを公開して下さい。
5. あなたのWikiwordをこのページに付け加えてください。
6. 上のセクションにプロジェクト・リファレンスを付け加えてください。
7. データセット・リファレンスをRDFデータセットのページに付け加えてください。関連するRDFダンプ、SP0ARQLエンドポイント、及び、関連のサブページに対するその他の関連ポインターを付け加えて下さい。
最終更新日時 2010-09-11 08:49 このページは34,318回アクセスされています。Privacy policy About ESW Wiki Disclaimers
(和訳版最終更新日時:2010/09/15 12:25)和訳:潟Tイバーエッヂ