このドキュメントは
OWL Use Cases: Collection Management
http://lists.w3.org/Archives/Public/www-archive/2002Jan/att-0019/01-part
の和訳です。
この文書には和訳上の誤りがありえます。
内容の保証はいたしかねますので、必ずW3C Webサイトの正式版文書を参照して下さい。


OWLの利用例:コレクション管理

ステータス: 1月14-15日の直接会議のためのドキュメント

バージョン: 2002年1月7日

エディタ

Guus Schreiber, IBROW / University of Amsterdam, schreiber@swi.psy.uva.nlGuus

メンバー

ドキュメントの目的と概要

このドキュメントは、コレクション管理分野を特徴づけ、“コレクション管理”分野の5つの可能な利用例を記述したものである。 利用例は標準形式で記述されている。 特に重点を置いているのは、OWL(Ontology Web Language)で表現されるであろう知識と情報の具体的な例である。

このドキュメントは2002年1月14-15日のベル研究所(Murray Hill, NJ)でのW3C Web Ontology Working Group会議に提出されるものである。

読み易さのために、このドキュメントは利用例から生じる要求事項のサマリーから始まる。


OWLへの要求事項のサマリー

番号は以下での利用例を指す。

表現力に関する要求事項

他の要求事項


利用例分野の範囲と定義

この利用例分野は典型的に次の特徴をもつ: コレクション管理は典型的に次のサブタスクをもつ:

他のエリア/問題/タスクへのリンク

バーチャルカタログ

ここでは、「インターオペラビリティ」の領域と明確な関係がある。 バーチャルカタログは典型的にオントロジーマッピングの能力を必要とする。 また、コレクションについての仮定が少ししか立てられないときに(例えば、その大きさ)、コレクション管理タスクに差をもたらす。

サービスカタログ

これらは多くの利用例で言及されているが、サービスの記述と検索の宣言的な側面において、「Webサービス」とこの領域には明確な関係がある。

プレゼンテーション世代

意味的なアノテーションが付けられたカタログは、Webページのような(コンテキスト依存の)世代表現のための理想的な基盤である。 例:芸術カタログのブラウザのためのWebページのダイナミックコンフィギュレーションによる、関連テキストとイメージの表示。

概念検索

概念検索では、我々は Web 全体を一つのインデックス付けされたカタログだと見なしたい。 これは今のところあまりにも遠い橋であるように思われ、ドメイン依存のカタログを作るという問題が与えられる。 短期的な概念検索のための現実的なシナリオは2段階プロセスである:
  1. あなたの検索をアーカイブ/カタログを提供しうる領域に限定するメカニズムのようなオープンディレクトリを使う。
  2. あなたの問合せに対する答えを見つけるために、カタログの意味的なサーチ・エンジンを使う。

内容標準

カタログのドメイン依存性のために、それらの多くは(既存か、あるいは開発中の)ドメイン標準/語彙との明確な関係付けを必要とする。 これらのドメイン標準は手作業によるインデックス付けをサポートするために開発されたものである。 また、WordNetのような、より一般的なリソースも使われている。

利用例1:「Arkive: 絶滅危機生物のカタログ」

貢献者: Jeremy Carrol

コンテキスト

Arkive プロジェクトはそれぞれの絶滅危機生物のレコードから成るマルチメディアデータベースを作っている。 データベースは、それぞれの種のための十分かつ適切な情報によって、完全性を目指す。 データベースは Web サイトを通じてアクセスされ、学校の生徒から分野の専門家まで、専門的知識のレベルがどのようなユーザをも対象としている。

オントロジー知識のキーとなる機能は:

他の機能はオントロジー知識が知識のアノテーションと由来を組織化するのに有効となる。 我々は次のことに注意する:

タスク

マルチメディアレコードのデータベースを組織化し、委託し、そして問合せる。

事例ドメイン

絶滅危機にある生物のマルチメディアレコード。

典型的なユーザ

オントロジーサンプル

現在、彼らは異なったトップレベルのカテゴリーのために、およそ10個の基本レコードテンプレートを使う。 例えば、典型的なのは、植物のためには「移動」フィールドがないが、動物のために重要である。 これらのトップレベルのカテゴリーは、一般的なタイプの行動しかカバーしていないという意味で必然的に不十分である。種のユニークな、あるいは、まれな行動は: また、このような行動は科学的な討論の主題になっている。 具体的な例が、くちばしに有毒な昆虫を拾い上げて、 彼らの羽毛にこすりつける鳥に関するものである。 彼らが何のためにこれをするかは論争を引き起こす: あなたがその行動のために使う名前は、その動機の上でのあなたの判断によるものである。すなわち、政治的な確信に依存するであろう。

また、同義的な複数の異なる名前を持っているいくつかの行動がある。 デフォルト継承は重要である。 よく知られているペンギン問題は:

   living things don't fly
   birds         do    fly
   penguins      don't fly
最初にレコードを作り、デフォルト値を埋め込むことができるときに、もし必要であるなら、あるいはより動的に変更するために、取り扱われるものである。

カテゴリ情報をフィールドでの複数の(部分的に首尾一貫しない)分類法に関連付けることは重要である。

OWLへの要求事項

言うのが難しいが − 知識ベースに対する広範囲な要求事項があり、実際にオントロジーサブシステムに属する問題である。

利用例2:「EDS Web ページ埋め立て」

貢献者: Mike Smith

コンテキスト

企業のコミュニケーションと企業の記録に対するサポート。

タスク

階層的カテゴリーの中に巨大なWebページの埋め立て地を組織化する

事例ドメイン

外部の新聞発表、製品提供とケーススタディ、企業手続き、内部の製品説明と比較、ホワイトペーパー、プロセス記述の提供。

典型的なユーザ

オントロジーサンプル

文書タイプ階層:
新聞発表
  経済状態の詳細をカバーする新聞発表
    証券取引委員会のファイリングを詳しく述べた新聞発表
.....
部分-全体関係やソフトウェア、ハードウェア、通信の互換性をカバーする条件を含むソリューション記述。

OWLへの要求事項

利用例3:「航空宇宙工学データモデリング」

貢献者: Stephen Buswell

コンテキスト

航空宇宙工学における企業のコミュニケーションと企業の記録に対するサポート。

タスク

大量の技術ドキュメントを相互にリンクされた階層的カテゴリーの中に組織化する

事例ドメイン

航空機設計ドキュメンテーション; 製造工程ドキュメンテーション; テスト工程ドキュメンテーション; メンテナンスドキュメンテーション; イラスト

典型的なユーザ

オントロジーサンプル

OWLへの要求事項

利用例4:「芸術イメージコレクション」

貢献者: Guus Schreiber

コンテキスト

我々は芸術作品の意味的なアノテーションに取り組んでいる。目的はオントロジーを通じてインデキシングと検索をサポートすることである。 芸術に関しては多くの知識ソースがある。我々はここでこれらのうちの2つに焦点を合わせる:
  1. 画像記述のための VRA 3.0 標準 は、基本的にはダブリンコアの絵画アノテーションの改良である
  2. ゲッティ財団によって構築された Art and Architecture Thesaurus (AAT) は、芸術作品(芸術カテゴリ、材料、スタイル、カラー、....) を記述するための120,000の用語のよく構造化された階層を提供する。
我々は VRA によって提供された画像記述テンプレートを表す WebOnt 言語を使い、VRA のすべてのデータエレメントをデータエレメントの「filler」が 見いだされる AAT 階層のサブツリーに関係付けることを望む。例えば、我々は VRA データエレメント「style/period」をスタイルとピリオドを 表している AAT のサブツリーに関連付けることを望む。

さらに、我々はオントロジーの中に追加の知識を表現することを望む。例えば、もしインデックス付けする人がアンティークな整理だんすの style/period に “後期ジョージ王朝風”という値を選択するなら、我々はデータエレメント“date.created”が西暦1760から1811年の間の値を持っていて、 そして“culture”が英国であると推論できることを望む。このタイプのバックグラウンド知識の利用可能性が、検索と同様にインデキシングのために 与えられるサポートを極めて増加させる。

タスク

デジタル画像コレクションのインデキシングと検索

事例ドメイン

アンティーク家具の画像の博物館コレクション

典型的なユーザ

オントロジーサンプル

AAT カラー階層の表現

我々は、我々のオントロジーで、どの AAT 用語がデータエレメント“color”の値と成りうるかを表すことを望む。 AAT は精巧な色の階層を持っていて、だいたい次のような構造になっている:
<color>
  <chromatic color>
    pink
      vivid pink 
      strong pink
      ....
      <intermediate pink>
        purplish pink
	  brilliant purplish pink
	  ....
	yellowish pink
	  ....
	brownish pink
    (etc.)
  <neutral color>
    white
    gray
      light gray
      ....
    black
タイプ“<label>”の用語は AAT が「ガイド用語」と呼ぶものである。 それらの目的は階層に構造を提供することである。 我々が画像記述テンプレートの“color”スロットの値の制約条件を指定するとき、我々は理想的には<color><階層の どんなサブクラスでもスロットフィラーとして用いられることができることを望む。 しかし、我々はおそらく値の集合からガイド用語を除外することを望む。 ガイド用語と実際の色の値との違いは UML で抽象的クラス対具体的クラスと呼ばれるものに近い(抽象的クラスがインスタンスを 作れなくて、具体的なクラスが作れる)。 このような記法は、RDFS そして DAML+OILに欠落している。

ついでながら: 我々の仕事の仮定は、成功するためには、(AAT のように)すでに利用可能な(セミ)オントロジーの上に作る必要があり、 WebOnt 言語での表現の上にこれらをマップする必要があるだろうということである。 我々が AAT のような大規模な努力をやり直すことができると考えるのは非現実的である。

集合構造の表現

我々がアンティークな整理だんすのようなオブジェクトにインデックスを付けようとするとき、ほとんど必ずオブジェクトの part-of 構造を表現する必要がある。 例えば、たんすの脚に“bun feet”のようなスタイルの値を与えたい。 我々の見解では、WebOnt 委員会は WebOnt 言語に(限定された形式の)集合を導入することを考えるべきである。 もしあなたが単にこれをもう1つの slot/relation として表現するなら、あなたはセマンティックスの多くを失う。 これは同じく UML の人々からの要求事項である可能性が高い(集合は UML のクラスモデルの重要な場所を占めている)。

定義知識

差し当たり、我々が WebOnt で AAT と VRA を表現できると想定しよう。 効果的な検索サポートのために我々はこのオントロジーにドメイン知識を加える必要がある。 この知識は画像記述テンプレートの中で典型的にスロット間制約条件の形式をとる。 1つの例: style/period = "Late Georgian" => culture = "British" AND date.created = between 1760 and 1811 [style/period、culture、date.created は、すべて、芸術作品記述テンプレートのスロットとして定義された VRA データエレメントである。]

我々はこの制約条件を RDFS で定義することができなかった。 Sean Bechofer(University of Manchester)は DAML+OIL ソリューションを提供した(データタイプ表現と URI の詳細はそのまま):

<daml:Restriction>
 <daml:onProperty rdf:resource="some-URL#style"/>
  <daml:hasClass>
   <daml:Class rdf:about="some-URL#Late Georgian"/>
  </daml:hasClass>
 <rdfs:subClassOf>
  <daml:Class>
   <daml:intersectionOf rdf:parseType="daml:collection"/>
    <daml:Restriction>
     <daml:onProperty rdf:resource="some-URL#date"/>
     <daml:hasClass>
      <daml:Class rdf:about="some-URL#1760-1811"/>
      </daml:hasClass>
     </daml:Restriction>
     <daml:Restriction>
      <daml:onProperty rdf:resource="some-URL#culture"/>
      <daml:hasClass>
       <daml:Class rdf:about="some-URL#British"/>
      </daml:hasClass>
     </daml:Restriction>
    </daml:intersectionOf>
  </daml:Class>
 </rdf:subClassOf>
</daml:Restriction>
それで、すべての後期ジョージ王朝風のものは、英国のもののサブクラスで、1760年から1811年の間に作られるたものである。 これは、データモデリングにおいて、multiple specialization と呼ばれるものに類似している。

ここで2つの問題が生じる:

[Sean Bechofer と Frank van Harmelen からの情報提供に特に感謝する。]

デフォルト知識

これは、実際、事例ドメインにおけるドメイン知識の最も共通の形式である。 デフォルト知識の1つのサンプル:
IF type  "chest of drawers" AND
     style/period = Late-Georgian
THEN (this typically suggests)
     material.main = mahogany
知識の構造は定義知識に類似している、しかしソリューションはおそらくさらに難しい。 これを「スロット間のプリファレンス」と呼ぶことができる。

OWLへの要求事項

利用例5:「概念的なオープンハイパーメディア」

貢献者: Nick Gibbins

コンテキスト

巨大な Webサイトのようなコーパスをブラウジングする際のナビゲーションの改善

タスク

コーパス上へのハイパーテキストリンクのオーバーレイの構築(linkbase)

事例ドメイン

学術機関によって作られた組織的な研究ドキュメント。

典型的なユーザ

  1. ドキュメント中の用語の詳細説明(例えば、ドキュメントで言及された人々についての情報)を必要とする初心者ユーザ
  2. 望んでいる情報のだいたいの場所を知っていて、それを見つけるためにブラウジングする方法を知っている経験豊かなユーザ
  3. ドキュメントにアノテーションを付ける(ドキュメント中の用語をオントロジーと結びつける)経験豊かなユーザ、それによって新しいリンクが作られることを可能にする

オントロジーサンプル

オントロジーは、部分的にダブリンコア(書誌的なメタデータの記述)に基づいているが、同じくドキュメント(部門の委員会議事録、交付金アプリケーションなど)の 内容として目次(あるいは、どちらかと言えば、それらの目次によって参照される実体)を記述するための表現方法を必要とする。

OWLへの要求事項

特性を使ってのインスタンス(例えば、人々)の参照
関係の合成
ある特定のタイプのリンク(例えば、ドキュメントの著者のホームページへのリンク)を指定するように要求された
一般に実体を指す用語を定義する能力
例えば、用語“Nick Gibbins”は、一般に、電子メールアドレス nmg@ecs.soton.ac.uk をもつ人を指すのに使われる。 こうした用語の指し示すものは、必ずしもスタティックではない。 例えば、用語“head of department”は、それが使われるコンテキスト(その用語が現われるドキュメントの発行日付)に応じて異なる個人を指す。
由来
リンクの著者の明示は不要だが、そのリンクが何によって作られたかを表す由来が必要

参考文献

  1. The Art and Architecture Thesaurus http://shiva.pub.getty.edu.
  2. Visual Resources Association~Standards Committee. VRA core categories, version 3.0. Technical report, Visual Resources Association, July 2000. http://www.gsd.harvard.edu/~staffaw3/vra/vracore3.htm.