Commons:構造化データ/概要

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Commons:Structured data/About and the translation is 100% complete. Changes to the translation template, respectively the source language can be submitted through Commons:Structured data/About and have to be approved by a translation administrator.

Other languages:
Deutsch • ‎English • ‎dansk • ‎español • ‎français • ‎galego • ‎polski • ‎português do Brasil • ‎العربية • ‎日本語

ウィキメディア・コモンズはウィキペディアの姉妹プロジェクトであり、5000万以上の自由に使えるメディアファイルを収集しています。コモンズの構造化 (Structured Data on Wikimedia Commons) は、それらのファイルについている説明を構造化およびコンピューターに読み取り可能なものに変更し、閲覧、検索、編集、整理、再利用を、多くの言語でよりやりやすくすることを目的としています。

これはウィキデータに使っているのと同じ Wikibase で実装しています。

このプロジェクトには2017年から2019年末にわたり、ウィキメディアのコミュニティの皆さんウィキメディア財団 (WMF) およびウィキメディア・ドイツ支部 (WMDE) (ウィキデータ担当チーム) の職員が取り組む計画です。

ウィキメディア・コモンズについて

ウィキメディア・コモンズはウィキメディアによる無料のメディアのリポジトリです。2018年秋現在、以下のようないつでも利用可能なメディアが5千万点超揃っています。

  1. 個人がアップロードする自分で撮影した写真やメディア。
  2. 著作権フリーのメディアファイルでFlickrやYouTube、オープンアクセスのジャーナル媒体などインターネット上、あるいはその他のリポジトリに公開され、そこからコモンズにアップロードされたもの。
  3. 相当規模の収蔵品がある組織や機関所蔵のメディアで、例えばUNESCONASA大英図書館からのアップロード。

2017年から2019年まで、コモンズ構造化プロジェクトを通して、ウィキメディア・コモンズは新しいインフラとツールを手にすることになります。これにより、これまでメディアファイルについて書かれてきたテキストに加えて、機械可読な、構造化データを用いて、コモンズの貢献者であるコミュニティの助けとなるでしょう。

コモンズの構造化プロジェクトは、アルフレッド・P・スローン財団より助成を受けて始まったプロジェクトです。助成について交付の申請とそれに先立つローカル協議などより詳しくはこちらをご覧ください

構造化データとは

ウィキメディア・コモンズはサイトの運用にウィキペディアと同じMeddiaWikiというソフトウェアを使用しています。MediaWikiはもともとWikipediaを作るために開発されたソフトウェアでした。そのため、コモンズにあるファイルについて、プレインテキスト(あるいはwikitextやテンプレート)とカテゴリで詳細を記載していました。詳細は通常ひとつの言語 -- ほとんどは英語 --のみで記載され、最も憂慮すべきは、機械可読ではないことでした。

構造化メタデータはファイルへのアクセスを強固で着実に構造化し、相互にリンクする形式を提供します。この形式は大規模なものでもソフトウェアが理解することが可能であり、メタデータの各要素と外部のデータベースを接続することもできます。さらに、構造化メタデータは構造化していないデータよりも別の言語に翻訳しやすいものとなります。

この切り替えにより、コモンズのメディアファイルをこれまでとは異なる方法で使うことができるようになります。また、コモンズにあるファイルを、様々な言語で見やすく、探しやすく、編集しやすく、作成しやすく、整理しやすく、使用や再利用しやすくするものでもあります。

System-search.svgSee also: なぜこれをやるのか

ウィキメディア・コモンズで何が変わるのか?

ウィキメディア・コモンズ上のファイルについての情報はウィキデータを装備した構造化データで拡張されます。

ウィキメディアのエコシステムにおける構造化データのリポジトリであるウィキデータは2012年にデビューしました。ウィキデータはウィキメディア・ドイツ(WMDE)のチームによって監督され、コモンズにおける構造化データのための基盤として提供されています。

ウィキデータのソフトウェアであるWikibaseは記事をwikitextでストアしているのではなく、コンセプト(「項目」と呼ばれる)をストアしています。そしてこれらの項目は例えば項目のタイトル、他の項目との関係、日付などを記述する多数の「文」を含んでいます。

ウィキデータ上の構造化データはウィキメディアのあらゆるサイトで、またサードパーティでも自由に再利用できます。さらに、コンピュータはこれを容易に処理したり理解できます。その柔軟性により、ウィキデータはSTEM[1]分野だけでなく、文化遺産や人文科学でも次第に使われ始めています。さらに、翻訳を広範にサポートしているので、ひとつの言語でウィキデータに入力されたデータは多くの他の言語でも同様に即座に利用可能になります。ウィキメディア・コモンズにおける構造化データ統合はWikibaseやウィキデータのメタデータをウィキメディア・コモンズの説明文に統合することで行われます。

System-search.svgSee also: よくある質問
System-search.svgSee also: 用語集

いつ開発されるか?

コモンズへの構造化データの開発は2017年から2019年終わりまで行われます。

3年間のプロジェクトを通して、コモンズ上のファイルを編集、保守、変換、クリーンアップするアクティブで多様なツールを構築したいボランティアやパートナーを奨励、サポートする計画を立てています。

3年後には、ウィキメディア・コモンズ上の約500万件かおそらくそれ以上のメディアファイルが何らかの構造化メタデータを保有することを想定しています。コミュニティの手続き次第ではありますが、あらゆるコモンズ上のファイルが何らかの構造化データで記述されるにはおそらくさらに何年か「ロングテール」の期間があるでしょう。

System-search.svgSee also: 開発

誰がやっているのか?

構造化コモンズは開発者、ウィキメディア・コモンズ、ウィキデータ、ウィキペディア及び姉妹ブロジェクト、パートナー、ウィキメディア運動の同盟などの間でのコラボレーションです。

開発チームウィキメディア財団とウィキメディア・ドイツの双方のスタッフから成っています。コミュニティの開発者(ツール開発者、ボット運営者、パートナー組織の開発者)はこのプロジェクトでさらに幅広い役割で活躍することもできます。開発された機能は全てコモンズやウィキデータ、そしてウィキペディアや姉妹プロジェクトに対して同様にアクティブな貢献者のコミュニティとの緊密なコラボレーションで、コンセプト化、作成、テスト、改善されます。私たちはまた文化組織(GLAM - ギャラリー、図書館、公文書館と博物館)からのフィードバックも歓迎します。

System-search.svgSee also: チーム
System-search.svgSee also: コミュニティ・フォーカス・グループ

支援と参加の方法

  • ウィキメディア・コミュニティのメンバー用に貢献方法は多数あります – フィードバックの提供、他の人の支援、コミュニティ・フォーカス・グループへの参加、コンテンツ翻訳...
  • 文化・知識組織(GLAMs)の代表もフィードバックを提供したり、フォーカス・グループに参加できます。
System-search.svgSee also: 参加しよう
System-search.svgSee also: Commons:International Image Interoperability Framework
  1. 科学、技術、工学、数学。