Commons:Données exploitables par des programmes
Sur Wikimédia Commons, de nombreuses métadonnées (incluant la licence et l'auteur) ne sont pas exploitables par des programmes. Il existe un module d'API, iiprop=extmetadata, qui peut être utilisé pour extraire certaines valeurs (exemple), mais comme les informations sont entrées comme texte libre dans la page de description du fichier, le résultat n'est pas parfait. Le projet en cours, données structurées de Commons, vise à déplacer les métadonnées, en tant que données entièrement structurées, ce qui devrait au final permettre de remplacer les données exploitables par des programmes présentées sur cette page.
Dans l'intervalle, et pour faciliter la transition à venir vers des données structurées, Wikimédia Commons utilise une série de modèles qui sont exploitables par des programmes de plusieurs manières, via les balises HTML. Certains scripts utilisent déjà cette possibilité. Il est important de noter que ces données sont disponibles pour tous les wikis qui utilisent Wikimédia Commons, où elles peuvent être lues dans le code HTML de la page Fichier: tout comme les autres données locales.
Données exploitables par des programmes
Données exploitables par des programmes ajoutées par des modèles de type infobox
Voici différents éléments HTML des modèles de description qui permettent de lire les informations:
- Les microformats qui suivent les standards et peuvent être lus par des parser déjà existants.
- Les attributs id (identifiants) des balises <td> sont des valeurs personnalisées qui permettent de compléter ces balises, ils doivent pouvoir être lus par des outils adaptés. La plupart des boîtes d'information les plus courantes ont deux colonnes : la première contient les noms des champs et la seconde contient les valeurs associées à ces champs
- Traditionnellement, les attributs id des balises <td> étaient utilisés pour marquer l'appel au nom d'un champ dans la première colonne d'une ligne. Pour obtenir la valeur associée, il faut récupérer le contenu de la cellule
<td>
suivante, située dans la seconde colonne. - Les modèles {{Creator}} et {{Institution}} ont une structure plus compliquée, ce qui fait que les cellules contenant les données sont marquées par des balise avec
des attributs utilisant une couleur de fond magenta
.
- Traditionnellement, les attributs id des balises <td> étaient utilisés pour marquer l'appel au nom d'un champ dans la première colonne d'une ligne. Pour obtenir la valeur associée, il faut récupérer le contenu de la cellule
Modèle | Nom du paramètre du modèle | Description | identifiant de l'attribut de la balise <td> | microformats | Commentaire |
---|---|---|---|---|---|
{{Information}} | description | description du fichier | fileinfotpl_desc |
hProduct.description. | Contient souvent plusieurs langues, annotées avec le modèle {{Lang}}. |
{{Information}} | date | date de création de l’œuvre originale | fileinfotpl_date |
hCalendar vevent.dtstart | Contient la date de publication soit seule, soit en complément de la date de création. Ces deux dates ont un sens différent du point de vue des droits d'auteur. L'utilisation du modèle {{Date context}} permet de mentionner cette différence. Microformat ajouté par le modèle {{Date}}. |
{{Information}} | source | source du fichier | fileinfotpl_src |
Contient souvent des tableaux complets. Nous ne disposons pas encore de moyens efficaces de gérer ce type de modèle décrivant des sources. Les modèles décrivant les sources font souvent référence à des identifiants dans des catalogues, mais ces derniers ne sont pas non plus des données exploitables par des programmes. | |
{{Information}} | author | auteur du fichier | fileinfotpl_aut |
Ceci peut être un auteur, un créateur et/ou un détenteur des droits de manière indifférenciée. Contient souvent le modèle {{Creator}}, décrit plus bas. | |
{{Information}} | permission | licence/permission pour le fichier | fileinfotpl_perm |
||
{{Information}} | other versions | autres version du fichier | fileinfotpl_ver |
||
{{Artwork}} | description | description de l’œuvre | fileinfotpl_desc |
hProduct.description | |
{{Artwork}} | date | date de création de l’œuvre originale | fileinfotpl_date |
hCalendar vevent.dtstart | Microformat ajouté par le modèle {{Date}} |
{{Artwork}} | source | source du fichier | fileinfotpl_src |
||
{{Artwork}} | artist | créateur de l’œuvre | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | author | auteur de l’œuvre d'art | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | permission | licence/permission pour le fichier et l’œuvre | fileinfotpl_perm |
||
{{Artwork}} | other versions | autres versions du fichier | fileinfotpl_ver |
||
{{Artwork}} | title | titre de l’œuvre | fileinfotpl_art_title |
hProduct.fn | |
{{Artwork}} | object type | objet de type œuvre d'art | fileinfotpl_art_object_type |
||
{{Artwork}} | medium | Techniques ou matériaux utilisés pour créer l'œuvre | fileinfotpl_art_medium |
||
{{Artwork}} | dimensions | dimensions de l’œuvre | fileinfotpl_art_dimensions |
||
{{Artwork}} | gallery | institution détenant l’œuvre | fileinfotpl_art_gallery |
||
{{Artwork}} | location | localisation de l’œuvre au sein de l’institution | fileinfotpl_art_location |
hProduct.locality | |
{{Artwork}} | accession number | numéro d'inventaire de l'œuvre | fileinfotpl_art_id |
hProduct.identifier | |
{{Artwork}} | object history | historique de l'œuvre | fileinfotpl_art_object_history |
||
{{Artwork}} | exhibition history | historique d'exposition de l'œuvre | fileinfotpl_art_exhibition_history |
||
{{Artwork}} | credit line | modalités d'entrée de l'œuvre dans la collection du musée | fileinfotpl_art_credit_line |
||
{{Artwork}} | inscriptions | Description des inscriptions, filigranes, sous-titres, armes sur l'œuvre | fileinfotpl_art_inscriptions |
||
{{Artwork}} | notes | Commentaires sur l’œuvre d'art | fileinfotpl_art_notes |
||
{{Artwork}} | references | Références liées à l’œuvre d'art | fileinfotpl_art_references |
||
{{Book}} | Author | auteur du livre | fileinfotpl_author |
||
{{Book}} | Editor | éditeur du livre | fileinfotpl_book_editor |
||
{{Book}} | Translator | traducteur du livre | fileinfotpl_book_translator |
||
{{Book}} | Illustrator | illustrateur du livre | fileinfotpl_book_illustrator |
||
{{Book}} | Title | titre du livre | fileinfotpl_book_title |
||
{{Book}} | Subtitle | sous-titre du livre | fileinfotpl_book_subtitle |
||
{{Book}} | Series title | titre de la série à laquelle appartient le livre | fileinfotpl_book_series-title |
||
{{Book}} | Authority file | données du contrôle d'autorité | fileinfotpl_book_authority |
||
{{Book}} | Publisher | éditeur du livre | fileinfotpl_book_publisher |
||
{{Book}} | Printer | imprimeur du livre | fileinfotpl_book_printer |
||
{{Book}} | Year of publication | date ou année de publication du livre | fileinfotpl_date |
||
{{Book}} | Place of publication | lieu ou ville de publication du livre | fileinfotpl_book_place-of-publication |
||
{{Book}} | Language | langue du livre | fileinfotpl_book_language |
||
{{Book}} | Description | description du livre | fileinfotpl_desc |
||
{{Creator}} | Name | Nom de l'auteur | creator |
vCard.fn | |
{{Creator}} | Alternative names | Autres noms du créateur | fileinfotpl_creator_alt-name_value |
vCard.nickname | |
{{Creator}} | Description | Nationalité et profession du créateu | fileinfotpl_creator_desc_value |
vCard.note | |
{{Creator}} | Date of death | Date de décès du créateur | fileinfotpl_creator_deathdate_value |
||
{{Creator}} | Date of birth | Date de naissance du créateur | fileinfotpl_creator_birthdate_value |
vCard.bday | |
{{Creator}} | Location of birth/death | Lieu de décès du créateur | fileinfotpl_creator_deathloc_value |
||
{{Creator}} | Location of birth | Lieu de naissance du créateur | fileinfotpl_creator_birthloc_value |
||
{{Creator}} | Work period | Période d'activité de l'auteur | fileinfotpl_creator_work-period_value |
||
{{Creator}} | Work location | Période d'activité de l'auteur | fileinfotpl_creator_work-location_valuev |
||
{{Creator}} | Image | Portrait ou photo représentant le créateur | fileinfotpl_creator_image |
||
{{Creator}} | Authority file | Contrôle d'autorité en lien avec le créateur | fileinfotpl_creator_authority_value |
| |
{{FileContentsByBot}} | (divers) | variable, merci de vous référer à la page : {{FileContentsByBot}} | (various) |
hproduct-by-bot | jeu de données de grande taille et en constante augmentation, merci de vous référer à cette page : {{FileContentsByBot}} |
{{Photograph}} | title | Titre de la photographie | fileinfotpl_art_title |
hProduct.fn | |
{{Photograph}} | description | Description de la photographie | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | original description | description d'archive d'origine de la photographie | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | date | Date de création de l’œuvre d'art originale | fileinfotpl_date |
hCalendar vevent.dtstart | Microformat ajouté par le modèle {{Date}} |
{{Photograph}} | medium | Technique ou support de la photographie | fileinfotpl_art_medium |
||
{{Photograph}} | dimensions | Dimensions de la photographie | fileinfotpl_art_dimensions |
||
{{Photograph}} | artist | Auteur de la photographie | fileinfotpl_aut |
"hProduct.fn value" | |
{{Photograph}} | institution | institution détenant l’œuvre d'art | fileinfotpl_art_gallery |
||
{{Photograph}} | location | Emplacement de la photographie au sein de l'institution | fileinfotpl_art_location |
hProduct.locality | |
{{Photograph}} | source | source du fichier | fileinfotpl_src |
||
{{Photograph}} | permission | licence/permission pour le fichier et l’œuvre | fileinfotpl_perm |
||
{{Photograph}} | other versions | autres version du fichier | fileinfotpl_ver |
||
{{Photograph}} | accession number | numéro d'inventaire de la photographie | hProduct.identifier |
Format alternatif pour CommonsMetadata
Comme le format basé sur le tableau et l'identifiant s'est avéré difficile à ajouter aux modèles qui ne sont pas formatés de la même manière que modèle "information" de Commons, CommonsMetadata fournit un format alternatif, similaire à celui des bandeaux de licence : le modèle contenant les informations doit tout entier être compris dans une balise de la classe fileinfotpl
et la balise contenant les informations spécifiques doit se trouver dans un élément de classe fileinfotpl_*
(avec les mêmes noms que ci-dessus, mais en tant que classe et non en tant qu'id).
Données exploitables par des programmes ajoutées par des modèles de licences
Mis en place en octobre 2010, en utilisant les classes <span class="licensetpl_XXX">
licensetpl
- un élément identifiant une licence. Intègre tout le code décrivant la licence et ne doit contenir qu'UNE SEULE licence, ne doit pas en contenir plusieurs.
licensetpl_short
- nom abrégé de la licence : “Domaine public”, “CC-BY-SA-3.0”, “CC-by-2.0-FR”, etc.
licensetpl_long
- nom complet de la licence : “Domaine public”, “Creative Commons Attribution-Share Alike 3.0”,
licensetpl_attr_req
- si un crédit est nécessaire. Mettre “true” si le crédit est nécessaire ou “false” sinon.
licensetpl_attr
- le crédit, si requis : texte libre.
licensetpl_link_req
- si un lien vers la licence est nécessaire pour cette licence. Mettre “true” si le lien est nécessaire ou “false” sinon.
licensetpl_link
- le lien vers le texte complet de la licence. “www.creativecommons.org/licenses/by-sa/XXX/YYY”
licensetpl_nonfree
- “true“ s'il s'agit d'une licence non libre (non utilisé sur Commons, mais seulement sur des wikis ayant une politique de Doctrine d'Exemption (PDE))
Lorsqu'il y a plusieurs blocs licensetpl
pour la même œuvre, il convient de les englober dans un bloc de niveau supérieur ayant pour classe : licensetpl_wrapper
.
Modèles insérant ces informations
- Templates setting
licensetpl
include:
{{PD-Layout}}, {{Cc-by-sa-3.0-migrated}}, {{Cc-by-layout}}, {{Cc-by-sa-layout}}, {{Cc-zero}}, {{FAL}}, {{GFDL}}, {{GFDL-1.2}}, {{GPL}} et {{LGPL}}.
Données exploitable par des programmes ajoutées par des modèles de mise en forme
Les modèles de mise en forme, prévus pour présenter de manière harmonisée différentes familles de bandeaux autres que des bandeaux de licences, véhiculent des données lisibles par des machines identifiant ces familles.
Modèle | Objet | Nom de la classe |
---|---|---|
{{Restriction-Layout}} | utilisé par des avertissement concernant des restrictions d'usage | restrictiontemplate
|
{{FoP-Layout}} | utilisé par les bandeaux sur la liberté de panorama | foptemplate
|
{{Partnership-Layout}} | utilisé par les modèles de partenariat | partnershiptemplate
|
{{Source-Layout}} | utilisé par les modèles génériques décrivant la source d'une œuvre | sourcetemplate
|
{{Created with}} | utilisé par les modèles créé avec ... | createdwithtemplate
|
Données exploitables par des programmes ajoutées par des modèles de restrictions d'usage non liées au droit d'auteur
Les modèles concernant les restrictions légales indépendantes des droits d'auteurs contiennent ces classes afin d'identifier des types de restrictions spécifiques.
Modèle(s) | Objectif | Nom de la classe |
---|---|---|
{{Trademarked}} | Images en tant que marques déposées | restriction-trademarked
|
{{Copydesign}} | Représentation d'objet(s) dont le design est protégé par les droits d'auteur | restriction-design
|
{{Communist symbol}} | Symboles communistes | restriction-communist
|
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} | Biens culturels italiens | restriction-ita-mibac
|
{{Australian Commonwealth reserve}} | Réserves australiennes | restriction-aus-reserve
|
{{Personality rights}} {{Romania personality rights}} | Droits de la personnalité | restriction-personality
|
{{2257}} | Avertissement concernant la loi des États-Unis sur la protection des enfants et l'obscénité (Child Protection and Obscenity Enforcement Act) | restriction-2257
|
{{Costume}} | Costumes | restriction-costume
|
{{Fan art}} | Fan art | restriction-fan-art
|
{{Currency}} | Monnaie | restriction-currency
|
{{IHL Symbol}} | Symboles dont l'usage est restreint par le droit international humanitaire | restriction-ihl
|
{{Nazi symbol}} | Symboles nazis et fascistes | restriction-nazi
|
{{Insignia}} | Insigne officiel | restriction-insignia
|
Données exploitables par des programmes ajoutées par des modèles spécifiques
D'autres données expoloitables par des programmes sont insérées. En voici une liste non exhaustive :
- {{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
- {{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>
Données exploitables par des programmes ajoutées par des modèles de localisation
Le modèle {{Location}} et les modèles similaires ajoutent des informations géographiques exploitables par des programmes au format suivant : <span class="geo">12.34;24.68</span>
(latitude et longitude sous la forme de nombre à virgule flottante, séparés par un point-virgule). Les coordonnées utilisent le système WGS 84 (utilisé par le GPS et la plupart des cartes en ligne). Voir la page Commons:Géolocalisation pour plus de détails.
Utilisation
API de MediaWiki
(Ouvrir dans le bac-à-sable API) qui renvoie des informations comme Credit, Artist, LicenseUrl et Copyrighted et est utilisé par Media Viewer, notamment.
Scripts utilisant des données destinées aux programmes
- MediaWiki:Gadget-Stockphoto.js
- MediaWiki:GallerySlideshow.js
- MediaWiki:Gadget-AddInformation.js
- MediaWiki:FileContentsByBot.js
Outils externes
Voir aussi
- Category:Templates generating microformats
- Commons:WikiProject Microformats
- Category:Files with lack of machine-readability
- Projets expérimentaux, abandonnés : Commons:API, Commons:Commons API
Comment définir de nouvelles données exploitables par des programmes
- si possible, encadrez les données réelles, pas les en-têtes d'un champ. Cette méthode était utilisée historiquement dans tous les modèles Information, mais s'avère bien plus difficile à continuer à utiliser sur le long terme.
- N'incluez que les données, pas les éléments de mise en forme de ces données.
- Partez du principe que le formatage de données sera perdu lors de la conversion des données. L'habillage graphique ne fait pas partie des informations.
- N'incluez pas plusieurs unités d'information dans un même champ de données. Il y a une différence entre une date de publication et une date de création. Les deux sont des dates, mais les deux sont des 'champs de données' différents. De même, CC-by-SA-4.0-3.0-2.5 n'est pas l'identifiant d'une licence, il y a en fait trois licences dont le nom commence par CC-by-SA-.
- Assurez-vous que les valeurs des données ont une unité, ou qu'elles sont exprimées dans des unités cohérentes.
- Don't wrap multiple units of information inside one field. There is a difference between a publication date and a creation date. Both are dates, but both are different 'data fields'. Also CC BY-SA-4.0-3.0-2.5 is not a license name, those would be 3 licenses with the name CC BY-SA-##.
- Make sure that the data value has one unit, or outputs one consistent unit.
Problèmes
Il y a un petit nombre de choses qui ne sont PAS ou très difficilement reconnaissables. Cela comprend :
- Derivative works
- Works included in works. See also Category:FoP_templates
- licenses derivates or works included in works are a mess.
- Author vs. Copyright holder
- usernames vs 'real names'
- Catalogue IDs etc
- VRTS permissions
- Publication date vs creation date
- Donating institutions of materials
- Anything that is NOT using the above structures is not recognizable at all and will require manual cleanup at some point.
- Heirs: {{Heirs-license}}
- Multilicensed CC works, that use {{Cc-by-3.0,2.5,2.0,1.0}}, {{Cc-by-sa-2.5,2.0,1.0}}, {{Cc-by-sa-4.0,3.0,2.5,2.0,1.0}} or {{Cc-by-all}}.
- Non-licensed works: {{Copyrighted free use}}, {{Attribution}} (Problem, how to describe this grant of rights success ?)
- Improvised File description templates like User:Tevaprapas/Information
- Templates denoting the copyright of partials of the work: {{Copyright information}}