User:Clou/Notes MONA

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search

Notes sur les données structurées de Wikimedia Commons à l'intention des projets de la maison MONA.

Clou (talk) 19:07, 4 March 2024 (UTC)

Structured Data on Commons[edit]

Principes fondamentaux[edit]

Les données structurées sur Wikimedia Commons décrivent les images (donc les photographies et les fichiers).

Les données structurées sur Wikimedia Commons ne décrivent pas les objets montrés par les images.

La nuance peut paraître subtile, mais quand l'on déclare que « une image montre une chose », ce qui est tout à fait possible sur Commons, on parle bien de l'image, non de la chose.

Source : https://commons.wikimedia.org/wiki/Commons:Structured_data

Exemples concrets[edit]

Autrement dit, on ne peut pas récupérer les informations sur l'objet montré par une image en utilisant seulement les données structurées de Commons :

  • cette requête https://w.wiki/9N8y devrait renvoyer 0 lignes (elle en renvoie 2, que je suppose être des descriptions erronées)
  • cette requête https://w.wiki/9N9y retourne 0 lignes (comme attendu)

Il faut utiliser la fédération de requêtes. Je présume que les serveurs SPARQL de la fondation Wikimedia sont paramétrés pour ce faire (question de CORS). Selon cette section, « This endpoint can federate with WDQS », ce qui est une bonne nouvelle.

Voyons voir cette requête qui retourne les images montrant un objet ayant le genre art public :

Ça fonctionne : on récupère sur Wikidata les informations sur l'objet montré par la photo. Nous obtenons 103 917 lignes, donc autant d'images distinctes qui utilisent la propriété wdt:P180 avec un objet identifié sur Wikidata dont le genre wdt:P136 est art public. Le nombre semble assez plausible.

Importante note technique : selon l'information indiquée ici, il est nécessaire de gérer l'optimisation de la requête avec hint:Prior hint:runFirst true. Sans cela, c'est time out.

Conclusion[edit]

C'est par les propriété wdt:P180 (depicts) et wdt:P921 (main subject) (éventuellement en préparer l'union) que nous pourrons récupérer les données sur les objets montrés, en l’occurrence faire le lien entre les artistes et les images de leurs oeuvres.

Par ailleurs, les principes de fédération de requêtes s'appliquent à n'importe quel autre point d'accès, pour peu que les serveurs soient paramétrés pour recevoir des requêtes externes et qu'il existe des URI communs entre les jeux de données (à la façon des clés externes entre les tables relationnelles).

Exemples intéressants[edit]

Les détails de la modélisation des photos d'oeuvres d'art sont exposés sur cette page : Commons:Structured_data/Modeling/Visual_artworks#How_to_model_structured_data_and_Wikitext_to_describe_Commons_files

En spécifiant sur Wikidata les valeurs de propriétés attendues par les wiki modèles de Commons, les infos de l'oeuvre sont automatiquement affichées.

Par contre, très important, les oeuvres doivent se voir attribuer un QID wikidata, ou alors il faut définir notre propre wiki modèle qui travaillera selon nos besoin et avec nos données.

Kiwi by Peter Woytuk[edit]

Kiwi genre public art, not a surrogate : https://commons.wikimedia.org/wiki/File:1._Tamanian_St_-_Kiwi_by_Peter_Woytuk_.jpg

  • deux sections dans le Summary : Objet et Photograph
    • Object : données structurées sur ce qui est représenté par la photo
    • Photograph : données structurées sur la photo
  • Onglet Structured Data : utilise P180 et P921, mais là n'apparaissent pas les données sur l'objet (on les retrouve seulement dans la section Object du Summary); donc les données structurées dans l'onglet structured décrivent la photo, pas les objets représentés.

Le lien entre l'image et les données de wikidata semble se faire automatiquement grâce à l'utilisation sur la page de l'image du modèle Wikimedia Commons {{Art photo}} : https://commons.wikimedia.org/wiki/Template:Art_Photo.

Oiseau,_Paul_Borduas,_1961[edit]

Essais avec données structurées, Wikidata et le wikimodèle Art Photo :

https://commons.wikimedia.org/wiki/File:Oiseau,_Paul_Borduas,_1961_(52208444377).jpg

Inukshuk[edit]

Voir https://commons.wikimedia.org/wiki/File:Jusipi_Nalukturuk,_Inukshuk,_2016_(48708655501).jpg

Utilisation d'un modèle pour indiquer la provenance Flickr :

=={{int:license-header}}==

{{cc-by-2.0}}

{{FlickreviewR|status=passed|author=art_inthecity|sourceurl=https://flickr.com/photos/57286185@N04/48708655501|archive=|reviewdate=2022-04-14 13:42:18|reviewlicense=cc-by-2.0|reviewer=FlickreviewR 2}}

Catégorie[edit]

Information sur droits d'auteur[edit]

https://commons.wikimedia.org/wiki/File:Colonne-vaisseau_55-o.art.pub-colvais-02.jpg

Art public à Montréal[edit]

https://en.wikipedia.org/wiki/List_of_public_art_in_Montreal

Requêtes[edit]

Notes[edit]

Les métadonnées techniques du fichiers (Exif) sont extraites et automatiquement renseignées par Commons.

Pour chaque ressource sur Commons, deux types de données peuvent être renseignées :

  • file information : métadonnées rudimentaires liées au fichier, come les captions en différentes langues, description, date, source, author, license
  • structured data : RDF qui utilise les entités de Wikidata

Il existe des consensus au sein de la communauté pour décrire des ressources qui sont identifiées sur Wikidata, mais pas pour celles qui sont identifiée à l'externe.

En général, il est nécessaire de distinguer le l’œuvre ou l'objet du fichier qui montre l’œuvre ou l'objet. L’œuvre a son creator et le fichier a également son propre creator, en général une personne qui prend la photo (Art et site?). Il est préférable que l’œuvre soit décrite sur Wikidata, mais peut l'être sur Commons.

Pour Wikidata, les bonnes pratiques de modélisation des oeuvres visuelles sont disponibles ici : https://www.wikidata.org/wiki/Wikidata:WikiProject_Visual_arts/Item_structure

Voir pour les batch upload

Ressources[edit]