Quantcast
Channel: crowdsourcing – Déjà Vu
Viewing all articles
Browse latest Browse all 8

PhotosNormandie a cinq ans – un bilan en forme de FAQ

$
0
0

PhotosNormandie est un projet collaboratif portant sur plus de 3000 photos historiques de la Bataille de Normandie. Il a pour but d’améliorer leurs légendes en utilisant les possibilités de la plate-forme Flickr.
Le projet boucle sa cinquième année d’activité ce 29 janvier 2012, et il apparaît presque comme un dinosaure à l’échelle de l’évolution des applications sur Internet.
PhotosNormandie est toujours bien actif et je propose dans cette note un petit bilan sous la forme d’une FAQ.

1. D’où viennent les photos ?

Elles sont proposées en libre téléchargement sur le site Archives Normandie 1939-1945 mis en place en 2004 par le Conseil Régional de Basse-Normandie à l’occasion de la commémoration du soixantième anniversaire de la libération de la région. Les photos proviennent des Archives Nationales des États-Unis (NARA) et du Canada.

Nous avons ajouté récemment 281 photos provenant de la Bibliothèque de Cherbourg-Octeville à la suite de la signature d’un partenariat (voir ci-dessous).

2. Avez-vous le droit d’utiliser ainsi ces photos ?

Oui. Les photos sont déclarées « libres de droits » sur le site Archives Normandie 1939-1945. Même si cette formule n’a en fait guère de sens en droit français, les conditions d’utilisation stipulées sont claires et nous nous y conformons scrupuleusement. L’origine est aussi rappelée dans le champ copyright de chaque photo.

Les photos sont d’autre part disponibles sur Internet en de nombreux autres endroits, comme sur le site commercial Archives de Guerres, mais sans nos légendes.

3. Pourquoi avoir lancé ce projet ?

Les légendes des photos sur le site Archives Normandie 1939-1945 sont très médiocres et pour certaines complètement désastreuses ou fantaisistes.

4. Dépendez-vous du Conseil Régional de Basse-Normandie ou d’une quelconque institution ?

Non. Nous sommes une équipe indépendante.

5. Le Conseil Régional de Basse-Normandie et le Mémorial de Caen sont-ils au courant de votre projet ?

Nos tentatives pour intéresser ces institutions à nos activités ont toujours été vaines. Le site Archives Normandie 1939-1945 ne semble plus administré.

6. Êtes-vous subventionnés, sponsorisés ? Gagnez-vous de l’argent avec PhotosNormandie ?

Non. Ce travail a une finalité patrimoniale et il est réalisé par un collectif totalement bénévole. Il n’est pas envisagé non plus de “vendre” les légendes qui sont librement utilisables. Nous demandons juste de créditer PhotosNormandie quand on utilise une des légendes.

7. Comment définir le projet ?

Le projet peut être défini comme une forme de crowdsourcing, c’est-à-dire une activité sur le Web où les contenus sont générés par les utilisateurs. Il est qualifié parfois d’indexation sociale, d’indexation collaborative, d’indexation contributive, etc. La terminologie est assez fluctuante et n’a pas vraiment d’importance. PhotosNormandie en tout cas ne correspond pas à une folksonomie caractéristique du web social. Les tags y sont très peu utilisés. Les légendes sont souvent assez longues et soigneusement rédigées.

PhotosNormandie correspond en fait à une démarche documentaire et rédactionnelle, à un travail collectif avec un objectif de production. C’est une entreprise qui vise à traiter à nouveau une collection de documents en utilisant les fonctionnalités sociales d’une plate-forme de partage.

Dans plusieurs communications, j’ai retenu le terme de redocumentarisation, même si ce néologisme est un peu barbare. Redocumentariser, c’est retraiter un document ou un ensemble de documents numérisés de façon à les enrichir de descriptions (métadonnées) nouvelles et à réarranger et relier leurs contenus (voir aussi mon billet Vous avez dit “redocumentarisation” ?).

8. Existe-t-il d’autres projets semblables ?

Oui, le plus connu est The Commons qui utilise également Flickr. Ce projet a été initié un an après PhotosNormandie par la Library of Congress. Il regroupe actuellement 56 institutions dont une seule française, la Bibliothèque de Toulouse1.

Il en existe d’autres dont les finalités et les modes de fonctionnement peuvent être différents, voir par exemple mon billet Une typologie du crowdsourcing appliqué aux images (qui date de 2009 et mériterait d’être actualisé…).

9. Pourquoi n’êtes-vous pas membre de The Commons ?

Ce n’est pas possible. Nous ne sommes pas une institution mais un collectif indépendant. Les photos appartiennent in fine aux Archives Nationales des États-Unis et du Canada; dans le cadre de The Commons, elles devraient être proposées par ces institutions.

10. Quelle est la fréquentation de la galerie de photos ?

Si l’on se réfère à The Commons, ce type d’initiative a deux objectifs principaux. Il s’agit à la fois d’augmenter l’exposition d’une collection de photos et de permettre au grand public d’apporter des informations et des connaissances afin d’améliorer leurs descriptions.

Bien que le premier objectif ne soit pas essentiel en ce qui concerne notre projet, il est clair que le partage d’une telle collection cohérente et suffisamment vaste sur Flickr permet de bénéficier d’une grande visibilité. Nous avons ainsi enregistré au cours de cette période plus de 8,3 millions de visites, soit environ 4500 visites quotidiennes en moyenne.

11. Comment êtes-vous organisés ?

En cinq ans, une soixantaine de contributeurs différents ont participé au projet et le groupe Flickr Discussions sur PhotosNormandie compte à ce jour 55 membres.

Cependant, une dizaine seulement de ces participants constitue le “noyau dur” du projet et forme une véritable communauté de recherche.

En comparant notre mode de fonctionnement avec certains autres projets qui marchent visiblement beaucoup moins bien (dont certains sur The Commons), nous estimons qu’une part essentielle du succès du projet vient de la constitution de ce groupe de recherche informel mais très motivé.

Lorsque l’on partage des photos sans constituer en même temps un groupe de travail actif, si l’on omet de répondre aux intervenants, de créer un peu d’animation, de démarcher les sites spécialisés et les forums déjà constitués, si, en bref, on “balance” des photos sur Flickr en attendant sagement que les visiteurs viennent proposer des commentaires intéressants, les résultats sont décevants.

12. Comment sont rédigées les légendes ?

Le processus de crowdsourcing est très différent de celui de Wikipedia.
Une discussion peut s’établir entre les divers participants. La discussion se termine par la validation collective des modifications proposées. On constate en général peu de désaccords lors des échanges. La rédaction de la légende nouvelle est alors effectuée par une seule personne (Michel Le Querrec, co-initiateur du projet) à partir d’informations fournies par les intervenants.

13. Vos informations sont-elles fiables, contrôlées ? Quelles sont vos compétences sur cette période historique ?

Le projet est ouvert à tous. Aucun diplôme en histoire ou archivistique n’est bien entendu requis pour participer. Néanmoins, le groupe de recherche s’est constitué autour de passionnés aux compétences complémentaires où l’on compte des archivistes, documentalistes, enseignants, etc. Nous avons aussi bénéficié de contributions de la part de deux historiens: Antonin Dehays, doctorant sous la direction de Jean Quellien puis de François Rouquet, et Simon Trew, professeur à la Royal Military Academy Sandhurst.

Tous les participants connaissent visiblement très bien l’histoire de la bataille de Normandie et disposent d’une abondante documentation. Ils sont pour la plupart originaires de la région et possèdent aussi une bonne connaissance familiale et locale de ces événements. Beaucoup d’entre eux ont collecté des informations sur leurs villes d’origine2.

De plus, à côté de la production directe sur Flickr, il existe une seconde strate dans l’organisation du travail. Elle est constituée par les contributions indirectes apportées par les utilisateurs des forums que nous consultons; ils forment une sorte de réseau de second niveau qu’il est indispensable d’activer dans ce genre de projet.

Nos règles concernant les sources sont simples:

  • si une information provient d’une source publiée, on doit citer cette source;
  • sinon, on doit produire des éléments visuels (observation de la photo, autres photos similaires, films, etc.) ou bien d’autres arguments provenant de sources publiées, de témoignages directs ou indirects;
  • les informations plausibles mais non certaines doivent toujours être mentionnées comme des hypothèses.

14. Votre projet a-t-il été critiqué ?

Oui, très rarement il est vrai, et toujours oralement, jamais par écrit. Les critiques portent sur la question de l’autorité et la légitimité de l’entreprise ainsi que son contrôle (ou son absence de contrôle) par le monde universitaire. Notre réponse est invariable: le projet est public et facilement contrôlable, les historiens spécialistes de la période sont les bienvenus.

Il est du reste très facile de juger de la qualité de notre travail. Archives Normandie 1939-1945, Archives de Guerres et PhotosNormandie utilisent les mêmes références de photos. Le lecteur peut donc aisément comparer les différentes légendes sur ces trois sites.

15. Quand décidez-vous qu’une légende est terminée, qu’une description de photo est achevée ?

Jamais. Nous ne sommes pas dans un modèle où la légende imprimée ne peut être modifiée, où la “fiche documentaire” rédigée par un archiviste assène une vérité immuable. Une légende est toujours ouverte, toujours révisable. C’est un contenu public potentiellement perfectible.

16. Vous considérez-vous comme des amateurs ?

Nous sommes des amateurs passionnés, et notre “modèle” est celui de l’astronomie. Dans cette discipline en effet, les amateurs aident les professionnels pour des tâches ingrates, répétitives, immenses: la surveillance des étoiles variables, la découverte de nouveaux objets (comètes, étoiles variables), etc. Leur rôle, certes modeste, est reconnu par une instance comme l’Union Astronomique Internationale (pour en savoir plus, voir aussi mon billet Les pratiques amateurs en astronomie).

Nous ne prétendons pas être reconnus comme de véritables historiens. Notre ambition est modeste. Mais nous pensons que le travail considérable effectué en améliorant pas à pas la description de cette collection, en cumulant de petites informations nouvelles, est utile à la fois au grand public et aux historiens professionnels.

17. Quels sont vos résultats ?

Plus de 6800 légendes ont été rédigées par Michel Le Querrec, co-initiateur du projet, en collationnant les contributions d’une soixantaine de participants. Certaines de ces légendes ont été mises à jour plusieurs fois. Nous pouvons affirmer sans forfanterie que l’ensemble forme probablement la meilleure description documentaire globale de cette collection de photos.

Parmi les nombreuses petites découvertes effectuées, nous sommes particulièrement fiers de l’identification de Robert Capa effectuée par Claude Demeester début 20083.

Un autre travail important consiste à retrouver les films en relation avec les photos. Les liens entre les photos et les films produits par le Signal Corps ont en effet été négligés et parfois même ignorés car la pratique archivistique de l’immédiat après-guerre traitait séparément les deux médias. Nous avons ainsi identifié plus de 250 références à des séquences filmées.

18. Pourquoi travailler avec Flickr qui est une société commerciale ?

La plate-forme Flickr permet de conserver la totale maîtrise des informations que nous produisons (voir ci-dessous) et de dialoguer très facilement sur les photos. Elle offre en outre une excellente visibilité à la collection; comme l’expliquait Matt Raymond de la Library of Congress à propos du projet The Commons:
Our broad strategy is to ‘fish where the fish are’ and to use the sites that give our content added value“.

L’hébergement sur une autre plate-forme, sur Wikimedia Commons par exemple, est tout à fait envisageable si nous conservons les mêmes facilités de dialogue et le contrôle des légendes.

19. Dépendez-vous de Flickr ?

Aucunement. Flickr est uniquement un outil permettant de publier et d’organiser des images, puis de les annoter collectivement. C’est un album moderne en quelque sorte. Un bel outil, certes, mais rien d’autre qu’un outil que l’on doit pouvoir abandonner pour un autre. Comme un album qui deviendrait usé, fatigué et devrait être remplacé. Ce qui signifie, en poursuivant la comparaison, que les annotations de photos que l’on souhaite conserver ne doivent en aucun cas figurer sur l’album lui-même, mais “au dos” des photos. Une plate-forme qui ne permet pas de disposer à tout moment des images accompagnées de leurs légendes n’a aucun intérêt.

C’est pourquoi nous utilisons la technique d’encodage des métadonnées descriptives à l’intérieur des images numériques selon les standards IPTC/IIM et XMP. De cette façon, la pérennité du travail est garantie4.

La description textuelle de l’image est toujours disponible avec l’image et facilement réutilisable. Nous sommes libres vis-à-vis de Flickr et de la technologie de base de données utilisée pour l’exploitation de la collection documentée. C’est un principe fondamental dans tous les projets de ce genre: vos données vous appartiennent, elles n’appartiennent pas à votre prestataire de service.

20. Quelles sont vos méthodes ?

La base du travail consiste à examiner très attentivement chaque photo, à collecter, compiler, discuter et critiquer toutes les informations que nous trouvons. La méthodologie suivie peut être décrite comme un ensemble de règles heuristiques que j’ai exposé dans l’article Heuristique et sérendipité : un exemple en images (janvier 2010).

La nature collective du travail est très importante. Chaque intervenant apporte sa petite ou sa grande contribution et l’ensemble des contributions est consolidé dans une nouvelle description.

Nous utilisons aussi tous les outils disponibles du Web. Ainsi, nous avons exploité la recherche inversée d’images dès l’ouverture du service TinEye en 2008.

Beaucoup de photos ne sont pas (ou mal) localisées. Afin d’identifier ces localisations inconnues, nous utilisons souvent les cartes postales anciennes et sollicitons quelquefois les collectionneurs. Nous avons mis au point également une technique simple, mais parfois longue à mettre en œuvre. Après avoir identifié une unité militaire qui figure sur une photo à l’aide des marquages sur les matériels ou des patchs des soldats, nous estimons une fourchette de dates probables de prise de vue. Puis nous suivons sur Google Street View le trajet de l’unité militaire en question durant cette période en tentant de repérer la localisation moderne correspondant à la scène photographiée. Cette méthode est bien sûr inopérante pour les zones urbaines qui ont été profondément transformées. C’est un exemple de tâche fastidieuse, dont le résultat n’est pas garanti, que des amateurs passionnés peuvent réaliser mais qui n’aurait peut-être jamais été effectuée par un historien professionnel.

Localisation à l'aide de Google Street View (réalisée par Claude Demeester). Photo p013041. Conseil Régional de Basse-Normandie/National Archives USA.

D’autres exemples de méthodes d’identification de lieux figurent ici.

21. Comment gérez-vous les commentaires indésirables ?

Sur certaines photos où figurent des Waffen SS, nous avons parfois relevé des commentaires bienveillants ou admiratifs envers ces unités. C’est arrivé très rarement, à peine une dizaine de fois en cinq ans. Nous avons effacé immédiatement ces propos indésirables5.

22. Avez-vous des contacts avec des institutions intéressées par votre projet ? Avez-vous développé des partenariats ?

Quelques musées, collectivités locales et photothèques françaises m’ont demandé des “conseils” pour développer des projets similaires. Les questions abordées concernaient essentiellement les aspects juridiques et techniques, rarement l’animation de l’activité. Aucun des projets envisagés n’a été réalisé à ma connaissance.

À l’inverse, nous avons exposé le projet à des institutions ou établissements qui détiennent (parfois au sens carcéral du terme) des collections de photos ou films qui nous intéressent et pourraient être “redocumentarisées” selon notre méthodologie. Dans plusieurs cas, nous n’avons reçu aucune réponse à nos propositions, et le plus souvent, le refus était net sous prétexte de problèmes de droits sur les images ou d’un manque à gagner redouté dans leur vente.

Nous avons néanmoins conclu un accord de partenariat avec la Bibliothèque de Cherbourg-Octeville en avril 2011 grâce à la ténacité de Barbara Hirard, responsable du fonds régional et des fonds iconographiques de la bibliothèque.

Un partenariat avec un éditeur de presse est également envisagé dans le futur pour la réalisation d’un numéro spécial du journal consacré au Débarquement.

23. Votre travail et vos résultats sont-ils reconnus ?

Les légendes de PhotosNormandie sont maintenant reprises dans plusieurs ouvrages spécialisés. Nous constatons aussi, hélas, quelques reprises intégrales de nos légendes sans que PhotosNormandie soit crédité.

Le projet a également obtenu en 2010 une ”mention honorable” dans la catégorie Best Use of Crowdsourcing for Description des Best Archives on the Web awards décerné par le site ArchivesNext.

En fait, nous percevons une sorte de réticence dans le milieu académique français à reconnaître que ce genre de travail réalisé par des amateurs possède une valeur. Mais ce n’est pas très important. La conception que nous défendons, où la description documentaire est toujours publiquement révisable et perfectible, conduit à envisager PhotosNormandie comme une simple expérience, une étape.

24. Quelles sont les perspectives de développement du projet ?

Le site Archive Normandie 1939-1945 contient plus de 13000 photos. Nous avons utilisé pour notre projet celles qui sont libres de droit. Les autres photos, qui ne sont pas disponibles en haute résolution, comportent également des légendes souvent inexactes ou très peu détaillées. Nous souhaitons que ce verrou des droits ne soit plus un obstacle et qu’il soit possible un jour de les mettre à disposition du public, peut-être sous une forme plus restrictive, afin d’améliorer aussi leurs descriptions. C’est exactement ce que nous avons réalisé avec la Bibliothèque de Cherbourg-Octeville et nous aimerions étendre l’expérience à d’autres fonds photographiques.

Les descriptions des photos sont actuellement rédigées en français. On nous a demandé assez souvent des légendes en anglais. Nous avons besoin pour réaliser cela d’une personne capable non seulement de traduire les descriptions actuelles, ce qui est déjà un gros travail, mais aussi de développer le projet en constituant et en animant une communauté anglophone.

Nous envisageons de géolocaliser les photos, c’est-à-dire écrire dans les images numériques les coordonnées du lieu de prise de vue de façon à permettre leur positionnement sur des cartes telles que Google Maps par exemple.

Enfin, l’expérience acquise au cours de ce projet est très positive et certainement applicable à de nombreux domaines qui nécessitent la participation de spécialistes disséminés dans le monde entier.

25. Comment en savoir plus sur le projet ?

J’ai effectué durant ces cinq années une bonne douzaine de présentations auprès d’historiens, archivistes, documentalistes, bibliothécaires, visualistes, iconographes, photographes. J’ai aussi écrit plusieurs articles et billets de blogs sur le projet. Une sélection de ces interventions figure ci-dessous:

  • Une plate-forme sociale pour la redocumentarisation d’un fonds iconographique, preprint de l’article publié dans Traitements et pratiques documentaires : vers un changement de paradigme ? Actes de la deuxième conférence Document numérique et Société, 2008, sous la direction d’Evelyne Broudoux et Ghislaine Chartron, ADBS, Collection : Sciences et techniques de l’information, 2008 [format PDF]. Présentation sur slideshare.
  • Symposium L’histoire contemporaine à l’ère digitale, Luxembourg, 15 et 16 octobre 2009, présentation sur slidesharevidéo
  • Colloque Dans la toile des médias sociaux, 27 et 28 juin 2011, Institut Historique Allemand, Paris, video
  • Liberating Archival Images: The PhotosNormandie Project on Flickr, translated by Lynne M. Thomas, in A Different Kind of Web: New Connections Between Archives and Our Users, Edited by Kate Theimer, Society of American Archivists, 2011

Je signale également différentes études en relation directe avec le projet:

26. Comment participer au projet ?

C’est très simple, il suffit d’ouvrir un compte (gratuit) sur Flickr et de commenter les photos.

  1. J’aurais l’occasion de présenter The Commons lors du séminaire Muséologie, muséographie et nouvelles formes d’adresse au public à l’IRI le 14 février 2012.
  2. À titre d’exemple, je m’occupe d’un site sur un petit village de l’Orne et Michel Le Querrec a créé un site sur Caen durant la SGM.
  3. Identification reprise et confirmée dans l’ouvrage Robert Capa – Traces d’une légende, par Bernard Lebrun et Michel Lefebvre. Paris: Éditions de la Martinière, 2011, page 213.
  4. À titre indicatif, la Library of Congress utilise une autre technique basée sur les machine tags de Flickr pour maintenir un lien entre sa base de données et sa galerie sur The Commons.
  5. Voir aussi l’article Des nazillons sur Flickr ?

Viewing all articles
Browse latest Browse all 8