Saturday, September 1, 2007

Insolite : quelle taille occuperait une Wikipédia en version papier ?

– La question d'une version « hors internet » de l'encyclopédie libre en ligne Wikipédia est une question qui revient de plus en plus souvent dans la communauté de ses utilisateurs, avec par exemple l'existence des projets de type projet:Wikipédia1.0, dans plusieurs langues (actuellement en anglais, allemand et français).

Ces derniers visent à proposer des versions sur support DVD (donc de 4,7 Go), donc consultables hors ligne, en se basant sur une sélection d'articles.

Cependant, la question de l'équivalence « papier » reste toujours actuelle : il est en effet plus facile de visualiser les importances relatives de contenu (en quantité en tout cas). Un wikipédien, Nikola Smolenski, s'est attelé au problème. Il a postulé - sans tenir compte de la présence des images dans les articles - que les volumes contenant Wikipédia auraient le format suivant : 25 cm de hauteur, 5 cm d'épaisseur (environ 400 feuillets), chaque page ayant deux colonnes, chaque colonne faisant 80 lignes, chaque ligne comprenant 50 caractères, soit 6 Mo par volume.

Nikola Smolenski en déduit, qu'une fois retiré les informations non nécessaires à l'édition d'un livre - c'est-à-dire les historiques des articles, pages de discussion et autres espaces dit « méta » servant à la construction de l'encyclopédie - la version anglophone de l'encyclopédie tiendrait sur environ 750 volumes (4,4 Go de données en octobre 2006). Il convient quand même, fait encore remarquer Nikola Smolenski, de prendre en compte la qualité des articles, qui réduirait plus ou moins fortement la taille des données publiables, alors que l'insertion d'illustrations augmenterait cette taille mais dans une mesure moindre.

Cette dernière considération constitue une interrogation forte des projets de la fondation Wikimedia et des Wikipedia, quelle que soit la langue employée : doit-on privilégier le nombre d'articles (plus de 1,5 million d'articles en anglais, de 600 000 en allemand, de 550 000 en français) ou leur qualité (signalés par des labels spécifiques après vote de la communauté) ? L'extension quotidienne des projets et donc des besoins en mémoire (et donc des besoins en serveurs) requiert de plus en plus d'argent, et pourrait amener dans le futur à effectuer certains choix dans les sujets traités.

No comments: