lundi 4 octobre 2010

Sondage

Il y a quelques temps, je lisais des articles sur les sondages biaisés de l'IFOP (voir ici ou par exemple).
Je viens d'en trouver un bien mieux sur Wikipédia. Je ne m'attarde pas trop sur la question de l'échantillon : il s'agit de toutes façons plus d'un vote que d'un sondage et ça serait difficile d'envisager un véritable échantillonnage. Pour avoir des résultats plus significatifs, on aurait tout de même pu essayer de donner un peu plus de visibilité au vote, par une annonce sur le Bistro par exemple. Mais on se contentera d'une annonce sur la page "Accueil de la communauté" (pas visible directement, il faut descendre pour voir la liste des sondages) et dans le Wikimag.

Le plus intéressant est la question, qui contient la réponse. Et pour ceux qui n'auraient pas compris qu'il faut laisser le message en sitenotice le plus longtemps possible, on donne même un indice dans les propositions de réponse1. Le résultat est tout de même surprenant.

L'argument pour la durée d'un mois est drôle également : c'est la durée minimale pour mesurer l'efficacité du message. Je pense que celui qui a dit ça s'est basé sur l'existence de stats mensuelles. Malheureusement, le Miyon n'a pas attendu le 1er octobre, et les 30 jours d'affichage vont être à cheval sur septembre et octobre. Des données quotidiennes doivent être dispos (encore faut-il les traiter) et des mesures sur un nombre exact de semaines serait plus logique. Mais le plus gros problème est qu'on ne sait même pas quelles données on veut analyser ni comment le faire. Le nombre de créations d'articles risque par exemple d'être faussé par ceux qui avaient créé un stock d'ébauches en vue du Miyon (et qui vont par exemple continuer leurs séries d'articles sur des divisions géographiques exotiques). Les données sur WP sont généralement soumises à de nombreux paramètres qu'on ne peut pas mesurer (par exemple la météo et tout ce qui peut occuper les gens par ailleurs, les buzz récents sur Bruel et Houellebecq, le message pour les journées du patrimoine, etc.), on ne pourra donc au mieux dire que lorsque le message a été affiché, le nombre de création d'articles/de comptes/de modification a connu telle évolution, sans conclure sur une relation de cause à effet.

Après tout, utiliser un sondage biaisé pour obtenir des données inexploitables n'est pas si étrange que ça.

1 Pour ceux qui ne comprendraient toujours pas, il faut envoyer 5 au 8 200 200 pour gagner son poids en articles WP.

1 commentaire:

Arkanosis a dit…

La correspondance suggestion ↔ résultat est en effet très intéressante (d'autant plus de mon point de vue que je me suis exprimé dans ce sens [1]).
Dommage qu'il n'y ait pas de groupe témoin pour vérifier qu'il y a bien un lien de cause a effet... on manque vraiment de méthodologie ;-)

[1] En fait, c'est plus compliqué que ça ; il était question du logo « spécial » aussi