samedi 22 mai 2010

Articles courts

Si vous vérifiez régulièrement les Nouvelles pages, vous avez peut-être remarqué qu'il y avait un peu moins d'articles bac à sable ces derniers temps.

C'est dû à un nouveau filtre qui détecte les articles de moins de 85 octets créés par des "nouveaux" et qui ne sont pas des redirections.

Par exemple, si une IP cherche à créer la page "Bydule" avec le texte "c un truc", elle aura un message lui indiquant gentiment qu'elle a certainement écrit un truc tout pourri et qu'elle ferait mieux de vérifier si le sujet n'est pas déjà traité ailleurs. Et comme on est gentil, on lui donne même un lien vers [[Special:Search/Bydule]]. Si notre IP est convaincue que sa création est correcte, il lui suffit de cliquer à nouveau sur "Publier" pour que sa "contribution" soit retenue, jusqu'à ce qu'un admin vienne la supprimer.

Ces créations demandent finalement pas mal de boulot aux admins, la première semaine, lorsque le filtre ne donnait pas encore d'avertissement, il a détecté 930 créations de moins de 100 octets, soit un peu plus de 130 par jour. Sur ces 930 créations, il y a une trentaine de pages qui existent encore (3,2%), la plupart sont des redirections. On a donc une bonne centaine de créations par jour qui sont bonnes à jeter, sans même avoir à réfléchir aux critères d'admissibilité.

Finalement, les utilisateurs n'ont pas "peur" des avertissements donnés par le filtre et n'hésitent pas à valider leur modification. Ainsi, on a un taux d'abandon de 48% sur ce filtre. J'espérais plus, mais ça fait quand même environ 20000 suppressions de moins par an si les chiffres restent stables.
Prochaine étape : interdire la création des articles vraiment aberrants. J'ai fait un filtre qui détecte les articles très courts (moins de 20 octets), et ils ont tous été supprimés pour l'instant. Maintenant, il va falloir convaincre la communauté d'interdire la création d'articles très courts aux IP (et aux comptes de moins de 3 edits par exemple)... J'ai de la chance, "Une '''pomme''' est un [[fruit]].", ça fait 33 octets.


Pour les autres filtres en préparation, je pense bientôt rajouter un avertissement au détecteur de décès non sourcés. Je réfléchis aussi à un filtre d'aide à la création d'article, en invitant par exemple le contributeur à rajouter des catégories s'il a oublié.

1 commentaire:

darkoneko a dit…

J'suis content de lire un avantage pratique et chiffrable de l'abuseFilter. Esperons que ça convainque des sceptiques :)

(mais comme beaucoup de choses, l'Abusefilter sera une très bonne chose sauf quand il deviendra trop restrictif - faudra faire attention)