Détection des fraudes et usages de faux dans le monde de la recherche

 

En 2010, Cyril Labbé, enseignant-chercheur à l'UJF / LIG, crée Ike Antkare, un faux chercheur rattaché à une université imaginaire et au nom duquel il a publié des dizaines d'articles inventés qui se citent les uns les autres. Le stratagème a permis à Ike Antkare de figurer parmi les dix premiers chercheurs en informatique les plus cités. Les logiciels de bibliométrie comme Scholarometer ou Publish or Perish n'ont rien détecté jusqu'à ce que Cyril Labbé ne révèle la farce et dénonce, par la même occasion, le manque de fiabilité de l'indice quantitatif de nombre de citations « h-index » utilisé pour l'évaluation des chercheurs.


Depuis, Cyril Labbé s'est attaqué à un autre type de manipulation des outils bibliométriques : les fausses publications. Ce spécialiste de la fouille de texte a en effet constaté que de fausses publications et articles étaient régulièrement publiés dans des bases de données réputées sérieuses. Il s'agissait alors pour lui de trouver une méthode pour détecter et supprimer automatiquement ces fausses études générées par le programme SCIgen. Le système de détection qu'il a mis au point calcule les fréquences de vocabulaire et repère les morceaux de phrase qui restent identiques dans une même publication. L'outil SCIgen a en effet tendance à se répéter et à introduire les mêmes séquences de mots dans les textes qu'il génère.


Les travaux de Cyril Labbé ont été cités dans la revue nature.com et permettent de dénoncer le dysfonctionnement du système de peer-review censé relire et valider les publications. On peut espérer qu'à l'avenir les outils développés par Cyril Labbé permettront de fournir une aide pour la détection des mauvaises pratiques (faux, duplications, plagiats, etc.) et contribueront à l'amélioration de la qualité de l'information scientifique.