2084 liens privés
Ça commence. Cette lib contient des informations linguistiques sur la fréquence des mots dans une langue. Un peu comme les tables de fréquence des lettres (qui disent que la lettre « E » est la plus courante en français, suivies de A, I, S, N, R…), mais pour les mots.
Cette lib cessera d’être mise à jour avec de nouvelles sources de textes utilisées pour calculer ça.
La cause : de plus en plus de textes sont générées par des IA, dont le contenu n’est pas celui des humains, et donc faussent les résultats.
D’autres causes de l’arrêt du support sont la fermeture des plateformes qui servaient de sources de mots (Twitter, Reddit…) et le bordel ambiant autour de l’IA générative qui dégoûte l’auteur…
~
On en est donc à un point où non seulement on doit faire attention aux IA sur le fond (le contenu peut-être crédible, mais inventé) mais aussi la forme sur le plan technique (le contenu utilise des mots autrement qu’un humain).
Le truc c’est que ces textes légèrement absurdes finissent par retourner dans les moteurs d’IA, qui se servent des données pour en produire d’autre. J’imagine que faire ça suffisamment de fois en boucle produira du charabia, autrement du bruit. Juste du bruit blanc de fond.