Why wordfreq will not be updated · rspeer/wordfreq · GitHub - Le Hollandais Volant

Supprimer Rendre public Rendre privé Add tags Delete tags

4447 shaares
2365 liens privés

4447 shaares · 2365 liens privés

Filtres

Liens par page

20 50 100

Why wordfreq will not be updated · rspeer/wordfreq · GitHub - Le Hollandais Volant

Ça commence. Cette lib contient des informations linguistiques sur la fréquence des mots dans une langue. Un peu comme les tables de fréquence des lettres (qui disent que la lettre « E » est la plus courante en français, suivies de A, I, S, N, R…), mais pour les mots.

Cette lib cessera d’être mise à jour avec de nouvelles sources de textes utilisées pour calculer ça.
La cause : de plus en plus de textes sont générées par des IA, dont le contenu n’est pas celui des humains, et donc faussent les résultats.

D’autres causes de l’arrêt du support sont la fermeture des plateformes qui servaient de sources de mots (Twitter, Reddit…) et le bordel ambiant autour de l’IA générative qui dégoûte l’auteur…

On en est donc à un point où non seulement on doit faire attention aux IA sur le fond (le contenu peut-être crédible, mais inventé) mais aussi la forme sur le plan technique (le contenu utilise des mots autrement qu’un humain).
Le truc c’est que ces textes légèrement absurdes finissent par retourner dans les moteurs d’IA, qui se servent des données pour en produire d’autre. J’imagine que faire ça suffisamment de fois en boucle produira du charabia, autrement du bruit. Juste du bruit blanc de fond.

article_blog · réflexions · intelligence_artificielle · #2024

September 21, 2024 at 15:24:57 GMT+2 * · permalien

https://lehollandaisvolant.net/?id=20240918191700

Filtres

Liens par page

20 50 100