aphorismes générés par ordinateur

par loulou, jeudi 06 avril 2017, 18:50 (il y a 2595 jours) @ Rémy

La diversité des productions obtenues par chaînes de markov (utilisées ici) dépend surtout de la taille du corpus à analyser : un vocabulaire limité avec suffisamment d'occurrences multiplie les combinaisons pour peu que la profondeur d'analyse reste faible, ce qui est necessaire avec les petits corpus. Pour comparer l'inventivité de deux corpus il faudrait en standardiser les tailles. Après il y a des outils pour mesurer directement la richesse lexicale d'un texte (par exemple dans le package nltk - natural langage toolkit - pour python). Moi par exemple je sais bien que j'écris toujours avec les mêmes mots. Je ferai peut-être des petites analyses comparatives entre plusieurs auteurs. De manière générale, il y a beaucoup de possibilités, c'est très fun.

Fil complet: