aphorismes générés par ordinateur

par loulou, lundi 03 avril 2017, 01:10 (il y a 2793 jours)

aphorismes générés par ordinateur à partir d'un corpus constitué de mes textes et de quelques textes de maurice blanchot





Exister est une habitude de la chair.

La pensée aussi a son chez lui.

La nuit s'ouvre une deuxième fois vers 3, 4 ou 5 heures, lorsqu'on finit par se sentir vieillir. Le passé se raidit comme un geste d’excuse.

Moi-même, je sais qu'aucun individu sérieux ne prendra la peine d'être mémorisé.

Les gens s'ouvrent toujours au même endroit : ils disent, c'est ma vie, je me suis détournée d’elle et je l'ai oubliée.

tes yeux ont un usage général, ils sont sourds, étouffants, bourdonnants. Tout est flou en eux, et pourtant nous savons qu’ils varient imperceptiblement pour répondre à la variation insensible du ciel.

Il y a des jambes sur mon vocabulaire, par quoi elles s’ennoblissent.

Tout nous est commun, sauf le ciel. La nuit qui tombe, épaule dégrafée comme la lune doit éclairer les amants la première fois qu'on en prend l'habitude.

Il faut un profond oubli : le langage refuse d'être tué.

Il y a plusieurs façons d'être triste parce qu'il n'y a qu'une seule façon de reconnaître tout ce que ne dément pas l'absence d'activités alentour.

Le quotidien est humain. On disperse les pensées qui courent comme une eau trop agile.

S'il faut chercher le soleil j'aurais fini par n'en plus croire la lumière, la nuit elle-même continue de dire bonjour à la mort, va-t’en.

Le but de la nature c'est que l'enfant soit dans la rue.

L'absence de pensée est un kaléidoscope.

Ce qui peut arriver après l’action ne fait pas plus banal.

Le ciel est plein d'une lumière jaune et cassante dont le but est la seule page imprimée du roman pas écrit.

Le texte, posté. la journée qui s'en va me déchire le coeur. j'aurais voulu pouvoir changer de soleil. Ce n’est pas remarquable pour moi.

aphorismes générés par ordinateur

par loulou, lundi 03 avril 2017, 01:11 (il y a 2793 jours) @ loulou

aphorismes générés par ordinateur

par sobac @, lundi 03 avril 2017, 10:50 (il y a 2792 jours) @ loulou

la facilité serait de comprendre, pourquoi il n'y a rien à comprendre

l'instant magique n'a rien à voir avec la magie

la fin en soi nourrit pas son homme

traduire en justice, est une façon d'apprendre les langues

sauter un repas, oui, mais sans élan

le mercredi des sandres dans la rivière

les meurtres sont petits entre amis

lard pour lard n'est pas l'art

aphorismes générés par ordinateur

par 411, lundi 03 avril 2017, 11:57 (il y a 2792 jours) @ loulou

Génial ! Franchement ! Mais comment ça marche au juste?

aphorismes générés par ordinateur

par Périscope @, lundi 03 avril 2017, 16:45 (il y a 2792 jours) @ 411

Tout peut vouloir dire quelque chose et son contraire.


Si l'aphorisme est une vérité subjective et vécue, c'est ce qui en fait son prix,
quel est l'intérêt de l'ordinateur, qui par ses algorithmes te ficelle une formule
dont on peut être béat aujourd'hui parce c'est la machine qui produit ça,

il y a du jeu, c'est tout.

le combat entre l'homme et la machine (dont il est le bricoleur) se poursuit.

question !

aphorismes générés par ordinateur

par Claire, lundi 03 avril 2017, 17:29 (il y a 2792 jours) @ Périscope

Oui, je suis d'accord. Ce qui serait intéressant, Louis, ce serait que tu reprennes tout cela pour modeler avec ta pensée à nouveau ce matériau hasardeux.

aphorismes générés par ordinateur

par Rémy @, lundi 03 avril 2017, 23:12 (il y a 2792 jours) @ 411

Tu donnes d'abord un long texte au programme. Il le découpe en mots, et il note pour chaque mot quels autres mots peuvent le suivre et avec quelle fréquence ils le font. Les points et les virgules comptent pour un mot. Dans un deuxième temps, le programme tire au hasard un des mots qui étaient au début d'une phrase (c'est-à-dire au début d'un des textes analysés ou après un point). De là il tire au hasard un des mots qui suivaient ce premier, puis un des mots qui suivaient le second, et ainsi de suite jusqu'à tomber sur un point. Ça fait un de ces aphorismes. À chaque tirage il respecte les probabilités de rencontrer chaque mot suivant.

En fait ça va même plus loin que ça : il ne note pas les suivants possibles pour chaque mot mais pour chaque groupe de deux mots. Pour composer ensuite, il tire au hasard une des phrases du document d'origine et en garde les deux premiers mots, ensuite à partir de ces deux-là il en tire un troisième au hasard en respectant les probabilités, puis à partir du deuxième et du troisième il tire le quatrième, et ainsi de suite jusqu'à trouver un point.

On peut aussi lui faire analyser par groupe de trois mots, de quatre mots ouc., ça s'appelle la "profondeur" d'analyse.

On peut aussi faire ça avec les lettres au lieu des mots, ça donne des trucs rigolos, comme du grommelot. Voici un résultat markovien de profondeur 3 lettres appliqué aux poèmes de Rimbaud :


Sile jour de je la tété
Aux et doigts gristingt glacrymal rêveux. L'hives
Pouait le avementeur lents, flot dans candolet de tout sur pers ma glacieux dûs,
Ce santement les, - Hop pleil, Muses six de grouses Maels viction divague, à Jésus vos tohu-bohu-bohu-bohus de l'este bais, couliés, le puis
L'Homme
A l'ans l'orgenouilles pieds de la vigueur
De rayons ans chemière soupide la flacees,
Haut, cils êcressants soussis, les yeux, cout
Entrembleu roupeau,

aphorismes générés par ordinateur

par loulou, mardi 04 avril 2017, 10:03 (il y a 2791 jours) @ Rémy

Voilà, Rémy l'a très bien expliqué

aphorismes générés par ordinateur

par 411, mercredi 05 avril 2017, 09:09 (il y a 2790 jours) @ Rémy

Yes. Merci. Ben moi je trouve ça très intéressant.

aphorismes générés par ordinateur

par loulou, mercredi 05 avril 2017, 20:15 (il y a 2790 jours) @ 411

Il faudrait être idiot pour éclipser l'intérêt de la méthode derrière la qualité littéraire du résultat, qui est évidemment secondaire.

aphorismes générés par ordinateur

par Rémy @, jeudi 06 avril 2017, 17:35 (il y a 2789 jours) @ 411

On tire de la phase d'analyse une manière de mesurer l'inventivité : si un auteur utilise des formules toutes faites, le vocabulaire est restreint et il n'y a que très peu de possibilités de bifurcation lors des tirages (beaucoup de mots ou de groupes de deux mots n'ont qu'un seul suivant), ; un auteur inventif, au contraire, fournira plein d'enchaînements variés et inattendus.

Après, lors de la phase générative, les aphorismes qui sortent de l'auteur à poncifs reprennent à l'identique des morceaux de phrases assez longs, alors que ceux issus de l'auteur inventif, tout en ressemblant à ses phrases, ne les copient pas.

aphorismes générés par ordinateur

par loulou, jeudi 06 avril 2017, 18:50 (il y a 2789 jours) @ Rémy

La diversité des productions obtenues par chaînes de markov (utilisées ici) dépend surtout de la taille du corpus à analyser : un vocabulaire limité avec suffisamment d'occurrences multiplie les combinaisons pour peu que la profondeur d'analyse reste faible, ce qui est necessaire avec les petits corpus. Pour comparer l'inventivité de deux corpus il faudrait en standardiser les tailles. Après il y a des outils pour mesurer directement la richesse lexicale d'un texte (par exemple dans le package nltk - natural langage toolkit - pour python). Moi par exemple je sais bien que j'écris toujours avec les mêmes mots. Je ferai peut-être des petites analyses comparatives entre plusieurs auteurs. De manière générale, il y a beaucoup de possibilités, c'est très fun.

aphorismes générés par ordinateur

par Rémy @, vendredi 07 avril 2017, 00:12 (il y a 2789 jours) @ loulou

Oui - là la question n'est pas tellement le nombre de mots différents, c'est le nombre de suites différentes pour chaque mot. En principe, ça ne détectera pas si tu utilises toujours les mêmes mots, mais si tu les enchaînes toujours de la même façon.
Dans du langage qui essaie de faire sens, ce facteur-là ne varie pas proportionnellement à la taille du corpus, et il suffit de relativement peu de matériau pour différencier les auteurs inventifs de ceux à tendance ponciviale.

(En théorie, taille du corpus analysé, nombre de mots différents et nombre d'enchaînements différents pour chaque mot ont des interférences statistiques plutôt surprenantes - si le corpus est tellement petit et le vocabulaire tellement varié qu'on ne rencontre la plupart des mots qu'une seule fois, évidemment il ne peut pas y avoir plusieurs enchaînements différents pour chaque mot... Une normalisation raisonnable de la taille du corpus consisterait à mettre en place un traitement spécial des hapax et à signaler comme non pertinent un corpus qui en contiendrait une trop grande proportion. En pratique, on est des humains, et quelqu'un qui utilise peu de mots différents utilisera aussi peu d'expressions différentes / d'enchaînements différents des mots ; on n'obtient des statistiques "linéaires" ou "correctes", qui ne séparent pas les sources en deux groupes mais forment un continuum, qu'en fabriquant des corpus artificiels, par exemple en regroupant plusieurs auteurs.)


C'est ennuyeux, quand même, d'utiliser toujours les mêmes mots... Que fais-tu pour combattre ça ?

aphorismes générés par ordinateur

par loulou, samedi 08 avril 2017, 00:17 (il y a 2788 jours) @ Rémy

Oui, tu as raison. Sinon une manière marrante de mettre en évidence les manies d'un auteur serait d'entrainer un réseau de neurones (apprentissages supervisé) sur un corpus de ses textes, ce qui donnerait une sorte de pasticheur automatique après un entraînement suffisant. Je m'y mettrai à l'occasion.

aphorismes générés par ordinateur

par zeio, lundi 03 avril 2017, 23:39 (il y a 2792 jours) @ loulou

En tout cas ça m'a bien fait rire.

aphorismes générés par ordinateur

par robot, mardi 04 avril 2017, 21:57 (il y a 2791 jours) @ loulou

Pas mal du tout, mais le premier suffit.