Eddi ist ein "Eddingtonscher Affe", der Begriff stammt aus einer ältlichen "Computer-Kurzweil"-Kolumne im Spektrum der Wissenschaft. Er bezieht sich auf Herrn Eddington, der den Satz von den vielen Affen, die auf ebenso vielen Schreibmaschinen herumhacken, und die Frage, ob sie irgendwann mal Shakespeare zusammenkriegen oder nicht, geprägt haben soll.
Eddi ist Freeware, Download Programm und Delphi 4-Sourcen (877K)
Eddi zerkaut und verdaut beliebige ASCII-Texte, denkt etwas darüber nach, und gibt sie in erratischen Brocken wieder von sich, die je nach Einstellung des Programms mehr oder weniger Ähnlichkeit mit dem Original haben. Manches von Eddis Ergüssen sieht sehr danach aus, als würde es der Eingabe versteckte Botschaften entlocken, die dort immer schon enthalten, aber von vordergründigem Sinn verdeckt waren. Etwa wenn es die Bayernhymne mit repetitiven "und blau!"-Ausrufen verziert. Prost.
Die Funktion von Eddi teilt sich in eine Analyse- und eine Synthese-Phase. In der konkreten Implementation ist dem noch eine Eingabephase vorgeschaltet:
Hier geben Sie einen Text ein, den Eddi analysieren soll. Der Text kann aus der Zwischenablage oder einer Datei eingefügt werden.
Hier werden die Optionen für die Analyse und Synthese eingestellt.
Die Checkboxen dienen der Auswahl des unterstützten Zeichenvorrats, nicht unterstützte Zeichen in der Eingabe werden einfach überlesen. Markieren Sie "Whitespace", wenn Sie auch die Struktur des Textes - etwa bei Gedichten wiedergeben wollen.
Das Eingabefeld Synthese gibt an, in welchen Portionen Text wieder herausgewürgt werden soll.
Die interessanteste Größe ist die Substring-Länge. Zu seinem Verständnis ist eine Kurzbeschreibung der Funktionsweise von Eddi angebracht:
Eddi analysiert den Eingabetext in Portionen dieser Substring-Länge. Zu jedem verschiedenen Substring dieser Länge, der in der Eingabe vorkommt werden alle Folgezeichen ausgezählt und in einer Baumstruktur abgelegt. Bei der Synthese wird nun mit einem Substring dieser Länge begonnen. Aus den in der Eingabe vorhandenen Folgezeichen wird zufällig eines mit der Wahrscheinlichkeit gewählt, die seiner Häufigkeit in der Eingabe entspricht.
Lange Substrings produzieren ähnlichere Ergebnisse, kürzere Substrings lassen Eddi mehr Freiheiten. Ausprobieren! Mehr Beispiele und nähere Beschreibung des Verfahrens findet sich in besagtem Spektrum-Artikel.
Hier wird das Analyseergebnis als Baum ausgegeben.
Im Screenshot kann man sehen, daß an 12 Stellen 'an' 11 Mal als 'and', und einmal als 'ano' weitergeführt wird. 'ano' führt unwiderruflich zu 'anot'. Weiter oben kann man erkennen, daß dort, wo ein 'w' auf ein Leerzeichen folgt, immer ein 'was' daraus werden muss.
Aus diesem Ergebnis kann man leicht ableiten, daß längere Eingabetexte zu mehr Möglichkeiten bei der Synthese führen.
Auf dieser Seite steht das Analyseergebnis. Sie können mehr Text synthetisieren, das Ergebnis speichern, in die Zwischenablage kopieren, oder löschen.
Eddi ist Freeware, Download Programm und Delphi 4-Sourcen (877K)
Kommentare sind wie immer erwünscht. Viel Spaß!
E-Mail: marian@marian-aldenhoevel.de