forked from neo/neo-layout
Gemeinsame README für die Korpusse angelegt.
This commit is contained in:
parent
ddcc485386
commit
ada143f602
|
@ -1,4 +1,5 @@
|
||||||
Diese Dateien basieren auf der von der Uni Leipzig erstellten Liste der 10000
|
== häufigste*.txt ==
|
||||||
|
Die Dateien basieren auf der von der Uni Leipzig erstellten Liste der 10000
|
||||||
häufigsten Wörter (bzw. Wortformen) der deutschen Sprache¹.
|
häufigsten Wörter (bzw. Wortformen) der deutschen Sprache¹.
|
||||||
Groß- und Kleinschreibung sowie Sonderzeichen (Bindestriche, Leerzeichen,
|
Groß- und Kleinschreibung sowie Sonderzeichen (Bindestriche, Leerzeichen,
|
||||||
Apostrophe, Buchstaben mit Akzenten, Zahlen, …) wurden ignoriert.
|
Apostrophe, Buchstaben mit Akzenten, Zahlen, …) wurden ignoriert.
|
||||||
|
|
|
@ -0,0 +1,10 @@
|
||||||
|
== Korpusse ==
|
||||||
|
Die Dateien in diesem Verzeichnis wurden als statistische Basis für die
|
||||||
|
computergestützte Optimierung von Tasturlayouts erstellt, derzeitig gibt es
|
||||||
|
• den Leipziger Korpus (in /leipzig),
|
||||||
|
• und eine Überarbeitung davon (in /Leipzig-Karl)
|
||||||
|
|
||||||
|
=== Programm zur Auswertung ==
|
||||||
|
Um aus einem Korpus unter GNU/Linux N-Gramme zu generieren, siehe:
|
||||||
|
• http://permalink.gmane.org/gmane.comp.hardware.keyboards.layout.neo/4602
|
||||||
|
• http://lists.neo-layout.org/pipermail/diskussion/2009-December/015238.html
|
Loading…
Reference in New Issue