Gemeinsame README für die Korpusse angelegt.

This commit is contained in:
dennis 2010-05-06 17:50:21 +00:00
부모 ddcc485386
커밋 ada143f602
2개의 변경된 파일12개의 추가작업 그리고 1개의 파일을 삭제

파일 보기

@ -1,4 +1,5 @@
Diese Dateien basieren auf der von der Uni Leipzig erstellten Liste der 10000
== häufigste*.txt ==
Die Dateien basieren auf der von der Uni Leipzig erstellten Liste der 10000
häufigsten Wörter (bzw. Wortformen) der deutschen Sprache¹.
Groß- und Kleinschreibung sowie Sonderzeichen (Bindestriche, Leerzeichen,
Apostrophe, Buchstaben mit Akzenten, Zahlen, …) wurden ignoriert.

10
statistik/README.txt Normal file
파일 보기

@ -0,0 +1,10 @@
== Korpusse ==
Die Dateien in diesem Verzeichnis wurden als statistische Basis für die
computergestützte Optimierung von Tasturlayouts erstellt, derzeitig gibt es
• den Leipziger Korpus (in /leipzig),
• und eine Überarbeitung davon (in /Leipzig-Karl)
=== Programm zur Auswertung ==
Um aus einem Korpus unter GNU/Linux N-Gramme zu generieren, siehe:
• http://permalink.gmane.org/gmane.comp.hardware.keyboards.layout.neo/4602
• http://lists.neo-layout.org/pipermail/diskussion/2009-December/015238.html