Text_Statistics berechnet einen Index für die Lesbarkeit eines Textdokuments.
Dabei werden die Anzahl der Wörter, der Sätze und der Anzahl der Silben eines Textes gezählt. Diese Statistiken werden benutzt, um den Flesch-Punktzahl. für jeden Satz zu ermitteln. Die Zahl steht für die Lesbarkeit bzw. Verständlichkeit des Textes und liegt zwischen 0 und 100. Die Skala kann grob wie folgt unterteilt werden:
90 bis 100 |
5. Klasse |
80 bis 90 |
6. Klasse |
70 bis 80 |
7. Klasse |
60 bis 70 |
8./9. Klasse |
50 bis 60 |
10. - 12. Klasse |
30 bis 50 |
Universitätsniveau |
0 to 30 |
Akademischer Grad erforderlich |
Mehr Informationen können in einem WikiPedia-Artikel gefunden werden.
Hinweis des Übersetzers: Die genannten Klassenangabe beziehen sich auf das amerikanische Schulsystem. Die ermittelte Zahl ist für deutsche Texte mit Vorsicht zu geniessen, denn die Statistiken basieren auf den Regeln der englische Sprache und ihrer Grammatik.
Text_Statistics-Beispiel
<?php
require 'Text/Statistics.php';
$block = new Text_Statistics($sometext);
$block->flesch; // enthält die ermittelte Punktzahl
?>
In den Unit-Tests des Packages sind weitere Beispiele zu finden.
Text_Word berechnet die Anzahl der Silben eines Wortes, basierend auf der Anzahl der aufeinanderfolgenden Vokalgruppen in einem Wort und wendet verschiedene Muster für besondere Fälle an.
Beispiel für numSyllables()
<?php
require_once 'Text/Word.php'
$word = new Text_Word('word');
$word->numSyllables(); // liefert 1
?>