59 lines
1.9 KiB
PHP
59 lines
1.9 KiB
PHP
<?php
|
|
include_once "Trie.php";
|
|
|
|
|
|
const CASE_NOIRE = " ";
|
|
|
|
|
|
function dico($longueur_max) {
|
|
$transliterator = Transliterator::createFromRules(':: Any-Latin; :: Latin-ASCII; :: NFD; :: [:Nonspacing Mark:] Remove; :: Upper(); :: NFC;', Transliterator::FORWARD);
|
|
|
|
$dico = [[new Trie()]];
|
|
for ($longueur = 0; $longueur <= $longueur_max; $longueur++) {
|
|
$dico[] = new Trie();
|
|
}
|
|
if (($lecteur = fopen("dico.csv", "r")) !== FALSE) {
|
|
$entete = fgetcsv($lecteur, 0, "\t");
|
|
while (($ligne = fgetcsv($lecteur, 0, "\t")) !== FALSE) {
|
|
if (
|
|
$ligne[0] == NULL
|
|
|| substr($ligne[0], 0, 1) == "#"
|
|
|| strlen($ligne[0]) > $longueur_max
|
|
) continue;
|
|
|
|
$mot = $ligne[0];
|
|
$definitions = array_slice($ligne, 1);
|
|
|
|
$mot = str_replace("-", CASE_NOIRE, $mot);
|
|
$mot = $transliterator->transliterate($mot);
|
|
if (strpos($mot, CASE_NOIRE) !== false) {
|
|
$mots = explode(CASE_NOIRE, $mot);
|
|
$nb_mots = count($mots);
|
|
$mot = implode("", $mots);
|
|
foreach($definitions as $i => $definition) {
|
|
$definitions[$i] = "$definition#$nb_mots";
|
|
}
|
|
}
|
|
|
|
$dico[strlen($mot)][$mot] = $definitions;
|
|
}
|
|
fclose($lecteur);
|
|
}
|
|
|
|
return $dico;
|
|
}
|
|
|
|
function mots_espaces($longueur_max) {
|
|
$dico = dico($longueur_max);
|
|
for ($longueur = 1; $longueur <= $longueur_max; $longueur++) {
|
|
for ($position_espace = 1; $position_espace + 1 < $longueur; $position_espace++) {
|
|
$mots_suivants = $dico[$longueur - $position_espace - 1];
|
|
foreach ($dico[$position_espace]->arrayIterator() as $premier_mot => $definition) {
|
|
$premier_mot[] = CASE_NOIRE;
|
|
$dico[$longueur]->arraySet($premier_mot, $mots_suivants);
|
|
}
|
|
}
|
|
}
|
|
return $dico;
|
|
}
|