13-04-2011, 02:25 AM
Bonjour à tous,
Je vous présente la toute première version de Phonem :p. Comme son nom l'indique, l'objectif de Phonem est de rationnaliser une chaine de caractères pour parvenir à une expression phonétique simplifiée.
C'est un héritier de Soundex & co, sauf que je voulais qu'il soit facilement lisible par un être humain. Je pensais au début faire uniquement de l'optimisation de la classe du Phonetic d'Edouard Bergé et puis je suis reparti de zéro, en prenant deux documents pour référence : prononciation française et les exceptions de la langue française.
Je suis actuellement en pleine phase de nettoyage de la fonction et je termine d'implémenter les exceptions (y en a ... beaucoup; vive la langue française). Je refilerai le code dès qu'il sera tout beau tout propre.
Mais voilà déjà les premiers résultats :
Comme vous pouvez le voir, y a encore quelques erreurs par ci, par là. En attendant, ce procédé peut être utile pour ceux qui cherchent de la souplesse dans leur méthode de recherche : ça permet de proposer à l'utilisateur d'autres termes ayant le même phonème par exemple si la recherche s'avère infructueuse. Je compte implémenter un détecteur (et non un censeur) de grossièretés sur mon forum grâce à Phonem. Il gère aussi les l33t sp34k, les multiples caractères, ce qui permet une meilleure captation des mots recherchés.
Je refile le code demain soir en rentrant, le temps de le nettoyer pour qu'il soit présentable
Holy
Je vous présente la toute première version de Phonem :p. Comme son nom l'indique, l'objectif de Phonem est de rationnaliser une chaine de caractères pour parvenir à une expression phonétique simplifiée.
C'est un héritier de Soundex & co, sauf que je voulais qu'il soit facilement lisible par un être humain. Je pensais au début faire uniquement de l'optimisation de la classe du Phonetic d'Edouard Bergé et puis je suis reparti de zéro, en prenant deux documents pour référence : prononciation française et les exceptions de la langue française.
Je suis actuellement en pleine phase de nettoyage de la fonction et je termine d'implémenter les exceptions (y en a ... beaucoup; vive la langue française). Je refilerai le code dès qu'il sera tout beau tout propre.
Mais voilà déjà les premiers résultats :
Code :
(920) acoquinâmes : akokiname
(921) acoquinassiez : akokinasié
(922) acoquinassions : akokinasion
(923) acoquinâtes : akokinate
(924) acoquinée : akokine
(925) acoquinement : akokineman
(926) acoquiner : akcokiné
(927) acoquinerez : akokineré
(928) acoquineriez : akokinerié
(929) acoquinerions : akokinerion
(930) acoquinerons : akokineron
(931) acoquinez : akokiné
(932) acoquiniez : akokinié
(933) acoquinions : akokinion
(934) acoquinons : akokinon
(935) acore : akor
(936) acotylédone : akotiledon
(937) acoumètre : akoumètr
(938) acoumétrie : akoumètri
(939) acouphène : akoufen
(940) acousticienne : akoustisiann
(941) acoustique : akoustik
(942) acquérais : akèrè
(943) acquéresse : akerès
(944) acquéreur : akereu
(945) acquérir : akerir
(946) acquerrai : akèré
(947) acquêt : akè
(948) acquiers : akièr
(949) acquiesçai : akièské
(950) acquiesçais : akièskè
(951) acquiescé : akièsk
(952) acquiescement : akièseman
(953) acquiescer : akièské
(954) acquiescerai : akièskèré
(955) acquis : aki
(956) acquise : akis
(957) acquisition : akizition
(958) acquisitive : akizitiv
(959) acquit : aki
(960) acquittable : akitabl
(961) acquittai : akité
(962) acquittais : akitè
(963) acromégalie : akromegali
(964) acromion : akromion
(965) acronyme : akronim
(966) acrophobie : akrofobi
(967) acropole : akropol
(968) acrostiche : akrostich
(969) acrotère : akroter
(970) acrylique : akrilik
Comme vous pouvez le voir, y a encore quelques erreurs par ci, par là. En attendant, ce procédé peut être utile pour ceux qui cherchent de la souplesse dans leur méthode de recherche : ça permet de proposer à l'utilisateur d'autres termes ayant le même phonème par exemple si la recherche s'avère infructueuse. Je compte implémenter un détecteur (et non un censeur) de grossièretés sur mon forum grâce à Phonem. Il gère aussi les l33t sp34k, les multiples caractères, ce qui permet une meilleure captation des mots recherchés.
Je refile le code demain soir en rentrant, le temps de le nettoyer pour qu'il soit présentable
Holy