lunes
mar292004
Phonetix, algoritmos fonéticos en Java
lunes, marzo 29, 2004 at 10:20AM
Phonetix es una pequeña librería de utilidad para el uso de algoritmos fonéticos en programas Java.
¿ Y para qué quiero esto ?, os preguntaréis muchos. Bien, esta librería lo que hace es recoger palabras en diferentes lenguajes y generar claves en base a sus fonemas. De este modo, palabras que resulten similares, por ejemplo a palabras similares buscar/busco/busca/buscón, les correspondería la misma clave. Esto es realmente útil a la hora de indexar textos, de modo que cuando un usuario busca las ocurrencias de buscar, le aparezcan también ocurrencias de palabras parecidas.
La librería implementa tres algoritmos fonéticos diferentes. Se trata de una librería Open Source con licencia LGPL. Podéis ver un ejemplo aquí, y aquí está su FAQ. Su funcionamiento se basa en Apache Lucene.
¿ Y para qué quiero esto ?, os preguntaréis muchos. Bien, esta librería lo que hace es recoger palabras en diferentes lenguajes y generar claves en base a sus fonemas. De este modo, palabras que resulten similares, por ejemplo a palabras similares buscar/busco/busca/buscón, les correspondería la misma clave. Esto es realmente útil a la hora de indexar textos, de modo que cuando un usuario busca las ocurrencias de buscar, le aparezcan también ocurrencias de palabras parecidas.
La librería implementa tres algoritmos fonéticos diferentes. Se trata de una librería Open Source con licencia LGPL. Podéis ver un ejemplo aquí, y aquí está su FAQ. Su funcionamiento se basa en Apache Lucene.
in
j2se
j2se 
Reader Comments