Debería ser posible utilizar una biblioteca como Detección de idiomas para Java y átelo con su PL/SQL.
Probablemente será más eficiente usar SQL para hacer bayesiano ingenuo filtrado y utilizar perfiles lingüísticos derivados, p. de Wikipedia (están cuidadosamente empaquetados aquí ).
Estos son solo consejos, no una solución completa como se solicitó para la recompensa, pero deberían ayudar a los buscadores de recompensas.