Recuperación de Imágenes

Debido a la gran sobrecarga de información a la que nos vemos sometidos día a día, la recuperación de información ha sido un área de conocimiento con una gran carga de trabajo en los últimos 20/30 años. Actualmente la recuperación de información textual podría considerarse como algo superado (aunque permite notables mejoras), pero la recuperación de información multimedia es un apasionante campo dónde queda todavía mucho recorrido.
A este respecto, hoy he leído dos interesantes posts sobre recuperación de imágenes. En el blog de José María Gómez aparece una entrada sobre imgSeek, un software OpenSource que permite buscar imágenes similares a un patrón dibujado por el usuario o bien una fotografía dada por él mismo. Por otra parte, en GenBeta veo una entrada sobre Panimage, un buscador de fotografías multilíngüe.

Estos post resultan muy interesantes porque muestran tendencias a seguir. Por una parte la recuperación de imágenes en la actualidad se apoya en contenido adicional, pseudo-semántica (las etiquetas de flickr) y metadatos, lo cuál está bien para un primer acercamiento pero lo deseable sería no necesitar de este contenido adicional para poder hacer la búsqueda. Softwrae como el de Retrievr o SIMPLIcity muestra capacidades de hacer búsquedas como imgSeek, es decir, buscando similiaridades entre imágenes. Pero aunque sea interesante y atractivo, no creo que sea una funcionalidad realmente útil para la gran mayoría de los usuarios acostumbrados a utilizar el lenguaje natural en sus consultas y búsquedas. Sin embargo, otros servicios como ALIPR (del MIT) muestran algo que me parece mucho más interesante, el etiquetado automático de fotografías, lo cuál combinado con una buena ontología (o una serie de ontologías) puede ser realmente útil al aportar de forma automática semántica a las imágenes permitiendo un nuevo mundo de recuperación multimedia.

Por el otro lado está la búsqueda translingüe. Panimage me parece un acercamiento interesante pero demasiado simple. Traducir las palabras para luego hacer una búsqueda con la palabra traducida es algo a la mano de cualquiera. Otro tema es ser capaz, automáticamente, de recuperar fotos que hagan referencia a un mismo concepto pero que estén etiquetadas en distintos lenguajes e integrar toda esta información en un único interfaz. Desde luego, con el apoyo de etiquetadores semánticos automáticos se tendría una ayuda estupenda ya que haciendo uso de recursos léxico-semánticos como EuroWordNet se podrían obtener todos los conceptos en todos los idiomas disponibles asociados a una consulta de un usuario para recuperar todas las fotografías o imágenes etiquetadas con esos conceptos. Quedaría el último paso de la integración en un interfaz y dar relevancia a cada una de las imágenes para ordenarlas por este criterio, pero eso sería una segunda fase menos traumática.

Actualmente ya hay mucha gente trabajando en estos temas, como la gente de RIEMANN (Research on IntElligent Media ANNotation) o la gente de System One, pero parece que todavía no se ha llegado a obtener resultados tan buenos y escalables como para llevarlos a un entorno comercial. Desde luego, a día de hoy existen técnicas más que de sobra y recursos suficientes para enfrentarse a este problema de forma efectiva pero el problema se encuentra en la eficiencia, ¿cómo hacer un buen sistema que sea capaz de procesar los miles de millones de imágenes que se encuentrar en internet y responda a miles de consultas por segundo?