27 de mayo de 2014

Entrega de Resultados

Investigación
Semana 16

El 20 de Mayo del 2014 llevé a cabo la penúltima reunión con mi asesora de tesis donde se dio revisión a la redacción de tesis, al blog y al código en GitHub. También se dio una segunda revisión al póster elaborado para hacer las últimas correcciones antes de mandarse a imprimir y hacer una exposición del mismo en el CIIDIT.

Tareas realizadas

  • Se movieron de la raíz del repositorio los archivos que no son usados por ningún script y que solo funcionan como prueba para cierta implementación.
  • Se agregó información al README con el fin de que aquellos desarrolladores con alguna configuración diferente de RoR puedan ejecutar las instrucciones sin problemas.
  • Se añadió funcionalidad en el controlador del servidor para que cuente el tiempo desde el momento en que recibe la imagen, hasta cuando termina de procesar justo antes de enviar la información de regreso, con el fin de tomar estos datos en los resultados de desempeño computacional.
  • Se creó un archivo que guarda el resultado de similitud para las diferentes pruebas realizadas con una misma imagen.

Correcciones del póster

  • Se agregaron los logotipos de la UANL, FIME y el CIIDIT.
  • Se eliminaron textos con información tentativa.
  • Se agregó definición de OCR y se agregó un cuadro con el procedimiento.
  • Se cambiaron las imágenes en el cuadro de propuesta por unas más recientes.
  • Se extendió la explicación del prototipo.

Ejecución de pruebas computacionales

Con la funcionalidad agregada al controlador y al script de pruebas, ahora es posible concentrar información verdadera en archivos con información separada por comas que sirven para crear tablas de velocidad de procesamiento, tamaño de archivo analizado y porcentaje de similitud de texto, para aquellos textos de imágenes previamente transcritos.

Por ejemplo en el archivo de velocidad de procesamiento tenemos en la primer columna el tiempo que tardo para cierta imagen, y el peso en Kb de la misma imagen.
11.756,330,
24.762,404,
7.373,235,
Para la prueba de similitud de texto recuperado de cierta imagen (por el momento solo dos imágenes se tienen capturadas manualmente para hacer la comparación), se le hace pasar por distintos filtros antes de ser examinada para la obtención de texto, y cada uno de estos diferentes procesos arroja un valor de similitud que esta entre el 0 y 1, donde se puede entender como 1 cuando se recuperó el 100% del texto tal cual se ve en la imagen.
0.143660212367,0.0844761382337,0.0547762191049,0.0,
0.826848249027,0.764598540146,0.836935166994,0.442250740375,
Este tipo de prueba ya se había hecho anteriormente para seleccionar cual técnica daba mejor resultado, pero no se tenía un registro de pruebas que dieran validez al mismo. Con esto ya es posible demostrarlo cuantitativamente, y no solo por percepción humana.

Resultado entregado

De entre las opciones que se tenían para entregar como resultado en el trabajo de investigación, decidí la opción del póster, el cuál fue presentado en un evento académico en el CIIDIT.

Trabajo a futuro

  • Continuar con el trabajo de investigación.
  • Crear un módulo reutilizable para otros proyectos.

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.