4 de marzo de 2014

Implementación de la Solución Propuesta

Investigación
Semana 7

El 28 de Febrero del 2014 llevé a cabo la séptima reunión con mi asesora de tesis donde se dio revisión a mi trabajo con el avance que tenía en cuanto a redacción y código, al igual que en las semanas anteriores realicé correcciones en la redacción, agregué e hice cambios en el documento de tesis, y se me explicó lo que vendría a continuación para esta semana.

Tareas realizadas

De forma general las tareas realizadas fueron las que se listan a continuación:
  • Corrección de errores.
  • Se volvió a cambiar el diseño de la matriz de características para que las columnas fueran menos anchas.
  • Agregar más contenido a algunos párrafos.
  • Modificar la autobiografía para que este redactada en primera persona.
  • Corregir plurales y singulares al citar autores.
  • Avance de código en el pre-procesamiento de la imagen.
  • Recortar la zona donde se detectaron líneas continuas que pudieran ser líneas de texto.

Para lograr rotar las cabeceras de la matriz de características se consultó la siguiente página: How to make table with rotated table headers in LaTeX.

Para lograr centrar en la página los ejemplos para XML y JSON se consultó la siguiente página: How to center verbatim.

Redacción de la tesis

Para esta semana se nos pidió acomodar bien el contenido de la metodología y avanzar en lo posible en el capítulo de solución propuesta.

De forma general mi asesora nos explicó a mi y mis compañeros que la parte de la metodología siempre va antes de cualquier otra cosa, y es donde hay que explicar las fases y técnicas, tal como si fuese la parte administrativa y de planeación de un proyecto.

Y que después de todo esto vendrán las discusiones acerca de la selección de herramientas como sus comparativas correspondientes. Y dentro de subsecciones de la solución propuesta viene todo lo que es la especificación técnica y funcional de programa implementado.

Esto entre otros tantos detalles que hay que corregir, como la extensión de los párrafos y secciones, el uso de palabras que no están en español, etcétera.

Recorte de imagen después de detectar líneas

La semana pasada mostré como era posible encontrar líneas rectas dentro de la imagen con texto, para poder encontrar la zona en la que habríamos de enfocarnos para la detección de texto. Como mostraba en esa ocasión era necesario recortar la zona que formaba una caja alrededor de donde iniciaban y terminaban las líneas.

Al correr el programa con la misma imagen de prueba de la semana pasada, la detección de líneas se muestra como sigue:


Después de esto podemos detectar los puntos de inicio y fin de estas líneas, con el fin de tomar estos puntos como las esquinas de una caja que encerrará el texto. Cabe mencionar que además se les dio un margen de 50 pixeles, para evitar cortar líneas de texto a la mitad.


Después de esto aplicamos los filtros tradicionales para poder recurrir al modulo de reconocimiento de texto.


La imagen anterior es la que entra para el reconocimiento de texto, y con esto ayudamos a que la lectura sea más clara y evitamos que tenga información basura debido al ruido que envuelve a la imagen.

Avances para la siguiente semana

  • Plantear un diseño experimental.
  • Seguir mejorando la redacción.
  • Realizar una prueba para determinar la cantidad de texto recuperado con diferentes técnicas usadas.

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.