7 votos

¿Cómo puedo procesar/leer las marcas de verificación en un formulario de papel?

Me gustaría procesar un gran número de formularios de papel escaneados (GUI o línea de comandos). Sólo me interesa leer las casillas de verificación (personalizadas). El formulario tiene el siguiente aspecto:

  • cada línea tiene 6 casillas en forma de círculo (una está marcada)
  • el formulario tiene más de 45 líneas

Después del procesamiento, me gustaría tener el valor comprobado (1 6) de cada línea. Supongo que como no hay Optical Personaje Reconocimiento que implica (pero OMR ), esto debería ser algo más fácil.

¿Hay alguna manera de hacer esto desde la GUI o la línea de comandos? ¿Cuál sería el mejor enfoque?

ACTUALIZADO : los escaneos vienen en PDF o JPEG (mi elección). Muestra de escaneo (380kb JPEG).

Aquí hay una versión anónima del formulario:

paper form to be processed

4voto

CousinCocaine Puntos 3615

Si quiere evitar el OCR, puede utilizar ImageMagick (un superconjunto de herramientas de manipulación de imágenes de la CLI). Pero hay que asegurarse de que todas las páginas están alineadas exactamente igual. Yo he preparado este flujo de trabajo, tienes que modificarlo para tus necesidades y crear algunos bucles, pero puede ayudarte en la dirección correcta.

Asegúrese de que la posición de cada ronda es la misma en cada hoja

Extraer cada ronda y guardarla con el row_circle-nr (como 04_1.png, 04_2.png, etc)

x=$position_of_circle_on_x
y=$position_of_circle_on_y
w=$width_of_circle_area
h=$hight_of_circle_area
input=$input_image
output=$output_row_cirleNr
convert +repage $input -crop $wx$h+$x+$y $output

Calcular el área del rojo mediante histogramas ( Yo prefiero el rojo, pero también puedes hacerlo con el negro )

RGBO=$( convert $FILE -colorspace HSL -verbose info: | grep mean | awk '{print $2}' )
REDVALUE=$( echo $RGBO | awk '{print $1}'  | cut -d. -f1 )

El mayor REDVALUE gana por cada fila

Bueno, esto es todo.

¿Cómo instalar imagemagick?

El uso e instalación de ImageMagick puede intimidar, pero este paquete de manipulación de imágenes es el más potente que he encontrado hasta ahora. Como la instalación desde el código fuente puede ser una molestia para los usuarios nativos de OS X, le aconsejo que utilice Homebrew .

Para instalar ImageMagick utilizando Homebrew ejecuta este oneliner en tu terminal:

ruby -e "$(curl -fsSL https://raw.github.com/mxcl/homebrew/go)"

Homebrew ya está instalado, es conveniente seguir las sugerencias del instalador después de la instalación. Ahora instalamos ImageMagick usando brew .

brew install imagemagick

Ahora podemos utilizar imagemagick y su convert como en los ejemplos anteriores.

1voto

maxpenguin Puntos 1488

Soy un entusiasta del código abierto así que eché un vistazo a ImageMagic para ver si es de código abierto, lo es, sin embargo el proyecto está basado en los Estados Unidos. Quiero ver si puedo ayudarle con una base de proyecto de código abierto de la universidad alemana llamada SDAPS.

El SDAPS es específicamente un programa OMR.

http://sdaps.org/SDAPS

He descargado su página de prueba y trataré de utilizarla para dar una respuesta a su pregunta utilizando SDAPS.

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X