Idealmente, me gustaría contar con capacidades inteligentes por lotes, con énfasis en la corrección de imágenes y con un OCR modificable. Un ejemplo de uso: Tengo fotos de páginas de libros de texto - la aplicación más ideal sería ajustar las sombras y el ruido, aplicar filtros para aclarar el texto, diferenciar entre el texto y las imágenes y procesarlas por separado, desviarse y deformarse para compensar las páginas curvas, recortar correctamente, proporcionar herramientas para el ajuste del OCR y compilar en un PDF. Corríjanme si me equivoco, pero todas estas tareas no son demasiado difíciles desde el punto de vista del desarrollador. Si este software no existe todavía, ¡quien lo haga mejor ganará millones!
Respuesta
¿Demasiados anuncios?Resuelto, con una gran aplicación llamada Prizmo. Algunos problemas de interfaz desconcertantes (¿las diapositivas se reorganizan ocasionalmente o cambian sus miniaturas a páginas adyacentes?), pero conseguí convertir un conjunto de fotos de un libro de texto tomadas con la cámara del teléfono con poca luz en un pdf plano y con corrección de curvatura. El OCR no funcionó en absoluto, pero las imágenes eran de tan baja calidad que me sorprendieron las pocas veces que lo hizo; si hubiera sido más cuidadoso con la fotografía, podría haber leído fácilmente una página tomada con la cámara de un iPhone. Una corrección de curvatura realmente buena, sólo unos pocos ajustes en la interfaz harían que este software fuera perfecto y eficiente para un mayor número de páginas, como atajos de teclado y algo de pensamiento puesto en la interfaz de ajuste de curvatura, o la capacidad de copiar los ajustes de corrección de curvatura sobre páginas similares, o la capacidad algo obvia de sacar 2 páginas de una imagen/escaneo de un libro. Si despiden a su actual jefe de UX y lo sustituyen por un usuario de tecnología, la próxima actualización será oro absoluto.