Gomata

Construyendo una Herramienta de Traducción de Manga para Abordar Mi Lista Pendiente

Y Dandole un Repaso a Python

Fecha:

Si alguna vez te has encontrado mirando una carpeta llena de manga sin traducir —o cualquier otra imagen con texto en japonés— y te has sentido abrumado, no estás solo. Aunque comisionar traducciones profesionales o aprender japonés sería lo ideal, es poco práctico para una lista pendientes tan grande como la mía.

La Tecnología

Decidí que para abordar la lista pendiente que no dejaba de crecer, necesitaba una solución casera para leer estas historias ahora, incluso si las traducciones no son perfectas. Después de investigar y ver el panorama actual de opciones, la elección del stack tecnológico fue:

Manga OCR
Especializado en texto de manga japonés, aunque tiene dificultades con fuentes borrosas o estilizadas.
PyQt6
Elegido por sus robustos widgets GUI, amplia variedad de documentación y recursos, y compatibilidad simple entre sus objetos de imagen y los utilizados por Manga OCR y la biblioteca de imágenes Pillow.
Google Translate
Rápido y accesible, aunque las traducciones ocasionalmente pierden matices.

La siguiente parte fue refrescar mis conocimientos de Python. Mis habilidades en Python estaban un poco oxidadas, pero la buena noticia es que estamos en 2025, y podemos saltarnos los pasos de buscar fragmentos de código que muestren una función. En su lugar, podemos preguntarle directamente a una IA que nos lo explique, ahorrando un tiempo precioso de búsqueda 😌. 1

La IA ahorra mucho tiempo en preguntas tontas.
La IA ahorra mucho tiempo en preguntas tontas.

Construyendo el Software

Uno de los principales enfoques fue mantenerlo simple, por lo que el proceso fue más directo:

  • Cargar una imagen o carpeta: Apuntar la aplicación a tus archivos de manga.
  • Seleccionar regiones de texto: Dibujar cajas alrededor de los globos de texto en japonés.
  • Extraer y traducir: Dejar que Manga OCR (una herramienta OCR enfocada en japonés) capture el texto, y luego pasarlo a Google Translate.
  • Guardar para después: Las traducciones se pueden almacenar para referencia o ajustes futuros. 2
Mostrando el flujo del texto.
Mostrando el flujo del texto.

Limitaciones

Este es un proyecto personal después de todo, y tiene algunas limitaciones respecto a la tecnología:

Específico del idioma
Manga OCR está optimizado para japonés, no para idiomas occidentales.
La calidad de imagen importa
El texto borroso o demasiado estilizado puede confundir al OCR.
Precisión de la traducción
Google Translate funciona, pero los diálogos con mucho contexto pueden confundirlo.
Un fallo al reconocer un kanji.
Un fallo al reconocer un kanji.

Próximos Pasos

  • Añadir herramientas básicas de edición de imágenes para limpiar las regiones de texto antes del OCR.
  • Experimentar con LLMs para mejorar la calidad de la traducción.

Pruébalo Tú Mismo

El código está disponible en mi GitHub. Necesitarás Python y uv para ejecutarlo. Recuerda, es un trabajo en progreso.

[1] Aunque todavía hay que hacer algunas búsquedas en Google de vez en cuando, la IA no es perfecta y a veces se confunde. Pero bueno, Dios da y Dios quita.

[2] Esta es una característica importante. Se requiere mantener el orden de las oraciones tal como se leen, para que en el futuro, estos datos puedan pasarse a un LLM para mejorar las traducciones.