¿Por qué el formato siempre se rompe?
Sinceramente, cada vez que convierto Word o PDF a Markdown, contengo la respiración. La semana pasada ayudé a un colega a convertir un documento técnico de 50 páginas. Pensé que sería un clic y listo. Al abrir el resultado: las tablas eran un desastre, los diagramas desaparecieron, hasta la indentación del código se perdió. ¿Frustrante, verdad?
El problema es que Markdown fue diseñado para ser "ligero". No soporta nativamente el formato elegante de Word. Pero no te preocupes—después de años de errores, encontré soluciones sólidas.
Problema 1: Las tablas se convierten en basura
Este es el problema más común. Las tablas complejas de Word (celdas combinadas, encabezados de varias filas) salen completamente rotas.
La solución
Si usas Pandoc, prueba añadir este parámetro:
pandoc input.docx -f docx -t gfm --extract-media=./media -o output.md
Es como darle una "lente HD" a tu convertidor. Si sigue desordenado, aquí va mi truco favorito: captura de pantalla de tablas complejas. En lugar de pasar una hora ajustando la sintaxis de tablas Markdown, toma 1 minuto para hacer una captura. Preciso y rápido.
Además, doc2markdown.com mejoró recientemente su motor de tablas. Divide automáticamente las celdas combinadas en formato Markdown estándar. No es 100% perfecto, pero al menos legible.
Problema 2: Las imágenes desaparecen
"¿El documento Word tenía imágenes, pero después de convertir solo quedan nombres de archivo?"
Es porque Markdown no almacena imágenes—almacena enlaces. Durante la conversión, las imágenes deben extraerse a una carpeta.
Cómo recuperar imágenes
- Usa flags de extracción: Como
--extract-mediamencionado arriba—extrae automáticamente las imágenes a una carpeta. - Rutas absolutas vs relativas: A menudo las imágenes no se pierden, solo están mal enlazadas. Revisa las rutas en
![](). ¿Usas rutas absolutas que fallan al compartir? Cambia a rutas relativas comoimages/pic1.png.
Problema 3: Caracteres especiales se corrompen
¿Alguna vez viste © convertirse en ``? ¿O fórmulas matemáticas como $\alpha$ mostrando código crudo?
Normalmente es un problema de codificación. Asegúrate de que el archivo fuente y el editor usen UTF-8. Para matemáticas, si tu convertidor soporta MathJax, perfecto. Si no, envuelve las fórmulas en sintaxis LaTeX—la mayoría de editores Markdown modernos pueden renderizarlo.
Consejo Pro: Herramienta correcta, mitad del esfuerzo
Arreglar formato manualmente es agotador. Si tu documento tiene formato complejo:
- Simplifica en origen: Elimina estilos innecesarios en Word primero.
- Usa herramientas especializadas: No confíes en convertidores "universales". ¿Convirtiendo papers académicos? Usa herramientas optimizadas para LaTeX. ¿Convirtiendo blogs? Usa doc2markdown—está optimizado para web.
No hay bala de plata para conversión de formato, pero con estos trucos ahorrarás horas. ¡La próxima vez que el formato se descontrole, prueba estos antes de reescribir desde cero!