Una herramienta profesional que convierte archivos HTML locales a PDFs optimizados, resolviendo problemas de lazy-loading y reduciendo drásticamente el peso final.
HTML to PDF Generator es una aplicación de escritorio en Python que utiliza Playwright (Chromium) para asegurar el render correcto de CSS/JS y aplica un post-procesado con PyMuPDF para optimizar las imágenes sin perder calidad.
- Servidor Local Integrado: Evita bloqueos CORS del navegador con archivos locales sirviendo recursos y tipografías correctamente.
- Auto-Scroll para Lazy-Loading: Inyecta un script que desplaza la página hasta el final para forzar la carga de imágenes lazy-loaded antes de capturar.
- Motor de Compresión Híbrido: Conserva PNG para imágenes con transparencia y convierte a JPEG las opacas según la calidad seleccionada.
- Limpieza de Metadatos: Elimina EXIF y metadatos del PDF (Autor, Fecha, Software) para privacidad y menor peso.
- Renombrado Inteligente Multi-idioma: Detecta sufijos
-eno_enpara nombrar PDFs (ej.CV_David_Pinto_ENG.pdf).
El script incluye un auto-instalador que descarga dependencias e instala Chromium para Playwright en la primera ejecución.
Requisitos:
- Python 3.8 o superior.
Dependencias (instaladas automáticamente):
playwrightpymupdf/fitzpillow
Ejecución:
python 5_HTML-2-PDF-Python.pyNota: la primera ejecución puede tardar mientras Playwright descarga Chromium.
- Añade archivos HTML usando el botón ➕.
- Ajusta la calidad JPEG (recomendado ~75%).
- Opcionalmente elimina los metadatos por privacidad.
- Elige la carpeta de salida y pulsa Generar.
- v0: Playwright inicial + servidor y auto-scroll.
- v1: Escalado optimizado para imágenes muy grandes.
- v2: Modo privacidad (sin metadatos).
- v3-v4: Mejoras del motor híbrido PNG/JPEG.
- v5: Renombrado inteligente y eliminación de páginas en blanco finales.
