Skip to content

Tarquitet/html-2-pdf

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📄 Generador HTML a PDF (Edición Definitiva)

Una herramienta profesional que convierte archivos HTML locales a PDFs optimizados, resolviendo problemas de lazy-loading y reduciendo drásticamente el peso final.

HTML to PDF Generator es una aplicación de escritorio en Python que utiliza Playwright (Chromium) para asegurar el render correcto de CSS/JS y aplica un post-procesado con PyMuPDF para optimizar las imágenes sin perder calidad.

1769443738317

✨ Características Principales (v5)

  • Servidor Local Integrado: Evita bloqueos CORS del navegador con archivos locales sirviendo recursos y tipografías correctamente.
  • Auto-Scroll para Lazy-Loading: Inyecta un script que desplaza la página hasta el final para forzar la carga de imágenes lazy-loaded antes de capturar.
  • Motor de Compresión Híbrido: Conserva PNG para imágenes con transparencia y convierte a JPEG las opacas según la calidad seleccionada.
  • Limpieza de Metadatos: Elimina EXIF y metadatos del PDF (Autor, Fecha, Software) para privacidad y menor peso.
  • Renombrado Inteligente Multi-idioma: Detecta sufijos -en o _en para nombrar PDFs (ej. CV_David_Pinto_ENG.pdf).

⚙️ Requisitos e Instalación

El script incluye un auto-instalador que descarga dependencias e instala Chromium para Playwright en la primera ejecución.

Requisitos:

  • Python 3.8 o superior.

Dependencias (instaladas automáticamente):

  • playwright
  • pymupdf / fitz
  • pillow

Ejecución:

python 5_HTML-2-PDF-Python.py

Nota: la primera ejecución puede tardar mientras Playwright descarga Chromium.

Leer en Inglés

Uso rápido

  • Añade archivos HTML usando el botón ➕.
  • Ajusta la calidad JPEG (recomendado ~75%).
  • Opcionalmente elimina los metadatos por privacidad.
  • Elige la carpeta de salida y pulsa Generar.

Registro de cambios

  • v0: Playwright inicial + servidor y auto-scroll.
  • v1: Escalado optimizado para imágenes muy grandes.
  • v2: Modo privacidad (sin metadatos).
  • v3-v4: Mejoras del motor híbrido PNG/JPEG.
  • v5: Renombrado inteligente y eliminación de páginas en blanco finales.

About

Simple program to conver local or downloaded html files into pdf

Resources

Stars

Watchers

Forks

Contributors

Languages