AI-Driven Automated Video Generation Pipeline

ENGLISH

AI-Driven Automated Video Generation Pipeline

This repository presents a fully automated video generation pipeline using AI tools to convert textual prompts into complete videos. The system is tailored for "faceless" content channels, leveraging automation to maximize efficiency and scalability.

Concept

From a 30-second or longer content prompt, the pipeline generates a video featuring:

AI-generated visuals matching the described content.
Voice-over narration generated via AI text-to-speech.
Synchronized subtitles that display the spoken text.

The system can adapt to various niches, including aviation, finance, spiritual content, and more.

Workflow Overview

Content Input:
A text prompt serves as the source for the video.
AI Image Generation:
Using Stable Diffusion locally accelerated via NVIDIA GPUs, the pipeline generates high-quality visuals based on the text descriptions.
Voice-Over Generation:
AI Text-to-Speech tools transform the content into professional audio narration.
Subtitles:
Synchronized subtitles are automatically overlaid onto the video.
Video Assembly:
All components (images, audio, and subtitles) are assembled into a final video output using tools like MoviePy.

Key Features

Fully Automated: From input to output, the process is streamlined without manual intervention.
Cost-Efficient: Runs locally using RTX 4090 GPUs, avoiding cloud API costs.
Versatile: Supports content creation for multiple domains.
Scalable: Optimized to handle batch video generation.

Tools and Technologies

Stable Diffusion (Local GPU Inference) for image generation.
Text-to-Speech AI for voice narration.
MoviePy for video assembly and editing.
FastAPI to streamline the local inference server.

Future Enhancements

Advanced prompt contextualization via NLP.
Enhanced video effects: transitions, background music, watermarks.
Scalability with CI/CD pipelines.

ESPAÑOL LATINO

Pipeline Automatizado de Generación de Video con IA

Este repositorio presenta un pipeline completamente automatizado que transforma prompts de texto en videos completos usando herramientas de IA. El sistema está diseñado para canales de contenido "faceless", enfocándose en la eficiencia y escalabilidad mediante automatización.

Concepto

A partir de un prompt de contenido de 30 segundos o más, el sistema genera:

Visuales creados con IA que reflejan el contenido descrito.
Narración por voz generada automáticamente con IA.
Subtítulos sincronizados que muestran el texto narrado.

Es adaptable a múltiples nichos como aviación, finanzas, contenido espiritual, entre otros.

Resumen del Flujo

Entrada de Contenido:
Un prompt de texto sirve como base para el video.
Generación de Imágenes con IA:
Usando Stable Diffusion localmente con aceleración NVIDIA RTX 4090, se crean imágenes de alta calidad basadas en las descripciones.
Narración por Voz:
Herramientas de texto-a-voz convierten el contenido en audio profesional.
Subtítulos:
Subtítulos sincronizados se agregan automáticamente al video.
Edición y Ensamblaje:
Las imágenes, el audio y los subtítulos se combinan en un video final usando herramientas como MoviePy.

Características Principales

Automatización Completa: Desde el prompt hasta el video final sin intervención manual.
Económico: Se ejecuta localmente en RTX 4090, evitando costos en la nube.
Versátil: Soporte para múltiples tipos de contenido.
Escalable: Optimizado para generar videos en lotes.

Herramientas y Tecnologías

Stable Diffusion (Inferencia Local con GPU) para imágenes.
Texto-a-Voz con IA para la narración.
MoviePy para la edición y ensamblaje del video.
FastAPI para servir la inferencia localmente.

Mejoras Futuras

Contextualización avanzada de prompts con NLP.
Efectos de video: transiciones, música de fondo y marca de agua.
Escalabilidad con pipelines CI/CD.

FRANÇAIS

Pipeline Automatisé de Génération Vidéo avec IA

Ce dépôt propose un pipeline de génération automatique de vidéos transformant des prompts textuels en vidéos complètes grâce à des outils d'IA. Le système cible les chaînes de contenu "faceless", en maximisant l'efficacité grâce à l'automatisation.

Concept

À partir d’un prompt de 30 secondes ou plus, le système produit :

Des visuels générés par IA en lien avec le texte.
Une narration audio réalisée via IA Text-to-Speech.
Des sous-titres synchronisés affichant le texte narré.

Le système s’adapte à des niches variées telles que l'aviation, la finance et le contenu spirituel.

Résumé du Flux de Travail

Entrée du Contenu :
Un prompt textuel sert de base pour la vidéo.
Génération d’Images IA :
Avec Stable Diffusion localement accéléré par NVIDIA RTX 4090, des images haute qualité sont produites à partir du texte.
Génération de la Voix :
Des outils Text-to-Speech transforment le texte en narration audio.
Sous-titres Synchronisés :
Des sous-titres sont automatiquement ajoutés au vidéo.
Assemblage Vidéo :
Images, audio et sous-titres sont assemblés avec MoviePy pour créer la vidéo finale.

Caractéristiques Clés

Automatisation Totale : Du texte à la vidéo finale sans intervention manuelle.
Rentable : Fonctionne localement avec RTX 4090, sans coûts cloud.
Polyvalent : Adapté à divers types de contenu.
Évolutif : Optimisé pour la production en lots.

Outils et Technologies

Stable Diffusion (Local GPU) pour la génération d’images.
IA Text-to-Speech pour la narration.
MoviePy pour l’édition et assemblage.
FastAPI pour l'inférence locale.

By Adrian Vargas using O1

Améliorations Futures

Génération de prompts plus contextuels via NLP.
Effets vidéo avancés : transitions, musique de fond, watermark.
Évolutivité via pipelines CI/CD.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
Wan2.1		Wan2.1
image_generation		image_generation
output		output
static/videos		static/videos
templates		templates
.dockerignore		.dockerignore
.gitignore		.gitignore
=2.0.0		=2.0.0
Dockerfile		Dockerfile
README.md		README.md
app.py		app.py
check_large_files.sh		check_large_files.sh
check_project_size.sh		check_project_size.sh
clean_docker.sh		clean_docker.sh
clean_memory.py		clean_memory.py
clean_project.sh		clean_project.sh
dashscope_patch.py		dashscope_patch.py
deploy_docker.sh		deploy_docker.sh
docker-compose.yml		docker-compose.yml
docker-entrypoint.sh		docker-entrypoint.sh
genesis_video.py		genesis_video.py
manual.txt		manual.txt
patched_attention.py		patched_attention.py
process.log		process.log
recover_docker_space.sh		recover_docker_space.sh
requirements.txt		requirements.txt
start_uvicorn.sh		start_uvicorn.sh
test_docker.sh		test_docker.sh
test_wan_video.py		test_wan_video.py
wan_t2v.py		wan_t2v.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ENGLISH

AI-Driven Automated Video Generation Pipeline

Concept

Workflow Overview

Key Features

Tools and Technologies

Future Enhancements

ESPAÑOL LATINO

Pipeline Automatizado de Generación de Video con IA

Concepto

Resumen del Flujo

Características Principales

Herramientas y Tecnologías

Mejoras Futuras

FRANÇAIS

Pipeline Automatisé de Génération Vidéo avec IA

Concept

Résumé du Flux de Travail

Caractéristiques Clés

Outils et Technologies

Améliorations Futures

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ENGLISH

AI-Driven Automated Video Generation Pipeline

Concept

Workflow Overview

Key Features

Tools and Technologies

Future Enhancements

ESPAÑOL LATINO

Pipeline Automatizado de Generación de Video con IA

Concepto

Resumen del Flujo

Características Principales

Herramientas y Tecnologías

Mejoras Futuras

FRANÇAIS

Pipeline Automatisé de Génération Vidéo avec IA

Concept

Résumé du Flux de Travail

Caractéristiques Clés

Outils et Technologies

Améliorations Futures

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages