Skip to content

advaricorp/videogenwan

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ENGLISH

AI-Driven Automated Video Generation Pipeline

This repository presents a fully automated video generation pipeline using AI tools to convert textual prompts into complete videos. The system is tailored for "faceless" content channels, leveraging automation to maximize efficiency and scalability.

Concept

From a 30-second or longer content prompt, the pipeline generates a video featuring:

  • AI-generated visuals matching the described content.
  • Voice-over narration generated via AI text-to-speech.
  • Synchronized subtitles that display the spoken text.

The system can adapt to various niches, including aviation, finance, spiritual content, and more.


Workflow Overview

  1. Content Input:
    A text prompt serves as the source for the video.

  2. AI Image Generation:
    Using Stable Diffusion locally accelerated via NVIDIA GPUs, the pipeline generates high-quality visuals based on the text descriptions.

  3. Voice-Over Generation:
    AI Text-to-Speech tools transform the content into professional audio narration.

  4. Subtitles:
    Synchronized subtitles are automatically overlaid onto the video.

  5. Video Assembly:
    All components (images, audio, and subtitles) are assembled into a final video output using tools like MoviePy.


Key Features

  • Fully Automated: From input to output, the process is streamlined without manual intervention.
  • Cost-Efficient: Runs locally using RTX 4090 GPUs, avoiding cloud API costs.
  • Versatile: Supports content creation for multiple domains.
  • Scalable: Optimized to handle batch video generation.

Tools and Technologies

  • Stable Diffusion (Local GPU Inference) for image generation.
  • Text-to-Speech AI for voice narration.
  • MoviePy for video assembly and editing.
  • FastAPI to streamline the local inference server.

Future Enhancements

  • Advanced prompt contextualization via NLP.
  • Enhanced video effects: transitions, background music, watermarks.
  • Scalability with CI/CD pipelines.

ESPAÑOL LATINO

Pipeline Automatizado de Generación de Video con IA

Este repositorio presenta un pipeline completamente automatizado que transforma prompts de texto en videos completos usando herramientas de IA. El sistema está diseñado para canales de contenido "faceless", enfocándose en la eficiencia y escalabilidad mediante automatización.

Concepto

A partir de un prompt de contenido de 30 segundos o más, el sistema genera:

  • Visuales creados con IA que reflejan el contenido descrito.
  • Narración por voz generada automáticamente con IA.
  • Subtítulos sincronizados que muestran el texto narrado.

Es adaptable a múltiples nichos como aviación, finanzas, contenido espiritual, entre otros.


Resumen del Flujo

  1. Entrada de Contenido:
    Un prompt de texto sirve como base para el video.

  2. Generación de Imágenes con IA:
    Usando Stable Diffusion localmente con aceleración NVIDIA RTX 4090, se crean imágenes de alta calidad basadas en las descripciones.

  3. Narración por Voz:
    Herramientas de texto-a-voz convierten el contenido en audio profesional.

  4. Subtítulos:
    Subtítulos sincronizados se agregan automáticamente al video.

  5. Edición y Ensamblaje:
    Las imágenes, el audio y los subtítulos se combinan en un video final usando herramientas como MoviePy.


Características Principales

  • Automatización Completa: Desde el prompt hasta el video final sin intervención manual.
  • Económico: Se ejecuta localmente en RTX 4090, evitando costos en la nube.
  • Versátil: Soporte para múltiples tipos de contenido.
  • Escalable: Optimizado para generar videos en lotes.

Herramientas y Tecnologías

  • Stable Diffusion (Inferencia Local con GPU) para imágenes.
  • Texto-a-Voz con IA para la narración.
  • MoviePy para la edición y ensamblaje del video.
  • FastAPI para servir la inferencia localmente.

Mejoras Futuras

  • Contextualización avanzada de prompts con NLP.
  • Efectos de video: transiciones, música de fondo y marca de agua.
  • Escalabilidad con pipelines CI/CD.

FRANÇAIS

Pipeline Automatisé de Génération Vidéo avec IA

Ce dépôt propose un pipeline de génération automatique de vidéos transformant des prompts textuels en vidéos complètes grâce à des outils d'IA. Le système cible les chaînes de contenu "faceless", en maximisant l'efficacité grâce à l'automatisation.

Concept

À partir d’un prompt de 30 secondes ou plus, le système produit :

  • Des visuels générés par IA en lien avec le texte.
  • Une narration audio réalisée via IA Text-to-Speech.
  • Des sous-titres synchronisés affichant le texte narré.

Le système s’adapte à des niches variées telles que l'aviation, la finance et le contenu spirituel.


Résumé du Flux de Travail

  1. Entrée du Contenu :
    Un prompt textuel sert de base pour la vidéo.

  2. Génération d’Images IA :
    Avec Stable Diffusion localement accéléré par NVIDIA RTX 4090, des images haute qualité sont produites à partir du texte.

  3. Génération de la Voix :
    Des outils Text-to-Speech transforment le texte en narration audio.

  4. Sous-titres Synchronisés :
    Des sous-titres sont automatiquement ajoutés au vidéo.

  5. Assemblage Vidéo :
    Images, audio et sous-titres sont assemblés avec MoviePy pour créer la vidéo finale.


Caractéristiques Clés

  • Automatisation Totale : Du texte à la vidéo finale sans intervention manuelle.
  • Rentable : Fonctionne localement avec RTX 4090, sans coûts cloud.
  • Polyvalent : Adapté à divers types de contenu.
  • Évolutif : Optimisé pour la production en lots.

Outils et Technologies

  • Stable Diffusion (Local GPU) pour la génération d’images.
  • IA Text-to-Speech pour la narration.
  • MoviePy pour l’édition et assemblage.
  • FastAPI pour l'inférence locale.

By Adrian Vargas using O1


Améliorations Futures

  • Génération de prompts plus contextuels via NLP.
  • Effets vidéo avancés : transitions, musique de fond, watermark.
  • Évolutivité via pipelines CI/CD.

About

videogenerator with Wan text to video

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors