Skip to content

SakkoumHamza/course_material_rag

Repository files navigation

🤖 Système RAG - Assistant Intelligent

Un système de Retrieval-Augmented Generation (RAG) complet utilisant ChromaDB, Ollama et Streamlit pour créer un assistant intelligent capable de répondre aux questions basées sur vos documents PDF.

📋 Interface

Interface RAG System


📋 Docker image

Docker image

✨ Caractéristiques

🔍 Traitement intelligent des documents

  • Extraction de texte avancée depuis PDF (texte + OCR)
  • Support multilingue (français/anglais) avec Tesseract
  • Chunking intelligent des documents
  • Embeddings avec SentenceTransformers

🧠 IA conversationnelle

  • Intégration avec Ollama (modèles LLM locaux)
  • Prompts personnalisés en français
  • Recherche par similarité vectorielle
  • Réponses avec sources citées

🌐 Interfaces multiples

  • Interface web Streamlit moderne et intuitive
  • Mode CLI interactif pour les développeurs
  • API REST (extensible)
  • Support Docker pour déploiement facile

💾 Stockage et performance

  • Base vectorielle ChromaDB persistante
  • Cache des embeddings pour performance
  • Health checks et monitoring
  • Volumes Docker pour persistance des données

🏗️ Architecture

graph TB
    A[Documents PDF] --> B[load_docs.py]
    B --> C[Extraction Texte/OCR]
    C --> D[Chunking]
    D --> E[Embeddings]
    E --> F[ChromaDB]
    
    G[Question Utilisateur] --> H[llm_processing.py]
    H --> I[Recherche Vectorielle]
    I --> F
    F --> J[Contexte Pertinent]
    J --> K[Ollama LLM]
    K --> L[Réponse + Sources]
    
    M[ui.py] --> H
    N[Streamlit App] --> M
Loading

Version actuelle

  • ✅ Support PDF avec OCR multilingue
  • ✅ Interface Streamlit complète
  • ✅ Intégration Ollama
  • ✅ Déploiement Docker

About

No description or website provided.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages