📚 RAG Pipeline (ChromaDB + SentenceTransformer + Groq)

A simple Retrieval-Augmented Generation (RAG) system that loads local text files, embeds them using SentenceTransformer, stores them in ChromaDB, and generates answers using Groq’s LLaMA 3 model.

🚀 Features

Local embeddings (no OpenAI required)
Persistent vector DB via ChromaDB
Query documents with semantic search
LLaMA 3 (Groq) for answers
Minimal, single-file implementation (main.py)

📁 Project Structure

main.py
news_articles/              # .txt documents
chroma_persistent_storage/  # auto-generated (ignored)
.env                        # contains GROQ_API_KEY
requirements.txt
.gitignore
venv/

🔐 Setup

Create a .env file:

GROQ_API_KEY=your_groq_api_key_here

Install dependencies:

pip install -r requirements.txt

▶️ Run

python main.py

Edit the question in main.py:

question = "tell me about databricks"

🧠 How it Works

Load .txt files
Chunk them
Generate embeddings with all-MiniLM-L6-v2
Store in ChromaDB
Retrieve relevant chunks
Send context → Groq LLaMA 3 → get answer

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

📚 RAG Pipeline (ChromaDB + SentenceTransformer + Groq)

🚀 Features

📁 Project Structure

🔐 Setup

▶️ Run

🧠 How it Works

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
news_articles		news_articles
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

KruthikaTS/RAG_Chat

Folders and files

Latest commit

History

Repository files navigation

📚 RAG Pipeline (ChromaDB + SentenceTransformer + Groq)

🚀 Features

📁 Project Structure

🔐 Setup

▶️ Run

🧠 How it Works

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages