Sistem za inteligentno svetovanje o avtomobilskih zavarovanjih, ki temelji na RAG (Retrieval-Augmented Generation) arhitekturi. Sistem uporablja vektorsko bazo podatkov za shranjevanje in iskanje relevantnih informacij o zavarovanjih ter napredne jezikovne modele za generiranje odgovorov.
- Inteligentno svetovanje o avtomobilskih zavarovanjih
- Obdelava in indeksiranje dokumentov različnih formatov (PDF, DOCX, TXT, HTML, itd.)
- Vektorska baza podatkov za hitro in natančno iskanje informacij
- Spletni vmesnik za komunikacijo z asistentom
- Podpora za slovenski jezik
- Python 3.8 ali novejši
- OpenAI API ključ
- Ustrezne knjižnice (glej
requirements.txt)
- Klonirajte repozitorij:
git clone [url-repozitorija]- Namestite potrebne knjižnice:
pip install -r requirements.txt- Ustvarite
.envdatoteko in dodajte potrebne spremenljivke okolja:
OPENAI_API_KEY=your-api-key-hereDbUploader.py- Razred za nalaganje dokumentov v vektorsko bazoTalk_Vector.py- Glavni razred za RAG funkcionalnost in komunikacijo z LLMPrompts.py- Predloge za generiranje poizvedbrag-web-backend.py- FastAPI spletni strežnikindex.html- Osnovni spletni vmesnikremove_from_db.py- Orodje za odstranjevanje dokumentov iz baze
from DbUploader import DocumentUploader
uploader = DocumentUploader()
db = uploader.upload_directory(
directory="pot/do/dokumentov",
db_directory="./vector_db_MD",
collection_name="Car_stuff",
recursive=True
)from Talk_Vector import RAGConversationAgent
agent = RAGConversationAgent(
db_path="./vector_db_MD",
collection_name="Car_stuff",
model_name="gpt-4"
)
agent.start_interactive_chat()python rag-web-backend.pySistem omogoča prilagajanje različnih parametrov:
- Velikost dokumentnih odsekov (
chunk_size) - Prekrivanje odsekov (
chunk_overlap) - Temperatura generiranja (
temperature) - Število dokumentov za iskanje (
k) - Dolžina zgodovine pogovora (
max_history_length)
- Sistem je optimiziran za slovenski jezik in specifično domeno avtomobilskih zavarovanj
- Za optimalno delovanje je priporočljiva uporaba GPT-4 modela
- Vsi dokumenti v bazi morajo biti v slovenskem jeziku
BUREK