🏛️ Голос из Архива (Архив памяти) | Voice from the Archive

«Архив памяти» — это интеллектуальная поисковая система и цифровая база данных, соз��анная для сохранения исторической памяти о жертвах политических репрессий. Проект использует технологии искусственного интеллекта (RAG — Retrieval-Augmented Generation) для анализа архивных уголовных дел, справок и приговоров.

Система работает полностью локально (без отправки конфиденциальных архивных данных в облачные API вроде OpenAI), обеспечивая максимальную безопасность и приватность данных.

✨ Ключевые возможности

🤖 AI-Архивариус (Smart RAG): Умный чат-бот, который отвечает на вопросы суровым, документальным языком, опираясь исключительно на загруженные архивные документы.
🔐 Privacy-First AI: Генерация ответов и векторизация текста происходят локально с использованием Ollama (Llama 3 8B) и локальных эмбеддингов.
📚 База данных репрессированных: Удобный интерфейс карточек (Person Cards) с биографиями, статьями обвинения и датами реабилитации.
🔤 Алфавитный указатель: Быстрый поиск людей по алфавиту и фильтрация по профессиям.
⚡ Высокопроизводительный процессинг: C++ бэкенд для быстрой нарезки (chunking) и очистки сырых текстовых документов от "мусора".

🏗️ Архитектура проекта

Система построена на микросервисной архитектуре с использованием Docker Compose:

Frontend (Streamlit): Пользовательский веб-интерфейс для чата, просмотра карточек и загрузки файлов.
Backend (FastAPI / Python): Основное API, маршрутизация, бизнес-логика, авторизация (JWT) и оркестрация RAG-пайплайна.
Processing Node (C++ httplib): Микросервис для лексического анализа, очистки Markdown и умного сплиттинга текста.
Database (PostgreSQL): Хранение профилей людей (PersonCard), исходных документов, чанков и истории чатов.
AI Engine (Ollama): Локальный инференс LLM для ответов на естественном языке.

🚀 Быстрый старт (Запуск через Docker)

Для запуска проекта вам потребуется установленный Docker и Docker Compose.

1. Клонирование репозитория

git clone https://github.com/Ваш_Пользователь/hackathon.git
cd hackathon

Name		Name	Last commit message	Last commit date
Latest commit History 108 Commits
.github/workflows		.github/workflows
.idea		.idea
asset		asset
backend_cpp		backend_cpp
backend_python		backend_python
front		front
frontend_html		frontend_html
frontend_python		frontend_python
scripts		scripts
.clangd		.clangd
.env.example		.env.example
.gitignore		.gitignore
HOSTING_COMPARISON.md		HOSTING_COMPARISON.md
HOSTING_SUMMARY.txt		HOSTING_SUMMARY.txt
QUICK_DEPLOY.md		QUICK_DEPLOY.md
README.md		README.md
README_HOSTING.md		README_HOSTING.md
docker-compose.yml		docker-compose.yml
fix_gemini_key.sh		fix_gemini_key.sh
pyproject.toml		pyproject.toml
quick_test_ollama.sh		quick_test_ollama.sh
test_ollama.sh		test_ollama.sh
test_ollama_integration.py		test_ollama_integration.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🏛️ Голос из Архива (Архив памяти) | Voice from the Archive

✨ Ключевые возможности

🏗️ Архитектура проекта

🚀 Быстрый старт (Запуск через Docker)

1. Клонирование репозитория

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🏛️ Голос из Архива (Архив памяти) | Voice from the Archive

✨ Ключевые возможности

🏗️ Архитектура проекта

🚀 Быстрый старт (Запуск через Docker)

1. Клонирование репозитория

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages