Skip to content
This repository was archived by the owner on Apr 6, 2026. It is now read-only.

DikiePercy/hackathon

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

108 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🏛️ Голос из Архива (Архив памяти) | Voice from the Archive

Python FastAPI Streamlit C++ PostgreSQL Ollama Docker

«Архив памяти» — это интеллектуальная поисковая система и цифровая база данных, соз��анная для сохранения исторической памяти о жертвах политических репрессий. Проект использует технологии искусственного интеллекта (RAG — Retrieval-Augmented Generation) для анализа архивных уголовных дел, справок и приговоров.

Система работает полностью локально (без отправки конфиденциальных архивных данных в облачные API вроде OpenAI), обеспечивая максимальную безопасность и приватность данных.


✨ Ключевые возможности

  • 🤖 AI-Архивариус (Smart RAG): Умный чат-бот, который отвечает на вопросы суровым, документальным языком, опираясь исключительно на загруженные архивные документы.
  • 🔐 Privacy-First AI: Генерация ответов и векторизация текста происходят локально с использованием Ollama (Llama 3 8B) и локальных эмбеддингов.
  • 📚 База данных репрессированных: Удобный интерфейс карточек (Person Cards) с биографиями, статьями обвинения и датами реабилитации.
  • 🔤 Алфавитный указатель: Быстрый поиск людей по алфавиту и фильтрация по профессиям.
  • Высокопроизводительный процессинг: C++ бэкенд для быстрой нарезки (chunking) и очистки сырых текстовых документов от "мусора".

🏗️ Архитектура проекта

Система построена на микросервисной архитектуре с использованием Docker Compose:

  1. Frontend (Streamlit): Пользовательский веб-интерфейс для чата, просмотра карточек и загрузки файлов.
  2. Backend (FastAPI / Python): Основное API, маршрутизация, бизнес-логика, авторизация (JWT) и оркестрация RAG-пайплайна.
  3. Processing Node (C++ httplib): Микросервис для лексического анализа, очистки Markdown и умного сплиттинга текста.
  4. Database (PostgreSQL): Хранение профилей людей (PersonCard), исходных документов, чанков и истории чатов.
  5. AI Engine (Ollama): Локальный инференс LLM для ответов на естественном языке.

🚀 Быстрый старт (Запуск через Docker)

Для запуска проекта вам потребуется установленный Docker и Docker Compose.

1. Клонирование репозитория

git clone https://github.com/Ваш_Пользователь/hackathon.git
cd hackathon

About

«Архив памяти» — это интеллектуальная поисковая система и цифровая база данных, созданная для сохранения исторической памяти о жертвах политических репрессий. Проект использует технологии искусственного интеллекта (RAG — Retrieval-Augmented Generation) для анализа архивных уголовных дел, справок и приговоров.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors