AI Society - LLM Model Router

🎯 Democratizing AI Access with Intelligent Routing
A Python-based model routing system that intelligently selects appropriate local LLMs for different types of queries. Features advanced multilingual support, conversation memory, and OpenAI-enhanced routing for superior query analysis and optimization.

What is AI Society?

AI Society is an advanced model routing system that combines dual AI intelligence - using OpenAI's superior query analysis with efficient local model execution. It features conversation memory for extended interactions and multilingual support for global accessibility.

✨ Core Features

🌍 Multilingual Intelligence - Automatic language detection and translation for optimal performance
🧠 Dual AI Architecture - OpenAI meta-routing + Local model execution
🔧 Query Optimization - Automatically enhances queries for dramatically better results
💬 Conversation Memory - Multi-turn conversations with hybrid FAISS indexing
🎯 Smart Model Selection - AI-powered routing to specialized models
⚡ Performance Tracking - Comprehensive monitoring and analytics

🚀 Quick Start

Prerequisites

Python 3.8+
Ollama installed and running
GPU with 8GB+ VRAM (tested on RTX 3090)
OpenAI API key (optional, for enhanced routing)

Installation

# Clone and setup
git clone https://github.com/dexmac221/AiSociety.git
cd AiSociety

# Automated setup
chmod +x setup.sh && ./setup.sh

# Quick start
chmod +x start.sh && ./start.sh

Access

Web Interface: http://localhost:8000
WebSocket API: ws://localhost:8000/ws
REST API: http://localhost:8000/api/health

✅ Current Status (September 2025)

🎯 System is LIVE and fully operational!

Latest Features:

✅ 14 cutting-edge 2025 models integrated
✅ Enhanced UI with dark mode and 8+ example categories
✅ Multilingual support with OpenAI translation framework
✅ Hybrid memory system with conversation context
✅ Real-time technical dashboard with performance metrics

🎯 Model Inventory (14 Latest 2025 Models)

💻 Coding Specialists

Qwen2.5-Coder:7B - Advanced multilingual coding with debugging
DeepSeek-Coder-v2:16B - Complex algorithms and system programming
CodeLlama:7B - General coding, documentation, refactoring

🧮 Math & Reasoning

Phi-4:14B - Microsoft's latest math reasoning model
Qwen2.5:7B - Algebra, calculus, statistics, problem solving
Phi3:mini - Quick calculations and basic math

🎨 Creative Specialists

Hermes-4:14B - NousResearch's latest uncensored creative model
Yi:9B - Long-form content, poetry, fiction
Neural-Chat:7B - Dialogue, conversation, roleplay

🌐 Multimodal & Efficiency

Qwen2.5-Omni:7B - Real-time voice, text, image, audio, video
Gemma-3:27B/4B - Google's latest multimodal models
Gemma-3:1B - Ultra-efficient edge deployment

🎯 General Purpose

Llama3.1:8B - Meta's latest reasoning and code model
Mistral:7B - Advanced reasoning and function calling

🏗️ System Architecture

Dual AI Intelligence Flow

Query Reception - User sends message in any supported language
Language Detection - OpenAI automatically detects query language
Translation Layer - Non-English queries translated for optimal performance
Memory Integration - System builds context from conversation history
OpenAI Analysis - GPT-4.1-mini analyzes and optimizes query
Model Selection - AI recommends optimal local model
Local Execution - Enhanced query runs on selected model
Response Enhancement - Results include optimization details and context

🌍 Multilingual AI Enhancement

Universal Language Support - Spanish, French, German, Italian, Portuguese, Japanese, Chinese, and more
Intelligent Translation - OpenAI detects language and translates for optimal comprehension
Native Response Language - Models receive instructions to respond in original language
Real-time Indicators - Language panel shows detection and translation status

💬 Conversation Memory System

Multi-turn Conversations - "Write a function" → "Explain that code" → "Make it more efficient"
Context Awareness - Remembers previous messages and maintains flow
Smart References - Understands "that code", "the previous example"
Hybrid Architecture - FAISS indexing with OpenAI summarization

🔧 Query Optimization

Before vs After

Original Query	OpenAI Enhancement
"sort list"	"Write a well-documented Python function with error handling..."
"quantum"	"Explain quantum computing in simple terms with examples..."
"5+3*2"	"Calculate step-by-step showing order of operations..."

⚙️ Configuration

OpenAI Integration (Recommended)

# Set API key for enhanced routing
export OPENAI_API_KEY="your-api-key-here"

Configuration File (`config/router_config.json`)

{
  "max_model_size": "8GB",
  "openai_meta_routing": {
    "enabled": true,
    "model": "gpt-4.1-mini",
    "cache_decisions": true
  },
  "specialization_weights": {
    "coding": 1.5,
    "math": 1.3,
    "creative": 1.2
  }
}

Testing & Validation

# Run comprehensive tests
./test_system.py

# Test specific components
python test_multilingual.py
python test_conversation_memory.py
python test_query_optimization.py

🌟 Example Usage

Coding Query

👤 "Debug this Python code: def fibonacci(n): return n + fibonacci(n-1)"
🔧 Enhanced: "Analyze and debug this recursive Python function..."
🤖 qwen2.5-coder → Identifies missing base case and infinite recursion

Conversation Memory

👤 "Write a Python sorting function"
🤖 [Provides function] 🧠 2 messages

👤 "Explain how that works"  
🤖 [Explains previous function] 🧠 4 messages

👤 "Make it more efficient"
🤖 [Improves with optimizations] 🧠 6 messages

📁 Project Structure

AiSociety/
├── src/
│   ├── daemon/          # Model discovery
│   ├── memory/          # Conversation memory  
│   └── routing/         # Intelligent routing
├── web/
│   └── app.py          # FastAPI web interface
├── config/             # Configuration files
├── docs/               # Documentation
├── requirements.txt    # Dependencies
├── setup.sh           # Setup script
└── start.sh           # Start script

🤝 Contributing

See CONTRIBUTING.md for guidelines on:

Reporting issues and feature requests
Development setup and workflow
Code style and testing requirements
Pull request process

📚 Documentation

DEVELOPMENT.md - Development guide and architecture
OPENAI_META_ROUTING.md - Technical deep dive on meta-routing
CHANGELOG.md - Version history and updates
SECURITY.md - Security policy and reporting

📄 License

This project is licensed under the MIT License - see the LICENSE file for details.

🙏 Acknowledgments

Ollama team for excellent local LLM infrastructure
OpenAI for API integration capabilities
FastAPI for the robust web framework
FAISS for efficient vector similarity search

📞 Support

GitHub Issues: Report bugs and request features
Discussions: Community discussions and questions

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.github		.github
config		config
docs		docs
src		src
web		web
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
SECURITY.md		SECURITY.md
debug_routing.py		debug_routing.py
main.py		main.py
prepare-github.sh		prepare-github.sh
requirements.txt		requirements.txt
schema_color.png		schema_color.png
setup.sh		setup.sh
setup_gpt4o.sh		setup_gpt4o.sh
setup_openai.sh		setup_openai.sh
start.sh		start.sh
test_conversation_memory.py		test_conversation_memory.py
test_direct_openai.py		test_direct_openai.py
test_fixed_routing.py		test_fixed_routing.py
test_multilingual.py		test_multilingual.py
test_openai_config.py		test_openai_config.py
test_openai_integration.py		test_openai_integration.py
test_query_optimization.py		test_query_optimization.py
test_simple_translation.py		test_simple_translation.py
test_system.py		test_system.py
web_interface.png		web_interface.png

Folders and files

Latest commit

History

Repository files navigation

AI Society - LLM Model Router

What is AI Society?

✨ Core Features

🚀 Quick Start

Prerequisites

Installation

Access

✅ Current Status (September 2025)

🎯 Model Inventory (14 Latest 2025 Models)

💻 Coding Specialists

🧮 Math & Reasoning

🎨 Creative Specialists

🌐 Multimodal & Efficiency

🎯 General Purpose

🏗️ System Architecture

Dual AI Intelligence Flow

🌍 Multilingual AI Enhancement

💬 Conversation Memory System

🔧 Query Optimization

Before vs After

⚙️ Configuration

OpenAI Integration (Recommended)

Configuration File (config/router_config.json)

Testing & Validation

🌟 Example Usage

Coding Query

Conversation Memory

📁 Project Structure

🤝 Contributing

📚 Documentation

📄 License

🙏 Acknowledgments

📞 Support

About

Topics

Resources

License

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Configuration File (`config/router_config.json`)

Packages