forked from ShaerWare/AI_Secretary_System
-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy path00_START_HERE.txt
More file actions
228 lines (164 loc) · 10.9 KB
/
00_START_HERE.txt
File metadata and controls
228 lines (164 loc) · 10.9 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
╔═══════════════════════════════════════════════════════════════════╗
║ ║
║ 🤖 AI SECRETARY SYSTEM "МАРИНА" 🤖 ║
║ ║
║ Виртуальный секретарь с клонированием голоса ║
║ Принимает звонки и общается с клиентами ║
║ ║
╚═══════════════════════════════════════════════════════════════════╝
📋 БЫСТРЫЙ СТАРТ:
═══════════════════════════════════════════════════════════════════
1️⃣ УСТАНОВКА
./setup.sh
2️⃣ НАСТРОЙКА API КЛЮЧА
nano .env
# Добавьте: GEMINI_API_KEY=ваш_ключ
# Получить: https://makersuite.google.com/app/apikey
3️⃣ ЗАПУСК
./run.sh
4️⃣ ТЕСТИРОВАНИЕ
./test_system.sh
📁 ФАЙЛЫ ПРОЕКТА:
═══════════════════════════════════════════════════════════════════
📚 ДОКУМЕНТАЦИЯ (читайте в этом порядке):
├── QUICKSTART.md ← Начните отсюда!
├── README.md ← Полная документация
├── ARCHITECTURE.md ← Как всё устроено
├── examples.md ← Примеры использования
├── CHEATSHEET.md ← Шпаргалка с командами
└── PROJECT_SUMMARY.md ← Итоговая сводка
🔧 ОСНОВНЫЕ СЕРВИСЫ:
├── orchestrator.py # Главный координатор (порт 8000)
├── phone_service.py # Телефонная интеграция (порт 8001)
├── voice_clone_service.py # Клонирование голоса (XTTS v2)
├── stt_service.py # Распознавание речи (Whisper)
└── llm_service.py # Генерация ответов (Gemini)
⚙️ КОНФИГУРАЦИЯ:
├── .env # API ключи и настройки ← НАСТРОЙТЕ!
├── requirements.txt # Python зависимости
└── docker-compose.yml # Docker оркестрация
🚀 СКРИПТЫ УПРАВЛЕНИЯ:
├── setup.sh # Установка системы
├── run.sh # Запуск системы
└── test_system.sh # Тестирование
🎤 ДАННЫЕ:
├── Марина/ # 54 образца голоса (WAV) ✅
├── models/ # TTS модели
├── temp/ # Временные файлы
└── calls_log/ # Логи звонков (создастся автоматически)
🎯 ЧТО УМЕЕТ СИСТЕМА:
═══════════════════════════════════════════════════════════════════
✅ Принимать телефонные звонки через Twilio
✅ Распознавать речь абонента (русский язык)
✅ Генерировать умные ответы через Gemini
✅ Отвечать голосом Лидии (клонирование голоса)
✅ Вести диалог с сохранением контекста
✅ Логировать все звонки с транскрипциями
✅ API для интеграции с другими системами
📊 АРХИТЕКТУРА:
═══════════════════════════════════════════════════════════════════
Звонок → Twilio
↓
Phone Service :8001
↓
Orchestrator :8000
↓
┌───────┼───────┐
↓ ↓ ↓
STT LLM TTS
Whisper Gemini XTTS v2
↓
Голос Лидии
🔑 НЕОБХОДИМЫЕ API КЛЮЧИ:
═══════════════════════════════════════════════════════════════════
✅ GEMINI_API_KEY - ОБЯЗАТЕЛЬНО
Получить: https://makersuite.google.com/app/apikey
Для генерации ответов секретаря
⚠️ TWILIO - Опционально (для реальных звонков)
Account SID, Auth Token, Phone Number
Получить: https://www.twilio.com
💻 СИСТЕМНЫЕ ТРЕБОВАНИЯ:
═══════════════════════════════════════════════════════════════════
✅ Ваша система:
• GPU 1: NVIDIA P104-100 (8GB)
• GPU 2: NVIDIA GeForce RTX 3060 (12GB)
• Всего: 20GB VRAM ← Отлично! ✓
• RAM: 64GB ← Отлично! ✓
Минимум для работы:
• CPU: 4 cores
• RAM: 16GB
• GPU: 8GB+ VRAM (или CPU режим)
• Диск: 10GB
🧪 БЫСТРЫЙ ТЕСТ:
═══════════════════════════════════════════════════════════════════
После запуска системы (./run.sh):
# Проверка здоровья
curl http://localhost:8000/health
# Синтез речи голосом Лидии
curl -X POST http://localhost:8000/tts \
-H "Content-Type: application/json" \
-d '{"text": "Здравствуйте! Это секретарь Марина."}' \
-o test.wav
# Прослушать результат
ffplay test.wav
📱 ИНТЕГРАЦИЯ С ТЕЛЕФОНИЕЙ:
═══════════════════════════════════════════════════════════════════
Для приема реальных звонков:
1. Зарегистрируйтесь на Twilio.com
2. Получите телефонный номер
3. Добавьте credentials в .env
4. Настройте webhook: https://your-domain.com/incoming_call
Для локального тестирования используйте ngrok:
ngrok http 8001
🛠️ НАСТРОЙКА ПОД СЕБЯ:
═══════════════════════════════════════════════════════════════════
1. Системный промпт секретаря
Отредактируйте: llm_service.py
Метод: _default_system_prompt()
2. Добавьте информацию о компании:
• Название компании
• График работы
• Услуги/продукты
• Контакты
3. Образцы голоса
Уже готово! 54 WAV файла в папке Марина/
📞 ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ:
═══════════════════════════════════════════════════════════════════
Смотрите подробные примеры в:
• examples.md - все варианты использования
• CHEATSHEET.md - шпаргалка с командами
❓ TROUBLESHOOTING:
═══════════════════════════════════════════════════════════════════
Проблема: CUDA out of memory
Решение: Уменьшите размер модели в stt_service.py
model_size = "small" или "tiny"
Проблема: API ключ не найден
Решение: Проверьте файл .env, должно быть:
GEMINI_API_KEY=ваш_ключ (без пробелов!)
Проблема: Плохое качество голоса
Решение: Проверьте образцы в папке Марина/
Должны быть чистые WAV без шума
Больше решений: README.md, раздел Troubleshooting
📚 ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ:
═══════════════════════════════════════════════════════════════════
• Подробная документация: README.md
• Архитектура системы: ARCHITECTURE.md
• Итоговая сводка: PROJECT_SUMMARY.md
• Примеры кода: examples.md
🚀 НАЧАТЬ РАБОТУ:
═══════════════════════════════════════════════════════════════════
1. Откройте QUICKSTART.md
2. Следуйте инструкциям
3. Через 5 минут система будет работать!
💡 ПОМОЩЬ И ПОДДЕРЖКА:
═══════════════════════════════════════════════════════════════════
Вопросы? Проблемы?
• Проверьте README.md
• Посмотрите examples.md
• Изучите CHEATSHEET.md
════════════════════════════════════════════════════════════════════
🎉 СИСТЕМА ГОТОВА К ИСПОЛЬЗОВАНИЮ! 🎉
════════════════════════════════════════════════════════════════════
Начните с: ./setup.sh
Затем откройте: QUICKSTART.md
Удачи! 🚀