Программа для распознавания текста с изображений, сделанная для индивидуального школьного проекта.
VeroVision — desktop-программа, которая распознаёт текст с изображений и умеет работать в двух режимах: обычный текст и код.
Пользователь может загрузить картинку с компьютера или вставить изображение из буфера обмена, после чего приложение распознаёт текст, показывает результат в окне и даёт его скопировать или сохранить в файл.
Для обычного текста используется EasyOCR с поддержкой русского и английского языков. Для кода в проекте подключена отдельная кастомная модель EasyOCR и дополнительная постобработка для исправления типичных ошибок распознавания.
Клонируйте репозиторий:
git clone https://github.com/Kitiketov/VeroVision.git
cd VeroVisionУстановите зависимости:
pip install PyQt5 pillow easyocr fuzzywuzzy
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121Запустите приложение:
python main.pyw- Python
- PyQt5
- EasyOCR
- PyTorch
- Pillow
- fuzzywuzzy
Приложение умеет:
- загружать изображение из файла;
- вставлять картинку из буфера обмена.
Есть два режима работы:
- Text mode — для обычного текста на русском и английском;
- Code mode — для распознавания кода через кастомную OCR-модель.
После распознавания приложение может:
- учитывать табуляцию и отступы;
- исправлять часть ошибок в коде через словарь частых слов;
- показать результат в окне;
- скопировать текст в буфер;
- сохранить результат в
.txt.
main.pyw— запуск приложения и инициализация окнаhandler.py— логика загрузки, распознавания, сохранения и UI-обработчиковdesign.py— сгенерированный PyQt-интерфейсuntitled.ui— исходный UI-файлtab_detection.py— работа с табуляцией и форматированиемrecognition/text_recognition.py— основная логика OCRrecognition/image_preprocessing.py— предобработка изображенийrecognition/postprocessing.py— постобработка распознанного текстаrecognition/common_words.txt— словарь для исправления типичных ошибокcustom_EasyOCR/— кастомная модель для режима распознавания кодаtest image/— тестовые изображения