Skip to content

Kitiketov/VeroVision

Repository files navigation

VeroVision

Python PyQt5 EasyOCR Status

Программа для распознавания текста с изображений, сделанная для индивидуального школьного проекта.

Table of Contents

About

VeroVision — desktop-программа, которая распознаёт текст с изображений и умеет работать в двух режимах: обычный текст и код.

Пользователь может загрузить картинку с компьютера или вставить изображение из буфера обмена, после чего приложение распознаёт текст, показывает результат в окне и даёт его скопировать или сохранить в файл.

Для обычного текста используется EasyOCR с поддержкой русского и английского языков. Для кода в проекте подключена отдельная кастомная модель EasyOCR и дополнительная постобработка для исправления типичных ошибок распознавания.

Installation

Клонируйте репозиторий:

git clone https://github.com/Kitiketov/VeroVision.git
cd VeroVision

Установите зависимости:

pip install PyQt5 pillow easyocr fuzzywuzzy
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

Запустите приложение:

python main.pyw

Tech Stack

  • Python
  • PyQt5
  • EasyOCR
  • PyTorch
  • Pillow
  • fuzzywuzzy

How it works

1. Загрузка изображения

Приложение умеет:

  • загружать изображение из файла;
  • вставлять картинку из буфера обмена.

2. Распознавание текста

Есть два режима работы:

  • Text mode — для обычного текста на русском и английском;
  • Code mode — для распознавания кода через кастомную OCR-модель.

3. Постобработка результата

После распознавания приложение может:

  • учитывать табуляцию и отступы;
  • исправлять часть ошибок в коде через словарь частых слов;
  • показать результат в окне;
  • скопировать текст в буфер;
  • сохранить результат в .txt.

Project structure

  • main.pyw — запуск приложения и инициализация окна
  • handler.py — логика загрузки, распознавания, сохранения и UI-обработчиков
  • design.py — сгенерированный PyQt-интерфейс
  • untitled.ui — исходный UI-файл
  • tab_detection.py — работа с табуляцией и форматированием
  • recognition/text_recognition.py — основная логика OCR
  • recognition/image_preprocessing.py — предобработка изображений
  • recognition/postprocessing.py — постобработка распознанного текста
  • recognition/common_words.txt — словарь для исправления типичных ошибок
  • custom_EasyOCR/ — кастомная модель для режима распознавания кода
  • test image/ — тестовые изображения

Authors

About

Программа для распознавания текста с изображений, сделанная для индивидуально школьного проекта.

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages