Продвинутая токенизация для русского языка с SynTagRus паттернами
-
Updated
Nov 11, 2025 - Python
Продвинутая токенизация для русского языка с SynTagRus паттернами
Инструмент для подсчёта упоминаний ключевых слов и фраз в русскоязычных текстах из Excel (новости РБК). Поддерживает лемматизацию (pymorphy2), токенизацию (razdel), анализ по датам, построение топа ключей и два режима поиска фраз — с учётом порядка слов и без.
Пушкин против Ершова: кто победит в дуэли стилей? Сравнил на Python словарь, ритм и грамматику — результат шокировал! https://dzen.ru/video/watch/69132bcfaedabb2e247560a7
Искал и нашел анафоры в рассказе Паустовского с помощью Python. Почему так мало? https://dzen.ru/video/watch/6904815b2e906c2a4a953745
Add a description, image, and links to the razdel topic page so that developers can more easily learn about it.
To associate your repository with the razdel topic, visit your repo's landing page and select "manage topics."