Skip to content

tsalkin/russian-humanizer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Russian Humanizer · «Живое слово»

English: README.en.md

Открытый инструмент, который превращает машинный русский текст в живой — опираясь на редакторскую традицию (Нора Галь, Чуковский, Розенталь, Мильчин). Убирает канцелярит, translationese, AI-штампы и машинную типографику, но бережёт смысл, термины, жанр и голос автора.

Чем отличается

На рынке уже есть Главред, «Тургенев», AI-детекторы и пара humanizer-ru. Этот проект делает то, чего нет у них вместе:

  1. Цель — аутентичность, а не обход AI-детекторов. Антидетекция — гонка вооружений, устаревает с каждым релизом детектора. Живой текст — устойчивая ценность.
  2. Русская физика маркеров, а не перевод английских правил: канцелярит, нанизывание родительных падежей, кальки английского синтаксиса.
  3. Защита от переисправления — первоклассная фича. Инструмент не «гильотина»: он знает, где пассив, повтор, термин или антитеза — норма, и не трогает их.
  4. Осторожный гибрид. Сам правит только однозначный мусор; рискованное предлагает с объяснением, решает человек.
  5. Объяснимость. Каждая правка: признак → источник правила → риск → исключения.

Принцип

Языковая модель выбирает статистически самое вероятное продолжение — подходящее наибольшему числу контекстов. Отсюда вся машинность: обобщения, симметрия, дежурные связки, ровный ритм. Очеловечивание — намеренный выбор менее вероятного, но более характерного и конкретного варианта.

Структура

russian-humanizer/
├── SKILL.md                       # ядро: алгоритм, двойной проход, аудит
├── references/
│   ├── patterns.md                # каталог маркеров (разделы 1–6)
│   ├── kantselyarit-dict.md       # словарь замен канцелярит/AI-лексика → живое
│   ├── translationese.md          # следы перевода с английского
│   ├── style-rules.md             # Галь/Чуковский/Розенталь → правила + схема
│   ├── false-positives.md         # защита от переисправления (ядро!)
│   └── automation-policy.md       # что правим сами, что предлагаем; пороги
├── prompt/standalone-prompt.md    # версия-промпт для любой LLM
├── evals/
│   ├── before-after.md            # тест-кейсы до/после по жанрам
│   └── false-positive-tests.md    # негативные тесты (что не трогать)
└── docs/quality-metrics.md        # как мерить качество

Установка и использование

Как скилл Claude (Claude.ai / Code / API): загрузи в Settings → Skills (или положи в ~/.claude/skills/, или передай через container.skills). Скилл срабатывает по запросу «очеловечь / убери канцелярит / перепиши живым языком».

Как промпт в любой LLM: возьми prompt/standalone-prompt.md, вставь в чат, добавь текст.

Режимы: «очеловечь: [текст]» — вернёт переписанное; «покажи, что поменял» — добавит разбор. Рискованные правки инструмент помечает отдельно.

Для локализаторов EN→RU

Отдельная ценность для тех, кто переводит на русский. Translationese — главный дефект перевода EN→RU: английский исходник просвечивает через русский синтаксис и коллокации. Файл references/translationese.md — прямой чек-лист против этого: дословные идиомы, артикль-подобные конструкции, избыточные притяжательные, кальки логических связок.

Качество

Главная метрика — слепая оценка носителями, а не балл детектора (детекторы и перплексия — только диагностика). Смысл проверяется через NLI; переисправление ловится отдельным контрольным набором. Подробно — docs/quality-metrics.md.

Источники

Wikipedia: Signs of AI writing · Н. Галь «Слово живое и мёртвое» · К. Чуковский «Живой как жизнь» · Д. Розенталь (управление, стилистика) · А. Мильчин (типографика) · М. Ильяхов (инфостиль). Каркас и идея двойного прохода — blader/humanizer (MIT). Принципы переданы своими словами, без дословного цитирования.

Лицензия

MIT — см. LICENSE.

About

Turn machine-sounding Russian into living prose. Removes bureaucratese, translationese and AI clichés — while preserving meaning, terms and the author's voice. Grounded in the Russian editorial tradition (Gal, Chukovsky, Rosenthal). Authenticity, not detector evasion.

Topics

Resources

License

Contributing

Stars

Watchers

Forks

Packages

 
 
 

Contributors