44 маркера, по которым ваш текст опознают как нейросетевой. И как их убрать

Медиасообщество

Вы написали пост, статью, описание продукта. Перечитали. Вроде нормально. Отправили коллеге, тот спрашивает: «Это GPT писал?»

Обидно. Особенно когда вы потратили час на промпт и три итерации.

Проблема не в том, что вы используете нейросеть. Проблема в том, что нейросеть оставляет следы. Конкретные, измеримые, детектируемые. Мы собрали 44 таких следа в один каталог, разобрались, почему они появляются, и сделали open-source инструмент, который их убирает.

Почему AI-текст звучит мёртво

Языковая модель выбирает статистически наиболее вероятное продолжение. Каждое следующее слово, каждое предложение стремится к среднему: самый типичный оборот, самая ожидаемая структура. Результат гладкий, грамотный и совершенно никакой. Как музак в лифте: технически музыка, но никто её не запоминает.

Человеческий текст устроен иначе. Он неровный. Длинное предложение с тремя уточнениями. Потом короткое. Вопрос? Можно и так. Автор перескакивает с мысли на мысль, возвращается, вставляет ремарку в скобках (вот как сейчас). Эта неровность и есть подпись автора.

Детекторы это знают. GPTZero, Originality.ai, DivEye измеряют ровно две вещи:

Perplexity (предсказуемость). Насколько каждое следующее слово ожидаемо. У AI-текста perplexity низкая: всё предсказуемо. У человека она скачет.

Burstiness (всплески). Насколько разнообразна структура по документу. AI пишет равномерно: все предложения примерно одной длины и сложности. Человек чередует.

Для русского языка добавляется третий фактор: морфологическая корректность. RuBERT-детекторы проверяют падежные цепочки и согласования. AI и люди ошибаются по-разному: модель путает падежи в длинных конструкциях, а живой человек скорее перепутает -тся/-ться.

Что конкретно выдаёт нейросеть
Мы разобрали 44 паттерна AI-генерации в русском тексте и разложили их по 10 категориям. Вот самые частые.

Пустые открытия
AI обожает начинать с космоса.

«В современном динамично развивающемся мире искусственный интеллект играет всё более важную роль в различных сферах жизнедеятельности человека.»

Удалите первый абзац. Настоящий текст начинается со второго. Или начните с факта: «GPT-4 вышел в марте 2023-го. Через полгода его использовали 92% компаний из Fortune 500.»

Канцелярит
Главный маркер. Модель превращает глаголы в существительные: «осуществление внедрения системы» вместо «внедрили систему». «Реализация проекта завершена» вместо «проект завершён».

Правило простое: если видите слово на «-ание», «-ение», «-ация», проверьте, нет ли нормального глагола.

Длинное тире
AI ставит длинное тире (—) в каждом втором предложении. Детекторы считают частоту em-dash как один из статистических маркеров. Запятая, двоеточие, точка, дефис (-) вместо него.

«Не просто X, а Y»
Фирменная формула GPT. Встречается в 80%+ текстов. «Не просто инструмент, а партнёр». «Не только ускоряет, но и трансформирует». Скажите прямо: «Это партнёр» или «Ускоряет и трансформирует». Без дипломатических реверансов.

Равномерная информационная плотность
Этот паттерн ловят детекторы нового поколения (DivEye, 2025). AI распределяет факты равномерно: каждое предложение несёт одинаковый «вес». Человек чередует: плотный абзац с цифрами, потом лёгкая связка, личное отступление, снова удар.

До: «AI увеличивает производительность на 40%. Он также снижает количество ошибок на 25%. Кроме того, он ускоряет время вывода продукта на рынок на 30%.»

После: «Производительность выросла на 40%, ошибок стало на четверть меньше. Это на бумаге. На практике половина команды не доверяет модели и перепроверяет вручную. Но те, кто доверился, выкатывают на 30% быстрее.»

Ещё 39 паттернов
Синонимическая карусель (AI чередует «компания», «организация», «предприятие» для одной сущности). Шаблонные переходы («Давайте рассмотрим подробнее...»). Водянистость (текст можно сократить вдвое без потери смысла). Идеальная типографика (все тире, кавычки, пробелы по ГОСТу, чего живой человек в мессенджере никогда не делает). И так далее.

Полный каталог с примерами до/после, приоритетами (от критических до стилистических) и быстрым сканером для аудита: github.com/ilyautov/humanizer-ru

Источник: vc.ru