Как отличить текст нейросети от реального человека? Можно не смотреть на длинные тире

Пять маркеров, по которым вы сразу увидите сгенерированный пост.

Журналист New York Times Сэм Крисс написал колонку с заголовком «Почему ИИ пишет… так?». Автор признался, что впервые столкнулся с первой нейросетью GPT еще шесть лет назад и внимательно следил за новой версией ChatGPT с 2022 года.

Крисс вывел несколько общих черт нейросетевых текстов. Во-первых, они используют тире – совсем не всегда длинное (эту функцию можно отключить), но строят предложения строго с его помощью.

Во-вторых, искусственный интеллект всегда юзает конструкцию «Это не X, это Y». Журналист нашел примеры в речах Камалы Харрис и Джо Байдена. В частности, экс-президент США сказал: «Проект бюджета от республиканцев не только безрассуден – он жесток» (да, Сэм подозревает спичрайтеров главы Белого дома в использовании ИИ).

В-третьих, у ChatGPT ограниченный словарный запас, поэтому он часто выбирает глагол delve (погружаться). Автор New York Times подсчитал, что в базе статей по биомедицинским наукам PubMed это слово до 2022 года встречалось в одной из 10 тысяч аннотаций. Но после 2024 года его использование выросло на 2700%. Тогда же депутаты парламента Великобритании резко начали начинать свои речи оборотом I rise to speak – прежде они так не говорили.

В-четвертых (и это продолжение предыдущего пункта), ИИ перебарщивает со словами «призрачный» и «тихий». Даже в новой версии ChatGPT в сгенерированном литературном рассказе из 1100 слов нашлись такие лексемы, как «тихо», «гул», «гудение», «эхо» (дважды), «пограничный» и «призраки».

«ИИ пытается писать хорошо. Он знает, что хорошее письмо предполагает тонкость: вещи, которые произносятся тихо или вовсе не произносятся, вещи, которые присутствуют наполовину и оставлены на то, чтобы читатель сам о них догадался. Чтобы воспроизвести этот эффект, ИИ во весь голос кричит о том, что абсолютно всё вокруг – тени, тонкости и тишина», – пояснил Крисс.

В-пятых, нейросети очень любят триады – писать в формате «Не X. Не Y. Только Z». А еще ChatGPT поймали за привычкой к саркастическим шуткам в формате «X с Y и Z». Например, если попросить ИИ-бота высмеять Илона Маска, он назовет его «реддит-троллем с вай-фаем и миллиардами». А прожарка синего цвета будет выглядеть так: «Просто бежевый с синдромом главного героя и проблемами с обязательствами».

Так что теперь вы знаете, на какие маркеры обращать внимание, чтобы отличать сгенерированный текст от написанного живым человеком.

Магистр «Что? Где? Когда?» устроил игру знатоков против ChatGPT. Кто победил?

Как отличить текст нейросети от реального человека? Можно не смотреть на длинные тире

Данил Тармасинов

Комментарии

Добавить комментарий Отменить ответ