Как отличить текст нейросети от реального человека? Можно не смотреть на длинные тире
Пять маркеров, по которым вы сразу увидите сгенерированный пост.
Журналист New York Times Сэм Крисс написал колонку с заголовком «Почему ИИ пишет… так?». Автор признался, что впервые столкнулся с первой нейросетью GPT еще шесть лет назад и внимательно следил за новой версией ChatGPT с 2022 года.
Крисс вывел несколько общих черт нейросетевых текстов. Во-первых, они используют тире – совсем не всегда длинное (эту функцию можно отключить), но строят предложения строго с его помощью.
Во-вторых, искусственный интеллект всегда юзает конструкцию «Это не X, это Y». Журналист нашел примеры в речах Камалы Харрис и Джо Байдена. В частности, экс-президент США сказал: «Проект бюджета от республиканцев не только безрассуден – он жесток» (да, Сэм подозревает спичрайтеров главы Белого дома в использовании ИИ).
В-третьих, у ChatGPT ограниченный словарный запас, поэтому он часто выбирает глагол delve (погружаться). Автор New York Times подсчитал, что в базе статей по биомедицинским наукам PubMed это слово до 2022 года встречалось в одной из 10 тысяч аннотаций. Но после 2024 года его использование выросло на 2700%. Тогда же депутаты парламента Великобритании резко начали начинать свои речи оборотом I rise to speak – прежде они так не говорили.

В-четвертых (и это продолжение предыдущего пункта), ИИ перебарщивает со словами «призрачный» и «тихий». Даже в новой версии ChatGPT в сгенерированном литературном рассказе из 1100 слов нашлись такие лексемы, как «тихо», «гул», «гудение», «эхо» (дважды), «пограничный» и «призраки».
«ИИ пытается писать хорошо. Он знает, что хорошее письмо предполагает тонкость: вещи, которые произносятся тихо или вовсе не произносятся, вещи, которые присутствуют наполовину и оставлены на то, чтобы читатель сам о них догадался. Чтобы воспроизвести этот эффект, ИИ во весь голос кричит о том, что абсолютно всё вокруг – тени, тонкости и тишина», – пояснил Крисс.
В-пятых, нейросети очень любят триады – писать в формате «Не X. Не Y. Только Z». А еще ChatGPT поймали за привычкой к саркастическим шуткам в формате «X с Y и Z». Например, если попросить ИИ-бота высмеять Илона Маска, он назовет его «реддит-троллем с вай-фаем и миллиардами». А прожарка синего цвета будет выглядеть так: «Просто бежевый с синдромом главного героя и проблемами с обязательствами».
Так что теперь вы знаете, на какие маркеры обращать внимание, чтобы отличать сгенерированный текст от написанного живым человеком.
Магистр «Что? Где? Когда?» устроил игру знатоков против ChatGPT. Кто победил?
Комментарии