Большинство сайтов, утверждающих, что они перехватывают написанный искусственным интеллектом текст, терпят неудачу

По мере того, как ажиотаж вокруг генеративного ИИ растет, критики призывают создателей технологии принять меры для смягчения ее потенциально вредных последствий. В частности, ИИ, генерирующий текст, привлек большое внимание - и не без оснований. Студенты могут использовать его для плагиата, контент-фермы могут использовать его для рассылки спама, а злоумышленники могут использовать его для распространения дезинформации.

OpenAI поддалась давлению несколько недель назад, выпустив инструмент-классификатор, который пытается отличить текст, написанный человеком, от синтетического. Но это не особенно точно; По оценкам OpenAI, он пропускает 74% текста, сгенерированного ИИ.

В отсутствие надежного способа обнаружения текста, исходящего от ИИ, возникла кустарная индустрия детекторных служб. ChatZero, разработанный студентом Принстонского университета, утверждает, что использует такие критерии, как «недоумение», чтобы определить, может ли текст быть написан ИИ. Детектор плагиата Turnitin разработала собственный детектор ИИ-текста. Помимо этого, поиск в Google выдает по крайней мере полдюжины других приложений, которые якобы способны отделять плод, созданный человеком, от плевел, созданного ИИ, чтобы истязать метафору.

Но действительно ли эти инструменты точны? Ставки высоки. В академической среде можно представить сценарий, в котором пропущенное обнаружение означает разницу между проходной и неудовлетворительной оценкой. Согласно одному опросу, почти половина студентов говорят, что использовали ChatGPT для домашних тестов или викторин, а более половины признались, что использовали его для написания эссе.

Чтобы выяснить, работают ли сегодняшние инструменты обнаружения текста с помощью ИИ, мы воспользовались системой, похожей на ChatGPT, под названием Claude, разработанной стартапом AI Anthropic, и создали восемь образцов письма в различных стилях. Мы специально попросили Клода сгенерировать:

Энциклопедическая статья о Мезоамерике
Рекламное электронное письмо для крема для обуви
Студийное сочинение о падении Рима
Новостная статья о президентских выборах в США 2020 года
Сопроводительное письмо на должность помощника юриста
Резюме инженера-программиста
Набросок эссе о достоинствах контроля над огнестрельным оружием

Хотя, по общему признанию, это не самый тщательный подход, мы хотели, чтобы он был простым - целью было оценить производительность детекторов текста ИИ на тексте, исходящем из одной системы ИИ (Клод). Мы протестировали несколько наиболее популярных детекторов, а именно собственный классификатор OpenAI, AI Write Check, GPTZero, Copyleaks, GPT Radar, CatchGPT и Originality.ai.

Статья в энциклопедии

Статья Клода в энциклопедии читается как статья из Британской энциклопедии, полная подробностей о подъеме, падении и длительном влиянии древних центральноамериканских цивилизаций. Идеи достаточно хорошо перетекают из абзаца в абзац, хотя и с добавлением непоследовательности (или двух), а стиль письма соответствует тому, что вы могли бы ожидать от академической публикации:

Мезоамерика - регион, охватывающий южную часть Мексики и Центральную Америку. Он был домом для доколумбовых обществ, которые имели общие культурные черты. Самые ранние сложные общества в Мезоамерике возникли около 3000 лет назад.

В Мезоамериканском культурном регионе преобладало выращивание кукурузы и возникновение сложных цивилизаций. Мезоамериканские цивилизации построили культовые храмы со ступенчатыми пирамидами и другую монументальную архитектуру. Многие из этих цивилизаций имели богатые мифологические и религиозные традиции, а также сложные календарные системы и математику.

Основные мезоамериканские цивилизации включали ольмеков, теотиуаканов, майя, сапотеков, миштеков, уастеков, государство тарасков и ацтеков, с которыми столкнулся испанский конкистадор Эрнан Кортес в начале 16 века. Эти доколумбовые цивилизации известны своими архитектурными подвигами, а также достижениями в математике, астрономии и календарях. Они также известны развитием сложных сетей рыночного обмена и торговых путей, соединяющих побережья Тихого и Атлантического океанов.

После завоевания империи ацтеков испанцы построили Мехико на руинах столицы ацтеков Теночтитлана. Язык ацтеков, науатль, сегодня остается наиболее распространенным языком коренных народов Мексики. Мезоамериканские культурные черты, такие как выращивание кукурузы, здания со ступенчатыми пирамидами и монументальные скульптуры, сохранились в период после завоевания и до сих пор присутствуют в современной мексиканской культуре.

По этим причинам мы предсказали, что текст вызовет проблемы у детекторов, и так и случилось. Из протестированных только два, GPTZero и Originality.ai, правильно классифицировали текст как сгенерированный ИИ. Остальные потерпели неудачу. Классификатор OpenAI изначально не был достаточно уверен, чтобы дать ответ, в то время как Оригинальность.ai дал тексту только 4% шанс быть написанным ИИ. Не лучший вид.

Классификатор OpenAI: классифицирован неправильно
Проверка письма AI: классифицирован неправильно
GPTZero: классифицировано правильно
Copyleaks: Неправильная классификация
GPT Radar: классифицирован неправильно
CatchGPT: неправильно классифицировано
Originality.ai: Неправильная классификация

Маркетинговая электронная почта

Клип Клода в социальных сетях представляет собой юмористическую смесь реальных и надуманных подробностей, но нет явного намека на то, что текст сгенерирован искусственным интеллектом. Он включает в себя цену и призыв к действию, даже - как аккуратно! Предупреждаем копирайтеров рекламы:

Тема: Стойкий блеск

Ваша обувь выглядит скучной и изношенной? С кремом для обуви Super Shine вы можете вернуть своей обуви глянцевый, как новый блеск и защитить ее от повреждений и износа.

Super Shine изготовлен из восков и красителей высочайшего качества и доступен в различных нейтральных и глянцевых цветах, подходящих для любого типа обуви или кожи. Наша полироль имеет уникальную формулу для очистки, полировки и защиты вашей обуви одним нанесением. Кондиционирующие масла проникают в кожу, питая ее изнутри, в то время как пигменты покрывают потертости и царапины, а защитный восковой слой запечатывает блеск, отталкивая воду и другие элементы.

Идеальный блеск еще никогда не был таким простым: просто сотрите грязь влажной тканью, нанесите Super Shine мягкой кистью и отполируйте до яркого блеска. Наш лак высыхает до твердого состояния, так что вы не оставите следов на руках или одежде. А поскольку немногого хватает, одной баночки хватит для полировки до 100 пар обуви.

Никогда больше не соглашайтесь на тусклую обувь. Если вы хотите, чтобы блеск вызывал восхищение, выберите Super Shine - его можно приобрести в местном магазине за 9,99 долларов США

Этот фрагмент поставил в тупик все детекторы, невероятно. Но, честно говоря, она была короче, чем статья в нашей энциклопедии. А детекторы, как правило, лучше работают с более длинными образцами текста, где закономерности более очевидны.

Классификатор OpenAI: классифицирован неправильно
Проверка письма AI: классифицирован неправильно
GPTZero: классифицирован неправильно
Copyleaks: Неправильная классификация
GPT Radar: классифицирован неправильно
CatchGPT: неправильно классифицировано
Originality.ai: Неправильная классификация

Сочинение в колледже

Клод не мог написать нам очень длинное студенческое сочинение из-за его технических ограничений, но, как бы компенсируя это, ИИ упаковал как можно больше деталей в несколько коротких абзацев. Образец, безусловно, содержит элементы типичного классного эссе, в том числе тезис, заключение (если не особенно резкое) и подтверждающие ссылки на исторические события:

Могущественная Римская империя: что привело к ее падению?

Римская империя была одной из величайших и самых продолжительных империй в истории. Однако к V веку нашей эры Римская империя вступила в период упадка и падения. Было несколько основных причин падения Рима: политическая нестабильность и коррупция, вторжения варваров, экономический спад и чрезмерная зависимость от рабов и военных трофеев.

В политическом плане поздняя Римская империя была полна гражданских войн, переворотов и соперничающих претендентов на престол. Эта постоянная борьба за власть истощала ресурсы империи и затрудняла борьбу с другими угрозами. Императоры использовали преторианскую гвардию, чтобы захватить власть, но затем они были убиты, и новые императоры поднялись, продолжая цикл.

По мере того, как империя слабела, вторгшиеся варварские племена увидели возможность. В 410 году н. э. вестготы разграбили сам Рим, нанеся шокирующий удар по престижу империи. Позже другие племена вторглись и захватили территорию в пределах империи, иногда получая землю в обмен на предоставление солдат римской армии. Эти племена ослабили империю, но привнесли новые обычаи и культуры.

Экономически в Риме была система, основанная на завоевании и добыче, а не на производстве. Стоимость содержания большой империи, легионов солдат, грандиозных зрелищ и развлечений была довольно высока. Как только рост замедлился, а новые завоевания принесли меньше богатства, неустойчивая экономическая система пошатнулась. В то же время рабы выполняли большую часть труда, и стимулов для улучшения сельскохозяйственных технологий или методов ведения бизнеса было мало.

Итак, Римская империя пала по многим причинам, включая политическую нестабильность, вторжения варваров, экономический спад и чрезмерную зависимость от рабства. В конечном счете, он не смог противостоять совокупному воздействию этих огромных внутренних и внешних давлений. Хотя Римская империя в конце концов пала, ее наследие живет в наших законах, культуре, языках и многом другом - постоянное напоминание о ее непреходящем величии.

Естественности текста хватило, чтобы в очередной раз победить большинство классификаторов, хотя и меньше, чем с маркетинговой копией. Это не сулит ничего хорошего педагогам, надеющимся положиться на эти инструменты; в отличие от обнаружения плагиата, обнаружение текста, сгенерированного искусственным интеллектом, является гораздо более тонкой задачей.

Классификатор OpenAI: классифицирован неправильно
Проверка письма AI: классифицирован неправильно
GPTZero: классифицировано правильно
Copyleaks: Неправильная классификация
GPT Radar: классифицирован неправильно
CatchGPT: классифицировано правильно
Originality.ai: Неправильная классификация

План эссе

Большинство школьников умеют набросать сочинение. Так может и ИИ - Клод, не вспотев, выложил набросок эссе с плюсами и минусами о преимуществах контроля над огнестрельным оружием. Он снабжал каждый абзац (например, «Основной абзац», «Анализ и обсуждение»), поддерживая беспристрастный тон в отношении вызывающей разногласия темы:

I) Введение. Расскажите о контроле над огнестрельным оружием и обратите внимание на то, что, хотя многие люди утверждают, что люди должны иметь право на ношение оружия, другие утверждают, что законодательство о контроле над огнестрельным оружием может помочь снизить уровень насилия с применением огнестрельного оружия.

II) Основной абзац 1: Аргумент в пользу контроля над огнестрельным оружием: Сторонники утверждают, что легкий доступ к огнестрельному оружию приводит к большему количеству убийств, самоубийств и других смертей, связанных с применением огнестрельного оружия. Они отмечают, что в штатах с более строгими законами об оружии меньше смертей, связанных с огнестрельным оружием. Более строгие меры, такие как проверка биографических данных, периоды ожидания и ограничения на штурмовое оружие, могут помочь спасти жизни, не допуская попадания оружия в руки преступников, террористов и других опасных лиц.

III) Основной параграф 2: Аргумент против контроля над оружием: Оппоненты возражают, что люди имеют право на самооборону и что «хорошие» люди должны иметь возможность иметь огнестрельное оружие для защиты от «плохих» людей. Они утверждают, что владение оружием является важной свободой и что ответственные, законопослушные граждане должны иметь возможность владеть огнестрельным оружием. Они утверждают, что законодательство о контроле над оружием не удержит преступников, которые всегда найдут способы получить доступ к огнестрельному оружию. Более строгие законы только ограничат свободы простых людей и сделают их менее безопасными.

IV) Анализ и обсуждение: Обсудите точки зрения обеих сторон и проанализируйте достоинства и недостатки каждого аргумента. Например, снизят ли ограничения оружия насилие с применением огнестрельного оружия или просто ограничат свободы? Разоружают ли ограничения добропорядочных граждан и подвергают ли их риску или в основном сдерживают безответственных людей или преступников? Могут ли некоторые меры, такие как проверка биографических данных, достичь баланса? Объясните сложности, связанные с проблемами и уровнем насилия с применением огнестрельного оружия в различных областях с различными уровнями ограничений.

V) Заключение: Завершите эссе повторным анализом и общими выводами о достоинствах законодательства о контроле над оружием. Обратите внимание на многогранный характер проблем и приведите аргументы в пользу дальнейших действий, которые потенциально могли бы снизить насилие с применением огнестрельного оружия при соблюдении прав человека.

Контур меня обманул, но детекторам пришлось попроще. Три - классификатор OpenAI, GPTZero и CatchGPT - прижились.

Классификатор OpenAI: классифицирован правильно
Проверка письма AI: классифицирован неправильно
GPTZero: классифицировано правильно
Copyleaks: Неправильная классификация
GPT Radar: классифицирован неправильно
CatchGPT: классифицировано правильно
Originality.ai: Неправильная классификация

Новостная статья

Как и в предыдущих примерах, в новостной статье, которую мы создали с помощью Клода, нет ничего явно искусственного. Он хорошо читается, структурирован более или менее в стиле перевернутой пирамиды. И не содержит явных фактических ошибок или логических нестыковок:

Байден побеждает Трампа на выборах в США в 2020 году, завершая раскольническую кампанию

Бывший вице-президент Джо Байден победил президента Трампа на выборах, которые собрали рекордное количество избирателей и стали референдумом о бурном пребывании Трампа на посту.

Мистер. Победа Байдена означала отвержение г-на Трампа миллионами избирателей после четырех чрезвычайно бурных лет, которые вызвали жаркие дебаты о национальных ценностях и будущем. Г-н Байден выступал за планы по расширению здравоохранения, решению проблемы экономического неравенства и борьбе с изменением климата, поклявшись при этом «восстановить душу нации» и призвать американцев к общей цели.

В кратком заявлении, сделанном в субботу утром, г-н Байден сказал, что он «польщен и унижен» доверием, которое оказал ему американский народ. «Битва окончена, но кампания по восстановлению души нации только началась», - сказал он из Уилмингтона, штат Делавэр, когда празднующие возликовали и просигналили рядом с автомобилями. «Американцам пора объединиться».

Мистер. Трамп не собирался уступать, заявляя без доказательств, что выборы были «сфальсифицированы» и что его раннее лидерство в некоторых штатах в ночь выборов показало, что он был законным победителем. На выборах, которые, по словам должностных лиц штата и сторонних экспертов, прошли гладко в разгар смертельной пандемии, не было зарегистрировано серьезных нарушений.

Результат сводился к отказу от вызывающих разногласия призывов г-на Трампа к расовым недовольствам и жесткой реакции на вирус, который унес более 232 000 жизней в Соединенных Штатах и оставил миллионы без работы.

Неудивительно, что детекторы боролись. За исключением GPTZero, никому не удалось правильно классифицировать статью. Originality.ai зашел так далеко, что дал ему 0%-ную вероятность того, что он будет сгенерирован искусственным интеллектом. Здорово.

Классификатор OpenAI: классифицирован неправильно
Проверка письма AI: классифицирован неправильно
GPTZero: классифицировано правильно
Copyleaks: Неправильная классификация
GPT Radar: классифицирован неправильно
CatchGPT: неправильно классифицировано
Originality.ai: Неправильная классификация

Сопроводительное письмо

Сопроводительное письмо, которое мы создали вместе с Клодом, имеет все признаки прямой и серьезной профессиональной переписки. Он подчеркивает навыки вымышленного кандидата на должность помощника юриста, придумывает название юридической фирмы (несколько своеобразно) и делает ссылки на такие инструменты юридического поиска, как Westlaw и LexisNexis:

Уважаемый менеджер по найму, Я пишу, чтобы выразить большой интерес к должности помощника юриста в вашей фирме. Я считаю, что мой опыт и образование в области права делают меня отличным кандидатом на эту должность.

В течение последних двух лет я работала помощником юриста в юридической фирме Smith & Jones, где приобрела обширный опыт поддержки адвокатов по всем аспектам гражданских судебных дел. Я систематизировал и хранил тысячи страниц юридических документов, включая стенограммы, показания под присягой и исследовательские материалы. Я также оптимизировал корпоративную систему управления файлами, что позволило значительно сэкономить время. Кроме того, я вел переписку с клиентами, адвокатами противоположной стороны и третьими лицами; помощь в судебных процессах; и завершенные юридические исследовательские проекты для поддержки досудебных ходатайств и переговоров об урегулировании.

До того, как стать помощником юриста, я получил степень младшего специалиста по параюридическим исследованиям в [название колледжа]. Мои курсы и стажировки заложили прочную основу в таких ключевых областях, как юридические исследования и написание текстов, а также знание соответствующего программного обеспечения и баз данных, включая Westlaw и LexisNexis. Я постоянно совершенствую свои навыки и знания благодаря постоянному профессиональному развитию.

Помимо моего опыта работы и образования, я прилежный и внимательный к деталям человек с отличными организаторскими и коммуникативными навыками. Я преуспеваю в быстро меняющейся среде и умею балансировать и расставлять приоритеты для сложных, срочных задач, чтобы уложиться в сжатые сроки. Буду признателен за возможность внести свой вклад в успех клиентов и дел вашей фирмы.

Спасибо за внимание. Я с нетерпением жду возможности поговорить с вами об этой возможности.

С уважением, [Ваше имя]

Письмо поставило в тупик классификатор OpenAI, который не мог с уверенностью сказать, было ли оно написано искусственным интеллектом или человеком. GPTZero и CatchGPT смогли распознать текст, сгенерированный ИИ, но остальные детекторы не смогли добиться того же.

Классификатор OpenAI: классифицирован неправильно
Проверка письма AI: классифицирован неправильно
GPTZero: классифицировано правильно
Copyleaks: Неправильная классификация
GPT Radar: классифицирован неправильно
CatchGPT: классифицировано правильно
Originality.ai: Неправильная классификация

Резюме

Сочетание поддельного сопроводительного письма с поддельным резюме казалось уместным. Мы попросили Клода написать один для инженера-программиста, и в основном он сработал. У нашего воображаемого кандидата есть эклектичное сочетание навыков программирования, но ни один из них не выделяется особенно неправдоподобно:

• Джон Доу

• Инженер-программист, 3 года опыта

• [email protected] • 123-456-7890

• Технические навыки: Java, JavaScript, C++, SQL, MySQL, Git, методология Agile, разработка ПО, алгоритмы, структуры данных

• Профессиональный опыт:

› ACME Corp, инженер-программист, с 2018 г. по настоящее время

› Работал над основными компонентами флагманского продукта компании - платформы анализа больших данных на основе SaaS.

› Руководил проектированием и разработкой модуля приема данных, способного обрабатывать огромные объемы потоковых данных. Используется Java и MySQL.

› Сокращение ошибок исходящих данных на 42 % за счет внедрения передовых алгоритмов проверки и исправления данных.

› Компания XYZ Tech, инженер-программист-стажер, лето 2017 г.

› Разрабатывал серверные компоненты для электронной коммерции с использованием JavaScript и Node.js.

› Прототип и демонстрация масштабирования основных баз данных и API для обеспечения пятикратного роста.

• Образование:

› Бакалавр компьютерных наук, Большой технический университет, 2017

› Курсы включали алгоритмы, операционные системы, машинное обучение, архитектуру программного обеспечения и теорию вычислений.

› 3.8 GPA

• Навыки: аналитические, коммуникативные, умение решать проблемы, внимание к деталям

• Интересы: бег, чтение и походы

Видно, детекторы согласны. Поддельное резюме поставило в тупик даже GPTZero, который до этого момента был самым надежным из всех.

Классификатор OpenAI: классифицирован неправильно
Проверка письма AI: классифицирован неправильно
GPTZero: классифицирован неправильно
Copyleaks: Неправильная классификация
GPT Radar: классифицирован неправильно
CatchGPT: классифицировано правильно
Originality.ai: Неправильная классификация

Беда с классификаторами

После всех этих испытаний какие выводы мы можем сделать? Вообще говоря, детекторы AI-текста плохо справляются с обнаружением. GPTZero был единственным стабильным исполнителем, правильно классифицировавшим текст, созданный ИИ, пять раз из семи. В остальном не очень. CatchGPT был вторым по точности с четырьмя из семи правильных классификаций, в то время как классификатор OpenAI занял третье место с одной из семи.

Так почему детекторы текста ИИ такие ненадежные?

Детекторы - это, по сути, языковые модели ИИ, обученные на многих, многих примерах общедоступного текста из Интернета и точно настроенные для прогнозирования вероятности того, что фрагмент текста был сгенерирован ИИ. Во время обучения детекторы сравнивают текст с похожим (но не точно таким же) написанным человеком текстом с веб-сайтов и других источников, чтобы попытаться изучить шаблоны, которые выдают происхождение текста.

Проблема в том, что качество генерируемого ИИ текста постоянно улучшается, а детекторы, скорее всего, обучены на множестве примеров из старых поколений. Если они не переобучаются на почти непрерывной основе, модели классификатора со временем станут менее точными.

Конечно, любой из классификаторов можно легко обойти, изменив некоторые слова или предложения в тексте, сгенерированном ИИ. Для решительных студентов и мошенников это, скорее всего, станет игрой в кошки-мышки. По мере совершенствования ИИ, генерирующего текст, будут улучшаться и детекторы.

Хотя классификаторы могут помочь в определенных обстоятельствах, они никогда не будут надежным единственным доказательством при принятии решения о том, был ли текст сгенерирован искусственным интеллектом. Это все говорит о том, что не существует панацеи для решения проблем, которые создает текст, созданный ИИ. Скорее всего, никогда не будет.