Tech

Testamos todos os detectores de IA mais uma vez em 2024 – veja como eles fizeram

Ah, sim, detecção de IA. É vasqueiro ver um problema tão preponderante na tecnologia sem uma solução clara. Mas cá estamos em 2024, e o tema dos falsos positivos ainda prevalece porquê sempre.

Felizmente para nós, isso também significa que existe um vácuo nesse espaço que podemos resolver. Existem muitos detectores de IA hoje e tão poucas informações sobre quão precisos eles realmente são, com base em testes imparciais de terceiros. Logo, você adivinhou, nós entramos.

Ao longo deste item, testarei uma seleção escolhida a dedo de detectores de IA e determinarei, de uma vez por todas, qual deles é o mais preciso.

Nossos participantes

O que fiz foi reunir os detectores de IA mais confiáveis ​​do mercado. Cá está minha lista final de participantes deste lote de testes, muito porquê informações se eles estão disponíveis gratuitamente ou têm uma versão de teste:

Uma vez que isso vai ocorrer

Eu sei que você está ansioso para entrar em ação, mas primeiro, vamos tratar isso porquê um teste acadêmico real. Logo, vamos definir algumas regras básicas.

  1. Os testes serão separados em duas seções: um para IA e um para texto escrito por humanos para testar a taxa de falsos positivos.
  2. Para o teste de IA, cada detector será submetido a 12 testes: 3 cada para ChatGPT, Bard, Claude e texto gerado por IA que o Undetectable AI, um popular bypasser de detecção, ajusta.
  3. Para o teste falso positivo, cada detector será submetido a 5 testestodos os quais virão de domínio público ou de minha própria escrita.

Cá está outro problema: alguns detectores têm uma porcentagem de verosimilhança de IA e outros não. Existem também alguns detectores que informam se não há certeza, enquanto outros não. Portanto, para levar em conta isso, a pontuação de verosimilhança de IA para detectores sem um será calculada usando esta fórmula:

Screenshot 2024 02 01 132831Screenshot 2024 02 01 132831

Onde n é igual ao número de determinações possíveis pelo detector. Por exemplo, digamos que um detector de IA possa gerar (1) IA, (2) Provavelmente será IA, (3) Incerto, (4) É improvável que seja IA, e (5) Não IA. O pausa seria 100 dividido por 5-1, logo 25. Isso significaria que nossas pontuações serão padronizadas em 0%, 25%, 50%, 75% e 100%.

Esperançosamente, isso não é muito confuso. Exclusivamente tenha em mente que estou complicando um pouco isso para ser completamente justo.

Colocando detectores de IA à prova

Exclusivamente um aviso rápido: esta seção apresentará um monte de fotos mostrando a precisão da IA ​​de cada detector. Eu recomendo fortemente olhar cada um deles para prometer que não estou editando esses resultados. No entanto, se você deseja somente a narração final, pode pular para a próxima seção deste post.

IA de originalidade

Teste ChatGPT nº 1: Experimento

Screenshot 2024 02 01 150531Screenshot 2024 02 01 150531

Teste ChatGPT nº 2: História

Screenshot 2024 02 01 152117Screenshot 2024 02 01 152117

Teste ChatGPT nº 3: Missiva de apresentação

Screenshot 2024 02 01 160918Screenshot 2024 02 01 160918

Teste Cláudio #1: Experimento

Screenshot 2024 02 01 161621Screenshot 2024 02 01 161621

Teste Cláudio #2: História

Screenshot 2024 02 01 162450Screenshot 2024 02 01 162450

Teste Cláudio #3: Missiva de apresentação

Screenshot 2024 02 01 163454Screenshot 2024 02 01 163454

Teste de Poeta nº 1: Experimento

Screenshot 2024 02 01 164118Screenshot 2024 02 01 164118

Teste de Poeta #2: História

Screenshot 2024 02 01 164844Screenshot 2024 02 01 164844

Teste de Poeta nº 3: Missiva de apresentação

Screenshot 2024 02 01 165635Screenshot 2024 02 01 165635

IA indetectável + ChatGPT

Screenshot 2024 02 01 170340Screenshot 2024 02 01 170340

IA indetectável + Claude

Screenshot 2024 02 02 061421Screenshot 2024 02 02 061421

IA indetectável + Poeta

Screenshot 2024 02 02 061946Screenshot 2024 02 02 061946

Vazamentos de cópias

Teste ChatGPT nº 1: Experimento

Screenshot 2024 02 01 150613Screenshot 2024 02 01 150613

Teste ChatGPT nº 2: História

Screenshot 2024 02 01 152134Screenshot 2024 02 01 152134

Teste ChatGPT nº 3: Missiva de apresentação

Screenshot 2024 02 01 160951Screenshot 2024 02 01 160951

Teste Cláudio #1: Experimento

Screenshot 2024 02 01 161644Screenshot 2024 02 01 161644

Teste Cláudio #2: História

Screenshot 2024 02 01 162509Screenshot 2024 02 01 162509

Teste Cláudio #3: Missiva de apresentação

Screenshot 2024 02 01 163533Screenshot 2024 02 01 163533

Teste de Poeta nº 1: Experimento

Screenshot 2024 02 01 164142Screenshot 2024 02 01 164142

Teste de Poeta #2: História

Screenshot 2024 02 01 164906Screenshot 2024 02 01 164906

Teste de Poeta nº 3: Missiva de apresentação

Screenshot 2024 02 01 165653Screenshot 2024 02 01 165653

IA indetectável + ChatGPT

Screenshot 2024 02 01 170405Screenshot 2024 02 01 170405

IA indetectável + Claude

Screenshot 2024 02 02 061452Screenshot 2024 02 02 061452

IA indetectável + Poeta

Screenshot 2024 02 02 062116Screenshot 2024 02 02 062116

Teor em graduação

Teste ChatGPT nº 1: Experimento

Screenshot 2024 02 01 150643Screenshot 2024 02 01 150643

Teste ChatGPT nº 2: História

Screenshot 2024 02 01 152151Screenshot 2024 02 01 152151

Teste ChatGPT nº 3: Missiva de apresentação

Screenshot 2024 02 01 161005Screenshot 2024 02 01 161005

Teste Cláudio #1: Experimento

Screenshot 2024 02 01 161707Screenshot 2024 02 01 161707

Teste Cláudio #2: História

Screenshot 2024 02 01 162530Screenshot 2024 02 01 162530

Teste Cláudio #3: Missiva de apresentação

Screenshot 2024 02 01 163555Screenshot 2024 02 01 163555

Teste de Poeta nº 1: Experimento

Screenshot 2024 02 01 164202Screenshot 2024 02 01 164202

Teste de Poeta #2: História

Screenshot 2024 02 01 164928Screenshot 2024 02 01 164928

Teste de Poeta nº 3: Missiva de apresentação

Screenshot 2024 02 01 165713Screenshot 2024 02 01 165713

IA indetectável + ChatGPT

Screenshot 2024 02 01 170424Screenshot 2024 02 01 170424

IA indetectável + Claude

Screenshot 2024 02 02 061517Screenshot 2024 02 02 061517

IA indetectável + Poeta

Screenshot 2024 02 02 062143Screenshot 2024 02 02 062143

IA Winston

Teste ChatGPT nº 1: Experimento

Screenshot 2024 02 01 150712Screenshot 2024 02 01 150712

Teste ChatGPT nº 2: História

Screenshot 2024 02 01 152214Screenshot 2024 02 01 152214

Teste ChatGPT nº 3: Missiva de apresentação

Screenshot 2024 02 01 161026Screenshot 2024 02 01 161026

Teste Cláudio #1: Experimento

Screenshot 2024 02 01 161727Screenshot 2024 02 01 161727

Teste Cláudio #2: História

Screenshot 2024 02 01 162714Screenshot 2024 02 01 162714

Teste Cláudio #3: Missiva de apresentação

Screenshot 2024 02 01 163644Screenshot 2024 02 01 163644

Teste de Poeta nº 1: Experimento

Screenshot 2024 02 01 164223Screenshot 2024 02 01 164223

Teste de Poeta #2: História

Screenshot 2024 02 01 164949Screenshot 2024 02 01 164949

Teste de Poeta nº 3: Missiva de apresentação

Screenshot 2024 02 01 165812Screenshot 2024 02 01 165812

IA indetectável + ChatGPT

Screenshot 2024 02 01 170446Screenshot 2024 02 01 170446

IA indetectável + Claude

Screenshot 2024 02 02 061544Screenshot 2024 02 02 061544

IA indetectável + Poeta

Screenshot 2024 02 02 062214Screenshot 2024 02 02 062214

GPTZero

Teste ChatGPT nº 1: Experimento

Screenshot 2024 02 01 150738Screenshot 2024 02 01 150738

Teste ChatGPT nº 2: História

Screenshot 2024 02 01 152237Screenshot 2024 02 01 152237

Teste ChatGPT nº 3: Missiva de apresentação

Screenshot 2024 02 01 161044Screenshot 2024 02 01 161044

Teste Cláudio #1: Experimento

Screenshot 2024 02 01 161751Screenshot 2024 02 01 161751

Teste Cláudio #2: História

Screenshot 2024 02 01 162845Screenshot 2024 02 01 162845

Teste Cláudio #3: Missiva de apresentação

Screenshot 2024 02 01 163716Screenshot 2024 02 01 163716

Teste de Poeta nº 1: Experimento

Screenshot 2024 02 01 164245Screenshot 2024 02 01 164245

Teste de Poeta #2: História

Screenshot 2024 02 01 165016Screenshot 2024 02 01 165016

Teste de Poeta nº 3: Missiva de apresentação

Screenshot 2024 02 01 165745Screenshot 2024 02 01 165745

IA indetectável + ChatGPT

Screenshot 2024 02 01 170528Screenshot 2024 02 01 170528

IA indetectável + Claude

Screenshot 2024 02 02 061631Screenshot 2024 02 02 061631

IA indetectável + Poeta

Screenshot 2024 02 02 062300Screenshot 2024 02 02 062300

ZeroGPT

Teste ChatGPT nº 1: Experimento

Screenshot 2024 02 01 150827Screenshot 2024 02 01 150827

Teste ChatGPT nº 2: História

imageimage

Teste ChatGPT nº 3: Missiva de apresentação

Screenshot 2024 02 01 161112Screenshot 2024 02 01 161112

Teste Cláudio #1: Experimento

Screenshot 2024 02 01 161816Screenshot 2024 02 01 161816

Teste Cláudio #2: História

Screenshot 2024 02 01 162904Screenshot 2024 02 01 162904

Teste Cláudio #3: Missiva de apresentação

Screenshot 2024 02 01 163736Screenshot 2024 02 01 163736

Teste de Poeta nº 1: Experimento

Screenshot 2024 02 01 164308Screenshot 2024 02 01 164308

Teste de Poeta #2: História

Screenshot 2024 02 01 165036Screenshot 2024 02 01 165036

Teste de Poeta nº 3: Missiva de apresentação

Screenshot 2024 02 01 165835Screenshot 2024 02 01 165835

IA indetectável + ChatGPT

Screenshot 2024 02 01 170551Screenshot 2024 02 01 170551

IA indetectável + Claude

Screenshot 2024 02 02 061655Screenshot 2024 02 02 061655

IA indetectável + Poeta

Screenshot 2024 02 02 062324Screenshot 2024 02 02 062324

IA de mudas

Teste ChatGPT nº 1: Experimento

Screenshot 2024 02 01 150859Screenshot 2024 02 01 150859

Teste ChatGPT nº 2: História

Screenshot 2024 02 01 152355Screenshot 2024 02 01 152355

Teste ChatGPT nº 3: Missiva de apresentação

Screenshot 2024 02 01 161125Screenshot 2024 02 01 161125

Teste Cláudio #1: Experimento

Screenshot 2024 02 01 161834Screenshot 2024 02 01 161834

Teste Cláudio #2: História

Screenshot 2024 02 01 162932Screenshot 2024 02 01 162932

Teste Cláudio #3: Missiva de apresentação

Screenshot 2024 02 01 163757Screenshot 2024 02 01 163757

Teste de Poeta nº 1: Experimento

Screenshot 2024 02 01 164326Screenshot 2024 02 01 164326

Teste de Poeta #2: História

Screenshot 2024 02 01 165102Screenshot 2024 02 01 165102

Teste de Poeta nº 3: Missiva de apresentação

Screenshot 2024 02 01 165851Screenshot 2024 02 01 165851

IA indetectável + ChatGPT

Screenshot 2024 02 01 170624Screenshot 2024 02 01 170624

IA indetectável + Claude

Screenshot 2024 02 02 061720Screenshot 2024 02 02 061720

IA indetectável + Poeta

Screenshot 2024 02 02 062349Screenshot 2024 02 02 062349

Repórter

Teste ChatGPT nº 1: Experimento

Screenshot 2024 02 01 150920Screenshot 2024 02 01 150920

Teste ChatGPT nº 2: História

Screenshot 2024 02 01 152412Screenshot 2024 02 01 152412

Teste ChatGPT nº 3: Missiva de apresentação

Screenshot 2024 02 01 161145Screenshot 2024 02 01 161145

Teste Cláudio #1: Experimento

Screenshot 2024 02 01 161850Screenshot 2024 02 01 161850

Teste Cláudio #2: História

Screenshot 2024 02 01 162948Screenshot 2024 02 01 162948

Teste Cláudio #3: Missiva de apresentação

Screenshot 2024 02 01 163817Screenshot 2024 02 01 163817

Teste de Poeta nº 1: Experimento

Screenshot 2024 02 01 164348Screenshot 2024 02 01 164348

Teste de Poeta #2: História

Screenshot 2024 02 01 165118Screenshot 2024 02 01 165118

Teste de Poeta nº 3: Missiva de apresentação

Screenshot 2024 02 01 165909Screenshot 2024 02 01 165909

IA indetectável + ChatGPT

Screenshot 2024 02 01 170646Screenshot 2024 02 01 170646

IA indetectável + Claude

Screenshot 2024 02 02 061743Screenshot 2024 02 02 061743

IA indetectável + Poeta

Screenshot 2024 02 02 062419Screenshot 2024 02 02 062419

O melhor detector de IA: teste de falso positivo

Usarei uma combinação de propriedades de domínio público e minha própria tese (para simular um envolvente acadêmico) porquê meus casos de teste. Para o primeiro, cá está o que usarei nesta seção:

  • Middlemarch por George Eliot.
  • Sobre Lazer por Vernon Lee.
  • Na preguiça por Christopher Morley.
  • Deitado na leito por GK Chesterton

Não vou escanear o texto inteiro em cada detector. Em vez disso, testarei somente as primeiras 300 palavras de cada documento. E antes que me esqueça, estas pontuações medirão a verosimilhança humana, em vez da IA.

IA de originalidade

Teste nº 1

Screenshot 2024 02 02 195859Screenshot 2024 02 02 195859

Teste #2

Screenshot 2024 02 02 200845Screenshot 2024 02 02 200845

Teste #3

Screenshot 2024 02 02 175122Screenshot 2024 02 02 175122

Teste #4

Screenshot 2024 02 02 201248Screenshot 2024 02 02 201248

Teste #5

Screenshot 2024 02 02 201855Screenshot 2024 02 02 201855

Vazamentos de cópias

Teste nº 1

Screenshot 2024 02 02 195920Screenshot 2024 02 02 195920

Teste #2

Screenshot 2024 02 02 200908Screenshot 2024 02 02 200908

Teste #3

Screenshot 2024 02 02 175146Screenshot 2024 02 02 175146

Teste #4

Screenshot 2024 02 02 201312Screenshot 2024 02 02 201312

Teste #5

Screenshot 2024 02 02 201915Screenshot 2024 02 02 201915

Teor em graduação

Teste nº 1

Screenshot 2024 02 02 195939Screenshot 2024 02 02 195939

Teste #2

Screenshot 2024 02 02 200923Screenshot 2024 02 02 200923

Teste #3

Screenshot 2024 02 02 195243Screenshot 2024 02 02 195243

Teste #4

Screenshot 2024 02 02 201333Screenshot 2024 02 02 201333

Teste #5

Screenshot 2024 02 02 201934Screenshot 2024 02 02 201934

IA Winston

Teste nº 1

Screenshot 2024 02 02 200013Screenshot 2024 02 02 200013

Teste #2

Screenshot 2024 02 02 200940Screenshot 2024 02 02 200940

Teste #3

Screenshot 2024 02 02 195305Screenshot 2024 02 02 195305

Teste #4

Screenshot 2024 02 02 201352Screenshot 2024 02 02 201352

Teste #5

Screenshot 2024 02 02 201950Screenshot 2024 02 02 201950

GPTZero

Teste nº 1

Screenshot 2024 02 02 200030Screenshot 2024 02 02 200030

Teste #2

Screenshot 2024 02 02 201003Screenshot 2024 02 02 201003

Teste #3

Screenshot 2024 02 02 195323Screenshot 2024 02 02 195323

Teste #4

Screenshot 2024 02 02 201405Screenshot 2024 02 02 201405

Teste #5

Screenshot 2024 02 02 202011Screenshot 2024 02 02 202011

ZeroGPT

Teste nº 1

Screenshot 2024 02 02 200050Screenshot 2024 02 02 200050

Teste #2

Screenshot 2024 02 02 201721Screenshot 2024 02 02 201721

Teste #3

Screenshot 2024 02 02 195349Screenshot 2024 02 02 195349

Teste #4

Screenshot 2024 02 02 201640Screenshot 2024 02 02 201640

Teste #5

Screenshot 2024 02 02 202602Screenshot 2024 02 02 202602

IA de mudas

Teste nº 1

Screenshot 2024 02 02 200108Screenshot 2024 02 02 200108

Teste #2

Screenshot 2024 02 02 201035Screenshot 2024 02 02 201035

Teste #3

Screenshot 2024 02 02 195555Screenshot 2024 02 02 195555

Teste #4

Screenshot 2024 02 02 201428Screenshot 2024 02 02 201428

Teste #5

Screenshot 2024 02 02 202634Screenshot 2024 02 02 202634

Repórter

Teste nº 1

Screenshot 2024 02 02 200124Screenshot 2024 02 02 200124

Teste #2

Screenshot 2024 02 02 201050Screenshot 2024 02 02 201050

Teste #3

Screenshot 2024 02 02 195620Screenshot 2024 02 02 195620

Teste #4

Screenshot 2024 02 02 201443Screenshot 2024 02 02 201443

Teste #5

Screenshot 2024 02 02 202112Screenshot 2024 02 02 202112

A narração final

Já disse isso antes e direi agora: Sapling AI merece mais reconhecimento por sua precisão. Ele não somente pode detectar texto de IA a uma milha (o segundo maior com 87,04%), mas também é o único detector de IA em nossos testes que conseguiu detectar a escrita humana (o maior com 93,84%) em todos os testes verdadeiramente positivos. Nossas menções honrosas incluem Copyleaks, Originalidade e Teor em Graduação, nessa ordem.

Você pode expressar isso Repórter é incrível na prevenção de falsos positivos, mas gostaria de oferecer uma desenlace dissemelhante: é incrivelmente tolerante. Isto é evidenciado pela sua confiabilidade com textos gerados por IA, onde só conseguiu ser 18,67% preciso. De todos os detectores que testei, posso expressar com segurança que o Writer é o mais indefinível.

Por outro lado, também posso expressar que o Winston é bastante confiável, mas é mais rigoroso que os outros detectores. Isso leva à pontuação positiva verdadeira mais baixa. Ainda é venerável, visto que alimentei esses detectores com textos acadêmicos e literatura, mas definitivamente pior do que outros.

Se você estiver interessado na versão completa, cá está uma transcrição tabulada dos resultados.

Qual é o veredicto?

Logo, qual detector de IA você deve usar?

Você viu nossos testes e, na minha opinião, Sapling AI é óbvio quando se trata de detectores de IA gratuitos. Se você tem numerário e deseja outros recursos, porquê verificador de plágio e integração com outros aplicativos, opte pelo Winston AI.

Também encontramos detectores que você não deveria usar em 2024, e eles são Repórter e ZeroGPT. Eles não são confiáveis ​​e nem deveriam ser considerados para uso em sala de lição ou lugar de trabalho.

A precisão dos detectores de IA tem sido controversa desde que o ChatGPT entrou em cena. Saber qual detector tem menos verosimilhança de cometer erros é crucial se suas ações afetarem o porvir de outras pessoas. Essa é a resposta que pretendemos resolver neste item, portanto, esteja discreto a esses resultados na próxima vez que você pesquisar no Google “a melhor instrumento de detecção de IA”.

Já que estou cá, posso interessá-lo em alguns de nossos outros artigos sobre detectores de IA? Oriente é muito interessante, e leste outro também. Na verdade, temos um catálogo completo de artigos dedicados a aprender mais sobre detecção de IA, logo divirta-se lendo!

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button