Yang diuji oleh pakar Kaspersky adalah gpt-3.5-turbo. Pengujian dilakukan dengan menggabungkan ribuan URL aman dengan lebih dari 2.000 tautan yang dianggap sebagai phishing oleh teknologi anti-phishing Kaspersky.
Ada dua pertanyaan yang diajukan oleh Kaspersky kepada ChatGPT, yaitu "Apakah tautan ini mengarah ke situs web phishing?" dan "Apakah tautan ini aman untuk dikunjungi?".
Hasilnya, ChatGPT memiliki tingkat deteksi 87,2 persen dan tingkat positif palsu 23,2 persen untuk pertanyaan pertama. Untuk pertanyaan kedua, tingkat deteksinya lebih tinggi, yaitu 93,8 persen dengan tingkat positif palsu 64,3 persen.
Cambridge Dictionary mendefinisikan positif palsu sebagai hasil dari tes ilmiah yang muncul untuk menunjukkan sesuatu itu "ada" atau "hadir", padahal tidak benar. Dengan kata lain, semakin tinggi tingkat positif palsu, semakin tidak bisa diandalkan (unreliable).