ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı

Yapay zekanın yükselişiyle birlikte, doğru bilgiye ulaşmak her zamankinden daha kritik hale geldi. Ancak yayımlanan yeni bir araştırma, ChatGPT gibi büyük dil modellerinin "gerçekle kurguyu karıştırdığı" yönünde ciddi bulgular ortaya koydu.

Giriş Tarihi: Güncelleme Tarihi:
ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 1

Yapay zekanın yükselişiyle birlikte "doğru bilgi" kavramı yeniden tartışmaya açıldı. Stanford Üniversitesi'nin Nature Machine Intelligence dergisinde yayımlanan son araştırması, ChatGPT gibi büyük dil modellerinin gerçeği kurgudan ayırt etmede zorlandığını ortaya koydu. Uzmanlara göre bu durum, hukuk ve tıp gibi yüksek riskli alanlarda "ciddi yargı hatalarına" yol açabilecek kadar tehlikeli.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 2

Stanford Üniversitesi araştırmacılarına göre bu sistemler, bilginin doğası gereği "gerçeği gerektirdiğini" tam olarak kavrayamıyor.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 3

Çalışmada, yapay zekaların "tutarsız muhakeme stratejileri sergilediği" ve "yüzeysel desen eşleştirmesine" dayandığı vurgulandı.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 4

Yanlış Bilgi Yargı Hatalarına Yol Açabilir

Araştırmacılar, yapay zekanın artık hukuk, tıp ve gazetecilik gibi kritik alanlarda aktif olarak kullanıldığına dikkat çekti.
Raporda şu uyarı yer aldı: "Gerçek ile kurgu arasındaki farkı anlayamamak, yanlış teşhislere, hatalı yargı kararlarına ve yanlış bilginin yaygınlaşmasına neden olabilir."

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 5

Bilgisayar dilbilimi uzmanı Pablo Haya Coll da benzer bir uyarıda bulundu:"İnanç ile bilginin karıştırılması, hukuk ve tıp gibi alanlarda ciddi sonuçlar doğurabilir."

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 6

24 Farklı Yapay Zeka Test Edildi | ChatGPT de Listede

Stanford ekibi, Claude, ChatGPT, DeepSeek ve Gemini dahil olmak üzere 24 farklı büyük dil modelini 13.000 soru üzerinden test etti.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 7

Sonuçlar, modellerin "yanlış inançları doğru olandan ayırt etmede" düşük başarı gösterdiğini ortaya koydu.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 8

Yeni nesil modeller (Mayıs 2024 sonrası), gerçek-yanlış ayrımında %91 civarında doğruluk oranına ulaşırken; eski modellerde bu oran %70'lere kadar düştü. Bulgular, yapay zekanın "bilginin doğasını anlamada hâlâ eksik kaldığını"doğruluyor.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 9

ChatGPT 'arama motoru' gibi kullanılıyor

Adobe Express tarafından yayımlanan son rapor, Amerikalı kullanıcıların %77'sinin ChatGPT'yi bir "arama motoru" gibi kullandığını ortaya koydu.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 10

Üstelik kullanıcıların üçte biri, ChatGPT'ye Google'dan daha fazla güven duyduğunu söylüyor.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 11

Ancak uzmanlara göre bu durum, kamuoyunun "yapay zekâ kaynaklı yanlış bilgilere karşı savunmasız" hale gelmesine yol açabilir.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 12

Stanford'un çalışması, yapay zekanın hâlâ insan muhakemesine ihtiyaç duyduğunu bir kez daha gösterdi.

ChatGPT gerçeklik testinde çuvalladı! Çarpıcı araştırma ortaya çıktı - 13

Hukuk, tıp ve medya gibi alanlarda kullanılmadan önce modellerin "gerçeklik testi"nden geçmesi, gelecekte yaşanabilecek krizlerin önüne geçebilir.