Yapay zeka sohbet robotları sağlık alanında giderek daha fazla kullanılıyor, ancak yeni bir araştırma, ChatGPT’nin tıbbi teşhislerde ciddi hatalar yapabileceğini ve halüsinasyon riski taşıdığını ortaya koydu. İşte uzmanların uyarıları ve kullanıcıların dikkat etmesi gerekenler…
Binghamton Üniversitesi Thomas J. Watson Mühendislik ve Uygulamalı Bilimler Fakültesi Sistem Bilimi ve Endüstri Mühendisliği Okulu’nda araştırma görevlisi olan Ahmed Abdeen Hamed, Polonya Krakow AGH Üniversitesi, Howard Üniversitesi ve Vermont Üniversitesi’nden işbirlikçileriyle birlikte çalışmaya liderlik etti.
George J. Klir Sistem Bilimi Profesörü Luis M. Rocha’nın Karmaşık Uyarlanabilir Sistemler ve Hesaplamalı Zeka Laboratuvarı’nın bir parçası olarak , Hamed geçen yıl xFakeSci adını verdiği bir makine öğrenmesi algoritması geliştirdi . Bu algoritma, sahte bilimsel makalelerin %94’üne kadarını tespit edebiliyor; bu da daha yaygın veri madenciliği tekniklerinden neredeyse iki kat daha başarılı. Hamed, bu yeni araştırmayı, büyük dil modellerinin biyomedikal üretkenlik yeteneklerini doğrulamanın bir sonraki adımı olarak görüyor.
Hamed, “İnsanlar bugünlerde ChatGPT ile sürekli konuşuyor ve ‘Şu semptomlarım var. Kanser miyim? Kalp krizi mi geçirdim? Tedavi görmeli miyim?’ diyorlar,” dedi. “Bu çok tehlikeli bir iş olabilir, bu yüzden bu soruları sorduğumuzda ne olacağını, ne tür cevaplar alacağımızı ve bu cevapların biyomedikal literatürden nasıl doğrulanabileceğini görmek istedik.”
iScience dergisinde yakın zamanda yayınlanan bir araştırma, ChatGPT ve büyük dil modellerini teste tabi tutuyor ve birkaç şaşırtıcı sonuca ulaşıyor.
From knowledge generation to knowledge verification: examining the biomedical generative capabilities of ChatGPT
Yapay zeka destekli sohbet robotu ChatGPT, sağlık sorunlarına ilişkin soruları yanıtlarken bazen doğru bilgiler verebilse de, yeni bir araştırma, bu sistemin tıbbi teşhislerde ciddi eksiklikleri ve hatta “halüsinasyon” riski taşıdığını ortaya çıkardı.
Araştırmacılar, ChatGPT’yi hastalık terimleri ve üç tür ilişki açısından test ettiler: ilaç adları, genetik ve semptomlar. Yapay zeka, hastalık terimlerini (%88-97), ilaç adlarını (%90-91) ve genetik bilgileri (%88-98) belirlemede yüksek doğruluk gösterdi.
Araştırma Ne Diyor?
Cell dergisinde yayınlanan bir çalışmada, ChatGPT’nin tıbbi bilgi eksiklikleri nedeniyle yanlış teşhisler koyabildiği, hatta gerçekte olmayan bilgiler üretebildiği (halüsinasyon) belirtildi. Araştırmacılar, ChatGPT’nin bazı durumlarda hastalıkları doğru tanımlayabildiğini, ancak özellikle nadir hastalıklar ve karmaşık vakalar söz konusu olduğunda ciddi hatalar yapabildiğini vurguladı.
Uzmanlar Uyarıyor: “Teşhis Koyma Yetkisi Yok!”
Tıp uzmanları, yapay zeka araçlarının sağlık alanında destekleyici olarak kullanılabileceğini ancak kesin teşhis için yeterli olmadığını belirtiyor. ChatGPT gibi modeller, tıbbi literatürden öğrendikleri bilgileri kullanıyor olsa da, gerçek bir doktorun klinik deneyimi ve hastayla etkileşimi yerine geçemez. Ayrıca, bu sistemlerin “halüsinasyon” adı verilen, gerçekte olmayan bilgiler üretme riski, yanlış yönlendirmelere yol açabiliyor.
Sonuç: ChatGPT’ye Güvenerek Teşhis Koymayın!
Araştırma, kullanıcıların sağlık sorunlarında ChatGPT veya benzeri yapay zeka araçlarına güvenmek yerine mutlaka bir doktora başvurması gerektiğini bir kez daha hatırlatıyor. Uzmanlar, yapay zekanın tıpta kullanımının etik ve güvenilir olması için daha fazla denetim ve iyileştirme gerektiğinin altını çiziyor.



















