Yapay Zeka, Acil Serviste Hekimleri Karmaşık Kararlarda Geride Bıraktı
Harvard araştırması, yapay zekanın acil serviste hekimlerden daha başarılı tanı ve tedavi planı yaptığını gösterdi.

Harvard Tıp Fakültesi ve Beth Israel Deaconess Tıp Merkezi araştırmacılarının gerçekleştirdiği yeni bir çalışma, yapay zeka modellerinin acil bakımda tıbbi karar verme becerilerinde hekimleri geçtiğini ortaya koydu. Araştırmada, büyük dil modelleri (LLM'ler) acil servis ortamında tanı koyma ve tedavi planlama gibi kritik görevlerde insanlardan üstün performans sergiledi.
Yapay Zeka Klinik Akıl Yürütmede Üstünlük Sağladı
Çalışma, 2024 yılında piyasaya sürülen OpenAI'nin o1-preview modeli kullanılarak yapıldı. Araştırmacılar, gerçek acil servis vakaları ve yayınlanmış olgu tartışmalarını modele sundu. Sonuçlarda, yapay zeka modelleri özellikle tedavi planlaması, klinik akıl yürütme ve dokümantasyon gibi alanlarda insan hekimlere kıyasla daha başarılı oldu.
Arjun Manrai, Harvard Tıp Fakültesi profesörü ve çalışmanın ortak kıdemli yazarı, "Yapay zeka modelini hemen hemen tüm kriterlere karşı test ettik ve hem önceki modellere hem de hekimlerden oluşan temel grubumuza üstünlük sağladı" dedi.
Test Süreci ve Bulgular
Araştırmacılar, o1 ve GPT-4o modellerini standart bir acil servis ortamında farklı aşamalarda test etti. Modellerden, mevcut bilgilerle olası tanıları sıralamaları ve sonraki adımları önermeleri istendi. En büyük fark, bilgi kısıtlılığının en yüksek olduğu triyaj aşamasında ortaya çıktı. Hem yapay zeka hem de insan hekimlerin tanısal başarısı, bilgi arttıkça yükseldi.
Peter Brodeur, Beth Israel Deaconess'te klinik araştırma görevlisi, "Modeller giderek daha yetenekli hale geliyor ve artık %100'e yakın puan alıyorlar. Bu yüzden ilerlemeyi takip etmek zorlaşıyor" ifadelerini kullandı.
Geleceğe Yönelik Gereksinimler
Yazarlar, yapay zekanın klinik pratiğe entegrasyonu için ileriye dönük kapsamlı klinik çalışmaların yapılması gerektiğini vurguladı. Ayrıca sağlık sistemlerinin bilgi işlem altyapısını güçlendirerek bu teknolojilerin güvenli şekilde uygulanabileceği çerçeveler geliştirmesi çağrısında bulundu.
Brodeur, "Bir model doğru tanı koyabilir, ancak gereksiz testler önererek hastayı riske atabilir. Bu nedenle performans ve güvenliğin değerlendirilmesinde insan faktörü kritik" dedi.
Son olarak araştırmacılar, çalışmanın temel olarak o1 modelinin önizleme sürümüne odaklandığını, ancak OpenAI'nin daha yeni modellerinin de performansını koruyup geliştirdiğine işaret etti. İnsanlar ile LLM'lerin iş birliği ve farklı modeller arasındaki performans değişikliklerini anlamak için daha fazla araştırma yapılmasının gerekliliğine dikkat çektiler. Bu bağlamda, Google Gemini ve devlet destekli siber saldırılar gibi gelişmeler, yapay zekanın farklı alanlardaki etkisini göstermektedir.
Ufuk Tekin
Haber Editörü
Deneyimli haber editörü ve yazar.