Sağlıkta Yapay Zeka: Regülasyon ve Gelecek

Sağlıkta yapay zeka 2025-2026'da düzenleyici çerçevenin olgunlaştığı ama klinik kanıtın hâlâ "süreç iyileşmesi var, sert sonlanım kanıtı ince" dengesinde durduğu bir eşiğe geldi. Bu yazı, en güncel regülasyon ve kanıtları abartısız biçimde sunuyor.

Op. Dr. Cem Akaltun Güncellendi Regülasyon FDA AB AI Yasası

Sağlıkta yapay zeka (YZ) artık bir gelecek vaadi değil, klinik pratiğin içine yerleşmiş bir gerçeklik. Ancak bu gerçekliğin iki yüzü var: bir yandan düzenleyici otoriteler kuralları hızla olgunlaştırıyor ve onaylı cihaz sayısı rekor kırıyor; öte yandan, randomize klinik çalışmalar (RKÇ) bize teknolojinin neyi başardığını kadar neyi henüz başaramadığını da net biçimde gösteriyor. Bu yazı, Haziran 2026 itibarıyla en güncel düzenleyici gelişmeleri ve klinik kanıtları, abartısız ve dengeli bir çerçevede ele alıyor. Amaç, ne körü körüne iyimserlik ne de kategorik kötümserlik; sahadaki sayılara sadık kalmak.

Düzenleyici Manzara: Kurallar Olgunlaşıyor

Sağlıkta YZ'nin en hızlı değişen boyutu düzenleme tarafı. Üç büyük otorite — ABD'de FDA, Avrupa Birliği ve Dünya Sağlık Örgütü (WHO) — son iki yılda çerçevelerini belirgin biçimde güncelledi.

FDA: Rekor onay yılı ve "öğrenen cihaz" sorunu

FDA verilerine göre, 1995'ten Aralık 2025 sonuna kadar toplam 1.451 YZ-etkin tıbbi cihaza pazarlama yetkisi verildi. Yalnızca 2025 yılında onaylanan cihaz sayısı 295 ile rekor kırdı (2024'te 253, 2023'te 221). Bu cihazların yaklaşık %76'sı radyoloji alanında — görüntü yorumlama, YZ'nin en olgun klinik uygulama alanı olmayı sürdürüyor.

Belki daha önemli bir gelişme, FDA'nın 3 Aralık 2024'te yayımladığı Önceden Belirlenmiş Değişiklik Kontrol Planı (PCCP) nihai kılavuzu. Bu kılavuz, "öğrenen" algoritmaların klasik düzenleme mantığıyla çeliştiği temel soruna yanıt veriyor: Bir cihaz piyasaya çıktıktan sonra kendini güncellerse, her güncelleme için yeniden onay mı gerekir? PCCP, üreticinin önceden tanımlanmış sınırlar içinde (Değişikliklerin Tanımı, Değişiklik Protokolü, Etki Değerlendirmesi) cihazı güncellemesine izin veriyor. Kılavuz, taslağa göre kapsamını genişleterek yalnızca makine öğrenmesini değil tüm YZ-etkin cihazları kapsadı ve kullanıcıya şeffaflık (etiketleme) zorunluluğu getirdi. Ağustos 2025'te FDA, Health Canada ve İngiltere MHRA, bu alanda beş ortak ilke yayımlayarak uluslararası uyumu güçlendirdi.

Üretken YZ (büyük dil modelleri) için de ilk düzenleyici sinyaller geldi. FDA'nın Dijital Sağlık Danışma Komitesi, 6 Kasım 2025'teki ikinci toplantısında reçeteli dil modeli tabanlı ruh sağlığı (terapi chatbot) cihazlarını ele aldı. Komitenin önerileri arasında kriz anında nitelikli insan müdahalesine yönlendirme (insan gözetimi), premarket dosyada PCCP ve performans izleme planı, ve psikiyatride plasebo etkisini dengelemek için çift-kör RKÇ yer aldı.

AB Yapay Zeka Yasası: Önemli takvim değişikliği

Mevcut tabloda en kritik güncelleme Avrupa'dan geldi. Avrupa Komisyonu, 19 Kasım 2025'te "Digital Omnibus on AI" önerisini yayımladı ve yüksek riskli yükümlülüklerin uygulama takvimini öteledi. Önceki planda kullanım-temelli yüksek risk yükümlülükleri (Ek III) 2 Ağustos 2026'da, CE-işaretli düzenlenmiş ürünlere gömülü YZ — yani YZ-etkin tıbbi cihazlar — için yükümlülükler (Ek I) 2 Ağustos 2027'de yürürlüğe girecekti. Yeni öneriyle bu tarihler sırasıyla 2 Aralık 2027 ve 2 Ağustos 2028'e ertelendi.

Burada dikkat edilmesi gereken nokta şu: Erteleme yalnızca uygulama tarihini kaydırıyor, yükümlülüklerin içeriğini kaldırmıyor. YZ-etkin tıbbi cihazlar yüksek riskli sınıfta kalmaya devam ediyor; veri yönetişimi, şeffaflık, insan gözetimi, risk yönetimi ve piyasa-sonrası izleme yükümlülükleri korunuyor. Ayrıca bu henüz öneri/geçici siyasi mutabakat aşamasında; resmî kabul, Resmî Gazete'de yayımla kesinleşecek.

WHO: Çok-modlu modeller için küresel çerçeve

WHO, 18 Ocak 2024'te yayımladığı büyük çok-modlu modeller (LMM) kılavuzuyla küresel etik çerçeveyi belirledi. Kırktan fazla öneri içeren belge, sağlıkta beş uygulama alanı (tanı/klinik bakım, hastaya-rehberli kullanım, idari işler, tıp eğitimi, bilimsel araştırma) tanımlıyor ve belgelenen riskleri sıralıyor: yanlış/yanlı/eksik çıktı, "otomasyon yanlılığı" ve veri mahremiyeti. Bu belge, dil modellerine ilişkin hâlâ yürürlükteki birincil küresel çerçeve niteliğinde.

Üç otorite, ortak yön

FDA "öğrenen cihaz"ı PCCP ile, AB "yüksek risk"i sürekli izlemeyle, WHO "otomasyon yanlılığı"nı insan gözetimiyle ele alıyor. Üçü de ortak bir noktada buluşuyor: YZ bir kez onaylanıp unutulacak bir ürün değil; sürekli izlenmesi, denetlenmesi ve insan gözetimi altında tutulması gereken bir süreç.

Klinik Kanıt: Nerede Çalışıyor?

Düzenleme kadar önemli olan asıl soru şu: YZ klinikte gerçekten işe yarıyor mu? Burada kanıt düzeyi alana göre belirgin biçimde değişiyor.

En olgun kanıt kolonoskopide. Annals of Internal Medicine'de 2024'te yayımlanan, 28 RKÇ ve 23.861 katılımcıyı kapsayan sistematik derleme/meta-analiz, YZ-destekli kolonoskopinin adenom saptama oranını (ADR) belirgin biçimde artırdığını gösterdi: RR 1,20 (%95 GA 1,14–1,27). Adenom kaçırma oranı ise RR 0,45 (%95 GA 0,37–0,54) ile yarıdan fazla düştü. Bu, doğrudan klinik anlamı olan, sağlam ve tekrarlanan bir bulgu.

Kardiyolojide de güçlü bir örnek var. Tayvan'da 13.631 hastayla yürütülen pragmatik bir RKÇ, EKG'den yapay zeka ile düşük ejeksiyon fraksiyonu (kalp yetmezliği) saptamanın yeni tanı oranını artırdığını gösterdi: genel risk oranı (HR) 1,50 (%95 GA 1,11–2,03, p=0,023). Üstelik bu, ekokardiyografi kullanımını gereksiz yere artırmadan sağlandı; ekokardiyografi için pozitif öngörü değeri %20,2'den %34,2'ye yükseldi.

Diyabet yönetiminde, YZ tabanlı bir insülin titrasyon sistemi (iNCDSS), 149 hastalık çok-merkezli bir RKÇ'de kıdemli endokrinologlara non-inferior bulundu: hedef glukoz aralığında geçirilen süre %76,4'e karşı %73,6 (fark +%2,7; non-inferiorite sınırı karşılandı), advers olaylarda fark yok. Konuşma-tabanlı tanısal YZ alanında ise Google'ın AMIE sistemi, Nature'da 2025'te yayımlanan randomize çift-kör bir çalışmada 159 senaryoda 20 birinci basamak hekimiyle karşılaştırıldı ve uzman değerlendiricilere göre 32 eksenin 30'unda hekimlere eşit ya da üstün bulundu. Ancak yazarlar önemli bir sınırı vurguluyor: çalışma yalnızca metin-sohbet üzerinden yürütüldü; bu, gerçek klinik karşılaşmadan farklı bir ortam.

2025'in en yaygın gerçek-dünya dağıtımı ise ortam (ambient) YZ tıbbi kâtipleri oldu. Altı ABD sağlık sisteminde yürütülen bir kalite-iyileştirme çalışması, tükenmişlik, bilişsel görev yükü ve dokümantasyon süresinde anlamlı azalma bildirdi; YZ kullanan hekimler EHR'de %8,5, not yazımında %15'ten fazla daha az zaman harcadı. Yine de bir uyarı var: Hekim notu doğrulamaktan hâlâ sorumlu ve bazıları "yazmak yerine düzeltmekle" zaman harcadığını bildiriyor.

Sınırlar: YZ'nin Henüz Başaramadıkları

Dürüst bir değerlendirme, başarılar kadar sınırları da görünür kılmalı. Burada en çarpıcı bulgular doğrudan hasta sonuçlarıyla ilgili.

Sert klinik sonlanımlarda kanıt hâlâ ince. Dört acil serviste 200.354 başvuruyu kapsayan basamaklı-kama küme RKÇ'sinde, pediatrik septik şok için bir YZ klinik karar destek sistemi, bir saat içinde antibiyotik+sıvı verme oranını hiç değiştirmedi: müdahale %39,0'a karşı kontrol %38,9 (düzeltilmiş OR 1,07; %95 GA 0,61–1,88; anlamlı fark yok). Yani sistem süreç ölçütünü bile iyileştiremedi. Bu, mortalite gibi sert sonlanımlarda pozitif RKÇ kanıtının ne kadar sınırlı olduğunu gösteren önemli bir örnek.

İnsan-YZ entegrasyonu beklenenden zayıf. JAMA Network Open'da 2024'te yayımlanan, 50 hekimli tek-kör bir RKÇ, dil modeline erişimi olan hekimlerle geleneksel kaynak kullananlar arasında tanısal akıl yürütme skorunda fark bulamadı (+2 puan; %95 GA −4 ila +8; p=0,60). Çarpıcı olan şu: Dil modeli tek başına, geleneksel kaynaktan 16 puan (%95 GA 2–30; p=0,03) daha yüksek skor aldı. Yani sorun YZ'nin yeteneğinde değil, insanın onu nasıl kullandığında. Buna karşın çelişen bir bulgu da var: Aynı araştırmacıların Nature Medicine'de 2025'te yayımladığı, 92 hekimli GPT-4 RKÇ'si bu kez anlamlı bir iyileşme (+6,5 puan) bildirdi. İki sonucu yan yana değerlendirmek gerekiyor — entegrasyon sorunu çözülemez değil ama henüz tutarlı biçimde çözülmüş de değil.

Beceri körelmesi (deskilling) — yeni ve düşündürücü bir uyarı. Lancet Gastroenterology & Hepatology'de 2025'te yayımlanan, Polonya'da 19 deneyimli endoskopistle yürütülen çok-merkezli gözlemsel çalışma, düzenli YZ maruziyetinden sonra hekimlerin YZ'siz yaptıkları kolonoskopilerde ADR'nin %28,4'ten %22,4'e düştüğünü gösterdi — %6 mutlak, %20 göreli azalma. Yazarlar bunu "YZ maruziyetinin tıpta hasta-ilişkili bir sonuca olumsuz etkisini gösteren ilk çalışma" olarak niteliyor. Çerçeveyi dürüst kuralım: Çalışma gözlemsel, retrospektif ve tek-ülke; nedensellik kanıtlamıyor. Ama yüksek önemde bir hipotez ortaya koyuyor ve PubMed'de Haziran 2026 itibarıyla geri çekme ya da düzeltme kaydı bulunmuyor.

Epic Sepsis Model dersi: Gerçek-dünya validasyon açığı

Yaygın dağıtılan bir sepsis erken-uyarı modeli, bağımsız dış validasyonda yalnızca ~0,63 AUC verdi; bir çalışmada sepsis hastalarının yaklaşık üçte ikisini kaçırdı ve çok sayıda yanlış alarm üretti. 2024 acil-servis verisinde 6 saatlik pencerede duyarlılık %14,7, özgüllük %95,3, PPV %7,6 ölçüldü; geliştirici sonradan iddialarını geri çekti. Buna karşılık, FDA-yetkili yeni nesil bir sepsis modeli prospektif/çok-merkezli geliştirme ve validasyonla NEJM AI'da yayımlandı. İki örnek yan yana bir dersi özetliyor: "Tek-merkez geliştirme + zayıf dış validasyon" ile "prospektif/çok-merkez + düzenleyici onay" arasındaki uçurum, bir modelin pazarlanabilir olmasıyla güvenilir olması arasındaki farktır.

Eşitlik, yanlılık ve raporlama açığı. FDA-onaylı YZ klinik karar destek araçlarının bir taramasında hiçbiri yanlılık değerlendirmesi içermiyordu; çoğu radyoloji YZ çalışması tek-kurum geliştirme ve demografik altgrup performansı seyrek raporlanıyor. TRIPOD-AI, DECIDE-AI ve CONSORT-AI gibi raporlama standartları dış validasyon ve altgrup şeffaflığını talep ediyor, ama uyum hâlâ düşük. Buna ek olarak, klinik YZ modelleri dağıtımdan sonra yıllar içinde performans kaybedebiliyor (dağılım kayması); hem FDA hem AB'nin piyasa-sonrası sürekli izlemeyi bu yüzden vurgulaması tesadüf değil.

Süreç İyileşmesi mi, Hasta Yararı mı? Kanıtın Özeti

Mevcut kanıtı tek bir cümlede özetlemek gerekirse: YZ, süreç ve tanısal-verimlilik ölçütlerinde (adenom saptama, kalp yetmezliği tanısı, dokümantasyon süresi) güçlü ve tekrarlanan iyileşmeler sağlıyor; ancak sert klinik sonlanımlarda (mortalite, şoka ilerleme) pozitif RKÇ kanıtı hâlâ sınırlı. Üstelik kanıtın önemli bir bölümü simüle ya da vinyet ortamından geliyor; gerçek-dünya prospektif sonlanım çalışmaları azınlıkta. Buna bir de yayın yanlılığı ekleniyor: Pozitif YZ çalışmaları daha çok yayımlanırken, kayıtlı ama yayımlanmamış çalışmalar tabloyu gerçekte olduğundan daha iyimser gösterebilir.

Uygulama alanıKanıt türüEtki büyüklüğüSonlanım türü
Kolonoskopi (ADR)28 RKÇ meta-analiziRR 1,20 (1,14–1,27)Süreç (saptama)
EKG ile düşük EF tanısıPragmatik RKÇ (n=13.631)HR 1,50 (1,11–2,03)Tanısal verimlilik
İnsülin titrasyonuRKÇ (n=149)+%2,7, non-inferiorSüreç (glukoz kontrolü)
Pediatrik septik şok KDSKüme RKÇ (200.354)aOR 1,07 (0,61–1,88), anlamsızSüreç + sert sonlanım
Dil modeli tanısal yardımRKÇ (50 hekim)+2 puan, anlamsızTanısal akıl yürütme
Beceri körelmesi (deskilling)Gözlemsel (19 endoskopist)ADR %28,4→%22,4Hasta-ilişkili (uyarı)

Gelecek Perspektifi: Somut Dönüm Noktaları

Geleceğe dair soyut iyimserlik yerine, 2025'in somut dönüm noktalarına bakmak daha aydınlatıcı. Ortam YZ kâtipleri, en yaygın gerçek-dünya dağıtımı olarak hekimlerin idari yükünü gözle görülür biçimde azaltıyor — ve belki de YZ'nin ilk büyük "sessiz devrimi" tanı koymakta değil, hekimi klavyeden kurtarmakta gerçekleşiyor. Konuşma-tabanlı tanısal sistemler (AMIE) laboratuvarda etkileyici sonuçlar veriyor ama gerçek-dünya doğrulaması bekliyor. Beceri körelmesi sinyali ve Epic Sepsis Model dersi ise, geleceğin yalnızca "daha iyi algoritma" değil, "daha iyi entegrasyon, daha sıkı validasyon ve sürdürülebilir insan gözetimi" meselesi olduğunu hatırlatıyor.

Düzenleme tarafında yön belli: Statik onaydan sürekli yaşam-döngüsü gözetimine geçiş. PCCP'nin "öğrenen cihaz" mantığı, AB'nin piyasa-sonrası izleme vurgusu ve WHO'nun otomasyon yanlılığı uyarısı, hepsi aynı gerçeği işaret ediyor: YZ bir kez kurulup unutulacak bir cihaz değil, sürekli izlenmesi gereken bir süreç. Önümüzdeki yıllarda üretken YZ ve dil modelleri için düzenleyici çerçevenin hızla şekilleneceğini, ruh sağlığı chatbot'ları gibi yüksek-riskli uygulamaların öncelikli mercek altına alınacağını öngörmek mümkün.

Sonuç

Sağlıkta yapay zeka, 2026 itibarıyla ne abartılı vaatlerin ne de toptan reddin yeridir. Düzenleyici çerçeve hızla olgunlaşıyor: FDA rekor sayıda cihaz onaylıyor ve "öğrenen cihaz" sorununa PCCP ile yanıt veriyor; AB yüksek-risk takvimini erteliyor ama yükümlülükleri koruyor; WHO küresel etik çerçeveyi sağlamlaştırıyor. Klinik tarafta tablo dengeli: Kolonoskopi, kardiyoloji ve dokümantasyon gibi alanlarda sağlam, tekrarlanan iyileşmeler var; ama sert klinik sonlanımlarda kanıt ince, insan-YZ entegrasyonu kırılgan ve beceri körelmesi gibi yeni riskler gündemde. Doğru tutum, her iddiayı kendi kanıt düzeyiyle tartmak; çelişen bulguları (entegrasyon lehine ve aleyhine, fayda ve deskilling) yan yana okumak; ve teknolojinin neyi başardığını kutlarken neyi henüz başaramadığını gizlememektir. Yapay zeka tıbbı dönüştürüyor — ama bu dönüşümün hekimin yerini almak değil, hekimi güçlendirmek; ve her zaman dikkatli, denetlenmiş ve insan gözetimi altında ilerlemek üzerine kurulması gerekiyor.

Bilgilendirme: Bu içerik genel bilgilendirme ve eğitim amaçlıdır. Mevzuat tarihleri ve sınıflandırmalar değişebilir; AB AI Yasası uyum tarihleri öngörülen/önerilen niteliktedir ve yürürlük süreçlerine göre güncellenebilir. Güncel ve bağlayıcı bilgi için ilgili düzenleyici otoritelerin resmî yayınlarına başvurulmalıdır.

Kaynaklar

  1. U.S. Food and Drug Administration. Artificial Intelligence-Enabled Medical Devices (liste). FDA. 2025–2026. site
  2. U.S. Food and Drug Administration. Marketing Submission Recommendations for a Predetermined Change Control Plan for AI-Enabled Device Software Functions (nihai kılavuz). FDA. 2024. site
  3. European Commission. Digital Omnibus on AI (yüksek-risk erteleme önerisi). European Commission Digital Strategy. 2025. site
  4. World Health Organization. Ethics and governance of artificial intelligence for health: large multi-modal models. WHO. 2024. site
  5. Aziz M, et al. AI-Assisted Colonoscopy for Polyp Detection: A Systematic Review and Meta-analysis. Annals of Internal Medicine. 2024. site
  6. Budzyń K, et al. Endoscopist deskilling risk after exposure to artificial intelligence in colonoscopy: a multicentre, observational study. Lancet Gastroenterology & Hepatology. 2025. site
  7. Goh E, et al. Large Language Model Influence on Diagnostic Reasoning: A Randomized Clinical Trial. JAMA Network Open. 2024. site
  8. Tu T, et al. Towards conversational diagnostic artificial intelligence (AMIE). Nature. 2025. site
  9. Tsai DJ, et al. AI-assisted diagnosis of low ejection fraction using ECG: a pragmatic randomized controlled trial. BMC Medicine. 2025. site
  10. Ying Z, et al. Real-Time AI-Assisted Insulin Titration System for Glucose Control in Type 2 Diabetes: A Randomized Clinical Trial. JAMA Network Open. 2025. site
  11. Scott HF, et al. Machine Learning Clinical Decision Support for Septic Shock in the Emergency Department: A Cluster Randomized Trial. Pediatrics. 2025. site
  12. U.S. Food and Drug Administration. Digital Health Advisory Committee — Generative AI-Enabled Digital Mental Health Devices. FDA. 2025. site