Radyoloji ve Tıbbi Görüntülemede Derin Öğrenme: 2026 İtibarıyla Kanıt Nerede?

Mamografide ilk randomize çalışma (MASAI) yapay zekâ destekli okumayı çift okumaya denk buldu; ancak hiçbir görüntüleme yapay zekâsında mortalite yararı henüz randomize kanıtla gösterilmedi.

Yazan: Op. Dr. Cem Akaltun · Güncellendi · ~12 dk okuma Görüntüleme & Radyoloji

Radyoloji, yapay zekânın tıpta en hızlı kök saldığı alan oldu. Bunun nedeni basit: görüntüler sayısal, bol ve etiketlenebilir; derin öğrenme de tam olarak bu tür örüntü tanıma görevlerinde parlıyor. Ancak "FDA onayı aldı" ile "hastaya gerçekten yarıyor" arasındaki mesafe, alandaki en kritik ve en sık atlanan ayrım. Bu yazıda mamografi, bilgisayarlı tomografi (BT), manyetik rezonans (MR) ve akciğer grafisindeki en güncel kanıtı (2025-2026) abartısız biçimde derliyoruz: neyin gerçekten kanıtlandığını, neyin hâlâ kanıtlanmadığını ve hangi noktalarda kaynakların birbiriyle çeliştiğini olduğu gibi sunuyoruz.

Mamografi: Alanın en sağlam kanıtı, ilk randomize çalışmayla geldi

Yıllarca yapay zekâlı mamografi tartışması retrospektif veriler üzerinden yürüdü. Bu durum 2026 başında değişti. MASAI çalışması, meme görüntülemede yapay zekâ alanındaki ilk tamamlanmış randomize kontrollü çalışmadır (RKÇ). İsveç'te 105.934 kadın 1:1 randomize edildi; yapay zekâ destekli tarama, standart çift okumayla karşılaştırıldı (Gommers ve ark., The Lancet, Ocak 2026).

Sonuçlar dengeli okunmalı. Birincil güvenlik son noktası olan interval kanser (taramalar arasında ortaya çıkan, yani taramada kaçan kanser) açısından yapay zekâ kolu çift okumaya non-inferior (denk, daha kötü değil) çıktı: 1000 kadında 1,55'e karşı 1,76 (oran 0,88; %95 GA 0,65-1,18; p=0,41). Yapay zekâ kolunda duyarlılık anlamlı olarak yüksekti: %80,5'e karşı %73,8 (p=0,031), özgüllük ise her iki kolda da %98,5 ile aynıydı. Ayrıca yapay zekâ kolunda daha az invaziv ve daha az agresif interval kanser görüldü ve ekran-okuma yükü yaklaşık %44 azaldı. Önceki ara analizde bildirilen "+%29 tarama-tespitli kanser" artışı, bu nihai makaleyle interval-kanser ve duyarlılık/özgüllük son noktalarına oturtulmuş oldu.

RKÇ'nin yanına gerçek dünyadan en büyük prospektif kanıt eklenmeli: PRAIM çalışması (Eisemann ve ark., Nature Medicine, Ocak 2025). Almanya'da 461.818 kadın, 12 merkez ve 119 radyolog kapsandı. Kanser tespit oranı 1000'de 6,7'ye karşı 5,7 (göreceli +%17,6; %95 GA +%5,7, +%30,8) çıktı; kritik olan, bu artışın geri çağırma oranını yükseltmeden elde edilmesiydi (37,4'e karşı 38,3/1000, non-inferior). Yani daha fazla kanser yakalandı ama daha fazla kadın gereksiz yere geri çağrılmadı. Ancak bu, gözlemsel bir uygulama çalışmasıdır: radyologlar yapay zekânın tahminine bakarak hangi okuma yolunu seçtiğinden "okuma davranışı yanlılığı" oluştu ve sonuçlar propensity-skor ağırlıklandırmasıyla düzeltildi. Bu, gerçek dünya tasarımının yapısal zayıflığıdır.

Aynı alanda iki duruş, yan yana

MASAI ve PRAIM yapay zekânın mamografide "hazır" olduğunu güçlü biçimde destekler. Buna karşılık Journal of Breast Imaging'deki bir editöryel (McDonald ve ark., 2025), "hızlı düzenleyici onay ile güvenilir RKÇ kanıtı arasındaki uçurum" nedeniyle RKÇ standardının korunmasını savunur. İki görüş çelişmiyor; aynı resmin tamamlanmamış olduğunu farklı uçlardan vurguluyor.

İnme triyajı: Zaman kazanıldı, ama sonuç (mortalite, sakatlık) henüz kanıtlanmadı

Büyük damar tıkanıklığı (LVO) inmede dakikalar beyin dokusudur. Yapay zekâ temelli triyaj yazılımları, BT-anjiyografide tıkanıklığı otomatik işaretleyip ilgili ekibi uyararak iş akışını hızlandırmayı hedefler. Viz.ai yazılımına ilişkin bir sistematik derleme ve meta-analiz (Translational Stroke Research, 2025), özellikle merkezler arası transfer gerektiren olgularda kapı-içi–kapı-dışı (door-in–door-out) sürede anlamlı kısalma bildirdi. Bağımsız VALIDATE çalışması 17 eyalette 166 tesis ve 14.116 hastayı kapsadı.

Buradaki dürüst sınır net olmalı: bu çalışmaların çoğu sürrogat (zaman) son noktaları üzerinden ilerliyor. Hastanın gerçek sonucunu ölçen (mRS ile işlevsel bağımsızlık, mortalite) sağlam, bağımsız RKÇ verisi sınırlı ve çoğu üretici sponsorlu. Üreticilerin sunduğu çarpıcı duyarlılık rakamları (örneğin Aidoc'un ISC 2026'da bildirdiği baş-uca LVO'da %92,6'ya karşı geleneksel çözümün %70,4'ü) bağımsız, hakemli, prospektif teyit beklemektedir.

Akciğer grafisiyle tüberküloz taraması: Yapay zekâ, kaçacak olguyu yakalıyor

Düşük gelirli, yüksek TB yüklü ortamlarda radyolog her zaman yoktur. Bilgisayar destekli tespit (CAD) yazılımları burada en somut halk sağlığı katkısını gösteriyor; DSÖ, CAD'i TB taramasında ve triyajında 2021 kılavuzuyla önermektedir. Bunun değeri uygulamada görülüyor: bazı gerçek-dünya programlarında mikrobiyolojik doğrulanan TB olgularının yarısından fazlası asemptomatiktir; yani yalnız semptom taramasıyla kaçacaklardı.

Ancak ürünler eşit değil. Güney Afrika TB prevalans araştırmasının dış validasyonunda (Qin ve ark., The Lancet Digital Health, 2024; düzeltme/correction yayımlandı) 10 ticari CAD ürünü karşılaştırıldı. %90 duyarlılıkta beş ürün >%60 özgüllük sağladı; fakat yalnız Lunit ve Nexus'un güven aralığı, DSÖ hedef ürün profili olan %70 özgüllüğü kapsadı. CAD4TB, InferRead ve Genki %50-60 bandında kaldı. Bu nüans önemli: "qXR/CAD4TB hedefi karşılıyor" türü genellemeler fazla iyimserdir. Ev içi temaslılarda yapılan bir çalışmada (Clinical Infectious Diseases, 2025) prevalan TB için AUC değerleri CAD4TBv7 0,87, qXRv3 0,88 ve Lunit v3.1 0,91 bulundu ve CAD performansı kan testinden üstündü. Yine de eşik değerlerinin popülasyona göre büyük değiştiği ve literatürdeki eşiklerin körü körüne aktarılmaması gerektiği vurgulanıyor.

Akciğer BT'sinde nodül ve kanser: Duyarlılık artıyor, ama bedeli gereksiz takip

Akciğer BT taramasında yapay zekânın etkisini inceleyen bir sistematik derleme (Geppert ve ark., Thorax, 2024) tabloyu dengeli özetler. Yapay zekâ destekli okuma duyarlılığı +%5 ila +%20 artırdı, fakat özgüllüğü −%3 ila −%8 düşürdü. Bu denklemin maliyet tarafı somut: %0,5 kanser prevalansı varsayımıyla, milyon taramada yaklaşık +150 ila +750 ek kanser yakalanırken aynı zamanda +59.700 ila +79.600 kişiye gereksiz BT takibi doğuyor. Üstelik incelenen 11 çalışmanın tümü yüksek bias riski ve uygulanabilirlik kaygısı taşıyordu. Net fayda, dolayısıyla, taranan popülasyona ve eşik ayarına sıkı sıkıya bağlıdır.

Alan / ÇalışmaAnahtar metrikKanıt türü
Mamografi — MASAI (Lancet 2026)Duyarlılık %80,5 vs %73,8 (p=0,031); interval kanser non-inferior (oran 0,88)RKÇ
Mamografi — PRAIM (Nat Med 2025)Tespit +%17,6; geri çağırma non-inferiorProspektif gözlemsel
TB — Güney Afrika (Lancet Digit Health 2024)%90 duyarlılıkta yalnız Lunit/Nexus %70 özgüllük hedefini kapsadıDış validasyon
Akciğer BT (Thorax 2024)Duyarlılık +%5/+%20; özgüllük −%3/−%8; milyonda ~60-80 bin gereksiz takipSistematik derleme

"Onay" ile "kanıt" aynı şey değil: Düzenleyici manzara

Radyoloji, FDA'nın yapay zekâ onaylarına hâkim alandır. Aralık 2025 itibarıyla kümülatif yaklaşık 1.451 yapay zekâ/makine öğrenmesi cihazı onaylanmıştı; 2025 onaylarının yaklaşık %71,5-75'i radyoloji alanındaydı (tarihsel ortalama ~%76). Ancak asıl önemli bulgu sayıda değil, kanıtın derinliğinde: JAMA Network Open'da yayımlanan bir sistematik derleme (Potnis ve ark., 2025), Eylül 2025 kesitiyle 950 cihazın 723'ünün (%76) radyoloji olduğunu; bunların %97'sinin 510(k) yolundan, yalnız %29'unun klinik test ve sadece %5'inin prospektif test içerdiğini gösterdi. Bu, "onay ≠ klinik etkinlik" tezinin ana dayanağıdır.

Düzenleyici çerçeve de yanlış aktarılmamalı. AB Yapay Zekâ Yasası (EU AI Act) radyoloji yapay zekâsını "yüksek riskli" sayar; ancak yürürlük tarihleri ötelenmiştir: bağımsız yüksek-risk sistemler için 2 Aralık 2027, gömülü tıbbi cihaz yapay zekâsı için 2 Ağustos 2028. Yani "2026'da zorunlu" söylemi yanlıştır. Tam otonom okumaya gelince: Oxipit ChestLink, normal akciğer grafilerini radyolog görmeden raporlayabilen, CE işaretli (Class IIb) ilk tam otonom görüntüleme yapay zekâsıdır; üretici >500.000 grafi ve %99 duyarlılık bildirir. Buna karşın ABD'de FDA onayı henüz yoktur — yani "ABD'de otonom okuma serbest" demek hatalı olur.

Kanıtlanmamış olan ne? Dürüst çerçeve

Tüm olumlu verilere rağmen birkaç boşluk inatla duruyor. Birincisi, hiçbir görüntüleme yapay zekâsında mortalite yararı RKÇ ile kanıtlanmış değildir; MASAI bile son nokta olarak mortaliteyi değil interval kanseri kullanır. İkincisi, genellenebilirlik kroniktir: radyolojide yapay zekânın farklı klinik ortamlardaki performansını inceleyen bir sistematik derleme (Ocak 2022-Haziran 2025; BT/MR/grafi), dahil edilen çalışmaların tamamının retrospektif olduğunu, hiçbirinin prospektif klinik çalışma olmadığını bulmuştur — düşük bias bile gerçek-dünya yararını garanti etmez. Farklı tarayıcı, hastane ve popülasyonda performansın düştüğü "dağılım kayması", başlıca dağıtım engeli olarak korunur.

Üçüncü ve klinik olarak en sinsi risk otomasyon yanlılığıdır ve bu artık ölçülmüş bir gerçektir. Serebral anevrizma için TOF-MRA çalışmasında (Kim ve ark., La Radiologia Medica, 2025), yapay zekânın ürettiği yanlış-pozitif bir bulgu radyologların anevrizma şüphesini anlamlı biçimde artırmış (p=0,01); deneyimsiz okuyucular gereksiz, daha yoğun takip önerme eğilimine girmiştir (p=0,005). Yani yardımcı araç, yanlışken bile kararı kendine çekebiliyor. Buna yayın yanlılığı ve üretici sponsorluğu eklenince, en parlak performans rakamlarının (örneğin %92,6 veya %99) bağımsız teyit beklediği açıktır.

Sonuç

2026 itibarıyla radyolojide derin öğrenme, tıbbın başka hiçbir köşesinde olmadığı kadar olgun bir kanıt tabanına sahip — ama bu olgunluk eşit dağılmıyor. Mamografi en sağlam zemin: bir RKÇ (MASAI) ve büyük bir prospektif çalışma (PRAIM), yapay zekâ destekli okumanın çift okumaya denk olduğunu, duyarlılığı artırdığını ve okuma yükünü yaklaşık yarıya indirdiğini birlikte gösteriyor. İnme triyajında zaman kazanımı ölçülebilir; TB taramasında yapay zekâ kaçacak olguları yakalıyor. Buna karşılık mortalite yararı hiçbir alanda randomize kanıtla gösterilmedi, prospektif dış validasyon kronik biçimde eksik, FDA onaylarının yalnız küçük bir azınlığı prospektif klinik kanıt içeriyor ve otomasyon yanlılığı gerçek bir hasta güvenliği sorunu. Doğru çerçeve "yapay zekâ radyoloğun yerini alıyor" değil; doğru tasarlanmış, doğru popülasyonda valide edilmiş ve insan denetiminde tutulan yapay zekâ, belirli görevlerde radyoloğu güçlendiren bir araçtır. Bundan sonraki kritik adım daha fazla onay değil; daha fazla prospektif, bağımsız ve sonuç-odaklı kanıttır.

Kaynaklar

  1. Gommers J, ve ark. Interval cancer, sensitivity, and specificity comparing AI-supported mammography screening with standard double reading in the MASAI study (randomize kontrollü çalışma). The Lancet. 2026;407(10527):505-514. site
  2. Eisemann N, ve ark. Nationwide real-world implementation of AI for cancer detection in population-based mammography screening (PRAIM). Nature Medicine. 2025. site
  3. Potnis KC, ve ark. FDA Approval of Artificial Intelligence and Machine Learning Devices in Radiology (sistematik derleme). JAMA Network Open. 2025. site
  4. Geppert J, ve ark. AI for lung cancer detection on CT screening: a systematic review. Thorax. 2024;79:1040-1049. site
  5. Qin ZZ, ve ark. Computer-aided detection products for TB screening (dış validasyon; düzeltme yayımlandı). The Lancet Digital Health. 2024;6:e605-e613. site
  6. Computer-aided detection accuracy in household TB contacts (prospektif kohort). Clinical Infectious Diseases. 2025. site
  7. Kim SH, ve ark. Automation bias in cerebral aneurysm detection on TOF-MRA (gözlemci performans çalışması). La Radiologia Medica. 2025;130:555-566. site
  8. Automated emergent LVO detection using Viz.ai software: systematic review and meta-analysis. Translational Stroke Research. 2025. site
  9. Assessing the generalizability of artificial intelligence in radiology: a systematic review across clinical settings. 2025. site
  10. McDonald ES, ve ark. The gap between regulatory clearance and reliable RCT evidence in breast AI (editöryel). Journal of Breast Imaging. 2025. site
  11. European Society of Radiology. Guiding AI in radiology: ESR's recommendations for the European AI Act. Insights into Imaging. 2025. site
  12. The Imaging Wire. Numbers from the FDA show radiology is maintaining its lead (sektör istatistiği). 2026. site
Bilgilendirme: Bu içerik yalnızca eğitim ve bilgilendirme amaçlıdır; tanı veya tedavi kararı yerine geçmez. Burada anılan yapay zekâ sistemleri hekim gözetiminde, ilgili düzenleyici onayları ve kurumsal doğrulamaları çerçevesinde kullanılmalıdır. Klinik kararlar her zaman hastayı değerlendiren hekime aittir.