Dijital Patoloji ve Hesaplamalı Patolojide Yapay Zeka: Hızlanan Onaylar, Temel Modeller ve Dürüst Bir Bilanço

Dijital patolojide yapay zeka 2024-2026 arasında düzenleyici onay, model ölçeği ve klinik entegrasyonda hızlandı; ancak yüksek doğruluk iddialarının ardında metodolojik zayıflık ve prospektif kanıt eksikliği duruyor.

Yazan: Op. Dr. Cem Akaltun · Güncellendi · ~12 dk okuma Görüntüleme & Radyoloji

Patoloji, modern tıbbın tanı omurgasıdır; kanser teşhisinin büyük bölümü hâlâ bir patoloğun mikroskop altında doku kesitlerini incelemesiyle konur. Son on yılda bu sürecin dijitalleşmesi — yani doku kesitlerinin yüksek çözünürlüklü tüm-slayt görüntülerine (whole-slide imaging, WSI) dönüştürülmesi — yapay zekanın (YZ) bu görüntüleri analiz etmesinin önünü açtı. 2025-2026 itibarıyla alan, birkaç yıl önceki "deneysel" çerçeveden çıkıp düzenleyici onay, model ölçeği ve klinik entegrasyon açısından somut bir olgunlaşma evresine girdi. Ancak bu hızlı ilerleme, dürüst bir bilanço gerektiriyor: neyin gerçekten kanıtlandığı ile neyin hâlâ vaat aşamasında olduğu arasındaki çizgi, klinik karar verici için kritiktir. Bu yazı, en güncel kanıtları abartısız biçimde derler.

Düzenleyici onaylarda 2024-2026 dalgası

En çarpıcı güncelleme onay hızındadır. FDA'nın patoloji panelinden geçen tüm-slayt görüntüleme sistem ve yazılımlarına verilen yaklaşık 48 de novo/510(k) izninin 17'si 2017-2023 döneminde (yedi yıl), 32'si ise yalnızca 2024-2025'te verildi. Yani onaylar belirgin biçimde ivmelendi. Birkaç yıl öncesine kadar geçerli olan "dijital patolojide tek tük FDA onayı var, Paige tek örnek" çerçevesi artık geçersizdir.

Üç onay, bu çoğullaşmanın farklı yüzlerini temsil eder. Paige Prostate (2021, de novo) tümör saptamada ilk örnekti. Buna Ibex Prostate Detect (FDA 510(k), 10 Şubat 2025) eklendi: prostat biyopsisinde küçük ve nadir kanserleri saptamaya yardımcı bir IVD yazılımı. Doğrulama çalışmasında kanser ısı haritası için %99,6 pozitif prediktif değer (PPV) bildirildi ve başlangıçta benign tanısı almış ardışık hasta kohortunda %13 oranında atlanan kanser yakalandı.

Asıl paradigma değişimi ise ArteraAI Prostate ile geldi (FDA De Novo, 13 Ağustos 2025). Bu, dijital patolojide ilk YZ tabanlı prognostik/prediktif testtir ve yeni bir ürün kodu kategorisi açmıştır. Multimodal bir yaklaşımla (dijitalize biyopsi görüntüsü + klinik veri) lokalize prostat kanserinde kısa dönem hormon tedavisinden fayda görecek hastaları ayırt eder. Önemli olan, geliştirme ve doğrulamasının 15 yıla varan takipli birden çok faz-3 randomize kontrollü çalışmaya (RKÇ) dayanmasıdır — uzak metastaz, biyokimyasal başarısızlık ve prostat kanserine özgü mortalite öngörüsünde standart modelleri geçmiştir. Bu, "tümörü gördü mü?" sorusundan "bu hastaya hangi tedavi yarar?" sorusuna geçiştir.

Altyapı tarafında da onaylar genişledi: Roche VENTANA DP 200 tarayıcısı (510(k), Haziran 2024), Sectra ile Leica Aperio GT 450 DX'in DICOM tanısal kullanımı (2024) ve PathAI AISight Dx'in çoklu tarayıcı desteği (2024-2025). İlk WSI birincil tanı izni ise hâlâ 2017 tarihli Philips IntelliSite'tır.

Onay ≠ Üstünlük Kanıtı

FDA 510(k)/de novo izinleri çoğunlukla retrospektif okuyucu ve doğrulama çalışmalarına dayanır; ürünün güvenli ve etkili olduğunu gösterir, ancak hasta sonucunu (sağkalım, mortalite) iyileştirdiğini kanıtlamaz. ArteraAI'nın faz-3 RKÇ temeli bu kuralın güçlü bir istisnasıdır.

Temel (foundation) modeller: ölçek yarışı ve "tek en iyi yok" gerçeği

Hesaplamalı patolojinin son iki yıldaki en büyük teknik atılımı temel modellerdir — milyonlarca etiketsiz slayttan kendi kendine denetimli (self-supervised) öğrenen, ardından birçok göreve uyarlanabilen büyük sinir ağları. Virchow (Paige, Nature Medicine, Ekim 2024) o tarihte en büyüğüydü: yaklaşık 100.000 hastadan 1,5 milyon WSI üzerinde eğitilmiş, 632 milyon parametreli bir görü dönüştürücüsü (ViT). Pan-kanser saptamada 9 yaygın ve 7 nadir kanser genelinde örnek düzeyinde AUC 0,95 bildirdi ve bazı nadir varyantlarda üretimdeki dokuya-özgü klinik modelleri geçti.

Ardından bir ölçek yarışı başladı: Virchow2 (225.401 hastadan 3,1 milyon WSI), Microsoft/Providence'ın Prov-GigaPath'ı (1,3 milyar patch, 31 doku tipi; EGFR mutasyon öngörüsünde standartlara göre +%23) ve Bioptimus'un 1,1 milyar parametreli H-Optimus-0'ı. Ancak "daha büyük model = daha iyi" varsayımı, alanın en önemli düzeltmesini gerektirdi.

Bu düzeltme, Neidlinger ve arkadaşlarının bağımsız kıyaslama çalışmasından (Nature Biomedical Engineering, 2025) geldi: 19 temel model, 13 kohort, 6.818 hasta / 9.528 slayt (akciğer, kolorektal, mide, meme). Sonuç çarpıcıdır: dil-görü modeli CONCH en yüksek genel performansı gösterdi, Virchow2 yakın ikinci oldu — ancak düşük-veri ve düşük-prevalans görevlerinde tüm modellerin üstünlüğü zayıfladı. Dahası, en iyi model kanser tipine göre değişti: mide ve küçük hücreli dışı akciğer kanserinde CONCH, kolorektalde Virchow2, memede BiomedCLIP. Yani tek bir "en iyi" temel model yoktur; performans göreve ve dokuya bağımlıdır. Bu, model seçimini ticari iddialarla değil, kullanım alanına özgü kanıtla yapma gerekliliğini ortaya koyar.

Toplu tanısal doğruluk: en güçlü sayı, en kritik uyarıyla

YZ'nin patolojideki genel doğruluğuna dair en kapsamlı sayısal dayanak, McGenity ve arkadaşlarının sistematik derleme ve tanısal test doğruluğu meta-analizidir (NPJ Digital Medicine, 2024). 2.976 çalışmadan 100 derlemeye, oradan 48 meta-analize süzülen veri 152.000'den fazla WSI'yi kapsar. Havuzlanmış sonuçlar etkileyicidir: duyarlılık %96,3 (GA 94,1-97,7), özgüllük %93,3 (GA 90,5-95,4). Gastrointestinal patolojide duyarlılık %93 / özgüllük %94, üropatolojide %95 / %96 düzeyindedir.

Ancak bu makalenin en önemli mesajı doğruluk rakamı değil, onun ardındaki uyarıdır: çalışmaların %99'u, QUADAS-2 değerlendirmesinde en az bir alanda yüksek veya belirsiz yanlılık ya da uygulanabilirlik riski taşıyordu. Yani yüksek doğruluk bildiriliyor, fakat bunu üreten metodoloji büyük ölçüde zayıf. Yazarların kendi vurgusuyla, alan "çok daha titiz değerlendirme" gerektiriyor. Bu meta-analiz PMC'de tam metin olarak açık erişimdedir ve geri çekme/erratum içermez; sayısal dayanağı bu nedenle bu yazıda merkeze alınmıştır.

Görev-özgü meta-analizler daha olgun bir tablo çizer. Meme dokusunda HER2 immünohistokimya sınıflaması için YZ, havuzlanmış duyarlılık 0,97 (GA 0,96-0,98), özgüllük 0,82 (0,73-0,88) ve AUC 0,98 düzeyine ulaşmıştır. Dar ve iyi tanımlı görevlerde YZ, patolojiye en yakın olgunluğa erişmiş durumdadır.

Kanıt kaynağıKapsamTemel sonuçKritik uyarı
McGenity meta-analizi (2024)48 meta-analiz, >152.000 WSIDuyarlılık %96,3 / Özgüllük %93,3Çalışmaların %99'u yüksek/belirsiz yanlılık (QUADAS-2)
Neidlinger kıyaslaması (2025)19 model, 6.818 hastaCONCH genel lider, Virchow2 ikinciDüşük-veride üstünlük kayboluyor; en iyi model dokuya göre değişiyor
Virchow (2024)1,5M WSI, 16 kanser tipiPan-kanser AUC 0,95Retrospektif; dış validasyon sınırlı
HER2 IHC meta-analizi (2024)Görev-özgüAUC 0,98; duyarlılık 0,97Dar görev; genellenebilirlik kısıtlı

Klinik iş akışına entegrasyon: mümkün ama yavaş

Tam dijital "sign-out" — yani patoloğun tüm tanıyı ekrandan, camdan slayda dönmeden imzalaması — teknik olarak uygulanabilirdir. Bir merkez, başlangıçta tek bir klinik tarayıcısı bile yokken yola çıkıp Eylül 2025 itibarıyla tüm klinik vakalarını dijital olarak imzalar hâle geldi. Ancak yaygınlaşma yavaştır: 2024 sonu itibarıyla laboratuvarların yalnızca yaklaşık %10'u tam dijital iş akışına geçmişti; ABD'de klinik laboratuvarların yaklaşık üçte biri süreci başlatmış veya planlamıştı.

Geçişin faydaları somuttur: bazı hastaneler tanı süresinde yaklaşık üçte bir azalma, YZ destekli akışlarda immünohistokimya kullanımında düşüş ve tanı güveninde artış bildiriyor. Buna karşılık en büyük engel maliyettir: yüksek kapasiteli tarayıcı, depolama sunucuları ve yüksek çözünürlüklü ekranlardan oluşan tam bir çözüm, çoğu laboratuvar için altı haneli bir yatırımdır ve dar bütçeli birimler için gerekçelendirmesi zordur.

Üretken ve etmen-temelli (agentik) yapay zeka: ufuktaki adım

2026'nın yükselen başlığı, üretken ve etmen-temelli modellerdir. PathChat, CONCH, PRISM, MUSK ve TITAN gibi sistemler otomatik rapor üretimi, görsel soru-cevap ve slayt üzerinde gezinme gibi yeteneklerle patoloğun iş akışını dönüştürmeyi hedefler. Ancak burada dürüstlük şarttır: bu teknolojiler 2026 itibarıyla araştırma aşamasındadır ve klinik kullanım için onaylı değildir. Vaat büyük, ancak klinik doğrulama henüz başlangıçtadır.

Sınırlar ve dürüst çerçeve: neyin kanıtlandığı, neyin kanıtlanmadığı

Kanıtlananlar: Görev-özgü saptama (prostat kanseri tespiti, HER2/IHC sınıflama) retrospektif okuyucu çalışmalarında patolog duyarlılığını anlamlı biçimde artırır — Paige Prostate'te duyarlılık %88,7'den %96,6'ya çıkmış, yanlış negatiflerde yaklaşık %70 azalma gözlenmiştir. Temel modeller, veri-kısıtlı koşullarda dahi güçlü temsiller öğrenir. Tam dijital sign-out teknik olarak uygulanabilirdir.

Kanıtlanmayanlar veya zayıf kalanlar:

Prospektif RKÇ kanıtı hâlâ çok seyrektir. Onayların çoğu retrospektif çalışmalara dayanır. İlk büyük çok-merkezli prospektif RKÇ ("AI-Assisted Pathologist Performance Improvement", NCT07291362) ancak Kasım 2025'te başladı ve yaklaşık 2027'de tamamlanacak. Yani mortalite veya sağkalım düzeyinde randomize hasta-sonucu kanıtı henüz mevcut değildir.

Dış validasyon açığı: Eğitim kohortları (özellikle TCGA) ağırlıkla Avrupa kökenli popülasyonlardan ve sınırlı sayıda akademik merkezden gelir; yetersiz temsil edilen gruplarda duyarlılık düşebilir.

Dağılım kayması (domain shift): Tarayıcı optiği, boyama protokolü ve sıkıştırma farkları, merkezler arasında merkez-içinden daha büyük değişkenlik yaratır. Boyama varyasyonu, genelleştirmenin önündeki en önemli teknik bariyerdir; renk normalizasyonu ise artefakt üretebilir ve sık yeniden eğitim gerektirir.

Kestirme öğrenme (shortcut/batch effect): Bir model, klinik özelliği değil kuruma-özgü teknik imzayı öğrenebilir — bu, performansı laboratuvarda abartır, gerçek dünyada düşürür. Otomasyon yanlılığı ise klinisyenlerin, özellikle deneyimsiz veya zaman baskısı altında, YZ önerisini kendi yargısının önüne koyması riskidir.

"Doğruluktan güvenilirliğe" kayma

2026 uzman konsensüsüne göre odak, ham doğruluk metriğinden güvenilirliğe (reliability) kaymalıdır. Akademik, kontrollü ortamdaki insan-düzeyi performans, gerçek klinik faydaya otomatik dönüşmez. Aktif yerelleştirme — yerinde validasyon, post-hoc kalibrasyon ve siteye özgü ince-ayar — bir lüks değil, zorunluluktur.

Sonuç

Dijital ve hesaplamalı patolojide yapay zeka, 2024-2026 arasında deneysel bir merak olmaktan çıkıp düzenleyici, teknik ve klinik açıdan somut bir gerçekliğe dönüştü. Onaylar çoğullaştı ve hızlandı; ArteraAI ile alan tümör saptamadan tedavi öngörüsüne geçti; temel modeller güçlü ve genel-amaçlı temsiller öğrenmeyi başardı. Görev-özgü uygulamalarda (prostat saptama, HER2 sınıflama) YZ, patolog performansını ölçülebilir biçimde destekliyor.

Buna karşılık, dürüst bir okuma şu boşlukları gizleyemez: en güçlü sayısal dayanağımız (McGenity meta-analizi) yüksek doğruluk gösterse de altındaki çalışmaların %99'u metodolojik yanlılık taşıyor; en iyi temel model diye bir şey yok, performans göreve bağlı; ve en kritik olarak, hasta sonucunu iyileştirdiğini gösteren büyük prospektif randomize kanıt henüz olgunlaşmadı — bunun ilk meyveleri 2027'de beklenecek. Dağılım kayması, dış validasyon eksikliği ve otomasyon yanlılığı, klinik dağıtımda hâlâ aşılması gereken gerçek engellerdir.

Pratik sonuç şudur: yapay zeka, patolojide insan uzmanlığının yerini almaktan ziyade onu güçlendiren bir araç olarak en güvenilir konumdadır. Her klinik dağıtım, ticari doğruluk iddialarına değil, kendi laboratuvarında doğrulanmış, kalibre edilmiş ve sürekli izlenen kanıta dayanmalıdır. Alanın olgunlaşması, daha büyük modellerden çok daha iyi kanıttan geçecektir.

Kaynaklar

  1. Vorontsov E, ve ark. A foundation model for clinical-grade computational pathology and rare cancers detection (Virchow). Nature Medicine. 2024. site
  2. McGenity C, ve ark. Artificial intelligence in digital pathology: a systematic review and meta-analysis of diagnostic test accuracy. NPJ Digital Medicine. 2024. site
  3. Neidlinger P, ve ark. Benchmarking foundation models as feature extractors for weakly-supervised computational pathology. Nature Biomedical Engineering. 2025. site
  4. Ibex Medical Analytics Receives First FDA 510(k) Clearance (Ibex Prostate Detect). Business Wire. 2025. site
  5. Artera Receives U.S. FDA De Novo Marketing Authorization (ArteraAI Prostate). Business Wire. 2025. site
  6. FDA grants de novo authorization to ArteraAI Prostate. Urology Times. 2025. site
  7. Computational Pathology in the Era of Emerging Foundation and Agentic AI — International Expert Perspectives. arXiv. 2026. site
  8. Digital Pathology Imaging AI in Cancer Research and Clinical Trials: An NCI Workshop Report. NCI / PMC. 2025. site
  9. Application of AI and digital tools in cancer pathology. The Lancet Digital Health. 2025. site
  10. Roche receives FDA clearance on its digital pathology solution (VENTANA DP 200). Roche Diagnostics. 2024. site
  11. AI-Assisted Pathologist Performance Improvement (NCT07291362). ClinicalTrials.gov. 2025. site
Bilgilendirme: Bu içerik yalnızca eğitim ve bilgilendirme amaçlıdır; tanı veya tedavi kararı yerine geçmez. Anılan yapay zekâ sistemleri, patoloğun ve klinik ekibin gözetiminde, ilgili düzenleyici onayları ve laboratuvar doğrulamaları çerçevesinde kullanılmalıdır.