Obstetride Yapay Zeka: Fetal Ultrasonda Otomatik Biyometri ve CTG Yorumlama

Yapay zeka fetal ultrasonda biyometriyi uzman düzeyinde ölçüyor ve tarama süresini kısaltıyor; ancak kardiyotokografide klinik sonucu iyileştirdiğine dair randomize kanıt hâlâ yok.

Op. Dr. Cem Akaltun Güncellendi Obstetri Fetal Ultrason CTG / NST

Obstetrik görüntülemede yapay zeka (YZ), birkaç yıl öncesine kadar daha çok vaat düzeyinde tartışılan bir konuyken, 2025-2026 itibarıyla somut klinik kanıtlar ve düzenleyici onaylarla artık gerçek bir uygulama alanına dönüşmüştür. Özellikle fetal ultrasonda otomatik biyometri ve standart düzlem tanıma konusunda elde edilen sonuçlar dikkat çekicidir. Buna karşılık intrapartum kardiyotokografi (CTG) yorumlamasında durum çok daha çekingendir: teknik doğruluk yüksek olsa da, doğrudan bebek sonucunu iyileştirdiğine dair sağlam kanıt hâlâ ortaya konabilmiş değildir. Bu yazıda her iki alandaki güncel kanıtı, abartıdan kaçınarak ve "neyi başardı / neyi başaramadı" ayrımını koruyarak ele alıyorum.

Otomatik Biyometri: Artık Uzman Düzeyinde Doğruluk

Alandaki en önemli gelişme, randomize klinik fayda kanıtının nihayet ortaya çıkmasıdır. King's College London ekibinin yürüttüğü PROMETHEUS randomize çalışması (NEJM AI, Mart 2025), tek merkezde 78 gebe ve 58 sonografçıyla gerçekleştirildi. Burada YZ tanı koymadı; 13 standart düzlemi tanıyıp kaydetti ve 4 temel biyometriyi ölçtü. Sonuçlar etkileyiciydi: fetal malformasyon yakalama duyarlılığı YZ destekli kolda %88,9'a (standart taramada %81,5), özgüllük %98,0'e (standart %92,2) yükseldi. Daha da çarpıcı olanı, tarama süresinin 19,7 dakikadan 11,4 dakikaya (yaklaşık %42 azalma) ve sonografçının bilişsel yükünün (NASA-TLX ölçeği) 46,5'ten 35,2'ye (yaklaşık %24 azalma) inmesiydi. YZ her ölçümde binlerce anlık görüntüyü değerlendirdiği için tekrarlanabilirlikte insan operatörü geride bıraktı.

Bu bulgu tek değil. Strazburg ekibinin video-temelli derin öğrenme çalışması (J Gynecol Obstet Hum Reprod, 2025; 281 video), YZ ile uzman arasındaki ortalama mutlak göreli hatayı baş çevresinde %0,96, abdomen çevresinde %1,56, femur uzunluğunda %1,77 ve tahmini fetal ağırlıkta %3,10 olarak ölçtü. Özellikle deneyimsiz sonografçılarla kıyaslandığında YZ anlamlı şekilde daha düşük hata verdi — yani teknolojinin asıl değeri, operatörler arası değişkenliği azaltmasında yatıyor olabilir.

Standart Düzlem Tanıma: Yüksek Başarı, Ama Kalp Hâlâ Zayıf Halka

Otomatik düzlem sınıflandırmasında genel performans yüksektir, ancak bu tablo nüanslı okunmalıdır. İskenderiye'de yürütülen prospektif kohort çalışması (Int J Gynaecol Obstet, 2025; 772 katılımcı, 11.823 düzlem), BioticsAI sistemiyle 18 ISUOG standart düzleminde genel duyarlılık %89,9, özgüllük %77,4 ve raporlamada %44 hız kazancı (4,02'ye karşı 7,16 dakika) bildirdi. Ancak femur ve abdomen için doğruluk %98'in üzerindeyken, kardiyak ve kraniyofasiyal düzlemler belirgin biçimde zayıftı: üç-damar-trakea düzleminde duyarlılık yalnızca %62,7, negatif öngörü değeri %30,8 idi. Bu, fetal kalbin görüntülenmesinin hâlâ otomasyonun en zorlandığı alan olduğunu gösteriyor.

FDA Onayı Klinik Fayda Demek Değildir

ABD'de cihazların büyük bölümü 510(k) yolundan onaylanır; bu yol mevcut bir cihaza "eşdeğerlik" temeline dayanır ve randomize sonuç çalışması gerektirmez. Dolayısıyla "FDA onaylı" ifadesi tek başına hastaya net klinik yarar sağlandığı anlamına gelmez — bu ikisini birbirinden ayırmak gerekir.

Anomali Taramasında YZ: Okuyucu Performansını Artırıyor

Anomali taramasında en olgun ürünlerden biri olan Sonio Suspect (FDA 510(k) onayı, 2023), kalp, beyin ve abdomenden alınan 7 rutin görüntüyü kullanarak sekiz yaygın fetal anomaliyi işaretler. 47 merkezli çoklu-okuyucu çalışmasında, anomali yakalamada eğri altı alan (AUC) %69'dan %91'e (22 puanlık artış, p<0,001) yükseldi ve bu etki klinisyenin deneyiminden ve hastanın vücut kütle indeksinden bağımsızdı.

Fetal kardiyak anomalilere odaklanan bir sistematik derleme ve meta-analiz (eClinicalMedicine, Mayıs 2025; 15 çalışma, 30.121 fetüs), normal-anormal kalp ayrımında havuzlanmış duyarlılığı 0,89 (%95 GA 0,83-0,93) ve özgüllüğü 0,91 (%95 GA 0,84-0,95) olarak bildirdi. Ancak bu rakamlar dikkatle okunmalıdır: çalışmaların çoğu retrospektifti, QUADAS-2 ile değerlendirildiğinde orta-yüksek yanlılık riski taşıyordu ve raporlama kalitesi düşüktü (TRIPOD+AI uyumu medyan %53). Heterojenite de yüksekti (I²≈%78). Yani umut verici bir genel resim, ama metodolojik temkin gerektiren bir kanıt tabanı.

CTG / Elektronik Fetal İzlem: Yüksek Doğruluk, Kanıtlanmamış Fayda

Burada kanıt resmi köklü biçimde farklıdır ve dürüst bir çerçeve şarttır. Alanın temel referansı olan INFANT randomize çalışması (Lancet, 2017; 47.062 kadın), bilgisayar destekli CTG yorumlamasının kötü neonatal sonucu azaltmadığını gösterdi: olumsuz sonuç bileşeni her iki kolda da %0,7 idi (düzeltilmiş RR 1,01; %95 GA 0,82-1,25) ve iki yaşta nörogelişimsel skorlarda da fark yoktu. Bu landmark negatif sonuç, aradan geçen yıllara rağmen geçerliliğini koruyor.

Buna karşılık, derin öğrenme tabanlı yeni modeller yüksek teknik doğruluk bildiriyor. Kore'de 14 hastaneyi kapsayan ulusal çalışma (Scientific Reports, 2025; 22.522 doğum) normal-anormal CTG ayrımında dahili AUC 0,880, dış validasyonda 0,862-0,895 değerlerine ulaştı. Çin'den çift-modal bir model (Front Physiol, 2025) fetal kalp hızını uterin kontraksiyonla birleştirerek AUC'yi 0,944'e çıkardı. Ancak bu çalışmaların yazarları dahi klinik uygulanabilirliği ileride prospektif çalışmalarla değerlendireceklerini açıkça belirtiyor.

Bu noktada çelişen kanıtı tek bir kaynağa indirgemeden yan yana sunmak doğru olur:

KaynakTasarımTemel bulguNe söylüyor
INFANT (Lancet, 2017)Randomize, 47.062 kadınKötü neonatal sonuç her iki kolda %0,7 (RR 1,01)Hasta sonucunu iyileştirmedi
Ulusal DL (Sci Rep, 2025)Çok merkezli kohort, 22.522 doğumAUC 0,862-0,895Yüksek tanısal doğruluk (sonuç değil)
Çift-modal (Front Physiol, 2025)Tek merkez, n=326AUC 0,944Teknik vaat, validasyon eksik

Aradaki fark aslında bir kavram ayrımıdır: tanısal doğruluk (modelin patolojik izleri ne kadar iyi tanıdığı) ile hasta-sonucu kanıtı (bu tanımanın gerçekten daha az asfiksi, daha az sezaryen ya da daha iyi nörogelişim sağlayıp sağlamadığı) aynı şey değildir. BJOG'da 2025'te yayımlanan uzman derlemesi bu öz-eleştiriyi açıkça yapıyor: intrapartum CTG'nin morbidite-mortaliteyi önlediğine dair kanıt 50 yıl sonra hâlâ belirsizdir; yüksek yanlış pozitiflik ve düşük özgüllük gereksiz sezaryenlere katkıda bulunmaktadır ve derin öğrenme yöntemleri klinik pratiğe girmeden önce aşılması gereken birçok engel vardır.

Erişim Boyutu: "Kör Tarama" ve Düşük Kaynaklı Ortamlar

Belki de en heyecan verici yeni yön, deneyimsiz kullanıcıların kullanabileceği YZ araçlarıdır. Butterfly Network'ün "kör tarama" (blind-sweep) gestasyonel yaş aracı, Mart 2026'da FDA 510(k) onayı aldı — bu, alandaki ilk kör-tarama FDA onayıdır. Eğitimsiz bir sağlık çalışanı el tipi cihazla 6 rehberli abdominal tarama yapar, ekrana bile bakmaz; sistem 16-37 hafta aralığında, 2 dakikadan kısa sürede deneyimli bir sonografçıya eşdeğer sonuç üretir. Validasyon temelini oluşturan NEJM Evidence çalışmasında, acemi kullanıcıda model yöntemiyle ortalama mutlak hata 4,9 gün, biyometri yöntemiyle 5,4 gündü. Benzer biçimde, görüntü yorumlama gerektirmeyen bir derin öğrenme modeli (npj Digital Medicine, 2025) 14-18. haftada 1,7 günlük, 18-24. haftada 2,8 günlük hata ile gestasyonel yaşı tahmin edebildi. Bu yaklaşım, sonografçıya erişimin sınırlı olduğu bölgelerde antenatal bakım için gerçek bir kapı aralayabilir.

Temel Kısıt: Dağılım Kayması ve Dış Validasyon

Tüm bu sonuçların ortak ve kritik kısıtı, modellerin eğitildikleri ortamdan farklı bir ortamda nasıl davrandığıdır. UCL ekibinin çok merkezli karşılaştırma çalışması (Scientific Reports, 2026; 4 merkez, 7 cihaz, 4.513 görüntü), tek merkezde eğitilip test edilen bir modelin performansını çok merkezli teste kıyasla fazla iyimser gösterdiğini ortaya koydu — bu, "dağılım kayması" (domain shift) olgusunun somut kanıtıdır. Intrapartum Ultrasound Grand Challenge (Med Image Anal, 2026) da benzer biçimde sonuçların umut verici olduğunu ama araştırmanın erken aşamada olduğunu ve klinik uygulamadan önce derinlemesine incelemenin şart olduğunu vurguluyor.

Otorite Çerçevesi: ISUOG Pozisyon Bildirisi

Uluslararası Obstetrik ve Jinekolojide Ultrason Derneği (ISUOG), Kasım 2025'te resmi bir yapay zeka pozisyon bildirisi yayımladı. Bildiri, bir YZ sisteminin sahaya dağıtılmasından önce şunları zorunlu kılıyor: tanısal performansın gösterilmesi, iş akışına etkisinin değerlendirilmesi, klinik güvenlik, popülasyona ve kullanıcıya özgü test, eğitim veri setinin demografik temsiliyetinde şeffaflık ve dağıtım sonrası sürveyans. ISUOG ayrıca bir risk katmanlandırması öneriyor: düşük riskli idari araçlar, orta riskli insan gözetimli karar-destek sistemleri ve yüksek riskli otonom sistemler. Bu çerçeve, alanın artık "işe yarıyor mu" sorusundan "güvenli ve adil biçimde nasıl entegre edilir" sorusuna geçtiğini gösteriyor.

Sonuç

Obstetrik YZ'de tablo, abartıya da küçümsemeye de yer bırakmayacak kadar nettir. Otomatik biyometri ve standart düzlem tespiti, uzman düzeyinde doğruluk ve uzmanı aşan tekrarlanabilirlik sunarak tarama süresini ve klinisyen yükünü ölçülebilir biçimde azaltmıştır; YZ destekli anomali taraması okuyucu performansını anlamlı ölçüde artırabilmektedir ve kör tarama araçları düşük kaynaklı ortamlar için gerçek bir erişim potansiyeli taşımaktadır. Buna karşılık CTG/elektronik fetal izlemde YZ'nin neonatal sonucu iyileştirdiğine dair prospektif randomize kanıt hâlâ yoktur; yüksek AUC değerleri tanısal doğruluğu gösterir ama hasta yararını kanıtlamaz. Biyometri çalışmalarının çoğu tek merkezli ve seçilmiş kohortludur, dağılım kayması dış geçerliliği zayıflatır ve kardiyak anomali kanıtı orta-yüksek yanlılık riski taşır. Klinik pratikte mantıklı yaklaşım, YZ'yi deneyimli klinisyenin yerine değil yanında — bir kalite ve verimlilik aracı olarak — konumlandırmak, ISUOG'un önerdiği gibi popülasyona özgü doğrulama ve dağıtım sonrası izlemeyle birlikte temkinli biçimde benimsemektir. Teknoloji hızla olgunlaşıyor; ancak otomasyon yanlılığı, eşitsizlik ve "onay ≠ fayda" tuzaklarına karşı eleştirel uyanıklık, en az teknolojinin kendisi kadar önemlidir.

Bilgilendirme: Bu içerik genel bilgilendirme ve eğitim amaçlıdır; tıbbi tavsiye, tanı veya tedavi yerine geçmez. Sözü edilen yapay zeka araçları araştırma ve/veya destek amaçlıdır; nihai tanı ve tedavi sorumluluğu hekime aittir. Gebelik takibinizle ilgili kararlar için hekiminize danışınız.

Kaynaklar

  1. Day TG, Matthew J, ve ark. AI-assisted fetal anomaly screening (PROMETHEUS RCT). NEJM AI. 2025. site
  2. INFANT Collaborative Group. Computerised interpretation of fetal heart rate during labour (INFANT). The Lancet. 2017. site
  3. Lovers AAA, ve ark. Advancements in fetal heart rate monitoring. BJOG. 2025. site
  4. AI-enabled prenatal ultrasound for fetal cardiac abnormalities: systematic review & meta-analysis. eClinicalMedicine. 2025. site
  5. Park J, ve ark. Automated interpretation of CTG using deep learning (nationwide multicenter). Scientific Reports. 2025. site
  6. Goetz-Fu A, ve ark. Deep learning for automatic fetal biometry from ultrasound videos. J Gynecol Obstet Hum Reprod. 2025. site
  7. Atia H, ve ark. Computer vision AI for second-trimester anomaly plane classification (BioticsAI). Int J Gynaecol Obstet. 2025. site
  8. Zhang Y, ve ark. 2D vs 3D AI-enhanced ultrasound for crown-rump length (3DCRL-Net). BMC Pregnancy Childbirth. 2025. site
  9. Di Vece C, ve ark. Multicentre benchmark dataset for landmark-based fetal biometry (domain shift). Scientific Reports. 2026. site
  10. ISUOG. Artificial Intelligence Positioning Statement. ISUOG. 2025. site
  11. Butterfly Network. Blind-sweep gestational age tool FDA 510(k) clearance. BusinessWire. 2026. site
  12. Sonio. Suspect FDA 510(k) clearance for fetal anomaly detection. Sonio. 2023. site