Tüp Bebekte Embriyo Seçiminde Yapay Zeka: Neyi Başardı, Neyi Başaramadı?
Yapay zeka embriyo değerlendirmeyi yaklaşık 10 kat hızlandırıp tutarlı kılıyor; ancak iki bağımsız randomize çalışmada canlı doğum veya klinik gebelikte morfolojiye üstünlük gösterilemedi. Kanıt, "daha hızlı ve standart" diyor; "daha fazla bebek" demiyor.
Tüp bebek (IVF) tedavisinin en kritik kararlarından biri, transfer edilecek embriyonun seçimidir. Onlarca yıldır bu seçim, embriyoloğun mikroskop altında yaptığı morfolojik değerlendirmeye dayanır: blastokist genişlemesi, iç hücre kütlesi ve trofektoderm kalitesi. Son yıllarda derin öğrenme tabanlı yapay zeka (YZ) modelleri, time-lapse görüntülerden veya statik blastokist fotoğraflarından embriyoyu otomatik olarak skorlayarak bu sürece girdi. Ortaya iddialı bir vaat çıktı: insandan daha objektif, daha tutarlı ve belki de daha başarılı bir seçim. Peki kanıtlar bu vaadi karşılıyor mu? 2024-2026 döneminin verileri, dürüst ve net bir cevap veriyor — ve bu cevap, pazarlama söyleminden farklı.
Öncü randomize çalışma: Yapay zeka morfolojiyi yenemedi
Alanın dönüm noktası, 2024'te Nature Medicine'de yayımlanan çok merkezli, çift-kör, randomize kontrollü çalışmadır (Illingworth ve ark.). Avustralya ve Avrupa'daki 14 merkezde, 1.066 hasta, derin öğrenme modeli iDAScore ile embriyo seçimi veya standart manuel morfoloji koluna ayrıldı. Bu, "noninferiority" (geri kalmama) hipotezini test eden, alandaki en güçlü prospektif kanıttır.
Sonuçlar net oldu. Klinik gebelik oranı yapay zeka kolunda %46,5, morfoloji kolunda %48,2 idi; risk farkı −1,7 puan (%95 güven aralığı −7,7 ila +4,3). Önceden belirlenen noninferiority marjı (−%5) güven aralığının alt sınırı tarafından aşıldığı için, yapay zekanın morfolojiden geri kalmadığı bile gösterilemedi. Sekonder sonlanım olan canlı doğum oranı yapay zekada %39,8, morfolojide %43,5 oldu (risk farkı −3,9 puan, %95 GA −9,9 ila +2,2; p=0,24) — istatistiksel fark yok, ama eğilim yapay zeka lehine de değil.
Dikkat çeken bir alt-grup sinyali vardı: taze transferlerde yapay zeka hafifçe iyiyken (RR 1,08), dondur-tümünü (freeze-all) sikluslarında belirgin biçimde daha kötü performans gösterdi (klinik gebelik %49,5 vs %61,3; etkileşim p=0,032). Yani üstünlük bir yana, donmuş embriyo transferinde olası bir zarar sinyali ortaya çıktı. Ayrıca embriyolog ile yapay zeka, olguların yalnızca %65,8'inde aynı embriyoyu seçti — yani vakaların üçte birinde farklı embriyo öne çıkarıldı, buna rağmen gebelik oranları benzer kaldı. Bu, "en iyi tek embriyoyu seçmenin" sonucu değiştirmediğini güçlü biçimde düşündürür.
Tek kanıtlanmış üstünlük: hız
Aynı çalışmada yapay zekanın net biçimde kazandığı tek alan değerlendirme süresiydi: embriyo başına 21,3 saniye (yapay zeka) ile 208,3 saniye (manuel) — yaklaşık 10 kat hızlanma (p<0,001). Yapay zeka "daha çok bebek" değil, "daha hızlı ve daha tutarlı değerlendirme" sunuyor.
İkinci bağımsız çalışma da aynı yönü gösterdi
Bu sonuçların tek bir merkeze ya da tek bir ürüne özgü olmadığını anlamak önemli. ABD'de 7 merkezde yürütülen Alife Health "LOTUS" randomize çalışması (440 hasta), statik blastokist görüntülerinden devam eden gebelik öngörüsünü test etti. Yayımlanan ara analizde (ilk 100 hasta), devam eden gebelik oranı yapay zeka kolunda %69, kontrol kolunda %64 idi (+%5 fark, p=0,5 — istatistiksel olarak anlamsız). Tam, hakemli sonuçlar henüz yayımlanmadı; ancak iki bağımsız randomize çalışmanın da üstünlük gösterememesi, sonucun rastlantı olmadığına işaret eder.
Düzenleyici onaylar hızlı, ama onay ≠ kanıt
Klinik kanıt nötr kalırken, ticari pazar hızla ilerledi. Fairtility CHLOE Blast, 2025'te FDA 510(k) klirensi aldı ve "ilk FDA-klirensli makine öğrenmesi tabanlı embriyo değerlendirme klinik karar-destek yazılımı" olarak konumlandırıldı. Alife Health Embryo Predict ise 28 Mayıs 2026'da FDA klirensi aldı; ABD, AB ve İngiltere'de CE Mark ile birlikte pazarda. Burada hayati bir nüans var: bu onaylar "embriyo değerlendirme / karar-destek" içindir — canlı doğumu artırdığı düzenleyici olarak kanıtlanmış değildir. Klirens, ürünün güvenli ve amaca uygun çalıştığını gösterir; klinik üstünlüğü değil.
Öploidi (kromozom) öngörüsü: orta düzey, PGT-A'nın yerini tutmaz
Yapay zekadan beklenen bir başka şey, embriyonun kromozomal durumunu (öploid mi anöploid mi) görüntüden tahmin etmesidir — bu, invaziv biyopsi gerektiren PGT-A testine alternatif olabilir mi sorusunu doğurdu. 2024'te eClinicalMedicine'de yayımlanan sistematik derleme ve meta-analiz (20 çalışma, 6.879 embriyo), birleşik AUC değerini 0,80 (duyarlılık 0,71; özgüllük 0,75) buldu. Ancak kritik bir ayrıntı var: yalnızca görüntüye dayanan modeller AUC 0,62'de kalırken, görüntüye anne yaşı ve klinik veri eklendiğinde AUC 0,71'e çıkıyordu — yani gücün önemli kısmı yapay zekadan değil, klinik bağlamdan geliyor. Üstelik heterojenlik çok yüksekti (I²≈%97) ve 20 çalışmanın yalnızca 7'sinde dış validasyon vardı. Yazarların net sonucu: yapay zeka invaziv yöntemlerin (PGT-A) yerini alamaz, yalnızca bir karar-destek aracıdır.
| Görev / sonlanım | Performans | Çalışma / kanıt |
|---|---|---|
| Klinik gebelik (YZ vs morfoloji) | %46,5 vs %48,2 (fark −1,7; noninferiority gösterilemedi) | Illingworth 2024, RKÇ |
| Canlı doğum (YZ vs morfoloji) | %39,8 vs %43,5 (fark −3,9; p=0,24) | Illingworth 2024, RKÇ |
| Değerlendirme süresi | 21 sn vs 208 sn (~10× hızlı) | Illingworth 2024, RKÇ |
| Devam eden gebelik (YZ vs kontrol) | %69 vs %64 (p=0,5) | Alife LOTUS, ara analiz |
| Öploidi öngörüsü | AUC 0,80 (yalnız görüntü 0,62) | Xin 2024, meta-analiz |
| Genel embriyo seçimi (tanısal) | AUC 0,70 (duyarlılık 0,69) | Diagnostik meta-analiz 2025 |
Ne kanıtlandı, ne kanıtlanmadı?
Kanıtlanan: Yapay zeka embriyo değerlendirmeyi çok hızlandırır (~10 kat) ve değerlendiriciden bağımsız, tutarlı/tekrarlanabilir bir skor üretir; bu, gözlemciler-arası değişkenliği azaltarak iş akışı ve standardizasyon açısından gerçek bir kazanımdır. Ayrıca embriyoyu, morfolojiye benzer bir doğrulukla sıralayabilir (implantasyon AUC ~0,70; öploidi AUC ~0,80).
Kanıtlanmayan: Canlı doğum veya klinik gebelik oranında morfolojiye üstünlük kanıtlanmadı — hatta öncü çalışmada noninferiority bile gösterilemedi. Yapay zeka PGT-A'nın yerini alamaz. En önemlisi, kümülatif canlı doğum üzerine etki gösterilmedi: bir hastanın tüm uygun embriyoları zamanla zaten transfer edildiğinden, "en iyiyi önce seçmek" gebeliğe ulaşma süresini kısaltabilir, ancak toplam bebek sayısını artırması beklenmez. Bu sonlanım henüz randomize çalışmayla test edilmemiştir.
Sıralama ≠ daha iyi embriyo yaratmak
Yapay zeka, var olan embriyo havuzunu yeniden sıralar; havuzun biyolojik kalitesini değiştirmez. Hasta başına doğum potansiyeli, sonuçta embriyo biyolojisiyle sınırlıdır. Bu kavramsal ayrım, "yapay zeka gebeliği artırır" beklentisinin neden çoğu zaman karşılanmadığını açıklar.
Dikkat edilmesi gereken metodolojik ve etik riskler
Veri kayması ve dış validasyon eksikliği: Çalışmaların neredeyse tamamı özel veri setlerine dayanıyor; merkezler ve alt-gruplar arasında AUC 0,60-0,75 arasında dalgalanıyor. Yüksek gelirli ülke verisiyle eğitilen modeller, farklı laboratuvar ve popülasyonlara genellenemeyebilir. Yayın yanlılığı: Etkileyici retrospektif sonuçların bolluğuna karşın prospektif randomize çalışmaların nötr/negatif çıkması, klasik bir pozitif-çalışma yanlılığı paternidir. Otomasyon yanlılığı ve beceri körelmesi: Embriyologların yapay zeka skoruna aşırı güvenip bağımsız değerlendirmeyi bırakması riski gerçektir. "Kara kutu" sorunu: Isı-haritası çalışmaları modelin morfoloji benzeri özelliklere odaklandığını gösterse de klinik değeri kanıtlanmamıştır; bu nedenle yorumlanabilir-YZ kullanan yeni randomize çalışmalar başlatılmıştır.
Bir başka örnek, çelişen kanıtın dürüstçe yan yana konmasını gerektirir: Bazı retrospektif çalışmalar yüksek yapay zeka skorlu embriyolarda cinsiyet oranı yanlılığı (erkek lehine kayma) sinyali bildirdi; ancak Illingworth'ün prospektif randomize çalışmasında bu doğrulanMADI (erkek/kız oranı farksız). Son olarak çıkar çatışması: öncü randomize çalışma üreticinin (Vitrolife) finansmanıyla yapıldı ve ticari onaylar da büyük ölçüde üretici verisine dayanıyor — bağımsız doğrulamanın değeri bu nedenle daha da artıyor.
Alan nereye gidiyor?
İyi haber, alanın artık prospektif kanıta yönelmiş olmasıdır. Çin'de yürütülen, yorumlanabilir yapay zekayı geleneksel morfolojiyle karşılaştıran randomize çalışma protokolü (n=1.100, birincil sonlanım devam eden gebelik) bu yönelimin bir örneğidir. Bu çalışmalar, "kara kutu skoru" yerine embriyologa gerekçeli, açıklanabilir bir karar desteği sunmayı ve gerçek klinik sonlanımları ölçmeyi hedefliyor. Önümüzdeki yıllarda esas soru "yapay zeka morfolojiden iyi mi?" değil, "hangi hasta alt-grubunda, hangi sonlanımda, gerçekten fayda sağlıyor mu?" olacak.
Sonuç
Embriyo seçiminde yapay zeka, bugünkü kanıt düzeyinde değerli bir verimlilik ve standardizasyon aracıdır — değerlendirmeyi yaklaşık 10 kat hızlandırır, gözlemciler-arası tutarlılığı artırır ve embriyoyu morfolojiye benzer doğrulukla sıralar. Ancak iki bağımsız randomize çalışmanın da gösterdiği gibi, canlı doğum veya gebelik oranını artırdığına dair kanıt yoktur; öncü çalışmada noninferiority bile sağlanamamış, dondur-tümünü sikluslarında olası bir zarar sinyali belirmiştir. Yapay zeka PGT-A'nın yerini almaz ve kümülatif canlı doğum üzerindeki etkisi test edilmemiştir. Dürüst çerçeve nettir: bu teknoloji embriyologun işini hızlandıran ve standartlaştıran güçlü bir yardımcıdır, onun yerini alan ya da gebelik şansını sihirli biçimde artıran bir araç değil. Klinik kullanımda, üretici-bağımsız prospektif kanıt, şeffaf alt-grup analizleri ve dengeli hasta bilgilendirmesi vazgeçilmezdir. İyi blastokist morfolojisi, hâlâ "yenilmesi gereken standart" olmayı sürdürüyor.
Kaynaklar
- Illingworth PJ ve ark. Deep learning versus manual morphology-based embryo selection in IVF: a randomized, double-blind noninferiority trial. Nature Medicine. 2024. site
- Sakkas D. The 'golden fleece of embryology' eludes us once again: a recent RCT using artificial intelligence reveals again that blastocyst morphology remains the standard to beat. Human Reproduction. 2025. site
- Xin X ve ark. Non-invasive prediction of human embryonic ploidy using artificial intelligence: a systematic review and meta-analysis. eClinicalMedicine. 2024. site
- Predicting pregnancy outcomes in IVF cycles: a systematic review and diagnostic meta-analysis of artificial intelligence in embryo assessment. Contraception and Reproductive Medicine. 2025. site
- Mrugacz G ve ark. Noninvasive Preimplantation Genetic Testing in Recurrent Pregnancy Loss and Implantation Failure: Breakthrough or Overpromise? Cells. 2025. site
- Wang S ve ark. Blastocyst selection through an interpretable artificial intelligence method versus traditional morphology grading: study protocol for a randomised controlled trial. BMJ Open. 2025. site
- Alife Health LOTUS interim analizi. Evaluation of the effect on ongoing pregnancy rate of using artificial intelligence for embryo prioritization: an interim analysis of a prospective RCT. Fertility and Sterility. 2024. site
- Alife Health. Receives FDA Clearance for AI-Powered Embryo Assessment (Embryo Predict). PR Newswire. 2026. site
- Fairtility. CHLOE Blast Achieves U.S. FDA 510(k) Clearance. Femtech Insider. 2025. site
- AI-based live birth prediction in IVF cycles: a systematic review without meta-analysis of model performance and validation. Middle East Fertility Society Journal. 2026. site
- Current progress and open challenges for applying artificial intelligence across the in vitro fertilization cycle. Patterns (Cell Press). 2025. site