Yapay zeka mı, gerçek mi?

06.11.2025 - Perşembe 17:38

Üsküdar Üniversitesi Mühendislik ve Doğa Bilimleri Fakültesi, Yazılım Mühendisliği (İngilizce) Bölümü Dr. Öğr. Üyesi Kristin Surpuhi Benli, yapay zekâ destekli ses ve görüntü üretim teknolojileri konusunu değerlendirdi.

"Deepfake" teknolojisi nedir?

Yapay zekâ destekli ses ve görüntü üretiminin, genel olarak "deepfake" teknolojisi olarak adlandırıldığını ifade eden Dr. Öğr. Üyesi Kristin Surpuhi Benli, “Kelime oluşumu itibariyle Deepfake, ‘deep learning’ (derin öğrenme) ve ‘fake’ (sahte) kelimelerinin birleşmesinden meydana gelmektedir. Bu teknoloji, yüz tanıma, ses analizi ve görüntü işleme gibi alanlarda geliştirilen derin öğrenme algoritmalarını kullanarak, gerçeğe son derece yakın sahte video, ses veya görüntüler üretir.” dedi.

Kötü niyetli kişiler tarafından kullanılabiliyor

Deepfake teknlojisini kullanılarak bir kişinin yüzü, mimikleri veya sesinin taklit edilebildiğini kaydeden Dr. Öğr. Üyesi Kristin Surpuhi Benli, “Bu sayede gerçekte yaşanmamış bir konuşma veya olay sanki gerçekleşmiş gibi sunulabilir. Bu teknoloji, yaratıcı içerikler üretmek için kullanılabileceği gibi, kötü niyetli kişiler tarafından dezenformasyon yaymak veya dolandırıcılık yapmak amacıyla da kullanılabilir.” diye konuştu.  

Sahte haber üretimi yapılabiliyor

Yapay zekâ ile üretilen video ve ses içeriklerinin günümüzde sinema, eğitim, reklam, oyun ve medya gibi pek çok alanda yaygın olarak kullanıldığını dile getiren Dr. Öğr. Üyesi Kristin Surpuhi Benli, “Reklamlar, uzaktan eğitim videoları, dijital oyunlardaki karakterler, sanal haber sunucuları ve farklı dillere çevrilen içerikler bu teknoloji sayesinde hızlı ve düşük maliyetle hazırlanmaktadır. Öte yandan, aynı teknolojiler sahte haber üretimi, dolandırıcılık ve bilgi kirliliği yaratmak gibi amaçlarla da kötüye kullanılabilmektedir.” ifadesinde bulundu.

Deepfake videoların bu denli ikna edici olmasının temelinde ne var?

Deepfake videoların bu denli ikna edici olmasının temelinde, yapay zeka teknolojilerinin, özellikle de derin öğrenme modellerinin, görüntü ve ses üretiminde sunduğu artan gerçekçilik ve ayrıntı düzeyinin yattığını anlatan Dr. Öğr. Üyesi Kristin Surpuhi Benli, “Yüz ifadeleri, göz kırpma, ışıklandırma ve ten dokusu gibi detaylar artık çok daha doğal biçimde taklit edilebiliyor. Ses klonlama teknolojileri ise konuşma ritmi ve tonlamayı başarıyla kopyalayabiliyor. Görüntü ve ses kalitesindeki bu ilerleme, sahte içerikleri her geçen gün daha inandırıcı kılıyor ve bu da onların insan gözüyle ya da kulağıyla fark edilmesini giderek zorlaştırıyor.” şeklinde konuştu.

Dijital çağda “gerçeklik” kavramı köklü bir dönüşüm geçiriyor

Yapay zeka, deepfake ve benzeri teknolojilerle birlikte dijital çağda “gerçeklik” kavramının köklü bir dönüşüm geçirdiğini söyleyen Dr. Öğr. Üyesi Kristin Surpuhi Benli, “Artık gördüğümüz, duyduğumuz, hatta okuduğumuz içeriklerin gerçekten olup olmadığını sorgulamamız gerekiyor. Bu durum, bilgiye erişimde daha fazla şüpheciliği beraberinde getirirken, doğruluğu ve güvenilirliği teyit edebilecek yeni yöntemlere ve etik standartlara olan ihtiyacı da artırıyor.” dedi.

Deepfake videolarda ayırt edici unsurlar neler?

Bir görüntünün veya sesin yapay zekâ ürünü olup olmadığını tespit etmeye yönelik teknik ve yöntemlerin giderek geliştiğini kaydeden Dr. Öğr. Üyesi Kristin Surpuhi Benli, şöyle devam etti:

“Bu tespit süreçleri; görüntü işleme, ses analizi ve makine öğrenimi tekniklerine dayanmaktadır. Görsellerde yüz ifadeleri ve mimikler analiz edilerek sahte içerik belirlenmeye çalışılır. Deepfake videolarda dikkat edilebilecek bazı ayırt edici unsurlar şunlardır; göz kırpmanın doğal olmaması, ağız hareketleri ile ses arasında senkronizasyon problemleri, ten rengi geçişlerindeki yapaylık, ışık yansımalarının doğallıktan uzak olması, saç ve kenar detaylarında görülen bozulmalar. Ses analizinde ise frekans spektrumu, vurgu, tonlama ve nefes alma gibi ayrıntılar incelenir. Bunun yanı sıra, özel olarak eğitilmiş derin öğrenme modelleri de sahte içeriklerin tespitinde etkin bir şekilde kullanılmaktadır.”

İleri düzey deepfake teknolojileri; mimiklerden göz hare