Diffusion Models nedir?
Türkçesi: Difüzyon Modelleri
İngilizcesi: Diffusion Models
Türkçe Okunuşu: difüjın modeller
İngilizce Okunuşu: dɪˈfjuːʒən ˈmɒdəlz
Dilbilgisi: İsim, (yapay zekâ terimi)
Köken: “Diffusion” kelimesi Latince diffundere (yaymak, dağıtmak) fiilinden gelir. “Model” ise Fransızca modèle ve Latince modulus (ölçü, biçim) sözcüklerinden türemiştir.
Alakalı Sözcükler: Generative Adversarial Network (GAN), Variational Autoencoder (VAE), Latent Diffusion Model (LDM), Denoising, Generative AI
Diffusion Models (DM), makine öğrenmesi ve özellikle üretici yapay zekâ (generative AI) alanında kullanılan olasılıksal modellerdir. Temel prensipleri, veriye rastgele gürültü (noise) ekleyerek bu veriyi kademeli biçimde “bozmak” ve ardından bu gürültüyü tersine çevirerek orijinal veriyi yeniden inşa etmeye dayanır. Bu süreç, sistemin verinin yapısını ve dağılımını öğrenmesine olanak tanır.
Bu modeller, Stable Diffusion, DALL·E 2 veya Imagen gibi metinden görsel üreten yapay zekâ sistemlerinin temelini oluşturur. Model, eğitim sürecinde milyonlarca görsel ve metin eşleşmesini kullanarak “gürültüden anlamlı içerik üretme” yeteneğini öğrenir. Gürültüden temiz bir görüntü üretme sürecine “denoising” (gürültü giderme) adı verilir.
Kullanım Alanları:
- Görsel üretimi (ör. sanat, moda, tasarım)
- Ses sentezi ve müzik oluşturma
- Video üretimi
- Tıbbi görüntüleme ve modelleme
- Veri artırma (data augmentation) ve simülasyon
GAN ve VAE gibi önceki nesil üretici modellere göre Diffusion Models daha kararlı, yüksek çözünürlüklü ve çeşitliliği yüksek çıktılar üretir. Ayrıca, metin yönlendirmeli görsel üretim (text-to-image) alanında günümüzde en popüler yaklaşım haline gelmiştir.
« Fihriste Dön