
Google Gemini Omni Flash Duyuruldu: Gemini Omni Flash ile video oluşturma dönemi başlıyor
Google, dün gerçekleşen Google I/O 2026 konferansında Gemini Omni Flash isimli yeni yapay zekâ modelini tüm dünyaya tanıttı. Şirket bu modeli, metin, görsel ve ses gibi farklı formatlardaki girdileri bir araya getirerek tutarlı videolar üretebilen çok modlu bir dünya modeli olarak konumlandırıyor. Mevcut yapay zekâ video araçlarının aksine model, sıfırdan içerik üretmenin yanı sıra kullanıcılara konuşarak video düzenleme imkânı da sunuyor.
Çok Modlu Girdi ile Sıfırdan Video Üretimi
Google DeepMind tarafından geliştirilen yeni model, en büyük farkını girdi esnekliğinde ortaya koyuyor. Gemini Omni Flash, yalnızca yazılı komutlarla değil, bir fotoğraf, mevcut bir video klip ya da ses kaydıyla da çalışabiliyor. Kullanıcılar dilerse bu girdilerin hepsini aynı anda kullanarak modelden birleşik bir çıktı alabiliyor. Google CEO’su Sundar Pichai, bu yaklaşımı “her şeyden her şeyi yaratmak” olarak özetliyor ve Omni ailesinin gelecekte ses ya da görsel gibi farklı çıktı formatlarını da destekleyeceğini belirtiyor.
Model şimdilik 10 saniyelik videolar üretebiliyor. Google DeepMind ürün yönetimi direktörü Nicole Brichtova, bu sürenin teknik bir kısıtlamadan değil, modeli daha fazla kullanıcıya hızlı ulaştırma kararından kaynaklandığını söylüyor. Şirket ilerleyen dönemde video uzunluğunu artırmak için çalışmalarını sürdürüyor.
Sohbet Eder Gibi Video Düzenleme Dönemi
Gemini Omni Flash asıl iddiasını video düzenleme tarafında gösteriyor. Bugüne kadar yapay zekâ ile video üretmek çoğunlukla tek seferlik bir işlemdi; sonuç beğenilmeyince baştan başlamak gerekiyordu. Yeni model ise kullanıcıya doğal dille adım adım düzenleme yapma şansı tanıyor. Bir sahnenin arka planını değiştirmek, karakterleri farklı objelerle değiştirmek ya da durağan bir kareyi harekete dönüştürmek için karmaşık yazılımlara ihtiyaç kalmıyor.
Modelin en dikkat çeken yönlerinden biri de çok turlu düzenleme becerisi. Kullanıcı bir değişiklik istediğinde model önceki talimatları hatırlıyor, karakter tutarlılığını ve sahne bütünlüğünü koruyarak yeni komutları uyguluyor. Bu sayede amatör kullanıcılar bile profesyonel düzeyde kurgu yapabiliyor. Google, bu özelliği geçen yıl tanıttığı Nano Banana görsel düzenleme modelinin videoya uyarlanmış hâli olarak nitelendiriyor.
Gerçek Dünya Bilgisi ve Fizik Anlayışı
Google’ın yeni modeli rakiplerinden ayıran bir diğer unsur ise dünya bilgisi. Gemini Omni Flash, eğitildiği veri sayesinde yer çekimi, kinetik enerji ve akışkanlar dinamiği gibi fizik kurallarını sezgisel olarak kavrıyor. Aynı zamanda tarih, bilim ve kültürel bağlam gibi alanlardaki bilgi birikimini de görsel üretime yansıtabiliyor. Örneğin model, protein katlanmasını anlatan kısa bir animasyonu, hem görsel hem de seslendirme açısından tutarlı bir şekilde baştan sona oluşturabiliyor.
Bu yetenek, modelin sadece görüntü üreten bir araç olmaktan çıkıp anlamlı hikâyeler kurgulayabilen bir sisteme dönüşmesini sağlıyor. Google DeepMind CTO’su Koray Kavukcuoğlu, modelin dünya bilgisi açısından mevcut Veo modelinden çok daha ileride olduğunu vurguluyor.
Hangi Platformlarda Kullanılabilecek?
Gemini Omni Flash, salı günü itibarıyla kullanıma açıldı. Modele şu an için Gemini uygulaması, Google Flow ve YouTube Shorts üzerinden erişilebiliyor. Google ayrıca modeli Gemini API, Google AI Studio ve Vertex AI kanallarıyla geliştiricilerin kullanımına da sundu. İlerleyen günlerde YouTube Create uygulamasına da entegre edilecek.
Erişim tarafında ise bazı sınırlamalar mevcut. Model şu anda yalnızca Google AI Plus, Pro ve Ultra aboneleri tarafından kullanılabiliyor. YouTube Shorts ve YouTube Create üzerinden sunulacak sürümün ücretsiz olacağı açıklandı. Bir diğer önemli ayrıntı da dil desteğiyle ilgili: Gemini Omni Flash şimdilik yalnızca İngilizce komutları tanıyor. Türkçe desteğinin ne zaman geleceğine dair resmî bir tarih paylaşılmadı.
Dijital Avatar ve Güvenlik Önlemleri
Modelin sunduğu yeniliklerden biri de kullanıcıların kendi dijital avatarlarını oluşturabilmesi. Bu özellik sayesinde bir kişi, fiziksel görüntüsünü ve sesini modele tanıtarak üretilen videolarda kendine yer verebiliyor. Google, olası kötüye kullanımları önlemek için avatar oluşturma sürecine özel bir güvenlik katmanı eklemiş durumda. Kullanıcıların kimlik doğrulaması için belirli hareketleri yapması ve bir dizi rakamı seslendirmesi gerekiyor.
Ayrıca Gemini Omni Flash ile üretilen tüm videolar SynthID dijital filigranı ile işaretleniyor. Bu sayede bir videonun yapay zekâ tarafından oluşturulduğu sonradan doğrulanabiliyor. Model, Google’ın sorumlu yapay zekâ ilkeleri doğrultusunda iç güvenlik ekipleri tarafından test edildi ve kırmızı takım değerlendirmelerinden geçti.
Veo Yerini Omni’ye Bırakıyor
Google’ın bu hamlesi, şirketin video üretimi stratejisinde önemli bir dönüşüme işaret ediyor. Daha önce Veo modeliyle metinden videoya üretim yapılabiliyordu. Gemini Omni Flash ise Veo’nun yerini alacak ve çok daha geniş bir kullanım senaryosu sunacak. Google DeepMind CEO’su Demis Hassabis, Omni’yi “yapay genel zekâya giden yolda kritik bir adım” olarak tanımlıyor. Şirketin uzun vadeli hedefi ise modelin görüntü ve ses çıktılarını da destekleyerek tam anlamıyla her yöne çalışan bir üretim aracına dönüşmesi. Teknoloji Haberleri - hedefbilgitoplumu.com
