Google'ın etkileşimli dünyalar yaratmak için geliştirdiği yapay zeka prototipi Project Genie.

  • Project Genie, metin veya görsellerden etkileşimli sanal dünyalar oluşturmak için Genie 3, Nano Banana Pro ve Gemini'yi bir araya getiriyor.
  • Erişim, Amerika Birleşik Devletleri'ndeki Google AI Ultra aboneleriyle sınırlıdır; oturumlar en fazla 60 saniye sürer ve çözünürlük yaklaşık 720p'dir.
  • Bu araç, dünyaları gerçek zamanlı olarak tasarlamanıza, keşfetmenize ve karıştırmanıza olanak tanıyor, ancak gerçekçilik sorunları, gecikme problemleri ve zayıf karakter kontrolü gibi dezavantajları bulunuyor.
  • Tanınmış oyunları taklit edebilme yeteneği, telif hakları konusunda tartışmaları alevlendiriyor ve video oyun sektörünün bir bölümünü endişelendiriyor.

Etkileşimli dünyalar oluşturmayı amaçlayan yapay zeka projesi

Google, atak stratejisinde yeni bir adım attı. Video oyunlarına uygulanan yapay zeka ve sanal dünyalar Kullanıcıların birkaç metin komutu veya bir görüntüye dayanarak etkileşimli ortamlar oluşturmasına ve bu ortamlarda gezinmesine olanak tanıyan bir prototip olan Project Genie'nin lansmanı ile şirket, aracı henüz test aşamasında olan bir deney olarak sunuyor. Ancak, ilk gösterimleri sektörde hem heyecan hem de şüphe uyandırdı.

Şimdilik erişim sınırlıdır. Amerika Birleşik Devletleri'ndeki Google AI Ultra planının aboneleriKısa oturumlar ve sistemin deneysel doğasıyla belirginleşen performansla birlikte, proje her kullanıcının erişebileceği bir geleceğe işaret ediyor. Saniyeler içinde küçük bir "oynanabilir dünya" oluşturun.Programlama veya grafik motorlarını kullanmayı bilmenize gerek kalmadan.

Project Genie nedir ve hangi teknolojileri bir araya getiriyor?

Yapay zekâ ile dünya oluşturucu

Project Genie bir Google DeepMind ve Google AI tarafından geliştirilen araştırma prototipi Bu, etkileşimli bir dünya oluşturucu olarak işlev görür. Teknik temeli üç sütuna dayanmaktadır: dinamik ortamları simüle etmede uzmanlaşmış Genie 3 modeli; görsel yönlerden ve eskizlerden sorumlu Nano Banana Pro; ve kullanıcı talimatlarını yorumlayan ve yaratım sırasında yardımcı olarak hareket eden çok modlu model Gemini.

Sistemin kalbi Genie 3, ekranda kare kare neler olacağını tahmin edebilen bir "dünya" modeli.Önceki teknolojilerin aksine, yalnızca statik 3D sahneler üreten bu yaklaşım, DeepMind'ın dahili deneylerine göre yaklaşık 720p çözünürlük ve birkaç dakika görsel tutarlılıkla, ortamın oyuncunun hareketlerine gerçek zamanlı olarak tepki vermesine olanak tanıyor.

Bu temelde bütünleştirilmiştir. Sahnenin ilk görüntüsünü oluşturmaktan sorumlu olan Nano Banana Pro Tanımlayıcı bir metin veya referans bir görselle başlayan bu ilk görünüm, grafik stilini, dünyanın kompozisyonunu ve keşif sırasında kontrol edilecek karakterin görünümünü belirlemek için bir taslak görevi görür.

Son olarak, Gemini, orkestrasyon katmanı ve yardımcı görevi görüyor.Doğal dildeki talimatları yorumlar, dünyayı anında ayarlamaya yardımcı olur ve bakış açısını değiştirme (birinci veya üçüncü şahıs), önceden oluşturulmuş bir ortamı yeniden düzenleme veya birkaç fikri tek bir oynanabilir senaryoda birleştirme gibi görevleri kolaylaştırır.

Sanal dünyalar nasıl yaratılır ve keşfedilir?

Yapay zekâ tarafından oluşturulan etkileşimli dünyalar

Project Genie'nin faaliyetleri şu şekilde yapılandırılmıştır: üç aşamalı ilerleyici süreç Google bunu, dünyaları taslak haline getirme, keşfetme ve harmanlama olarak özetliyor. Amaç, herkesin ek araçlara ihtiyaç duymadan bir fikirden küçük bir etkileşimli deneyime geçebilmesini sağlamaktır.

İlk aşamada, kullanıcı oluşturmak istediği dünyanın bir açıklamasını yazar veya bir referans görseli yükler. Bu girdiden yola çıkarak, Nano Banana Pro statik bir önizleme oluşturur. Oyun ortamı, düşük poligonlu bir orman, fütüristik bir kentsel ortam, tarihi bir manzara veya metinde tanımlanan herhangi bir şey olabilir. Karakter tipi, kamera modu ve bazı temel hareket parametreleri de bu aşamada tanımlanır.

Çizim kabul edildikten sonra, oyuncuya olanak sağlamak için Genie 3 devreye girer. W, A, S ve D tuşları gibi tipik PC kontrollerini kullanarak ortamı özgürce keşfedin.Model, karakterin önünde ne görüneceğini anlık olarak oluşturur, her kareyi önceki karelere dayanarak tahmin eder ve kamera döndürüldüğünde veya daha önce ziyaret edilen bir alana geri döndüğünde belirli bir tutarlılığı korur.

Üçüncü temel yetenek ise şudur: dünyaların birleşimi ve yeniden harmanlanmasıSistem, kullanıcıların daha önce oluşturulmuş senaryoları tekrar incelemelerine, yeni parametrelerle değiştirmelerine, birleştirmelerine veya hatta Google'dan önceden oluşturulmuş dünyaları temel alarak varyasyonlar oluşturmalarına olanak tanır. Ayrıca, oturumların videoları diğer kullanıcıların izlemesi veya ilham kaynağı olarak kullanması için paylaşılabilir.

Tüm bunlar, diğer Google yapay zeka hizmetlerine benzer bir web uygulaması üzerinden yürütülüyor, böylece Ek program yüklemenize gerek yok, ayrıca ileri düzey teknik bilgiye de ihtiyaç duyulmaz.Aracı açın, talimatı girin ve ilginç bir sonuç bulana kadar kombinasyonları test etmeye başlayın.

Teknik sınırlamalar: zaman, performans ve gerçekçilik

Sanal dünyalar için bir yapay zeka prototipinin sınırlamaları

Google, Project Genie'yi şu şekilde tanımlamakta ısrar ediyor: Deneysel niteliği belirgin bir araştırma prototipiBu etiket sadece bir formalite değil: mevcut deneyim, aracın ilk merakın ötesinde pratik kullanımını etkileyen çeşitli açık sınırlamalar ortaya koymaktadır.

En belirgin olanı şudur: Üretim ve keşif oturumu başına 60 saniyelik süre sınırı.O bir dakikadan sonra dünya durur ve yeni bir deneyim başlamalıdır. Şirket, bu kısıtlamanın, her oturumun oynayan kullanıcı için özel bir çip ayırması sayesinde bilgi işlem kaynaklarının daha iyi dağıtılmasını sağladığını açıklıyor.

Performans açısından, kamuya açık testler şu şekilde tanımlar: 720p'ye yakın çözünürlük ve saniyede 20 ila 24 kare arasında bir frekans.Bu özelliklere, karakteri hareket ettirirken veya kamerayı değiştirirken fark edilebilir bir giriş gecikmesi eşlik ediyor. Bazı ilk test kullanıcılarına göre, deneyim tamamen akıcı, geleneksel bir video oyunundan ziyade etkileşimli bir videoya daha çok benziyor.

Genie 3'ün de dikkate alınması gerektiğini belirtmekte fayda var. Bu klasik bir grafik motoru değil, bir sonraki kareyi tahmin eden bir model. Yukarıdakilere dayanarak, bu durum garip davranışlara yol açar: görünürde hiçbir sebep olmadan dokusu değişen yollar, kaybolan öğeler, mantıksız fizik kuralları veya rastgele deforme olan animasyonlar.

Google'ın kendisi de oluşturulan dünyalar konusunda uyarıda bulunuyor. "Bunlar tamamen gerçek görünmeyebilir veya her zaman fizik yasalarına veya göstergelerine uygun olmayabilir."Karakter kontrolleri de hassas olmayabiliyor. Başka bir deyişle, teknoloji umut vaat ediyor ancak oynanış ve görsel istikrar açısından kusursuz bir oyun deneyimi sunmaktan hala çok uzak.

Sınırlı erişim ve uluslararası yol haritası

Yapay zeka prototipine sınırlı erişim

Bu ilk aşamada, Project Genie yalnızca şu kişiler için kullanılabilir: Amerika Birleşik Devletleri'ndeki Google AI Ultra müşterileriŞirketin en gelişmiş abonelik planı, yüksek performanslı yapay zeka yeteneklerine ihtiyaç duyan işletmelere ve içerik üreticilerine yöneliktir. Bu, deneye erişimi olan kullanıcı sayısını sınırlayan bir premium hizmettir.

Testlerin sınırlandırılması kararı şu iki nedenden dolayı açıklanmaktadır: her oturumun hesaplama maliyeti Bu durum, Google'ın daha geniş çaplı bir kullanıma sunmadan önce ayrıntılı geri bildirim toplama isteğinden kaynaklanıyor. DeepMind Araştırma Direktörü Shlomi Frutcher, bu araçları daha fazla insanın kullanımına açarak gerçek dünya kullanım görüşlerini toplamanın "heyecan verici" olduğunu vurguladı, ancak şu an için Avrupa veya diğer pazarlara ne zaman geleceğine dair belirli bir tarih yok.

İspanyol ve Avrupalı ​​kullanıcılar ve araştırmacılar açısından bakıldığında, bu durum en azından kısa vadede şu anlama gelir: En gerçekçi rol gözlemci rolü olacaktır.Testleri yakından takip edin, sosyal medyada dolaşan videoları analiz edin ve bu teknolojinin seviye tasarımı, hızlı prototipleme veya fikir görselleştirme iş akışlarına ne ölçüde entegre edilebileceğini değerlendirin.

Google niyetini belirtti. erişimi kademeli olarak genişletin Performans, maliyetler ve yasal sorunlar izin verdiği takdirde. Ancak bu genişlemenin hızı, topluluğun tepkisine ve telif hakkı ile üçüncü taraf içeriğinin sorumlu kullanımıyla ilgili tartışmaların nasıl gelişeceğine de bağlı olacaktır.

Tanınmış oyunları taklit etme yeteneği ve telif hakkı tartışması

Genie Projesi'nin en hassas noktalarından biri de şuydu: Var olan video oyunlarından açıkça esinlenilmiş dünyaları, değişen derecelerde başarıyla yeniden yaratma yeteneği.Bazı uzman gazeteciler, Super Mario 64, Metroid Prime veya The Legend of Zelda: Breath of the Wild gibi oyunlara oldukça benzeyen senaryolar oluşturmayı başardılar.

Zelda örneğinde, bu durum daha önce de görülmüştür. Paraşütle atlama sırasında paraşüt açan karakterlerBu hareket, Nintendo oyunuyla yakından ilişkilidir. Bu benzerlikler, modelin çok sayıda kamuya açık oyun videosu kullanılarak eğitildiğini düşündürmekte ve yapay zeka eğitiminde fikri mülkiyetin nasıl ele alındığı konusunda soruları gündeme getirmektedir.

Google, tanınmış serilerden esinlenerek oluşturulan dünyaların yeniden yaratıldığı çeşitli testlerin ardından, çalışmalara başladı. belirli senaryoların ve karakterlerin oluşturulmasını engellemekÖzellikle belirli isimler veya ticari markalar söz konusu olduğunda. Bazı durumlarda, araç "üçüncü taraf içerik sağlayıcılarının çıkarlarını" gerekçe göstererek belirli destanlara dayalı dünyaların oluşturulmasını doğrudan engelliyor.

Şirket, Project Genie'nin ne olduğunu açıklıyor. “esas olarak herkese açık web verileriyle eğitilmiştir”Ancak unutmayın ki bu içerik telif hakları yasalarına tabidir. Sonuç olarak, telif hakkıyla korunan eserleri çoğaltma girişimlerinin bazılarının açıkça engellendiği, diğerlerinin ise aşırı doğrudan referanslardan kaçınıldığı sürece göz ardı edildiği, yapım aşamasında olan bir denetleme sistemi ortaya çıkmıştır.

Bu sıra dışı davranış, tartışmayı alevlendiriyor. Yapay zekâ, mevcut oyunlardan ne ölçüde ilham alabilir veya almalıdır? Peki, saygı duruşu, taklit ve kopyalama arasında nerede sınır çizeceğiz? Bu tartışmanın, yapay zekâda eğitim verileri ve telif haklarına ilişkin düzenleyici çerçevelerin henüz tanımlanmakta olduğu Avrupa Birliği gibi bölgelerde özellikle önem taşıması bekleniyor.

Video oyun endüstrisi üzerindeki potansiyel etki

Medyanın izleme cazibesinin ötesinde Saniyeler içinde "Mario gibi" veya "Zelda gibi" dünyalar oluşturuluyor.Project Genie, büyük teknoloji şirketleri arasında oyun geliştirmeye yönelik üretken yapay zekayı uygulama yarışının bir parçasıdır. Örneğin Microsoft, tasarım ve üretim sürecinin bazı kısımlarını otomatikleştirmek için Muse gibi projeler ortaya koydu ve diğer şirketler de maliyetleri düşürmek ve geliştirmeyi hızlandırmak için benzer çözümler araştırıyor.

Bu bağlamda, Google'ın önerisi şu amacı taşıyor: hızlı prototipleme ve deney aracı Bu, hem bağımsız stüdyolar hem de büyük yayıncılar için ilgi çekici olabilir. Bir taslaktan veya bir paragraf metinden oynanabilir bir senaryo oluşturma yeteneği, fikirlerin erken aşamada doğrulanmasını, dahili demoların oluşturulmasını veya mekaniklerin test edilmesini aylar süren çalışmaya gerek kalmadan kolaylaştırabilir.

Ancak bu tür çözümlerin artışı sektördeki bazı kesimlerde endişeye yol açıyor. Bir yandan, Bazı meslek grupları üzerindeki potansiyel etki konusunda endişeler var. Eğer içeriğin bir kısmı otomatik olarak oluşturuluyorsa, durum farklı. Öte yandan, birçok geliştirici, yazarlarına net bir tazminat ödenmeden yapay zekanın zaten yayınlanmış eserler üzerinde eğitildiği iş modellerine karşı temkinli yaklaşıyor.

Özellikle kültürel eserlerin korunması konusundaki tartışmaların yoğun olduğu Avrupa ve İspanya pazarlarında, Project Genie gibi araçların gelecekteki düzenlemelere nasıl entegre edileceği büyük önem taşıyacak. Eğitim verilerine ilişkin şeffaflık, hak sahipleri için vazgeçme sistemleri ve üretilen içeriğin atfedilmesi gibi hususlar, ihtiyatlı bir benimseme ile geliştiriciler ve yayıncılarla süregelen bir çatışma arasında fark yaratabilir.

Şimdilik, Genie Projesi henüz başlangıç ​​aşamasındadır. Bu, bitmiş bir üründen ziyade halka açık bir laboratuvar gibi işlev görüyor.Gelişimi ve Google'ın ilgili yasal ve etik sorunları nasıl ele alacağı, bunun sonunda stüdyo iş akışlarına entegre olup olmayacağını veya gösterişli ancak sınırlı bir deney olarak kalıp kalmayacağını belirleyecektir.

Ancak bu prototipin ortaya çıkışı, büyük teknoloji şirketlerinin bunda ne gibi bir potansiyel gördüğünü açıkça ortaya koyuyor. Etkileşimli dünyaların otomatik olarak oluşturulması Birinci dereceden stratejik bir alan. Günümüzde fiili kullanımı kısıtlı ve teknik kusurlarla dolu olsa da, gidiş yönü açık: metin ve görüntüleri oynanabilir deneyimlere dönüştürme yeteneği giderek artan modeller ve bu yeni araçlarla nasıl bir arada var olmak istediğine karar vermek zorunda kalacak bir endüstri.

İlgili makale:
Sanal gerçekliğin tanımı Bilmeniz gerekenler!