Google, açık ve yerel yapay zekâya yönelik büyük yatırımı Gemma 4'ü piyasaya sürdü.

  • Gemma 4, Gemini 3 teknolojisine dayalı, E2B'den 31B parametreye kadar değişen boyutlarda dört açık yapay zeka modelinden oluşan bir ailedir.
  • Bu modeller, 256'e kadar token içeren bağlam pencereleri sayesinde, yüksek "parametre zekasını" mobil, uç ve özel altyapılarda yerel yürütme ile birleştiriyor.
  • Apache 2.0 lisansı, kısıtlama olmaksızın ticari kullanıma izin verir, dijital egemenliği güçlendirir ve Avrupa'daki düzenlemeye tabi ortamlarda dağıtımı kolaylaştırır.
  • Gemma 4 çok modlu (metin, görüntü, video ve ses küçük modellerde) olup 140'tan fazla dili desteklemektedir ve Google AI Studio, Hugging Face, Kaggle ve Ollama'da mevcuttur.

Gemma 4 Yapay Zeka Modeli

Google stratejisinde önemli bir adım attı. açık yapay zeka Gemma 4'ün piyasaya sürülmesiyle birlikte, yeni bir model ailesi, yüksek düzeyde mantıksal düşünme yeteneğini çok daha mütevazı donanım gereksinimleriyle birleştirmeyi hedefliyor. Şirket, bu nesli, mobil cihazlardan veri merkezlerine kadar kendi altyapılarında gelişmiş yapay zeka çalıştırması gerekenler için ciddi bir alternatif olarak sunuyor.

Tek bir model olmaktan çok uzak, Gemma 4, dört açık modelden oluşan eksiksiz bir seridir.Verileri ve dağıtımları üzerinde daha fazla kontrol sahibi olmak isteyen geliştiriciler, işletmeler ve kamu kuruluşları için tasarlanan bu teklif, özellikle aşağıdaki gereksinimlere çok iyi uyum sağlamaktadır: Avrupa'da dijital egemenlik ve mevzuat uyumluluğuİşlemlerin nerede gerçekleştirileceğine ve verilerin nerede saklanacağına karar verme yetkisinin giderek daha önemli hale geldiği bir ortamda.

"Parametre tabanlı zekâ"ya odaklanan dört modelden oluşan bir aile.

Gemma 4 model ailesi

Gemma 4, aynı teknolojik temeller üzerine inşa edilmiştir. İkizler 3Ancak net bir hedefle: Google'ın "en üst düzeye çıkarmak" olarak adlandırdığı şeyi. "parametre tabanlı zeka"Şirket, yalnızca boyut üzerinden rekabet etmek yerine, nispeten kompakt modellerde çok daha büyük sistemlerle karşılaştırılabilir performans seviyelerine ulaşmış olmakla övünüyor.

Aile şu kişilerden oluşmaktadır: dört farklı boyuttaEtkin 2B (E2B), Etkin 4B (E4B), bir model 26B, Uzmanlar Karması (MoE) mimarisiyle. ve yoğun bir varyantı 31B parametreleriİkincisi zaten orada bulunuyor. Arena AI'nin açık modeller sıralamasında ilk 3'te yer alıyor.Bu sayede parametre sayısını yirmi katına çıkaran alternatifleri geride bırakıyor; bu da özellikle kaliteyi feda etmeden GPU maliyetlerini düşürmek isteyenler için önemli bir avantaj.

model 26B Eğitim Bakanlığı Çıkarım aşamasında parametrelerinin yalnızca küçük bir kısmını (yaklaşık 3,8 milyar) etkinleştirecek şekilde optimize edilmiştir; bu da belirteç oluşturma hızını ve enerji verimliliğini artırır. Buna karşılık, sürüm 31B yoğun Hassas ayarlama gerektiren görevler, karmaşık orkestrasyon ve iş veya kurumsal ortamlarda yoğun kullanım için tercih edilen seçenek olarak konumlandırılmıştır.

Google, kamuya açık kıyaslama testleri açısından bu varyantların, DeepSeek veya Qwen gibi Çinli üreticilerin daha ağır modelleri de dahil olmak üzere diğer sağlayıcıların daha ağır modelleriyle doğrudan rekabet ettiğini vurguluyor; bu üreticiler son yıllarda açık kaynak ekosisteminde güçlenmişti. Gemma 4'ün 31B modeli, Arena AI'da en iyi üçüncü açık model olarak listeleniyor.26B MoE de aynı şekilde yüksek sıralarda yer alıyor.

İşletme açısından bakıldığında, boyut ve performans arasındaki bu ilişki şunu ima eder: daha az donanım harcaması, daha düşük gecikme süresi ve sınır modellerini tek bir yerde çalıştırma yeteneği NVIDIA H100 80GB GPUBu durum, orta ölçekli Avrupalı ​​şirketlerin orantısız altyapı yatırımı yapmadan gelişmiş yapay zekâ ile çalışmasının önünü açıyor.

Cep boyutunda yapay zeka: mobil, IoT ve uç bilişim

Gemma 4 mobil cihazlarda

Daha küçük modeller, E2B ve E4BBunlar özellikle ağın uç noktalarında, yani şu noktalarda çalışmak üzere tasarlanmıştır: mobil cihazlar, IoT ve yerel donanımGoogle, bu varyantların şu platformlarda çalışmak üzere optimize edildiğini belirtiyor: Android akıllı telefonlar, Ahududu PiJetson Nano ve diğer düşük güç tüketimli sistemler, çok düşük gecikme süresiyle ve hatta internet bağlantısı olmadan bile çalışabilir.

Bu segmentte öncelik sadece ham güç değil, aynı zamanda sunabilme yeteneğidir. çok modlu işlevler ve hızlı yanıt Kaynak kısıtlı ortamlarda. Gemma 4 uç modelleri bu tür durumları ele alabilir. metin, resim ve videove E2B ve E4B durumlarında yerel destek eklerler. sesBu sayede, verilerin buluta gönderilmesine gerek kalmadan yerel sesli asistanlar, saha görüntü tanıma veya gerçek zamanlı video analizi gibi kullanım senaryoları mümkün hale gelir.

Bu hafif modeller için bağlam penceresi şu noktaya ulaşır: token arzı ileBu, uzun belgeleri, kapsamlı konuşmaları veya ilgili kod parçacıklarını tek bir komut isteminde işlemek için yeterlidir. Google'a göre, geniş bağlam ve yerel yürütmenin bu kombinasyonu sürtünmeyi ortadan kaldırmaya yardımcı olur. gizlilik, bağlantı ve gecikmeBu durum, veri işleme üzerindeki kısıtlamaların giderek daha katı hale geldiği Avrupa'daki endüstriyel, sağlık veya eğitim projeleri için son derece önemlidir.

Donanım üreticileri açısından bakıldığında, Gemma 4 entegrasyonun önünü açıyor. Gelişmiş yapay zeka doğrudan tüketici ürünlerine entegre ediliyor.Şirket, akıllı telefonlardan ve tabletlerden tıbbi cihazlara ve endüstriyel sensörlere kadar bu modellerin, Qualcomm ve MediaTek gibi yaygın Android ekosistemi sağlayıcılarının çipleriyle çalışacak şekilde tasarlandığını ve böylece geniş çaplı benimsenmelerini kolaylaştırdığını vurguladı.

Ayrıca, uç modellerin mimarisi aşağıdaki gibi tekniklerden yararlanır: Katman Başına Gömme (PLE) Parametre kullanımının verimliliğini en üst düzeye çıkarmak, böylece genel amaçlı modellerde alışılageldiği kadar yüksek hesaplama maliyetiyle akıl yürütme ve bağlam anlama olanağı sağlamak.

Çoklu modluluk, aracılar ve gelişmiş geliştirici desteği

Gemma'nın 4 çok modlu yeteneği

Gemma 4'ün güçlü yönlerinden biri, net bir şekilde benimsediği yaklaşımdır. aracı iş akışlarıModeller yalnızca metin üretmekle sınırlı değil: doğal olarak entegre özelliklere sahipler. fonksiyon çağrısı, yapılandırılmış JSON çıktısı ve sistem talimatlarıBu, çeşitli adımları koordine eden, harici API'leri çağıran ve kurumsal uygulamalarla kolayca entegre edilebilen formatlarda sonuçlar döndüren özerk ajanların oluşturulmasına olanak tanır.

Google, Gemma 4 ailesindeki tüm modellerin şu şekilde tasarlandığı konusunda ısrar ediyor: üst düzey akıl yürütücülerGöreve göre akıl yürütme derinliğini ayarlamak için yapılandırılabilir düşünme modlarıyla birlikte gelir. Bu da daha iyi sonuçlar elde edilmesini sağlar. çok aşamalı akıl yürütme, çevrimdışı kod üretimi ve karmaşık problem çözme becerisi; güvenilirliğin gerekli olduğu kurumsal ve kamu yönetimi ortamlarında kilit öneme sahiptir.

Çok modlu düzlemde, dört model de işlem yapabilir. Farklı çözünürlük ve en boy oranlarına sahip metin ve görsellerE2B ve E4B varyantları ise bu kapasiteyi genişletiyor. video ve sesBu kombinasyon, örneğin, grafikler içeren belgeleri, endüstriyel izleme videolarını veya zengin eğitim içeriklerini analiz eden ve gerçek zamanlı olarak bağlamsal yanıtlar üreten sistemleri mümkün kılar.

Bağlam penceresi şu noktaya ulaşır: En büyük modellerde 256.000 token bulunmaktadır.Bu özellik, kullanıcıların tüm kod depolarını, uzun yasal sözleşmeleri veya büyük miktarda teknik dokümanı tek bir sorguyla yüklemelerine olanak tanır. Destek, danışmanlık veya BT denetim ekipleri için bu, daha önce saatlerce süren manuel inceleme gerektiren görevleri otomatikleştirmeyi kolaylaştırır.

Dil açısından bakıldığında, Gemma 4 yerel olarak 100'den fazla dili desteklemektedir. 140 dilAvrupa için ve özellikle İspanya için bu, ana AB dillerinden daha az temsil edilen dillere kadar her şeyi kapsayan çok dilli çözümler geliştirilebileceği ve kamu ve özel hizmetlerde erişilebilirlik ve kapsayıcılık hedeflerine ulaşılmasına yardımcı olabileceği anlamına gelir.

Avrupa'da bulut entegrasyonu, dijital egemenlik ve dağıtım

Gemma 4'ün dağıtımı yalnızca şirket içi donanımlarla sınırlı değildir. Google, bu modelleri bulut hizmetine entegre etmiştir. Vertex AI y Google Kubernetes Motoru (GKE)Kuruluşların özel bilgi işlem kaynaklarını yapılandırmasına ve çıkarım iş yüklerini talep üzerine ölçeklendirmesine olanak tanır. Düzenlemeye tabi Avrupa sektörleri için bu, aşağıdaki seçeneklerle birleştirilmiştir: Egemen Bulut Veri yerleşimi gerekliliklerine ve Genel Veri Koruma Yönetmeliği (GDPR) ile uyumluluğa göre ayarlanmış, hava boşluklu veya şirket içi dağıtımlar.

Şirket, daha büyük modellerin bfloat16 hassas ağırlıklarının verimli bir şekilde çalıştırılabileceğini vurguluyor. tek 80 GB NVIDIA H100 GPUOrta ölçekli şirketler veya altyapılarının kontrolünü elinde tutmak isteyen kamu kurumları için giriş engelini azaltmak. Nicelleştirilmiş versiyonlarında, modeller ayrıca şu alanlarda da çalışabilir: tüketici donanımı veya iş istasyonlarıBu durum, olası konuşlandırma alanlarının kapsamını genişletmektedir.

İspanya'daki ve Avrupa'nın geri kalanındaki teknoloji yöneticileri için bu kombinasyon, açık model, kontrollü dağıtım ve bağımsız bulut desteği Bu, hibrit mimarilerin tasarlanmasına olanak tanır: zekanın bir kısmı yerel veri merkezlerinde bulunabilirken, daha az hassas iş yükleri ortak bir teknolojik altyapı korunarak genel bulutta çalıştırılabilir.

Ek olarak, Google şunları da sunmaktadır: Ajan Geliştirme Kiti (ADK)Gemma 4 tabanlı ajanların oluşturulmasını, test edilmesini ve dağıtımını basitleştiren modüler bir çerçeve. Ayrıca aşağıdaki gibi hizmetlere de dayanmaktadır: Cloud Run, NVIDIA RTX PRO 6000 GPU'larla (Blackwell) çalışıyor. Sunucu gerektirmeyen modda, yüksek yoğunluklu pilot projelerin ilk günden itibaren kendi donanımınızı edinmenize gerek kalmadan başlatılmasına olanak tanır.

Yapay zekâ konusundaki tartışmaların genellikle kontrol, şeffaflık ve denetlenebilirlik etrafında döndüğü Avrupa bağlamında, şu olasılık ortaya çıkmaktadır: Kontrollü altyapılarda Apache 2.0 altında açık kaynaklı modelleri kullanıma sunmak. Özellikle yeniliği katı düzenleyici çerçevelerle uzlaştırmak zorunda olan idareler, bankalar, sigorta şirketleri veya sağlık sektöründeki şirketler için oldukça caziptir.

Apache Lisansı 2.0, açık ekosistem ve topluluk desteği

Toplumda özellikle ilgi uyandıran bir konu varsa, o da Gemma 4'e lisans verilmesi kararıdır. Apache 2.0Gemma'nın önceki sürümleri, ticari ürünler için yasal soruları gündeme getiren özel lisanslar kullanıyordu; şimdi ise standart bir açık kaynak lisansı ile, Geliştiriciler ve şirketler, modelleri çok daha az zorlukla değiştirebilir, yeniden dağıtabilir ve para kazanabilirler..

Bu açılış, Google'ın çabaladığı bir dönemde gerçekleşiyor. Açık modeller ekosisteminde yeniden zemin kazanmakBu durum, Meta'nın Llama'sı veya Çin modelleri (DeepSeek, Qwen, GLM, Minimax) gibi alternatiflerin benimsenme oranlarının arttığı bir dönemin ardından geldi. Sektördeki etkili isimler, örneğin Hugging Face'in kurucu ortağı, bu hamleyi yerel yapay zeka için "büyük bir dönüm noktası" olarak nitelendirerek, hukuk ekiplerinin artık Gemma 4'e dayalı projeleri onaylamak için çok daha net bir çerçeveye sahip olduğunu vurguladı.

Gemma ailesini çevreleyen ekosistem, bu sürümden önce de zaten güçlü bir performans sergiliyordu. Google, önceki nesillerin daha da güçlü olduğunu belirtiyor... 400 milyon indirme ve topluluğun bundan daha fazlasını yarattığı 100.000 çeşit Farklı dillere ve kullanım durumlarına uyarlanmıştır. En çarpıcı örnekler arasında, özellikle şu alanlarda uzmanlaşmış modeller yer almaktadır: Bulgar veya kanser araştırması araçları gibi Hücre2Cümle-Ölçeği Yale Üniversitesi'nde geliştirilmiştir.

Gemma 4 ile şirket, "Gemma evreninin" daha da genişlemesini ve daha fazla kişiyi davet etmesini umuyor... Avrupa girişimleri, üniversiteleri ve araştırma merkezleri Kendi türevlerini oluşturmalarına olanak tanır. İzin verici bir lisans ve açık ağırlıkların birleşimi, sağlık, adalet, Endüstri 4.0 veya eğitim gibi belirli sektörlere odaklanan sürümlerin geliştirilmesine olanak tanır ve bunlar daha sonra çok fazla kısıtlama olmaksızın paylaşılabilir veya pazarlanabilir.

İspanyol şirketleri için bu durum, Gemma 4 üzerinde dahili asistanlar, kurumsal arama motorları veya gelişmiş analitik sistemler gibi özel çözümler geliştirmenin mümkün olduğu anlamına geliyor; bu sayede kod, veri ve altyapı üzerindeki kontrol korunabiliyor ve bu da güçlendirme eğilimiyle iyi bir uyum sağlıyor. Avrupa teknolojik egemenliği.

Kullanım alanları: yeni kurulan şirketlerden büyük şirketlere

Gemma 4'e çok çeşitli özellikler sunulmuştur. potansiyel uygulamalarİş dünyasında modeller, oluşturmak için kullanılabilir. çok dilli sanal asistanlar Gelişmiş mantıksal çıkarımlar yoluyla karmaşık sorguları işleyebilen veya geliştirme ekiplerinde kod oluşturma ve incelemeyi otomatikleştirebilen.

Daha büyük modeller aşağıdaki gibi görevlere yöneliktir: Ajanların koordinasyonu, büyük miktarda dokümanın analiziBu, teknik raporlar oluşturmayı veya hukuk ve uyumluluk departmanlarına yardımcı olmayı içerir. Geniş bağlam pencereleri ve çok modlu desteğin birleşimi, tek bir temsilcinin aynı iş akışı içinde sözleşmeler, e-postalar, grafikler, izleme sistemi görüntüleri ve ses kayıtlarıyla çalışmasını kolaylaştırır.

Eğitim ve kamu sektöründe, metin, görüntü ve bazı durumlarda video ve ses işleme yeteneği, aşağıdakilerin oluşturulmasına olanak tanır: öğrenme destek platformları Özetler, adım adım açıklamalar veya farklı seviyelere uyarlanmış materyaller üreten sistemler. Yerel uygulama ayrıca, küçüklerin veya savunmasız grupların hassas verileriyle çalışırken gizlilik gerekliliklerine uyulmasına da yardımcı olur.

Girişimcilik alanında Gemma 4, aşağıdakilerin temelini oluşturabilir: dikey ürünler Fintech, dijital sağlık, lojistik veya B2B SaaS alanlarında, Apache 2.0'ın sunduğu esneklik sayesinde ekipler şunları yapabilir: ince ayar Modeli kendi verileri üzerinde geliştirebilir, şirket içi veya bulutta dağıtabilir ve katı tescilli lisanslara bağlı kalmadan sonucu pazarlayabilirler.

Özellikle Avrupa için ilgi çekici olan, gelişme olasılığıdır. yerel yapay zeka çözümleri Örneğin, verileri Avrupa topraklarında bulunan veri merkezlerinde depolayarak ve modelleri kuruluşun doğrudan kontrolü altında tutarak ulusal ve topluluk düzenlemelerine saygı gösteren bu yaklaşımlar, gelecekteki AB Yapay Zeka Yönetmeliği ile bağlantılı projeler için önemli olabilir.

Gemma 4'e nereden ve nasıl erişilir?

Google, geliştiriciler ve araştırmacılar tarafından benimsenmesini kolaylaştırmak amacıyla Gemma 4 ağırlıklarını çeşitli kanallar aracılığıyla kullanıma sunmuştur. Açık kaynaklı ağırlıklar şu adresten indirilebilir: Sarılma Yüz y GitHubArayüz ve API'ler aracılığıyla kullanım mümkünken, Google AI StüdyosuEntegrasyonlar ayrıca şu seçeneklerle de sunulmaktadır: OllamaDocker, Kaggle ve LM Studio gibi araçlar.

Şirketin açıklamasına göre, Gemma 4 yerel olarak « üzerinde çalıştırılabilir.milyarlarca Android cihazı» ve çok çeşitli donanımlarda: Dizüstü bilgisayar GPU'ları ve iş istasyonlarından, özel geliştirici hızlandırma merkezlerine kadar uzanıyor. Bu, gelişmiş yapay zekayı büyük veri merkezlerinin ötesine, son kullanıcı cihazlarına ve uç bilişim ortamlarına genişletme stratejisiyle uyumlu.

Hızlı testlerle başlamak isteyenler için en doğrudan seçenek şudur: Google AI Stüdyosu 26B ve 31B modelleri için veya Google AI Edge Galerisi E2B ve E4B varyantları söz konusu olduğunda durum böyledir. Buna paralel olarak, Hugging Face gibi platformlardaki geliştirici toplulukları, farklı ortamlar için uyarlamalar ve kullanıma hazır yapılandırmalar yayınlamaya başlamıştır bile.

İspanya ve diğer Avrupa ülkelerinde, yerel entegratörlerin ve yönetilen hizmet sağlayıcılarının hizmet sunmaya başlaması bekleniyor. Gemma 4 tabanlı anahtar teslim çözümlerEgemen bulut dağıtımlarını, İspanyolca desteği ve finansal hizmetler veya sağlık hizmetleri gibi belirli sektör düzenlemelerine uyumu bir araya getiriyor.

Genel olarak, Gemma 4'ün piyasaya sürülmesi Google'ı bu alandaki en önemli oyunculardan biri konumuna getiriyor. açık ve yerel olarak çalıştırılabilir yapay zeka modelleriAvrupa endüstrisinin, uzun vadeli ticari ürünler geliştirmek için yüksek performans, veri kontrolü ve net lisanslama çerçevelerini birleştiren araçlara tam olarak ihtiyaç duyduğu bir dönemdeyiz.

edge AI daha fazla gizlilik
İlgili makale:
Edge AI ve gizlilik: Verilerinizi ifşa etmeden güçlü AI