Stanford Üniversitesi ve Washington Üniversitesi’nden araştırmacılar, yalnızca 26 dakika içinde ve 50 dolardan daha az bir maliyetle OpenAI’ın gelişmiş modellerine rakip bir yapay zeka modelini eğitmeyi başardı. s1 olarak adlandırılan bu model, 1.000 sorudan oluşan küçük bir veri seti ile eğitildi ve büyük yapay zeka modellerinin bilgisini küçük modellere aktaran distilasyon (distillation) yöntemi ile geliştirildi.

Araştırmacılar, s1’in mantık yürütme yeteneklerini geliştirmek için Google’ın Gemini 2.0 Flash Thinking Experimental modelinden yararlandı. Ancak Google’ın hizmet şartları Gemini API’sinin rakip yapay zeka modellerinin geliştirilmesi için kullanılmasını yasaklıyor ve bu durum olası hukuki sorunları gündeme getiriyor.

s1 modeli, Alibaba Cloud’un açık kaynaklı Qwen2.5 modeli üzerine inşa edildi. Başlangıçta 59.000 soruluk büyük bir veri seti kullanılarak eğitime başlansa da yapılan testler daha küçük bir veri setinin benzer doğruluk oranlarını sunduğunu ortaya koydu ve böylece eğitim süresi ve maliyet önemli ölçüde düşürüldü.

Eğitim süreci 16 adet Nvidia H100 GPU kullanılarak tamamlandı. Model, doğruluğunu artırmak için test-time scaling adı verilen gelişmiş bir teknikten yararlanıyor. Araştırmacılar, modele “Wait” komutu ekleyerek yanıt üretme süresini uzattı ve böylece modelin yanıtlarını tekrar gözden geçirip hatalarını düzeltmesine imkan tanıdı. Bu yöntem, yapay zekanın karmaşık mantık süreçlerini daha doğru çalıştırmasını sağladı.

Bu gelişme, yüksek performanslı yapay zeka modellerinin mutlaka milyarlarca dolarlık yatırımlarla ve devasa veri merkezleriyle eğitilmesi gerekmediğini kanıtlıyor. OpenAI’ın o1 modeli de benzer bir mantık yürütme tekniği kullanıyor ve Çin merkezli DeepSeek’in R1 modeli, benzer bir yöntemle çok daha düşük maliyetle geliştirildiğini iddia ediyor.

Ancak OpenAI, DeepSeek’i modellerinden bilgi distile ederek rakip bir yapay zeka geliştirmekle suçladı ve bu durum büyük teknoloji şirketlerinin açık kaynak yapay zeka modelleri karşısındaki duruşlarını yeniden gözden geçirmelerine neden olabilir.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

You May Also Like

Nvidia’dan beklenmedik Samsung eleştirisi: Güvenilir değil

Nvidia CEO’su Jensen Huang’dan Samsung HBM’e yönelik beklenmedik bir suçlama geldi. İşte detaylar.

28 milyar liralık Bitcoin’ini kaybeden adam bakın ne yaptı!

Galler’deki eski bir kripto madencisi 8 bin Bitcoin’in olduğu cüzdanı kurtarmak için çöp arazisini satın almak istiyor.

NASA büyük gizemi çözebilir: Kuzey Işıkları’na roket gönderiyor!

NASA’nın Alaska’da gerçekleştireceği roket fırlatmalarıyla auroraların (Kuzey Işıkları’nın) hareketlerindeki gizem çözülmeye çalışılacak.

Snapdragon 8 Elite Gen 2’li telefonlarla birlikte batarya derdi bitiyor!

Snapdragon 8 Elite Gen 2 işlemcili telefonlarla birlikte, daha büyük ve hızlı şarj edilebilen bataryalar geliyor.