Stanford Üniversitesi ve Washington Üniversitesi’nden araştırmacılar, yalnızca 26 dakika içinde ve 50 dolardan daha az bir maliyetle OpenAI’ın gelişmiş modellerine rakip bir yapay zeka modelini eğitmeyi başardı. s1 olarak adlandırılan bu model, 1.000 sorudan oluşan küçük bir veri seti ile eğitildi ve büyük yapay zeka modellerinin bilgisini küçük modellere aktaran distilasyon (distillation) yöntemi ile geliştirildi.
50 dolarlık OpenAI rakibi yapay zeka: s1
Araştırmacılar, s1’in mantık yürütme yeteneklerini geliştirmek için Google’ın Gemini 2.0 Flash Thinking Experimental modelinden yararlandı. Ancak Google’ın hizmet şartları Gemini API’sinin rakip yapay zeka modellerinin geliştirilmesi için kullanılmasını yasaklıyor ve bu durum olası hukuki sorunları gündeme getiriyor.
![](https://ares.shiftdelete.net/2025/02/2-6.jpg)
s1 modeli, Alibaba Cloud’un açık kaynaklı Qwen2.5 modeli üzerine inşa edildi. Başlangıçta 59.000 soruluk büyük bir veri seti kullanılarak eğitime başlansa da yapılan testler daha küçük bir veri setinin benzer doğruluk oranlarını sunduğunu ortaya koydu ve böylece eğitim süresi ve maliyet önemli ölçüde düşürüldü.
Eğitim süreci 16 adet Nvidia H100 GPU kullanılarak tamamlandı. Model, doğruluğunu artırmak için test-time scaling adı verilen gelişmiş bir teknikten yararlanıyor. Araştırmacılar, modele “Wait” komutu ekleyerek yanıt üretme süresini uzattı ve böylece modelin yanıtlarını tekrar gözden geçirip hatalarını düzeltmesine imkan tanıdı. Bu yöntem, yapay zekanın karmaşık mantık süreçlerini daha doğru çalıştırmasını sağladı.
Bu gelişme, yüksek performanslı yapay zeka modellerinin mutlaka milyarlarca dolarlık yatırımlarla ve devasa veri merkezleriyle eğitilmesi gerekmediğini kanıtlıyor. OpenAI’ın o1 modeli de benzer bir mantık yürütme tekniği kullanıyor ve Çin merkezli DeepSeek’in R1 modeli, benzer bir yöntemle çok daha düşük maliyetle geliştirildiğini iddia ediyor.
Ancak OpenAI, DeepSeek’i modellerinden bilgi distile ederek rakip bir yapay zeka geliştirmekle suçladı ve bu durum büyük teknoloji şirketlerinin açık kaynak yapay zeka modelleri karşısındaki duruşlarını yeniden gözden geçirmelerine neden olabilir.