OpenAI, derin öğrenme alanında attığı adımlarla dikkat çekmeye devam ediyor. GPT-4 adlı multimodal modeli geliştiren ekip, insan düzeyinde performans sergileyebilen bir yapay zeka elde etti.
Görüntü ve metin girdileriyle çalışabilen GPT-4, profesyonel ve akademik ölçütlerde GPT-3.5’ten daha iyi sonuçlar veriyor. Modelin metin girdileri ChatGPT ve API aracılığıyla kullanıma sunulurken, görüntü girdileri ise yakın zamanda bir ortakla birlikte daha geniş bir kullanıma hazırlanacak.
OpenAI derin öğrenmeyi ölçeklendirme çabalarındaki son kilometre taşı olan GPT-4’ü duyurdu. GPT-4, insanlar tarafından birçok gerçek dünya senaryosunda daha az yetenekli olmasına rağmen, çeşitli profesyonel ve akademik ölçütlerde insan düzeyinde performans sergileyen, hem görüntü hem de metin girdilerini kabul eden ve metin çıktıları veren büyük bir multimodal modeldir. Örneğin, GPT-4, bir simülasyon bar sınavını üst %10’luk bir skorla geçerken, GPT-3.5’in skoru alt %10 civarındaydı. Adversarial test programından ve ChatGPT’den alınan dersler kullanılarak GPT-4, doğruluk, yönlendirilebilirlik ve koruyucu kısıtlamalardan çıkmama konusunda en iyi sonuçlarına ulaştı (ancak hala mükemmel değil).
Son iki yıl boyunca, derin öğrenme yığınları yeniden oluşturuldu ve Azure ile birlikte, iş yükleri için yerden tasarlanmış bir süper bilgisayar tasarlandı. Bir yıl önce, GPT-3.5’i sistemlerinin ilk “test çalışması” olarak eğittiler. Bazı hatalar bulundu ve düzeltildi ve teorik temelleri geliştirildi. Sonuç olarak, GPT-4 eğitim çalışmaları (en azından onlar için!) önceden doğru bir şekilde tahmin edebildikleri ilk büyük model oldu. Güvenilir ölçeklendirme üzerinde odaklandıkları sürece, gelecekteki yetenekleri daha önceden tahmin etmek ve hazırlamak için metodolojilerini keskinleştirmeyi amaçlıyorlar – bunu güvenlik için kritik bir şey olarak görüyorlar.
GPT-4’ün metin girdi kabiliyeti, ChatGPT ve API aracılığıyla (bekleme listesiyle) kullanıma sunuldu. Görüntü girdi kabiliyetini daha geniş bir kullanılabilirliğe hazırlamak için, bir ortakla yakın bir şekilde işbirliği yapılıyor. Ayrıca, AI model performansının otomatik değerlendirmesi için OpenAI Evals’in kaynak kodu açık kaynaklı hale getirilerek, modeldeki eksiklikleri bildirerek daha fazla gelişmeyi yönlendirmeye yardımcı olacak herkesin rapor vermesine izin veriliyor.
Sohbet sırasında, GPT-3.5 ve GPT-4 arasındaki ayrım belirsiz olabilir. Fark, görevin karmaşıklığı yeterli bir eşiğe ulaştığında ortaya çıkar – GPT-4, GPT-3.5’ten daha güvenilir, yaratıcı ve çok daha nüanslı talimatları işlemeye yeteneklidir.
İki model arasındaki farkı anlamak için, insanlar için tasarlanmış olan çeşitli ölçütlerde test edildi. En son kamuoyuna açık testler kullanıldı (Olimpiyatlar ve AP serbest yanıtlı soruların durumunda) veya 2022-2023 sürümlerinin uygulama sınavları satın alındı. Bu sınavlar için özel bir eğitim yapılmadı. Soruların azı, modelin eğitimi sırasında görüldü, ancak sonuçların temsilci olduğunu düşünüyorlar – ayrıntılar için teknik rapora bakılabilir.
Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.