OpenAI, yapay zekâ alanında önemli bir adım atarak iki yeni modeli tanıttı: o3 ve o4-mini. Bu modeller artık sadece metinleri değil, görselleri de düşünme sürecinin bir parçası hâline getirebiliyor. Yani bir fotoğrafı kırpabiliyor, yakınlaştırabiliyor, döndürebiliyor ve bu işlemleri içsel muhakemelerinin bir parçası olarak kullanabiliyorlar.
Görsel ve Sözel Zekâ Birleşiyor!

OpenAI’nin yaptığı açıklamaya göre, “o3 ve o4-mini modelleri, görseller üzerinde düşünerek görsel algılama alanında çığır açan bir yeniliği temsil ediyor.” Önceki sürümlerde olduğu gibi ayrı bir görsel analiz sistemine ihtiyaç duymadan, görsellerle ve metinlerle doğal şekilde bütünleşerek çok daha anlamlı ve doğru yanıtlar üretebiliyorlar.
Görsellerle Düşünmek Ne Demek?
Örneğin, el yazısıyla yazılmış bir matematik problemi, bulanık bir tabela ya da karmaşık bir grafik yüklediğinizde, model sadece içeriği anlamakla kalmıyor, onu adım adım çözümleyebiliyor. Üstelik önceki sürümlere kıyasla çok daha başarılı şekilde.
Sonuç olarak, her ne kadar etkileyici olsa da bu modeller kusursuz değil. OpenAI, modellerin bazen fazla düşünmeye meyilli olabildiğini, bu yüzden gereksiz ve uzun süren görsel düzenlemeler yapabildiğini belirtiyor. Ayrıca, bir görsel doğru analiz edilse bile yorumlamada hatalar olabilir. Aynı görsel yüklemesiyle tekrar deneme yapıldığında farklı sonuçlar alınması da hâlâ modelin güvenilirliğini etkileyebiliyor.
Yorum bulunmamaktadır.