OpenAI, dil modellerinin yalnızca metin üretimiyle sınırlı kalmaması gerektiği inancıyla GPT-4o’nun gelişmiş çok modlu yetkinliklerini duyurdu. Yeni model, görüntü oluşturma ve görselleri anlama konularında önemli iyileştirmeler sunarak yaratıcılık ve görsel iletişim süreçlerini güçlendirmeyi hedefliyor.
GPT-4o’nun yeni özellikleri
Metin ve Görselleri Entegre Etme: Kullanıcılar artık metinlerini doğrudan görsellere entegre edebilecek, model metni daha anlamlı ve bağlama uygun görsellerle birleştirecek.
Gelişmiş Görsel Anlayış: Model, yüklenen görsellerden ilham alarak yeni içerikler üretebilecek ve görseller arasındaki ilişkileri daha iyi analiz edebilecek.
Karmaşık Sahne Oluşturma: Kullanıcılar 10 ila 20 nesneye kadar detay içeren sahneleri daha tutarlı ve anlamlı şekilde oluşturabilecek.
GPT-4o’nun kullanıma açılması
Öncelikli olarak ChatGPT Pro, Plus ve Team abonelerine sunulacak olan bu gelişmiş yetenekler, ilerleyen günlerde ChatGPT’nin ücretsiz kullanıcılarına da açılacak. OpenAI, beklenenden yüksek bir talep olduğunu belirterek erişimi kademeli olarak genişleteceğini duyurdu.
GPT-4o’nun, bir önceki model olan GPT-4o Turbo’ya kıyasla daha akıcı, bağlama duyarlı ve tutarlı görseller ürettiği belirtiliyor. Yapay zekanın görsel yeteneklerindeki bu ilerleme, yaratıcı projeler, tasarım ve dijital sanat alanlarında devrim yaratma potansiyeline sahip olarak görülüyor.