AI alanında birçok rakip ortaya çıkıyor, "Yüz Model Savaşı" dönemi başlıyor
Geçen ay, AI dünyasında bir "hayvanlar savaşı" patlak verdi. Bir tarafta, Meta'nın sunduğu Llama, açık kaynak özelliği sayesinde geliştiricilerin gözdesi oldu. Diğer tarafta ise bu yılın Mayıs ayında piyasaya çıkan Falcon adlı büyük model, Llama'yı geride bırakarak açık kaynak LLM sıralamasında zirveye oturdu.
İlginçtir ki, Falcon'un geliştiricisi Birleşik Arap Emirlikleri'nin başkenti Abu Dabi'deki Teknoloji İnovasyon Araştırma Enstitüsü'dür. Birleşik Arap Emirlikleri'nin Yapay Zeka Bakanı daha sonra "Zaman dergisi" tarafından "Yapay Zeka alanında en etkili 100 kişi" arasına seçilmiştir.
Bugün, AI alanı birçok farklı görüşün ortaya çıktığı bir aşamaya girmiştir. Belirli mali kaynaklara sahip ülkeler ve şirketler, yerel versiyon ChatGPT'yi geliştirmeye çalışıyor. Sadece Körfez bölgesinde, Suudi Arabistan, yerel üniversiteler için LLM eğitimi amacıyla 3000'den fazla H100 çipi satın aldı.
Bu durum insanı düşündürüyor: söylenen yüksek zorlukta sert teknoloji nasıl "bir ülke bir model" haline geldi?
Transformer oyunun kurallarını değiştirdi
2017'de, Google'dan 8 bilgisayar bilimcisi "Attention Is All You Need" başlıklı makalelerinde Transformer algoritmasını açıkladı ve bu, mevcut AI heyecanının katalizörü oldu. Artık tüm büyük modeller, GPT serisi de dahil olmak üzere, Transformer temelinde inşa edilmektedir.
Transformer'ın devrimci yönleri iki noktada öne çıkıyor: birincisi, konum kodlamasıyla döngüsel tasarımın yerini alması, paralel hesaplama sağlaması ve eğitim verimliliğini büyük ölçüde artırması; ikincisi ise bağlam anlama yeteneğinin daha da güçlendirilmesidir.
Bu, büyük modellerin teorik araştırmadan mühendislik sorununa dönüşmesini sağladı. Veri, hesaplama gücü ölçeği, model mimarisi gibi mühendislik unsurları, AI yarışmasının anahtarı haline geldi. Belirli bir teknik yeteneğe sahip olan her şirket büyük modeller geliştirebilir.
Açık Kaynak ve Kapalı Kaynak Tartışması
Şu anda, "Bai Mo Savaşı" gerçek oldu. Temmuz itibarıyla, Çin'deki büyük model sayısı 130'a ulaştı ve ABD'nin 114 modelini geçti. Japonya, Hindistan, Güney Kore gibi diğer ülkelerin de kendi büyük modelleri var.
Ama, girmek kolay, başarılı olmak zor. Falcon'u örnek alırsak, sıralamada Llama'yı geçmesine rağmen, Meta üzerinde somut bir etki yaratmak zor. Açık kaynak büyük modeller için, aktif bir geliştirici topluluğu temel rekabet avantajıdır. Meta'nın açık kaynak geleneği var ve topluluk yönetiminde daha üstündür.
Elbette, performansı artırmak da bir yol. Ancak şu anda çoğu LLM, GPT-4 ile hala belirgin bir fark var. En son AgentBench testinde, GPT-4 4.41 puanla açık ara önde, ikinci olan Claude ise sadece 2.77 puan aldı, diğer açık kaynak modellerinin çoğu ise 1 puan civarında.
Bu farkı yaratan, OpenAI'nin mükemmel bilim insanı ekibi ve uzun süreli birikimdir. Büyük modellerin özü, ekosistem inşasında yatmaktadır ( açık kaynak ) veya saf akıl yürütme yeteneği ( kapalı kaynak ).
Maliyet ve Gelir Dengesizliği
Şu anda, büyük model endüstrisinde maliyet ve gelir arasında ciddi bir dengesizlik sorunu yaygın olarak görülmektedir. Sequoia Capital'in tahminine göre, dünya genelindeki teknoloji şirketleri her yıl büyük model altyapısına 200 milyar dolar harcayabilirken, büyük modelin yıllık geliri en fazla 75 milyar dolardır ve en az 125 milyar dolarlık bir açık bulunmaktadır.
Microsoft ve Adobe gibi yazılım devleri bile AI ürünlerinde zararlarla karşı karşıya kalıyor. Çoğu büyük model şirketi, büyük yatırımlara rağmen hâlâ net bir kâr modeli bulamadı.
Homojenleşmiş rekabetin artması ve açık kaynak modellerin çoğalmasıyla, yalnızca büyük model tedarikçileri daha fazla baskı ile karşılaşabilir. Gelecekte, AI'nın değeri muhtemelen daha fazla belirli uygulama senaryolarında ortaya çıkacak, modelin kendisinde değil.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
18 Likes
Reward
18
5
Share
Comment
0/400
0xSherlock
· 15h ago
Paradan daha çekici
View OriginalReply0
WhaleMinion
· 16h ago
Büyük savaş daha yeni başladı
View OriginalReply0
SignatureDenied
· 16h ago
Teknoloji sınır tanımıyor
View OriginalReply0
LuckyBearDrawer
· 17h ago
Para her şeyi çözer.
View OriginalReply0
SelfStaking
· 17h ago
Kripto Para Trade yapmak yerine model geliştirmek daha iyidir.
AI büyük modelleri çeşitleniyor, teknik engellerin düşüşü küresel rekabeti tetikliyor.
AI alanında birçok rakip ortaya çıkıyor, "Yüz Model Savaşı" dönemi başlıyor
Geçen ay, AI dünyasında bir "hayvanlar savaşı" patlak verdi. Bir tarafta, Meta'nın sunduğu Llama, açık kaynak özelliği sayesinde geliştiricilerin gözdesi oldu. Diğer tarafta ise bu yılın Mayıs ayında piyasaya çıkan Falcon adlı büyük model, Llama'yı geride bırakarak açık kaynak LLM sıralamasında zirveye oturdu.
İlginçtir ki, Falcon'un geliştiricisi Birleşik Arap Emirlikleri'nin başkenti Abu Dabi'deki Teknoloji İnovasyon Araştırma Enstitüsü'dür. Birleşik Arap Emirlikleri'nin Yapay Zeka Bakanı daha sonra "Zaman dergisi" tarafından "Yapay Zeka alanında en etkili 100 kişi" arasına seçilmiştir.
Bugün, AI alanı birçok farklı görüşün ortaya çıktığı bir aşamaya girmiştir. Belirli mali kaynaklara sahip ülkeler ve şirketler, yerel versiyon ChatGPT'yi geliştirmeye çalışıyor. Sadece Körfez bölgesinde, Suudi Arabistan, yerel üniversiteler için LLM eğitimi amacıyla 3000'den fazla H100 çipi satın aldı.
Bu durum insanı düşündürüyor: söylenen yüksek zorlukta sert teknoloji nasıl "bir ülke bir model" haline geldi?
Transformer oyunun kurallarını değiştirdi
2017'de, Google'dan 8 bilgisayar bilimcisi "Attention Is All You Need" başlıklı makalelerinde Transformer algoritmasını açıkladı ve bu, mevcut AI heyecanının katalizörü oldu. Artık tüm büyük modeller, GPT serisi de dahil olmak üzere, Transformer temelinde inşa edilmektedir.
Transformer'ın devrimci yönleri iki noktada öne çıkıyor: birincisi, konum kodlamasıyla döngüsel tasarımın yerini alması, paralel hesaplama sağlaması ve eğitim verimliliğini büyük ölçüde artırması; ikincisi ise bağlam anlama yeteneğinin daha da güçlendirilmesidir.
Bu, büyük modellerin teorik araştırmadan mühendislik sorununa dönüşmesini sağladı. Veri, hesaplama gücü ölçeği, model mimarisi gibi mühendislik unsurları, AI yarışmasının anahtarı haline geldi. Belirli bir teknik yeteneğe sahip olan her şirket büyük modeller geliştirebilir.
Açık Kaynak ve Kapalı Kaynak Tartışması
Şu anda, "Bai Mo Savaşı" gerçek oldu. Temmuz itibarıyla, Çin'deki büyük model sayısı 130'a ulaştı ve ABD'nin 114 modelini geçti. Japonya, Hindistan, Güney Kore gibi diğer ülkelerin de kendi büyük modelleri var.
Ama, girmek kolay, başarılı olmak zor. Falcon'u örnek alırsak, sıralamada Llama'yı geçmesine rağmen, Meta üzerinde somut bir etki yaratmak zor. Açık kaynak büyük modeller için, aktif bir geliştirici topluluğu temel rekabet avantajıdır. Meta'nın açık kaynak geleneği var ve topluluk yönetiminde daha üstündür.
Elbette, performansı artırmak da bir yol. Ancak şu anda çoğu LLM, GPT-4 ile hala belirgin bir fark var. En son AgentBench testinde, GPT-4 4.41 puanla açık ara önde, ikinci olan Claude ise sadece 2.77 puan aldı, diğer açık kaynak modellerinin çoğu ise 1 puan civarında.
Bu farkı yaratan, OpenAI'nin mükemmel bilim insanı ekibi ve uzun süreli birikimdir. Büyük modellerin özü, ekosistem inşasında yatmaktadır ( açık kaynak ) veya saf akıl yürütme yeteneği ( kapalı kaynak ).
Maliyet ve Gelir Dengesizliği
Şu anda, büyük model endüstrisinde maliyet ve gelir arasında ciddi bir dengesizlik sorunu yaygın olarak görülmektedir. Sequoia Capital'in tahminine göre, dünya genelindeki teknoloji şirketleri her yıl büyük model altyapısına 200 milyar dolar harcayabilirken, büyük modelin yıllık geliri en fazla 75 milyar dolardır ve en az 125 milyar dolarlık bir açık bulunmaktadır.
Microsoft ve Adobe gibi yazılım devleri bile AI ürünlerinde zararlarla karşı karşıya kalıyor. Çoğu büyük model şirketi, büyük yatırımlara rağmen hâlâ net bir kâr modeli bulamadı.
Homojenleşmiş rekabetin artması ve açık kaynak modellerin çoğalmasıyla, yalnızca büyük model tedarikçileri daha fazla baskı ile karşılaşabilir. Gelecekte, AI'nın değeri muhtemelen daha fazla belirli uygulama senaryolarında ortaya çıkacak, modelin kendisinde değil.