AI Eğitim Paradigmasının Evrimi: Merkezi Kontrolden Merkeziyetsiz İşbirliğine Teknik Devrim
AI'nın tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engeli olan aşamadır; bu, modelin yetenek sınırlarını ve gerçek uygulama etkilerini doğrudan belirler. Çıkarım aşamasının hafif çağrılarıyla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir; bu, AI sisteminin inşasında gerçek bir "ağır sanayi"dir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede özellikle tartışılan Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, tek bir kurumun yerel yüksek performanslı küme içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordineli olarak çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata tolerans mekanizmalarının verimliliğini en üst düzeye çıkarır; GPT, Gemini gibi büyük ölçekli modellerin eğitimine oldukça uygundur ve yüksek verimlilik, kontrol edilebilir kaynaklar gibi avantajları vardır, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da içermektedir.
Dağıtık eğitim, günümüz büyük model eğitiminde ana akım bir yöntemdir. Temelinde, model eğitim görevlerinin parçalanıp birden fazla makineye dağıtılarak eşgüdümlü bir şekilde gerçekleştirilmesi yatmaktadır; bu sayede tek makine hesaplama ve depolama darboğazları aşılmaktadır. Fiziksel olarak "dağıtık" özelliklere sahip olsa da, genel olarak merkezi bir kurum tarafından kontrol edilen zamanlama ve senkronizasyon altında çalışmaktadır. Genellikle yüksek hızlı yerel ağ ortamında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevleri koordine eder. Ana akım yöntemler şunlardır:
Veri paralelliği: Her bir düğüm farklı veri parametreleri eğitiyor, model ağırlıklarının eşleşmesi gerekiyor.
Model paralelliği: Modelin farklı kısımlarını farklı düğümlere yerleştirerek güçlü ölçeklenebilirlik sağlama
Boru hattı paralel: Aşamalı seri yürütme, verimliliği artırır.
Tensor paralelliği: Matris hesaplamalarını ince bir şekilde bölmek, paralel granülasyonu artırmak
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını işbirliği yaparak görev tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir geleceği temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinator olmadan eğitim görevlerini birlikte tamamlar, genellikle görev dağılımı ve işbirliği için protokollerle yönlendirilir ve katkının dürüstlüğünü sağlamak için kripto teşvik mekanizmalarından yararlanır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Cihaz heterojenliği ve bölme zorluğu: Heterojen cihazların koordinasyonu zor, görev bölme verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi kararsız, gradyan senkronizasyonu darboğazı belirgin
Birlikte koordinasyon eksikliği: Merkezi bir denetleyici yok, görev dağıtımı ve hata geri alma mekanizmaları karmaşık
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin hesaplama gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur; sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok boyutu içerir, ancak "etkili iş birliği + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanabilir mi hâlâ erken prototip keşif aşamasındadır.
Federated learning, bir geçiş biçimi olarak dağıtık ve Merkeziyetsizlik arasında, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular ve gizlilik uyumuna önem veren senaryolar için uygundur. Federated learning, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitiminde veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre karşı dirençli özelliklere sahip değildir. Gizlilik uyum senaryolarında bir "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır, endüstride geçiş aşaması dağıtım yapısı olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolar içinde, görev yapısının karmaşık olması, kaynak ihtiyaçlarının son derece yüksek olması veya işbirliği zorluğu nedeniyle, heterojen, güvensiz düğümler arasında verimli bir şekilde tamamlanması doğal olarak uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine dayanır; açık ağlarda etkili bir şekilde bölünmesi ve senkronizasyonu zordur; veri gizliliği ve egemenlik kısıtlamaları olan görevler hukuki uyum ve etik kısıtlamalardan dolayı açıkça paylaşılamaz; işbirliği teşvikleri olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut Merkeziyetsizlik eğitiminde gerçek kısıtlamaları oluşturur.
Ancak bu, merkeziyetsizlik eğitiminin sahte bir kavram olduğu anlamına gelmez. Aslında, yapısal olarak hafif, paralel çalışmaya uygun ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumlu sonrası eğitim görevleri, veri topluluğu eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazlarının katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gösterme özelliklerine sahiptir ve P2P ağları, Swarm protokolü, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncü alanında, temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında daha fazla özgün keşif önermiştir ve mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise nispeten net olup, ilk mühendislik ilerlemeleri gözlemlenmektedir. Bu makale, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkilerini daha fazla tartışacaktır.
Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme iş birliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kararlıdır, böylece herkes eğitime katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmasıyla tam donanımlı bir AI merkeziyetsiz eğitim sistemi inşa etmeyi hedeflemektedir.
Bir, Prime Intellect protokol yığını yapısı ve ana modül değeri
İki, Prime Intellect Eğitiminin Anahtar Mekanizması Detaylı Açıklaması
PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect'in Merkeziyetsizlik eğitim senaryoları için özel olarak tasarladığı bir görev modelleme ve uygulama çerçevesidir ve heterojen ağlar ile asenkron katılım için tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırarak her eğitim düğümünün yerel olarak bağımsız bir görev döngüsünü tamamlamasını sağlar ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve toplama mekanizmalarıyla iş birliği yapar. Geleneksel denetimli öğrenme süreçleriyle karşılaştırıldığında, PRIME-RL, merkezi bir planlama olmadan esnek eğitim uygulamaları için daha uygundur; bu, sistem karmaşıklığını azaltırken çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
TOPLOC:Ağırlıksız eğitim davranış doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayalı olarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan, doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam modelin yeniden hesaplanmasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulaması gerçekleştirir. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir; bu, güvene dayanmayan eğitim ödül dağıtımının sağlanması için kritik bir yenilik olup, denetlenebilir ve teşvik edilebilir merkeziyetsiz işbirliği eğitim ağlarının inşası için uygulanabilir bir yol sunar.
SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve birleştirme protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ve yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmadan sürekli olarak kısmi güncellemeler göndermesine olanak tanır, ağırlıkların kademeli yakınsaması ve çoklu versiyon evrimi gerçekleştirilir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonu oluşturmanın temel temelidir.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Merkeziyetsizlik eğitimi sırasında sık karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve yalnızca yerel komşu düğümlere bağımlı olarak model işbirliği eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizması ile bir araya geldiğinde, OpenDiLoCo, tüketici sınıfı GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamakta ve küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmaktadır. Bu, merkeziyetsizlik eğitim ağının temel iletişim altyapılarından biridir.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından merkeziyetsiz AI eğitim ortamı için özel olarak tasarlanmış hafif iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topoloji, gradyan sıkıştırma, düşük hassasiyet senkronizasyonu ve kesintiden kurtarma desteği sunar, tüketici sınıfı GPU'lar ve istikrarsız düğümler üzerinde çalışabilir, OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağlarının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır, gerçekten açık ve güvene ihtiyaç duymayan işbirlikçi eğitim ağının "son bir mil" iletişim altyapısını kurar.
Üç, Prime Intellect Teşvik Ağı ve Rol Dağılımı
Prime Intellect, herhangi birinin görevlere katılmasını ve gerçek katkılara dayanarak ödüller kazanmasını sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı oluşturdu. Protokol, üç ana rol türü temelinde çalışmaktadır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlamak
Eğitim düğümü: Yerel eğitimi yürütmek, ağırlık güncellemelerini göndermek ve gözlem izlerini göndermek
Doğrulama Düğümü: TOPLOC mekanizmasını kullanarak eğitim davranışlarının gerçekliğini doğrulamak ve ödül hesaplamalarına ve strateji birleştirmeye katılmak
Sözleşmenin temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturur.
Dört, INTELLECT-2: İlk doğrulanabilir merkeziyetsiz eğitim modelinin yayınlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü. Bu, dünyadaki ilk asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri tarafından işbirliği ile eğitilen güçlendirilmiş öğrenme büyük modelidir ve 32B parametre ölçeğine sahiptir. INTELLECT-2 modeli, üç kıtaya yayılmış 100'den fazla GPU heterojen düğüm tarafından işbirliği ile eğitilmiştir. Tamamen asenkron bir mimari kullanarak, eğitim süresi 400 saatten fazladır ve asenkron işbirliği ağının uygulanabilirliği ve istikrarını göstermektedir. Bu model, yalnızca bir performans atılımı değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulanmasıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitim ağının eğitim sürecini ilk kez gerçekleştirdiğini göstermektedir.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
15 Likes
Reward
15
4
Share
Comment
0/400
MoonBoi42
· 16h ago
Kaynak yatırımları yapıldı ama hala Aya doğru kalkmadı.
View OriginalReply0
ContractSurrender
· 16h ago
Merkeziyetsizlik verimsizlik anlamına gelmez
View OriginalReply0
CommunityJanitor
· 16h ago
Yorulmuş Bilgi İşlem Gücü değil mi?
View OriginalReply0
ZkSnarker
· 16h ago
aslında hala merkezi AI yapıyoruz ama ekstra adımlarla... lmao
AI eğitiminde yeni bir paradigm: Merkeziyetsizlik iş birliğine geçişteki teknolojik devrim
AI Eğitim Paradigmasının Evrimi: Merkezi Kontrolden Merkeziyetsiz İşbirliğine Teknik Devrim
AI'nın tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engeli olan aşamadır; bu, modelin yetenek sınırlarını ve gerçek uygulama etkilerini doğrudan belirler. Çıkarım aşamasının hafif çağrılarıyla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritmaları desteği gerektirir; bu, AI sisteminin inşasında gerçek bir "ağır sanayi"dir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede özellikle tartışılan Merkeziyetsizlik eğitimi.
Merkeziyetsiz eğitim, tek bir kurumun yerel yüksek performanslı küme içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme zamanlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordineli olarak çalıştırılır. Bu derin işbirliği mimarisi, bellek paylaşımı, gradyan senkronizasyonu ve hata tolerans mekanizmalarının verimliliğini en üst düzeye çıkarır; GPT, Gemini gibi büyük ölçekli modellerin eğitimine oldukça uygundur ve yüksek verimlilik, kontrol edilebilir kaynaklar gibi avantajları vardır, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunları da içermektedir.
Dağıtık eğitim, günümüz büyük model eğitiminde ana akım bir yöntemdir. Temelinde, model eğitim görevlerinin parçalanıp birden fazla makineye dağıtılarak eşgüdümlü bir şekilde gerçekleştirilmesi yatmaktadır; bu sayede tek makine hesaplama ve depolama darboğazları aşılmaktadır. Fiziksel olarak "dağıtık" özelliklere sahip olsa da, genel olarak merkezi bir kurum tarafından kontrol edilen zamanlama ve senkronizasyon altında çalışmaktadır. Genellikle yüksek hızlı yerel ağ ortamında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi ile ana düğüm, alt görevleri koordine eder. Ana akım yöntemler şunlardır:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını işbirliği yaparak görev tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu şekilde eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir geleceği temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinator olmadan eğitim görevlerini birlikte tamamlar, genellikle görev dağılımı ve işbirliği için protokollerle yönlendirilir ve katkının dürüstlüğünü sağlamak için kripto teşvik mekanizmalarından yararlanır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi, dünya genelindeki bir grup gönüllünün, her birinin hesaplama gücünü katkıda bulunarak modeli birlikte eğitmesi olarak anlaşılabilir, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur; sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulama gibi birçok boyutu içerir, ancak "etkili iş birliği + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanabilir mi hâlâ erken prototip keşif aşamasındadır.
Federated learning, bir geçiş biçimi olarak dağıtık ve Merkeziyetsizlik arasında, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular ve gizlilik uyumuna önem veren senaryolar için uygundur. Federated learning, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitiminde veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre karşı dirençli özelliklere sahip değildir. Gizlilik uyum senaryolarında bir "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizmaları açısından nispeten ılımlıdır, endüstride geçiş aşaması dağıtım yapısı olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, Merkeziyetsizlik eğitimi tüm görev türleri için uygun değildir. Bazı senaryolar içinde, görev yapısının karmaşık olması, kaynak ihtiyaçlarının son derece yüksek olması veya işbirliği zorluğu nedeniyle, heterojen, güvensiz düğümler arasında verimli bir şekilde tamamlanması doğal olarak uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliğine dayanır; açık ağlarda etkili bir şekilde bölünmesi ve senkronizasyonu zordur; veri gizliliği ve egemenlik kısıtlamaları olan görevler hukuki uyum ve etik kısıtlamalardan dolayı açıkça paylaşılamaz; işbirliği teşvikleri olmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlar, mevcut Merkeziyetsizlik eğitiminde gerçek kısıtlamaları oluşturur.
Ancak bu, merkeziyetsizlik eğitiminin sahte bir kavram olduğu anlamına gelmez. Aslında, yapısal olarak hafif, paralel çalışmaya uygun ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumlu sonrası eğitim görevleri, veri topluluğu eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazlarının katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gösterme özelliklerine sahiptir ve P2P ağları, Swarm protokolü, dağıtık optimizasyon araçları gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda merkeziyetsizlik eğitim ve federatif öğrenme öncü alanında, temsilci blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımında daha fazla özgün keşif önermiştir ve mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise nispeten net olup, ilk mühendislik ilerlemeleri gözlemlenmektedir. Bu makale, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve merkeziyetsiz AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkilerini daha fazla tartışacaktır.
Prime Intellect: Eğitim izleri doğrulanabilir güçlendirilmiş öğrenme iş birliği ağı öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kararlıdır, böylece herkes eğitime katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmasıyla tam donanımlı bir AI merkeziyetsiz eğitim sistemi inşa etmeyi hedeflemektedir.
Bir, Prime Intellect protokol yığını yapısı ve ana modül değeri
İki, Prime Intellect Eğitiminin Anahtar Mekanizması Detaylı Açıklaması
PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect'in Merkeziyetsizlik eğitim senaryoları için özel olarak tasarladığı bir görev modelleme ve uygulama çerçevesidir ve heterojen ağlar ile asenkron katılım için tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırarak her eğitim düğümünün yerel olarak bağımsız bir görev döngüsünü tamamlamasını sağlar ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve toplama mekanizmalarıyla iş birliği yapar. Geleneksel denetimli öğrenme süreçleriyle karşılaştırıldığında, PRIME-RL, merkezi bir planlama olmadan esnek eğitim uygulamaları için daha uygundur; bu, sistem karmaşıklığını azaltırken çoklu görev paralelliği ve strateji evrimi için bir temel oluşturur.
TOPLOC:Ağırlıksız eğitim davranış doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayalı olarak etkili bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan, doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam modelin yeniden hesaplanmasına dayanmaz, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulaması gerçekleştirir. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir; bu, güvene dayanmayan eğitim ödül dağıtımının sağlanması için kritik bir yenilik olup, denetlenebilir ve teşvik edilebilir merkeziyetsiz işbirliği eğitim ağlarının inşası için uygulanabilir bir yol sunar.
SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve birleştirme protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ve yerel senkronizasyon stratejisini birleştirerek, birden fazla düğümün senkronize olmadan sürekli olarak kısmi güncellemeler göndermesine olanak tanır, ağırlıkların kademeli yakınsaması ve çoklu versiyon evrimi gerçekleştirilir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransını önemli ölçüde artırır, istikrarlı ağırlık konsensüsü ve sürekli eğitim iterasyonu oluşturmanın temel temelidir.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Merkeziyetsizlik eğitimi sırasında sık karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi veri paralelliğine dayanmakta olup, Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta ve yalnızca yerel komşu düğümlere bağımlı olarak model işbirliği eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizması ile bir araya geldiğinde, OpenDiLoCo, tüketici sınıfı GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamakta ve küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmaktadır. Bu, merkeziyetsizlik eğitim ağının temel iletişim altyapılarından biridir.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından merkeziyetsiz AI eğitim ortamı için özel olarak tasarlanmış hafif iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topoloji, gradyan sıkıştırma, düşük hassasiyet senkronizasyonu ve kesintiden kurtarma desteği sunar, tüketici sınıfı GPU'lar ve istikrarsız düğümler üzerinde çalışabilir, OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağlarının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır, gerçekten açık ve güvene ihtiyaç duymayan işbirlikçi eğitim ağının "son bir mil" iletişim altyapısını kurar.
Üç, Prime Intellect Teşvik Ağı ve Rol Dağılımı
Prime Intellect, herhangi birinin görevlere katılmasını ve gerçek katkılara dayanarak ödüller kazanmasını sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı oluşturdu. Protokol, üç ana rol türü temelinde çalışmaktadır:
Sözleşmenin temel süreçleri, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturur.
Dört, INTELLECT-2: İlk doğrulanabilir merkeziyetsiz eğitim modelinin yayınlanması
Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü. Bu, dünyadaki ilk asenkron, güvene dayanmayan Merkeziyetsizlik düğümleri tarafından işbirliği ile eğitilen güçlendirilmiş öğrenme büyük modelidir ve 32B parametre ölçeğine sahiptir. INTELLECT-2 modeli, üç kıtaya yayılmış 100'den fazla GPU heterojen düğüm tarafından işbirliği ile eğitilmiştir. Tamamen asenkron bir mimari kullanarak, eğitim süresi 400 saatten fazladır ve asenkron işbirliği ağının uygulanabilirliği ve istikrarını göstermektedir. Bu model, yalnızca bir performans atılımı değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmasının ilk sistematik uygulanmasıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitim ağının eğitim sürecini ilk kez gerçekleştirdiğini göstermektedir.