أطلقت NVIDIA و OpenAI أسرع نماذج التفكير المفتوح

robot
إنشاء الملخص قيد التقدم

أصدرت NVIDIA و OpenAI للتو نموذجين جديدين من نماذج التفكير ذات الوزن المفتوح، gpt-oss-120b و gpt-oss-20b. يمكن للنموذج 120b معالجة 1.5 مليون توكن في الثانية على نظام NVIDIA GB200 NVL72 واحد. وقد أصبح ذلك ممكنًا بفضل مزيج من بنية Blackwell الخاصة بـ NVIDIA و تنسيق جديد بدقة 4 بت يسمى NVFP4. يساعد هذا التنسيق في تحقيق توازن بين الدقة والكفاءة.

ما الذي يمد النماذج بالطاقة

ما يساعد هذه النماذج على العمل بكفاءة هو مزيج من الأجهزة الجديدة والبرامج الذكية. تم تدريبها على وحدات معالجة الرسومات H100 القوية من NVIDIA وهي مصممة للعمل بسلاسة عبر مجموعة واسعة من الأجهزة. يمكنك استخدامها من أنظمة السحابة الكبيرة إلى أجهزة الكمبيوتر المكتبية العادية المزودة ببطاقات NVIDIA RTX. إذا كنت تستخدم بالفعل CUDA، فمن المحتمل أن تتمكن من تشغيل هذه النماذج دون الكثير من العمل الإضافي.

كلا النموذجين معبأين أيضًا كما تسميه NVIDIA "خدمات الميكرو للتفسير". وهذا يجعل النماذج أسرع وأسهل نسبيًا. لا تحتاج إلى بناء كل شيء من الصفر. وإذا كنت تستخدم بالفعل أدوات الذكاء الاصطناعي الشهيرة مثل Hugging Face أو Llama.cpp، فستتوافق هذه النماذج بسهولة.

تلعب أجهزة Blackwell الأحدث من NVIDIA دورًا كبيرًا هنا أيضًا. تحتوي على ميزة تسمى NVFP4، والتي تساعد النماذج على العمل بشكل أسرع وأكثر كفاءة من خلال استخدام أرقام ذات دقة أقل دون فقدان الدقة. قد يبدو ذلك تقنيًا، لكن النتيجة بسيطة جدًا. ستؤدي إلى ذكاء اصطناعي أسرع يستخدم طاقة وذاكرة أقل. بالنسبة للشركات، يمكن أن يعني ذلك تكاليف أقل.

هناك أيضًا علاقة طويلة الأمد بين NVIDIA وOpenAI ساعدت في جعل هذا ممكنًا. تعود هذه العلاقة إلى الوقت الذي سلم فيه جينسن هوانغ أول DGX-1 شخصيًا. ما يحدث الآن مع سلسلة gpt-oss يبدو وكأنه الخطوة المنطقية التالية في تلك التعاون. ومع ذلك، ستتطلب تلك الإنتاجات أوامر من حيث القوة الحاسوبية، والتشطيب، والاستعداد التشغيلي. يعمل كل من الأجهزة والبرامج والخدمات معًا، وهو أمر نادر رؤيته على هذا المستوى.

مفتوح للجميع للبناء

أحد أهم الأشياء المتعلقة بهذا الإصدار هو أن النماذج مفتوحة. وهذا يعني أن أي شخص من الشركات الناشئة والجامعات يمكنه العمل عليها أيضًا. يمكنهم البناء عليها، وتخصيصها، واستخدامها في أنظمتهم. تمتلك OpenAI الآن أكثر من 4 ملايين مطور على مر العصور يعملون على منصتها. بينما تمتلك NVIDIA من جانبها أكثر من 6.5 مليون مطور يستخدمون أدواتها البرمجية. لقد كانوا يعملون معًا لمدة تقارب العقد، ونطاق العمل ضخم. هناك مئات الملايين من وحدات معالجة الرسوميات (GPUs) في جميع أنحاء العالم تعمل على منصة NVIDIA CUDA. عندما يتم إصدار تقنية مثل هذه في نظام بيئي كبير ومتقدم، فإن الاعتماد يميل إلى التحرك بسرعة. وهذه هي النقطة التي تبدأ فيها الأمور في الشعور بأقل من كونها إطلاقًا وأكثر كتحول.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت