Обчислювальна потужність стає новою моделлю послуг, гарячий тренд "перетворення" великих моделей може охолонути
Навчання великих моделей вимагає значної обчислювальної потужності, що робить обчислювальну потужність новою бізнес-моделлю. Проте, наразі галузь стикається з викликами, такими як дефіцит висококласних GPU та високі витрати. Зі зростанням раціональності на ринку, захоплення «переплавкою» великих моделей може поступово охолонути, і постачальникам обчислювальної потужності потрібно заздалегідь підготуватися та вчасно перейти на нові моделі.
Випускник Ціньхуа університету Бі Кайфенг тренував великий метеорологічний модель Панг, використовуючи 200 графічних процесорів (GPU) протягом двох місяців попереднього навчання. При ціні 7,8 юанів за годину за один GPU, лише витрати на навчання можуть перевищити 2 мільйони юанів. А витрати на навчання універсальної великої моделі можуть зрости в сотні разів.
Зараз у Китаї вже є понад 100 великих моделей з 10 мільярдами параметрів. Але висококласні графічні процесори (GPU) не вистачає, ціна на один графічний процесор Nvidia A100 колись піднімалася до 200-300 тисяч юанів, а місячна оренда одного сервера A100 досягала 50-70 тисяч юанів. Навіть так, все ще є підприємства, які стикаються з проблемами невиконання зобов'язань постачальниками.
В галузі загальноприйнято вважати, що без підтримки на десятки мільярдів коштів важко продовжувати розробку великих моделей. Зі зростанням раціональності ринку компанії також відповідно коригуватимуть стратегії та контроль витрат.
Перед обличчям дефіциту обчислювальної потужності підприємства вжили різних заходів для реагування:
Використання якісних даних для підвищення ефективності навчання
Підвищення стабільності інфраструктури, досягнення стабільної роботи на рівні тисячі калорій протягом тривалого часу
Оптимізація обчислювальної потужності, підвищення використання
Перехід від архітектури хмарних обчислень до архітектури надпотужних обчислень
Використання вітчизняних платформ замість GPU від Nvidia
Обчислювальна потужність вже розвинулася в нову модель послуг. Послуги з обчислювальної потужності включають загальну обчислювальну потужність, інтелектуальну обчислювальну потужність та суперобчислювальну потужність, які надаються користувачам через API та інші способи. Вгорі виробничого ланцюга постачаються базові ресурси, в середньому - відповідають за виробництво та управління обчислювальною потужністю, а внизу - це галузеві користувачі.
Наразі послуги обчислювальної потужності в основному використовують дві моделі: оплату за використання та підписку на рік або місяць. У майбутньому також буде сприяти "інтеграції обчислювальної мережі", щоб забезпечити гнучкий розподіл між архітектурами, регіонами та постачальниками послуг.
З огляду на нормалізацію попиту на великі моделі, обчислювальна потужність швидко формує унікальну промислову ланцюг та бізнес-модель. Незважаючи на те, що в даний час спостерігається дефіцит висококласних GPU, у довгостроковій перспективі попит і пропозиція зрештою зрівняються. Постачальники обчислювальної потужності повинні своєчасно коригувати стратегії, щоб підготуватися до змін на ринку.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
15 лайків
Нагородити
15
4
Поділіться
Прокоментувати
0/400
GhostAddressMiner
· 08-05 00:11
Ти запускаєш мільярдну модель за 200 тис., тс-тс, за цим кроком безумовно стоїть підтримка капіталу.
Обчислювальна потужність сервісів нових типів зростає, а хвиля великих моделей може зменшитись.
Обчислювальна потужність стає новою моделлю послуг, гарячий тренд "перетворення" великих моделей може охолонути
Навчання великих моделей вимагає значної обчислювальної потужності, що робить обчислювальну потужність новою бізнес-моделлю. Проте, наразі галузь стикається з викликами, такими як дефіцит висококласних GPU та високі витрати. Зі зростанням раціональності на ринку, захоплення «переплавкою» великих моделей може поступово охолонути, і постачальникам обчислювальної потужності потрібно заздалегідь підготуватися та вчасно перейти на нові моделі.
Випускник Ціньхуа університету Бі Кайфенг тренував великий метеорологічний модель Панг, використовуючи 200 графічних процесорів (GPU) протягом двох місяців попереднього навчання. При ціні 7,8 юанів за годину за один GPU, лише витрати на навчання можуть перевищити 2 мільйони юанів. А витрати на навчання універсальної великої моделі можуть зрости в сотні разів.
Зараз у Китаї вже є понад 100 великих моделей з 10 мільярдами параметрів. Але висококласні графічні процесори (GPU) не вистачає, ціна на один графічний процесор Nvidia A100 колись піднімалася до 200-300 тисяч юанів, а місячна оренда одного сервера A100 досягала 50-70 тисяч юанів. Навіть так, все ще є підприємства, які стикаються з проблемами невиконання зобов'язань постачальниками.
В галузі загальноприйнято вважати, що без підтримки на десятки мільярдів коштів важко продовжувати розробку великих моделей. Зі зростанням раціональності ринку компанії також відповідно коригуватимуть стратегії та контроль витрат.
Перед обличчям дефіциту обчислювальної потужності підприємства вжили різних заходів для реагування:
Обчислювальна потужність вже розвинулася в нову модель послуг. Послуги з обчислювальної потужності включають загальну обчислювальну потужність, інтелектуальну обчислювальну потужність та суперобчислювальну потужність, які надаються користувачам через API та інші способи. Вгорі виробничого ланцюга постачаються базові ресурси, в середньому - відповідають за виробництво та управління обчислювальною потужністю, а внизу - це галузеві користувачі.
Наразі послуги обчислювальної потужності в основному використовують дві моделі: оплату за використання та підписку на рік або місяць. У майбутньому також буде сприяти "інтеграції обчислювальної мережі", щоб забезпечити гнучкий розподіл між архітектурами, регіонами та постачальниками послуг.
З огляду на нормалізацію попиту на великі моделі, обчислювальна потужність швидко формує унікальну промислову ланцюг та бізнес-модель. Незважаючи на те, що в даний час спостерігається дефіцит висококласних GPU, у довгостроковій перспективі попит і пропозиція зрештою зрівняються. Постачальники обчислювальної потужності повинні своєчасно коригувати стратегії, щоб підготуватися до змін на ринку.