Удивительно недорогие модели ИИ Deepseek бросают вызов гигантам отрасли. Несмотря на претензии на стоимость обучения всего 6 миллионов долларов для Deepseek V3, более пристальный взгляд показывает гораздо более существенные инвестиции.
Самостояние Deepseek: «Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас», подчеркивает его амбиции. Этот ИИ значительно повлиял на рынок, в частности, вызывая значительное падение запасов NVIDIA.
Изображение: Ensigame.com
Инновационная архитектура DeepSeek V3 является ключом к ее производительности:
- Multi-Token Prediction (MTP): предсказывает несколько слов одновременно, повышая точность и скорость.
- Смесь экспертов (MOE): использует 256 нейронных сетей, активируя восемь для каждого токена, ускоряя обучение и повышение производительности.
- Многополосное скрытое внимание (MLA): Повторно извлекает ключевые детали, минимизируя потерю информации и улучшая понимание нюансов.
Изображение: Ensigame.com
Тем не менее, полуанализа выявил обширную инфраструктуру Deepseek: приблизительно 50 000 графических процессоров Nvidia Hopper (включая H800, H100 и H20), распространяющиеся по нескольким центрам обработки данных. Общие инвестиции в сервер оцениваются в 1,6 млрд. Долл. США, при этом эксплуатационные расходы достигают 944 млн. Долл. США.
Deepseek, дочерняя компания High-Flyer, владеет своими центрами обработки данных, предлагая контроль и более быструю реализацию инноваций. Его самофинансируемый статус повышает гибкость. Высокие зарплаты (более 1,3 миллиона долларов в год для некоторых исследователей) привлекают лучших китайских талантов.
Изображение: Ensigame.com
Заявление о затратах на обучение в размере 6 миллионов долларов вводит в заблуждение, представляющее только предварительное использование графического процессора, исключая исследования, уточнение, обработку данных и инфраструктуру. Общее количество инвестиций в AI DeepSeek превышает 500 миллионов долларов. Его бережливая структура облегчает эффективные инновации.
Изображение: Ensigame.com
Успех DeepSeek демонстрирует потенциал хорошо финансируемой независимой компании по искусству. Тем не менее, его «бюджетный» повествование преувеличено; Миллиарды инвестиций, технологических достижений и сильной команды являются важными факторами. Несмотря на это, затраты DeepSeek по -прежнему значительно подрывают конкурентов (например, 5 миллионов долларов за R1 против 100 миллионов долларов за CHATGPT4O).