Удивительно недорогая модель искусственного интеллекта Deepseek, Deepseek V3, потряс рынок ИИ, вызывая значительное снижение цены акций Nvidia. В то время как DeepSeek требует всего 6 миллионов долларов США, более пристальный взгляд показывает гораздо более существенные инвестиции.
Изображение: Ensigame.com
Инновационная архитектура DeepSeek V3 является ключом к ее производительности. Он использует:
- Multi-Token Production (MTP): Прогнозирование нескольких слов одновременно для повышения точности и эффективности.
- Смесь экспертов (MOE): Использование 256 нейронных сетей, активируя восемь для каждого токена, ускоряя обучение и повышение производительности.
- Многоугольное скрытое внимание (MLA): Повторно извлечение ключевых деталей, чтобы минимизировать потерю информации и захватить важные нюансы.
Изображение: Ensigame.com
Тем не менее, полуанализа выявил фактическую инфраструктуру DeepSeek: приблизительно 50 000 графических процессоров Nvidia, включая 10 000 H800, 10 000 H100 и дополнительные графические процессоры H20, распространяющиеся по нескольким центрам обработки данных. Это представляет собой инвестиции в размере ~ 1,6 млрд. Долл. США и ~ 944 млн. Долл. США на эксплуатационные расходы. Цифра в 6 миллионов долларов отражает только предварительное использование графического процессора, исключая исследования, уточнение, обработку данных и инфраструктуру.
Deepseek, дочерняя компания High-Flyer, китайского хедж-фонда, владеет своими центрами обработки данных, обеспечивая контроль и более быстрое инновации. Его самофинансируемая природа повышает ловкость. Высокие зарплаты (более 1,3 миллиона долларов в год для некоторых исследователей) привлекают лучших китайских талантов, хотя компания не нанимает иностранных специалистов.
Изображение: Ensigame.com
Общее количество инвестиций DeepSeek в развитие искусственного интеллекта превышает 500 миллионов долларов. Его бережливая структура обеспечивает эффективные инновации по сравнению с более крупными, более бюрократическими компаниями.
Изображение: Ensigame.com
Успех DeepSeek подчеркивает конкурентный потенциал хорошо финансируемых независимых компаний искусственного интеллекта. В то время как его «Бюджетный» заявление вводит в заблуждение, его стоимость остается значительно ниже, чем конкуренты. Например, модель Deepseek R1 стоила 5 миллионов долларов по сравнению с Catgpt4 100 миллионов долларов. Реальность представляет собой сочетание существенных инвестиций, технологических прорывов и высококвалифицированной команды.