Cloud4Y27 янв в 13:05

В 30 раз дешевле: DeepSeek и конец эпохи дорогого AI

4 мин

27K

Блог компании Cloud4YФинансы в ITИскусственный интеллектIT-компанииIT-инфраструктура *

Перевод

Комментарии 32

MrCina32 27 янв в 13:20

спасибо дипсику что могу пользоваться чатом GPT за 7usd в месяц.

vtal007 27 янв в 13:41

Не умаляя заслуг китайских ученых. Но хочется задать вопрос. Дипсик (у него есть более забавное народное название) успешен не потому ли, что он "догоняющий" и может учитывать пройденный путь других (тех, кто его опережает) моделей и разработчиков?

Moog_Prodigy 27 янв в 15:07

Так и есть, но поскольку китайцы были ограничены в ресурсах, именно они придумали новую модель, которая показала сравнимую эффективность.

Это не совсем "догонялки", как раньше было в технологиях. Китайцы вот этим шагом уже опередили openai, чисто по ресурсам. Конечно, про 6 млн это они тоже кривят душой - подготовка датасетов, электроэнергия и стоимость всего кластера тут не включена. Но в чем не соврали - это то, что моделька действительно крутая, и выложили в открытый доступ. Пофиг, что железо у большинства не тащит 100 токенов в секунду, через mmap оно запускается даже на CPU с 0.05 токенов в секунду, главное результат выдает тот же по итогу. Это можно проверить на компе стоимостью не в миллион баксов, а копеешном. Если что - я проверял, это действительно так. А тут и на хабре минимум два поста было от чуваков, имеющими 1 терабайт озу, тоже проверяли.

Тут видится классическая идея "голодного художника". Нет ресурсов - оптимизируй\переделай архитектуру. У китайцев таких ресурсов нет (не было на тот момент), а мозги таки были. Ну и вырастили себе OpenAI конкурентов, молодцы, чо. Без сарказма. А без конкуренции цены могут только расти. Нам же лучше.

vtal007 27 янв в 15:09

Нам однозначно лучше

Politura 27 янв в 15:47

Конечно, про 6 млн это они тоже кривят душой

Это не они кривят душой, а либо в оригинале наврали, либо переводчик наврал. Проверить не проверишь, т.к. ссылка на якобы оригинал указывает на какую-то другую статью.

Разработчики ДипСик в своем отчете указали, что 6 млн стоило только дообучение не-размышляющей DeepSeek v3 до размышляющей DeepSeek R1. Сколько стоило обучить с нуля DeepSeek v3 в отчете нет.

min8 28 янв в 11:40

Он успешен потому, что для его использования не требуется ничего, скачать можно легко из маркета, впн для использования не нужен, платить не надо сложностей с аккаунтом нет

vtal007 28 янв в 12:52

так причем тут "использование" и ВПН в частности

речь шла про успешность модели с точки зрения ее достижений
"Модель R1 показала результаты на уровне OpenAI o1 в задачах многошагового рассуждения "

а вообще есть и платная (или даже платные) варианты дипсика

K1LL3RPUNCH 28 янв в 12:11

диксак

ZetaTetra 27 янв в 13:45

Обычно, считается что чем больше вложений, тем больше у технологий перспектив, а в мире где каждый год решение может превратиться в тыкву без вложений. И показатель что вложений немного, скорее настораживает, а не воодушевляет.

И не стоит забывать что это копирование существующей технологии. Да, удачи в копировании и удешевлении иногда получаются успешными. К примеру Segway <=> Ninebot (Причём Ninebot'у в итоге пришлось продаться Xiaomi иначе такой иск от Segway'я им было не потянуть).

logran 29 янв в 05:05

Это не копирование, а развитие. DeepSeek предложил достаточно солидный список улучшений и новых наработок (и не спрятал их за пейвол или коммерческую тайну), которые сейчас уже себе растащили все крупные игроки и благодаря которым как раз таки и просели цены на API (а не благодаря конкуренции с китаем).

С таким же успехом можно сказать, что ChatGPT это копирование существующей технологии гугла. Подумаешь, пару новшеств добавили и на больших данных обучили...

MrCina32 27 янв в 14:33

Релиз GPT-5 не произвёл эффекта GPT-4

не соглашусь. как ежедневный пользователь чатагпт вижу разительные изменения в качестве ответов, особенно в гуманитарной сфере.

Okeu 29 янв в 10:00

Когда вышел GPT-4 он был сильно мощнее предыдущей версии. Т.е там за год-два был коллосальный прирост качества ответов. GPT-5 почти не дал никакого буста в сравнении с прошлой версией. Напомню, что после GPT-4 был GPT-4o, GPT-o1, GPT-4.5, GPT-o3 - и на каждой итерации нам лили в уши, что это прорыв.
Конечно GPT-5 лучше, чем GPT-4, с этим никто и не спорит. А вот с предшественником не так все однозначно)

MrCina32 29 янв в 19:16

Руководствуясь опытом скажу что хоть GPT- 4 был прорывом (как по мне по причине низкой базы 3.5) , но он не был полноценно юзабельным в реальной практике. (я эпоху GPT-4 пересидел в Grok) А вот теперь без 5.2 не могу и дня прожить чтобы его не использовать и в работе и в личных запросах. Знакомая сегодня очень удивилась когда увидела как один и тот же промпт на моем GPT-5 и ее Deepsek выдал совершенно разный по качеству ответ, не в пользу последнего.

sidorovkv 27 янв в 19:20

Ого, актуалочка подъехала.

K1LL3RPUNCH 28 янв в 12:15

АктуалОчка

KivApple 27 янв в 20:45

Только вот DeepSeek сейчас выдаёт гораздо более посредственные ответы, чем актуальные версии ChatGPT или Claude. Попробуйте не энциклопедические знания у него спрашивать, а реальные задачи типа рефакторинга крупной кодовой базы.

Снижение стоимости обучения не значит, что теперь все за 6 миллионов будут учить, а значит, что будут учить по прежнему на миллиарды, но чаще выпускать версии, использовать больше обучающих данных и т д

logran 29 янв в 05:07

Для Deepseek потому что ждите v4. У гопоты и клода с тех пор уже кучу новых версий вышло.

Для кодовой базы за условно смешные деньги есть Minimax M2.1, и за еще более смешные (почти бесплатно) GLM-4.7, которые конечно не уровня Opus, но кодовая база проблем у них не вызывает.

deepmind7 27 янв в 21:44

Если новая версия дапсика сократит обучение ещё на 30 будет интересно посмотреть на лицо Джейсона Куртки

anonym0use 27 янв в 22:25

Есть мнение(не моё) что разработчики дипсика скомуниздили обучающую выборку, смогли бы они достичь такого же результата с нуля за те же $6млн ?

НЛО прилетело и опубликовало эту надпись здесь

logran 29 янв в 05:09

Обучение на синтетике != "стырили датасет". Клод тоже сперва говорил что он ГПТ, большая часть моделей сейчас через раз считаем себя гемини и т.д ибо пол интернета этим уже зас*ано.

У китайцев огромный корпус китайских датасетов в довесок, из-за чего их модели пишут тексты прям заметно иначе (не всегда лучше, но - иначе)

remindscope 28 янв в 01:04

Подумаешь, что ChatGPT использовался для генерации данных для обучения DeepSeek. Об этом мы тактично умолчим.

hremlin 28 янв в 04:25

Почему ЧатЖПТ не использует ЧатЖПТ для обучения? Или все же использует, тогда весь смысл поста куда-то теряется?

beswalod 28 янв в 06:45

Ну, есть мнение, что ребята из DeepSeek немного приукрашивают:

Okeu 29 янв в 10:03

если честно, источники так себе. Вполне могу поверить, что кожаная куртка с альтманом в слезах бросились публиковать страшную правду о которой невозможно молчать через третьи руки))

beswalod 29 янв в 12:30

Или китайские братушки захотели по дешёвке скупить акции NVIDIA. Конспирология работает в обе стороны

Okeu 29 янв в 13:35

Конспирология

больше похоже, что желтушные СМИ этим занимаются)

bow 28 янв в 09:32

Как в старом анекдоте.
- Доктор, DeepSeek всем говорит, что обучился за $6 млн. Что мне делать?
- Голубчик, и вы можете говорить всем то же самое про себя.

Grogcm20 28 янв в 12:53

Это мнение можно будет считать объективным только если Дипсик добьется превосходства первым, а не будет идти по пятам уже имеющихся технологий! Китай страна-копия, не стоит забывать.

Uglevod 28 янв в 13:12

Если это дешевле ( да хоть в 40 раз ) но, это для кого то а ,не для меня.. То, мне на это пуфик ) .. просто как версия мнения)

... Интересно, когда в Китае будут уже объявлять празник-выходной или ежегодный национальный праздник, приуроченный к выходу новой победной версии DeepSeek )?

Uglevod 29 янв в 12:47

Ну, или хотя бы закатить бал в честь
ИИ )
Да, здравствует ИИ бал )

L1stiks 31 янв в 19:23

Ну тогда ЗАкрытый ИИ БАЛ. Чтобы хоть что о у них было не опен сурс )

Зарегистрируйтесь на Хабре, чтобы оставить комментарий