Обновить

Комментарии 32

спасибо дипсику что могу пользоваться чатом GPT за 7usd в месяц.

Не умаляя заслуг китайских ученых. Но хочется задать вопрос. Дипсик (у него есть более забавное народное название) успешен не потому ли, что он "догоняющий" и может учитывать пройденный путь других (тех, кто его опережает) моделей и разработчиков?

Так и есть, но поскольку китайцы были ограничены в ресурсах, именно они придумали новую модель, которая показала сравнимую эффективность.

Это не совсем "догонялки", как раньше было в технологиях. Китайцы вот этим шагом уже опередили openai, чисто по ресурсам. Конечно, про 6 млн это они тоже кривят душой - подготовка датасетов, электроэнергия и стоимость всего кластера тут не включена. Но в чем не соврали - это то, что моделька действительно крутая, и выложили в открытый доступ. Пофиг, что железо у большинства не тащит 100 токенов в секунду, через mmap оно запускается даже на CPU с 0.05 токенов в секунду, главное результат выдает тот же по итогу. Это можно проверить на компе стоимостью не в миллион баксов, а копеешном. Если что - я проверял, это действительно так. А тут и на хабре минимум два поста было от чуваков, имеющими 1 терабайт озу, тоже проверяли.

Тут видится классическая идея "голодного художника". Нет ресурсов - оптимизируй\переделай архитектуру. У китайцев таких ресурсов нет (не было на тот момент), а мозги таки были. Ну и вырастили себе OpenAI конкурентов, молодцы, чо. Без сарказма. А без конкуренции цены могут только расти. Нам же лучше.

Нам однозначно лучше

Конечно, про 6 млн это они тоже кривят душой

Это не они кривят душой, а либо в оригинале наврали, либо переводчик наврал. Проверить не проверишь, т.к. ссылка на якобы оригинал указывает на какую-то другую статью.

Разработчики ДипСик в своем отчете указали, что 6 млн стоило только дообучение не-размышляющей DeepSeek v3 до размышляющей DeepSeek R1. Сколько стоило обучить с нуля DeepSeek v3 в отчете нет.

Он успешен потому, что для его использования не требуется ничего, скачать можно легко из маркета, впн для использования не нужен, платить не надо сложностей с аккаунтом нет

так причем тут "использование" и ВПН в частности

речь шла про успешность модели с точки зрения ее достижений
"Модель R1 показала результаты на уровне OpenAI o1 в задачах многошагового рассуждения "

а вообще есть и платная (или даже платные) варианты дипсика

диксак

Обычно, считается что чем больше вложений, тем больше у технологий перспектив, а в мире где каждый год решение может превратиться в тыкву без вложений. И показатель что вложений немного, скорее настораживает, а не воодушевляет.

И не стоит забывать что это копирование существующей технологии. Да, удачи в копировании и удешевлении иногда получаются успешными. К примеру Segway <=> Ninebot (Причём Ninebot'у в итоге пришлось продаться Xiaomi иначе такой иск от Segway'я им было не потянуть).

Это не копирование, а развитие. DeepSeek предложил достаточно солидный список улучшений и новых наработок (и не спрятал их за пейвол или коммерческую тайну), которые сейчас уже себе растащили все крупные игроки и благодаря которым как раз таки и просели цены на API (а не благодаря конкуренции с китаем).

С таким же успехом можно сказать, что ChatGPT это копирование существующей технологии гугла. Подумаешь, пару новшеств добавили и на больших данных обучили...

Релиз GPT-5 не произвёл эффекта GPT-4

не соглашусь. как ежедневный пользователь чатагпт вижу разительные изменения в качестве ответов, особенно в гуманитарной сфере.

Когда вышел GPT-4 он был сильно мощнее предыдущей версии. Т.е там за год-два был коллосальный прирост качества ответов. GPT-5 почти не дал никакого буста в сравнении с прошлой версией. Напомню, что после GPT-4 был GPT-4o, GPT-o1, GPT-4.5, GPT-o3 - и на каждой итерации нам лили в уши, что это прорыв.
Конечно GPT-5 лучше, чем GPT-4, с этим никто и не спорит. А вот с предшественником не так все однозначно)

Руководствуясь опытом скажу что хоть GPT- 4 был прорывом (как по мне по причине низкой базы 3.5) , но он не был полноценно юзабельным в реальной практике. (я эпоху GPT-4 пересидел в Grok) А вот теперь без 5.2 не могу и дня прожить чтобы его не использовать и в работе и в личных запросах. Знакомая сегодня очень удивилась когда увидела как один и тот же промпт на моем GPT-5 и ее Deepsek выдал совершенно разный по качеству ответ, не в пользу последнего.

Ого, актуалочка подъехала.

АктуалОчка

Только вот DeepSeek сейчас выдаёт гораздо более посредственные ответы, чем актуальные версии ChatGPT или Claude. Попробуйте не энциклопедические знания у него спрашивать, а реальные задачи типа рефакторинга крупной кодовой базы.

Снижение стоимости обучения не значит, что теперь все за 6 миллионов будут учить, а значит, что будут учить по прежнему на миллиарды, но чаще выпускать версии, использовать больше обучающих данных и т д

Для Deepseek потому что ждите v4. У гопоты и клода с тех пор уже кучу новых версий вышло.

Для кодовой базы за условно смешные деньги есть Minimax M2.1, и за еще более смешные (почти бесплатно) GLM-4.7, которые конечно не уровня Opus, но кодовая база проблем у них не вызывает.

Если новая версия дапсика сократит обучение ещё на 30 будет интересно посмотреть на лицо Джейсона Куртки

Есть мнение(не моё) что разработчики дипсика скомуниздили обучающую выборку, смогли бы они достичь такого же результата с нуля за те же $6млн ?

НЛО прилетело и опубликовало эту надпись здесь

Обучение на синтетике != "стырили датасет". Клод тоже сперва говорил что он ГПТ, большая часть моделей сейчас через раз считаем себя гемини и т.д ибо пол интернета этим уже зас*ано.

У китайцев огромный корпус китайских датасетов в довесок, из-за чего их модели пишут тексты прям заметно иначе (не всегда лучше, но - иначе)

Подумаешь, что ChatGPT использовался для генерации данных для обучения DeepSeek. Об этом мы тактично умолчим.

Почему ЧатЖПТ не использует ЧатЖПТ для обучения? Или все же использует, тогда весь смысл поста куда-то теряется?

если честно, источники так себе. Вполне могу поверить, что кожаная куртка с альтманом в слезах бросились публиковать страшную правду о которой невозможно молчать через третьи руки))

Или китайские братушки захотели по дешёвке скупить акции NVIDIA. Конспирология работает в обе стороны

Конспирология

больше похоже, что желтушные СМИ этим занимаются)

Как в старом анекдоте.
- Доктор, DeepSeek всем говорит, что обучился за $6 млн. Что мне делать?
- Голубчик, и вы можете говорить всем то же самое про себя.

Это мнение можно будет считать объективным только если Дипсик добьется превосходства первым, а не будет идти по пятам уже имеющихся технологий! Китай страна-копия, не стоит забывать.

Если это дешевле ( да хоть в 40 раз ) но, это для кого то а ,не для меня.. То, мне на это пуфик ) .. просто как версия мнения)

... Интересно, когда в Китае будут уже объявлять празник-выходной или ежегодный национальный праздник, приуроченный к выходу новой победной версии DeepSeek )?

Ну, или хотя бы закатить бал в честь
ИИ )
Да, здравствует ИИ бал )

Ну тогда ЗАкрытый ИИ БАЛ. Чтобы хоть что о у них было не опен сурс )

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.cloud4y.ru
Дата регистрации
Дата основания
2009
Численность
51–100 человек
Местоположение
Россия