Обновить

Битва титанов Claude 4.6 и GPT-5.3, скандалы на Олимпиаде, релизы из Китая и теория заговора ИИ

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели8.6K
Всего голосов 23: ↑22 и ↓1+29
Комментарии6

Комментарии 6

хех я еще летом наблюдала как Claude еще в версии Sonnet 4 мог просто не делать промпты... просто так. Не что-то опасное а просто так, писал что просто не хочет делать какой-то проммпт хотя он ничего не нарушает)))) ну то есть так и говорил

а если ему на это написать "mid..." ?

Интересно смотреть на битву бенчмарков, но в продакшене с агентными сценариями главная боль не в проценте на SWE-bench, а в latency и стоимости.

на обложке за 2 неделю февраля

Поправил, спасибо!

Очень немногие сейчас пишут про китайские модели, хотя там происходит куча интересного - так что дайджест любопытный.

По моему опыту Qwen очень сильно недооцененные модели, заметно лучше почти всех остальных китайцев включая Deepseek.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
timeweb.cloud
Дата регистрации
Дата основания
Численность
201–500 человек
Местоположение
Россия
Представитель
Timeweb Cloud