Комментарии 6
хех я еще летом наблюдала как Claude еще в версии Sonnet 4 мог просто не делать промпты... просто так. Не что-то опасное а просто так, писал что просто не хочет делать какой-то проммпт хотя он ничего не нарушает)))) ну то есть так и говорил
Интересно смотреть на битву бенчмарков, но в продакшене с агентными сценариями главная боль не в проценте на SWE-bench, а в latency и стоимости.
на обложке за 2 неделю февраля
Очень немногие сейчас пишут про китайские модели, хотя там происходит куча интересного - так что дайджест любопытный.
По моему опыту Qwen очень сильно недооцененные модели, заметно лучше почти всех остальных китайцев включая Deepseek.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Информация
- Сайт
- timeweb.cloud
- Дата регистрации
- Дата основания
- Численность
- 201–500 человек
- Местоположение
- Россия
- Представитель
- Timeweb Cloud
Битва титанов Claude 4.6 и GPT-5.3, скандалы на Олимпиаде, релизы из Китая и теория заговора ИИ