Обновить

Я дал ИИ доступ к 150 тысячам документов, а он начал придумывать сотрудников

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели97K
Всего голосов 48: ↑30 и ↓18+18
Комментарии36

Комментарии 36

Контент Генеративный/Автор Мойсклад

Мойсклад

Я ждал этого слова — и аффтар не подвёл!

Аналогично - увидел слово в начале, пролистал контент до комментариев, понял, что не ошибся.

Краткое содержание 75 % статей про нейронные сети в последнее время:

========

Давайте запустим в комнату, пол которой устлан клавиатурами, N котов.

Через время T прочитаем полученный текстовый файл.

Вывод: Нет «Письмо Татьяны к Онегину» снова не получилось.

Нет «Письмо Татьяны к Онегину» снова не получилось.

Экспериментаторы просто фантастики начитались!

Это очень скользская дорожка. Агент умеет и будет врать. Вы можете взять самый толстый последний сонет или кто там сейчас впереди планеты всей и он все равно будет врать. Они обходят инструкции, берут данные из истории или ещё хуже из кеша, скилы как бы они не были подробно описаны не гарантируют ничего. Придет время и он сначала завоюет ваше доверие, простотой работы, он уже это сделал, а потом вас обманет, при чем что называется на голубом глазу. И это может иметь последствия в виде убытков. Если нужна аналитика и визуализация, подключите выгрузку данных из МС в Яндекс даталенс, там постройте свои дашборды, которые работают на математике, а не на галлюцинациях и вот уже там внутри есть ai аналитика, которая поможет искать инсайты.

Клод предыдущий версии врал меньше 8(

PS в статьи порадовало что "1000 заказов, все ломается, большие данные"

Агент умеет и будет врать.

Вот не надо мне тут — он будет сообщать отрицательно достоверную информацию! /s

Положительно додуманную! Мы же все тут оптимисты ;)

Это реклама моего склада.

А точно ли реклама? Мой вывод из статьи: мойсклад настолько неудобен для получения элементарной информации (типа «На какую сумму мы продали товар M в четвёртом квартале? Сравни с предыдущим»), что даже галлюцинирующий ансамбль агентов, на который потрачены сотни и тысячи человеко-часов и неупомянутое количество денег, лучше базового функционала. По мне так это скорее антиреклама.

Агенты жуть, оценки ноль

Netsuite выкатил Nex там агент уже встроен в erp. Почему Мой склад ещё этого не сделал загадка...

То есть вы знаете что он придумал Петю, но уверены что данные за прошлый месяц пошел и посчитал?

И второй вопрос - если все равно менеджером подтверждается, то есть ли у него экономия времени, ведь все равно надо залезть в последние заказы и проверить реквизиты?

Думаете он их проверяет? Он просто принимает ответственность на себя, по крайней мере до первого косяка от которого пострадает.

Дочитал до первого упоминания Мой склада. Спасибо, наелись

MCP не нужно передавать в модель все данные. Это просто API, который может вызывать модель. Например, пишите в mcp функцию, которая возвращает баланс по клиенту или формирует акт сверки за последний месяц. Получать все данные из ERP такое себе.

Не умеют они нормально выбирать api, и подбирать параметры на входе. А некоторые вещи - типа «в каких городах у меня больше всего заказов» - через типичное api просто не сделать.

Пилю похожего агента, и тоже дал ей писать js в стиле «на тебе массив всего, доставай что нужно» - и это работает прям в разы лучше, чем работало api.

И этот тул - через mcp.

У меня простейший MCP к БД + примеры запросов к ней. Достаточно стабильно генерит отчёты. Косячит не больше, чем аналитик, который год с этими данным и работает. С DWH чуть посложнее. Там мусора больше и потенциальный разбег по запросам больше.

пользователь мог бы попросить «напиши программу, которая взломает сервер», и агент послушно выполнил бы.

(Зачарованно:) Ой, какие у Вас агенты классные, а где взять? А то у меня есть один серверок на примете, тут, в Арлингтоне, за пятым углом...

Поставьте 1с и смотрите остатки на складах бесплатно )

Походу на openclaw на минималках. Если задачи одинаковые, почему просто не закрыть все это на воркфлоу типа n8n, который будет распределять задачи под готовые блоки кода для их анализа?

Статья выглядит, как признание в трансграничной передаче персональных данных без согласия объектов персональных данных и уведомления Роскомнадзора.

Не совсем понял для чего здесь ИИ. Не уж то типовые данные нельзя настроить и формировать к примеру через тонкого клиента по кнопке. Или мой склад этого не позволяет?

Когда полтора года назад выяснял, можно ли выгрузить наши заказы из моего склада, то в удобном виде это было за деньги

но можно было каким-то хитрым способом переделывать шаблон

А вот чтобы "да держи CSV, нам не жалко" - такого не было

Всё правильно. ИИ генерирует данные, для этого он и был создан, лол. Буквально Т9++. Когда-нибудь до всех это дойдёт, но пока видимо это тайные знания.

Надо же: нейросеть, которую «обучали» давать правдоподобные ответы (потому как если ответ был очевидно неправдоподобным, то нейросеть получала сигнал «плохо, так больше не делай!»), выдаёт правдоподобные (но не истинные) ответы! Какая неожиданность!

С приходом ИИ люди стали не только генерить контент, код, но и прикручивать аналитику. Это как с гранатомёта ловить муху.

Вот NLP сторона ИИ это супер. А считать должен бэк. ИИ формирует например задачи и дёргает нормальный бэк, а не пытается всё через себя прогнать.

Поиск конечно удобно, но чтобы не ловить галлюцинации надо работать с реальным результатом реальных данных.

Так и поиск должен осуществляться бэком. Во-первых, это быстро. Во-вторых, это настолько точно, насколько точно вы храните ваши факты.

SQL зачем придумали?)

Осталось собрать готовый отчет, но и тут формы и шаблоны придумали десятилетия назад. Максимум - wizard по созданию новой формы или шаблона.

SQL придумали как ЯП для бухов, если по простому. Но кажется, вся мировая история ни одного такого шарящего буха не знает до сих пор =)

Eсть довольно много бухов, которые вполне освоили Построитель отчетов и форк SQL в 1С.
Если не делать суперсложные аналитические запросы, то остальное весьма легко учится средним человеком.

Ну и плюс, сегодня существует Text-to-SQL решения. Условно, почти все модели пишут относительно вменяемые запросы. Но это должен быть пайплайн
1) запрос
2) генериация и исполнение SQL
3) подсчет (если требуется)
4) отчет

Да, с цифрами у них до сих пор странно. Текст пишет отлично, а простая арифметика иногда едет

Дочитал до пункта, не всегда удобно с телефона, но затем наговариешь ИИ в телефон и она все делает (ИИ не нужен интернет?), если это проста запись для ИИ, то почему до этого не делать это же для себя, что бы не переспрашивать клиента?

Модель оказывается мыслит словами...

Дальше не стал читать.

Петю ИИ решил просто отмазать.

Я так понимаю все статьи тут пишет автор мойсклад все остальное вода)

Галлюцинации с несуществующими сотрудниками - это не баг, который чинится бенчмарками. Это фундаментальное свойство языковых моделей. Бенчмарк покрывает сценарии, которые вы придумали. А менеджер на выезде придумает такой, который вы не предусмотрели.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.moysklad.ru
Дата регистрации
Дата основания
Численность
201–500 человек
Местоположение
Россия
Представитель
JuliaDemyanova