Комментарии 6
Вся эта борьба с ветряными мельницами выглядит очень потешно. Не существует варианта в котором твой сайт будет доступен пользователям и не будет нейросетям. Любые попытки помешать обучению моделей обречены на выстрел себе в ногу. Не менее смешно выглядят художники, актеры, копирайтеры и прочие которые выпускают петиции против нейросоетй
К сожалению, это реальность с которой прийдется считаться. Это как петиции против ядерного оружия. Его уже придумали, разпредумать обратно не выйдет. Смиритесь
Не существует варианта в котором твой сайт будет доступен пользователям и не будет нейросетям
Как это не существует? При условии, что хозяин нейросети добросовестный субъект, существует по крайней мере два простых способа и кучка более замороченных. Вебмастер сайта может 1) запретить в robots.txt боту нейросети парсить свой сайт. 2) забанить бот нейросети в настройках сервера типа .htaccess.
Не менее смешно выглядят художники, актеры, копирайтеры и прочие которые выпускают петиции против нейросоетей
Это точно. Они выглядят вообще жадными и глупыми.
При условии, что хозяин нейросети добросовестный субъект

Во-первых, на одного добросовестного приходится миллион недобросовестных или тех, кто просто не в курсе.
Во-вторых, уже есть боты которые используют обычный браузер и распознают скриншоты сайтов. Что зачастую будет даже дешевле: я года два назад делал перевод странички линкедина влезающего в один экран без скроллинга в маркдаун: сначала построил DOM, которая оказалась какими-то мегабайтами чистого HTML с кучей данных которые в итоге не показываются. Перевод напрямую их в маркдаун был десятки килобайт текста, при этом дофига повторов. Распознать скриншот одного такого экрана будет намного дешевле, чем закидывать всю эту дрянь в какую-нибудь модель.
А 4 года назад собеседовался в Линкедин, 6 раундов на которых меня собеседовали исключительно индусы.
Даже если суды установят ограничения для обучения ИИ, правовые нормы, регулирующие поиск и веб-архивирование, уже давно сложились и хорошо известны
Теперь вспоминаем кто у нас главный поисковик и кто потенциально главный ИИ?
Честно, это выглядит странно. Понимаю, что издатели боятся, как ИИ использует их тексты, но закрывать архивы, это как запретить библиотекам хранить газеты. История исчезнет, а с ней и часть нашей памяти. Не кажется, что это перебор?
Как борьба с ИИ стирает историю веба