Cloud4Y23 мар в 09:43

Как борьба с ИИ стирает историю веба

2 мин

Блог компании Cloud4YИскусственный интеллектЗаконодательство в ITОткрытые данные * Читальный зал

Перевод

Комментарии 6

Вся эта борьба с ветряными мельницами выглядит очень потешно. Не существует варианта в котором твой сайт будет доступен пользователям и не будет нейросетям. Любые попытки помешать обучению моделей обречены на выстрел себе в ногу. Не менее смешно выглядят художники, актеры, копирайтеры и прочие которые выпускают петиции против нейросоетй
К сожалению, это реальность с которой прийдется считаться. Это как петиции против ядерного оружия. Его уже придумали, разпредумать обратно не выйдет. Смиритесь

GorkyUser 23 мар в 10:27

Не существует варианта в котором твой сайт будет доступен пользователям и не будет нейросетям

Как это не существует? При условии, что хозяин нейросети добросовестный субъект, существует по крайней мере два простых способа и кучка более замороченных. Вебмастер сайта может 1) запретить в robots.txt боту нейросети парсить свой сайт. 2) забанить бот нейросети в настройках сервера типа .htaccess.

Не менее смешно выглядят художники, актеры, копирайтеры и прочие которые выпускают петиции против нейросоетей

Это точно. Они выглядят вообще жадными и глупыми.

AdrianoVisoccini 23 мар в 10:31

При условии, что хозяин нейросети добросовестный субъект

Politura 26 мар в 16:51

Во-первых, на одного добросовестного приходится миллион недобросовестных или тех, кто просто не в курсе.
Во-вторых, уже есть боты которые используют обычный браузер и распознают скриншоты сайтов. Что зачастую будет даже дешевле: я года два назад делал перевод странички линкедина влезающего в один экран без скроллинга в маркдаун: сначала построил DOM, которая оказалась какими-то мегабайтами чистого HTML с кучей данных которые в итоге не показываются. Перевод напрямую их в маркдаун был десятки килобайт текста, при этом дофига повторов. Распознать скриншот одного такого экрана будет намного дешевле, чем закидывать всю эту дрянь в какую-нибудь модель.
А 4 года назад собеседовался в Линкедин, 6 раундов на которых меня собеседовали исключительно индусы.

Arhammon 23 мар в 11:20

Даже если суды установят ограничения для обучения ИИ, правовые нормы, регулирующие поиск и веб-архивирование, уже давно сложились и хорошо известны

Теперь вспоминаем кто у нас главный поисковик и кто потенциально главный ИИ?

alekseiib 24 мар в 04:21

Честно, это выглядит странно. Понимаю, что издатели боятся, как ИИ использует их тексты, но закрывать архивы, это как запретить библиотекам хранить газеты. История исчезнет, а с ней и часть нашей памяти. Не кажется, что это перебор?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий