Обновить
128K+

Открытые данные *

Данные будут свободны!

11,67
Рейтинг
Сначала показывать
Порог рейтинга

Открытая дискуссия: «Стратегия AI-трансформации: от исследования к реальным бизнес-решениям»

Время на прочтение1 мин
Охват и читатели4.2K

Эксперты red_mad_robot и СКОЛКОВО проведут открытую онлайн-дискуссию о состоянии и перспективах российского рынка GenAI.

В центре обсуждения — совместное исследование — Карта рынка GenAI, и практические вопросы, с которыми сталкивается бизнес при работе с AI.

Илья Самофеев, CEO red_mad_robot, поделится ключевыми инсайтами из исследования: как меняется структура рынка, где заканчиваются эксперименты и начинаются масштабируемые решения, и какие ограничения оказываются решающими для бизнеса.

К разговору также присоединится Николай Верховский — директор департамента цифровых и продуктовых программ Школы управления СКОЛКОВО — обсудят инвестиции, кадровый дефицит, роль данных и российские практики применения GenAI.

Дата и время: 28 января, 10:30–11:30.

Приглашаем вас присоединиться к открытой онлайн-дискуссии.

Участие бесплатное, по регистрации.

Читать далее

Новости

Создатели h3h3 и других YouTube-каналов подали иск против Snap за использование данных для ИИ

Время на прочтение2 мин
Охват и читатели5.7K

Группа ютуберов, уже подававших иски против техногигантов за то, что те без разрешения собирали их видео для обучения своих ИИ-моделей, теперь добавила в список ответчиков и Snap. Истцы – создатели трех YouTube-каналов с общей аудиторией 6,2 млн подписчиков – утверждают, что Snap обучала свои ИИ-системы на их видеоконтенте, используя его, например, в Imagine Lens, инструменте, позволяющего редактировать изображения посредством текстовых подсказок.

Читать далее

Сотрудники крупных ИИ-компаний запустили проект Poison Fountain, чтобы навредить обучению нейросетей

Время на прочтение2 мин
Охват и читатели13K

Проект с говорящим названием Poison Fountain предлагает владельцам сайтов кормить веб‑скрейперов, собирающих данные для обучения ИИ, специально сконструированными «отравленными» наборами данных. Цель — саботировать работу языковых моделей, превратив многомиллиардные разработки в неадекватные системы.

Читать далее

В поисках «золотого датасета»: OpenAI собирает реальные рабочие задачи и файлы для тренировки будущих ИИ-агентов

Время на прочтение2 мин
Охват и читатели6.9K

OpenAI обращается к сторонним подрядчикам с просьбой загружать реальные задания и рабочие файлы с текущих или прежних мест работы — чтобы использовать эти материалы для оценки эффективности своих моделей следующего поколения. Об этом свидетельствуют документы OpenAI и компании Handshake AI, занимающейся обучающими данными, с которыми ознакомилось издание Wired.

Читать далее

За фасадом технологий: исследователи прочёсывают Америку в поисках скрытых дата-центров

Время на прочтение4 мин
Охват и читатели16K

Команда исследователей из Epoch AI использует методы открытой разведки, чтобы картографировать рост дата‑центров по всей территории США.

Они изучают спутниковые снимки, разрешения на строительство и прочие документы, превращая собранные данные в интерактивную карту, где указаны стоимость объектов, их энергопотребление и владельцы.

Читать далее

AI Overviews и AI Mode могут оказаться под запретом? ЕС начал расследование против Google

Время на прочтение2 мин
Охват и читатели5.5K

Google вновь оказалась под прицелом европейских регуляторов: против компании открыто свежее расследование об антимонопольных нарушениях. Во вторник представители Евросоюза объявили, что изучают, каким образом компания использует онлайн-контент для своих ИИ-моделей и связанных с ними сервисов — и не нарушает ли при этом конкуренцию.

Регуляторов тревожит, что компания могла создать несправедливое преимущество, используя этот контент сразу в двух своих поисковых режимах — AI Overviews и AI Mode — без компенсаций издателям и без возможности для них отказаться от такого использования.

Читать далее

Новый модуль Grammarly, AI Grader, использует открытые данные о преподавателе для предсказания оценки

Время на прочтение2 мин
Охват и читатели5.3K

Те времена, когда Grammarly был всего лишь безобидным проверяльщиком орфографии, давно канули в Лету. Теперь у Grammarly есть «агент‑оценщик» AI Grader, который обещает не только давать персонализированные комментарии к студенческим работам, но и предсказывать итоговую оценку. А делает он это, как гордо заявляет компания, в том числе за счёт «сбора общедоступной информации о преподавателе».

Читать далее

Маск пообещал релиз Grok 3 в опенсорсе через полгода

Время на прочтение2 мин
Охват и читатели7.8K

Илон Маск подтвердил, что Grok 3 — предпоследняя версия генеративного чат‑бота его компании xAI — будет выложена в открытый доступ примерно через шесть месяцев. Несколькими днями ранее xAI сделал открытым исходный код Grok 2.5.

Читать далее

Фреймворк BeyondWeb (Datology AI) перестраивает веб-документы для лучшего обучения моделей

Время на прочтение3 мин
Охват и читатели4.7K

Сегодня бюджеты на обучение больших языковых моделей измеряются уже триллионами токенов, а достойные веб‑данные становятся всё труднее добыть. В Datology AI называют эту «стену данных» одним из главных вызовов и предлагают BeyondWeb как решение. Система заново структурирует уже существующие веб‑документы, делая их более ёмкими по содержанию, придаёт текстам обучающий тон и перестраивает их так, чтобы они лучше подходили для тренировок.

Читать далее

Релиз открытой модели ByteDance: Seed-OSS-36B с контекстом в 512 000 токенов

Время на прочтение5 мин
Охват и читатели9K

Исследовательская команда Seed Team (ByteDance) выпустила Seed‑OSS-36B на платформе Hugging Face.

Seed‑OSS-36B — это новая линейка открытых больших языковых моделей (LLM), созданных для сложных рассуждений и удобства работы разработчиков. Главное их отличие — удлинённый контекст, то есть объём информации, который модель способна воспринять и обработать за один сеанс.

Читать далее

Nvidia и Национальный научный фонд США создают открытые ИИ-модели для исследователей

Время на прочтение2 мин
Охват и читатели4.6K

Национальный научный фонд США (ННФ) привлёк значительные инвестиции от государства и частного сектора для реализации проекта Open Multimodal AI Infrastructure (OMAI).

Ведёт его Институт Аллена по искусственному интеллекту (Ai2), а конечная цель — дать в распоряжение американских учёных передовые модели ИИ. Главная особенность OMAI — открытость создаваемых языковых моделей (LLM).

Читать далее

Самообучающаяся DINOv3✶ от Meta✶ обгоняет конкурентов в анализе изображений

Время на прочтение3 мин
Охват и читатели9.9K

Обычно обучение систем искусственного интеллекта для генерации или анализа изображений требует колоссальных объемов данных: фотографии, скажем, котов вручную снабжаются ярлыками — «кот», «идет», «полосатый». Но DINOv3✶ от Meta✶ пошла иным путем: она обучалась на 1,7 млрд изображений без каких‑либо меток и теперь умеет решать множество задач без человеческого вмешательства, нередко опережая специализированные модели.

Читать далее

Датасет Granary от Nvidia: миллион часов речи для обучения нового поколения ИИ

Время на прочтение3 мин
Охват и читатели7.2K

Nvidia представила мощный набор открытых инструментов, который позволит разработчикам создавать высококачественные системы распознавания и синтеза речи для 25 европейских языков. Сердцем этой инициативы стала Granary — гигантская библиотека человеческой речи. В ней около миллиона часов аудиозаписей.

Чтобы извлечь максимум из этих данных, Nvidia предлагает две новые языковые AI‑модели: Canary-1b‑v2 и Parakeet‑tdt-0.6b‑v3.

Читать далее

Ближайшие события

Компания Proton готова покинуть Швейцарию в связи с возможными поправками в закон о правилах слежки

Время на прочтение2 мин
Охват и читатели16K

Генеральный директор Proton выступил против принятия поправок в закон о слежке. Он заявил о планах компании покинуть страну, если VPN-сервисы и приложения для обмена сообщениями будут вынуждены идентифицировать и хранить данные пользователей. Его позицию разделяют и другие участники рынка. 

Читать далее

На вебинаре расскажем про управление данными юрлиц

Время на прочтение2 мин
Охват и читатели369

22 апреля в 18.00 на вебинаре поговорим о системе класса MDM, которая работает с данными юрлиц.

Почему это важно? Бизнес годами пестует корпоративных клиентов, но со временем данные неизбежно портятся — компании переезжают, меняют название, закрываются. Контактные лица увольняются, телефоны не отвечают, а письма не доходят. Из-за этого банки, страховые и телеком-операторы делают нецелевые предложения, упускают клиентов и теряют деньги. А самое главное — не понимают, кого так и не охватили и почему.

Как работает MDM для корпоративного бизнеса? Она уже содержит данные о юрлицах, ИП, связанных с ними физлицах, лицензиях, истории компании, структуре владения. Это сведения из 13 проверенных источников, включая ЕГРЮЛ, Росстат, основные государственные реестры и собственные справочники HFLabs. 

Клиентские данные, которые уже есть в компании, MDM стандартизирует, обогащает и обновляет каждый день. Так система обеспечивает полный набор информации по юрлицам — это особенно важно для продаж, аналитики, комплаенса. 

На вебинаре разберем, как MDM помогает:

— Сегментировать клиентов по сути, а не по ОКВЭД,
— Понимать, куда движется клиент: видеть все его данные и «среднюю температуру» по отрасли или региону,
— Отслеживать изменения в данных юрлиц,
— Разбираться в сложных структурах владения.

Покажем сценарии из практики — как данные из MDM-системы помогают находить прибыльные сегменты, не терять клиентов и просто лучше понимать ваш B2B-рынок.

Кому будет полезно? Тем, кто работает с клиентскими данными в крупных компаниях, B2B-маркетологам, владельцам продуктов, которые ищут сегменты роста, сейлам, работающим с юрлицами, аналитикам, специалистам по комплаенсу и риск-оценке.

Вебинар бесплатный, но для участия нужно зарегистрироваться. Начинаем ровно в 18.00, с рассказом без воды и ответами на вопросы уложимся за час.

Читать далее

Что поменялось в клиентских данных за 20 лет? Смотрите в проекте HFLabs

Время на прочтение1 мин
Охват и читатели484

11 апреля HFLabs отмечает 20 лет. В честь такой даты запустили проект c главными событиями в сфере персональных данных, которые случились за это время.

Вместе с Валерой — это наш маскот и по совместительству внутренний чат-бот —предлагаем вспомнить, как за два десятилетия изменились законодательство, работа с клиентскими данными и технологии.

Что есть на сайте проекта:

• Главные изменения в сфере персональных данных за 20 лет, которые коснулись каждого,

• Важные вехи, которые позволили трансформировать клиентский сервис, 

• Тренды в управлении клиентскими данными в IT, на законодательном уровне и в бизнесе.

Заходите смотреть, вспоминать и ностальгировать;)

Кстати, о том, как и чем живет HFLabs, мы пишем в телеграм-канале «Лабсовая», а о новости в сфере клиентских данных рассказываем вот тут.

Читать далее

На вебинаре расскажем, как страховая компания автоматизировала комплаенс и процессы ПОД/ФТ

Время на прочтение1 мин
Охват и читатели474

6 марта в 18.00 проведем онлайн-разбор кейса и расскажем, как компания «Сбербанк страхование жизни» автоматизировала проверки контрагентов, создание анкет физ- и юрлиц, авторасчет уровней риска, отчетность.

Пройдёмся по шагам:
— С какими вызовами в работе с ПОД/ФТ столкнулась команда одной из крупнейших российских страховых,
— Как выбирали вендора,
— Какие результаты принесло внедрение продукта от отечественного вендора,
— Как подготовиться ко внедрению и избежать типичных ошибок.

Кому будет интересно? Руководителям направлений комплаенса и ПОД/ФТ, CIO, IT-специалистам, аналитикам.

Чтобы принять участие в вебинаре, нужно зарегистрироваться по ссылке. Надоедать напоминаниями не будем, один раз пришлем ссылку на подключение. Вебинар продлится час.

Читать далее

RSHB DA Meetup: Качество данных и Data Vault 2.0 в действии

Время на прочтение2 мин
Охват и читатели664

27 февраля в 18:00 онлайн и офлайн в Москве состоится митап от РСХБ.цифра для дата-аналитиков и инженеров данных RSHB DA Meetup: Качество данных и Data Vault 2.0 в действии. Приглашаем на новый митап всех, кто занимается большими данными и следит за их качеством. Вас ждут три доклада от руководителей дата-направлений в разных компаниях — про песочницу данных, методологию Data Vault 2.0 и качество данных в Self-Service.

Зарегистрироваться на митап

Разработчик представил проект Killed by LLM, где опубликованы бенчмарки, которые были побеждены прогрессом ИИ

Время на прочтение1 мин
Охват и читатели10K

Разработчик Роб Копель представил проект Killed by LLM. Это мемориал бенчмаркам, коллекциям задач и наборам данных, которые были побеждены прогрессом ИИ. Исходный код этого решения написан на HTML и TypeScript и опубликован на GitHub под лицензией MIT.

Читать далее

Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным

Время на прочтение2 мин
Охват и читатели558

Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным (Institutional Data Initiative, IDI), запущенной Библиотекой Гарвардского университета. В рамках исследовательской инициативы американский университет будет работать с библиотеками и музеями, правительственными учреждениями и другими организациями для публикации их коллекций в виде данных.

Читать далее