Все потоки

Открытые данные *

Данные будут свободны!

11,67

Рейтинг

СтатьиПостыНовостиАвторыКомпании

redmadrobot 27 янв в 15:35

Открытая дискуссия: «Стратегия AI-трансформации: от исследования к реальным бизнес-решениям»

1 мин

4.2K

Блог компании red_mad_robotИскусственный интеллектОткрытые данные *

Эксперты red_mad_robot и СКОЛКОВО проведут открытую онлайн-дискуссию о состоянии и перспективах российского рынка GenAI.

В центре обсуждения — совместное исследование — Карта рынка GenAI, и практические вопросы, с которыми сталкивается бизнес при работе с AI.

Илья Самофеев, CEO red_mad_robot, поделится ключевыми инсайтами из исследования: как меняется структура рынка, где заканчиваются эксперименты и начинаются масштабируемые решения, и какие ограничения оказываются решающими для бизнеса.

К разговору также присоединится Николай Верховский — директор департамента цифровых и продуктовых программ Школы управления СКОЛКОВО — обсудят инвестиции, кадровый дефицит, роль данных и российские практики применения GenAI.

Дата и время: 28 января, 10:30–11:30.

Приглашаем вас присоединиться к открытой онлайн-дискуссии.

Участие бесплатное, по регистрации.

Читать далее

+3

dmitrifriend 27 янв в 14:06

Создатели h3h3 и других YouTube-каналов подали иск против Snap за использование данных для ИИ

2 мин

5.7K

Блог компании BotHubЗаконодательство в ITIT-компанииИскусственный интеллектОткрытые данные *

Группа ютуберов, уже подававших иски против техногигантов за то, что те без разрешения собирали их видео для обучения своих ИИ-моделей, теперь добавила в список ответчиков и Snap. Истцы – создатели трех YouTube-каналов с общей аудиторией 6,2 млн подписчиков – утверждают, что Snap обучала свои ИИ-системы на их видеоконтенте, используя его, например, в Imagine Lens, инструменте, позволяющего редактировать изображения посредством текстовых подсказок.

Читать далее

+1

dmitrifriend 13 янв в 13:07

Сотрудники крупных ИИ-компаний запустили проект Poison Fountain, чтобы навредить обучению нейросетей

2 мин

13K

Блог компании BotHubИнформационная безопасность * Искусственный интеллектМашинное обучение * Открытые данные *

Проект с говорящим названием Poison Fountain предлагает владельцам сайтов кормить веб‑скрейперов, собирающих данные для обучения ИИ, специально сконструированными «отравленными» наборами данных. Цель — саботировать работу языковых моделей, превратив многомиллиардные разработки в неадекватные системы.

Читать далее

+10

dmitrifriend 12 янв в 16:29

В поисках «золотого датасета»: OpenAI собирает реальные рабочие задачи и файлы для тренировки будущих ИИ-агентов

2 мин

6.9K

Блог компании BotHubИсследования и прогнозы в IT * Открытые данные * Искусственный интеллектIT-компании

OpenAI обращается к сторонним подрядчикам с просьбой загружать реальные задания и рабочие файлы с текущих или прежних мест работы — чтобы использовать эти материалы для оценки эффективности своих моделей следующего поколения. Об этом свидетельствуют документы OpenAI и компании Handshake AI, занимающейся обучающими данными, с которыми ознакомилось издание Wired.

Читать далее

+3

dmitrifriend 5 янв в 16:50

За фасадом технологий: исследователи прочёсывают Америку в поисках скрытых дата-центров

4 мин

16K

Блог компании BotHubИсследования и прогнозы в IT * IT-компанииОткрытые данные *

Команда исследователей из Epoch AI использует методы открытой разведки, чтобы картографировать рост дата‑центров по всей территории США.

Они изучают спутниковые снимки, разрешения на строительство и прочие документы, превращая собранные данные в интерактивную карту, где указаны стоимость объектов, их энергопотребление и владельцы.

Читать далее

+2

dmitrifriend 9 дек 2025 в 12:34

AI Overviews и AI Mode могут оказаться под запретом? ЕС начал расследование против Google

2 мин

5.5K

Блог компании BotHubИскусственный интеллектЗаконодательство в ITIT-компанииОткрытые данные *

Google вновь оказалась под прицелом европейских регуляторов: против компании открыто свежее расследование об антимонопольных нарушениях. Во вторник представители Евросоюза объявили, что изучают, каким образом компания использует онлайн-контент для своих ИИ-моделей и связанных с ними сервисов — и не нарушает ли при этом конкуренцию.

Регуляторов тревожит, что компания могла создать несправедливое преимущество, используя этот контент сразу в двух своих поисковых режимах — AI Overviews и AI Mode — без компенсаций издателям и без возможности для них отказаться от такого использования.

Читать далее

+1

dmitrifriend 24 авг 2025 в 20:55

Новый модуль Grammarly, AI Grader, использует открытые данные о преподавателе для предсказания оценки

2 мин

5.3K

Блог компании BotHubСофтИскусственный интеллектIT-компанииОткрытые данные *

Те времена, когда Grammarly был всего лишь безобидным проверяльщиком орфографии, давно канули в Лету. Теперь у Grammarly есть «агент‑оценщик» AI Grader, который обещает не только давать персонализированные комментарии к студенческим работам, но и предсказывать итоговую оценку. А делает он это, как гордо заявляет компания, в том числе за счёт «сбора общедоступной информации о преподавателе».

Читать далее

+1

dmitrifriend 24 авг 2025 в 16:55

Маск пообещал релиз Grok 3 в опенсорсе через полгода

2 мин

7.8K

Блог компании BotHubИскусственный интеллектМашинное обучение * IT-компанииОткрытые данные *

Илон Маск подтвердил, что Grok 3 — предпоследняя версия генеративного чат‑бота его компании xAI — будет выложена в открытый доступ примерно через шесть месяцев. Несколькими днями ранее xAI сделал открытым исходный код Grok 2.5.

Читать далее

+1

dmitrifriend 24 авг 2025 в 14:10

Фреймворк BeyondWeb (Datology AI) перестраивает веб-документы для лучшего обучения моделей

3 мин

4.7K

Блог компании BotHubИскусственный интеллектМашинное обучение * Открытые данные * Исследования и прогнозы в IT *

Сегодня бюджеты на обучение больших языковых моделей измеряются уже триллионами токенов, а достойные веб‑данные становятся всё труднее добыть. В Datology AI называют эту «стену данных» одним из главных вызовов и предлагают BeyondWeb как решение. Система заново структурирует уже существующие веб‑документы, делая их более ёмкими по содержанию, придаёт текстам обучающий тон и перестраивает их так, чтобы они лучше подходили для тренировок.

Читать далее

+1

dmitrifriend 21 авг 2025 в 20:43

Релиз открытой модели ByteDance: Seed-OSS-36B с контекстом в 512 000 токенов

5 мин

9K

Блог компании BotHubИскусственный интеллектМашинное обучение * Открытые данные *

Исследовательская команда Seed Team (ByteDance) выпустила Seed‑OSS-36B на платформе Hugging Face.

Seed‑OSS-36B — это новая линейка открытых больших языковых моделей (LLM), созданных для сложных рассуждений и удобства работы разработчиков. Главное их отличие — удлинённый контекст, то есть объём информации, который модель способна воспринять и обработать за один сеанс.

Читать далее

+9

dmitrifriend 18 авг 2025 в 19:06

Nvidia и Национальный научный фонд США создают открытые ИИ-модели для исследователей

2 мин

4.6K

Блог компании BotHubИскусственный интеллектIT-инфраструктура * Открытые данные * IT-компании

Национальный научный фонд США (ННФ) привлёк значительные инвестиции от государства и частного сектора для реализации проекта Open Multimodal AI Infrastructure (OMAI).

Ведёт его Институт Аллена по искусственному интеллекту (Ai2), а конечная цель — дать в распоряжение американских учёных передовые модели ИИ. Главная особенность OMAI — открытость создаваемых языковых моделей (LLM).

Читать далее

+1

dmitrifriend 16 авг 2025 в 23:40

Самообучающаяся DINOv3✶ от Meta✶ обгоняет конкурентов в анализе изображений

3 мин

9.9K

Блог компании BotHubИскусственный интеллектМашинное обучение * Обработка изображений * Открытые данные *

Обычно обучение систем искусственного интеллекта для генерации или анализа изображений требует колоссальных объемов данных: фотографии, скажем, котов вручную снабжаются ярлыками — «кот», «идет», «полосатый». Но DINOv3✶ от Meta✶ пошла иным путем: она обучалась на 1,7 млрд изображений без каких‑либо меток и теперь умеет решать множество задач без человеческого вмешательства, нередко опережая специализированные модели.

Читать далее

+1

dmitrifriend 15 авг 2025 в 18:38

Датасет Granary от Nvidia: миллион часов речи для обучения нового поколения ИИ

3 мин

7.2K

Блог компании BotHubИскусственный интеллектМашинное обучение * IT-компанииОткрытые данные *

Nvidia представила мощный набор открытых инструментов, который позволит разработчикам создавать высококачественные системы распознавания и синтеза речи для 25 европейских языков. Сердцем этой инициативы стала Granary — гигантская библиотека человеческой речи. В ней около миллиона часов аудиозаписей.

Чтобы извлечь максимум из этих данных, Nvidia предлагает две новые языковые AI‑модели: Canary-1b‑v2 и Parakeet‑tdt-0.6b‑v3.

Читать далее

+2

Cloud4Y 19 мая 2025 в 14:07

Компания Proton готова покинуть Швейцарию в связи с возможными поправками в закон о правилах слежки

2 мин

16K

Блог компании Cloud4YОткрытые данные * Законодательство в ITХранение данных *

Генеральный директор Proton выступил против принятия поправок в закон о слежке. Он заявил о планах компании покинуть страну, если VPN-сервисы и приложения для обмена сообщениями будут вынуждены идентифицировать и хранить данные пользователей. Его позицию разделяют и другие участники рынка.

Читать далее

+27

Innna_07 17 апр 2025 в 07:06

На вебинаре расскажем про управление данными юрлиц

2 мин

369

Блог компании HFLabsОткрытые данные * Управление продажами *

22 апреля в 18.00 на вебинаре поговорим о системе класса MDM, которая работает с данными юрлиц.

Почему это важно? Бизнес годами пестует корпоративных клиентов, но со временем данные неизбежно портятся — компании переезжают, меняют название, закрываются. Контактные лица увольняются, телефоны не отвечают, а письма не доходят. Из-за этого банки, страховые и телеком-операторы делают нецелевые предложения, упускают клиентов и теряют деньги. А самое главное — не понимают, кого так и не охватили и почему.

Как работает MDM для корпоративного бизнеса? Она уже содержит данные о юрлицах, ИП, связанных с ними физлицах, лицензиях, истории компании, структуре владения. Это сведения из 13 проверенных источников, включая ЕГРЮЛ, Росстат, основные государственные реестры и собственные справочники HFLabs.

Клиентские данные, которые уже есть в компании, MDM стандартизирует, обогащает и обновляет каждый день. Так система обеспечивает полный набор информации по юрлицам — это особенно важно для продаж, аналитики, комплаенса.

На вебинаре разберем, как MDM помогает:

— Сегментировать клиентов по сути, а не по ОКВЭД,
— Понимать, куда движется клиент: видеть все его данные и «среднюю температуру» по отрасли или региону,
— Отслеживать изменения в данных юрлиц,
— Разбираться в сложных структурах владения.

Покажем сценарии из практики — как данные из MDM-системы помогают находить прибыльные сегменты, не терять клиентов и просто лучше понимать ваш B2B-рынок.

Кому будет полезно? Тем, кто работает с клиентскими данными в крупных компаниях, B2B-маркетологам, владельцам продуктов, которые ищут сегменты роста, сейлам, работающим с юрлицами, аналитикам, специалистам по комплаенсу и риск-оценке.

Вебинар бесплатный, но для участия нужно зарегистрироваться. Начинаем ровно в 18.00, с рассказом без воды и ответами на вопросы уложимся за час.

Читать далее

0

kos_ste 10 апр 2025 в 07:03

Что поменялось в клиентских данных за 20 лет? Смотрите в проекте HFLabs

1 мин

484

Блог компании HFLabsIT-компанииОткрытые данные *

11 апреля HFLabs отмечает 20 лет. В честь такой даты запустили проект c главными событиями в сфере персональных данных, которые случились за это время.

Вместе с Валерой — это наш маскот и по совместительству внутренний чат-бот —предлагаем вспомнить, как за два десятилетия изменились законодательство, работа с клиентскими данными и технологии.

Что есть на сайте проекта:

• Главные изменения в сфере персональных данных за 20 лет, которые коснулись каждого,

• Важные вехи, которые позволили трансформировать клиентский сервис,

• Тренды в управлении клиентскими данными в IT, на законодательном уровне и в бизнесе.

Заходите смотреть, вспоминать и ностальгировать;)

Кстати, о том, как и чем живет HFLabs, мы пишем в телеграм-канале «Лабсовая», а о новости в сфере клиентских данных рассказываем вот тут.

Читать далее

+2

Innna_07 27 фев 2025 в 07:05

На вебинаре расскажем, как страховая компания автоматизировала комплаенс и процессы ПОД/ФТ

1 мин

474

Блог компании HFLabsОткрытые данные *

6 марта в 18.00 проведем онлайн-разбор кейса и расскажем, как компания «Сбербанк страхование жизни» автоматизировала проверки контрагентов, создание анкет физ- и юрлиц, авторасчет уровней риска, отчетность.

Пройдёмся по шагам:
— С какими вызовами в работе с ПОД/ФТ столкнулась команда одной из крупнейших российских страховых,
— Как выбирали вендора,
— Какие результаты принесло внедрение продукта от отечественного вендора,
— Как подготовиться ко внедрению и избежать типичных ошибок.

Кому будет интересно? Руководителям направлений комплаенса и ПОД/ФТ, CIO, IT-специалистам, аналитикам.

Чтобы принять участие в вебинаре, нужно зарегистрироваться по ссылке. Надоедать напоминаниями не будем, один раз пришлем ссылку на подключение. Вебинар продлится час.

Читать далее

0

RSHB_tsyfra 13 фев 2025 в 14:45

RSHB DA Meetup: Качество данных и Data Vault 2.0 в действии

2 мин

664

Блог компании РСХБ.Цифра (Россельхозбанк)Big Data * Открытые данные * Базы данных *

27 февраля в 18:00 онлайн и офлайн в Москве состоится митап от РСХБ.цифра для дата-аналитиков и инженеров данных RSHB DA Meetup: Качество данных и Data Vault 2.0 в действии. Приглашаем на новый митап всех, кто занимается большими данными и следит за их качеством. Вас ждут три доклада от руководителей дата-направлений в разных компаниях — про песочницу данных, методологию Data Vault 2.0 и качество данных в Self-Service.

Зарегистрироваться на митап

+1

denis-19 6 янв 2025 в 07:06

Разработчик представил проект Killed by LLM, где опубликованы бенчмарки, которые были побеждены прогрессом ИИ

1 мин

10K

Искусственный интеллектМашинное обучение * Открытые данные * Open source * Тестирование веб-сервисов *

Разработчик Роб Копель представил проект Killed by LLM. Это мемориал бенчмаркам, коллекциям задач и наборам данных, которые были побеждены прогрессом ИИ. Исходный код этого решения написан на HTML и TypeScript и опубликован на GitHub под лицензией MIT.

Читать далее

+7

Travis_Macrif 13 дек 2024 в 08:46

Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным

2 мин

558

Открытые данные * Open source * Big Data * Искусственный интеллектМашинное обучение *

Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным (Institutional Data Initiative, IDI), запущенной Библиотекой Гарвардского университета. В рамках исследовательской инициативы американский университет будет работать с библиотеками и музеями, правительственными учреждениями и другими организациями для публикации их коллекций в виде данных.

Читать далее

+3

1