Обновить
256K+

Звук

Это «ж-ж-ж» неспроста

88,59
Рейтинг
Сначала показывать
Порог рейтинга

Акустическое обнаружение дронов с помощью ESP32

Время на прочтение2 мин
Охват и читатели13K

Стоимость проекта оценивается всего в 15 долларов США, что действительно упрощает обнаружение беспилотников, поскольку спецификация полностью состоит из одного ESP32-S3 и микрофона ICS-43434 I2S.

Большинство схем обнаружения беспилотников основаны подобно тому, как мы ищем крупные самолеты, используя РАДАР. А ещё до появления радара были акустические детекторы, такие как знаменитые японские “военные тубы”, которые стали популярными много лет назад. РАДАРНЫЕ модули стоят недешево, а MEMS–микрофоны стоят сравнительно недорого. Дроны, особенно квадрокоптеры, не отличаются бесшумностью. Таким образом, появилось решение использовать акустическое обнаружение, чтобы упростить процесс обнаружения дронов.

Конечно, можно сделать, чтобы ESP32 обращался на какой-нибудь сервер Azure или AWS, чтобы передать акустические данные для обработки какой-нибудь гигантской моделью машинного обучения. С ESP32 это было бы проще всего сделать, но иногда, полагаться на облако неудобно. При использовании чужого оборудования всегда возникают проблемы с надёжностью. Автор этой обратился к алгоритмическому подходу – в частности, к фильтрам Герцеля для определения акустических частот, используемых беспилотными летательными аппаратами. Для анализа конкретных частотных диапазонов алгоритм Гертцеля максимально прост, что означает, что всё может выполняться локально на ESP32.

Недостатком является то, что, поскольку мы просто слушаем на определенных частотах, шум окружающей среды может стать проблемой. Рекомендуется выполнить калибровку для конкретной среды, а также надеть поролоновую накладку на микрофон, чтобы избежать ложных срабатываний из-за шума ветра. Предполагается, что усилитель, используемый в этих “военных тубах”, не только защитит микрофон от ветра, но и увеличит дальность действия и направленность звука.

Читать далее

Новости

Вышло обновление свободного проекта для создания музыкальных миксов Mixxx 2.5.6

Время на прочтение1 мин
Охват и читатели3.6K

27 марта 2026 года состоялся релиз свободного мультиплатформенного проекта для создания музыкальных миксов Mixxx 2.5.6. Это решение для сведения музыкальных композиций в живые DJ‑миксы, которое является бесплатным аналогом Rekordbox и Serato. Исходный код проекта написан на C++ и JavaScript и опубликован на GitHub под лицензией General Public License version 2.

Читать далее

«Яндекс Музыка» реализовала в сервисе ИИ-рекомендации, которые работают на смартфоне пользователя даже без интернета

Время на прочтение4 мин
Охват и читатели6.2K

Команда проекта «Яндекс Музыка» реализовала в музыкальном сервисе ИИ-рекомендации, которые работают на смартфоне пользователя даже без интернета. В этом случае опуия «Моя волна» открывает новую музыку и адаптируется под предпочтения там, где связь нестабильна или отсутствует: в самолёте, в поездке за город или в горном походе

Читать далее

Bumpboxx представила портативную аудиосистему в виде бумбокса Sharp GF-777

Время на прочтение2 мин
Охват и читатели4.1K

Компания Bumpboxx представила портативную аудиосистему BB-777, которая напоминает легендарный бумбокс Sharp GF-777. Устройство получило два кассетных «порта», слот для CD, FM/AM-радио, разъём для флешки, AUX и Bluetooth. 

Читать далее

Sonova планирует продать подразделение Sennheiser по производству наушников

Время на прочтение1 мин
Охват и читатели5.1K

Швейцарский производитель слуховых аппаратов Sonova планирует продать потребительское подразделение немецкой Sennheiser в рамках масштабной реструктуризации рыночной стратегии. Sonova намерена сосредоточиться на своём основном бизнесе.

Читать далее

Google DeepMind выпустила Lyria 3 Pro: теперь нейросеть пишет 3-минутные треки

Время на прочтение2 мин
Охват и читатели8.1K

Google DeepMind официально запустила Lyria 3 Pro. Главное отличие от предшественника: вместо 30-секундных нарезок нейросеть теперь создаёт композиции длительностью до 3 минут. Причём делает это осмысленно – модель научилась различать структуру музыкального произведения: интро, куплеты, припевы и бриджи, что позволяет задавать их в промпте и получать более связный и продуманный трек.

Читать далее

Artificial Analysis: лучшие модели для синтеза речи – ElevenLabs Eleven, Inworld TTS и MiniMax Speech

Время на прочтение1 мин
Охват и читатели6.2K

Платформа Artificial Analysis обновила свой лидерборд моделей синтеза речи (TTS, text-to-speech). В пятёрке самых предпочтительных моделей – сразу три представителя Inworld, а компанию им составляют MiniMax и ElevenLabs.

Первое место, с результатом 1 238 Эло, заняла модель Inworld TTS 1.5 Max, следом идут ElevenLabs Eleven v3 (1 197), Inworld TTS 1 Max (1 183), Inworld TTS 1.5 Mini (1 182) и замыкает топ-5 MiniMax Speech 2.8 HD (1 175). Интересно, что четыре из пяти лидеров были выпущены в этом году, – прогресс идёт семимильными шагами.

Читать далее

Spotify представила новую функцию SongDNA для знакомства с историей создания трека

Время на прочтение1 мин
Охват и читатели6K

Платформа Spotify представила новую функцию SongDNA, которая поможет пользователям узнать о том, кто и как помогал в создании любимых треков. Пока функция доступна только подписчикам Premium.

Читать далее

Spotify тестирует инструмент отделения ИИ-контента от музыки артистов

Время на прочтение2 мин
Охват и читатели3.5K

Spotify проводит бета-тестирование новой функции «Защита профиля исполнителя», которая позволяет артистам просматривать релизы до их публикации в своих профилях. Идея заключается в том, чтобы дать музыкантам больше контроля над тем, какие треки будут связаны с их именем в стриминговом сервисе.

Читать далее

Мелодия будильника от Алисы может стать звуковым товарным знаком

Время на прочтение2 мин
Охват и читатели4.2K

Яндекс подал заявку на регистрацию звукового товарного знака.

Согласно документам, компания намерена закрепить за собой исключительное право на звук будильника для Алисы. Подобная практика распространена среди крупных технологических корпораций, которые стремятся защитить не только визуальные элементы бренда (логотипы, цвета), но и узнаваемые аудиосопровождения, используемые в продуктах и рекламе.

Читать далее

v2a-модель PrismAudio учится озвучивать видео, разделяя смысл, время, эстетику и пространство

Время на прочтение3 мин
Охват и читатели4.5K

Разработчики из команды FunAudioLLM (входящей в Alibaba Group) представили PrismAudio – новый фреймворк для генерации звука по видео (video-to-audio, v2a), который кардинально меняет подход к этой задаче.

Вместо того чтобы пытаться оптимизировать всё и сразу с помощью единой функции потерь, как это делалось раньше, PrismAudio разбивает процесс на четыре специализированных потока рассуждений – семантический, темпоральный, эстетический и пространственный.

Читать далее

Представлен открытый проект cliamp — ретро-терминальный музыкальный плеер, вдохновлённый Winamp

Время на прочтение1 мин
Охват и читатели14K

Состоялся выпуск открытого мультиплатформеного проекта под названием cliamp. Это ретро‑терминальный музыкальный плеер для WIndows, Linux и macOS, вдохновлённый Winamp. Исходный код решения написан на Go и опубликован на GitHub под лицензией MIT.

Читать далее

Житель Северной Каролины признал себя виновным в мошенничестве с потоковой передачей музыки при помощи ИИ и ботов

Время на прочтение1 мин
Охват и читатели4.4K

Музыкант из города Корнелиус, штат Северная Каролина, 54-летний Майкл Смит признал вину за участие в мошеннической схеме против музыкальных стриминговых платформ для получения авторских отчислений, сообщило Министерство юстиции США. Обвиняемый сгенерировал сотни тысяч песен при помощи искусственного интеллекта и использовал ботов для накрутки миллиардов прослушиваний.

Читать далее

Ближайшие события

Вышел проект CopySpeak — легковесное приложение для Windows, которое читает текст из буфера обмена вслух с помощью ИИ

Время на прочтение1 мин
Охват и читатели6.2K

Состоялся выпуск открытого проекта CopySpeak. Это легковесное настольное приложение для Windows, которое читает текст из буфера обмена вслух с помощью ИИ-алгоритмов преобразования текста в речь.

Читать далее

Elevenlabs запустил маркетплейс AI-музыки

Время на прочтение2 мин
Охват и читатели5.3K

ElevenLabs запустила маркетплейс музыки, где пользователи могут публиковать и продавать треки, созданные с помощью музыкальной ИИ-модели ElevenCreative.

Читать далее

CBS News объявил о закрытии радиослужбы после почти ста лет работы

Время на прочтение1 мин
Охват и читатели6.3K

Американский телеканал CBS News объявил о закрытии своей радиослужбы, сославшись на сложные экономические условия из-за перехода слушателей на цифровые источники и подкасты, пишет Associated Press. Служба CBS News Radio начала вещание в сентябре 1927 года, став предшественницей всей сети CBS.

Читать далее

Представлен открытый проект BillyPro — минималистичный музыкальный плеер для Windows

Время на прочтение1 мин
Охват и читатели6.3K

Разработчик под ником bisoloc представил открытый проект BillyPro. Это минималистичный музыкальный плеер для Windows с мгновенным запуском, низким потреблением ресурсов ЦП, воспроизведением без пауз, DSP-эффектами, портативными настройками, управлением с клавиатуры и поддержкой всех популярных форматов (от MP3 и FLAC до OPUS и AIFF). Исходный код решения написан на C++ и опубликован на GitHub под разрешительный лицензией для применения в личных целях.

Читать далее

Spotify добавил опцию «Эксклюзивный режим» для аудиофилов на ПК с Windows

Время на прочтение1 мин
Охват и читатели5.5K

Пользователи Spotify получат доступ к «Эксклюзивному режиму» — новой функции в приложении Spotify для Windows, которая поможет максимально улучшить качество звука путём его обработки на устройстве. 

Читать далее

Creative представила Sound Blaster Audigy FX Pro

Время на прочтение2 мин
Охват и читатели4.9K

Компания Creative Technology анонсировала Sound Blaster Audigy FX Pro, новейшее дополнение к серии Audigy FX. Разработанная для сборщиков ПК и пользователей настольных компьютеров, система сочетает опции воспроизведения высокого разрешения, дискретный объёмный звук 7.1, встроенное усиление для наушников и поддержку приложения Creative Nexus.

Читать далее

Релиз FFmpeg 8.1 Hoare

Время на прочтение2 мин
Охват и читатели6K

16 марта 2026 года состоялся релиз открытого мультимедиа-пакета FFmpeg 8.1 под кодовым названием Hoare для Linux, Windows и macOS. Версия FFmpeg 7.0 вышла в апреле 2024 года. Выпуск FFmpeg 8.0 случился в августе 2025 года.

Читать далее
1
23 ...