Все потоки

Алгоритмы *

Все об алгоритмах

423,98

Рейтинг

СтатьиПостыНовостиАвторыКомпании

inkedsymon 5 часов назад

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Простой

5 мин

4.5K

Искусственный интеллектМашинное обучение * Научно-популярноеАлгоритмы * Математика *

Мнение

Представьте: вам дают 10 терабайт текста и говорят — запихни это в файл на 70 гигабайт. Так, чтобы потом по любому вопросу можно было восстановить нужный кусок. Не точно, но близко. Не побайтово, но по смыслу.

Вы бы сказали: «это lossy-компрессия, часть данных неизбежно потеряется».

И были бы правы. Потому что именно это делает LLM.

Читать далее

+21

PatientZero 7 часов назад

Как я случайно написал самый быстрый CSV-парсер на C#

Средний

22 мин

6.5K

C# * Клиентская оптимизация * Алгоритмы *

Перевод

На рождественских каникулах я ехал на автобусах из одного штата в другой, и мне нужно было как-то убить 24 часа. Я читал об UTF-8 и узнал об этой кодировке нечто интересное: все традиционные символы ASCII сохранены в ней в их исходном однобайтовом представлении, поэтому их можно сканировать крайне быстро. Я решил поэкспериментировать с кодом, максимально быстро подсчитывающим такие символы, в результате получив готовый парсер CSV, который вполне сравним с предыдущими парсерами, а то и быстрее них.

В статье я расскажу о своём процессе работы, экспериментах и оптимизациях, которые привели меня к этому итогу.

Читать далее

+9

Ioanna 12 часов назад

Не бойтесь динамического программирования

Простой

7 мин

6.7K

Алгоритмы * Карьера в IT-индустрииPython *

Говорят, все боятся задач на динамическое программирование (aka ДП), потому что их решения выглядят как из задачника по матанализу. А мне оно всегда нравилось. Одна изящная формула — и задача решена.

В этой статье разберем три задачи по динамическому программированию с LeetCode и попробуем каждый раз прийти к изящной формуле интуитивно. Также обсудим, по каким признакам можно понять, что задача — на динамическое программирование.

Разбор трех задачек

+10

ph_piter 13 часов назад

Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»

2 мин

5.6K

Блог компании Издательский дом «Питер»Профессиональная литература * Машинное обучение * Искусственный интеллектАлгоритмы *

Привет, Хабожители! Создайте и разверните систему GraphRAG производственного уровня. Научитесь извлекать структурированные знания из текста и комбинировать методы векторного поиска с поиском по графам. Книга богата практическими примерами: от создания инструмента поиска по векторному сходству и приложения Agentic RAG до оценки эффективности и точности результатов работы такого приложения.

Читать далее

+8

Lozkins 15 часов назад

Математическое программирование vs RL: может ли ИИ догнать классику в оптимизации?

17 мин

3.4K

Алгоритмы * Математика * Машинное обучение * Искусственный интеллект

Кейс

С определенным успехом методы математического программирования захватили множество задач автоматизации и оптимизации бизнес процессов (маршрутизация доставки, планирование производства или графиков работы сотрудников, планирование сетей и т.д.). Используемые методы решения и классические постановки задач десятилетиями остаются без серьезных изменений. Когда ждать революцию? Кто имеет потенциал для ее организации?

Проведем эксперимент на предмет того, есть ли у RL способности решать оптимизационные задачи. Для исследования возьмем не сложную практическую оптимизационную задачу и оценим как обучение с подкреплением справится.

Материал будет полезен как заядлым специалистам по мат.оптимизации, так и ml-инженерам или data scientist’ам. Рассматриваемая задача может быть интересна специалистам из области логистики/транспортных перевозок.

Читать далее

+4

geka 15 часов назад

Новые способы хранения тайлов в Картах: как один сервер выдерживает 80k RPS

22 мин

5.1K

Блог компании ЯндексГеоинформационные сервисы * Алгоритмы * Высоконагруженные системы * Хранение данных *

80k RPS и 25 Гбит/с трафика тайлов с одного сервера — звучит как мечта для картографического сервиса? На самом деле это реально — если ваш способ отдачи тайлов спроектирован для этого.

С момента появления первых веб‑карт подходы к хранению картографических данных сильно изменились. В этой статье я разберу эволюцию от классических методов до современных облачных форматов и расскажу о нашем собственном решении с интересными алгоритмами индексации, а также зачем нам для этого понадобились деревья и алгоритмы цифровой сортировки.

Поделюсь опытом того, как мы отказались от сложного рендеринга на бэкенде, упростили инфраструктуру и эксплуатацию, а заодно перестали бояться пиковой нагрузки. Покажу, как это позволило нам отдавать сотни экспериментальных вариантов подложки Карт, используя в качестве бэкенда только S3.

Читать далее

+25

aokoroko 15 часов назад

Множество Мандельброта — видео

Средний

10 мин

2.6K

Программирование * Компьютерная анимация * C++ * Параллельное программирование * Алгоритмы *

Туториал

Анимация: генерирует последовательность из 255 высокоточных кадров в формате BMP (frame_000.bmp ... frame_254.bmp) и автоматически компилирует их в видеоролик (файл Mandelbrot.mp4) с частотой 30 кадров в секунду, используя встроенный FFmpeg.

Скачать последнюю версию (Windows и Linux)
В windows это Mandelbrot_windows.exe и ffmpeg.exe
https://github.com/Divetoxx/Mandelbrot-Video/releases
Выше README содержит English и Русский!

FFmpeg - "швейцарский армейский нож" для обработки видео. В 2026 году он остается отраслевым стандартом, поддерживаемым сообществом разработчиков открытого программного обеспечения. От YouTube и Netflix до профессиональных киностудий - все на него полагаются. И да, он совершенно бесплатный.

Читать далее

0

dochkinavika 21 час назад

Долой иерархию и роли: о том, как LLM-агенты самоорганизуются лучше, чем мы их проектируем

7 мин

7.8K

Алгоритмы * Искусственный интеллектМашинное обучение * Natural Language Processing * Анализ и проектирование систем *

Аналитика

Роли, иерархии, департаменты — всё это придумано для людей. ИИ-агенты устроены иначе. Мы 6 месяцев проверяли, что произойдёт, если не назначать агентам роли и дать им самоорганизоваться. 25 000 задач, 8 моделей, до 256 агентов. Результат: назначать роли — антипаттерн. Система, где агенты сами выбирают специализацию, превосходит систему с координатором на 14%. 8 агентов создали 5 006 уникальных ролей. Агенты сами решают, когда не участвовать — и это повышает качество. В статье — полный разбор эксперимента и практические рекомендации.

Читать далее

+7

DJP вчера в 20:06

SQL квалии

Средний

14 мин

8.8K

SQL * Алгоритмы * БиологияИскусственный интеллектМозг

Мнение

Есть мнение, что принципиальной точкой в развитии ИИ станет обретение им сознания. Что такое со‑знание, как оно появляется и «работает» (у Жизни, у нас, у ИИ) разговор отдельный. Но говоря о сознании нельзя пройти мимо темы так называемый «квалий», на использовании которых в качестве своеобразной базы данных как считается сознание и основывает свою работу. Конечно же есть множество литературы на эту тему, в т.ч. и Д. Чалмерс, однако к.м.к. всё же имеет смысл схематически показать что такое квалии, как они получаются и работают на краткой, простой и понятной модели с использованием ПК и языка SQL.

Создать квалию

+1

40oleg 29 мар в 14:35

Машина Тьюринга в Minecraft

Средний

4 мин

15K

DIY или Сделай самПрограммирование * Алгоритмы *

Кейс

Что если взять одну из базовых концепций computer science и построить её прямо внутри игры — из пикселей, блоков и виртуальных проводов? Именно это я и сделал. Машина Тьюринга — теоретическая модель, которая лежит в основе всех современных компьютеров. Она читает символы, записывает их и переходит между состояниями по заданной программе. Майнкрафт позволяет симулировать электрические сигналы с помощью редстоуна. Из этого материала можно собирать настоящие логические схемы — и в итоге целые вычислительные устройства. Получился полностью рабочий механизм: машина читает данные, выполняет команды и останавливается по завершении программы.

Делаем интересную Майнкрафт штуку

+23

TBEPK 28 мар в 10:23

Как я впервые услышал черную дыру: Python и LIGO

Средний

9 мин

6.1K

Python * Data Engineering * Алгоритмы * Открытые данные *

Туториал

Recovery Mode

Привет, Хабр!

Когда речь заходит об обсерватории LIGO, большинство из нас вспоминает классический сценарий: где-то за миллиарды световых лет слились две черные дыры, и через миллионы лет детекторы на Земле зафиксировали гравитационный всплеск, длившийся доли секунды. В классической Общей теории относительности (ОТО) считается, что изолированная или просто поглощающая газ черная дыра гравитационно «нема». Она ничего не излучает.

Но что, если это не так? Что, если гравитационные телескопы способны «слышать» не только редкие катастрофические слияния, но и постоянный, фоновый гул от обычных черных дыр, которые прямо сейчас пожирают материю в нашей галактике? И что, если этот гул может рассказать нам о физическом размере объектов, внутри которых, как нам говорят, находится «бесконечная сингулярность»?

В этой статье я покажу, как концепция механики сплошных сред позволяет предсказать точную частоту такого резонанса. А затем мы откроем Python, подключимся к серверам GWOSC (Gravitational Wave Open Science Center), выкачаем гигабайты сырых тензорных данных LIGO и методами цифровой обработки сигналов (DSP) вытащим этот акустический след из шума.

Спойлер: мы найдем этот гул для трех разных черных дыр. И он совпадет с расчетным до десятых долей процента. Такого анализа (поиск непрерывного гравитационного резонанса от аккреции) еще никто не делал. Это буквально новый метод определения параметров черных дыр.

Слушать черные дыры

+4

alsafr 27 мар в 07:31

Моя волна — теперь и в офлайне. Рассказываем, как уместили рекомендательную систему в сотню килобайт

Простой

5 мин

15K

Блог компании ЯндексМашинное обучение * ЗвукАлгоритмы * Искусственный интеллект

Несколько лет назад мы представили Мою волну — систему персональных рекомендаций в Яндекс Музыке, которая подстраивается под предпочтения пользователей. В её основе — рекомендательные нейросети-трансформеры, размер которых может достигать сотен миллиардов параметров, и поэтому без мощных дата-центров их работа просто невозможна.

Сегодня мы впервые представляем нашу новую рекомендательную технологию TinyML, которая работает локально, на обычном смартфоне. Теперь при потере доступа в интернет Моя волна не просто бесшовно продолжит воспроизведение музыки, но и будет подстраиваться под действия пользователя и формировать рекомендации, исходя из его предпочтений в текущий момент.

Как это работает и что нам пришлось для этого создать — расскажем под катом.

Читать далее

+40

kchirikhin 27 мар в 03:56

«Лёгкие маршруты» в 2ГИС: рассказываем про алгоритмы и новую систему штрафов

13 мин

8.1K

Блог компании 2ГИСАлгоритмы * Геоинформационные сервисы * Транспорт

Кейс

Навигатор при построении маршрута решает масштабную оптимизационную задачу на графах — он работает с дорогами не как с линиями на карте, а со структурой из миллионов рёбер и вершин. Учитываются ограничения движения, текущие и прогнозные скорости, качество дорог и многое другое.

Недавно в дополнение к самому быстрому и оптимальному мы добавили ещё один вид маршрута — «лёгкий маршрут», наименее стрессовый для водителя. Минимум сложных перекрёстков, поворотов налево и перестроений.

В статье рассказываем, как мы строим маршруты в целом и как новый вид вписывается в текущую архитектуру маршрутизации.

Читать далее

+15

camunar 26 мар в 21:55

Бекэнд на fastify для няшных котят (aura8)

Простой

7 мин

6.9K

Алгоритмы * Node.JS *

Роадмэп

Мы разработали приложение, где пользователь может свайпать картинки, и с учетом лайков пользователя мы генерируем новые картинки. Ниже рассказ, с чем интересным мы столкнулись во время разработки этого приложения.

Читать далее

0

PavelRodikov 26 мар в 09:23

Что умеют школьники, которые через 5 лет будут нашими коллегами

13 мин

7.9K

Блог компании X5 TechПрограммирование * Карьера в IT-индустрииУчебный процесс в ITАлгоритмы *

Школьные олимпиады по информатике до сих пор воспринимаются как отдельный мир, где дети решают абстрактные задачи, далёкие от реальной работы. Но сильный олимпиадник сегодня уже не просто быстро пишет код. По уровню алгоритмического мышления он близок к junior, а иногда и к middle-разработчику, только без боевого опыта. Он умеет жить в таймлимитах, думать об асимптотике, быстро проектировать решение, дебажить под давлением и работать не только с чистой алгоритмикой, но и с задачами по ИИ, безопасности и робототехнике. Поэтому заключительный этап Всероссийской олимпиады школьников по информатике, который в этом году проходит с 22 по 28 марта, показывает, какой инженер будет нужен индустрии через несколько лет. Чтобы понять, из каких скилов собирается портрет будущего инженера, мы посмотрели, как сегодня устроен финал олимпиады, какие задачи там дают и чему он на самом деле учит.

Читать далее

+9

faqzis 26 мар в 08:26

Тайны рекламного аукциона в Ozon и как мы приручали VCG

Средний

15 мин

5.1K

Блог компании Ozon TechИнтернет-маркетинг * Алгоритмы * Поисковые технологии *

Кейс

Привет! Меня зовут Дмитрий, я ведущий разработчик в команде рекламного рантайма. Наша команда, как вы уже могли догадаться, занимается разработкой аукционов в поисковой рекламе Ozon.

В этой статье я хочу познакомить вас с механикой аукционов и рассказать, как мы делаем это в Ozon. Сначала мы разберёмся, что такое рекламный аукцион, что он имеет общего с аукционом в обычном понимании и как используется в контексте поисковой рекламы. А ещё подробно разберём аукцион типа VCG (аукцион Викри — Кларка — Гровса), вместе выведем формулы для него и посмотрим, какие результаты мы получили на практике.

Читать далее

+7

TanyaVSdannye 25 мар в 21:37

Множественная регрессия: Расширяем горизонты прогнозирования

Средний

10 мин

7.9K

Анализ и проектирование систем * Python * Алгоритмы * Карьера в IT-индустрииМашинное обучение *

Хотите научиться предсказывать продажи, цены на недвижимость или спрос на товары, учитывая сразу несколько факторов? Вам поможет множественная регрессия.

В этой статье вы узнаете:

• Математическую основу множественной линейной регрессии – от уравнения гиперплоскости до метода наименьших квадратов;
• Разбор полного кода на Python с использованием scikit-learn на реальном датасете Advertising (200 наблюдений);
• Как интерпретировать коэффициенты модели;
• Сравнение с простой линейной регрессией – насколько лучше работает множественная модель;
• Расширение до полиномиальной регрессии, когда линейности недостаточно.

Читать далее

+2

meliksetyan 25 мар в 20:46

TurboQuant. Новый алгоритм сжатия от Google

Средний

4 мин

18K

Сжатие данных * Алгоритмы * Исследования и прогнозы в IT *

Обзор

Recovery Mode

Google Research выпустили TurboQuant - новый алгоритм сжатия данных, который сокращает объём кэш-памяти LLM как минимум в 6 раз и даёт ускорение до 8 раз. При этом заявляется отсутствие потерь в точности, что напрямую влияет на эффективность работы ИИ.

Читать далее

+12

AAKVAS 24 мар в 14:13

Строим перспективу по изображению

Средний

12 мин

8.9K

Обработка изображений * Алгоритмы * Kotlin *

Туториал

Преобразование Хафа, оператор Собеля и немного линейной алгебры: как я добавил в приложение автоматическое построение перспективы по изображению.

Читать далее

+9

inkedsymon 24 мар в 09:17

В каждом JPEG зашита модель вашей сетчатки. Буквально

Простой

8 мин

51K

Алгоритмы * Обработка изображений * Научно-популярноеСжатие данных * Python *

Обзор

После того как я написал статью про то, что ваш монитор не умеет показывать бирюзовый и 65% видимых цветов для него просто не существуют, один мой знакомый (далекий правда от технической отрасли) спросил: «Окей, монитор врёт, а что тогда делает JPEG с оставшимися 35%?» И это хороший вопрос. Я полез в спеку, а через полчаса забыл, зачем вообще полез. Потому меня уже интересовало другое: ребята, которые в 1992-м финализировали этот стандарт, по сути заревёрсили человеческое зрение и запихнули его в алгоритм сжатия.

И я хочу вам про это рассказать, потому что это самый красивый кусок инженерии, который я видел. В той статье я разбирал, как мало мы на самом деле видим. Здесь — как мало нам на самом деле нужно видеть, чтобы мозг поверил, что видит всё. А потом я решил это проверить руками.

Читать далее

+241

1

2 3 ...