Первая грузовая компания (ПГК), Москва - Крупнейшая цифровая логистическая компания на ж/д / Статьи / Хабр

Все потоки

ПрофильСтатьи97Посты10Новости1Подписчики

Maxim_Santalov 27 мар в 08:17

Как не дать проекту деградировать при работе с Claude Code: правила, хуки и автоматизация

Средний

12 мин

6K

Блог компании Первая грузовая компания (ПГК)Искусственный интеллектУправление разработкой * Будущее здесь

Туториал

Привет, Хабр! Я Максим, ведущий специалист по анализу данных и ML в логистике. Этот пост — про работу с Claude Code: как я выстроил систему, которая не даёт проекту рассыпаться.

Подопытный кролик — мой пет-проект awesome-project.com (название изменено): AI-ассистент для структурированных сессий, React + TypeScript, Express/Node.js, PostgreSQL, DeepSeek. Соло-проект с реальными пользователями, где Claude Code — основной соисполнитель.

За время разработки я собрал полную коллекцию граблей. Проблема была в отсутствии системы работы с инструментом. Теперь есть. Расскажу, как она устроена и что ещё предстоит починить.

Читать далее

+9

Voronin_N_A_R_W 26 фев в 16:11

Как Гендальфу провести ИИ-хоббитов по fullstack проекту – Тексты

Простой

13 мин

8K

Блог компании Первая грузовая компания (ПГК)DIY или Сделай самИскусственный интеллект

Кейс

Меня зовут Николай, я занимаюсь автоматизацией систем отчётности и анализа в ПГК Диджитал. В этой статье я хочу поделиться опытом ведения личного творческого проекта, где многие функции переложены на нейросети. Это вторая часть цикла, первая статья была посвящена разработке кастомных инструментов под частные специфические задачи моего проекта – цифрового мультимедийного комикса.. Здесь я собираюсь рассказать о создании текстов.

Читать далее

+1

Vesna-krasa 27 янв в 15:55

Совет соседа или совет от DeepSeek?

Простой

7 мин

9.3K

Блог компании Первая грузовая компания (ПГК)Microsoft ExcelИскусственный интеллект

Туториал

Всем привет! Я Дарья Васильева и отвечаю за DevRel в ПГК Диджитал. В этом посте я хочу поделиться своим любимыми лайфхаком в работе с таблицами в программе Excel.

«Пролистываем!» - буркнете вы себе под нос, добавив, что в мире ИИ такие вопросы решаются за одну минуту. И тут вы правы. Но так ли это? Я не гуру Excel, мне он нужен для относительно простых манипуляций с небольшим объемом информации до 300 строк и 15 столбиков.

Описываемый лайфхак не мое ноу-хау, я подсмотрела у коллеги и теперь распространяюсь здесь. В процессе написания статьи мне стало интересно, а как справляется с этой задачей ИИ. Насколько понятно он объясняет пошаговое решение новичку, какие варианты предлагает. Моя задача понять, что лучше совет соседа или совет ИИ? Разбираемся.

Читать далее

+3

Maxim_Santalov 24 дек 2025 в 15:57

Стек начинающего дата-сайентиста в 2026: инструменты для роста

Средний

7 мин

12K

Блог компании Первая грузовая компания (ПГК)Машинное обучение * Карьера в IT-индустрииУчебный процесс в IT

Мнение

Привет! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В свое предыдущей статье я разбирал ошибки в резюме джунов (и не только), которые снижают шансы попасть в ML. Сегодня расскажу, как упорядочить инструменты data scientist'а, чтобы легко адаптироваться в специальности.

Введение

Недавно мне показали проект по прогнозированию ремонта вагонов. Несколько десятков параметров, миллионы записей. Всё решение — один файл Jupyter Notebook и пара скриптов.

Я открыл этот файл. Две тысячи строк кода. Названия переменных вроде df_tmp_final_v3. Комментарии на смеси русского и английского. Сохранённые модели назывались model_good.pkl и model_production_maybe.pkl. Некоторые ячейки кода было страшно запускать. Ни документации, ни записи о проведённых тестах.

Узнаёте? Это частая реальность в области данных.

Вы не одиноки

Многие начинающие специалисты задают похожие вопросы:

Как работать, когда тестов уже несколько десятков? Вы перебираете настройки и алгоритмы, но через неделю не можете вспомнить, что дало лучший результат.

Как внедрить модель? В Notebook всё работает, но как превратить её в сервис, который сможет использовать ваше приложение?

Хорошая новость: для этих проблем уже есть решения.

На курсах об этом часто не говорят...

+8

Voronin_N_A_R_W 27 ноя 2025 в 14:51

Как Гэндальфу провести ИИ-хоббитов по fullstack проекту: Часть 1 – программирование

Простой

14 мин

7K

Блог компании Первая грузовая компания (ПГК)DIY или Сделай сам

Кейс

Привет! Меня зовут Воронин Николай, я занимаюсь автоматизацией систем отчётности и анализа в ПГК Диджитал.

В этой статье я хочу поделиться опытом ведения личного творческого проекта, где многие функции переложены на нейросети. Расскажу об обнаруженных мной особенностях, плюсах и недостатках.

Мой проект – это цифровой мультимедийный комикс. Для его реализации требуется создание программного обеспечения, иллюстрации, музыка и звуки, работа с сюжетом и персонажами. Соответственно четыре AI, которые несут кольцо к финалу проекта это:

· Deepseek – LLM для кодинга.

· Deepseek – LLM для отладки и выверки текстов и проработки сюжетной целостности.

· StableDiffusion – иллюстрации.

· Suno AI – музыкальное сопровождение.

Почему нейросети – хоббиты, и зачем им нужен Гэндальф?

В основном это касается больших языковых моделей (Deepseek, CharGPT, Grok, Gemini, Gigachat и т.п.). Важно понимать, что Искусственный Интеллект – это модное, но неправильное название для нейросети и большой языковой модели – никакого интеллекта там нет. Это очень большой массив хитро размеченной информации с хитрым алгоритмом статистического поиска сначала распознавания вопроса и затем наиболее вероятного ответа. Мыслительного процесса, понимания вопроса и логического построения ответа нет. Нейросети не умеют даже считать, в них просто загружено очень много математических задач с ответами и, получая запрос, нейросеть ищет наиболее вероятный ответ.

Соответственно, чем задача специфичнее – тем больше шанс, что в обучающих материалах по ней было мало информации, нейросеть будет пытаться интерпретировать её через другие задачи, которые по логике разметки кажутся похожими (с точки здравого смысла это может быть не так), и решения будут становится всё более и более странными.

Читать далее

+2

Maxim_Santalov 23 окт 2025 в 14:45

Джун глазами синьора: 5 ошибок в резюме, которые снижают ваши шансы попасть в ML

Простой

6 мин

16K

Блог компании Первая грузовая компания (ПГК)Карьера в IT-индустрииМашинное обучение *

Мнение

Привет! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. И я тот самый человек, который просматривал десятки резюме каждый день во время поиска стажёра или джуна на позицию в нашу компанию. Из 56 кандидатов до оффера дошло два человека. И знаете, что? Большинство отсеялось именно на этапе первичного просмотра резюме — не потому что кандидаты слабые, а потому что не могут правильно себя презентовать.

Важный момент: на позицию джуна мы не искали готового специалиста — иначе искали бы мидла. Нам был нужен человек, который:

- может показать, что он делал своими руками, а не просто "изучал теорию";

- понимает, почему выбрал конкретный подход к решению задачи;

- осознаёт, что ML — это на 80% работа с данными и только на 20% — модели.

Сила резюме начинающего специалиста — в умении показать свой потенциал через конкретные действия, даже если опыта пока немного. Прошли курс? Покажите проект после него. Написали модель? Объясните ход мыслей.

Давайте разберём типичные ошибки на реальных примерах. Имена изменены, ситуации — настоящие.

Читать далее

+10

Maxim_Santalov 30 сен 2025 в 14:13

Оптимизация ремонта грузовых вагонов: от мирового опыта к российской практике

Средний

9 мин

9.1K

Блог компании Первая грузовая компания (ПГК)Машинное обучение * Управление проектами * Будущее здесь

Ретроспектива

Привет, Хабр! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В своей статье расскажу, как мы разработали систему оптимизации распределения вагонов на ремонт для одного из крупнейших железнодорожных операторов России Первой грузовой компании (ПГК). Внедрили методологию оценки экономического эффекта через сравнение с «идеальным сценарием». За два с половиной года работы система обработала рекомендации для более чем 50,000 вагонов.

Читать далее

+5

Vesna-krasa 7 авг 2025 в 13:45

Как развивать DevRel без бюджета: личный опыт и практические советы

Простой

9 мин

5.9K

Блог компании Первая грузовая компания (ПГК)Developer Relations * Управление сообществом *

Мнение

Всем привет! Я Дарья Васильева и отвечаю за DevRel в ПГК Диджитал. В этой статье я расскажу, как мы (я не одна) развиваем наше направление при ограниченном бюджете: делюсь личным опытом, идеями.

Прелюдия. Что такое Devrel

DevRel (Developer Relations) — всё ещё относительно новая сфера для многих компаний. Часто не до конца понятно, кто такие DevRel-ы и чем они занимаются. А литературы по теме почти нет. Могу порекомендовать книгу на английском «The Business Value of Developer Relations».

По сути, DevRel — это человек-оркестр: он соединяет PR, HR, техническое знание, организационные навыки и огромное желание вовлечь команду в общее дело.

Сегодня компании активно привлекают DevRel-ов в условиях острой конкуренции за талантливых IT-профессионалов. Конкуренция возникает на этапе подбора и продолжается после выхода сотрудника — в процессе его адаптации и дальнейшего удержания в компании. Кандидаты всё чаще выбирают работодателя не только по уровню зарплаты, но и обращают внимание на гораздо более широкий спектр факторов: корпоративная культура, ценности компании, наличие интересных и значимых проектов, качество выпускаемой продукции и предоставляемых услуг, а также возможности для личного и профессионального роста.

И здесь на первый план выходит роль специалистов DevRel, которые помогают выстраивать прочные отношения с профессиональным IT-сообществом, транслировать ценности компании во вне, демонстрировать её технологическую экспертизу и культуру.

О главном. DevRel без бюджета: что можно сделать уже сейчас.

Читать далее

+5

BohanDmitry 24 июл 2025 в 13:24

ИИ на подъёме: восхождение к пику ожиданий и первые уроки в реальном бизнесе

Простой

7 мин

3.9K

Блог компании Первая грузовая компания (ПГК)Искусственный интеллектБизнес-модели * Машинное обучение *

Мнение

Где мы все? Судя по классическому циклу зрелости, Large Language Models (LLM) уверенно маршируют к вершине «Пика завышенных ожиданий». Энтузиазм бьёт ключом: каждый день — новые анонсы и инвестиции. Как руководитель отдела инновационных проектов в «Первой Грузовой компании», я вижу этот ажиотаж и сам погружен в изучение потенциала LLM для нашей отрасли. Иллюзия всесильности ИИ сейчас сильна как никогда. Мы сейчас явно находимся на пике завышенных ожиданий.

Читать далее

+6

Voronin_N_A_R_W 10 июл 2025 в 15:26

Мета-ориентирование, баланс между классическим документированием и автодокументированием

Простой

12 мин

1.9K

Блог компании Первая грузовая компания (ПГК)Базы данных * Подготовка технической документации * Реверс-инжиниринг *

Мнение

Добрый день! Меня зовут Воронин Николай, я занимаюсь автоматизацией систем отчётности и анализа в ПГК Диджитал.

Моя статья является структурированием личного опыта, полученного в конкретных условиях, он не претендует на статус best‑practice, допускает ситуации, в которых могут существовать более эффективные решения или проблема не стоит в целом.

Мета‑ориентирование — это общее название, в рамках статьи, для совокупности навыков и подходов, облегчающих понимание частных алгоритмов и потоков данных в большой системе со сложными связями между множеством объектов.

В моём случае речь пойдёт о комплексе нескольких BI систем, существующих параллельно, но сложности вполне могут возникать и в рамках одной, достаточно массивной системы отчётности.

Читать далее

+4

FreightOne 26 июн 2025 в 10:33

Прокачаться в data science: блоги и каналы

7 мин

11K

Блог компании Первая грузовая компания (ПГК)Учебный процесс в ITМашинное обучение * Анализ и проектирование систем * Data Engineering *

Обзор

Делимся блогами, посвященными машинному обучению и data science. Материалы от практикующих дата-сайентистов, программистов, физиков и биоинформатиков будут интересны как начинающим, так и «прожженным» специалистам.

Читать далее

+11

huraligne 5 июн 2025 в 15:19

RAG: Дообучение модели эмбеддингов для повышения точности поиска

10 мин

11K

Блог компании Первая грузовая компания (ПГК)Машинное обучение * Искусственный интеллект

Привет, Хабр! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы продолжаем серию статей, в которой я рассказываю о том, как мы с командой разрабатывали ИИ-помощника. В прошлой статье мы обсудили, почему стандартные подходы к работе с документами не всегда работают, и какие шаги помогли нам повысить качество поиска без существенных затрат памяти на GPU.

Сегодня речь пойдёт о следующем этапе: дообучении (fine-tuning) модели эмбеддингов для улучшения качества поиска в RAG-системе. Это позволило нам получить более точные представления документов и пользовательских запросов, что напрямую сказалось на релевантности финальных ответов. Давайте перейдём к деталям.

Читать далее

+9

iliaslasten 25 мая 2025 в 16:31

Нейминг без боли: архитектура токенов в дизайн-системах через библиотечную структуру

Средний

6 мин

10K

Блог компании Первая грузовая компания (ПГК)Дизайн

Туториал

Привет, Хабр. Я Илья Сластен, продуктовый дизайнер интерактивной карты ПГК Диджитал. Ранее в своих статьях я рассказывал о ключевых аспектах работы с локальными переменными в Figma и подход Atomic Design и о минимализме в дизайне. Сегодня поговорим о нейминге.

Когда создаешь дизайн-систему, кажется, что главное — создать компоненты, настроить сетки, собрать библиотеку в Figma. Но на деле одна из самых сложных частей — это разобраться с токенами: как их называть, как их организовать, и как всё это выстроить так, чтобы было удобно и дизайнерам, и разработчикам. Без этого система быстро превращается в кашу.

В этой статье я покажу, как на практике организовать токены и Figma-библиотеки так, чтобы масштабирование не превращалось в хаос. Мы разберём уровни абстракции токенов, способы нейминга, таксономию и подход к построению библиотек на 4-х уровнях:

Читать далее

+7

Triumfrus 24 апр 2025 в 15:47

Введение в MLflow: настройка и запуск

Простой

6 мин

3.8K

Блог компании Первая грузовая компания (ПГК)DevOps * Python *

Туториал

Введение в MLflow: настройка и запуск

Привет, Хабр! Я Александр Кузьмичёв, специалист по анализу данных и машинному обучению в ПГК Диджитал. Мы в компании занимаемся разработкой цифровых продуктов для железнодорожных грузоперевозок. Ранее я рассказывал о том, как открытая платформа MLflow помогает нам в работе.

В этой серии статей я хотел бы поделиться с вами увлекательным путешествием в мир MLflow, Optuna, AutoML и развёртывания моделей с помощью MLflow.

Сегодня мы заложим фундамент, начнём с вводной статьи. Я расскажу, как установить и настроить MLflow, а также как опубликовать его с доступом в интернет. Это пригодится для мини- и пет-проектов. В дальнейшем добавлю функционал по логированию, что значительно упростит процесс работы с моделями.

Читать далее

+1

huraligne 10 апр 2025 в 15:37

RAG: борьба с низким качеством ответов в условиях экономии памяти на GPU

9 мин

9.9K

Блог компании Первая грузовая компания (ПГК)Машинное обучение * Искусственный интеллектNatural Language Processing *

Привет, Хабр! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы начинаем серию статей, в которой я расскажу о том, как мы с командой разрабатывали ИИ-помощника, а также приведу практические кейсы по улучшению точности ответов с минимальными затратами памяти графических процессоров.

Как вы уже могли догадаться, наш ИИ-помощник разработан на основе RAG (Retrieval-Augmented Generation) системы. Хотя принцип работы RAG многим уже знаком и не вызывает того самого «вау», я всё же кратко напомню, как эта система работает, почему она так популярна и почему её ответам можно доверять.

В этой статье я расскажу, как мы разрабатывали RAG-систему для юридического отдела нашей компании, с какими вызовами столкнулись и как их преодолевали. Вы узнаете, почему стандартные подходы не всегда работают, и как, погрузившись в специфику данных, мы смогли значительно улучшить качество ответов, сохранив при этом экономию ресурсов GPU.

Читать далее

+8

kunitsynpv 27 мар 2025 в 12:48

Частые ловушки в экспериментах машинного обучения — рассказываем, что следует знать

Простой

5 мин

5.1K

Блог компании Первая грузовая компания (ПГК)Анализ и проектирование систем * Машинное обучение * Учебный процесс в ITData Engineering *

Мнение

Привет, Хабр! Я Павел Куницын, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. Мы занимаемся разработкой цифровых продуктов в сфере железнодорожных грузоперевозок: интерактивной карты вагонного парка, оптимизатора ремонтов и других решений. В большинстве из них мы применяем машинное обучение.

О том, как мы подходим к этому, я и мои коллеги рассказываем в нашем блоге на Хабре. Например, мы работаем с MLflow, который помогает анализировать результаты и вести учет экспериментов. Но несмотря на доступную автоматизацию, на этапе экспериментов могут возникать определённые сложности. Расскажу о наиболее частых проблемах.

Читать далее

+13

iliaslasten 18 мар 2025 в 15:35

Принципы минимализма в UX/UI: парадокс «меньше — значит больше»

Средний

6 мин

7.6K

Блог компании Первая грузовая компания (ПГК)ДизайнПрототипирование * Векторная графика *

Мнение

Привет, Хабр. Я Илья Сластен, продуктовый дизайнер интерактивной карты ПГК Диджитал. В своей предыдущей статье я рассмотрел ключевые аспекты работы с локальными переменными в Figma и подход Atomic Design. Сегодня предлагаю поговорить о минимализме в дизайне.

В мире, где цифровая реальность меняется стремительно, а каждый клик важен, создание успешных веб-сайтов и приложений становится задачей, от решения которой зависит многое. Говоря о самых успешных подходах, минимализм в дизайне выходит на передний план. Это не просто эстетический выбор, это философия, которая стремится к ясности, эффективности и функциональности. Как же принцип «меньше — значит больше» помогает нам создавать более удобные и интуитивно понятные интерфейсы? Давайте разберемся.

Читать далее

+5

slkorneev 26 фев 2025 в 15:31

Как мы создали Telegram-бот и увеличили эффективность осмотра вагонов

5 мин

7K

Блог компании Первая грузовая компания (ПГК)Мессенджеры *

Привет, Хабр! Меня зовут Сергей Корнеев, я руководитель направления аналитики отдела прототипирования в ПГК Диджитал. Мы занимаемся разработкой пилотных цифровых решений (Proof of concept, MVP), которые упрощают жизнь нашим коллегам и способствуют повышению эффективности бизнеса.

В этой статье расскажу, как мы задумались над процессом осмотра вагонов, как IT-решения помогают бизнесу и почему мы выбрали Telegram-бот, а не другие варианты.

Читать далее

+7

RLents 6 фев 2025 в 15:39

DeepSeek и Qwen 2.5 против ChatGPT: как китайские компании запустили новый скачок в мире ИИ

Простой

6 мин

25K

Блог компании Первая грузовая компания (ПГК)Искусственный интеллектМашинное обучение * Будущее здесь

Мнение

В последние недели мир искусственного интеллекта (ИИ) был потрясен значительными достижениями китайских компаний, особенно DeepSeek и Alibaba, которые представили свои передовые модели — DeepSeek-R1 и Qwen 2.5-Max соответственно. Конечно же, эти события вызвали широкий резонанс в технологическом сообществе и привели к обсуждению будущего ИИ.

Меня зовут Роман Ленц, я начальник отдела анализа данных и машинного обучения ПГК Диджитал — цифровой дочки Первой грузовой компании – крупнейшего частного оператора грузовых железнодорожных перевозок в России. В этой статье мы разберемся, что за «зверь» этот DeepSeek и Qwen и что их появление значит для мира ИИ?

Читать далее

+9

artur_temievich 23 янв 2025 в 15:30

ИИ на путях: как решить задачу перепланирования расписания движения поездов

Сложный

8 мин

2.7K

Блог компании Первая грузовая компания (ПГК)Машинное обучение * Искусственный интеллект

Привет, Хабр. Я Артур Саакян, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. Мы разрабатываем уникальные цифровые продукты для железнодорожных перевозок, такие как оптимизация ЖД перевозок, навигатор, ЖД карты, цифровой вагон и так далее.

В этой статье опишу подход к оптимизации расписания поездов в реальном времени при помощи обучения с подкреплением (RL), который применим и к российским грузовым ж/д перевозкам, но пока не используется. Тезисы статьи:

1. Перепланирование расписания движения поездов (Train Timetable Rescheduling)
2. Коротко об RL и Q-learning
3. Моделирование железнодорожной среды
4. Заключение

Читать далее

+6

1