Обновить
8K+
Первая грузовая компания (ПГК)
Крупнейшая цифровая логистическая компания на ж/д
65,78
Рейтинг
202
Подписчики
Сначала показывать

Как не дать проекту деградировать при работе с Claude Code: правила, хуки и автоматизация

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели6K

Привет, Хабр! Я Максим, ведущий специалист по анализу данных и ML в логистике. Этот пост — про работу с Claude Code: как я выстроил систему, которая не даёт проекту рассыпаться.

Подопытный кролик — мой пет-проект awesome-project.com (название изменено): AI-ассистент для структурированных сессий, React + TypeScript, Express/Node.js, PostgreSQL, DeepSeek. Соло-проект с реальными пользователями, где Claude Code — основной соисполнитель.

За время разработки я собрал полную коллекцию граблей. Проблема была в отсутствии системы работы с инструментом. Теперь есть. Расскажу, как она устроена и что ещё предстоит починить.

Читать далее

Как Гендальфу провести ИИ-хоббитов по fullstack проекту – Тексты

Уровень сложностиПростой
Время на прочтение13 мин
Охват и читатели8K

Меня зовут Николай, я занимаюсь автоматизацией систем отчётности и анализа в ПГК Диджитал. В этой статье я хочу поделиться опытом ведения личного творческого проекта, где многие функции переложены на нейросети. Это вторая часть цикла, первая статья была посвящена разработке кастомных инструментов под частные специфические задачи моего проекта – цифрового мультимедийного комикса.. Здесь я собираюсь рассказать о создании текстов.

Читать далее

Совет соседа или совет от DeepSeek?

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели9.3K

Всем привет! Я Дарья Васильева и отвечаю за DevRel в ПГК Диджитал. В этом посте я хочу поделиться своим любимыми лайфхаком в работе с таблицами в программе Excel.

«Пролистываем!» -  буркнете вы себе под нос, добавив, что в мире ИИ такие вопросы решаются за одну минуту. И тут вы правы. Но так ли это? Я не гуру Excel, мне он нужен для относительно простых манипуляций с небольшим объемом информации до 300 строк и 15 столбиков.  

Описываемый лайфхак не мое ноу-хау, я подсмотрела у коллеги и теперь распространяюсь здесь. В процессе написания статьи мне стало интересно, а как справляется с этой задачей ИИ. Насколько понятно он объясняет пошаговое решение новичку, какие варианты предлагает. Моя задача понять, что лучше совет соседа или совет ИИ? Разбираемся.

Читать далее

Стек начинающего дата-сайентиста в 2026: инструменты для роста

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели12K

Привет! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В свое предыдущей статье я разбирал ошибки в резюме джунов (и не только), которые снижают шансы попасть в ML. Сегодня расскажу, как упорядочить инструменты data scientist'а, чтобы легко адаптироваться в специальности.

Введение

Недавно мне показали проект по прогнозированию ремонта вагонов. Несколько десятков параметров, миллионы записей. Всё решение — один файл Jupyter Notebook и пара скриптов.

Я открыл этот файл. Две тысячи строк кода. Названия переменных вроде df_tmp_final_v3. Комментарии на смеси русского и английского. Сохранённые модели назывались model_good.pkl и model_production_maybe.pkl. Некоторые ячейки кода было страшно запускать. Ни документации, ни записи о проведённых тестах.

Узнаёте? Это частая реальность в области данных.

Вы не одиноки

Многие начинающие специалисты задают похожие вопросы:

Как работать, когда тестов уже несколько десятков? Вы перебираете настройки и алгоритмы, но через неделю не можете вспомнить, что дало лучший результат.

Как внедрить модель? В Notebook всё работает, но как превратить её в сервис, который сможет использовать ваше приложение?

Хорошая новость: для этих проблем уже есть решения.

На курсах об этом часто не говорят...

Как Гэндальфу провести ИИ-хоббитов по fullstack проекту: Часть 1 – программирование

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели7K

Привет! Меня зовут Воронин Николай, я занимаюсь автоматизацией систем отчётности и анализа в ПГК Диджитал.

В этой статье я хочу поделиться опытом ведения личного творческого проекта, где многие функции переложены на нейросети. Расскажу об обнаруженных мной особенностях, плюсах и недостатках.

Мой проект – это цифровой мультимедийный комикс. Для его реализации требуется создание программного обеспечения, иллюстрации, музыка и звуки, работа с сюжетом и персонажами. Соответственно четыре AI, которые несут кольцо к финалу проекта это:

·         Deepseek – LLM для кодинга.

·         Deepseek – LLM для отладки и выверки текстов и проработки сюжетной целостности.

·         StableDiffusion – иллюстрации.

·         Suno AI – музыкальное сопровождение.

Почему нейросети – хоббиты, и зачем им нужен Гэндальф?

В основном это касается больших языковых моделей (Deepseek, CharGPT, Grok, Gemini, Gigachat и т.п.). Важно понимать, что Искусственный Интеллект – это модное, но неправильное название для нейросети и большой языковой модели – никакого интеллекта там нет. Это очень большой массив хитро размеченной информации с хитрым алгоритмом статистического поиска сначала распознавания вопроса и затем наиболее вероятного ответа. Мыслительного процесса, понимания вопроса и логического построения ответа нет. Нейросети не умеют даже считать, в них просто загружено очень много математических задач с ответами и, получая запрос, нейросеть ищет наиболее вероятный ответ.

Соответственно, чем задача специфичнее – тем больше шанс, что в обучающих материалах по ней было мало информации, нейросеть будет пытаться интерпретировать её через другие задачи, которые по логике разметки кажутся похожими (с точки здравого смысла это может быть не так), и решения будут становится всё более и более странными.

Читать далее

Джун глазами синьора: 5 ошибок в резюме, которые снижают ваши шансы попасть в ML

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели16K

Привет! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. И я тот самый человек, который просматривал десятки резюме каждый день во время поиска  стажёра или джуна на позицию в нашу компанию. Из 56 кандидатов до оффера дошло два человека. И знаете, что? Большинство отсеялось именно на этапе первичного просмотра резюме — не потому что кандидаты слабые, а потому что не могут правильно себя презентовать.

Важный момент: на позицию джуна мы не искали готового специалиста — иначе искали бы мидла. Нам был нужен человек, который:

- может показать, что он делал своими руками, а не просто "изучал теорию";

- понимает, почему выбрал конкретный подход к решению задачи;

- осознаёт, что ML — это на 80% работа с данными и только на 20% — модели.

Сила резюме начинающего специалиста — в умении показать свой потенциал через конкретные действия, даже если опыта пока немного. Прошли курс? Покажите проект после него. Написали модель? Объясните ход мыслей.

Давайте разберём типичные ошибки на реальных примерах. Имена изменены, ситуации — настоящие.

Читать далее

Оптимизация ремонта грузовых вагонов: от мирового опыта к российской практике

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели9.1K

Привет, Хабр! Я Максим Катрушенко, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. В своей статье расскажу, как мы разработали систему оптимизации распределения вагонов на ремонт для одного из крупнейших железнодорожных операторов России Первой грузовой компании (ПГК). Внедрили методологию оценки экономического эффекта через сравнение с «идеальным сценарием». За два с половиной года работы система обработала рекомендации для более чем 50,000 вагонов.

Читать далее

Как развивать DevRel без бюджета: личный опыт и практические советы

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.9K

Всем привет! Я Дарья Васильева и отвечаю за DevRel в ПГК Диджитал. В этой статье я расскажу, как мы (я не одна) развиваем наше направление при ограниченном бюджете: делюсь личным опытом, идеями.

Прелюдия. Что такое Devrel

DevRel (Developer Relations) — всё ещё относительно новая сфера для многих компаний. Часто не до конца понятно, кто такие DevRel-ы и чем они занимаются. А литературы по теме почти нет. Могу порекомендовать книгу на английском «The Business Value of Developer Relations».

По сути, DevRel — это человек-оркестр: он соединяет PR, HR, техническое знание, организационные навыки и огромное желание вовлечь команду в общее дело.

Сегодня компании активно привлекают DevRel-ов в условиях острой конкуренции за талантливых IT-профессионалов. Конкуренция возникает на этапе подбора и продолжается после выхода сотрудника — в процессе его адаптации и дальнейшего удержания в компании. Кандидаты всё чаще выбирают работодателя не только по уровню зарплаты, но и обращают внимание на гораздо более широкий спектр факторов: корпоративная культура, ценности компании, наличие интересных и значимых проектов, качество выпускаемой продукции и предоставляемых услуг, а также возможности для личного и профессионального роста.

И здесь на первый план выходит роль специалистов DevRel, которые помогают выстраивать прочные отношения с профессиональным IT-сообществом, транслировать ценности компании во вне, демонстрировать её технологическую экспертизу и культуру.

О главном. DevRel без бюджета: что можно сделать уже сейчас.

Читать далее

ИИ на подъёме: восхождение к пику ожиданий и первые уроки в реальном бизнесе

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели3.9K

Где мы все? Судя по классическому циклу зрелости, Large Language Models (LLM) уверенно маршируют к вершине «Пика завышенных ожиданий». Энтузиазм бьёт ключом: каждый день — новые анонсы и инвестиции. Как руководитель отдела инновационных проектов в «Первой Грузовой компании», я вижу этот ажиотаж и сам погружен в изучение потенциала LLM для нашей отрасли. Иллюзия всесильности ИИ сейчас сильна как никогда. Мы сейчас явно находимся на пике завышенных ожиданий.

Читать далее

Мета-ориентирование, баланс между классическим документированием и автодокументированием

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели1.9K

Добрый день! Меня зовут Воронин Николай, я занимаюсь автоматизацией систем отчётности и анализа в ПГК Диджитал.

Моя статья является структурированием личного опыта, полученного в конкретных условиях, он не претендует на статус best‑practice, допускает ситуации, в которых могут существовать более эффективные решения или проблема не стоит в целом.

Мета‑ориентирование — это общее название, в рамках статьи, для совокупности навыков и подходов, облегчающих понимание частных алгоритмов и потоков данных в большой системе со сложными связями между множеством объектов.

В моём случае речь пойдёт о комплексе нескольких BI систем, существующих параллельно, но сложности вполне могут возникать и в рамках одной, достаточно массивной системы отчётности.

Читать далее

Прокачаться в data science: блоги и каналы

Время на прочтение7 мин
Охват и читатели11K

Делимся блогами, посвященными машинному обучению и data science. Материалы от практикующих дата-сайентистов, программистов, физиков и биоинформатиков будут интересны как начинающим, так и «прожженным» специалистам.

Читать далее

RAG: Дообучение модели эмбеддингов для повышения точности поиска

Время на прочтение10 мин
Охват и читатели11K

Привет, Хабр! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы продолжаем серию статей, в которой я рассказываю о том, как мы с командой разрабатывали ИИ-помощника. В прошлой статье мы обсудили, почему стандартные подходы к работе с документами не всегда работают, и какие шаги помогли нам повысить качество поиска без существенных затрат памяти на GPU.

Сегодня речь пойдёт о следующем этапе: дообучении (fine-tuning) модели эмбеддингов для улучшения качества поиска в RAG-системе. Это позволило нам получить более точные представления документов и пользовательских запросов, что напрямую сказалось на релевантности финальных ответов. Давайте перейдём к деталям.

Читать далее

Нейминг без боли: архитектура токенов в дизайн-системах через библиотечную структуру

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели10K

Привет, Хабр. Я Илья Сластен, продуктовый дизайнер интерактивной карты ПГК Диджитал. Ранее в своих статьях я рассказывал о ключевых аспектах работы с локальными переменными в Figma и подход Atomic Design и о минимализме в дизайне. Сегодня поговорим о нейминге.

Когда создаешь дизайн-систему, кажется, что главное — создать компоненты, настроить сетки, собрать библиотеку в Figma. Но на деле одна из самых сложных частей — это разобраться с токенами: как их называть, как их организовать, и как всё это выстроить так, чтобы было удобно и дизайнерам, и разработчикам. Без этого система быстро превращается в кашу.

В этой статье я покажу, как на практике организовать токены и Figma-библиотеки так, чтобы масштабирование не превращалось в хаос. Мы разберём уровни абстракции токенов, способы нейминга, таксономию и подход к построению библиотек на 4-х уровнях:

Читать далее

Введение в MLflow: настройка и запуск

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели3.8K

Введение в MLflow: настройка и запуск

Привет, Хабр! Я Александр Кузьмичёв, специалист по анализу данных и машинному обучению в ПГК Диджитал. Мы в компании занимаемся разработкой цифровых продуктов для железнодорожных грузоперевозок. Ранее я рассказывал о том, как открытая платформа MLflow помогает нам в работе.

В этой серии статей я хотел бы поделиться с вами увлекательным путешествием в мир MLflow, Optuna, AutoML и развёртывания моделей с помощью MLflow.

Сегодня мы заложим фундамент, начнём с вводной статьи.  Я расскажу, как установить и настроить MLflow, а также как опубликовать его с доступом в интернет. Это пригодится для мини- и пет-проектов. В дальнейшем добавлю функционал по логированию, что значительно упростит процесс работы с моделями.

Читать далее

Ближайшие события

RAG: борьба с низким качеством ответов в условиях экономии памяти на GPU

Время на прочтение9 мин
Охват и читатели9.9K

Привет, Хабр! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы начинаем серию статей, в которой я расскажу о том, как мы с командой разрабатывали ИИ-помощника, а также приведу практические кейсы по улучшению точности ответов с минимальными затратами памяти графических процессоров. 

Как вы уже могли догадаться, наш ИИ-помощник разработан на основе RAG (Retrieval-Augmented Generation) системы. Хотя принцип работы RAG многим уже знаком и не вызывает того самого «вау», я всё же кратко напомню, как эта система работает, почему она так популярна и почему её ответам можно доверять.

В этой статье я расскажу, как мы разрабатывали RAG-систему для юридического отдела нашей компании, с какими вызовами столкнулись и как их преодолевали. Вы узнаете, почему стандартные подходы не всегда работают, и как, погрузившись в специфику данных, мы смогли значительно улучшить качество ответов, сохранив при этом экономию ресурсов GPU.

Читать далее

Частые ловушки в экспериментах машинного обучения — рассказываем, что следует знать

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.1K

Привет, Хабр! Я Павел Куницын, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. Мы занимаемся разработкой цифровых продуктов в сфере железнодорожных грузоперевозок: интерактивной карты вагонного парка, оптимизатора ремонтов и других решений. В большинстве из них мы применяем машинное обучение.

О том, как мы подходим к этому, я и мои коллеги рассказываем в нашем блоге на Хабре. Например, мы работаем с MLflow, который помогает анализировать результаты и вести учет экспериментов. Но несмотря на доступную автоматизацию, на этапе экспериментов могут возникать определённые сложности. Расскажу о наиболее частых проблемах.

Читать далее

Принципы минимализма в UX/UI: парадокс «меньше — значит больше»

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.6K

Привет, Хабр. Я Илья Сластен, продуктовый дизайнер интерактивной карты ПГК Диджитал. В своей предыдущей статье я рассмотрел ключевые аспекты работы с локальными переменными в Figma и подход Atomic Design. Сегодня предлагаю поговорить о минимализме в дизайне.

В мире, где цифровая реальность меняется стремительно, а каждый клик важен, создание успешных веб-сайтов и приложений становится задачей, от решения которой зависит многое. Говоря о самых успешных подходах, минимализм в дизайне выходит на передний план. Это не просто эстетический выбор, это философия, которая стремится к ясности, эффективности и функциональности. Как же принцип «меньше — значит больше» помогает нам создавать более удобные и интуитивно понятные интерфейсы? Давайте разберемся.

Читать далее

Как мы создали Telegram-бот и увеличили эффективность осмотра вагонов

Время на прочтение5 мин
Охват и читатели7K

Привет, Хабр! Меня зовут Сергей Корнеев, я руководитель направления аналитики отдела прототипирования в ПГК Диджитал. Мы занимаемся разработкой пилотных цифровых решений (Proof of concept, MVP), которые упрощают жизнь нашим коллегам и способствуют повышению эффективности бизнеса.

В этой статье расскажу, как мы задумались над процессом осмотра вагонов, как IT-решения помогают бизнесу и почему мы выбрали Telegram-бот, а не другие варианты.

Читать далее

DeepSeek и Qwen 2.5 против ChatGPT: как китайские компании запустили новый скачок в мире ИИ

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели25K

В последние недели мир искусственного интеллекта (ИИ) был потрясен значительными достижениями китайских компаний, особенно DeepSeek и Alibaba, которые представили свои передовые модели — DeepSeek-R1 и Qwen 2.5-Max соответственно. Конечно же, эти события вызвали широкий резонанс в технологическом сообществе и привели к обсуждению будущего ИИ.

Меня зовут Роман Ленц, я начальник отдела анализа данных и машинного обучения ПГК Диджитал — цифровой дочки Первой грузовой компании – крупнейшего частного оператора грузовых железнодорожных перевозок в России. В этой статье мы разберемся, что за «зверь» этот DeepSeek и Qwen и что их появление значит для мира ИИ?

Читать далее

ИИ на путях: как решить задачу перепланирования расписания движения поездов

Уровень сложностиСложный
Время на прочтение8 мин
Охват и читатели2.7K

Привет, Хабр. Я Артур Саакян, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. Мы разрабатываем уникальные цифровые продукты для железнодорожных перевозок, такие как оптимизация ЖД перевозок, навигатор, ЖД карты, цифровой вагон и так далее.

В этой статье опишу подход к оптимизации расписания поездов в реальном времени при помощи обучения с подкреплением (RL), который применим и к российским грузовым ж/д перевозкам, но пока не используется. Тезисы статьи:

1. Перепланирование расписания движения поездов (Train Timetable Rescheduling)
2. Коротко об RL и Q-learning
3. Моделирование железнодорожной среды
4. Заключение

Читать далее

Информация

Сайт
pgk.ru
Дата регистрации
Дата основания
Численность
1 001–5 000 человек
Местоположение
Россия