Case · Automation

RPA‑бот (NDA): мониторинг сигналов → мессенджеры/таблица

Скорость: 7 мин → 15 сек (≈–96%). Воркфлоу для роли/отдела: сбор → нормализация → дедуп → маршрутизация.

Роль: Product/Data AnalystТаймлайн: 3 дня (MVP) + 1 неделя стабилизацияСтатус: prod (private)RPAAutomationPythonPlaywrightPandasBot APISchedulingNDA

Один бот вместо ежедневного ручного мониторинга. Новые записи собираются из публичных источников, нормализуются, проверяются на дубли и автоматически улетают в рабочие чаты и в таблицу отчётности.

  • Скорость: 7 мин → 15 сек (≈–96% времени на задачу)
  • Экономия отдела: ~300 000 ₽/мес при текущём объёме
Workflow отделаNDAPlaywright · Pandas · Bot API

Контекст

До

  • Специалисты ежедневно просматривают несколько публичных источников.
  • Отбирают релевантные карточки (текст + медиа), вручную переносят в таблицу.
  • Рассылают в рабочие чаты и следят за статусами.

После

  • RPA‑бот агрегирует новые записи, применяет фильтры релевантности и устраняет дубликаты.
  • Формирует выгрузку в таблицу и автоматически отправляет карточки в профильные чаты (категория/ответственный).
  • Контролирует доставку, ведёт историю, не затрагивает персональные данные.

Задача

Снизить ручной труд, исключить пропуски и ускорить реакцию отдела, соблюдая правила источников.

Что сделал

  • Спроектировал пайплайн сбора и нормализации (разные источники → единая схема).
  • Скрейпинг на Playwright с «человеческими» задержками, ретраями и безопасным логином.
  • Фильтры релевантности: словари/рег.выражения/топонимы + fuzz‑matching.
  • Де‑дуп: SSIM по изображению + Левенштейн по тексту + эвристики по времени/локации.
  • Маршрутизация: отправка в чаты по категориям/ответственным, вложения медиа, deep‑links.
  • Экспорт в таблицу (Excel/CSV) с гиперссылками и условным форматированием.
  • Логи/алерты, контроль SLA, безопасные перезапуски джоб.

Архитектура

  • Источники → парсеры (Playwright) → нормализация схемы.
  • Фильтры релевантностиде‑дуп (SSIM + Levenshtein).
  • Выходы: таблица (.xlsx/.csv) и мессенджеры (категория/ответственный).

Результаты → решение

  • Скорость: ~–96% времени на задачу (7 мин → 15 сек).
  • Экономия отдела: ~300 000 ₽/мес при текущём объёме.
  • 0 пропусков за счёт ретраев и контроля полноты.
  • TTR 1–3 мин от публикации до появления в чате.

Примечание (NDA)

Конкретные источники, селекторы/авторизация и таблица маршрутизации скрыты. Обсудим на приватном созвоне.

Готовы подключиться

Нужно обсудить похожий кейс?

Расскажите коротко о задаче — вернёмся с предложением в течение дня. Открыты к пилотам, MVP и постоянной поддержке.