Case · Automation
RPA‑бот (NDA): мониторинг сигналов → мессенджеры/таблица
Скорость: 7 мин → 15 сек (≈–96%). Воркфлоу для роли/отдела: сбор → нормализация → дедуп → маршрутизация.
Роль: Product/Data AnalystТаймлайн: 3 дня (MVP) + 1 неделя стабилизацияСтатус: prod (private)RPAAutomationPythonPlaywrightPandasBot APISchedulingNDA
Один бот вместо ежедневного ручного мониторинга. Новые записи собираются из публичных источников, нормализуются, проверяются на дубли и автоматически улетают в рабочие чаты и в таблицу отчётности.
- Скорость: 7 мин → 15 сек (≈–96% времени на задачу)
- Экономия отдела: ~300 000 ₽/мес при текущём объёме
Workflow отделаNDAPlaywright · Pandas · Bot API
Контекст
До
- Специалисты ежедневно просматривают несколько публичных источников.
- Отбирают релевантные карточки (текст + медиа), вручную переносят в таблицу.
- Рассылают в рабочие чаты и следят за статусами.
После
- RPA‑бот агрегирует новые записи, применяет фильтры релевантности и устраняет дубликаты.
- Формирует выгрузку в таблицу и автоматически отправляет карточки в профильные чаты (категория/ответственный).
- Контролирует доставку, ведёт историю, не затрагивает персональные данные.
Задача
Снизить ручной труд, исключить пропуски и ускорить реакцию отдела, соблюдая правила источников.
Что сделал
- Спроектировал пайплайн сбора и нормализации (разные источники → единая схема).
- Скрейпинг на Playwright с «человеческими» задержками, ретраями и безопасным логином.
- Фильтры релевантности: словари/рег.выражения/топонимы + fuzz‑matching.
- Де‑дуп: SSIM по изображению + Левенштейн по тексту + эвристики по времени/локации.
- Маршрутизация: отправка в чаты по категориям/ответственным, вложения медиа, deep‑links.
- Экспорт в таблицу (Excel/CSV) с гиперссылками и условным форматированием.
- Логи/алерты, контроль SLA, безопасные перезапуски джоб.
Архитектура
- Источники → парсеры (Playwright) → нормализация схемы.
- Фильтры релевантности → де‑дуп (SSIM + Levenshtein).
- Выходы: таблица (.xlsx/.csv) и мессенджеры (категория/ответственный).
Результаты → решение
- Скорость: ~–96% времени на задачу (7 мин → 15 сек).
- Экономия отдела: ~300 000 ₽/мес при текущём объёме.
- 0 пропусков за счёт ретраев и контроля полноты.
- TTR 1–3 мин от публикации до появления в чате.
Примечание (NDA)
Конкретные источники, селекторы/авторизация и таблица маршрутизации скрыты. Обсудим на приватном созвоне.
Готовы подключиться
Нужно обсудить похожий кейс?
Расскажите коротко о задаче — вернёмся с предложением в течение дня. Открыты к пилотам, MVP и постоянной поддержке.