Перейти к содержимому
На главнуюМетодология

Как мы считаем — открыто

Никакой магии. Каждая цифра в нашем анализе — это понятная метрика на базе ~20 млн тендеров. Ниже — два уровня: коротко для всех и формула для тех, кто хочет проверить.

Основные метрики

Пять метрик, которые мы показываем сразу

Каждая метрика объяснена просто — а если хотите формулу, разверните блок «Технически».

TAM — общий размер рынка

Потолок: сколько денег в вашей нише за год

Просто

TAM — сумма всех денег в госзакупках за год по тем ОКПД2-кодам, где работает ваша компания. Это «потолок»: сколько максимально можно было бы заработать, выиграв вообще все тендеры в своей нише.

Технически — подробнее
TAM = Σ  НМЦК(t)   по всем t ∈ T

T — все тендеры за период с ОКПД2, совпадающим с вашими; НМЦК — начальная максимальная цена контракта. Вычисляется на 19.94 млн строк parquet через DuckDB. Есть 3 определения TAM (raw / filtered / narrow) — берём narrow (фильтр по supplier-specific ключевым словам) для более реалистичной оценки.

SAM — что реально достижимо для вас

Часть TAM, где вы можете участвовать

Просто

SAM — часть TAM, где вы можете участвовать с вашими возможностями. Не все тендеры в вашем ОКПД2 — для вас: где-то нужна сертификация, где-то не подходит регион, где-то слишком большой объём.

Технически — подробнее
SAM = Σ  НМЦК(t)   по t ∈ M(HIGH)

M(HIGH) — тендеры, которым matcher v9.3 присвоил confidence ≥ HIGH по вашему ИНН. Аннуализируется через period_years. Если данных matcher'а нет (новый ИНН) — используем proxy из supplier_pw_okpd_breakdown (826K записей): средний объём на одного поставщика в ваших нишах. Помечается как sam_estimate: true.

SOM — что вы реально заработаете

Реалистичный план на год, а не потолок

Просто

SOM — из SAM то, что вы реально выиграете при ваших ценах и условиях. Это уже не «потолок», а реалистичный план на год.

Технически — подробнее
SOM = SAM × verified_GO_rate × win_rate × margin

verified_GO_rate = (GO + CAUTION·θ) / total(HIGH) — вердикт Stage 3 LLM-классификатора; win_rate — байесовское обновление 51% baseline с приором Beta(18.87, 18.13); margin — отраслевой baseline 5–35%. Три сценария (conservative / realistic / optimistic) с разным θ.

ML-прогноз вероятности победы

Насколько просядет цена и каков ваш шанс

Просто

Для каждого тендера ML-модель (обучена на 19.94 млн исторических данных) даёт: вероятность, что цена упадёт на X%, вероятность, что вы выиграете, и ключевые факторы, влияющие на исход.

Технически — подробнее
drop_pct → квантили q10 … q90  +  декомпозиция KIPA

Модель v8.2-full (multilingual-e5-large encoder + ML head), обучена на 234M исторических предсказаний. Возвращает квантили q10..q90 для прогноза drop_pct (падение цены) и декомпозицию KIPA (Конкуренция, История, Прогноз цены, Адекватность НМЦ). Калибровка через temperature scaling. Латентность: 50–100 мс warm, до 13 с cold start.

Matcher v9.3 — как мы находим «ваши» тендеры

3 ступени: SQL-фильтр → AI-уточнение → вердикт

Просто

Matcher состоит из 3 ступеней: (1) SQL-фильтр отбирает кандидатов по ОКПД2 и ключевым словам — быстро, но грубо; (2) AI-уточнение проверяет описание тендера и отсеивает ложные срабатывания; (3) финальная верификация присваивает вердикт GO / CAUTION / SKIP. Для аналитики используем только HIGH-confidence (точности достаточно).

Технически — подробнее
Stage 1 (FTS5)  →  Stage 2 (LLM re-rank)  →  Stage 3 (вердикт)

Stage 1: SQL FTS5 на нормализованных order_name + okpd2_codes + region. Stage 2: OpenRouter LLM (Claude Opus 4 / DeepSeek v3) для re-ranking top кандидатов через structured prompts. Stage 3: rule-based + LLM-вердикт (GO / CAUTION / SKIP / уточнить у заказчика). Confidence: HIGH (90%+) / MEDIUM / LOW. Пример — 8237 HIGH-матчей по Kunder.

Продвинутые метрики

Для тех, кто копает глубже: концентрация рынка и ценность заказчиков во времени.

HHI — концентрация конкуренции

Много мелких игроков или несколько монополистов

Просто

HHI показывает: много мелких поставщиков (низкая концентрация — можно зайти) или несколько монополистов держат рынок (высокая концентрация — вход сложный). Чем ниже — тем легче конкурировать.

Технически — подробнее
HHI = Σ  sᵢ²  × 10000

sᵢ — доля рынка i-го поставщика. Шкала: <1500 LOW (competitive), 1500–2500 MODERATE, >2500 HIGH (oligopolistic). Считаем и по покупателям (заказчики), и по поставщикам (конкуренты).

Customer LTV — ценность долгосрочного заказчика

Сколько принесёт один заказчик за N лет

Просто

LTV — сколько денег один заказчик принесёт за N лет, если будет с вами работать. Если госзаказчик в первый год дал контракт на 1 млн ₽ и останется 3 года — LTV(3y) ≈ 2.5 млн (не каждый год полная сумма + дисконт). Помогает понять, кто из заказчиков ценнее всего.

Технически — подробнее
LTV(N) = Σ  annual_value · retentionʸ / (1+discount)^(y−1)

Сумма по y = 1..N. retention оценивается как repeat_count / possible_repeats — доля заказчиков, делавших повторные тендеры год спустя. Discount = 12%.

Разобранный пример

Как 20 млн тендеров превращаются в 392 «ваших» — на примере Kunder

Это наш публичный кейс. Те же 4 шага проходит анализ по любому ИНН.

1

Каталог из истории

По ИНН подняли историю участия и подтвердили 11 актуальных товарных категорий (силиконовые изделия для детей и медицины).

2

Stage 1 — широкий отбор

FTS5-поиск по ~20 млн тендеров дал 8 237 кандидатов. Большинство — ложные совпадения («силиконовая смазка», «герметик»).

3

Stage 2–3 — уточнение

ML- и AI-проверка сузили выборку до 392 HIGH-confidence лотов, по которым реально можно подавать заявку. Точность на ручной выборке — 88%.

4

Объём и вердикт

По 392 лотам собрали воронку и оценку потенциального объёма ниши, выделили топ-3 риска (в т.ч. концентрацию по 3 заказчикам) → решение go.

Цифры по Kunder — публичные (см. кейс). Конкретные финансовые показатели клиентов не публикуем.

Откуда ссылки на ЕИС и как перепроверить

ЕИС — Единая информационная система в сфере закупок (zakupki.gov.ru) — официальный государственный реестр всех закупок по 44-ФЗ и 223-ФЗ. Все тендеры в нашем анализе — реальные записи оттуда.

Где это уместно, мы даём ссылку на закупку в ЕИС — чтобы любую цифру можно было открыть в первоисточнике: заказчик, НМЦК, итог, победитель. Мы ничего не «придумываем»: методология открыта, данные публичны.

Все метрики считаются на 19.94 млн исторических тендеров (44-ФЗ / 223-ФЗ, 2020–2026) через DuckDB по parquet. В бесплатном превью конфиденциальные данные — конкретные суммы и имена заказчиков — замаскированы; полная версия доступна в личном кабинете по подписке.

Хотите увидеть это по своей компании?

Введите ИНН — покажем анализ по вашей нише. Бесплатно, без регистрации.