Документация

Заказчики, подписчики и Госторги ID

Заказчики — это компании или ИП, зарегистрированные в системе. Заказчики идентифицируются по ИНН. Сотрудники заказчика связаны с компанией и идентифицируются по Госторги ID. Каждый сотрудник имеет свой Профиль. Профиль состоит из Фильтра сотрудника и его атрибутов: E-mail, ФИО, обращение и т.п. С Профилем могут быть связаны один или несколько Фильтров. Сотрудник может просматривать отчеты, созданные в соответствии с своими Фильтрами, или получать ссылки на эти отчеты по E-mail. Отправка отчетов называется рассылкой. Сотрудник, получающий рассылку, называется Подписчиком. Подписчик может изменять свой Профиль и параметры рассылки в Кабинете подписчика, в том числе добавлять новых подписчиков.

Отчеты обновляются, а рассылки рассылаются ежедневно.

Фильтры в настоящее время создаются и отлаживаются на индивидуальной основе по специальному запросу.

Рассылки

Рассылка — это применение Фильтра подписчика к текущей базе новых тендеров, в т.ч. за последний день. Рассылка приходит на E-mail, а также все письма Рассылки могут быть просмотрены в “Протоколе рассылок” Кабинета подписчика. В “Протоколе рассылок” фиксируется точное время отправки письма и его содержание. Также через сайт может быть удобно читать объемные письма.

Преимущество рассылок в том, что в них включаются только новые тендеры. Однако иногда может быть удобно просмотреть все новые тендеры за несколько дней. Это можно сделать с помощью отчетов по новым тендерам.

Отчеты

Отчеты — это применение Фильтров к базе текущих тендеров, а также базам за 2015-2016 гг.

Каждый отчет содержит номер тендера, его заголовок, коды, регион, цену. Отчеты могут использоваться для оценки качества фильтров: процент пропуска целевых тендеров, процент шума. Отчеты могу содержать несколько вариантов фильтров, варьируя добавление кодов, минус-слов и словосочетаний, уточнения запросов и т.д. Каждый тендер в отчете содержит ссылку на правило или список правил, в результате применения которых он был отобран.

Тендеры в отчетах представлены в табличной форме, их можно сортировать одновременно по нескольким столбцам таблицы (суммам, регионам и т.д.).

Также отчеты можно скачать в формате Excel.

Для отладки фильтров могут не приниматься во внимание регионы и цены, т.к. фильтрация по этим параметрам не вызывает принципиальных сложностей.

Фильтр

Фильтры состоят из правил, списков регионов и диапазонов цен.

Правила выделяют тендеры по предметам закупок, они определяют что закупается. Список регионов определяет где производится закупка. Диапазон цен задается двумя числами: минимальная и максимальная цена лота закупки.

Иногда требуется учесть несколько разных областей специализации для разных сотрудников одной компании. В этом случае надо добавить нового подписчика и сформировать для него новый Фильтр. Также один и тот же Фильтр может быть назначен нескольким подписчикам.

Фильтр оформлен в хорошо известном формате YAML (точнее, используется упрощенное подмножество YAML с несколькими дополнениями).

Теги

Теги задают некоторые общие свойства фильтров:

  • VER3 — номер версии фильтра;
  • NUM — номер фильтра для Альбома фильтров;
  • TAG — контекстные теги фильтра;
  • DEL — не показывать фильтр в Альбоме фильтров;
  • TITLE — наименование фильтра;
  • REMxx — список секций на обработку (x=1 — только первая, x=10 — только вторая, x=100 — только третья и т.д.);

Секции

Правила могут группироваться в секции по типам тендеров: тендеры 44-ФЗ, котировки, тендеры 223-ФЗ. Секция состоит из нескольких правил, которые применяются с учетом атрибутов, если они есть.

Атрибуты секций

  • sum1, sum2 — диапазон цен лотов закупок;
  • rc — список кодов регионов;
  • org — список ИНН или элементов имен заказчиков;

Атрибуты секции применяются ко всем правилам секции. Примеры атрибутов секции:

sum1: 1234
sum2: 1234567
rc: 11 22 33 44 55
org: 123456789 

Правила

Правило состоит из имени правила (например, номера) и тела правила. Имя правила показывается в Отчетах для каждого отобранного тендера, для того чтобы можно было сравнить эффективность разных правил. Тело правила — это комбинация кодов, ключевых слов и спецзнаков.

Правило определяет включать данный тендер в рассылку и отчет или нет, т.е. является ли этот тендер целевым. Для каждой секции можно предусмотреть несколько правил, каждое из которых выделяет свою узкую предметную область. При этом результат применения правил можно определить так:

Цель = Правило1 ИЛИ Правило2 ИЛИ Правило3 ...

Правило может состоять либо из списка кодов, либо из списка терминов, либо из комбинации того и другого. Рассмотрим по отдельности все эти три случая.

Коды

В первом случае отбор тендеров проводится по кодам. Результат применения правила такой:

Цель = Код1 ИЛИ Код2 ИЛИ Код3 ...

Пример:

Правило: Код1 Код2 Код3

Во всех классификаторах существует определенная иерархия кодов или классов. При этом тендер с кодом нижнего уровня будет отобран этим правилом в том случае, если в данном правиле есть или заданный код или хотя бы один соответствующий код верхнего уровня.

Термины

Во втором случае отбор проводится по терминам без учета кодов или классов:

Цель = Термин1 ИЛИ Термин2 ...

Пример:

Правило: Термин1 Термин2 Термин3 

При поиске по терминам происходит стеминг или грамматические усечение термина до его корня. Это позволяет задавать термины в их нормальной форме, не обращая внимания на окончания. Однако иногда это приводит к ошибочным результатам, тогда можно задать точную форму термина с помощью спецзнака “!”.

Специальные знаки (операторы)

В этом случае поиск целевых тендеров по терминам может быть модифицирован с использованием специальных знаков, аналогичных тем, которые используются в расширенном поиске поисковых систем:

  • -Термин — исключить тендеры с этим термином (минус-слова);
  • +Термин — исключить тендеры без этого термина (плюс-слова);
  • Термин1_Термин2 — включить тендеры имеющие одновременно и последовательно два этих термина (словосочетания);
  • Термин1=Термин2 — включить тендеры имеющие одновременно два этих термина (простая комбинация);
  • Термин1=Термин2/Термин3=Термин4/Термин5 — включить тендеры имеющие все возможные сочетания этих терминов (сложная комбинация);
  • $123=$124=$125 — включить все возможные сочетания переменных (комбинация переменных);
  • Термин1%Термин2 — включить Термин1_Термин2 и Термин2_Термин1;

Для сложной комбинации Т1=Т2/Т3=Т4/Т5 будут отбираться тендеры, имещие хотя бы один набор терминов из множества (Т1=Т2=Т4, Т1=Т2=Т5, Т1=Т3=Т4, Т1=Т3=Т5). Порядок терминов в комбинациях не учитывается, что может иногда приводить к ложно-положительным результатам.

Коды и термины

В третьем случае целевые тендеры отбираются по ключевым словам, при этом поиск осуществляется внутри множества тендеров, которое выделено списком кодов:

Цель = (Код1 ИЛИ Код2 ...) И (Термин1 ИЛИ Термин2 ...)

Пример:

Правило: Код Термин1 Термин2 Термин3 

Как и во втором случае список терминов может быть модифицирован спецзнаками.

Минус-правила

Отдельным видом правила являются минус-правила. В этом случае коды сочетаются только с минус-терминами, при этом отбираются тендеры с нужными кодами, не содержащие указанные термины.

Цель = (Код1 ИЛИ Код2 ...) И НЕТ (Термин1 ИЛИ Термин2 ...)

Минус-правила полезны для уточнения классов, т.е. исключения из целевого класса нецелевых тендеров по заданным терминам. Пример:

Правило: Код -Термин1 -Термин2 -Термин3 

Еще одним вариантом минус-правил являются правила с минус-кодами. Такие правила могут быть полезны для контроля или первичного поиска целевых классов/кодов. Предполагается, что коды тендера указаны либо правильно, либо нет. В первом случае правило можно составить на основе целевого кода, исключая нецелевые тендеры по списку терминов. Во втором случае можно определить новые целевые коды, а также оценить число целевых тендеров вне этих кодов. Как вариант можно начинать составление правил с семантического ядра (максимально полного списка целевых терминов и словосочетаний) и затем определять и вычитать целевые коды. Пример:

Правило: Термин1 Термин2 Термин3 -Код1 -Код2 -Код3

Переменные

Списк терминов, минус-терминов и словосочетаний удобно хранить в переменных, которые подставляются в правила (это аналог ссылок YAML). Для определения переменных используется специальный вид правила. Для использования переменной она помещается в тело правила. Для использования минус-терминов в правиле ставится минус перед переменной. Переменную можно определять и использовать в правиле любой секции. Одна и та же переменная может быть использована в разных правилах, что уменьшает возможнось ошибок: термины и словосочетания не требуется вводить повторно. Пример:

$123: Термин1 Термин2 Термин3
$124: Термин4 Термин5 Термин6
Правило: Код1 $123 $124
Правило: Код1 Термин1 -Термин2 $123 -$124

Область поиска

Область поиска терминов — КПЗ (краткий предмет закупки, плюс некоторые сведения об ассортименте если они есть). КПЗ иногда совпадает с заголовком тендера, если не является расширенной его версией.

Номера правил

Секции могут выделяться номерами правил:

  • Номера 1-100 относятся ко всем секциям;
  • Номера 101-200 относятся только к первой секции;
  • Номера 201-300 относятся только ко второй и третьей секции;
  • Номера 301-400 относятся только к третьей секции;
  • Номера 1001-1100 являются номерами тестовых правил. Они позволяют отбирать тендеры для отчетов (и анализировать отобранные тендеры по номеру правила), но не участвуют в формировании дневных отчетов. Для тестовых правил может формироваться своя таблица частот кодов.

Макросы и мета-фильтры

Мета-фильтры просто объединяют несколько фильтров вместе для рассылки. Макросы автоматически формируют несколько новых фильтров и объединяют их в мета-фильтр с целью учета регионов, сумм или других параметров на основе уже готовых фильтров общего вида. Примеры макросов:

base: 124=>218 125=>219 126=>220 137=>221
rc: 50 77 78 47
macro: 10001 Фирма-подписчик
title: Компьютеры и ПО

Разное

Если задан общий атрибут несколько раз, то выбирается последний. Если задан частный атрибут секции, то он имеет приоритет, а общий атрибут действует в тех секциях где не задан частный. Если задано несколько правил или переменных с одинаковым номером, то используется только последнее.

Альбом фильтров

Некоторые примеры фильтров собраны в Альбоме фильтров. Они демонстрируют все варианты разработанной системы фильтров. Кроме этого на основе фильтров строятся таблицы кодов ОКДП, ОКПД, а по базе контрактов можно получить отчеты по всем Заказчикам и Поставщикам, принявшим участие в тендерах по данной тематике. Возможны и дополнительные аналитические отчеты и диаграммы.

Отчеты по секциям

Отчеты по секциям это таблица указанной секции за выбранный год.

Дневые отчеты

Дневной отчет содержит списки тендеров, полученный в результате применения фильтра, за определенный день.

Дополнительные отчеты

Списки кодов

Отчеты первой секции за 2014-2015 гг. формируются на основе списка классов секции тендеров. Результаты сортировки по частоте кодов этих тендеров помещаются в таблицу кодов ОКПД. Эти результаты могут быть использованы для автоматического или полуавтоматического формирования фильтров котировок.

Отчеты первой секции за 2012-2013 гг. формируются на основе списка классов секции тендеров. Результаты сортировки по частоте кодов этих тендеров помещаются в таблицу кодов ОКДП. Эти результаты могут быть использованы для автоматического или полуавтоматического формирования фильтров тендеров 223-ФЗ.

База контрактов (Заказчики)

Список тендеров отчетов за 2012-2015 гг. дает возможность по базе контрактов построить сводную таблицу заказчиков: кто чаще делал заказы по данной тематике, на какую сумма, доля этих заказов среди всех и т.д.

База контрактов (Конкуренты)

Список тендеров отчетов за 2012-2015 гг. дает возможность по базе контрактов построить сводную таблицу поставщиков (конкурентов): кто чаще делал побеждал в тендерах по данной тематике, на какую сумму, доля этих заказов среди всех и т.д.