Кейс: разработчики РИДЫ помогли ЦРПТ посчитать рынок
Алгоритм Ритейл Дата Центра для обработки и анализа BIG DATA применяет крупнейший держатель данных о товаре - оператор ЦРПТ.
С его помощью компания получила возможность делать супер точный расчет рынков сбыта маркированных товаров.
Как работает маркировка и какие данные она собирает
Государственная информационная система мониторинга товаров Честный знак — это единый метод маркировки и отслеживания товаров. Все производители и импортеры отдельных категорий товаров, а также участники оптового и розничного оборота товаров вносят данные о движении товаров в систему.
Так выглядит схема маркировки
Производитель или импортер крепит марку на каждую коробку и отправляет партию оптовику, оптовик считывает код сканером и подтверждает, что получил этот товар.
Дальше он продает товар мелким розничным магазинам → розничные магазины тоже считывают код каждого товара и обновляют данные в системе. В розничном магазине товар продают конечному покупателю — продавец пробивает код через онлайн-кассу, и та передает данные в систему. Теперь товар продан, и система снимает его с учета.
В систему маркировки попадают документы о движении каждой единицы маркированного товара во всем товарообороте страны — это огромный массив информации. По словам оператора маркировки, количество операций в системе Честный Знак выше, чем, у Uber или Netflix.
Какую задачу потребовалось решить оператору маркировки?
Данные по движению товаров уникальны и могли бы помочь при анализе логистической цепочки, рынков производства и сбыта. Например, накопленная информация позволяла бы проводить анализ покупательского поведения, мониторить ключевые показатели отраслей, рассчитывать количество производителей, оптовых и розничных компаний. На базе этих данных ЦРПТ планировал готовить аналитические отчеты для нужд государства и бизнеса.
При этом big data Честного Знака содержит много конфиденциальной и чувствительной информации и имеет высокую степень защиты.
Для работы с такими данными, потребовалось создание алгоритмов, которые, помимо высоких требований к шифрованию и безопасности данных, выполняли бы 2 ключевых условия:- ни при каких вариациях и условиях задания алгоритмов, они не должны раскрывать коммерчески ценную информацию участников рынка
- алгоритмы должны учитывать особенности каждой товарной группы и давать точную картину рынка, без экстраполяций и предположений.
Именно с таким заданием оператор маркировки обратился в Ритейл Дата Центр.
Решение под ключ
Команда Ритейл Дата Центр включает специалистов разных отраслей, которые необходимы для решения подобных задач. Среди них бизнес-аналитики, с опытом работы на международных предприятиях и специалисты по Data Scientist, погруженные в особенности данных систем прослеживаемости товаров.
К моменту запроса сотрудники РДЦ были хорошо знакомы с данными Честного Знака и тестировали аналитическую систему РИДА. На базе своей экспертизы и понимания состава данных, команда подготовила прототип архитектуры сервиса и разработали алгоритмы для ее корректной работы.
Особое внимание уделялось шифрованию данных и безопасности алгоритмов, обрабатывающих конфиденциальные данные. Ключ и данные в открытом виде доступны только алгоритму, который находится внутри системы Честный Знак.
Верхнеуровневая пользовательская схема расчета объемов рынка
Другим вызовом для решения технической задачи на высоком уровне стала необходимость настраивать алгоритм под изменчивые поведенческие характеристики отдельных отраслей. Появление новых типов вывода товаров из оборота, множественное обогащение динамическими признаками товара — все эти факторы должны быть учтены на этапе формирования бизнес-запроса.
Посмотрим на конкретном примере появившиеся возможности по расчету рынков сбыта:
- С помощью алгоритма можно рассчитать рынок розничных продаж всех видов мороженного по РФ.
- А можно узнать объем продаж только вафельных стаканчиков.
- Еще глубже - рынок вафельных стаканчиков со вкусом клубники стоимостью в диапазоне от 35 до 67 рублей.
- Совсем детально - сколько таких стаканчиков с заданным вкусом и диапазоном цены было продано в парке ВДНХ за летние выходные.
При этом алгоритм проверяет, чтобы не нарушались принципы агрегации и обезличивания данных. Иными словами выводы исследования не раскрывают полный список производителей этих стаканчиков и долю продаж каждого производителя.
Таким образом, команда Ритейл Дата Центра создала уникальный инструмент для анализа рынка на базе данных о движении маркированных товаров.
Более детально о том, как мы работаем над обогащением данных Честного знака.
Похожие статьи
Подпишитесь на дайджест РДЦ
обзоры рынка, инсайты, отчеты