Важность чистоты исходных данных для аналитики и прогнозирования.

Чистота данных

Аналитика и прогнозирование играют ключевую роль в современном бизнесе. Они помогают компаниям принимать правильные решения и достигать конкурентного преимущества. Однако, результаты аналитической работы и прогнозы могут быть неточными и неполными, если исходные данные не являются чистыми.

Вся информация для работы аналитика должна предварительно подготавливаться – это важный процесс, во время которого происходит устранение ошибок, исключение дубликатов, группировка заменителей и корректировка неправильных значений.

Давайте рассмотрим несколько примеров из моих последних проектов:

1. Дубли.
В одной компании требовалось поставить систему прогнозирования продаж на FMCG рынке. При анализе исходных данных я обнаружил странное выпадение продаж и остатков на значительных промежутках времени. Как оказалось — в это время на рынке был представлен “дубликат” — тоже самое, только “с перламутровыми пуговицами”. Думаю, вы понимаете, о чем я. Т.е. кто-то создал дубликат карточки номенклатуры, оприходовал товар, оповестил коллег и наблюдал за продажами. Четкого правила и регламента для такой процедуры не было — поэтому не все знали о подобных нюансах. В итоге — “полетели” и учет и аналитика. Пришлось выискивать все подобные случаи по памяти, создавать памятки и регламенты по ведению справочника номенклатуры, объединять дубликаты по принципу схожести и т.д. Только после этого можно было работать дальше.

2. Хранение информации.
В другой компании работа с дубликатами, наоборот, была поставлена на поток — регламент, инструкции и вопросов не было от слова совсем. Пока не дошли до учета прайс-листов. В той конкретной задаче важно было достаточно досконально анализировать движения цен на рынке на ежедневной основе. Как это делают на бирже. Только вот проверить работоспособность системы нужно было на исторических данных, а хранение данных прайс-листов было далеко не образцово-показательно. А без исторических данных в корректном формате построить какой-либо аналитический инструмент крайне сложно. Пришлось наводить порядок, пытаясь выудить все ошибки и устранить их.

3. Некорректные данные.
С этим сталкивался почти везде. Например, при анализе экономики состояния запасов обнаруживал мертвые залежи товаров и оборудования, которые оказывались “фикцией для банков”… Т.е. товара физически не было, но он числился на балансе для каких-то целей финансистов.
Или еще лучше — данные, получаемые с открытых источников, не внушали доверия. В одном из проектов у всех дистрибьюторов рынка была договоренность выкладывать свои остатки в общий доступ. Взамен ты получаешь эту информацию тоже. Итого — у всех есть возможность понимать рынок, знать, где “перехватиться” в случае дефицита и т.д. Однако и тут нашлись умельцы, кто начали искажать данные. Тем самым устранив ценность данной системы, практически помножив ее на ноль.

Можно продолжать приводить примеры достаточно долго.
Но мораль проста: информация требует правильного хранения и учета. От этого зависит точность, достоверность и надежность результатов на выходе.
Хороший пример необходимости корректировать спрос перед прогнозированием описан в моей статье про Visual Forecast.

Но, зачастую, мы сами создаем себе проблемы. Пример — ежеквартальные планы продаж. Уверен на 100% — большинство из читающих эту статью сталкивались с аномально увеличивающимися отгрузками на последних неделях каждого квартала, когда менеджеры отдела продаж усиленно пытаются нагнать планы.
В итоге получаем нелогичные всплески продаж. И просадку в начале следующего квартала.

Однако и это можно спрогнозировать. Только вот нагрузка на сотрудников отдела продаж и, тем более, на сотрудников склада — будет значительно выше в эти периоды. Она будет очень неравномерна, что повлечет за собой возникновение ошибок.
А ведь так просто немного подумать и скорректировать мотивацию отдела продаж, чтобы это не оказывало пагубное влияние на другие департаменты… Но это уже совсем другая история!

Чистых вам данных, господа!