Горы данных
Первое препятствие, которое следовало преодолеть, было очевидным: анализа одной корзины недостаточно. Поездка в супермаркет в выходной всей семьей, покупка продуктов для нечастых вечеринок, для дня рождения ребенка или просто покупка чего нибудь вкусненького если независимо исследовать любой из этих случаев, то картина получится искаженной. Анализ одной един ственной покупки не очень то поможет разобраться в действительной жизни домохозяйства. Вместо этого следует регулярно собирать данные о множестве покупок. Во вторых, горы данных, полученных таким образом и используемых при построении моделей, не могут расти бесконечно, поскольку возможноети вычислительного центра 7esco ограничены. Средний покупатель заходит в супермаркет раз в неделю и покупает 40 единиц товара. Всего клубными картами владеют 10 млн человек. Таким образом, в базу данных придется занести 1 мрд 600 млн единиц товара в месяц. В третьих, о чем на самом деле говорит картина покупок, полученная в результате анализа? Каким образом 7esco может связать полученные данные с решением клиента приобрести товары определенного бренда или нескольких брендов? Ошибочная логика означала бы, что выводы, сделанные на основе анализа покупок, тоже ошибочны.