Сколько записей?
Мы увидели, что 7esco избежала опасности потратить миллионы фунтов стерлингов на создание хранилища данных. Среди крупных предприятий было модно тратить огромные суммы на новые компьютерные технологии, предназначенные для создания единого хранилища данных, полученных из разрозненных систем. Экспертам предстояло решить еще одну проблему. Команда успешно применила кластерную технологию для обработки 1% данных. Теперь настало время обработать данные обо всех 10 млн клиентов, используя 80 мерную систему. Для кластерного анализа требуются компьютеры чрезвычайно высокой производительности: обработать данные о 10 млн клиентов означает произвести миллиарды операций.
Исходя из результатов обработки 1% данных, можно было сказать, что обработка информации обо всех клиентах займет месяцы машинного времени. В те времена компьютер Dunnhumby стоил чуть больше 1,2 млн фунтов стерлингов. Разработчики программного обеспечения ничем не могли помочь. Вероятно, пора было проводить крупномасштабную модернизацию вычислительного оборудования. Но команда «Клубной карты» никогда бы не одобрила таких расходов, поскольку это значительно снизило бы рентабельность самой «Клубной карты». Должен был существовать другой способ. Процесс кластерного анализа был критически рассмотрен и найдено еще одно новаторское решение: сначала следует применять кластерный анализ для части данных, а после этого для полного объема. Точность результата практически не снижается, а процесс обработки займет несколько дней, а не месяцев. Сегодня компьютерная технология Tesco по прежнему стоит во много раз дешевле, чем хранилища данных многих конкурентов, тем не менее обрабатывается 100% данных обо всех покупателях и применяется свыше 100 стандартных методов анализа.
Вы должны войти чтобы комментировать.