Руководству: или как обойти конкурета

Сколько записей?

Мы увидели, что 7esco избежала опасности потратить миллионы фунтов стер­лингов на создание хранилища данных. Среди крупных предприятий было модно тратить огромные суммы на новые компьютерные технологии, предна­значенные для создания единого хранилища данных, полученных из разроз­ненных систем. Экспертам предстояло решить еще одну проблему. Команда успешно применила кластерную технологию для обработки 1% данных. Теперь наста­ло время обработать данные обо всех 10 млн клиентов, используя 80 мерную систему. Для кластерного анализа требуются компьютеры чрезвычайно высо­кой производительности: обработать данные о 10 млн клиентов означает про­извести миллиарды операций.

Исходя из результатов обработки 1% данных, можно было сказать, что об­работка информации обо всех клиентах займет месяцы машинного времени. В те времена компьютер Dunnhumby стоил чуть больше 1,2 млн фунтов стер­лингов. Разработчики программного обеспечения ничем не могли помочь. Вероятно, пора было проводить крупномасштабную модернизацию вычисли­тельного оборудования. Но команда «Клубной карты» никогда бы не одобрила таких расходов, поскольку это значительно снизило бы рентабельность самой «Клубной карты». Должен был существовать другой способ. Процесс кластер­ного анализа был критически рассмотрен и найдено еще одно новаторское решение: сначала следует применять кластерный анализ для части данных, а после этого для полного объема. Точность результата практически не снижа­ется, а процесс обработки займет несколько дней, а не месяцев. Сегодня компьютерная технология Tesco по прежнему стоит во много раз дешевле, чем хранилища данных многих конкурентов, тем не менее обраба­тывается 100% данных обо всех покупателях и применяется свыше 100 стан­дартных методов анализа.

Вы должны войти чтобы комментировать.