Хранилища данных,
OLAP, CRM: информация
 
 На главную | Книги | Ссылки | Рассылка | Письмо автору | RSS

Совет №39
Шинная архитектура для аналитических приложений

Материал опубликован с разрешения компании Ralph Kimball Associates
Автор оригинала: Bill Schmarzo (все статьи)
Перевод на русский язык: Олег Кузьменко
Оригинальный документ располагается здесь.

 

В нашем предыдущем совете мы исследовали основные факторы, приведшие к нынешнему ажиотажу вокруг аналитических приложений. Одним из них является широкое признание многомерного моделирования как зрелого метода дисциплины хранилищ данных, который ставит во главу угла требования бизнеса. Многомерные модели создают благоприятные условия для аналитических исследований, предоставляя высокопроизводительное и легкое в использовании окружение, которое позволяет идентифицировать отклонения от обычных значений показателей эффективности ведения бизнеса, а также причины их возникновения.

Существуют два дополнительных требования по эффективной поддержке аналитических приложений, предъявляемых к архитектуре хранилища данных.

Во-первых, шинная архитектура и согласованные размерности, которые создают условия для ее реализации, должны лежать в основе архитектуры хранилищ данных. В недавней книге Марджи и Ральфа, “The Data Warehouse Toolkit 2nd Edition”, дается следующее определение шинной архитектуры: «архитектура для области представления хранилища данных, основывающаяся на согласованных размерностях и фактах. В случае несоблюдения шинной архитектуры витрина данных представляет собой замкнутое, автономное приложение». Чтобы узнать больше о шинной архитектуре и согласованных размерностях, смотрите статью Ральфа в одном из номеров журнала Intelligent Enterprise за 1999 год.

Вспомните, что мы выступаем за создание многомерных моделей, которые сфокусированы на бизнес-процессах (например, заказы, поставки, складские запасы, платежи), а не на подразделениях предприятия (отделы продаж, маркетинга, производство или бухгалтерия). Шинная архитектура хранилищ данных и согласованные размерности являются необходимыми условиями для аналитических приложений, потому что наиболее интересные и полезные приложения требуют объединения метрик от нескольких бизнес-процессов.

Например, для анализа ценности клиента за период времени, в течение которого он остается с нами (т.е. текущей стоимости вероятных доходов, полученных от клиента в будущем), потребуются данные: по заказам (чтобы определить приносимый им доход и маржу), дебиторской задолженности (чтобы определить затраты на сбор этой задолженности), процессу продаж (чтобы определить себестоимость продаж), поставкам (чтобы определить производственные затраты, что особенно важно для бизнеса, который занимается производством под заказ), логистике (чтобы определить затраты на дистрибуцию), и вызовам сервисной службы (чтобы определить расходы на сервис и поддержку).

Ключевые метрики по каждому из этих бизнес-процессов будут храниться в раздельных многомерных моделях. Шинная архитектура предоставляет нам возможность перемещаться между моделями различных процессов для получения полного представления о клиенте. В инструменте генерации запросов мы используем многопроходный SQL для того, чтобы выполнить это перемещение. Подобная интеграция данных от различных бизнес-процессов была бы очень трудной, если бы не было шинной архитектуры, использующей согласованные размерности.

Во-вторых, часто для поддержки аналитических приложений необходимо использование консолидированных витрин данных. Консолидированная витрина данных представляет собой интегрированный набор многомерных моделей, каждая из которых ориентирована на отдельный бизнес-процесс. Она объединяет необходимые данные по многим бизнес-процессам и может быть использована несколькими аналитическими приложениями. Например, в консолидированную витрину, применяемую для анализа выгодности клиента, могут собираться данные по заказам, выставлению счетов, предложениям, сервисному обслуживанию. С этой витриной будут работать аналитические приложения, занимающиеся анализом оттока клиентов, эффективности промо-акций, и перекрестных продаж продуктов.

Легкость в использовании и производительность являются главными факторами, обеспечивающим успех консолидированным витринам данных. Нельзя рассчитывать на то, что можно сделать из бизнес-пользователей экспертов по многопроходному SQL, заставить их быть зависимыми от специалистов ИТ, или вынудить пользователей «соединять данные на экране» их ПК для интеграции данных от нескольких изолированных витрин.
К сожалению, многие средства генерации запросов и отчетов не предоставляют адекватной поддержки возможности “drill across” между несколькими витринами данных, каждая из которых ориентирована на свой бизнес-процесс. Консолидированная витрина данных, обеспечивая единое аналитическое представление (единственная схема «звезда»), упрощает работу пользователей, обуславливает высокую производительность. Консолидированные витрины поддерживаются большинством инструментов генерации запросов и отчетов. В известном смысле, они являются следующим шагом в эволюции хранилищ данных, знаменуя уход от изолированных витрин с согласованными размерностями. Преимуществом консолидированных витрин является то, что в случае их использования не требуется применение многопроходного SQL (вся информация сосредоточена в одной таблице фактов), а их недостатком – необходимость затрат и задержек, связанных с созданием консолидированных таблиц, содержащих данные из исходных изолированных витрин.

Переход от нынешней архитектуры к той, что может поддерживать аналитические приложения завтрашнего дня, можно считать естественным этапом эволюции хранилищ данных. Данный переход требует следования хорошо известным и документированным концепциям многомерного моделирования, таким как шинная архитектура, согласованные размерности и консолидированные витрины данных.
В случае отсутствия надлежащей архитектуры доступ и анализ данных от нескольких бизнес-процессов, требуемый для поддержки аналитических приложений, которые приносят большую пользу бизнесу, становится почти безнадежным делом.

 

По этой теме можно также почитать:

 

Для удобства отслеживания новых публикаций на сайте рекомендую подписаться на рассылку или подписаться на канал RSS.

 

Если вы нашли в сети интересные ссылки на ресурсы по технологиям хранилищ данных, OLAP, CRM или data mining, и хотите поделиться ими с другими, присылайте их. Я с удовольствием размещу их на этом сайте.

Популярные страницы:

Советы разработчику хранилищ данных

OLAP

Моделирование

Книги

Книги на русском языке

Бесплатные книги

Производители OLAP

CRM

Производители CRM

Управление метаданными

Коллекция ссылок

Найти: на

[ На главную | Книги | Ссылки | Рассылка | Письмо автору | Реклама на сайте ]

© Константин Лисянский, 2001-2008.

[AD] [AD] [AD]

Используются технологии uCoz