Хранилища данных,
OLAP, CRM: информация
 
 На главную | Книги | Ссылки | Рассылка | Письмо автору | RSS

Совет №46
Еще один взгляд на вырожденные измерения

Материал опубликован с разрешения компании Ralph Kimball Associates
Автор оригинала: Ральф Кимбал (все статьи)
Перевод на русский язык: Егор Демьянов
Оригинальный документ располагается здесь.

 

На семинарах по многомерному моделированию нас часто спрашивают о вырожденных измерениях (degenerate dimensions). Вырожденные измерения вводят в замешательство, так как они не похожи на обычные измерения. Полезно вспомнить, что согласно определению, данному в словаре Уэбстера, «вырожденный» обозначает: 1) отклоняющийся от нормы, или 2) математически более простой.

Вырожденное измерение выглядит как ключ в таблице фактов, но по этому ключу не производится соединение с таблицей, потому что все интересующие нас атрибуты помещаются в другие измерения. Иногда вырожденные измерения называют текстовыми фактами, тем не менее, они не являются фактами, так как ключ таблицы фактов обычно состоит из вырожденного измерения и дополнительных внешних ключей.

Вырожденные измерения часто встречаются в таблицах фактов, созданных на уровне отдельных транзакций. Обычно вырожденными измерениями являются идентификаторы, присваиваемые учетными системами: номера заказов, билетов, транзакций по кредитным картам, чеков и т.п. Вырожденные измерения являются естественными ключами «родителей», соответствующих детальным записям.

Хотя по вырожденному измерению не производится соединения с таблицей, содержащей дополнительные атрибуты, вырожденное измерение может быть полезно для группировки родственных записей в таблице фактов. Например, в розничной торговле номер чека группирует все товары, купленные в одной корзине. В здравоохранении вырожденные измерения могут использоваться для группировки фактов, относящихся к одному курсу лечения или нахождению в больнице.

Часто мы встречаем несколько вырожденных измерений в одной таблице фактов. Например, в страховании таблица фактов с позициями требований о возмещении обычно содержит в качестве вырожденных измерений номер требования и номер полиса. Таблица фактов по отгрузкам пожжет содержать номер заказа и номер товарной накладной.

Вырожденные измерения также служат для поддержания связи с учетными системами. Они могут быть очень полезны на этапе разработки ETL для связи записей таблицы фактов с записями в учетных системах в целях тестирования или проверки целостности.

Мы, как правило, не используем суррогатных ключей для вырожденных измерений. Обычно значения этих измерений уникальны и имеют разумные размеры, применение суррогатных ключей неоправданно. Однако если идентификатор учетной системы является длинной строкой, то суррогатный ключ может помочь сэкономить значительное пространство, особенно в случае таблиц фактов с большим числом записей. Также суррогатный ключ необходим, если идентификатор учетной системы не уникален. Конечно, если вы используете суррогатный ключ, то измерение уже не является вырожденным.

При рецензировании дизайна мы иногда находим таблицы измерений, растущие пропорционально таблицам фактов. При добавлении записей в таблицу фактов, добавляются записи и в измерение, часто даже в таком же или близком количестве. Такая ситуация должна служить для вас тревожным сигналом. Часто измерение, увеличивающееся с той же скоростью, что и таблица фактов, является незамеченным на этапе проектирования вырожденным измерением.

 

 

По этой теме можно также почитать:

 

Для удобства отслеживания новых публикаций на сайте рекомендую подписаться на рассылку или подписаться на канал RSS.

 

Если вы нашли в сети интересные ссылки на ресурсы по технологиям хранилищ данных, OLAP, CRM или data mining, и хотите поделиться ими с другими, присылайте их. Я с удовольствием размещу их на этом сайте.

Популярные страницы:

Советы разработчику хранилищ данных

OLAP

Моделирование

Книги

Книги на русском языке

Бесплатные книги

Производители OLAP

CRM

Производители CRM

Управление метаданными

Коллекция ссылок


[AD]

Найти: на

[ На главную | Книги | Ссылки | Рассылка | Письмо автору | Реклама на сайте ]

© Константин Лисянский, 2001-2008.

[AD] [AD] [AD]

Используются технологии uCoz