Управление
качеством данных в хранилище данных
- The
Eight Steps to Customer Data Quality - восемь рекомендаций
по повышению качества информации предприятия.
- Data
Warehouse Quality - качество данных представляет один из типов
рисков, управление которым является критичным в проектах по построению
хранилищ данных. В статье рассматриваются три ключевых элемента
подхода к улучшению качества данных, основанного на оценке рисков.
Приводятся определения основных количественных показателей качества
данных, а также схема жизненного цикла управления качеством данных
проекта по построению хранилища данных. Статья будет полезна специалистам
по качеству данных, руководителям проектов и архитекторам хранилищ
данных.
- Help
For Data Quality Problems - автор статьи разработал процесс
тотального управления качеством данных, позволяющий компаниям
экономить средства за счет использования более качественных данных.
В статье приводятся примеры программных продуктов, позволяющих
автоматизировать различные задачи процесса управления качеством
данных. Автор приводит несколько полезных рекомендаций по организации
процесса очистки данных, а также по улучшению бизнес-процесов,
порождающих данные.
- The
Data Doctor: Five Common Excuses For Not Reengineering Legacy
Data - автор статьи приводит примеры причин, по которым
компании не желают реорганизовывать унаследованные данные при
построении хранилища данных, и которые, по его мнению, могут привести
к серьезным проблемам с данными.
- A Process
for Improving Data Quality - авторы статьи разработали методику
DQEF измерения качества данных и разработки планов его улучшения.
Методика носит итеративный характер и может быть адаптирована
для удовлетворения потребностей конкретной организации. Методика
DQEF уделяет особое внимание качеству данных в разрезе времени.
В статье описываются четыре различных метода качественной и количественной
оценки качества данных. Приведены ссылки на другие работы в области
управления качеством данных.
- Ошибки в неочищенных данных (на
русском языке) - автор статьи приводит примеры типичных
ошибок, которые могут присутствовать в данных, и которые необходимо
исправлять в процессе загрузки данных из оперативных источников
в хранилище данных.
- A Hierarchical
Approach to Improving Data Quality - авторы статьи показывают,
что качество данных - понятие многомерное и иерархическое.
Приводятся определения атрибутов, размерностей и категорий качества
данных как компонентов трехуровневой иерархической классификации
характеристик качества данных. В целом показывается, что проблемы
качества данных можно эффективно оценивать и решать с использованием
структурного подхода.
- Indicators
of Quality - в статье Ральфа Кимбала обсуждаются различные
показатели качества данных.
- Achieving
Enterprise Data Quality - после нескольких лет попыток решить
проблему качества данных появилась новая дисциплина - Enterprise
Data Quality Management (EDQM), направленная на повышение точности,
своевременности и согласованности данных предприятия. В статье
описываются характеристики, которыми должен обладать инструмент
очистки данных для облегчения решения задач в рамках методологии
EDQM. В статье описывается история и свойства инструментов по
очистке данных от первых инструментов данного класса вплоть до
современных средств, позволяющих поддерживать процессы контроля
качества данных на уровне предприятия.
- Design
and Analysis of Quality Information for Data Warehouses (в
формате Adobe
Acrobat) - авторы описывают подход управления
качеством данных на основе репозитория метаданных. Вводятся определения
основных концепций качества данных (quality goal, quality query,
quality domain и т.д). Далее предлагается метамодель качества
данных, позволяющая формулировать цели качества, запросы качества
и осуществлять измерение качества.
- Data
Warehouse Quality Design: A Review of the DWQ Project (в
формате Adobe
Acrobat)
- Opportunities
for Quality in the Data Warehouse (в
формате Adobe
Acrobat)
- Is
Your Data Correct? - описание простых статистических
приемов проверки качества данных хранилища.
- Intelligent Solutions: Measure Twice - Cut Once
Часть
1, Часть
2, Часть
3
Нечёткое сравнение строк
Обзоры продуктов
Для удобства отслеживания новых публикаций на сайте рекомендую
подписаться на рассылку или подписаться
на канал RSS.
Если вы нашли в сети интересные ссылки на ресурсы
по технологиям хранилищ данных, OLAP, CRM или data mining, и хотите
поделиться ими с другими, присылайте
их. Я с удовольствием размещу их на этом сайте.
|
[AD]
|