Хранилища данных,
OLAP, CRM: информация
 
 На главную | Книги | Ссылки | Рассылка | Письмо автору | RSS

Управление качеством данных в хранилище данных

  • The Eight Steps to Customer Data Quality - восемь рекомендаций по повышению качества информации предприятия.
  • Data Warehouse Quality - качество данных представляет один из типов рисков, управление которым является критичным в проектах по построению хранилищ данных. В статье рассматриваются три ключевых элемента подхода к улучшению качества данных, основанного на оценке рисков. Приводятся определения основных количественных показателей качества данных, а также схема жизненного цикла управления качеством данных проекта по построению хранилища данных. Статья будет полезна специалистам по качеству данных, руководителям проектов и архитекторам хранилищ данных.
  • Help For Data Quality Problems - автор статьи разработал процесс тотального управления качеством данных, позволяющий компаниям экономить средства за счет использования более качественных данных. В статье приводятся примеры программных продуктов, позволяющих автоматизировать различные задачи процесса управления качеством данных. Автор приводит несколько полезных рекомендаций по организации процесса очистки данных, а также по улучшению бизнес-процесов, порождающих данные.
  • The Data Doctor: Five Common Excuses For Not Reengineering Legacy Data - автор статьи приводит примеры причин, по которым компании не желают реорганизовывать унаследованные данные при построении хранилища данных, и которые, по его мнению, могут привести к серьезным проблемам с данными.
  • A Process for Improving Data Quality - авторы статьи разработали методику DQEF измерения качества данных и разработки планов его улучшения. Методика носит итеративный характер и может быть адаптирована для удовлетворения потребностей конкретной организации. Методика DQEF уделяет особое внимание качеству данных в разрезе времени. В статье описываются четыре различных метода качественной и количественной оценки качества данных. Приведены ссылки на другие работы в области управления качеством данных.
  • Ошибки в неочищенных данных (на русском языке) - автор статьи приводит примеры типичных ошибок, которые могут присутствовать в данных, и которые необходимо исправлять в процессе загрузки данных из оперативных источников в хранилище данных.
  • A Hierarchical Approach to Improving Data Quality - авторы статьи показывают, что качество данных - понятие многомерное и иерархическое. Приводятся определения атрибутов, размерностей и категорий качества данных как компонентов трехуровневой иерархической классификации характеристик качества данных. В целом показывается, что проблемы качества данных можно эффективно оценивать и решать с использованием структурного подхода.
  • Indicators of Quality - в статье Ральфа Кимбала обсуждаются различные показатели качества данных.
  • Achieving Enterprise Data Quality - после нескольких лет попыток решить проблему качества данных появилась новая дисциплина - Enterprise Data Quality Management (EDQM), направленная на повышение точности, своевременности и согласованности данных предприятия. В статье описываются характеристики, которыми должен обладать инструмент очистки данных для облегчения решения задач в рамках методологии EDQM. В статье описывается история и свойства инструментов по очистке данных от первых инструментов данного класса вплоть до современных средств, позволяющих поддерживать процессы контроля качества данных на уровне предприятия.
  • Design and Analysis of Quality Information for Data Warehouses (в формате Adobe Acrobat) - авторы описывают подход управления качеством данных на основе репозитория метаданных. Вводятся определения основных концепций качества данных (quality goal, quality query, quality domain и т.д). Далее предлагается метамодель качества данных, позволяющая формулировать цели качества, запросы качества и осуществлять измерение качества.
  • Data Warehouse Quality Design: A Review of the DWQ Project (в формате Adobe Acrobat)
  • Opportunities for Quality in the Data Warehouse (в формате Adobe Acrobat)
  • Is Your Data Correct? - описание простых статистических приемов проверки качества данных хранилища.
  • Intelligent Solutions: Measure Twice - Cut Once
    Часть 1, Часть 2, Часть 3

Нечёткое сравнение строк

Обзоры продуктов

Для удобства отслеживания новых публикаций на сайте рекомендую подписаться на рассылку или подписаться на канал RSS.

 

Если вы нашли в сети интересные ссылки на ресурсы по технологиям хранилищ данных, OLAP, CRM или data mining, и хотите поделиться ими с другими, присылайте их. Я с удовольствием размещу их на этом сайте.

Популярные страницы:

Советы разработчику хранилищ данных

OLAP

Моделирование

Книги

Книги на русском языке

Бесплатные книги

Производители OLAP

CRM

Производители CRM

Data Mining

Управление метаданными

Коллекция ссылок

[AD]

Найти: на

[ На главную | Книги | Ссылки | Рассылка | Письмо автору | Реклама на сайте ]

© Константин Лисянский, 2001-2008.

[AD] [AD] [AD]

Используются технологии uCoz