Корпоративные хранилища данных. Планирование,
разработка и реализация. Т.1
Эрик Спирли
Хорошая
книга. Я получил удовольствие и массу полезных знаний при её прочтении.
Для вас я сделал небольшой обзор содержимого каждой из глав книги.
Глава 1. Информационная технология и концепция хранилищ данных.
Описывается история возникновения концепции хранилищ данных, вводится
сама концепция, в общих чертах описывается архитектура хранилища
данных и методология его проектирования. Глава мне понравилась,
поскольку очень неплохо описывает концепцию хранилищ данных, а также
схему методологии построения хранилища.
Глава 2. Увязка бизнеса и ИТ через хранилища данных.
Эта глава будет полезна руководителю подразделения информационных
технологий, а также руководителям бизнес-подразделений. В ней говорится
о том, как создание хранилища данных может помочь оптимизировать
бизнес-процессы в организации, и тем самым повысить отдачу от бизнеса.
Глава 3. Планирование и построение хранилища данных.
В этой главе автор приводит высокоуровневое описание четырёх типов
хранилищ данных. Надо заметить, что во всех работах, которые мне
приходилось читать до этого, авторы настаивали на своём понимании
термина "хранилище данных", отметая все остальные варианты.
Здесь же автор делает попытку описать все варианты, разъясняя сильные
и слабые стороны каждого из них.
Глава 4. Предметная область и рамки проекта.
Из названия можно догадаться, что эта глава предназначена для чтения
руководителями проектов по созданию хранилищ данных. Помимо описания
того, что нужно делать при проведении интервью с руководством компании,
автор делится своим опытом по поводу того, как это делать. Я нахожу
его рекомендации в данной области достаточно ценными.
Глава 5. Моделирование данных.
Естественно, что книги Ральфа Кимбала [1,
2] дадут читателям намного лучшее
представление о проектировании моделей данных типа "схема звезда".
Однако руководителю проекта, пожалуй, будет достаточно тех знаний,
которые он получит из этой главы. Специалистам по моделированию
придётся почитать классиков.
Глава 6. Репозиторий метаданных.
Автор приводит достаточно неплохую классификацию метаданных, которые
необходимо хранить и обрабатывать в процессе проектирования, построения
и использования хранилища данных. Глава даёт очень неплохое представление
о серьёзности задачи управления метаданными.
Глава 7. Повышение качества информации в хранилищах данных.
Данная глава достаточно поверхностно описывает проблемы управления
качеством данных предприятия. Приводится схема процесса непрерывного
повышения качества данных, описанная подробно в книге
Ларри Инглиша. Приводится небольшой список программных продуктов,
предназначенных для повышения качества данных. О проблемах качества
данных и метаданных можно почитать в очень хорошей книге
Майкла Брэкета.
Глава 8. Концептуальная и логическая архитектура хранилища данных.
Эта глава мне понравилась, пожалуй, больше всех остальных. В ней
автор формулирует ряд базовых принципов (метапринципов), следование
которым просто необходимо для успешного создания хранилища. Я пока
нигде ещё не встречал такого компактного и в то же самое время ёмкого
перечня принципов построения хранилищ данных. Помимо описания этих
принципов, автор продолжает знакомить читателей с классификацией
типов хранилищ данных, которая впервые приводится в главе 3.
Глава 9. Физическая архитектура хранилища данных.
В этой главе читатель найдёт краткое описание типов аппаратных платформ,
дисковых подсистем и прочего "железа", пригодного для
использования при построении хранилища данных. Помимо этого, освещаются
вопросы, связанные с выбором операционной системы и промежуточного
программного обеспечения.
Глава 10. Преобразование данных.
Преобразование данных - процесс, занимающий большую
часть времени создания хранилища данных, - описано всего на
16 страницах. Приводится высокоуровневое описание задач преобразования
данных. Никаких деталей о способах преобразования, о необходимых
метаданных и других тонкостях процесса в этой главе не приводится.
Ничего удивительного, если учитывать то, что в отрасли ещё не сформировалось
единое мнение по поводу того, как должен выглядеть процесс преобразования
данных. Хотя, возможно, эти вопросы будут рассмотрены во втором
томе книги.
Глава 11. Доступ к данным.
В этой главе описываются различные типы потребителей информации,
а также приводится простая классификация средств доступа к данным
(генераторы отчётов, OLAP, data
mining, средства визуализации). Более подробно о каждом из типов
таких средств можно почитать в соответствующей литературе.
Глава 12. Добыча данных.
Данная глава полностью посвящена набирающей в последнее время популярность
технологии data mining. Автор вкратце описывает
процесс поиска скрытых закономерностей в данных организации, а также
рассказывает о разных классах алгоритмов, использующихся для обнаружения
этих закономерностей (нейронные сети, генетические алгоритмы, кластеризация
и классификация, деревья решений, регрессионные модели, дискриминантный
анализ). В конце главы приводится небольшой список коммерческих
продуктов класса data mining.
В заключение хочется сказать, что книга заслуживает того, чтобы
её прочитал каждый специалист, имеющий отношение к построению хранилищ
данных. Тем более что это - одна из книг по проблемам хранилищ
данных, изданных на русском языке.
Для удобства отслеживания новых публикаций на сайте рекомендую
подписаться на рассылку или подписаться
на канал RSS.
|