RU EN
Книги для разработчиков

The Data Warehouse ETL Toolkit

The Data Warehouse ETL Toolkit

Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data
Год:
Страниц:
526
Просмотров:
1087
The Data Warehouse ETL Toolkit favorites 0
Описание

The extract, transform, and load (ETL) phase of the data warehouse development life cycle is far and away the most difficult, time-consuming, and labor-intensive phase of building a data warehouse. Done right, companies can maximize their use of data storage; if not, they can end up wasting millions of dollars storing obsolete and rarely used data. Bestselling author Ralph Kimball, along with Joe Caserta, shows you how a properly designed ETL system extracts the data from the source systems, enforces data quality and consistency standards, conforms the data so that separate sources can be used together, and finally delivers the data in a presentation-ready format.

Serving as a road map for planning, designing, building, and running the back-room of a data warehouse, this book provides complete coverage of proven, timesaving ETL techniques. Beginning with a quick overview of ETL fundamentals, it then looks at ETL data structures, both relational and dimensional. The authors show how to build useful dimensional structures, providing practical examples of techniques. Along the way you'll learn how to:

  • Plan and design your ETL system.
  • Choose the appropriate architecture from the many possible options.
  • Build the development/test/production suite of ETL processes.
  • Build a comprehensive data cleaning subsystem.
  • Tune the overall ETL process for optimum performance.
Написать сообщение
Тип
Почта
Имя
*Сообщение
RSS
Если вам понравился этот сайт и вы хотите меня поддержать, вы можете
Soft skills: 18 самых важных навыков, которыми должен владеть каждый работник
Переход от монолита к микросервисам: история и практика
Angular без CLI (руководство)
300+ вопросов по JavaScript на собеседовании
Сравнение REST и GraphQL
Зарплата по результатам собеседования — лучший способ сократить отклики на вакансию, а тестовые задания — избыточны
Почему вы никогда не должны соглашаться на собеседования с программированием
Функции и хранимые процедуры в PostgreSQL: зачем нужны и как применять в реальных примерах
«Спасите C++»: отец легендарного языка просит разработчиков о помощи
Идентификация, Аутентификация, Авторизация. В чем же разница?
Boosty
Donate to support the project
GitHub account
GitHub profile