sábado, 31 de enero de 2015

DataWareHouse (Bodega de Datos)



Un Data Ware House, traducido literalmente como un "Almacén de Datos", es un conjunto de datos integrados u orientados a grandes volúmenes de información.
Estas bodegas se utilizan para hacer consultas de datos históricos y, en base a ellos, realizar análisis o estudios. que varían con el tiempo considerada con grandes volúmenes de información y sus fuentes son: Base de datos, fuentes externas, Internet, etc. y se utilizan solo en consultas y análisis de datos.


Objetivos del Data WareHouse:
Información accesible.
Que la información de la organización sea consistente.
Eliminar duplicidad de información.
Mayor seguridad.
Estandarizar el acceso a la información.
Centralizar Datos.
Información para después interpretarla.

Características del DWH:
Integradas.
Temáticas.
Históricas.
No Volátiles.


Etapas:
Justificación. Hace referencia al costo.
Planeación. Es la infraestructura no técnica
El análisis del negocio. Es el alcance que tendrá el diseño que es donde se planea las bases de datos.
Construcción. Son todas las aplicaciones e implantación que es el usuario final y las pruebas.

Un DWH Ofrece:
Transformación de los datos, ya que esos datos se pueden convertir en información útil.
Repositorios y metadatos en grandes cantidades.
Procesamiento analítico en línea o mejor conocido como OLAP.
Visualizaciones en forma de Histogramas.

Requerimientos de los DWH:
En  realidad no necesitan físicamente de mucho, solo basta con un servidor para abastecer la información y alojarla ahí, y se recomienda un segundo servidor como respaldo, pero no es necesario, y hablando en términos de software se necesitan herramientas tales como de almacenamiento, extracción y colección de los datos, análisis y elaboración de reportes.  

Esquemas:
Esquema de estrella simple
Esquema de copo de nieve
Esquema de constelación de hechos