Introducción

El Data Warehouse (también conocido como “almacén de datos”) es una tecnología para el manejo de la información construido sobre la base de optimizar el uso y análisis de la misma utilizado por las organizaciones para adaptarse a los acelerados cambios en los mercados. Es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. . Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sea necesario.
La información histórica que el Data Warehouse contiene permite analizar tendencias y efectuar predicciones con la ayuda de herramientas de inteligencia empresarial. El Data Warehouse asegura que toda la organización utilice los mismos datos y éstos se transformen en valiosa información con la que adoptar decisiones.
Definiciones de Data Warehouse
Un
Data Warehouse es un
conjunto integrado de bases de datos, con orientación temática, que están
diseñados para el apoyo a la Toma de Decisiones, y donde cada unidad de datos
es relevante en algún momento del tiempo
Bill H. Inmon
"una copia de las transacciones de datos
específicamente estructurada para la consulta y el análisis“
Ralph Kimball
“Yo
considero al DW como algo que provee dos beneficios empresariales reales:
Integración y Acceso de datos. DW elimina una gran cantidad de datos inútiles y
no deseados, como también el procesamiento desde el ambiente operacional
clásico”
Susan Osterfeldt
Objetivos
- Hacer la información de la organización accesible
- Hacer a la información de la organización consistente
- Controlar el acceso efectivo a los datos
- Generar información de manera flexible
- Servir de ayuda a la toma de decisiones
Características
Entre sus principales características tenemos
- Orientado al tema: Es que la información se clasifica en base a los aspectos que son de interés para la empresa. Siendo así, los datos tomados están en contraste con los clásicos procesos orientados a las aplicaciones.
- Integrado: Integra datos recolectados de diferentes sistemas operacionales de la organización y o fuentes externas.
- De tiempo variante: Los datos son relativos a un periodo de tiempo y estos deben ser integrados periódicamente, los mismos son almacenados como fotos que se corresponden a un periodo de tiempo.
- No volátil: Los datos que son almacenados no sufren ninguna actualización solo son incrementados. El período cubierto para un Data Warehouse va de 2 a 10 años.
Arquitectura de un Data Warehouse
La
arquitectura (abajo en la figura ) de esta tecnología está integrada por los siguientes
componentes:
OLTP
(On-Line Transaction Processing)
Son aplicaciones que
definen el comportamiento habitual de un entorno operacional de gestión y
ejecutan las operaciones del día a día. Algunas de las características más
comunes de este tipo de transacciones podrían ser:
*
Altas/Bajas/Modificaciones
*
Consultas
rápidas, escuetas y predecibles
*
Poco
volumen de información e información disgregada
*
Transacciones
rápidas
*
Gran
nivel de concurrencia
*
Modo
de actualización on-line
*
Baja
redundancia de datos
Algunos ejemplos de
este tipo de aplicaciones son:
*
Compras
*
Ventas
*
Inventario
*
Sueldos
Consolación
Es la parte del
proceso de Data Warehouse que se encarga de producir el cambio de los sistemas
OLTP a las Bases de Datos OLAP. Consolidan datos de aplicaciones no integradas,
sumarían datos disueltos y los transforman.
Middleware
Es un software que reside
físicamente en un Cliente y en un Servidor de Comunicaciones.
OLAP
(On-Line Analytical Process)
Son
aplicaciones que se encargan de analizar datos del negocio para generar
información táctica y estratégica que sirve de soporte para la toma de
decisiones. Mientras que las transacciones OLTP utilizan Bases de Datos
Relacionales u otro tipo de archivos, OLAP logra su máxima eficiencia y flexibilidad
operando sobre Bases de datos Multidimensionales. Podemos nombrar las
siguientes características como las más sobresalientes de estas aplicaciones:
v Estructura de datos transparente al usuario.
v Solo Consulta, trabajan sobre la información operacional
generada por los sistemas OLTP.
v Consultas sobre grandes volúmenes de datos no predecibles
v Información histórica.
v Modo de actualización Batch.
v Alta redundancia de datos para facilitar la generación de
consultas y obtener buenos tiempos de respuesta.
EIS (Executive Information System)
Son
herramientas para proveer información estratégica a los ejecutivos mediante
informes, comparativa y cuadros de mando multidimensionales.
DSS (Decission Support System)
Herramienta
de soporte para la toma de decisiones. Incorpora reglas de decisión y análisis
de datos no predefinidos en las posibilidades de un EIS.
v Sistemas de presentación.
v Sistemas Interrogativos.
v Sistemas de Simulación.
v Sistemas funcionales.
v Sistemas Expertos.
Ventajas y desventajas de Data la Werehouse
Ventajas
Hay muchas ventajas por las que es recomendable usar un almacén de datos. Algunas de ellas son:
- Los almacenes de datos hacen más fácil el acceso a una gran variedad de datos a los usuarios finales
- Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la decisión tales como informes de tendencia', por ejemplo: obtener los ítems con la mayoría de las ventas en un área en particular dentro de los últimos dos años; informes de excepción, informes que muestran los resultados reales frente a los objetivos planteados a priori.
- Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor operacional de las aplicaciones empresariales, en especial la gestión de relaciones con clientes.
Desventajas
Utilizar almacenes de datos también plantea algunos inconvenientes, algunos de ellos son:
- A lo largo de su vida los almacenes de datos pueden suponer altos costos. El almacén de datos no suele ser estático. Los costos de mantenimiento son elevados.
- Los almacenes de datos se pueden quedar obsoletos relativamente pronto.
- A veces, ante una petición de información estos devuelven una información subóptima, que también supone una pérdida para la organización.
- A menudo existe una delgada línea entre los almacenes de datos y los sistemas operacionales. Hay que determinar qué funcionalidades de estos se pueden aprovechar y cuáles se deben implementar en el data warehouse, resultaría costoso implementar operaciones no necesarias o dejar de implementar alguna que sí vaya a necesitarse.
Multimedia
Referencias
http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos
http://www.slideshare.net/nesegohv/datawarehouse-2598403
http://www.adictosaltrabajo.com/tutoriales/tutoriales.php?pagina=datawarehouse
http://www.adictosaltrabajo.com/tutoriales/tutoriales.php?pagina=datawarehouse
Muy bien la información, la Base de Datos Data Warehouse me parece muy buena pues con la forma que almacena sus datos nos permite acceder fácilmente.
ResponderEliminarMe parece una BD interesante ya que te ayuda a orientar tu decisión y desechar datos que no se necesitan, llevando asi aun funcionamiento o acceso al dato requerido mas rapido y eficaz.
ResponderEliminarcomo dice mi compañero Angel buena base de datos maneja muy bien la informacion de manera organizada,consistente,accsesible
ResponderEliminarComo menciona Susan Osterfeldt:
ResponderEliminar"Yo considero al DW como algo que provee dos beneficios empresariales reales: Integración y Acceso de datos".
Otorga unos beneficios por demás importantes para una empresa, si tomamos en cuenta que evita el almacenamiento de datos inútiles y no deseamos nos encontramos frente a una excelente solución.
Data Warehouse me gusto este tipo de almacenamiento, y la informacion esta exelente mas en los objetivos y definiciones ya que colocastes tres verciones.
ResponderEliminarCreo que es u tipo de base de datos muy buena ya que se enfoca principalmente a lo que es la consulta y el analisis de los datos contenidos en ella, es de gran uso principalmen para empresas u organizaciones que necesitan un almacenamiento de este tipo ya que resultaria mas eficientes para ellos por que evita el alamcenamiento de datos inutiles y otorga un facil y rapido acceso a una gran cantidad de datos a los usuarios.
ResponderEliminarBuena informacion, ya que esta herramienta nos ayuda a optimizar el flujo de datos en nuestra base de datos.
ResponderEliminarUna BD muy interesante, una informacion corta pero es muy consistente, se menciona lo mas relevante, importante de lo que se necesita entender, saber, comprender, me gusto la idea de las imagenes y el video para facilitar la lectura y comprender mejor.
ResponderEliminar