martes, 18 de septiembre de 2012

    Introducción


El Data Warehouse (también conocido como “almacén de datos”) es una tecnología para el manejo de la información construido sobre la base de optimizar el uso y análisis de la misma utilizado por las organizaciones para adaptarse a los acelerados cambios en los mercados. Es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. . Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sea necesario.


La información histórica que el Data Warehouse contiene permite analizar tendencias y efectuar predicciones con la ayuda de herramientas de inteligencia empresarial. El Data Warehouse asegura que toda la organización utilice los mismos datos y éstos se transformen en valiosa información con la que adoptar decisiones.

    Definiciones de Data Warehouse

  Un Data Warehouse es un conjunto integrado de bases de datos, con orientación temática, que están diseñados para el apoyo a la Toma de Decisiones, y donde cada unidad de datos es relevante en algún momento del tiempo
Bill H. Inmon
           "una copia de las transacciones de datos específicamente estructurada para la consulta y el análisis“
Ralph Kimball
      “Yo considero al DW como algo que provee dos beneficios empresariales reales: Integración y Acceso de datos. DW elimina una gran cantidad de datos inútiles y no deseados, como también el procesamiento desde el ambiente operacional clásico”
Susan Osterfeldt

    Objetivos

  •   Hacer la información de la organización accesible
  •   Hacer a la información de la organización consistente
  •   Controlar el acceso efectivo a los datos
  •   Generar información de manera flexible
  •   Servir de ayuda a la toma de decisiones
       

Características

Entre sus principales características tenemos
  • Orientado al tema: Es que la información se clasifica en base a los aspectos que son de interés para la empresa. Siendo así, los datos tomados están en contraste con los clásicos procesos orientados a las aplicaciones.

  • Integrado: Integra datos recolectados de diferentes sistemas operacionales de la organización y o fuentes externas.
  • De tiempo variante: Los datos son relativos a un periodo de tiempo y estos deben ser integrados periódicamente, los mismos son almacenados como fotos que se corresponden a un periodo de tiempo.

  • No volátil: Los datos que son almacenados no sufren ninguna actualización solo son incrementados. El período cubierto para un Data Warehouse va de 2 a 10 años.

Arquitectura de un Data Warehouse


La arquitectura (abajo en la figura ) de esta tecnología está integrada por los siguientes componentes:

OLTP (On-Line Transaction Processing)


Son aplicaciones que definen el comportamiento habitual de un entorno operacional de gestión y ejecutan las operaciones del día a día. Algunas de las características más comunes de este tipo de transacciones podrían ser:

         *        Altas/Bajas/Modificaciones
         *        Consultas rápidas, escuetas y predecibles
         *        Poco volumen de información e información disgregada
         *        Transacciones rápidas
         *        Gran nivel de concurrencia
         *        Modo de actualización on-line
         *        Baja redundancia de datos

Algunos ejemplos de este tipo de aplicaciones son:
         *        Compras
         *        Ventas
         *        Inventario
         *        Sueldos

Consolación

Es la parte del proceso de Data Warehouse que se encarga de producir el cambio de los sistemas OLTP a las Bases de Datos OLAP. Consolidan datos de aplicaciones no integradas, sumarían datos disueltos y los transforman.

Middleware

Es un software que reside físicamente en un Cliente y en un Servidor de Comunicaciones.

OLAP (On-Line Analytical Process)

Son aplicaciones que se encargan de analizar datos del negocio para generar información táctica y estratégica que sirve de soporte para la toma de decisiones. Mientras que las transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos, OLAP logra su máxima eficiencia y flexibilidad operando sobre Bases de datos Multidimensionales. Podemos nombrar las siguientes características como las más sobresalientes de estas aplicaciones:
  v  Estructura de datos transparente al usuario.
  v  Solo Consulta, trabajan sobre la información operacional generada por los sistemas OLTP.
  v  Consultas sobre grandes volúmenes de datos no predecibles
  v  Información histórica.
  v  Modo de actualización Batch.
  v  Alta redundancia de datos para facilitar la generación de consultas y obtener buenos tiempos de respuesta.

EIS (Executive Information System)

Son herramientas para proveer información estratégica a los ejecutivos mediante informes, comparativa y cuadros de mando multidimensionales.

DSS (Decission Support System)

Herramienta de soporte para la toma de decisiones. Incorpora reglas de decisión y análisis de datos no predefinidos en las posibilidades de un EIS.
  v  Sistemas de presentación.
  v  Sistemas Interrogativos.
  v  Sistemas de Simulación.
  v  Sistemas funcionales.
  v Sistemas Expertos.


Ventajas y desventajas de Data la Werehouse

Ventajas

Hay muchas ventajas por las que es recomendable usar un almacén de datos. Algunas de ellas son:
  • Los almacenes de datos hacen más fácil el acceso a una gran variedad de datos a los usuarios finales
  • Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la decisión tales como informes de tendencia', por ejemplo: obtener los ítems con la mayoría de las ventas en un área en particular dentro de los últimos dos añosinformes de excepción, informes que muestran los resultados reales frente a los objetivos planteados a priori.
  • Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor operacional de las aplicaciones empresariales, en especial la gestión de relaciones con clientes.


Desventajas

Utilizar almacenes de datos también plantea algunos inconvenientes, algunos de ellos son:
  • A lo largo de su vida los almacenes de datos pueden suponer altos costos. El almacén de datos no suele ser estático. Los costos de mantenimiento son elevados.
  • Los almacenes de datos se pueden quedar obsoletos relativamente pronto.
  • A veces, ante una petición de información estos devuelven una información subóptima, que también supone una pérdida para la organización.
  • A menudo existe una delgada línea entre los almacenes de datos y los sistemas operacionales. Hay que determinar qué funcionalidades de estos se pueden aprovechar y cuáles se deben implementar en el data warehouse, resultaría costoso implementar operaciones no necesarias o dejar de implementar alguna que sí vaya a necesitarse.

Multimedia




Referencias

http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos 




8 comentarios:

  1. Muy bien la información, la Base de Datos Data Warehouse me parece muy buena pues con la forma que almacena sus datos nos permite acceder fácilmente.

    ResponderEliminar
  2. Me parece una BD interesante ya que te ayuda a orientar tu decisión y desechar datos que no se necesitan, llevando asi aun funcionamiento o acceso al dato requerido mas rapido y eficaz.

    ResponderEliminar
  3. como dice mi compañero Angel buena base de datos maneja muy bien la informacion de manera organizada,consistente,accsesible

    ResponderEliminar
  4. Como menciona Susan Osterfeldt:
    "Yo considero al DW como algo que provee dos beneficios empresariales reales: Integración y Acceso de datos".

    Otorga unos beneficios por demás importantes para una empresa, si tomamos en cuenta que evita el almacenamiento de datos inútiles y no deseamos nos encontramos frente a una excelente solución.

    ResponderEliminar
  5. Data Warehouse me gusto este tipo de almacenamiento, y la informacion esta exelente mas en los objetivos y definiciones ya que colocastes tres verciones.

    ResponderEliminar
  6. Creo que es u tipo de base de datos muy buena ya que se enfoca principalmente a lo que es la consulta y el analisis de los datos contenidos en ella, es de gran uso principalmen para empresas u organizaciones que necesitan un almacenamiento de este tipo ya que resultaria mas eficientes para ellos por que evita el alamcenamiento de datos inutiles y otorga un facil y rapido acceso a una gran cantidad de datos a los usuarios.

    ResponderEliminar
  7. Buena informacion, ya que esta herramienta nos ayuda a optimizar el flujo de datos en nuestra base de datos.

    ResponderEliminar
  8. Una BD muy interesante, una informacion corta pero es muy consistente, se menciona lo mas relevante, importante de lo que se necesita entender, saber, comprender, me gusto la idea de las imagenes y el video para facilitar la lectura y comprender mejor.

    ResponderEliminar