¿Qué pasaría si las organizaciones procesaran todos sus datos hasta convertirlos en soporte para la toma de decisiones? ¿Qué pasaría si emplearan software especializados que sirvieran para la presentación de la información y el análisis de la misma? Daremos algunos ejemplos de Data Warehouse para responder estas preguntas.

EJEMPLOS-DE-DATA-WAREHOUSE

Ejemplos de Data Warehouse

En primer lugar, es importante diferenciar entre dos términos que, por su abreviatura, pueden confundirnos fácilmente, y desde un principio la intención es que el usuario sepa a qué atenerse y conozca algunos conceptos básico a lo que se va a enfrentar. Aquí mostraremos infinitos ejemplos que sirvan para que el individuo tenga las herramientas para distinguir estos elementos.

Definición

Vista la diferencia entre ambos términos, procederemos a definirlos formalmente, pues se trata de un proceso que extrae, transforma, consolida e integra los datos de una organización, tanto internos como externos, con la finalidad de hacerlos accesibles y útiles en la toma de decisiones.

De igual forma el Data warehouse también puede definirse como una base con información de sistema de archivos electrónicos, que almacena los datos necesarios para el análisis de la información y la toma de decisiones. Su diferencia radica en que que está orientada al negocio, integrada, variante en el tiempo y no volátil.

Básicamente, Data Warehousing (DWH) es un proceso y Data Warehouse (DW) es una base de datos.

Características

Son varios os aspectos que caracterizan el Data warehouse que proporcionan las herramientas necesarias para su optima utilización, cumpliendo así lineamientos programados que generen las herramientas para su suso de la mejor manera posible. Detallaremos las características de un Data Warehouse:

Orientada al negocio

Al Data Warehouse sólo ingresan datos relevantes para el análisis y toma de decisiones. Es decir, no se consideran datos que no tienen valor analítico, como por ejemplo, direcciones de habitación, códigos postales, direcciones de correo, entre otros. Pero son de interés variables como, tipo de cliente, ubicación geográfica, edad, etc.

Se manejan entidades de alto nivel, como clientes, productos, rubros, zonas, y otros. Los datos se guardan de forma multidimensional, es decir en tablas de hechos y dimensiones.

Integrada

Todos los datos provenientes de fuentes heterogéneas se consolidan para garantizar su calidad y limpieza. Los principales orígenes de datos son:

Según el tipo de usuario.

    • Operacional: Diariamente produce gran cantidad de datos, pero por sí mismos son de poca relevancia para el análisis requerido. Por ejemplo, las ventas de productos.
    • Medio: Genera datos con implicación a corto y mediano plazo, basados en los datos operacionales. Un buen ejemplo de este concepto es la generación de inventarios.
    • Gerencial: Emplea datos resultantes del proceso de integración y transformación. A su vez, genera nueva información. Se refiere, básicamente, al usuario del Data Warehouse.

Según el área o el departamento de la organización

    • Áreas: Cada una tiene responsabilidades bien definidas. Producen datos propios que son compartidos con las demás áreas.
    • Subdivisiones: Suelen ser geográficas. Aportan datos de localización, que deben ser incorporados junto con los demás.

Según la fuente

    • Internas: Generan datos propios, provenientes de las actividades diarias de la empresa.
    • Externas: Complementan los datos internos, por ejemplo censos y estadísticas.

Variante en el tiempo

Permite el acceso a diferentes versiones de una misma situación, ya que los datos actuales son almacenados junto con los históricos, en los ejemplos de data warehouse.

 

No volátil

Garantiza la estabilidad de la información, ya que una vez que los datos entran, no cambian. Es decir, los datos son manipulados únicamente cuando se introducen y cuando se consultan.

En resumen, las principales cualidades del Data Warehouse son:

Cualidades

Maneja datos en volumen, consecuencia de la acumulación de datos históricos, actuales y agregados, provenientes de diversas fuentes.

Coloca todo el volumen de datos en una misma base de datos centralizada. Estructura los datos de manera multidimensional.

Beneficios

Debido a sus características y cualidades, el Data Warehouse, presenta los siguientes beneficios:

  • Reduce el tiempo mínimo que se requiere para recoger todos los datos relevantes acerca de un tema en específico.
  • Proporciona herramientas de análisis.
  • Muchos reportes y análisis son definidos por el usuario.
  • Permite acceder, analizar y monitorear directamente los indicadores de la organización.
  • Ayuda a identificar los factores que inciden en el funcionamiento de la empresa.
  • Permite adelantar y determinar el comportamiento futuro de la institución.
  • Los usuarios pueden consultar datos de manera rápida y sencilla.

En definitiva, el Data Warehouse ayuda a la organización a responder preguntas esenciales para la toma de decisiones. Esto logra obtener beneficios de forma competitiva que optimizan su puesto en el mercado en el que operan. Algunas de estas preguntas son:

  • ¿Cuál es el perfil de los clientes?
  • ¿Cómo es su comportamiento?
  • ¿Cuál es la rentabilidad del negocio?
  • ¿Cuál es el riesgo que corre la organización?
  • ¿Qué servicios y productos utiliza y cómo puede incrementarlos?

EJEMPLOS-DE-DATA-WAREHOUSE

Ámbito de aplicación

Un Data Warehouse puede adaptarse a cualquier organización, sin importar su tamaño y complejidad. Esto es como consecuencia de la agenda de cualquier institución, empresa u organización al momento de tomar decisiones pertinentes referentes a los datos que produce.

Riesgos de aplicación

Requiere una gran inversión por parte de la organización.  Los beneficios de su implementación no se ven a corto plazo, sino a mediano y largo plazo.

La manipulación de datos atenta contra la manipulación de los datos sensibles.

Aspectos a tomar en cuenta

Tal y como se comentó al principio, son varios los aspectos que hay que tomar en cuenta para la aplicación de estos elementos para el uso de un servidor. Entre ellos podemos mencionar los siguientes:

Costos de aplicación

Un data Warehouse conlleva costos de construcción, operación y de sostén. El costo de construcción implica los costos de recursos humanos, tiempo y tecnología, mientras que el de operación y mantenimiento, contempla los costos de evolución, crecimiento y los producidos por los cambios en el origen de los datos.

Impacto en las personas

La aplicación de un Data Warehouse siempre genera expectativas en los usuarios, quienes necesariamente tendrán que adquirir nuevas destrezas. El éxito de este tipo de data depende del uso activo y retroalimentación por parte de los usuarios.

Impacto en los procesos empresariales y de toma de decisiones

Con la aplicación de un Data Warehouse pueden quedar al descubierto ciertas deficiencias en los procesos empresariales, pero al mismo tiempo aumenta la confianza en las decisiones tomadas en base a los resultados arrojados por la misma.

Arquitectura

EJEMPLOS-DE-DATA-WAREHOUSE

La arquitectura general de un ejemplo de data Warehouse es la que se muestra en la figura de arriba. Como se puede apreciar, este sistema implica una serie de interacciones entre sus componentes. Al respecto y a manera de resumen, su funcionamiento puede describirse de la siguiente forma:

  • Los datos son tomados de diversas fuentes, como servicios web, archivos y otras bases de datos, tanto internas como externas.
  • Una vez extraídos los datos, estos son integrados, transformados y limpiado, para posteriormente ser cargados en el Data Warehouse.
  • Con la finalidad de generar información táctica y estratégica, se obtienen informes y análisis provenientes de la carga de los datos.
  • Finalmente, los usuarios pueden consultar y explorar los reportes y análisis generados.

Elementos

Vamos ahora a describir algunos de los elementos que se pueden evaluar en el Data Warehouse que deben ser de nuestra consideración.

Fuentes del Data Warehouse

Generalmente, son el resultado de la actividad diaria de la empresa, en cuyo caso se denominan fuentes internas. Cuando los datos son tomados de, por ejemplo, servidores web, éstas son consideradas fuentes externas. Son diferentes entre sí, porque dependen de su procedencia, formato, función, etc.

Extracción, transformación y carga

EJEMPLOS-DE-DATA-WAREHOUSE

Conocido como ETL, es el proceso que comprende todas las tareas que se realizan desde que se obtienen los datos hasta que se cargan en el Data Warehouse. Éstas son: extracción, manipulación, control, integración, depuración de datos, carga y actualización.

Extracción

Incluye técnicas enfocadas en obtener, desde diversas fuentes, sólo los datos relevantes y mantenerlos en un almacenamiento interno. Este tipo de almacenamiento permite manipular los datos sin intervenir ni alterar con mas datos las fuentes ni el Data Warehouse, crear una capa de extracción entre la lectura y la carga, almacenar y gestionar los metadatos que se generan en el proceso y facilitar la integración.

La extracción se basa en las necesidades de los usuarios y los requisitos definidos para la solución.

Transformación

Se trata de las técnicas encargadas de hacer compatibles los diferentes formatos, así como de filtrar y clasificar los datos, y relacionar fuentes.

Esta función es la responsable de aplicar todos los comandos aptos en relación a los datos, a fin de promoverlos de forma fuerte y razonable que hagan compatibilidad y coherencia con el Data Warehouse. Además, se encarga de la limpieza y calidad de los datos.

Carga

Referente a las técnicas propias de la carga inicial de los datos y la actualización periódica del Data Warehouse.

  • La carga inicial se refiere a la primera carga de datos que recibe el Data Warehouse. Generalmente, consume muchísimo tiempo debido a la gran cantidad de registros pertenecientes a largos periodos de tiempo.
  • La actualización periódica se refiere a la inserción de pequeños volúmenes de datos. Su objetivo es añadir a los ejemplos de data warehouse sólo aquellos datos que se generan de la última actualización. Depende de las necesidades y requerimientos del usuario.

En definitiva, mediante el proceso de la carga de datos, se garantiza el mantenimiento del Data Warehouse.

A modo de resumen, se puede decir que el proceso ETL se lleva a cabo de la siguiente manera:

  • Los datos, una vez extraídos de las fuentes relevantes, se depositan en el almacenamiento interno.
  • Mientras los datos se mantienen en el almacenamiento interno, se integran y transforman.
  • Cuando los datos son limpiados, luego del paso anterior, son pasados al Data Warehouse.

Reportes

Los reportes son herramientas gráficas que le permiten al usuario obtener informes detallados sobre la información de su empresa. La forma de interactuar con estos reportes es bastante sencilla para el usuario, pues se trata de instrucciones de fácil seguimiento. Básicamente, debe seleccionar opciones de un menú, referente a las condiciones y especificaciones del tema presentado.

OLAP

Es el componente más poderoso del Data Warehouse, ya que contiene el motor de consultas multidimensionales especializadas del sistema.

Permite el análisis de la organización desde diferentes escenarios históricos. Proyecta su comportamiento y evolución desde una visión multidimensional, es decir, mediante la combinación de diferentes perspectivas, temas de interés o dimensiones. Esto permite deducir tendencias por medio del descubrimiento de relaciones entre las perspectivas que a simple vista serían difíciles de encontrar.

Data Mining

EJEMPLOS-DE-DATA-WAREHOUSE

Es, principalmente, una herramienta estadística, mediante la cual se pueden hacer predicciones. Se trata de inferir comportamientos, sin que hayan reglas preestablecidas. Genera reportes en forma de tablas y gráficos, entre otros, los cuales promueven la toma de decisión de una manera proactiva. Trabaja sobre la base de la información que ya ha sido enteramente procesada.

Diferencia entre OLAP y Data Mining

Una vez considerados los principales aspectos de OLAP y el Data Minig, se puede establecer una diferencia básica entre ellos.

  • Mediante OLAP se interpreta la situación actual de la empresa, dando respuestas rápidas que faciliten la toma de decisiones.
  • El Data Minig predice situaciones, basado en el estudio de conocimientos ocultos que provocan cierto tipo de comportamientos.

En consecuencia, ambos sistemas se ocupan de resolver diferentes tipos de situaciones analíticas.

Data Minig y su relación con Data Warehouse

Un sistema Data Minig es una tecnología de soporte para el usuario final, cuyo objetivo es extraer información útil a partir de la información contenida en la base de datos de las empresas. Es decir, el origen de la información que utilizan los algoritmos de Data Minig suelen ser datos históricos contenidos en un Data Warehouse.

Debe existir una integración entre las técnicas de Data Minig y los procesos que conlleva el Data Warehouse. Es decir, para poder realizar el análisis del negocio, debe haber concordancia entre el Data Minig, el Data Warehouse y el servidor OLAP.

Cada vez que Data Warehouse proporciona nuevos resultados, la empresa puede volver a aplicar Data Minig para optimizar la toma de decisión.

En definitiva, el Data Minig y el Data Warehouse, son herramientas completamente compatibles. El Data Warehouse aporta memoria, y el Data Minig inteligencia.

Bases de datos tradicionales vs Data Warehouse

El análisis de los aspectos expuestos hasta ahora, nos lleva a comprender que un Data Warehouse difiere de las bases de datos que soportan las transacciones diarias de las organizaciones. Acá las diferencias básicas

  • En las bases de datos tradicionales la información está organizada para que sea recuperada y actualizada fácilmente. Un Data Warehouse está organizado y orientado hacia el usuario final, el cual únicamente puede realizar consultas.
  • Las bases de datos transaccionales se ocupan del procesamiento diario de los datos. El Data Warehouse trabaja con datos históricos, es decir, correspondientes a largos períodos de tiempo.
  • Las bases de datos tradicionales son accesadas en varias oportunidades durante una jornada de trabajo. En un Data Warehouse las lecturas y consultas son mínimas, pues se accede esporádicamente.
  • El volumen de datos que administra un Data Warehouse es mucho mayor que el administrado en las bases de datos tradicionales.
  • La estructura de las bases transaccionales es estable. La estructura de un Data Warehouse varía de acuerdo con su propia evolución y utilización.

A continuación, estableceremos algunos ejemplos de Data Warehouse.

Ejemplos de Data Warehouse

Una empresa de alcance nacional, dedicada a la venta de artículos de limpieza al mayor y al por menor, considerada además de mediano tamaño por su volumen de ventas, tiene como meta principal maximizar sus ganancias. De igual manera, con el fin de conseguir mayor cantidad de clientes, desea expandirse a un nuevo nivel de mercado y, posteriormente, ampliar su rubro de productos. Una de sus principales políticas es mejorar continuamente para conseguir una mejor posición con respecto a sus competidores de los ejemplos de data warehouse.

EJEMPLOS-DE-DATA-WAREHOUSE

La aplicación de un Data Warehouse le ofrece los siguientes beneficios a la organización.

  • Permite a los usuarios tener una visión general del negocio.
  • Transforma datos operativos en información analítica, enfocada hacia la toma de decisiones.
  • Genera reportes dinámicos que facilitan su análisis.
  • Facilita la formación de estrategias para el cumplimiento de las metas de la organización.
  • Beneficia la estabilidad de la estructura de la empresa.

Otro ejemplo de data warehouse cotidiano se refiere a la gestión de una institución educativa, la cual presenta deficiencias en cuanto a la comunicación con sus estudiantes. De igual manera, carece de un centro de información unificado que posea toda la información de los mismos. El objetivo de la institución es acompañar a los alumnos durante su carrera y luego de su egreso, para ofrecerle nuevas propuestas que potencien el rendimiento de la organización y el desarrollo de los estudiantes.

Con la aplicación de un Data Warehouse se busca responder a las necesidades de la universidad. En principio, eliminando la duplicidad de la información y la presencia de detalles erróneos sobre los estudiantes, así como toda la información que, en general, se considere de mala calidad y que no resulte relevante. Adicionalmente, se integra toda la información, formando un registro unificado de estudiantes que sirva de base para el buen desarrollo del proyecto de la institución.

Finalmente, se impulsan las actividades de mercadotecnia, dándole a la universidad mayor beneficio y ayudando a su crecimiento a través de la correcta gestión de la información.

En conclusión, en ejemplos de data warehouse brinda la oportunidad de conocer lo que está sucediendo en la organización, lo que ha sucedido, lo que puede llegar a suceder y el porqué. Puedes ver el artículo tipos de virus informáticos.