Autor: VerGuiz

Datamining

El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento.
Los datos que vemos son sólo la punta del iceberg
Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso común a todos ellos se suele componer de cuatro etapas principales:
*  Determinación de los objetivos. Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining.
* Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.
*  Determinación del modelo. Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.
*  Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.
Esfuerzo en cada etapa del datamining
Carga de trabajo en las fases de un proyecto de datamining

Sistemas de Información Ejecutiva (EIS)

Un Sistema de Información para Ejecutivos o Sistema de Información Ejecutiva es una herramienta software, basada en un DSS, que provee a los gerentes de un acceso sencillo a información interna y externa de su compañía, y que es relevante para sus factores clave de éxito.
La finalidad principal es que el ejecutivo tenga a su disposición un panorama completo del estado de los indicadores de negocio que le afectan al instante, manteniendo también la posibilidad de analizar con detalle aquellos que no estén cumpliendo con las expectativas establecidas, para determinar el plan de acción más adecuado.
Sistemas de Información Ejecutiva (EIS)
De forma más pragmática, se puede definir un EIS como una aplicación informática que muestra informes y listados (query & reporting) de las diferentes áreas de negocio, de forma consolidada, para facilitar la monitorización de la empresa o de una unidad de la misma.
El EIS se caracteriza por ofrecer al ejecutivo un acceso rápido y efectivo a la información compartida, utilizando interfaces gráficas visuales e intutivas. Suele incluir alertas e informes basados en excepción, así como históricos y análisis de tendencias. También es frecuente que permita la domiciliación por correo de los informes más relevantes.
A través de esta solución se puede contar con un resumen del comportamiento de una organización o área específica, y poder compararla a través del tiempo. Es posible, además, ajustar la visión de la información a la teoría de Balanced Scorecard o Cuadro de Mando Integral impulsada por Norton y Kaplan, o bien a cualquier modelo estratégico de indicadores que maneje la compañía.
Ejemplo de EIS

Data Warehouse

Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales… etc). Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales).
Datawarehouse
El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho más que eso. Según definió el propio Bill Inmon, un datawarehouse se caracteriza por ser:
*   Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.
*  Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.
*   Histórico: el tiempo es parte implícita de la información contenida en un datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el datawarehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones.
*   No volátil: el almacén de información de un datawarehouse existe para ser leído, pero no modificado. La información es por tanto permanente, significando la actualización del datawarehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.
Otra característica del datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de la información, su periodicidad de refresco, su fiabilidad, forma de cálculo… etc.
Los metadatos serán los que permiten simplificar y automatizar la obtención de la información desde los sistemas operacionales a los sistemas informacionales.
Los objetivos que deben cumplir los metadatos, según el colectivo al que va dirigido, son:
*   Dar soporte al usuario final, ayudándole a acceder al datawarehouse con su propio lenguaje de negocio, indicando qué información hay y qué significado tiene. Ayudar a construir consultas, informes y análisis, mediante herramientas de Business Intelligence como DSS, EIS o CMI.
*   Dar soporte a los responsables técnicos del datawarehouse en aspectos de auditoría, gestión de la información histórica, administración del datawarehouse, elaboración de programas de extracción de la información, especificación de las interfaces para la realimentación a los sistemas operacionales de los resultados obtenidos… etc.
Por último, destacar que para comprender íntegramente el concepto de datawarehouse, es importante entender cual es el proceso de construcción del mismo, denominado ETL (Extracción, Transformación y Carga), a partir de los sistemas operaciones de una compañía:
*  Extracción: obtención de información de las distintas fuentes tanto internas como externas.
*  Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información.
*  Carga: organización y actualización de los datos y los metadatos en la base de datos.
Datawarehouse y datamarts
Una de las claves del éxito en la construcción de un datawarehouse es el desarrollo de forma gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el almacén de datos a los demás usuarios. Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir resultados a corto plazo.
Principales aportaciones de un datawarehouse
*  Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio.
*  Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información.
*  Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.
*  Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.
*  Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.

Sistema de Información Organizacional

Un sistema de información, es todo proceso por el cual se recopila, se clasifica, se procesa, se interpreta y se resumen muchos datos con el fin de sacar unas conclusiones y con el propósito de orientar la toma de decisiones en la empresa u organización. Estos sistemas de información y las tecnologías de la información han logrado cambiar la forma como operan las organizaciones actuales, pues con su uso se logran importantes mejoras, pues automatizan los procesos operativos, suministran una plataforma de información necesaria para la toma de decisiones. En el sentido más amplio, un sistemas en un conjunto de componentes que interaccionan entre sí para lograr un objetivo común.
 Nuestra sociedad está rodeado de sistema por ejemplo cualquier persona experimenta sensaciones físicas gracias a un complejo sistemas nerviosos formados por el cerebro, la médula espinal, los nervios, etc. Una organización es un sistema. Sus componentes mercadotecnia, manufactura, ventas, investigación, etc. trabajan juntos para crear utilidad que beneficien a la organización o empresa. Todo sistema organizacional depende, en mayor o menor medida, de una entidad abstracta denominada sistemas de información. Este sistema es el medio por el cual los datos fluyen de una persona o departamento hacia otros y puede ser cualquier cosa como la comunicación interna entre los diferentes componentes de la organización.
 Para mantener su funcionamiento, estos sistemas deben estar bajo control. Por ejemplo necesita satisfacer ciertos estándares de desempeño. La cantidad de artículos fabricados debe cumplir con determinada cuota, además de alcanzar niveles aceptables de calidad y costo. Hay varias maneras de nombrar a los sistemas de información: • Sistema de información organizacional.
 • Sistema de información y decisión.
 • Sistema de información de gestión.
 • Sistema de procesamiento de datos.
En general, cabe decir que, ante el volumen y complejidad de los datos a procesar, es indispensable la incorporación de herramientas informáticas. Pero, en contra de una generalizada creencia, un sistema de información orientado hacia la planificación, la decisión ejecutiva y el control no es simplemente un conjunto de computadoras. Es un sistema de funciones y relaciones que vincula las herramientas informáticas, la organización, el personal capacitado, la comunidad a la que se sirve y la conducción del gobierno local. Técnicamente, lo esencial de ese sistema es la información, registrada, procesada y comunicada mediante computadoras, programas informáticos y técnicos idóneos.
 El objetivo de toda información es describir y explicar situaciones reales mediante datos cuantitativos y cualitativos, numéricos, gráficos, conceptuales, relacionales, para diseccionar la acción política en el marco de un contexto dinámico. Con respecto a la planificación y la toma de decisiones, la información cumple las siguientes funciones:
 • Reduce el nivel de incertidumbre.
 • Permite prever la aparición de problemas o desviaciones.
• Disminuye el tiempo de reacción ante nuevas situaciones.
 • Eleva el nivel de racionalidad de las decisiones
. • Optimiza la eficacia y eficiencia de las acciones.
 En un sistema de información, las diversas áreas de la organización procesan y suministran en forma sistemática y homogénea la información propia, compatible con la información del resto. El sistema vincula todos los datos y los pone a disposición de los usuarios y los productores de información. Es fundamental esa sistematización, para asegurar la conectividad técnica (protocolos de comunicación, soft de soporte, medios magnéticos, etc.) y la conectividad funcional (que datos almacenar y que características deben tener). Esa información debe fluir a través de una red o malla, con múltiples posibilidades de relación, en una comunicación multidireccional, con variados niveles de acceso y jerarquías de usuarios. También deben establecerse relaciones con otras organizaciones, para recibir y dar información.
 Los sistemas de información tratan el desarrollo, uso y administración de la infraestructura de la tecnología de la información en una organización. En la era post-industrial, la era de la información, el enfoque de las compañías ha cambiado de la orientación hacia el producto a la orientación hacia el conocimiento, en este sentido el mercado compite hoy en día en términos del proceso y la innovación, en lugar del producto. El énfasis ha cambiado de la calidad y cantidad de producción hacia el proceso de producción en sí mismo, y los servicios que acompañan este proceso. El mayor de los activos de una compañía hoy en día es su información, representada en su personal, experiencia, conocimiento, innovaciones (patentes, derechos de autor, secreto comercial). Para poder competir, las organizaciones deben poseer una fuerte infraestructura de información, en cuyo corazón se sitúa la infraestructura de la tecnología de información. De tal manera que el sistema de información se centre en estudiar las formas para mejorar el uso de la tecnología que soporta el flujo de información dentro de la organización. La información puede llegar a ser el elemento decisivo, que en un momento dado, determine el éxito o el fracaso de un negocio, con el fin de lograr la máxima utilidad de la información ésta debe administrarse de manera correcta, como ocurriría con cualquier otro recurso de la empresa.
 La información es algo que procesamos, usamos y sin la cual no podemos operar adecuadamente en nuestros contextos, en ocasiones se habla de:
 • sobrecarga informativa:
 para referirnos a situaciones en las cuales la cantidad de información es tan grande que no es manejable.
 • Poca carga informativa:
 Falta de información y se refiere a situaciones donde la cantidad de información es tan baja que no se puede realizar la tarea requerida.
 La sobrecarga de información o la baja carga de información han dado vida a sistemas de procesamientos de información que usan hardware y software que la codifican, clasifican y almacenan, para que los usuarios potenciales la accedan fácilmente y sin esfuerzo; sistemas que se encargan de localizar la información que necesitan las organizaciones para sus actividades estratégicas y operativas o para realizar proyectos especiales en un momento determinado.
 La disponibilidad actual de las computadoras ha generado todo un incremento y una diversificación de la información, a través del computador se puede generar mayor cantidad de información que aquella que podría almacenarse de forma manual, ya que ésta puede llegar a multiplicarse a velocidades impresionantes.

¿Que es un Sistema de Información Geográfica?

Un Sistema de Información Geográfica  es una integración organizada de hardware, software y datos geográficos diseñada para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la información geográficamente referenciada con el fin de resolver problemas complejos de planificación y  de gestión.

FUNCIONAMIENTO DE UN SIG

El SIG funciona como una base de datos con información geográfica (datos alfanuméricos) que se encuentra asociada por un identificador común a los objetos gráficos de un mapa digital. De esta forma, señalando un objeto se conocen sus atributos e, inversamente, preguntando por un registro de la base de datos se puede saber su localización en la cartografía.

La razón fundamental para utilizar un SIG es la gestión de información espacial. El sistema permite separar la información en diferentes capas temáticas y las almacena independientemente, permitiendo trabajar con ellas de manera rápida y sencilla, y facilitando al profesional la posibilidad de relacionar la información existente a través de la topología de los objetos, con el fin de generar otra nueva que no podríamos obtener de otra forma.

Las principales cuestiones que puede resolver un Sistema de Información Geográfica, ordenadas de menor a mayor complejidad, son:

  1. Localización: preguntar por las características de un lugar concreto.
  2. Condición: el cumplimiento o no de unas condiciones impuestas al sistema.
  3. Tendencia: comparación entre situaciones temporales o espaciales distintas de alguna característica.
  4. Rutas: cálculo de rutas óptimas entre dos o más puntos.
  5. Pautas: detección de pautas espaciales.
  6. Modelos: generación de modelos a partir de fenómenos o actuaciones simuladas.

Por ser tan versátiles, el campo de aplicación de los Sistemas de Información Geográfica es muy amplio, pudiendo utilizarse en la mayoría de las actividades con un componente espacial. La profunda revolución que han provocado las nuevas tecnologías ha incidido de manera decisiva en su evolución.

LA CREACIÓN DE DATOS

Las modernas tecnologías SIG trabajan con información digital, para la cual existen varios métodos utilizados en la creación de datos digitales. El método más utilizado es la digitalización, donde a partir de un mapa impreso o con información tomada en campo se transfiere a un medio digital por el empleo de un programa de Diseño Asistido por Ordenador (DAO o CAD) con capacidades de georreferenciación.

Dada la amplia disponibilidad de imágenes orto-rectificadas (tanto de satélite y como aéreas), la digitalización por esta vía se está convirtiendo en la principal fuente de extracción de datos geográficos. Esta forma de digitalización implica la búsqueda de datos geográficos directamente en las imágenes aéreas en lugar del método tradicional de la localización de formas geográficas sobre un tablero de digitalización.

LA REPRESENTACIÓN DE LOS DATOS

Los datos SIG representan los objetos del mundo real (carreteras, el uso del suelo, altitudes). Los objetos del mundo real se pueden dividir en dos abstracciones: objetos discretos (una casa) y continuos (cantidad de lluvia caída, una elevación). Existen dos formas de almacenar los datos en un SIG: raster y vectorial.