Diplomado en Analítica de Datos y Big Data
Menú de navegación
- Contenidos programáticos
- Departamento de Estudios Interculturales (DEIN)
- Documentos Institucionales e informes
- Publicación y contratos
- Departamento de Tecnología del Conocimiento
- Sistema de Colecciones de la UMNG
- Proyección Social Campus Nueva Granada
Publicador de contenidos
En un mundo globalizado donde cada minuto se generan enormes cantidades de datos de todo tipo (estructurados, semiestructurados y no estructurados), resultantes de las actividades cotidianas a nivel personal o de las técnicas y métodos aplicados en los procesos de producción, optimización y comercialización a nivel organizacional e institucional, es indispensable contar con diferentes metodologías y herramientas que permitan generar información de alto valor que apoye la toma de decisiones. De acuerdo con una infografía creada por domo.com, muestra que cada minuto en el mundo se generan datos resultantes del envío de 473.400 mensajes en Twitter, se consumen 97.222 horas de streaming en Netflix, se publican 2.083.333 mensajes en Snapchat, más de 120 profesionales se unen a Linkedin, Amazon sirve 1.111 productos, son vistos 4.333.560 vídeos en Youtube, Skype registra
176.220 llamadas, los usuarios comparten 49.380 imágenes en Instagram, 750.000 canciones son escuchadas en Spotify, Google ofrece 3.877.140 búsquedas en Internet. En la actualidad se considera que se generan más datos en dos días que en toda la historia contemporánea. El tratamiento y análisis de datos masivos se conoce como Big Data y es una de las claves fundamentales para la gestión eficaz en las empresas.
Las tecnologías Big Data se emplean actualmente en la mayoría de las áreas o disciplinas y en distintos sectores que van desde la salud hasta el sector industrial. La creciente generación de datos digitales obtenidos como resultado de las aplicaciones móviles, las redes sociales y los procesos relacionados con el internet de las cosas, constituyen una ventana para la extracción de conocimiento de manera eficiente, expedita y accesible.
Adicionalmente a la aplicación de las tecnologías Big Data, se ha confirmado con resultados cuantificables la eficiencia que aporta la ciencia de datos para la toma de decisiones orientadas a optimizar la rentabilidad de las empresas, acrecentar el retorno de la inversión, consolidar el posicionamiento de los productos, perfeccionar la experiencia del usuario, responder a iniciativas regulatorias y proveer productos y servicios conforme con los requerimientos, costumbres y perfiles de los diversos clientes o usuarios en general.
El diplomado en Big Data y analítica de datos, está orientado a fortalecer los conocimientos, prácticas y aplicaciones en el tratamiento, procesamiento y analítica de datos en los diferentes campos del conocimiento para la toma de decisiones.
Objetivo
- Brindar conocimiento de los fundamentos y potencialidades que proporciona las tecnologías Big Data en la gestión y manejo de grandes volúmenes de datos de tipo estructurado, semiestructurado y no estructurado.
- Comprender la utilidad y ventajas de las soluciones de Big Data generadas mediante las distintas aplicaciones y software para el tratamiento y análisis de datos que redunden en la generación de conocimiento.
- Proporcionar a los participantes métodos y herramientas apropiadas para el procesamiento y análisis de datos que genere información útil para la toma de decisiones a nivel organizacional.
Dirigido a
Toda persona interesada en adquirir habilidad en el manejo avanzado de datos y su respectivo análisis.
Duración
120 horas
Competencias
Al finalizar el curso el estudiante deberá estar en capacidad de:
- Identificar los conceptos básicos de Big Data y su potencial de aplicación.
- Aplicar las herramientas requeridas para el procesamiento de datos.
- Emplear los métodos apropiados para el análisis de datos.
- Interpretar la información generada del análisis de datos para la toma de decisiones.
- Realizar procesos de gestión basado en la toma de decisiones.
- Explorar diversas aplicaciones y software para la extracción, tratamiento, visualización y análisis de datos para la toma de decisiones
Contenido
Módulo 1: Fundamentos de Big Data y sistema de almacenamiento de datos
- Definición y generalidades
- Tipos de datos
- Calidad de los datos
- Gestión de los datos
- Generación de datos
- Adquisición de datos
- Almacenamiento
- Análisis de los datos
- Tecnologías de los Big Data
- Hadoop
- Hadoop Distributed File System (HDFS)
- MapReduce
- Hadoop Ecosystem
- Plataformas de Big Data en la Nube
- Las nuevas BBDD
- Características de las BBDD NoSQL
- Tipos de Bases de Datos NoSQL
- Bases de datos Clave Valor
- Bases de datos documentales
- Bases de datos en grafo
- Bases de datos orientada a objetos
- Bases de datos orientadas en columna
- Modelo híbrido
- Comparación principal BBDD NoSQL
- Ejemplos de bases de datos NoSQL
- Hbase
- DynamoBD
- MongoBD
- Casandra
- Redis
Módulo 2: Diseño de un proyecto Big Data y casos de uso
- Metodología PMBOK
- Etapas en el diseño de un proyecto Big Data
- Gestión del proyecto y seguimiento
- Reelección de OBMA en 2012
- Amazon y sus empleados
- Wall-Mart
- Usos de Big Data
Módulo 3: Ciencia de datos
- Naturaleza de los datos masivos
- Fuentes de generación de datos masivos
- Características y valor de los datos
- Dificultades computacionales
- Visualización de datos masivos
- Gráficas
- Coordenadas paralelas
- Gráficas interactivas
- Proyecciones
- Métodos de clasificación de datos
- Análisis discriminante
- Algoritmo de k- vecinos más cercanos
- Modelos de regresión
- Redes bayesianas
- Árboles de decisión
- Técnicas de Machine Learning
- Métodos kernel
- Máquinas de soporte vectorial
- Algoritmo EM
- Modelo de mezclas gaussianas
- Redes neuronales
Módulo 4: Análisis estadístico - Software R y RStudio
- Introducción
- Características de R y RStudio
- Operaciones en R
- Tipos de datos
- Carga de datos estructurados
- Carga de datos no estructurados
- Análisis de datos
- Distribuciones de frecuencia
- Herramientas de visualización de datos
- Análisis descriptivo de datos
- Principios de estadística inferencial
- Análisis gráfico
- Manipulación de texto
- Web scraping
- Manipulación básica de texto
- JSOM y XML
- Representación gráfica
- Estadística y ciencia de datos con R
- Árboles de decisión
- Igualdad de medias
- Modelos de regresión
- Clústering con k - medias
Módulo 5: Aplicación del software Knime Power BI
- Introducción a Knime Power BI
- Entorno de Knime Power BI
- Repositorio de nodos
- Acciones básicas
- Construcción de un flujo de datos
- Acceso a datos
- Leer datos de archivos
- Carga de bases de datos
- Servicios en línea
- Otras fuentes de datos
- ETL y manipulación de datos
- Filtrado de filas y columnas
- Agregaciones
- Trabajo y concatenación
- Transformación: conversión, reemplazo, estandarización
- Preparación de datos para análisis
- Exportar datos
- Escribir en un archivo
- Generar informes
- Análisis y visualización de datos
- Histogramas
- Datos paralelos
- Matriz de puntos
- Gráfico lineal
- Análisis predictivo
- Conceptos básicos de minería de datos
- Regresiones
- Elaboración del modelo (Clúster y árboles de decisión)
- Evaluación del modelo
- Control de flujo
- Parametrización del flujo de trabajo: Variables de flujo
- Ejecución de partes del flujo: Bucles
- Limpiar el flujo de trabajo
Estrategia metodológica
Para el logro de los objetivos planteados, el programa del diplomado contempla:
Para el desarrollo de las clases:
- Exposición de conceptos por parte del profesor.
- Guías y talleres de soporte aplicados.
- Desarrollo de ejercicios prácticos en el computador dirigidos por el docente.
- Trabajo de retroalimentación yexploración para realizar fuera de clase.
- Ayudas didácticas
- Computadores personales.
- Talleres de ejercicios.
- Software RStudio, Power BI yKnime.
- Aula virtual
Criterios de evaluación
El estudiante debe demostrar competencias en el manejo de cada herramienta con el desarrollo de los talleres y guías de trabajos de las clases y los trabajos que se le soliciten.
Adicionalmente, debe asistir mínimo al 80% de las horas de clase programadas.
La evaluación mide el:
- Desarrollo Cognitivo (conocimiento)
- Desarrollo de Habilidades (operativo)
Al finalizar el diplomado, se entregará una certificación de asistencia y aprobación.
Valor del diplomado
Inscripción: $ 71.000
Institucional: $ 2.640.000
Particulares: $ 3.168.000
Solicita más información
Departamento de Tecnologías del Conocimiento
PBX: 650 0000 - Extensiones:
Bogotá, Villa Académica: 1220-1221-1222
Bogotá, Facultad de Medicina: 2127
Cajicá, Campus: 3042
e-mail: tecnologias.conocimiento@unimilitar.edu.co tecnologias.conocimientocampus@unimilitar.edu.co