OBJETIVO
En este curso, el alumno aprenderá sobre los patrones y prácticas de ingeniería de datos en lo que respecta a trabajar con soluciones analíticas por lotes y en tiempo real mediante tecnologías de plataforma de datos de Azure. Los estudiantes comenzarán por comprender las tecnologías básicas de computación y almacenamiento que se usan para crear una solución analítica.
DURACION
32 Horas
EXAMEN
DP-203
MODALIDAD
Presencial / Online
PERFIL DE AUDIENCIA
El público principal de este curso son profesionales de datos, arquitectos de datos y profesionales de la inteligencia empresarial que desean aprender sobre ingeniería de datos y crear soluciones analíticas mediante tecnologías de plataforma de datos que existen en Microsoft Azure. La audiencia secundaria para este curso analistas de datos y científicos de datos que trabajan con soluciones analíticas basadas en Microsoft Azure.
REQUISITOS PREVIOS
Los estudiantes exitosos comienzan este curso con conocimientos de computación en la nube y conceptos de datos básicos y experiencia profesional con soluciones de datos.
Completar específicamente:
• AZ-900 – Fundamentos de Azure
• DP-900 – Fundamentos de datos de Microsoft Azure.
CONTENIDO
Módulo 1:
Explore las opciones informáticas y de almacenamiento para cargas de trabajo de ingeniería de datos.
• Introducción a Azure Synapse Analytics.
• Describir Azure Databricks.
• Introducción al almacenamiento de Azure Data Lake.
• Describir la arquitectura de Delta Lake.
• Trabaje con flujos de datos mediante Azure Stream Analytics.
Módulo 2:
Diseñar e implementar la capa de servicio.
• Diseñar un esquema multidimensional para optimizar las cargas de trabajo analíticas.
• Transformación sin código a escala con Azure Data Factory.
• Rellene las dimensiones que cambian lentamente en las canalizaciones de Azure Synapse Analytics.
Módulo 3:
Consideraciones de ingeniería de datos para archivos de origen.
• Diseñe un almacenamiento de datos moderno con Azure Synapse Analytics.
• Proteja un almacenamiento de datos en Azure Synapse Analytics.
Módulo 4:
ejecute consultas interactivas con grupos SQL sin servidor de Azure Synapse Analytics.
• Explore las capacidades de grupos SQL sin servidor de Synapse de Azure.
• Consultar datos en el lago mediante grupos SQL sin servidor de Synapse de Azure.
• Cree objetos de metadatos en grupos SQL sin servidor de Azure Synapse.
• Proteja los datos y administre usuarios en grupos SQL sin servidor de Azure Synapse.
Módulo 5:
Explore, transforme y cargue datos en el almacenamiento de datos con Apache Spark.
• Comprender la ingeniería de big data con Apache Spark en Azure Synapse Analytics.
• Ingiere datos con portátiles Apache Spark en Azure Synapse Analytics.
• Transforme datos con DataFrames en grupos de Apache Spark en Azure Synapse Analytics.
• Integrar grupos de SQL y Apache Spark en Azure Synapse Analytics.
Módulo 6:
Exploración y transformación de datos en Azure Databricks.
• Describir Azure Databricks.
• Leer y escribir datos en Azure Databricks.
• Trabajar con DataFrames en Azure Databricks.
• Trabajar con métodos avanzados dataframes en Azure Databricks.
Módulo 7:
Ingiere y carga datos en el almacén de datos.
• Use las prácticas recomendadas de carga de datos en Azure Synapse Analytics.
• Ingestión a escala de Petabytes con Azure Data Factory.
Módulo 8:
Transforme datos con canalizaciones de Azure Data Factory o Azure Synapse.
• Integración de datos con canalizaciones de Azure Data Factory o Azure Synapse.
• Transformación sin código a escala con canalizaciones de Azure Data Factory o Azure Synapse.
Módulo 9:
Orquestar el movimiento y la transformación de datos en canalizaciones de Synapse de Azure.
• Orquestar el movimiento y la transformación de datos en Azure Data Factory.
Módulo 10:
Optimice el rendimiento de las consultas con grupos sql dedicados en Azure Synapse.
• Optimice el rendimiento de las consultas de almacenamiento de datos en Azure Synapse Analytics.
• Comprender las características para desarrolladores de almacenamiento de datos de Azure Synapse Analytics.
Módulo 11:
Analizar y optimizar el almacenamiento de almacenamiento de datos.
• Analizar y optimizar el almacenamiento de almacenamiento de datos en Azure Synapse Analytics.
Módulo 12:
Admite el procesamiento analítico transaccional híbrido (HTAP) con Azure Synapse Link.
• Diseñar el procesamiento transaccional y analítico híbrido mediante Azure Synapse Analytics.
• Configurar Azure Synapse Link con Azure Cosmos DB.
• Consulta Azure Cosmos DB con grupos de Apache Spark.
• Consulta Azure Cosmos DB con grupos SQL sin servidor.
Módulo 13:
Seguridad de extremo a extremo con Azure Synapse Analytics.
• Proteja un almacenamiento de datos en Azure Synapse Analytics.
• Configurar y administrar secretos en Azure Key Vault.
• Implementar controles de cumplimiento para datos confidenciales.
Módulo 14:
Procesamiento de secuencias en tiempo real con Stream Analytics.
• Habilite la mensajería confiable para aplicaciones de Big Data mediante Azure Event Hubs.
• Trabaje con flujos de datos mediante Azure Stream Analytics.
• Ingieren flujos de datos con Azure Stream Analytics.
Módulo 15:
cree una solución de procesamiento de secuencias con event hubs y Azure Databricks.
• Procesar datos de streaming con streaming estructurado de Azure Databricks.
Module 16:
cree informes mediante la integración de Power BI con Azure Synpase Analytics.
• Cree informes con Power BI mediante su integración con Azure Synapse Analytics.
Módulo 17:
Realizar procesos integrados de aprendizaje automático en Azure Synapse Analytics.
• Use el proceso integrado de aprendizaje automático en Azure Synapse Analytics.