Explora Databricks con este curso gratuito para analistas y científicos de datos

Si usas Spark o quieres integrar BI con lagos de datos, este curso gratuito de Databricks puede ayudarte mucho.

Anuncios

Cuando escuché por primera vez sobre Databricks, fue en una charla sobre arquitectura moderna de datos. Lo mencionaron junto a Apache Spark, notebooks colaborativos y algo llamado “Lakehouse”.

No entendí nada. Unos meses después, decidí tomar el curso gratuito “Introducción a Databricks” en DataCamp. Fueron tres horas bien invertidas.

El curso no es una guía paso a paso para usar Spark ni un taller intensivo de Machine Learning. Es una introducción a la plataforma Databricks, pensada para que entiendas qué hace, cómo se usa y por qué podría interesarte.

Explora Databricks con este curso gratuito para analistas y científicos de datos

Se arranca explicando el concepto de “Lakehouse”, que combina la estructura de un almacén de datos con la flexibilidad de un lago de datos. Parece marketing, pero tiene sentido cuando ves la arquitectura.

El instructor, Kevin Barlow, te muestra la interfaz de Databricks y cómo se organiza el espacio de trabajo. Usas notebooks (muy parecidos a los de Jupyter) para hacer consultas SQL, conectarte a fuentes de datos externas y configurar clústeres.

En las siguientes lecciones entras al tema del cálculo distribuido con Apache Spark. Nada muy técnico, pero lo suficiente para entender por qué es relevante en entornos con grandes volúmenes de datos. Luego usas SQL dentro de Databricks para consultas y tableros de BI. Todo se siente muy integrado.

La duración del curso es corta, tres horas, y está dividido en tres partes:

  1. Introducción a Databricks
  2. Fundamentos de la Plataforma de Inteligencia de Datos
  3. Introducción a SQL en Databricks

Durante esas secciones, pasas por ejercicios interactivos donde:

  • Escribes consultas SQL sobre conjuntos de datos reales
  • Configuras clústeres
  • Pruebas permisos y catálogos
  • Usas notebooks colaborativos

Todo en inglés, pero con una interfaz bastante intuitiva.

Para entrar al curso, necesitas tener nociones básicas de Python o SQL, conocer qué es un notebook y tener interés por temas como Big Data o ciencia de datos. La plataforma requiere que tengas una cuenta (hay una versión gratuita), y lo ideal es contar con buena conexión a internet.

La lista de habilidades que se tocan es amplia, aunque de forma superficial:

  • Fundamentos de Apache Spark
  • Automatización de pipelines de datos
  • Visualización de datos en notebooks
  • Machine Learning con MLflow
  • Integración con Data Lakes

No terminas siendo experto en ninguno, pero sales con una idea general del ecosistema Databricks.

Este curso está pensado para estudiantes y profesionales que ya estén metidos en ciencia de datos, BI, ingeniería de datos o TI. No es una buena opción si apenas estás empezando a programar. Pero si ya trabajas con Spark, SQL o estás construyendo soluciones analíticas, puede ayudarte a entender cómo usar Databricks como base.

La valoración del curso es alta, y más de 14 mil personas ya lo han tomado. Eso le da cierto respaldo. Además, lo imparte alguien que trabaja en el área y no un influencer de YouTube.

Paso a paso para acceder al curso

  1. Ingresa a aquí.
  2. Crea una cuenta gratuita en DataCamp o inicia sesión
  3. Haz clic en “Start Course” o “Comenzar curso”
  4. Listo. No necesitas tarjeta ni compromiso

Si usas Spark, SQL o MLflow en tu trabajo, dale una oportunidad. Puede ayudarte a ahorrar muchas horas en pruebas y errores.

Anuncios
Henry Hernandez

Henry Hernandez

Me encanta compartir cursos gratuitos y recursos útiles para que sigas aprendiendo sin gastar.

Artículos: 892