X
Blog | Databricks

Primeros pasos en Databricks

En este artículo te presentamos un video en el que vas a encontrar todo lo necesario para entender los primeros pasos en Databricks y poder empezar a trabajar con esta tecnología gratis.

Databricks para el análisis de datos

Databricks se convirtió en una herramienta fundamental para el trabajo en Data & AI porque reduce de sobremanera el stack de herramientas que cualquier persona que trabaja con datos utiliza. Elimina la complejidad asociada al uso de varias tecnologías porque centraliza el acceso, la manipulación y la gestión de los datos en el mismo lugar, no importa el perfil de quien acceda (ingenieros, científicos, analistas, usuarios de negocio, etc.)

Además, introduce el concepto de lakehouse que vino a resolver los problemas clásicos del data warehouse y del data lake. Las arquitecturas lakehouse combinan lo mejor de dos mundos, por un lado la estrategia de almacenamiento costo efectiva y la flexibilidad del data lake con la performance y la disponibilidad de datos del data warehouse.

Primeros pasos

En este video explicamos cómo evolucionaron las arquitecturas de datos modernas data warehouse, data lake y lakehouse. También hablamos de qué novedades y beneficios introduce Databricks a las personas que trabajan con datos y repasamos algunos de los features más destacados: Delta Live Tables, Delta Sharing, Unity Catalog y Databricks SQL.

Este video le va a servir a quienes estén empezando a trabajar con Databricks o necesiten entender cuáles son los aspectos básicos de esta herramienta.

En el video van a encontrar:

  • Componentes de una arquitectura de datos.
  • Qué buscamos en una arquitectura de datos.
  • Cómo construir una arquitectura de datos.
  • Qué es un data warehouse.
  • Problemas del data warehouse.
  • Qué es un Data Lake.
  • Qué son y cómo funcionan los sistemas distribuidos (Spark).
  • Qué es Databricks.
  • Cómo darte de alta en la versión gratuita (Databricks Community).
  • Databricks para los diferentes roles de datos.
  • Cómo estructurar un data lake en Databricks (arquitectura Medallion).
  • Problemas del data warehouse y del data lake.
  • Data Lakehouse: qué es y qué viene a resolver.
  • Qué novedades introduce Databricks en el data lakehouse.
  • Desafíos de Delta Lake.
  • Delta Lake: qué es y cómo se compone.
  • Demo Delta Lake.
  • Delta Live Tables: qué es y cómo funciona.
  • Delta Sharing: qué es y cómo funciona.
  • Unity Catalog: qué es y cómo funciona.
  • Databricks SQL: qué es y cómo funciona.

¿Cuáles son las principales ventajas de Databricks?

1) Simplicidad

Databricks funciona como un sistema distribuido que puede configurarse de forma muy simple. Con apenas un clic, podremos contar con la capacidad de cómputo de un cluster de Spark.

2) Potencia y elasticidad

La sencillez de Databricks, no va en contra de su potencia. Detrás de esta plataforma, implementamos un sistema con la capacidad y la potencia de Spark que, además, está montado 100% en nube. Entonces, no por ser simple, pierde capacidad de cómputo o potencia.

3) Para todos los perfiles de datos

Al ser fácil de usar, al tener mucha capacidad de cómputo y al ser elástica, Databricks es una plataforma que sirve para todo lo que queramos crear con los datos y para todo tipo de perfiles.

4) Basada en una arquitectura libre

Su arquitectura se basa en componentes open source. Esto no implica que sea gratis, significa que el vendor lock-in es bajo.

Supongamos que tenemos que construir un data lake con teras y teras de datos que representa la realidad de mi negocio, el hecho que esté basado en componentes libres significa que, si el día de mañana queremos ir de Databricks a otra tecnología, podremos hacerlo y el costo no será tan elevado.

¿Qué es una arquitectura de datos?

Una arquitectura de datos es una combinación de tecnologías que permite resolver las necesidades de información de una organización. Por ejemplo: cuánto se vendió, cuántos clientes se ganaron o están en riesgo de perderse, cuál es el nivel de stock de productos, etc. Provee todos aquellos datos que el negocio necesita para poder tomar decisiones data-driven.

La arquitectura de datos es la estructura tecnológica que está detrás de una solución de datos, ya sean tableros, reportes, sistemas de alertado, modelos de inteligencia artificial, etc. Lo más importante es que pueda garantizar una visión integral del negocio.

Para profundizar más en este concepto, te invitamos a que leas este artículo sobre ¿Qué es una arquitectura de datos moderna?

Arquitectura de datos moderna

Conclusión

En poco tiempo, Databricks está dejando de ser un aspiracional y está pasando a ser la tecnología elegida para darle vida a los proyectos de Data & AI. Aprender a usarla es un paso clave para los diferentes perfiles que trabajan con datos, por eso dejamos este video con todo lo necesario para empezar.


* Este contenido fue publicado originalmente en Datalytics.com. Datalytics y Lovelytics se fusionaron en enero de 2025.

Author

Artículos relacionados

Portada del contenido del blog sobre gobierno de datos 2026
Ene 29 2026

Gobierno de datos 2026 ¿Cómo diseñar la estrategia con IA?

En este artículo, analizamos cómo diseñar una estrategia de gobierno de datos para inteligencia artificial, moderna y escalable, clave para que la IA genere valor real....
Nov 19 2025

Por qué el equipo de LATAM elige trabajar en Lovelytics

El equipo de Lovelytics LATAM está formado por personas de distintos países, culturas y zonas horarias que —desde Cali hasta la Patagonia— trabajan en equipo para...
Sep 04 2025

Databricks reconoce a Lovelytics LATAM como el partner del año en Unity Catalog

En la edición 2025 del LATAM Partner Forum celebrado en Brasil, Databricks reconoció a Lovelytics LATAM como el partner del año en la categoría Unity Catalog....
Ago 26 2025

Nueva marca, a partir de hoy somos Lovelytics LATAM

Hoy cambiamos el nombre de nuestra marca. Desde ahora somos Lovelytics LATAM.  Oficializamos el cambio que anticipamos en enero después de meses de...
Jun 24 2025

¿Qué es y cómo usar AI/BI Genie de Databricks?

AI/BI Genie es un agente que nos permite conversar con los datos. En este artículo explicamos qué desafíos resuelve, cuánto cuesta y explicamos cómo usarla a partir de...
May 07 2025

¿Qué es AI/BI Dashboard de Databricks?

En este artículo explicamos qué es AI/BI Dashboard de Databricks, para qué tipo de perfiles está pensada, en qué circunstancias conviene usarla y cuándo es recomendable...
Ene 21 2025

¿Qué es Apache Spark y cómo funciona?

Apache Spark es un tipo de tecnología que utiliza sistemas distribuidos. En este artículo explicamos qué es, cuáles son los conceptos clave a tener en cuenta y te...
Dic 06 2024

¿Qué es Staff Augmentation?

En este artículo explicamos qué es el Staff Augmentation de equipos de datos, qué problemas viene a resolver y cuáles son sus principales beneficios. ¿Qué problemas...
Nov 26 2024

Ingeniería de datos: ¿Cómo hacer un plan de pruebas?

En este artículo explicamos cómo hacer un plan de pruebas mínimo en ingeniería de datos. Hablamos de la importancia de asegurar la calidad de los procesos con un plan...
Nov 14 2024

Arquitectura de datos moderna con AWS, ¿Cómo construirla?

En este artículo explicamos cómo construir una arquitectura de datos moderna con AWS. Además, describimos cómo es el ecosistema de servicios que ofrece para los...