Apache Spark es un tipo de tecnología que utiliza sistemas distribuidos. En este artículo explicamos qué es, cuáles son los conceptos clave a tener en cuenta y te orientamos a empezar a usarlo de forma sencilla. ¿Qué es Apache Spark? Apache Spark es una tecnología que...
En este artículo explicamos qué es un data lakehouse, qué problemas viene a resolver y cuáles son sus principales características. Además, desarrollamos el concepto de Arquitectura Medallero y profundizamos en cada una de sus capas. Los problemas del data lake A...
En este artículo desarrollamos en detalle qué es un data lake, cuáles son sus ventajas y sus desventajas. Además, explicamos cómo se componen este tipo de arquitecturas y qué sucede en cada una de sus capas. Data lake: contexto histórico A principios del siglo XXI,...
En este artículo mostramos cómo implementar una arquitectura de datos en Azure Databricks. Además, explicamos cuáles son los componentes de una arquitectura lakehouse y qué servicios de Microsoft usar en cada una de sus fases. ¿Qué es una arquitectura de...
En este artículo explicamos qué es Azure Databricks y cuáles son sus costos y beneficios. Además, damos un detalle de qué variables tener en cuenta al momento de armar un presupuesto para evitar sorpresas en la facturación. ¿Qué es Azure Databricks? Azure...