por Rocío Klan | Ene 21, 2025 | Blog, Data Analytics, Data Engineering
Apache Spark es un tipo de tecnología que utiliza sistemas distribuidos. En este artículo explicamos qué es, cuáles son los conceptos clave a tener en cuenta y te orientamos a empezar a usarlo de forma sencilla. ¿Qué es Apache Spark? Apache Spark es una tecnología que...
por Claudio Buffa | Nov 26, 2024 | Blog, Data Analytics, Data Engineering
En este artículo explicamos cómo hacer un plan de pruebas mínimo en ingeniería de datos. Hablamos de la importancia de asegurar la calidad de los procesos con un plan de pruebas detallado y documentado: qué, cómo y por qué probar. ¿Se puede programar sin errores?...
por Lovelytics LATAM | Nov 14, 2024 | Blog, Data Analytics, Data Engineering
En este artículo explicamos cómo construir una arquitectura de datos moderna con AWS. Además, describimos cómo es el ecosistema de servicios que ofrece para los proyectos de Data Analytics. Los abordamos desde cada una de las etapas: almacenamiento, ingesta,...
por Rocío Klan | Sep 25, 2024 | Blog, Data Analytics, Data Engineering
En este artículo desarrollamos en detalle qué es un data lake, cuáles son sus ventajas y sus desventajas. Además, explicamos cómo se componen este tipo de arquitecturas y qué sucede en cada una de sus capas. Data lake: contexto histórico A principios del siglo XXI,...
por Rocío Klan | Feb 14, 2024 | Blog, Data Analytics, Data Engineering
Desde hace algunos años, los sistemas distribuidos se convirtieron en un estándar para quienes trabajamos con datos. En este artículo explicamos, de manera muy sencilla, qué son, cómo evolucionaron, cómo funcionan y cómo saber cuál necesitamos. ¿Qué son los sistemas...
por Rocío Klan | Ene 30, 2024 | Blog, Data Analytics, Data Engineering
En este artículo explicamos qué es una arquitecturas de datos moderna, cuáles son sus capas y sus componentes y analizamos los pros y los contras del data warehouse y del data lake. ¿Qué es una arquitectura de datos? Una arquitectura de datos es una...