Spatial Data Science Bootcamp Madrid 2024

Un año mas estuvimos presentes en el Spatial Data Science Bootcamp organizado por CARTO

The Modern Geospatial Data Stack

Ernesto Martínez Becerra, Product Manager en CARTO , nos presentó la evolución del GIS tradicional, desde su nacimiento en 1854 gracias a John Snow que compuso el mapa del cólera, al GIS moderno, que combina ciencia de datos y GIS, basado en estándares abiertos OGC como Geo Parquet, optimizado para manejar grandes volúmenes de datos, interoperable y cloud native.

Los grandes data warehouses: postgis, google bigquery, amazon redshift, snowflake, databricks, etc., están apostando por el lenguaje Spatial SQL.

Hay diferentes estrategias para dividir el espacio en grid discretos: Quadkey, Uber H3, S2 que mejoran considerablemente el rendimiento de grandes volúmenes de datos.

Low code Spatial Analytics

Tomas Ehrenfeld, Solutions Engineer en CARTO, nos presentó CARTO Workflows para generar flujos de proceso. El taller práctico hizo hincapié en cómo aprovechar CARTO workflows para crear análisis SIG repetibles mediante una interfaz gráfica dentro de un entorno cloud.

Creamos nuestro propio geoproceso con CARTO Workflow para producir un análisis SIG completo, desde datos sin procesar hasta resultados limpios y visualización.

Workflows es una herramienta Low code, que hace que el análisis espacial cloud native sea accesible para todos los usuarios, con cualquier nivel de habilidad. Dispone de una interfaz gráfica para diseñar, ejecutar y automatizar procedimientos analíticos de varios pasos. Permite Acceder a más de 100 componentes analíticos cloud native que cubren la preparación y gestión de datos, estadísticas y análisis espacial avanzado. Posibilita la automatización de datos vivos/dinámicos y la integración en cualquier herramienta de orquestación.

El geoproceso que hemos realizado es el siguiente:

Y el resultado es el siguiente:

Existen multitud de plantillas para no tener que comenzar desde el tablero en blanco.

https://academy.carto.com/creating-workflows/workflow-templates

Si quieres más información sobre índices espaciales puedes descargarte el siguiente report: https://go.carto.com/report-spatial-indexes-101

Leveraging Python for Spatial Data Science

Eduardo Fernández León, Lead Data Scientist & AI Engineer en Santalucía Seguros presentó varios casos de uso muy interesantes. Primero importamos las librerías. Trabajamos con geopandas que nos permite hacer visualización y operaciones espaciales, Cartoframes, que es la librería de carto similar a geopandas e importamos también h3, entre otras.

Empleando “orders.shape” pudimos ver el total de “orders” que estábamos manejando. Concretamente 10.121 registros.

La función “Map(Layer(orders))” de Carto que permite ver un mapa en jupyter con los “orders” que tenemos.

Ejecutamos un Kernel density estimation, un mapa de calor, dónde modificamos el atributo “bw_adjust” para ver el mapa de calor más o menos denso.

Vimos cuántos puntos teníamos por cada h3. Y también hicimos lo mismo sobre las secciones censales. Lo más fácil sería quedarnos con la sección censal porque la información socio-demográfica la tenemos a este nivel.

Vimos el test estadístico de Moran que tiene una distribución: no hay ningún patrón, hay una tendencia a estar aglomerado, y otra a estar disperso. Brinda mucha información acerca de lo que está pasando en ciertas secciones censales que tienen un comportamiento diferente.

Hicimos un clustering con Density-based clustering (DBSCAN). Al indicar un EPS de 300 metros, tuvimos que proyectar los orders  (‘epsg:32630’).

Finalmente pasado de análisis de correlaciones “correlation” a regresiones “regression”. Detectamos secciones censales envejecidas.

Al final hicimos una regresión de Poisson (Generalized linear regression). Manda el X2.

No tiene componente espacial pero podemos añadirlo.

Por último, introdujimos la variable espacial con la regresión: Geographically Weighted Regression (GWR).

Scalable Spatial Analytics

Lucía García-Duarte Sáenz, Data Scientist en CARTO, nos presentó un caso de uso muy interesante: identificó zonas con déficit de antenas de telefonía móvil.

Identificó zonas con mucha actividad humana para luego verificar si el número de antenas en estas ubicaciones eran suficientes para satisfacer la demanda y brindar un servicio de alta calidad.

Para ello, analizó datos de torres de telefonía móvil para comprender los patrones espaciales de las antenas de telefonía móvil 4G en Madrid.

Preparó datos externos, incluida la creación de un Índice de Actividad Humana, que luego usó para comprender en detalle los patrones de las antenas.

Descubrió por qué las antenas se colocan en ubicaciones específicas mediante la ejecución de análisis avanzados.

Data Visualization Clinic

Miguel Alvarez, Data Science Lead at CARTO , nos brindó una masterclass en visualización de datos.

Comentó que cada visualización debe comenzar con una pregunta: “Necesito saber en qué parte de EE. UU. los ingresos son más altos para poder centrarme en el lanzamiento de mi nueva bebida premium”.

Pudimos comprobar que Carto resuelve la visualización con matrícula de honor.

Como conclusión, decir que como todos los años, fue una placer participar en la sesión. Gracias a todo el equipo CARTO por acogernos con tanto cariño y profesionalidad. En Geograma estamos encantados de ayudar, tanto a clientes como a potenciales de la plataforma, ofreciendo nuestros Servicios profesionales Carto.

Sergio Jorrín Abellán, director de operaciones de Geograma

Categorías