El pasado 7 de marzo de 2025 realizamos la primera edición de Datos y tequilas en Guadalajara, Jalisco. La cita fue en HackerGarage, espacio maker por excelencia que se convirtió en el punto de encuentro de la comunidad datera tapatía, misma que compartió una serie de proyectos que documentan y buscan transformar fenómenos como las inundaciones, la movilidad ciclista, el desarrollo de vivienda vertical y la desaparición forzada de personas.
Nos alegró realizar un encuentro de este tipo en Jalisco luego de casi una década del último Tequilas y Datos, realizado en Zapopan en 2015. En esta ocasión, gracias a HackerGarage contamos con una transmisión en vivo del evento (inicia al minuto 22). Si no pudiste acompañarnos a este evento, aquí te traemos un resumen de los proyectos que se presentaron:
Notebooks: generación de embeddings y clusters con IA – SignaLab
Eduardo G. de Quevedo, responsable técnico de SignaLab, presentó tres cuadernos de código para depurar, limpiar y procesar datos textuales.
- Cuaderno 1: Limpieza y depuración de texto. A partir de csv se cargan datos de corpus textuales. Permite eliminar links, hashtags y arrobas, además de limpiar texto de preposiciones comunes.
- Cuaderno 2: Embedings y clusterización. Emplea software libre disponible en Hugging Face, específicamente 4 modelos de lenguaje. Habilita realizar combinaciones semánticas y clusterización en dos o tres dimensiones.
- Cuaderno 3: Exploración y visualización en 2D. Permite tomar presencias cercanas de texto y hacer comparaciones. Posibilidad de hacerle preguntas mediante prompts.
Los cuadernos están disponibles en Github y trabajan con modelos de lenguaje de la librería Sentence-Transformers. Se pueden descargar y correr en Jupyter Notebook o en Google Colab.

Desarrollos verticales en la ZMG: entre la “uberización” de la vivienda y el blanqueamiento por despojo – Estudiantes ITESO
Representantes del grupo de investigación conformado por Mariana Parra, Diego Andoni, Carlos Camacho, Miranda Osuna y Fernando Casarín expusieron su investigación sobre el auge de la vivienda vertical en la Zona Metropolitana de Guadalajara (ZMG). Entre sus principales hallazgos destacaron que, entre 2013 y 2017, se construyeron 170 edificios de más de 40 metros de altura.
Debido a que desde 2017 dejó de ser público el registro de catastro, obtuvieron datos sobre la altura de las edificaciones del Earth Engine Data Catalog de Google. También hicieron web scrapping del sitio web de Airbnb para identificar cuántos hay en la ZMG. Para la limpieza de datos usaron herramientas de Libre Office y Open Refine, mientras que para conversiones y cálculos recurrieron a QGIS. En la visualización se apoyaron de Tableau y Mapbox.
Su investigación puede consultarse en Desarrollos verticales en la ZMG.

Distribución espacial de los sitios de inundación del Área Metropolitana de Guadalajara – Laboratorio de datos del ITESO
¿Dónde puedo ver los sitios de inundación del Área Metropolitana de Guadalajara (AMG)? Esa pregunta motivó a Paty Muñoz a crear diferentes visualizaciones y análisis geoestadísticos.
Detectó que el sistema gubernamental SIGmetro permite visualizar algunos puntos de inundación, pero estaban hasta 2023. ¿Si hay muchas fuentes para el SIGmetro, cómo podemos colaborar a ampliar y actualizar esta información? Muñoz realizó entonces scrapping de posts (o tuits), relacionados con inundaciones, de la cuenta en X de @Trafico_ZMG —cuenta de periodismo y reporte ciudadano enfocada en movilidad urbana.
El resultado, luego de la recabación, limpieza y análisis de los datos fue un minisistema geoespacial con mapa de densidad, coropletas por colonia y gráficos. Asimismo, realizó un análisis de geoestadística espacial. Entre las visualizaciones, creó un mapa que georreferencia incidentes y permite ver videos asociados a los reportes, además de un mapa de calor que indica las calles donde más se inunda.

Urbanizaciones e inundaciones en la cuenca de Atemajac – Observatorio sobre Conflictos Socioambientales y Defensa de Activistas
José Carlos Toral, profesor de la Universidad de Guadalajara (UdeG) e integrante del Observatorio sobre Conflictos Socioambientales y Defensa de Activistas, de la misma casa de estudios, compartió avances de su investigación de maestría en Urbanismo y Territorio.
Mediante datos del INEGI y de los planes parciales de desarrollo mostró mapas de la cuenca de Atemajac, que recorre 15 y medio kilómetros en el AMG, detectando incongruencias entre fuentes sobre la delimitación de la cuenca.
Presentó un mapa sobre el crecimiento urbano alrededor de la cuenca a partir de los años noventa. En el mismo, se evidencia cómo, contrario a leyes y reglamentos, se han urbanizado zonas pertenecientes a la cuenca. Asimismo, documentó un incremento de las inundaciones a partir de 2012 y, mediante un mapa animado mostró la correlación entre urbanización e inundaciones —aunque reconoció que no es el único factor asociado.

Mapa de detenciones por narcomenudeo en la Zona Metropolitana de Guadalajara – El After
La periodista independiente Mariana Mora presentó un trabajo en proceso que forma parte de su proyecto de comunicación e información sobre política de drogas llamado El After.
En su revisión y análisis crítico de los datos de detenciones por narcomenudeo —obtenidos vía solicitudes de transparencia— documentó la criminalización de personas usuarias de sustancias psicoactivas. Detectó, por ejemplo, que el 89% de las detenciones son por posesión simple, es decir, para consumo propio. Asimismo, identificó que suelen aplicarse las penas más altas posibles, que son de tres años de prisión. También mostró que la mayoría de las personas detenidas son hombres y la sustancia en posesión más frecuente es la marihuana.
Cartografías de la Memoria – Rafael Rangel, Fernanda Verduzco y Héctor Piña
Este proyecto mapea los territorios de la Desaparición en la ZMG. Rafael Rangel planteó que los datos facilitados a nivel estatal no tienen la desagregación por colonia, lo cual permitiría entender mejor el fenómeno de la desaparición. Por ello, se dieron a la tarea de hacer web scraping de las fichas de búsqueda publicadas por la comisión de búsqueda, en las cuales se indica la edad de la persona y la colonia de desaparición. Convirtieron las fichas, archivos de imagen, a datos estructurados, logrando un conjunto de datos con 9 mil registros.
Esto les permitió crear un mapa donde es posible ver la distribución geográfica de las desaparición de personas en la ZMG. Se identificaron clusters de desaparición, por ejemplo en Tlajomulco o en un área cercana a Zapopan. En el análisis de datos detectaron que la edad de desaparición con mayor frecuencia en la muestra es de entre 20 y 30 años; por otro lado, las desapariciones se dan más en colonias con mayor índice de marginación.
RAMCI Riesgo de accidente de movilidad ciclista – IEEG / UdeG
Un estimado de 23 ciclistas fallecen anualmente y 104 sufren heridas graves en un accidente vial en la ZMG. Con esos datos abrió su presentación Ramón Alejandro Briseño Martínez, del Instituto de Información, Estadística y Geografía de Jalisco (IIEG) y coordinador de la licenciatura en Inteligencia Artificial y Ciencia de los Datos en la UdeG.
Mediante algoritmos de machine learning y una recopilación de datos de múltiples fuentes en tiempo real, generó tres productos que permiten predecir la severidad de accidentes viales. El primero de ellos es un mapa de riesgo semaforizado considerando variables de infraestructura. El segundo es un mapa dinámico que calcula la severidad de un eventual accidente considerando variables en tiempo real tales como el nivel de tráfico, la hora del día y la visibilidad. El tercero arroja el nivel de riesgo con base en variables personalizadas que puede introducir la persona usuaria.
“Se lo llevó un grupo armado”: la crisis de desapariciones violentas en Jalisco – El Suspicaz
Al menos 1248 personas han sido desaparecidas de forma violenta en Jalisco, casi todas entre 2020 y 2024. Podrían ser más, ya que, por un lado, dentro del universo de más de 8 mil reportes con cédula de búsqueda analizados hay casos sin información sobre cómo se dio la desaparición y, por el otro, la mayoría de las personas desaparecidas no tienen cédula de búsqueda. Así lo compartió el periodista Lauro Rodríguez, quien realizó el trabajo en conjunto con el investigador de la UdeG, Jorge Ramirez Plascencia.
Hasta enero de 2025 los datos de la comisión de búsqueda tenían una columna titulada “descripción desaparición”, misma que los investigadores analizaron para este proyecto mediante un algoritmo en python que les permitió identificar palabras clave asociadas a la violencia. Actualmente los datos oficiales ya no cuentan con dicha columna, que solía contener datos personales. Una versión pública —con datos anonimizados por los investigadores— del conjunto de datos con los 1248 casos de desaparición con violencia y su descripción está publicada y disponible para consulta.
Huellas Digitales – Mapas Chingones
Un demo funcional que puede usarse como herramienta para la búsqueda de personas desaparecidas es lo que presentó Edgar Daniel Ramírez. Para ello se requiere contar con la sábana de llamadas, que es el registro de llamadas y mensajes realizados, horarios y tipos de conexión, además de georeferencia de las antenas a las cuales se conectó un teléfono. Estos datos son almacenados por las empresas de telefonía. El proyecto presentado permite introducir una sábana de llamadas en formato xlsx/xls y, usando la API de Google Maps, devuelve de manera automática una visualización de la ruta del teléfono, lo cual permitiría optimizar la búsqueda de personas.
Cartografía de la Ausencia – Héctor Pina
Cerramos este Datos y tequilas con Héctor Piña invitándonos a la presentación de Cartografía de la ausencia, un mosaico digital que, de manera alternada, muestra los rostros de aproximadamente 7 mil personas desaparecidas. Es también, según explicó, una invitación a pensar en quienes no están, un proyecto que conjunta tecnología, política y estética para acompañar y recuperar los rostros, para nombrar la ausencia.
En la presentación también estarán Guadalupe Aguilar, Marcela Turati, Alejandra Guillén y Rossana Reguillo. El próximo 19 de marzo a las 18:00 en Ciudad Creativa Digital.
Así terminó esta edición de Datos y Tequilas, muchas gracias a Hacker Garage por permitirnos realizar este evento es sus instalaciones y muchas gracias a todas las personas que nos acompañaron en esta jornada llena de proyectos y #DatosAbiertos.