Recursos
··3 mins
En esta página recopilo enlaces a distintos tipos de datos que pueden utilizar en sus proyectos.
Datasets relacionados con Chile #
- Portal de Datos Abiertos del Gobierno de Chile: incluye muchos datasets interesantes como la Encuesta Origen-Destino de Viajes en Santiago 2012.
- Encuestas de Movilidad en varias ciudades de Chile: Arica, Iquique-Alto Hospicio, Antofagasta, Copiapó, Coquimbo-La Serena, Gran Valparaíso, Gran Santiago, Temuco-Padre de las Casas, Valdivia, Osorno, Puerto Montt. Sin embargo, no están en formatos abiertos :(
- Delitos de mayor connotación social en Chile: estadísticas de delitos agregadas por comunas, desde 2001 hasta 2017.
- Estadísticas migratorias en Chile, 2000–2016
- Datos COVID-19 del Ministerio de Ciencia de Chile: repositorio con todos los datos recolectados y disponibilizados por el Ministerio de Ciencia. Incluye datos de movilidad, series temporales, y más.
- Guaguas: “nombres de guaguas (bebés) registrados en Chile entre 1920 y 2019, según el Servicio de Registro Civil e Identificación. Incluye todos los nombres con al menos 15 ocurrencias.”
- Cartografía del Censo 2017 de Chile: links a los mapas del Censo 2017 (áreas urbanas, comunas, provincias, distritos, calles, etc.).
- Mapas vectoriales de Chile: archivos en formato shapefile que incluyen redes viales del país, bordes administrativos de regiones, comunas y provincias, entre otras, provistos por la Biblioteca del Congreso Nacional. Estos mapas se pueden cargar con el módulo GeoPandas. Están desactualizados.
- Microdatos del Censo 2017: archivos con los datos individuales del Censo 2017 de Chile. Nota: no es la fuente oficial (para ello deben ir al INE y solicitar un
CD-ROM
con los datos). - OpenStreetMap Data Extracts: dumps de la información contenida en OpenStreetMap, separadas por continente y país, incluyendo Chile. Está en formato
pbf
que puede ser leído utilizando esta versión deimposm.parser
. Otra alternativa es usarpyrosm
. - Asesorías de la Cámara de Diputados/as 2018–2022.
Datasets en general #
Podrían contener información relevante de/sobre/en Chile.
- DBpedia: el contenido de Wikipedia en todos los lenguajes disponibles de la enciclopedia, de manera estructurada.
- Recomendaciones de series de Animé: dataset con las series de animé recomendadas por cada usuario de MyAnimeList.net.
- Reproducciones de música en last.fm: los artistas top para 360 mil usuarios, o todas las canciones escuchadas por 1000 usuarios, de acuerdo a su actividad en last.fm.
- Resultados de enfrentamientos en el juego DOTA2
- Datos de Telefonía Móvil de Milán
- Medallas y Resultados de los Juegos de Rio 2016
- Jugadores de FIFA 2017
- La red social de personajes de Marvel Comics
- Datos de redes en la Uni. Koblenz: conjunto de datasets con redes de distinto tipo, incluyendo redes dirigidas, no dirigidas, bipartitas, con/sin pesos, con signos y con ratings, en áreas como redes sociales, redes de enlaces, redes de autoría, redes físicas, redes de interacción y redes de comunicaciones.
- Gender Equity Index: mediciones del año 2012 de igualdad de género en el mundo, por país.
- The World Bank Data Catalog: datos del Banco Mundial que incluyen series temporales de desarrollo, educación, GDP, GINI, etc.
- Wikipedia Pageviews: cantidad de visitas que recibe cada artículo de Wikipedia.
- Wikipedia Clickstream: red de artículos de Wikipedia basada en como las personas hacen clic entre ellos (por ej., si alguien lee el artículo
A
y hace un clic hace el artículoB
, la red contiene el linkA -> B
). - Foursquare Datasets: millones de check-ins de Foursquare entre el año 2012 y 2014.
- Pingüinos de Palmer: repositorio que contiene un dataset con datos de seguimiento (GPS) y características de pingüinos en la antártica.
- Características de Canciones de Spotify: propiedades de más de 160 mil canciones.
Repositorios de Datasets #
- Kaggle: más de 50 mil datasets, algunos utilizados para competencias. Hay mucho por explorar (algunos de los datasets vinculados arriba están en Kaggle).
Sitios para buscar inspiración #
- Kantar Information is Beautiful Awards
- Nightingale (visítenlo en una ventana anónima del navegador, para poder leer los artículos).
- Flowing Data
- Observable HQ
- Malofiej