Herramientas de Big Data son aplicadas en las nuevas propuestas de investigación del PEN
Marzo, 2019. Un grupo de investigadores del Programa Estado de la Nación conforman una nueva mesa de trabajo, dedicada a la ciencia de datos y visualización, que busca explotar las herramientas de Big Data, y aplicarlas a los temas del desarrollo humano que trabaja el PEN.
Ciencia de datos y visualización se denomina a esta mesa de trabajo, ya que dicho concepto implica un amplio proceso de investigación que contempla: conocimiento de las materias objeto de estudio, recolección de datos de fuentes digitales, uso de técnicas de programación para organizar la información, análisis estadísticos sofisticados, y la comunicación de resultados a través de visualizaciones.
La mesa de Ciencia de Datos constituye una nueva forma de recuperar y analizar la información, más expedita y precisa. Permitirá un abordaje sobre temas del desarrollo humano con fuentes de información innovadoras, pero también representa un nuevo desafío para el PEN porque requiere capacidades técnicas y computacionales avanzadas.
Los primeros pasos con minería de datos se dieron con el análisis de la base histórica de la encuesta de hogares, la base de datos de emergencias 9-1-1, la información vial obtenida de la aplicación Waze, el análisis de las redes sociales (Facebook) de los candidatos presidenciales 2018, y la utilizada para elaborar el Votómetro (aplicación para comparar los puntos de vista de los votantes con respecto a temas de interés nacional con los candidatos a la presidencia de la República), entre las principales.
Otras bases de datos que en la actualidad se están trabajando con estas herramientas son las de las sentencias de la Sala Constitucional, y la territorialización de la matriz insumo-producto, entre otras.
A partir del 2018, el PEN trabaja estos temas con el apoyo del Laboratorio Nacional de Computación Avanzada (CNCA), del Cenat, perteneciente al Consejo Nacional de Rectores, que facilita el clúster de computadores para el trabajo de grandes cantidades de datos y todo su conocimiento técnico.
Los productos de esta área de trabajo están alimentando a los distintos Informes del PEN, y a otras áreas de investigación específica. Por ejemplo, los procesamientos con técnicas de minería de texto sobre los programas de gobierno 2018, la aplicación del Votómetro y los análisis de redes sociales en la campaña electoral, pueden ser accedidos en la dirección www.VotemosCR.com.
Más recientemente, con la base de datos de Waze, se hicieron análisis de los flujos de tránsito que se publicaron en el Capítulo Armonía con la Naturaleza del Informe Estado de la Nación 2018, accesible en este link: https://estadonacion.or.cr/2018/
Otra investigación específica, describió las principales trampas viales en la GAM, también con los datos de Waze. Se puede acceder en: https://estadonacion.or.cr/trampas-viales/
En el sitio web del Programa Estado de la Nación se seguirán publicando los resultados de esta nueva mesa de trabajo en Ciencia de Datos y Visualización de datos complejos.