Histogramas con Matplotlib y Pandas
Los histogramas son gráficos que indican la frecuencia de un
hecho mediante una distribución de los datos. Los histogramas no se pueden
elaborar con atributos, sino con variables medibles tales como peso,
temperatura, tiempo, etc.
Los histogramas se utilizan para:
- Interpretar las variaciones de los datos.
- Ofrecer una mejor visión de la información proporcionada por los datos para interpretarlos más adecuadamente.
- Identificar las causas del problema.
- Comprobar las causas.
- Valorar la solución una vez que se ha eliminado la causa del problema.
Siguiendo con el ejemplo de datos de Canadá, realizamos la carga de los datos, los modificamos, y agregamos el siguiente código:
#divide la extensión de los datos de 2013 en 10 contenedores de igual ancho
count, bin_edges= np.histogram(df_can['2013'])
#genero el histograma
df_can['2013'].plot(kind='hist', xticks = bin_edges)
#configuramos la visualizacion del cuadro
pllt.title('IHistogram of Inmigration from 195 countries in 2013')
pllt.ylabel('Number of Countries')
pllt.xlabel('Number of Inmigrants')
pllt.show()
No hay comentarios:
Publicar un comentario