Manejar un archivo de Excel en Python
Ejercicio:
Análisis de los Datos Obtenidos del Gobierno de Canadá sobre Inmigración.
Podemos descargar desde este enlace:
https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DV0101EN/labs/Data_Files/Canada.xlsx
Par poder iniciar con el análisis de datos en Python debemos instalar librerías que nos ayudaran con esto.
Luego hare una entrada explicando que son estas librerías y como funcionan.
Previamente instalamos las librerías numpy, pandas y openpyxl mediante pip; para esto mediante linea de comandos escribimos las siguientes instrucciones, esperando que se instalen:
pip install nympy
pip install pandas
pip install openpyxl
•Abrir un archivo alojado en una página web•
Vamos a crear un archivo de Python con el siguiente código:
import numpy as np
import pandas as pd
#lee el archivo xls
df_can = pd.read_excel(
'https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DV0101EN/labs/Data_Files/Canada.xlsx',
#ignora las primeras 20 filas que corresponden al enunciado
skiprows =range(20),
sheet_name="Canada by Citizenship",
skipfooter=2
)
Tendremos un resultado similar a este:
No hay comentarios:
Publicar un comentario