BigData: Manejar un archivo de Excel en Python

jueves, 29 de abril de 2021

Manejar un archivo de Excel en Python

Ejercicio:

Análisis de los Datos Obtenidos del Gobierno de Canadá sobre Inmigración.

Podemos descargar desde este enlace:

https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DV0101EN/labs/Data_Files/Canada.xlsx

Par poder iniciar con el análisis de datos en Python debemos instalar librerías que nos ayudaran con esto.

Luego hare una entrada explicando que son estas librerías y como funcionan.

Previamente instalamos las librerías numpy, pandas y openpyxl mediante pip; para esto mediante linea de comandos escribimos las siguientes instrucciones, esperando que se instalen:

pip install nympy

pip install pandas

pip install openpyxl

•Abrir un archivo alojado en una página web•

Vamos a crear un archivo de Python con el siguiente código:

import numpy as np

import pandas as pd

#lee el archivo xls

df_can = pd.read_excel(

'https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-data/CognitiveClass/DV0101EN/labs/Data_Files/Canada.xlsx',

#ignora las primeras 20 filas que corresponden al enunciado

skiprows =range(20),

sheet_name="Canada by Citizenship",

skipfooter=2

)

Tendremos un resultado similar a este:

Páginas

jueves, 29 de abril de 2021

Manejar un archivo de Excel en Python

Manejar un archivo de Excel en Python

No hay comentarios:

Publicar un comentario

Buscar este blog

Vistas de página en total

Seguidores