Programação Python (Parte 3) - Prof. MARCO VAZ
MarcoVaz
179.4K views
01 Pacotes
Apresentação Tratamento de Exceção Tratamento de Exceção (continuação) Exercitando Pacotes Python Pacote NumPy Pacote NumPy (continuação) Números Aleatórios Exercitando Pacote Pandas (Series) Pacote Pandas (Series - Continuação) Pacote Pandas (DataFrame) Pacote Pandas (Criando DataFrame) Pacote Pandas (Mais DataFrame) Pacote MatPlotlib Pacote MatPlotlib (Gráficos)
Pacote Pandas
Pandas DataFrame
Pandas DataFrame é uma estrutura de dados bidimensional com os dados alinhados de forma tabular em linhas e colunas, mutável em tamanho e potencialmente heterogênea, semelhantemente a uma pasta de trabalho do MS-EXCEL. A diferença essencial é que os nomes de colunas e os números de linha são conhecidos como índice de coluna e linha, no caso do DataFrame. As colunas possuem nomes (índice da coluna) e, as linhas, podem ter nomes referentes a colunas e as linhas podem ter nomes (índices textuais) ou podem, por padrão, ser numeradas (Índice numérico).
Criando um DataFrame
Em geral, o DataFrame pode conter dados a partir de:
- Um DataFrame do Pandas
#Importando a biblioteca Pandas
In [1]: import pandas as pd
#Criando um Dataframe com 2 linhas (indexes 0 e 1) e 4 colunas ('Idade', 'Sexo', 'Peso', 'Altura').
In [2]: meu_df = pd.DataFrame([[21,'F', 50, 1.57],[22,'F',58, 1.70]], index=range(0,2), columns=['Idade', 'Sexo', 'Peso', 'Altura'])
#Exibindo o DataFrame criado
In [3]: meu_df
Out[3]:
Idade Sexo Peso Altura
0 21 F 50 1.57
1 22 F 58 1.70
#Acesso as linhas do DataFrame a partir do seu índice. Utilizar a função .iloc[indice].
#Exibir a segunda linha do Dataframe
In [4]: meu_df.iloc[1]
Out[4]:
Idade 22
Sexo F
Peso 58
Altura 1.7
Name: 1, dtype: object
- Uma Série Pandas: um array unidimensional capaz de armazenar qualquer tipo de dados com rótulos ou índice de eixo. Um exemplo de um objeto Series é uma coluna de um DataFrame.
#Criando uma Série formada por nomes e com índices de 0 até 4.
In [4]: nomes = pd.Series(["Luciano","Matheus", "Rodrigo", "Bruno", "Michel"], index=range(0,5))
#Criando um DataFrame a partir da Serie nomes com a coluna denominada Nomes
In [5]: df = pd.DataFrame(data=nomes, columns=['Nomes'])
In [6]: df
Out[6]:
Nomes
0 Luciano
1 Matheus
2 Rodrigo
3 Bruno
4 Michel
Create your playground on Tech.io
This playground was created on Tech.io, our hands-on, knowledge-sharing platform for developers.
Suggested playgrounds