Lidando com linhas e colunas no Pandas DataFrame
Um quadro de dados é uma estrutura de dados bidimensional, ou seja, os dados são alinhados de forma tabular em linhas e colunas. Podemos realizar operações básicas em linhas / colunas, como selecionar, excluir, adicionar e renomear. Neste artigo, estamos usando o nba.csv
arquivo.
Lidando com Colunas
Para lidar com colunas, realizamos operações básicas em colunas como selecionar, excluir, adicionar e renomear.
Seleção de coluna :
Para selecionar uma coluna no Pandas DataFrame, podemos acessar as colunas chamando-as pelo nome das colunas.
# Import pandas package
import pandas as pd
# Define a dictionary containing employee data
data = {'Name':['Jai', 'Princi', 'Gaurav', 'Anuj'],
'Age':[27, 24, 22, 32],
'Address':['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'],
'Qualification':['Msc', 'MA', 'MCA', 'Phd']}
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
# select two columns
print(df[['Name', 'Qualification']])
Saída:
Para obter mais exemplos, consulte Como selecionar várias colunas em um dataframe do pandas. Adição de
coluna :
Para adicionar uma coluna no DataFrame do Pandas, podemos declarar uma nova lista como uma coluna e adicioná-la a um Dataframe existente.
# Import pandas package
import pandas as pd
# Define a dictionary containing Students data
data = {'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'],
'Height': [5.1, 6.2, 5.1, 5.2],
'Qualification': ['Msc', 'MA', 'Msc', 'Msc']}
# Convert the dictionary into DataFrame
df = pd.DataFrame(data)
# Declare a list that is to be converted into a column
address = ['Delhi', 'Bangalore', 'Chennai', 'Patna']
# Using 'Address' as the column name
# and equating it to the list
df['Address'] = address
# Observe the result
print(df)
Saída:
Para obter mais exemplos, consulte Adicionar nova coluna a DataFrame existente no Pandas.
Exclusão de coluna :
Para excluir uma coluna no Pandas DataFrame, podemos usar o drop()
método. As colunas são excluídas eliminando as colunas com os nomes das colunas.
# importing pandas module
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
# dropping passed columns
data.drop(["Team", "Weight"], axis = 1, inplace = True)
# display
print(data)
Saída:
conforme mostrado nas imagens de saída, a nova saída não tem as colunas passadas. Esses valores foram descartados, pois o eixo foi definido como 1 e as alterações foram feitas no quadro de dados original, pois o local era True.
Quadro de dados antes de descartar colunas-
Quadro de dados depois de descartar colunas-
Para mais exemplos, consulte Excluir colunas de DataFrame usando Pandas.drop()
Lidando com linhas:
Para lidar com linhas, podemos realizar operações básicas em linhas como selecionar, excluir, adicionar e renomear.
Seleção de linha :
Pandas fornecem um método exclusivo para recuperar linhas de um quadro de dados. DataFrame.loc[]
método é usado para recuperar linhas do Pandas DataFrame. As linhas também podem ser selecionadas passando a localização do inteiro para umafunção iloc [] .
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
# retrieving row by loc method
first = data.loc["Avery Bradley"]
second = data.loc["R.J. Hunter"]
print(first, "\n\n\n", second)
Saída:
conforme mostrado na imagem de saída, duas séries foram retornadas, pois havia apenas um parâmetro em ambas as vezes.
Para mais exemplos, consulte Extração de linhas do Pandas usando .loc []
Adição de linha :
para adicionar uma linha no DataFrame do Pandas, podemos concatenar o dataframe antigo com o novo.
# importing pandas module
import pandas as pd
# making data frame
df = pd.read_csv("nba.csv", index_col ="Name")
df.head(10)
new_row = pd.DataFrame({'Name':'Geeks', 'Team':'Boston', 'Number':3,
'Position':'PG', 'Age':33, 'Height':'6-2',
'Weight':189, 'College':'MIT', 'Salary':99999},
index =[0])
# simply concatenate both dataframes
df = pd.concat([new_row, df]).reset_index(drop = True)
df.head(5)
Saída:
Quadro de dados antes de adicionar linha-
Quadro de dados depois de adicionar linha-
Para mais exemplos, consulte Adicionar uma linha no topo no pandas DataFrame.
Exclusão de linha :
Para excluir uma linha no Pandas DataFrame, podemos usar o método drop(). As linhas são excluídas eliminando Linhas por rótulo de índice.
# importing pandas module
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
# dropping passed values
data.drop(["Avery Bradley", "John Holland", "R.J. Hunter",
"R.J. Hunter"], inplace = True)
# display
data
Saída:
conforme mostrado nas imagens de saída, a nova saída não possui os valores passados. Esses valores foram descartados e as mudanças foram feitas no quadro de dados original, uma vez que o local era True.
Quadro de dados antes de eliminar valores -
Quadro de dados após eliminar valores -
Para mais exemplos, consulte Excluir linhas do DataFrame usando Pandas.drop()
Problema relacionado às colunas:
- Como obter nomes de colunas no dataframe do Pandas
- Como renomear colunas no Pandas DataFrame
- Como soltar uma ou várias colunas no Dataframe do Pandas
- Obtenha valores únicos de uma coluna no Pandas DataFrame
- Como colocar nomes de colunas em letras minúsculas no dataframe do Pandas
- Aplicar letras maiúsculas a uma coluna no dataframe do Pandas
- Coloque a primeira letra de uma coluna em maiúscula no dataframe do Pandas
- Obtenha os valores n-maiores de uma coluna específica no Pandas DataFrame
- Obtenha os menores valores de uma coluna específica no Pandas DataFrame
- Converter uma coluna em nome / índice de linha no Pandas
Problema relacionado às linhas:
As postagens do blog Acervo Lima te ajudaram? Nos ajude a manter o blog no ar!
Faça uma doação para manter o blog funcionando.
70% das doações são no valor de R$ 5,00...
Diógenes Lima da Silva