Python | Pandas Extraindo linhas usando .loc []
Python é uma ótima linguagem para fazer análise de dados, principalmente por causa do fantástico ecossistema de pacotes Python centrados em dados. O Pandas é um desses pacotes e torna a importação e análise de dados muito mais fácil.
Pandas fornecem um método exclusivo para recuperar linhas de um quadro de dados. DataFrame.loc[]
método é um método que usa apenas rótulos de índice e retorna linha ou quadro de dados se o rótulo de índice existir no quadro de dados do chamador.
Sintaxe: pandas.DataFrame.loc []
Parâmetros:
Rótulo de índice: string ou lista de string de rótulo de índice de linhasTipo de retorno: quadro de dados ou série dependendo dos parâmetros
Para baixar o CSV usado no código, clique aqui.
Exemplo # 1: Extraindo uma única linha
Neste exemplo, a coluna Nome é feita como a coluna de índice e, em seguida, duas linhas únicas são extraídas uma a uma na forma de série usando rótulo de índice de linhas.
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
# retrieving row by loc method
first = data.loc["Avery Bradley"]
second = data.loc["R.J. Hunter"]
print(first, "\n\n\n", second)
Saída:
conforme mostrado na imagem de saída, duas séries foram retornadas, pois havia apenas um parâmetro em ambas as vezes.
Exemplo 2: Parâmetros múltiplos
Neste exemplo, a coluna Nome é feita como a coluna do índice e, em seguida, duas linhas únicas são extraídas ao mesmo tempo, passando uma lista como parâmetro.
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
# retrieving rows by loc method
rows = data.loc[["Avery Bradley", "R.J. Hunter"]]
# checking data type of rows
print(type(rows))
# display
rows
Saída:
conforme mostrado na imagem de saída, desta vez o tipo de dados do valor retornado é um quadro de dados. Ambas as linhas foram extraídas e exibidas como um novo quadro de dados.
Exemplo # 3: Extraindo várias linhas com o mesmo índice
Neste exemplo, o nome da equipe é feito como a coluna de índice e um nome da equipe é passado para o método .loc para verificar se todos os valores com o mesmo nome da equipe foram retornados ou não.
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Team")
# retrieving rows by loc method
rows = data.loc["Utah Jazz"]
# checking data type of rows
print(type(rows))
# display
rows
Saída:
conforme mostrado na imagem de saída, todas as linhas com o nome da equipe “Utah Jazz” foram retornadas na forma de um quadro de dados.
Exemplo 4: Extração de linhas entre dois rótulos de índice
Neste exemplo, dois rótulos de índice de linhas são passados e todas as linhas que caem entre esses dois rótulos de índice foram retornadas (Ambos os rótulos de índice inclusivos).
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
# retrieving rows by loc method
rows = data.loc["Avery Bradley":"Isaiah Thomas"]
# checking data type of rows
print(type(rows))
# display
rows
Saída:
conforme mostrado na imagem de saída, todas as linhas que caem entre os dois rótulos de índice passados são retornadas na forma de um quadro de dados.
As postagens do blog Acervo Lima te ajudaram? Nos ajude a manter o blog no ar!
Faça uma doação para manter o blog funcionando.
70% das doações são no valor de R$ 5,00...
Diógenes Lima da Silva