Python | Pandas Dataframe.rank()

Python é uma ótima linguagem para fazer análise de dados, principalmente por causa do fantástico ecossistema de pacotes python centrados em dados. O Pandas é um desses pacotes e torna a importação e análise de dados muito mais fácil.

O Dataframe.rank()método Pandas retorna uma classificação de cada índice respectivo de uma série passada. A classificação é retornada com base na posição após a classificação.

Syntax:
DataFrame.rank (axis = 0, method = 'average', numeric_only = None, na_option = 'keep', ascending = True, pct = False)
Parameters:
eixo: 0 ou 'índice' para linhas e 1 ou 'colunas' para coluna.
método: Recebe uma string de entrada ('média', 'min', 'max', 'primeiro', 'denso') que diz aos pandas o que fazer com os mesmos valores. O padrão é a média, o que significa atribuir a média das classificações aos valores semelhantes.
numeric_only: recebe um valor booleano e a função de classificação funciona em valores não numéricos apenas se for False.
na_option: Recebe 3 string de entrada ('keep', 'top', 'bottom') para definir a posição dos valores nulos se houver algum na série passada.
ascendente: valor booleano classificado em ordem ascendente se for verdadeiro.
pct: valor booleano classificado em porcentagem, se True.
Return type: Série com classificação de cada índice de série do chamador.

Para obter o link para o arquivo CSV usado no código, clique aqui.

Exemplo nº 1: Coluna de classificação com valores únicos

No exemplo a seguir, uma nova coluna de classificação é criada, classificando o Nome de cada Jogador. Todos os valores na coluna Nome são únicos e, portanto, não há necessidade de descrever um método.

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv")
  
# creating a rank column and passing the returned rank series
data["Rank"] = data["Name"].rank()
  
# display
data
  
# sorting w.r.t name column
data.sort_values("Name", inplace = True)
  
# display after sorting w.r.t Name column
data

Saída:
conforme mostrado na imagem, uma classificação de coluna foi criada com a classificação de cada Nome. Depois que a função sort_value classificou o quadro de dados em relação ao nome, pode-se ver que a classificação também foi classificada, uma vez que eram apenas classificações de nomes.

Antes de classificar -

Depois de classificar -

Exemplo # 2: Classificar coluna com alguns valores semelhantes

No exemplo a seguir, o quadro de dados é classificado primeiro em relação ao nome da equipe e, primeiro, o método é o padrão (ou seja, média) e, portanto, a classificação dos mesmos jogadores da equipe é a média. Depois disso, o método min também é usado para ver a saída.

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv")
  
# sorting w.r.t team name
data.sort_values("Team", inplace = True)
  
# creating a rank column and passing the returned rank series
# change method to 'min' to rank by minimum
data["Rank"] = data["Team"].rank(method ='average')
  
# display
data

Saída:

Com método = 'média'

Com método = 'min'

Acervo Lima

O maior acervo de tutoriais e referências

Python | Pandas Dataframe.rank()

Latest posts

Latest posts

Most popular posts