Como obter nomes de linhas / índices no dataframe do Pandas
Ao analisar os conjuntos de dados reais, que geralmente são muito grandes em tamanho, talvez seja necessário obter as linhas ou os nomes dos índices para realizar algumas operações.
Vamos discutir como obter nomes de linhas no dataframe do Pandas .
Primeiro, vamos criar um dataframe simples com nba.csv
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# calling head() method
# storing in new variable
data_top = data.head(10)
# display
data_top
Agora vamos tentar obter o nome da linha do conjunto de dados acima.
Método # 1: simplesmente iterar sobre os índices
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv("nba.csv")
# calling head() method
# storing in new variable
data_top = data.head()
# iterating the columns
for row in data_top.index:
print(row, end = " ")
Saída:
0 1 2 3 4 5 6 7 8 9
Método 2: usando linhas com objeto dataframe
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv("nba.csv")
# calling head() method
# storing in new variable
data_top = data.head()
# list(data_top) or
list(data_top.index)
Saída:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método # 3: o index.values
método retorna uma matriz de índice.
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv("nba.csv")
# calling head() method
# storing in new variable
data_top = data.head()
list(data_top.index.values)
Saída:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método # 4: usando o tolist()
método com valores fornecidos a lista de índice.
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv("nba.csv")
# calling head() method
# storing in new variable
data_top = data.head()
list(data_top.index.values.tolist())
Saída:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Método # 5: contar o número de linhas no dataframe
Como carregamos apenas 10 linhas principais do dataframe usando o head()
método, vamos varificar o número total de linhas primeiro.
# iterate the indices and print each one
for row in data.index:
print(row, end= " ")
Saída:
Agora, vamos imprimir a contagem total do índice.
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv("nba.csv")
row_count = 0
# iterating over indices
for col in data.index:
row_count += 1
# print the row count
print(row_count)
Saída:
458
As postagens do blog Acervo Lima te ajudaram? Nos ajude a manter o blog no ar!
Faça uma doação para manter o blog funcionando.
70% das doações são no valor de R$ 5,00...
Diógenes Lima da Silva