Como somar os valores do dataframe do Pandas por linhas?
Ao trabalhar no módulo python pandas, pode ser necessário, para resumir, as linhas de um Dataframe. Abaixo estão os exemplos de soma das linhas de um Dataframe. Um Dataframe é uma estrutura de dados bidimensional na forma de uma tabela com linhas e colunas. Ele pode ser criado carregando os conjuntos de dados do armazenamento existente, o armazenamento pode ser banco de dados SQL, arquivo CSV, um arquivo do Excel ou de uma lista python ou dicionário também.
A função Pandas dataframe.sum() retorna a soma dos valores para o eixo solicitado.
Sintaxe: DataFrame.sum (axis)
Parâmetros:
- eixo: {índice (0), colunas (1)}
Soma de cada linha:
df.sum(axis=1)
Exemplo 1:
Somando todas as linhas de um Dataframe usando a função sum e definindo o valor do eixo como 1 para somar os valores da linha e exibir o resultado como saída.
# importing pandas module as pd
import pandas as pd
# creating a dataframe using dictionary
df = pd.DataFrame({'X':[1, 2, 3, 4, 5],
'Y':[54, 12, 57, 48, 96]})
# sum() method sums up the rows and columns of a dataframe
# axis = 1 sums up the rows
df = df.sum(axis = 1)
print(df)
Saída :
Soma de todas as linhas por índice
Exemplo 2:
Somando todas as linhas ou algumas linhas do Dataframe conforme o requisito usando a função loc e a função sum e definindo o eixo em 1 para somar as linhas. Ele resume apenas as linhas especificadas e coloca os valores NaN nos lugares restantes.
# importing pandas as pd
import pandas as pd
# creating the dataframe using pandas DataFrame
df = pd.DataFrame({'X':[1, 2, 3, 4, 5],
'Y':[54, 12, 57, 48, 96],
'Z':['a', 'b', 'c', 'd', 'e']})
# df['column_name'] = df.loc[start_row_index:end_row_index,
# ['column1','column2']].sum(axis = 1)
# summing columns X and Y for row from 1 - 3
df['Sum_of_row'] = df.loc[1 : 3,['X' , 'Y']].sum(axis = 1)
print(df)
Saída :
Somando todas as linhas da linha 1 a 3
Exemplo 3:
Somando as linhas usando a função eval para avaliar a soma das linhas com a expressão especificada como parâmetro.
# importing pandas as pd
import pandas as pd
# creating the dataframe using pandas DataFrame
df = pd.DataFrame({'X':[1, 2, 3, 4, 5],
'Y':[54, 12, 57, 48, 96],
'Z':['a', 'b', 'c', 'd', 'e']})
# eval('expression') calculates the sum of the specified columns of that row
df = df.eval('Sum = X + Y')
print(df)
Saída :
Soma das linhas usando a função eval
Exemplo 4:
Somando as linhas usando a função eval para avaliar a soma das linhas com linhas especificadas usando loc com a expressão para calcular a soma como um parâmetro para a função eval. Ele apenas retorna as linhas que estão sendo especificadas no loc e corta o restante.
# importing pandas as pd
import pandas as pd
# creating the dataframe using pandas DataFrame
df = pd.DataFrame({'X':[1, 2, 3, 4, 5],
'Y':[54, 12, 57, 48, 96],
'Z':['a', 'b', 'c', 'd', 'e']})
# eval('expression') calculates the sum
# of the specified columns of that row
# using loc for specified rows
df = df.loc[2:4].eval('Sum = X + Y')
display(df)
Saída :
Somando as linhas especificadas usando apenas eval
Atenção geek! Fortaleça suas bases com o Python Programming Foundation Course e aprenda o básico.
As postagens do blog Acervo Lima te ajudaram? Nos ajude a manter o blog no ar!
Faça uma doação para manter o blog funcionando.
70% das doações são no valor de R$ 5,00...
Diógenes Lima da Silva