Junção de dados do Excel de vários arquivos usando Python Pandas
Vamos ver como juntar os dados de dois arquivos do Excel e salvar os dados mesclados como um novo arquivo do Excel.
Temos 2 arquivos registration details.xlsx
e exam results.xlsx
.
registration details.xlsx
Temos 7 colunas neste arquivo com detalhes de 14 alunos exclusivos. Os nomes das colunas são os seguintes:
- Data de admissão
- Nome do estudante
- Gênero
- DOB
- Id de email do aluno
- Consulta nº
- Número de registro.
exam results.xlsx
Temos 7 colunas neste arquivo com detalhes de 32 alunos exclusivos. Os nomes das colunas são os seguintes:
- Número de registro.
- Nome
- Nº de perguntas tentadas
- Corrigir
- Incorreta
- Marcas obtidas
- Percentagem
Você pode baixar esses arquivos a partir destes links: detalhes do registro.xlsx e resultados do exame.xlsx .
Agora, vamos ver as colunas comuns entre esses dois arquivos:
Portanto, a coluna comum entre os arquivos do Excel é REGISTRATION NO . Portanto, precisamos mesclar esses dois arquivos de forma que o novo arquivo do Excel contenha apenas as colunas necessárias, ou seja:
Algoritmo:
- Importe o módulo Pandas.
- Leia ambos os arquivos usando a
read_excel()
função. - Combine-os usando a
merge()
função. - Use a
to_excel()
função, para criar o arquivo resultante.
import
pandas
f1
=
pandas.read_excel(
"registration details.xlsx"
)
f2
=
pandas.read_excel(
"exam results.xlsx"
)
f3
=
f1[[
"REGISTRATION NO"
,
"STUDENT EMAIL ID "
]].merge(f2[[
"REGISTRATION NO"
,
"Name"
,
"Marks Obtained"
,
"Percentage"
]],
on
=
"REGISTRATION NO"
,
how
=
"left"
)
f3.to_excel(
"Results.xlsx"
, index
=
False
)
As postagens do blog Acervo Lima te ajudaram? Nos ajude a manter o blog no ar!
Faça uma doação para manter o blog funcionando.
70% das doações são no valor de R$ 5,00...
Diógenes Lima da Silva