Um gráfico de dispersão é um tipo de técnica de visualização de dados que mostra a relação entre duas variáveis ​​numéricas. Para traçar um gráfico de dispersão usando pandas, existe a classe DataFrame e essa classe tem um membro chamado plot. Chamar o método scatter() no membro do gráfico desenha um gráfico entre duas variáveis ​​ou duas colunas do DataFrame do pandas. 

Sintaxe: DataFrame.plot.scatter (x, y, s = nenhum, c = nenhum)

Parâmetro:

x: nome da coluna a ser usado como coordenadas horizontais para cada ponto
y: nome da coluna a ser usado como coordenadas verticais para cada ponto
s: tamanho dos pontos
c: cor dos pontos

Passos:

  • Importe as bibliotecas necessárias.
  • Prepare um dado
  • Converta os dados preparados em DataFrame
  • Desenhe um gráfico de dispersão

Exemplo 1: Neste exemplo, vamos traçar o gráfico de dispersão usando dataframe, aqui vamos criar o dataframe e traçar o gráfico de dispersão usando colunas diferentes.

# Program to draw scatter plot using Dataframe.plot
# Import libraries
import pandas as pd
  
# Prepare data
data={'Name':['Dhanashri', 'Smita', 'Rutuja',
              'Sunita', 'Poonam', 'Srushti'],
      'Age':[20, 18, 27, 50, 12, 15]}
  
# Load data into DataFrame
df = pd.DataFrame(data = data);
  
# Draw a scatter plot
df.plot.scatter(x = 'Name', y = 'Age', s = 100);

Saída:

Exemplo 2: Aqui, criaremos o dataframe e traçaremos o gráfico de dispersão usando diferentes colunas com pontos de dados de estilo.

# Program to draw scatter plot using Dataframe.plot
# Import libraries
import pandas as pd
  
# Prepare data
data={'Name':['Dhanashri', 'Smita', 'Rutuja',
              'Sunita', 'Poonam', 'Srushti'],
      'Age':[ 20, 18, 27, 50, 12, 15]}
  
# Load data into DataFrame
df = pd.DataFrame(data = data);
  
# Draw a scatter plot and here size of dots determined by age of person
df.plot.scatter(x = 'Name', y = 'Age', s = 'Age', c = 'red');

Saída:

 Atenção geek! Fortaleça suas bases com o Python Programming Foundation Course e aprenda o básico.