Estatística é uma forma de análise matemática que se refere à coleta, organização, análise, interpretação e apresentação de dados. A análise estatística ajuda a fazer o melhor uso dos vastos dados disponíveis e a melhorar a eficiência das soluções.

R é uma linguagem de programação usada para computação estatística e gráficos do ambiente. A seguir está uma introdução aos conceitos estatísticos básicos, como gráficos de plotagem, como gráficos de barras, gráficos de pizza, histogramas e boxplots.

Nesta postagem, aprenderemos a traçar gráficos para uma única variável. O seguinte software é necessário para aprender e implementar estatísticas em R:

  • Software R
  • IDE RStudio

Funções para traçar gráficos em Estatísticas

A seguir está uma lista de funções que são necessárias para traçar gráficos para a representação de dados estatísticos:

  • Função plot():
    Esta função é usada para desenhar um gráfico de dispersão com eixos e títulos.

    Sintaxe:

    plot (x, y = NULL, ylim = NULL, xlim = NULL, type = "b" ....)

  • função data():
    esta função é usada para carregar conjuntos de dados especificados.

    Sintaxe:

    dados (lista = caractere(), lib.loc = NULL, pacote = NULL .....)

  • Função table():
    a função table é usada para construir uma tabela de contingência das contagens em cada combinação de níveis de fator.

    <strongsyntax:></strongsyntax:>

    tabela (x, row.names = NULL, ...)

  • barplot() Função:
    Cria um gráfico de barras com barras verticais / horizontais.

    Sintaxe:

    gráfico de barras (altura, largura = 1, names.arg = NULL, espaço = NULL ...)

  • Função pie():
    Esta função é usada para criar um gráfico de pizza.


  • Sintaxe:

pizza (x, rótulos = nomes (x), raio = 0,6, bordas = 100, sentido horário = VERDADEIRO ...)

  • hist() Função:
    A função hist()cria um histograma dos valores de dados fornecidos.

    Sintaxe:

    hist (x, quebras = "Sturges", probabilidade =! freq, freq = NULL, ...)
  • Observação: você pode encontrar as informações sobre cada função usando o “?” símbolo
    antes do início de cada função.

    Conjuntos de dados integrados R são muito úteis para começar e desenvolver habilidades. Portanto, usaremos alguns conjuntos de dados integrados.
    Vamos começar criando um gráfico de barras simples usando o conjunto de dados Chickwts e aprender como usar conjuntos de dados e algumas funções do RStudio.

    Gráficos de barra

    Um gráfico de barras representa dados categóricos com barras retangulares onde as barras podem ser plotadas vertical ou horizontalmente.

    # ? is used before a function
    # to get help on that function
    ?plot          
    ?chickwts      
    data(chickwts) #loading data into workspace
    plot(chickwts$feed) # plot feed from chickwts

    No código acima '?' na frente de uma função específica significa que ele fornece informações sobre essa função com sua sintaxe. Em R, '#' é usado para comentar uma linha única e não há comentários de várias linhas em R. Aqui estamos usando chickwtscomo conjunto de dados e feed é o atributo no conjunto de dados.
    Saída:

    Bar Chart
    feeds=table(chickwts$feed)
      
    # plots graph in decreasing order
    barplot(feeds[order(feeds, decreasing=TRUE)]) 

    Saída:

    Bar chart decreasing
    feeds = table(chickwts$feed)  
      
    # outside margins bottom, left, top, right. 
    par(oma=c(1, 1, 1, 1))                            
    par(mar=c(4, 5, 2, 1))                            
      
    # las is used orientation of axis labels       
    barplot(feeds[order(feeds, decreasing=TRUE)]  
        
    # horiz is used for bars to be shown as horizontal.
    barplot(feeds[order(feeds)], horiz=TRUE,   
      
    # col is used for colouring bars.       
    # xlab is used to label x-axis. 
    xlab="Number of chicks", las=1 col="yellow")    

    Saída:

    Bar chart Horizontal

    Gráfico de setores

    Um gráfico de pizza é um gráfico estatístico circular dividido em fatias para mostrar os diferentes tamanhos dos dados.

    data("chickwts")
      
    # main is used to create 
    # an heading for the chart
    d = table(chickwts$feed)               
      
    pie(d[order(d, decreasing=TRUE)], 
        clockwise=TRUE, 
        main="Pie Chart of feeds from chichwits", )

    Saída:

    Pie Chart

    Histogramas

    Os histogramas são a representação da distribuição dos dados (numéricos ou categóricos). É semelhante a um gráfico de barras, mas agrupa os dados em termos de intervalos.

    # break is used for number of bins.
    data(lynx)   
      
    # lynx is a built-in dataset.
    lynx         
      
    # hist function is used to plot histogram.
    hist(lynx)   
    hist(lynx, break=7, col="green",
         main="Histogram of Annual Canadian Lynx Trappings")

    Saída :

    Histogram
    data(lynx)
      
    # if freq=FALSE this will draw normal distribution  
    lynx                   
    hist(lynx)   
    hist(lynx, break=7, col="green",
         freq=FALSE main="Histogram of Annual Canadian Lynx Trappings")
      
    curve(dnorm(x, mean=mean(lynx),  
                sd=sd(lynx)), col="red", 
                lwd=2, add=TRUE)

    Saída:

    Histogramcurve

    Box Plots

    Box Plot é uma função para representar graficamente grupos de dados numéricos usando quartis. Representa a distribuição de dados e compreensão de média, mediana e variância.

    # USJudgeRatings is Built-in Dataset.
    ?USJudgeRatings                        
      
    # ylim is used to specify the range.
    boxplot(USJudgeRatings$RTEN, horizontal=TRUE, 
            xlab="Lawyers Rating", notch=TRUE,
            ylim=c(0, 10), col="pink") 

    USJudgeRating é um conjunto de dados Build-in com 6 atributos e RTEN é um dos atributos entre eles, com classificação entre 0 e 10 inclusive. Usamos para traçar um boxplot com diferentes atributos da função boxplot.
    Saída:

    BoxPlot