R - Estatística
Estatística é uma forma de análise matemática que se refere à coleta, organização, análise, interpretação e apresentação de dados. A análise estatística ajuda a fazer o melhor uso dos vastos dados disponíveis e a melhorar a eficiência das soluções.
R é uma linguagem de programação usada para computação estatística e gráficos do ambiente. A seguir está uma introdução aos conceitos estatísticos básicos, como gráficos de plotagem, como gráficos de barras, gráficos de pizza, histogramas e boxplots.
Nesta postagem, aprenderemos a traçar gráficos para uma única variável. O seguinte software é necessário para aprender e implementar estatísticas em R:
- Software R
- IDE RStudio
Funções para traçar gráficos em Estatísticas
A seguir está uma lista de funções que são necessárias para traçar gráficos para a representação de dados estatísticos:
- Função plot():
Esta função é usada para desenhar um gráfico de dispersão com eixos e títulos.Sintaxe:
plot (x, y = NULL, ylim = NULL, xlim = NULL, type = "b" ....)
- função data():
esta função é usada para carregar conjuntos de dados especificados.Sintaxe:
dados (lista = caractere(), lib.loc = NULL, pacote = NULL .....)
- Função table():
a função table é usada para construir uma tabela de contingência das contagens em cada combinação de níveis de fator.<strongsyntax:></strongsyntax:>
tabela (x, row.names = NULL, ...)
- barplot() Função:
Cria um gráfico de barras com barras verticais / horizontais.Sintaxe:
gráfico de barras (altura, largura = 1, names.arg = NULL, espaço = NULL ...)
- Função pie():
Esta função é usada para criar um gráfico de pizza.
Sintaxe:
pizza (x, rótulos = nomes (x), raio = 0,6, bordas = 100, sentido horário = VERDADEIRO ...)
A função
hist()
cria um histograma dos valores de dados fornecidos.Sintaxe:
hist (x, quebras = "Sturges", probabilidade =! freq, freq = NULL, ...)
Observação: você pode encontrar as informações sobre cada função usando o “?” símbolo
antes do início de cada função.
Conjuntos de dados integrados R são muito úteis para começar e desenvolver habilidades. Portanto, usaremos alguns conjuntos de dados integrados.
Vamos começar criando um gráfico de barras simples usando o conjunto de dados Chickwts e aprender como usar conjuntos de dados e algumas funções do RStudio.
Gráficos de barra
Um gráfico de barras representa dados categóricos com barras retangulares onde as barras podem ser plotadas vertical ou horizontalmente.
# ? is used before a function
# to get help on that function
?plot
?chickwts
data(chickwts) #loading data into workspace
plot(chickwts$feed) # plot feed from chickwts
No código acima '?' na frente de uma função específica significa que ele fornece informações sobre essa função com sua sintaxe. Em R, '#' é usado para comentar uma linha única e não há comentários de várias linhas em R. Aqui estamos usando chickwts
como conjunto de dados e feed é o atributo no conjunto de dados.
Saída:
feeds=table(chickwts$feed)
# plots graph in decreasing order
barplot(feeds[order(feeds, decreasing=TRUE)])
Saída:
feeds = table(chickwts$feed)
# outside margins bottom, left, top, right.
par(oma=c(1, 1, 1, 1))
par(mar=c(4, 5, 2, 1))
# las is used orientation of axis labels
barplot(feeds[order(feeds, decreasing=TRUE)]
# horiz is used for bars to be shown as horizontal.
barplot(feeds[order(feeds)], horiz=TRUE,
# col is used for colouring bars.
# xlab is used to label x-axis.
xlab="Number of chicks", las=1 col="yellow")
Saída:
Gráfico de setores
Um gráfico de pizza é um gráfico estatístico circular dividido em fatias para mostrar os diferentes tamanhos dos dados.
data("chickwts")
# main is used to create
# an heading for the chart
d = table(chickwts$feed)
pie(d[order(d, decreasing=TRUE)],
clockwise=TRUE,
main="Pie Chart of feeds from chichwits", )
Saída:
Histogramas
Os histogramas são a representação da distribuição dos dados (numéricos ou categóricos). É semelhante a um gráfico de barras, mas agrupa os dados em termos de intervalos.
# break is used for number of bins.
data(lynx)
# lynx is a built-in dataset.
lynx
# hist function is used to plot histogram.
hist(lynx)
hist(lynx, break=7, col="green",
main="Histogram of Annual Canadian Lynx Trappings")
Saída :
data(lynx)
# if freq=FALSE this will draw normal distribution
lynx
hist(lynx)
hist(lynx, break=7, col="green",
freq=FALSE main="Histogram of Annual Canadian Lynx Trappings")
curve(dnorm(x, mean=mean(lynx),
sd=sd(lynx)), col="red",
lwd=2, add=TRUE)
Saída:
Box Plots
Box Plot é uma função para representar graficamente grupos de dados numéricos usando quartis. Representa a distribuição de dados e compreensão de média, mediana e variância.
# USJudgeRatings is Built-in Dataset.
?USJudgeRatings
# ylim is used to specify the range.
boxplot(USJudgeRatings$RTEN, horizontal=TRUE,
xlab="Lawyers Rating", notch=TRUE,
ylim=c(0, 10), col="pink")
USJudgeRating é um conjunto de dados Build-in com 6 atributos e RTEN é um dos atributos entre eles, com classificação entre 0 e 10 inclusive. Usamos para traçar um boxplot com diferentes atributos da função boxplot.
Saída:
As postagens do blog Acervo Lima te ajudaram? Nos ajude a manter o blog no ar!
Faça uma doação para manter o blog funcionando.
70% das doações são no valor de R$ 5,00...
![QR code PIX para fazer uma doação](https://acervolima.com/resources/img/qr-code.jpg)
Diógenes Lima da Silva
![Logo PIX](https://acervolima.com/resources/img/logo_pix.png)