Escolar Documentos
Profissional Documentos
Cultura Documentos
Curso de Estatística no R
Análise de Dados
8 de novembro de 2018
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Sumário
1 Noções do R
Data Frame
2 Estatística descritiva
Gráficos
3 Testes para média e proporção
4 Correlação
5 Regressão linear
6 Regressão logística
7 Análise fatorial
8 Análise de correspondência
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Média
sum(vetor )/length(vetor )
46.6
O comando mean( )
Cálculo da média usando o comando direto
mean(vetor)
[1] 46.6
Definição
Se as observações numa amostra de tamanho n são x1 , x2 , ..., xn ,
então a média aritmética é: Pn
x
x = x1 +x2 +...+x
n
n
= i=1 i
n
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Enivaldo Rocha
Separatrizes
Percentil
Representa o elemento que divide a amostra e ordena em
percentis, por exemplo: o percentil 50 é igual a mediana.
Quantil
O comando quantile apresenta o valor que divide os dados em
percentis 25, 50 e 75.
quantile(vetor, probs=0.5)
50
41
quantile(vetor, probs=c(0.25,0.75))
25 75
21 53
diff(quantile(vetor,probs=c(0.25,0.75)))
75
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
O Comando Summary
O comando summary fornece as estatísticas mínimo, q1, mediana, média, q3 e o máximo de uma variável
quantitativa.
Exemplo: Considere X o peso do cérebro de uma amostra de 19 animais e Y a sua massa corporal em
gramas.
X = c(1176, 273, 151, 123, 110, 289, 165, 119, 95, 32, 700, 166, 118, 115, 41, 28, 5.2, 2.6, 0.5)
Y = c(78000, 60000, 16000, 37000, 11000, 780000, 230000, 72000, 25000, 4500, 272000, 35000,
50000, 50000, 22000, 60000, 2000, 23, 19)
summary(X)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.5 36.5 118.0 195.2 165.5 1176.0
summary(Y)
Min. 1st Qu. Median Mean 3rd Qu. Max.
19 13500 37000 94976 66000 780000
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Medidas de Variabilidade
Range
É a medida de variação mais simples, range amostral, definido
como a diferença entre a maior e a menor das observações na
amostra
r = max (xi ) − min(xi )
Intervalo interquartílico
Definido como a diferença entre o 3o quartil e o primeiro quartil
IQR = q3 − q1
Enivaldo Rocha
Variância
Se as observações numa amostra de tamanho n são x1 , x2 , ..., xn ,
então a variância amostral é: Pn
(xi −x )2
s 2 = i=1n−1
e o desvio padrão amostral é a raiz quadrada positiva de s 2
...1.....2.....3.....4.....5.....6.....7.....8.....9...
.................|....-2.5....5.6....+2.5....|.........
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Exemplo: Considere a amostra do peso do cérebro (X) e a massa corporal (Y) dos 19 animais, e as notas dos
alunos da disciplina análise de dados do mppp 2017.2 (nota).
> notas <- read.csv("notas.csv", sep=";", dec=",",header=TRUE) > nota <- notasnotas
s1 <- sqrt(var(X))
> s2 <- sqrt(var(Y))
> s3 <- sqrt(var(nota))
> m1 <- mean(X)
> m2 <- mean(Y)
> m3 <- mean(nota)
> CVx < −s1/m1
> CVy < −s2/m2
> CVn ota < −s3/m3
> CVx
1.461587
> CVy
1.908605
> CVn ota
0.305887
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Distribuição de Frequência
notas <- read.csv("notas.csv", sep=";", dec=",",header=TRUE)
sort(notas$notas)
1.52.52.52.53.03.03.03.03.53.53.53.53.54.04.04.04.04.04.04.54.54.54.5
4.5 4.5 5.0 5.0 5.0 5.0 5.0 5.0 5.0 5.0 5.0 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 5.5 6.0
6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.0 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
7.0 7.0 7.0 7.0 7.0 7.0 7.5 7.5 7.5 7.5 7.5 7.5 7.5 7.5 7.5 7.5 8.0 8.0 8.0 8.0 8.0 8.0 8.5
8.5 8.5 9.0 9.0 9.5 10.0 10.0 10.0
Enivaldo Rocha
Histograma
hist(notas$notas, main="Histograma da variável Notas",prob=T, xlab="Notas", ylab="Densidade")
0.20
0.15
Densidade
0.10
0.05
0.00
2 4 6 8 10
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
BoxPlot
O boxplot representa um excelente método para detectar outlier presentes na distribuição da variável, o
fato de usar a mediana como uma medida de centralidade permite que a distribuição fique livre da
influência de pontos extremos.
Outlier
Máximo
3º Quartil
1º Quartil
Mínimo
Enivaldo Rocha
BoxPlot - Exemplos
Exemplo 1 - Considere as notas da disciplina análise de dados e verifique se tem algum outlier presente na
distribuição.
20
15
Salários
10
5
Boxplot de salários
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Dados: Bussab
m <- read.csv("milsa.csv", sep=";", dec=",",header=TRUE)
barplot(table(mestciv ), col = c(”blue”, ”red”), ylim = c(0, 25), space = .8, width = c(.2, .2), main =
”Númerodefilhosporestadocivil”, xlab = ”EstadoCivil”, ylab = ”NúmerodeFilhos”)
25
20
15
Número de Filhos
10
5
0
casado solteiro
Estado Civil
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
0.15
0.10
0.05
0.00
2 4 6 8 10
Notas
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
20
15
15
Salários
Salários
10
10
5
Datasus
require(graphics)
setwd(" /Curso de Estatistica no R/Dados da Saúde")
tx <- read.csv("txc a4.csv ”, sep = ”; ”, dec = ”, ”, header = TRUE )
ca <- ts(tx, frequency = 1, start = c(1980, 1))
class(ca)
plot(ca)
ca
0.20
0.15
mama
0.10
0.05
1.0
0.9
0.8
pele
0.7
0.6
0.5
0.4
14
12
prostata
10
8
6
0.40 4
0.35
0.30
linfoma
0.25
0.20
0.15
0.10
Time
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Tipos de câncer
par(mfrow=c(2,2))
plot(ca[,1], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Mama",
col="pink")
plot(ca[,2], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Pele",
col="green")
plot(ca[,3], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Próstata",
col="red")
plot(ca[,4], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Linfoma", col="blue")
Mortalidade no Brasil por Câncer de Mama Mortalidade no Brasil por Câncer de Pele
0.20
1.0
Taxa de mortalidade (por 100000)
0.9
0.15
0.8
0.7
0.10
0.6
0.5
0.05
1980 1985 1990 1995 2000 2005 2010 2015 0.4 1980 1985 1990 1995 2000 2005 2010 2015
Time Time
0.35
Taxa de mortalidade (por 100000)
0.30
0.25
10
0.20
8
0.15
6
0.10
4
1980 1985 1990 1995 2000 2005 2010 2015 1980 1985 1990 1995 2000 2005 2010 2015
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Tipos de câncer
par(mfrow=c(2,2))
plot(ca[,1], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Mama",
col="pink",ylim=c(0,15))
plot(ca[,2], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Pele",
col="green",ylim=c(0,15))
plot(ca[,3], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Câncer de Próstata",
col="red",ylim=c(0,15))
plot(ca[,4], ylab="Taxa de mortalidade (por 100000)", main="Mortalidade no Brasil por Linfoma", col="blue",
ylim=c(0,15))
Mortalidade no Brasil por Câncer de Mama Mortalidade no Brasil por Câncer de Pele
15
15
Taxa de mortalidade (por 100000)
10
5
5
0
0
1980 1985 1990 1995 2000 2005 2010 2015 1980 1985 1990 1995 2000 2005 2010 2015
Time Time
15
Taxa de mortalidade (por 100000)
10
5
5
0
1980 1985 1990 1995 2000 2005 2010 2015 1980 1985 1990 1995 2000 2005 2010 2015
Time Time
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
plot(m$Ano, m$salario, pch=2, lwd=5, main="Salário versus Idade", xlab="Idade (anos)", ylab="Salários”)
45
40
35
Salários
30
25
20
0 5 10 15 20 25 30 35
Idade (anos)
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha Histograma e Curvas
Teóricas
Uniforme
hist(x,probability=TRUE,main="Uniforme[0,1]",ylab="Densidade",col="yellow")
curve(dunif(x,0,1),add=T)
Binomial
n <- 10 hspace.2cm p <- 0.25 hspace,2cm x <- rbinom(100,n,p)
hist(x,probability=TRUE,ylab="Densidade",col="pink",main="Binomial", ym=c(0,0.30))
xvalores <- 0:n
points(xvalores,dbinom(xvalores,n,p),type="h",lwd=3)
points(xvalores,dbinom(xvalores,n,p),type="p", lwd=3)
Normal
x <- rnorm(100)
hist(x,probability=TRUE,col="lightblue",main="Normal(0,1)",ylab="Densidade",ylim=c(0,0.5),xlim=c(-
3,3))
curve(dnorm(x),add=T)
Exponencial x <- rexp(100,1/2500)
hist(x,probability=TRUE,col="lightgreen",main="Exponencial com média=2500",ylab="Densidade")
curve(dexp(x,1/2500),add=T)
0.5
0.00030
0.25
1.2
0.4
0.00025
0.20
1.0
0.00020
0.3
0.8
0.15
Densidade
Densidade
Densidade
Densidade
0.00015
0.6
0.2
0.10
0.00010
0.4
0.1
0.05
0.00005
0.2
0.00000
0.00
0.0
0.0
x x x x
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
install.packages("datasets")
head(iris)
head(swiss)
pairs(swiss)
0 20 40 60 80 0 10 30 50 15 20 25
90
80
70
Fertility
60
50
40
80
60
Agriculture
40
20
0
30
20
Examination
10
5
50
40
30
Education
20
10
0
100
80
60
Catholic
40
20
0
25
20
Infant.Mortality
15
40 60 80 5 15 25 35 0 20 60 100
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
begintable[]
Fertility Agriculture Examination Education Catholic Infant.Mortality
Courtelary 80.2 17.0 15 12 9.96 22.2
Delemont 83.1 45.1 6 9 84.84 22.2
Franches-Mnt 92.5 39.7 5 5 93.40 20.2
Moutier 85.8 36.5 12 7 33.77 20.3
Neuveville 76.9 43.5 17 15 5.16 20.6
Porrentruy 76.1 35.3 9 7 90.57 26.6
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Matrizes de Gráficos
panel.hist <- function(x, ...)
{
usr <- par("usr"); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col = "cyan", ...)
}
pairs(swiss, diag.panel = panel.hist)
0 20 40 60 80 0 10 30 50 15 20 25
90
Fertility
80
70
60
50
40
80
Agriculture
60
40
20
0
Examination
30
20
10
5
50
Education
40
30
20
10
0
100
Catholic
80
60
40
20
0
25
Infant.Mortality
20
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
0 20 40 60 80 0 10 30 50 15 20 25
90
Fertility
80
70
0.35 0.65 0.66 0.46 0.42
60
50
40
80
Agriculture
60
Examination
30
0.70 0.57
20
0.11
10
5
50
Education
40
30
0.15 0.099
20
10
0
100
Catholic
80
60
0.18
40
20
0
25
Infant.Mortality
20
15
40 60 80 5 15 25 35 0 20 60 100
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
0 20 40 60 80 0 10 30 50 15 20 25
90
Fertility
80
70
0.35 0.65 0.66 0.46 0.42
60
50
40
80
Agriculture
60
0.69 0.64 0.40 0.061
40
20
0
Examination
30
0.70 0.57
20
0.11
10
5
50
Education
40
30
0.15 0.099
20
10
0
100
Catholic
80
60
0.18
40
20
0
25
Infant.Mortality
20
15
40 60 80 5 15 25 35 0 20 60 100
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Matrizes de Gráficos
panel.lm <- function (x, y, col = par("col"), bg = NA, pch = par("pch"),
cex = 1, col.line="red")
points(x, y, pch = pch, col = col, bg = bg, cex = cex)
ok <- is.finite(x) is.finite(y)
if (any(ok))
abline(lm(y[ok] x[ok]), col = col.line)
pairs(swiss, diag.panel = panel.hist, upper.panel = panel.cor,
lower.panel = panel.lm)
0 20 40 60 80 0 10 30 50 15 20 25
90
Fertility
80
70
0.35 0.65 0.66 0.46 0.42
60
50
40
80
Agriculture
60
Examination
30
0.70 0.57
20
0.11
10
5
50
Education
40
30
0.15 0.099
20
10
0
100
Catholic
80
60
0.18
40
20
0
25
Infant.Mortality
20
15
40 60 80 5 15 25 35 0 20 60 100
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
0.3
Sepal.Length
Corr: Corr: Corr:
0.2
−0.118 0.872 0.818
0.1
0.0
4.5
4.0
Sepal.Width
3.5
Corr: Corr:
3.0 −0.428 −0.366
2.5
2.0
Petal.Length
Corr:
4
0.963
2.5
2.0
Petal.Width
1.5
1.0
0.5
0.0
7.5
5.0
2.5
0.0
7.5
Species
5.0
2.5
0.0
7.5
5.0
2.5
0.0
5 6 7 8 2.0 2.5 3.0 3.5 4.0 4.5 2 4 6 0.0 0.5 1.0 1.5 2.0 2.5 setosa versicolorvirginica
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
1.2
Cor : −0.118 Cor : 0.872 Cor : 0.818
Sepal.Length
versicolor: 0.526 versicolor: 0.754 versicolor: 0.546
0.4
0.0
4.5
Sepal.Width
3.5
2.0
Cor : 0.963
6
setosa: 0.332
Petal.Length
4
versicolor: 0.787
2 virginica: 0.322
2.5
2.0
Petal.Width
1.5
1.0
0.5
0.0
5 6 7 8 2.0 2.5 3.0 3.5 4.0 4.5 2 4 6 0.0 0.5 1.0 1.5 2.0 2.5
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
8.0
setosa
7.5
Sepal.Lengthversicolor
7.0
virginica
6.5
6.0
5.5
5.0
4.5
Sepal.Width
4.0
3.5
3.0
2.5
2.0
7
Petal.Length
6
5
4
3
2
1
versicolor versicolor
virginica
virginica
Species
versicolor versicolor
setosa
setosa
2.5
1.5 2.0 2.5
2.0
1.5
Petal.Width
1.0
0.5
0.0 0.5 1.0
0.0
7
4 5 6 7
6
5
4 Petal.Length 4
3
2
1 2 3 4
1
4.5
3.5 4.0 4.5
4.0
3.5
Sepal.Width
3.0
2.5
2.0 2.5 3.0
2.0
8
7 8
7
Sepal.Length 6
5
5 6
ggcorr(swiss, label=T)
Infant.Mortality
Catholic 0.2
0.5
0.0
−0.5
Examination 0.7 −0.6 −0.1 −1.0
library(corrplot)
primeiro fazemos a matriz de correlação
M <- cor(swiss)
corrplot(M, method = "circle")
Infant.Mortality
Examination
Agriculture
Education
Catholic
Fertility
1
Fertility
0.8
0.6
Agriculture
0.4
0.2
Examination
Education
−0.2
−0.4
Catholic
−0.6
−0.8
Infant.Mortality
−1
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha Agrupamento pela
correlção
Examination
0.8
0.6
Education
0.4
0.2
Infant.Mortality
Agriculture
−0.2
−0.4
Fertility
−0.6
−0.8
Catholic
−1
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
>head{cerebro}
especie animal cerebro peso relacao
1 primata Humano 1176 78000 1,51%
2 primata Chipanzé 273 60000 0,46%
> cerebro$especie
primata primata primata primata primata carnivorus carnivorus carnivorus carnivorus
carnivorus antiodátilos antiodátilos antiodátilos antiodátilos antiodátilos marsupiais logomorfos roedores
roedores
Cérebro
1200
1000
800
600
Peso
400
200
0
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Peso
8e+05
6e+05
4e+05
Peso
2e+05
0e+00
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
plot(cerebro$cerebro,cerebro$peso,main=paste("Peso do Cérebro
versus Peso do animal"),ylab="Cérebro",xlab="Peso")
8e+05
6e+05
4e+05
Cérebro
2e+05
0e+00
Usando o Fator
boxplot(cerebro$cerebro .̃ cerebro$especie, main="Cérebro dos Animais por Espécie", ylab="Peso",
col=("yellow"))
boxplot(cerebro$peso .̃ cerebro$especie, main="Peso dos Animais por Espécie", ylab="Peso", col=("orange"))
Cérebros dos Animais por Espécie Peso dos Animais por Espécie
8e+05
1200
1000
6e+05
800
4e+05
600
Peso
Peso
400
2e+05
200
0e+00
0
antiodátilos carnivorus logomorfos marsupiais primata roedores antiodátilos carnivorus logomorfos marsupiais primata roedores
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
table(dados$origem)
capital interior outro
11 12 13
table(dados$origem,dados$estciv)
casado solteiro
capital 7 4
interior 8 4
outro 5 8
table(dados$origem,dados$estciv,dados$educa) , , = 1o Grau
casado solteiro
capital 2 2
interior 1 2
outro 2 3
, , = 2o Grau
casado solteiro
capital 4 1
interior 6 1
outro 2 4
, , = Superior
casado solteiro
capital 1 1
interior 1 1
outro 1 1
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Tabela de proporções
prop.table(table(dados$educacao))
1o Grau 2o Grau Superior
0.3333333 0.5000000 0.1666667
prop.table(table(dados$estciv, dados$origem))
capital interior outro
casado 0.1944444 0.2222222 0.1388889
solteiro 0.1111111 0.1111111 0.2222222
prop.table(table(dados$origem,dados$estciv,dados$educa))
, , = 1o Grau
casado solteiro
capital 0.05555556 0.05555556
interior 0.02777778 0.05555556
outro 0.05555556 0.08333333
, , = 2o Grau
casado solteiro
capital 0.11111111 0.02777778
interior 0.16666667 0.02777778
outro 0.05555556 0.11111111
, , = Superior
casado solteiro
capital 0.02777778 0.02777778
interior 0.02777778 0.02777778
outro 0.02777778 0.02777778
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Summary
Variável quantitativa
summary(dados$Salario)
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.00 7.55 10.15 11.13 14.10 23.30
summary(dados$Salario[dados$estciv=="solteiro"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.000 7.275 9.050 9.881 11.700 18.800
summary(dados$Salario[dados$estciv=="casado"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.600 8.775 11.950 12.135 15.025 23.300
Variável categórica
summary(dados$origem)
capital interior outro
11 12 13
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Enivaldo Rocha
t.test(amostra1,mu=15)
Enivaldo Rocha
Enivaldo Rocha
Paired t-test
Enivaldo Rocha
prop.test()
Realiza o teste de proporções para uma ou duas amostras.
sintaxe: prop.test(x, n, p, opções)
Parâmetros
x: Vetor contendo o número de sucessos em cada amostra.
n: Vetor contendo o número de realizações de cada amostra.
p: Vetor contendo as probabilidades de sucesso de cada amostra.
Opções:
alternative: string indicando a hipótese alternativa desejada.
Valores possíveis: "two-sided", "less"ou "greater".
conf.level: coeficiente de confiança do intervalo.
correct: TRUE – indica que a correção de continuidade de Yates
será aplicada.
FALSE – indica que a correção de continuidade não será aplicada.
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Testar
H0 : P = P 0
H1 : P 6= P0
prop.test(104,200,0.6,correct=F)
Enivaldo Rocha
prop.test(c(104,50),c(200,95),correct=F)
Enivaldo Rocha
Exemplo:
Considere a amostra do tempo de serviço, em anos, de 10
funcionários de uma companhia de seguros e o número de clientes
que cada um conquistou. Será que existe uma relação entre a
variável número de clientes e o tempo de serviço do corretor?
X 2 3 4 5 4 6 7 8 8 10
Y 48 50 56 52 43 60 62 58 64 72
70
65
60
Y
55
50
45
2 4 6 8 10
X
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Tipos de correlação
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Enivaldo Rocha
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Enivaldo Rocha
Comandos R:
mean(X) 5.7
mean(Y) 56.5
var(X) 6.455556
var(Y) 73.16667
summary(X)
Min. 1st Qu. Median Mean 3rd Qu. Max. 2.00 4.00 5.50
5.70 7.75 10.00
summary(Y)
Min. 1st Qu. Median Mean 3rd Qu. Max. 43.0 50.5 57.0
56.5 61.5 72.0
cor(X,Y) 0.8767952
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Diagrama de dispersão
70
65
60
Número de clientes
55
50
45
2 4 6 8 10
Tempo de serviço
Propriedades da correlação
Enivaldo Rocha
Ho : ρ = 0
H1 : ρ 6= 0
Estatística do teste: t = pr
1−r 2
n−2
cor.test(x, y,
alternative = c("two.sided", "less", "greater"), method = c("pearson", "kendall", "spearman"),
exact = NULL, conf.level = 0.95, continuity = FALSE, . . . )
cor.test(X,Y)
Pearson’s product-moment correlation
data: X and Y
t = 5.5989, df = 5, p-value = 0.00251
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.5841215 0.9896355
sample estimates:
cor
0.928676
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Exemplo: Box, Hunter and Hunter. Statistics for experiments. News York, 1978.
O diagrama de dispersão abaixo apresenta a população (Y) da cidade de Oldenburg, na Alemanha, e o número de
cegonhas (X) no final de cada ano, durante o período de sete anos entre 1930 e 1936.
80
70
60
Popuação civil (por 1000)
50
40
30
Número de cegonhas
Observando o gráfico acima, podemos ser induzido a concluir que o aumento no número de cegonhas causa um
crescimento na população da cidade de Oldenburg. Neste caso, a correlação entre Y e X ocorre devido a um
terceiro fator, W. Tanto Y como X cresce sobre o período de 7-anos, o fator comum W é o tempo.
Estatítica Descritiva Gráficos Exemplos de Funções Estatísticas Testes para a Média e Proporçã
Enivaldo Rocha
Exercício:
a Obtenha os gráficos (ano,X) e (ano,Y)
b Calcule r(ano,X), r(X,ano), r(ano,Y) e r(Y,ano)