Escolar Documentos
Profissional Documentos
Cultura Documentos
DE NÍVEL SUPERIOR
Vol. I
Fortaleza - CE
2022
SUMÁRIO
ESTATÍSITICA DESCRITIVA
1. Definição de Estatística 4
2. Método Estatístico 5
3. Divisão da Estatística 5
4. População e amostra 6
5. Parâmetro e estatística 7
6. Variável 8
9. Amostragem 11
13.1.2 Separatrizes 57
INFERÊNCIA ESTATÍSTICA
Bibliografia 150
Dados 160
1 Definição
"Ciência que se preocupa com a organização, descrição, análise e interpretação dos dados
experimentais, com base em um conjunto de métodos que se destina a possibilitar a tomada de
decisões, face às incertezas." (Wallis).
Ou ainda:
"É um ramo do conhecimento científico que consta de um conjunto de processos que têm por
objeto a observação, a classificação formal e a análise dos fenômenos coletivos ou de massa
(finalidade descritiva) e também investigar a possibilidade de fazer inferências indutivas válidas a
partir dos dados observados por meio de métodos capazes de permitir esta inferência (finalidade
indutiva)".
Montgomery e Runger definem Estatística como sendo a ciência que nos ajuda a tomar decisões
e tirar conclusões na presença de variabilidade. O campo da Estatística lida com a coleta,
apresentação, análise e uso dos dados para tomar decisões, resolver problemas e planejar produtos
e processos. Em termos simples, Estatística é a ciência de dados.
Logo, o Estatístico é o verdadeiro Cientista dos Dados.
Levine et al definem Estatística como sendo "um conjunto de métodos que ajudam a transformar
dados em informações úteis para tomadores de decisões."
Podemos dizer que dados são coleções de evidências relevantes sobre um fato observado.
Dados primários: quando são publicados pela própria pessoa ou organização que os haja
recolhido. Ex: tabelas do censo demográfico do IBGE.
Dados secundários:quando são publicados ou comunicados por outro pesquisador ou outra
organização. Ex: quando determinado jornal publica estatísticas referentes ao censo
demográfico extraídas do IBGE.
OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o
grande risco de erros de transcrição.
Tem por finalidade estruturar e a organizar as fases ou etapas que devem ser estabelecidas na
abordagem de uma observação estatística.
- Definição do problema;
- Planejamento;
- Coleta de dados;
- Apuração de dados;
- Apresentação de dados;
- Análise e interpretação dos dados.
3. Divisão da Estatística
A Estatística divide-se em :
1) Estatística Descritiva:
Que se preocupa com a organização, sumarização e descrição dos dados experimentais. Consiste
num conjunto de métodos que ensinam a reduzir uma quantidade de dados bastante numerosa em
um número pequeno de medidas, substitutas e representantes daquela massa de dados.
2) Estatística Indutiva:
Que se preocupa com a análise e interpretação dos dados. Consiste em inferir propriedades de um
universo a partir de uma amostra com resultados conhecidos.
3) Probabilidade:
4. População e Amostra
Objetivando o estudo quantitativo e qualitativo dos dados (ou informações) obtidas nos vários
campos da atividade cientifica, a Estatística manipula dois tipos de conjuntos de dados: a
população e a amostra:
a) População- (ou universo) é o conjunto de elementos com pelo menos uma característica comum.
Ex: O Brasil possui 27 unidades federativas (UF), sendo 26 Estados e 1 Distrito Federal. Uma
amostra destas unidades poderia ser de 5 UF.
Ou ainda, se estivéssemos interessado em retirar uma amostra de municípios brasileiros, de um total
de 5570 municípios, poderíamos escolher 100 municípios, por exemplo.
Com relação aos dois tipos de conjuntos de dados : população e amostra, temos os seguintes
conceitos na Estatística:
a) Parâmetro - é uma medida que se refere à população, ou seja, é obtida com base nos valores da
população.
Ex: média ( µ), proporção ( π), variância ( σ2) e desvio-padrão (σ)
b) Estatística – é uma medida que se refere à amostra, ou seja, é obtida com base nos valores da
amostra.
Ex: média( x ), proporção (p), variância (s2) e desvio-padrão (s).
Na prática, usamos uma estatística para se estimar um parâmetro populacional, que em geral é
desconhecido. Ou seja, realizamos um processo de amostragem, que significa retirar uma amostra
da população de estudo. Ao fazer isto, estamos cometendo um erro, chamado de erro amostral - ε.
O erro amostral (ε) é expresso na unidade da variável de estudo. Ele representa a máxima diferença
admitida entre o verdadeiro parâmetro populacional (θ) e o seu estimador ( θˆ ), conhecido como
estatística. Então:
θ − θˆ ≤ ε
Variável é uma característica que pode ser observada ou medida em cada elemento da população ou
da amostra, sob as mesmas condições.
`
O estudo das variáveis ocupa um lugar primordial no processo de pesquisa científica. Elas podem
ser classificadas de acordo com diferentes critérios:
Conforme o critério da medição, uma variável pode ser classificada em variável qualitativa ou
variável quantitativa.
Variável qualitativa (categórica): é a que se refere a uma classificação por tipos, categorias ou
atributos, ex.: sexo, cor dos olhos, estado civil etc; conseqüentemente, temos as “estatísticas de
atributos”, ou seja, nas variáveis categóricas resumem-se os dados por determinar a freqüência de
cada uma das categorias observadas e apresentá-las em uma tabela ou gráfico.
Variável quantitativa (numérica): quando seus valores são expressos em números, ex.: idade,
peso, altura, renda etc; conseqüentemente, temos as “estatísticas de variáveis”, ou seja, além de
verificar freqüências, podemos também calcular médias e realizar outras operações.
De acordo com o tipo de variável empregada em uma pesquisa ou estudo, os dados podem ser
classificados em:
b) Dados ordinais: são aqueles que se referem à avaliação de um fenômeno em termos de sua
situação dentro de um conjunto de patamares ordenados, variando desde um patamar mínimo até
um patamar máximo.
Por exemplo: Nível de escolaridade (fundamental, médio e superior)
c) Dados discretos : são aqueles que podem assumir apenas valores pertencentes a um conjunto
enumerável, ou seja, a escala numérica se refere ao conjunto dos números inteiros (N).
Por exemplo número de filhos, o ponto obtido em cada jogada, número de defeitos por unidade etc.
d) Dados contínuos: são aqueles que assumem quaisquer valores num certo intervalo razoável de
variação, ou seja a escala numérica é o conjunto dos números reais (R).
Qualitativa Quantitativa
a) Dados Brutos - são os dados originais, que ainda não se encontram prontos para análise, pois não
foram numericamente organizados
É caracterizado pelo ato de nomear ou rotular um objeto, pessoa ou alguma característica. Os dados
são classificados em categorias distintas nas quais não está implícita nenhuma ordem. Neste nível
de mensuração, não são possíveis operações aritméticas, apenas a contagem de valores, pois
verifica-se uma relação de equivalência (=, ≠) em relação à característica de interesse.
Ex: sexo (Masculino e Feminino), religião, filiação partidária, estado civil, raça, profissões etc.
Neste nível, os dados, além de apresentarem as propriedades inerentes da escala nominal, são postos
em ordem do menor ao maior, de forma significante. A relação de ordem (>, <) vale para todos os
dados, e com isto temos uma escala ordinal.
Ex: status socioeconômico, grau de escolar, hierarquização funcional etc.
Neste nível, observam-se que os dados, além de apresentarem as propriedades inerentes da escala
ordinal, apresentam intervalos iguais de medição, ou seja, em uma unidade de medida fixa, embora
não envolva um verdadeiro ponto zero. Esta escala permite inferir diferenças entre unidades a serem
medidas, porém, não se pode afirmar que um valor em um intervalo específico da escala seja
múltiplo de outro. Por exemplo, suponha dois objetos medidos a uma temperatura de 15°C e 30°C,
respectivamente. A mensuração da temperatura permite determinar o quanto um objeto é mais
quente que o outro; porém, não se pode afirmar que o objeto com 30°C está duas vezes mais quente
que o outro com 15°C.
d) Nível de Razão
Neste nível, observam-se que os dados, além de apresentarem as propriedades inerentes da escala
intervalar, apresentam um quociente significativo entre dois valores, ou seja, uma razão entre os
pares de valores no conjunto ordenado. A origem(ou ponto zero) é única e considerado como
ausência total da característica medida. Desta forma, é possível saber se um valor em um intervalo
específico da escala é múltiplo de outro.
9. Amostragem
Dentre as diversas maneiras de coletar dados, a amostragem é mais freqüente, particularmente nas
pesquisas sobre fenômenos sociais e econômicos,
Uma amostra pode ser probabilística, ou seja, quando os elementos amostrais são escolhidos com
probabilidades conhecidas.
Uma amostra não-probabilística é aquela em que os elementos amostrais não são escolhidos com
probabilidades, ou seja, a escolha dos elementos amostrais é feita de forma deliberada.
Antes de se escolher qual o método de amostragem a ser utilizado, devemos ter uma noção do
tamanho inicial da amostra. Neste caso, teremos como base o erro amostral, dado por:
θ − θˆ ≤ ε
E o tamanho N da população alvo do estudo. Usa-se a seguinte expressão para a determinação
inicial do tamanho da amostra:
n0
n=
n
1+ 0
N
1
Onde: n0 =
ε2
1 1 1
n0 = = = = 400
ε 2 ( 0, 05) 2 0,0025
n0 400 400
n= = = = 399, 20 ≅ 399
n0 400 1,002
1+ 1+
N 200000
Uma vez determinado o tamanho inicial da amostra, deve-se realizar o sorteio dos elementos que
irão compô-la. Este processo depende do Método de Amostragem a ser adotado.
Neste método, todos os elementos da população têm a mesma chance (probabilidade – 1/n) de
serem selecionados. Atribui-se a cada elemento da população um número distinto. Efetuam-se
sucessivos sorteios até completar o tamanho da amostra n. Para realizar o sorteio, utilizar a Tabela
de Números Aleatórios - TNA (anexo) que consistem em tabelas que apresentam dígitos de 0 à 9
distribuídos aleatoriamente.
Por exemplo:
Suponha uma população com 500 elementos, que numeramos de 000 a 499 para selecionar
uma amostra aleatória de n=50 elementos.
O processo termina quando for sorteado o elemento 50. A probabilidade de cada elemento ser
selecionado é p=1/50
b) Amostragem Sistemática
Conveniente quando a população está ordenada segundo algum critério como fichas, lista telefônica
etc.
Procedimento:
Exemplo:
Se N = 5.000 é o tamanho da população e precisamos de uma amostra de n = 250, dividimos N/n =
20. Selecionamos ao acaso um número de 1 à 20. Suponha que saiu o número 7:
1a unidade a ser selecionada 7a
2a unidade a ser selecionada 20 + 7 = 27a
3a unidade a ser selecionada 27 + 20 = 47a
67a, 87a,..., 4987a dando um total de 250 unidades.
c) Amostragem Estratificada
As varáveis de estratificação mais comuns são: classe social, idade, sexo, profissão.
Exemplo: Numa localidade com 150 000 habitantes, 45 000 têm menos de 20 anos de idade, 75 000
têm idades entre 30 e 50 anos e 30 000 têm mais de 50 anos de idade. Extrair uma amostra de 30
habitantes desta população pelo processo de amostragem estratificada com partilha proporcional.
A amostra deverá conter 9 habitantes com menos de 20 anos, 15 com idades entre 20 e 50 anos 6
com mais de 50 anos.
Um dos métodos usados para a apresentação de dados estatísticos que consegue expor os resultados
sobre determinado assunto num só local, sinteticamente, de tal modo que se tenha uma visão mais
globalizada daquilo que se vai analisar.
A apresentação tabular dos dados estatísticos se faz mediante tabelas (ou quadros), resultantes da
disposição dos respectivos dados em linhas e colunas distribuídas de modo ordenado, seguindo
regras práticas adotadas pelos diversos sistemas estatísticos. No Brasil, essas regras foram fixadas
pelo Conselho Nacional de Estatística, por meio da Resolução nº 886, de 26 de outubro de 1966.
10.1 Tabela
É aquela composta de uma coluna matriz, também chamada coluna indicadora, onde vão inscritos
os valores ou modalidades de ordem de classificação e da coluna em que aparecem os valores que
representam as ocorrências ou intensidades do fenômeno em causa.
a) Elementos essenciais:
b) Elementos complementares:
Os elementos complementares de uma tabela estatística são: fonte, notas e chamadas, todos situados
no rodapé da tabela.
Corpo
Linhas
Total
Rodapé
- Séries homógradas;
- Séries heterógradas.
São séries em que a variável de estudo varia em função da época ou do tempo, permanecendo fixos
a região ou o local e o fenômeno.
São séries em que a variável de estudo varia em função da região, do local ou do espaço,
permanecendo fixos a época ou o tempo e o fenômeno.
Estados População
Rio de Janeiro 15.420.375
São Paulo 39.827.570
Ceará 8.185.286
Amazonas 3.221.939
Minas Gerais 19.273.506
Fonte: IBGE
São séries em que a variável de estudo varia em função do fenômeno, permanecendo fixos a época
ou o tempo e a região ou local.
Freqüentemente, são usadas séries estatísticas conjugadas, onde são cruzados dois ou mais tipos de
séries; pode-se ter as conjugações geográfico-temporal (ou espaço-temporal), geográfico-
especificativa, especificativo-temporal, especificativo-geográfico-temporal etc.
Exemplos:
b) Série geográfico-específica
c) Série específico-temporal
É uma série em que o fenômeno, a época e a região permanecem fixos, porém o fenômeno pode ser
subdividido em grupos de classes que têm a finalidade de tornar mais cômodo o estudo.
Defini-se freqüência (ou freqüência simples) de um dado valor de uma variável (qualitativa ou
quantitativa) como o número de vezes que esse valor foi observado.
Denota-se a freqüência do i-ésimo valor observado por fi.
Define-se freqüência total ft como a soma de todos os elementos observados nas freqüências
simples. Sendo o n o número total de valores observados, verifica-se imediatamente que:
n
ft = ∑ fi = n
i =1
Define-se freqüência relativa fri (ou freqüência relativa simples), ou proporção, de um dado valor
de uma variável (qualitativa ou quantitativa), como o quociente de sua freqüência pelo número total
de elementos observados, da seguinte forma:
fi
fri =
n
n
Lembrando que: ∑f
i =1
i =n
Define-se freqüência absoluta acumulada F (ou Fac) como a soma das freqüências simples das
classes inferiores com a da classe considerada, da seguinte forma:
j≤k
Fj = ∑ fi
i =1
Define-se freqüência relativa acumulada Fri (ou Fra) como o quociente da freqüência absoluta
acumulada (F) pelo total de dados observados (n), ou seja:
Fi
Fri =
n
Estas freqüências são condensadas em uma única tabela, de fácil manejo, denominada Tabela de
Distribuição de Freqüências.
a) Variável qualitativa
Neste caso, usamos uma tabela simples, onde em um coluna são apresentadas as categorias, em
outra as freqüências e em uma terceira as freqüências relativas, conforme exemplo abaixo:
Título:
Freqüências
Categorias f (unidades) F fr ou ( %) Fra ou (%)
n
Total
∑f
i =1
i =n
Fonte:
Exemplo:
Exemplo usando o R:
Vamos fazer a entrada de dados pelo R e selecionar esta variável, da seguinte forma:
df %>% select(SEXO)
Então, temos aí 45 observações desta variável. Mesmo sendo uma quantidade pequena, é
muito para fazer a contagem manual. Para reduzir este tempo, vamos utilizar o R com os seguintes
comando:
Neste caso, usamos uma tabela simples, onde em uma coluna são apresentados os valores da
variável, e nas outras as freqüências, conforme exemplo abaixo:
Valor 1
Valor n
n
Total
∑f
i =1
i =n
Fonte:
Exemplo:
Seja o número de defeitos por unidade, obtidos a partir de aparelhos retirados de uma linha de
montagem:
2, 4, 2, 1, 2, 3, 1, 0, 5,1, 0, 1, 1, 2, 0, 1, 3, 0, 1, 2
Freqüências
Nr de defeitos f (unidades) F fr ou ( %) Fra ou (%)
0 4 4 20 20
1 7 11 35 55
2 5 16 25 80
3 2 18 10 90
4 1 19 5 95
5 1 20 5 100
Total 20
Exemplo usando o R:
# Cria-se um dataframe###
dat <- data.frame(Defeitos = c(2, 4, 2, 1, 2, 3, 1, 0, 5,1, 0, 1, 1, 2, 0, 1, 3, 0, 1, 2))
# Faz-se a tabela###
dat %>% count(Defeitos) %>% mutate(Defeitos = as.character(Defeitos),
f = n,
Fac = cumsum(f),
fr = round(f / sum(f) *100 , digits = 2),
Fr = cumsum(fr)
) %>% select(-n) %>%
flextable() %>% fit_to_width(max_width = 7) %>%
colformat_double(big.mark=".", decimal.mark = ",", na_str = "N/A") %>%
set_caption(("Tabela de distribuição do Nr de Defeitos"), style = "Table Caption")
2) Tabela de Freqüência Dupla Entrada para Dados não Agrupados ou não Tabulados em Classe
Este tipo de tabela se aplica quando estamos trabalhando com duas ou mais variáveis. Neste
caso, estaremos interessados em realizar uma análise conjunta das variáveis escolhidas. A tabela de
dupla entrada, tem seguinte forma:
Título:
Variável 2
Variável 1
Catg. 1 ... Catg n Total
Catg. 1
...
Catg. n
Total
Fonte:
Exemplo:
Exemplo usando o R:
Por exemplo: vamos selecionar dos dados da planilha no anexo "Dados", a variável "SEXO" e a
variável "Cor dos Olhos", da seguinte maneira:
df %>% select(SEXO, `COR DOS OLHOS`) %>% group_by(SEXO, `COR DOS OLHOS`)
%>% summarise(f = n(), .groups = 'drop') %>% pivot_wider(names_from = `COR DOS
OLHOS`, values_from = f) %>% flextable() %>% fit_to_width(max_width = 7) %>%
colformat_num(big.mark=".", decimal.mark = ",", na_str = 0) %>%
set_caption(("Tabela de Distribuição por Sexo e Cor dos Olhos"), style = "Table Caption")%>%
add_header_row( values = c("SEXO", "COR DOS OLHOS"),
colwidths = c(1, 5), top = T) %>% align(align = "center", part = "header") %>%
hline_top(part = "header", border = brd) %>%
vline(j = 1, part = "all", border = brd) %>%
merge_at(i = c(1:2),j = 1, part = "header") %>%
hline(part = "header", border = brd)
É utilizada quando temos uma variável quantitativa (contínua ou discreta em grande quantidade – n
≥ 25). Neste caso, a Tabela de Distribuição de Freqüências é composta por intervalo de classes,
freqüências, freqüências relativas, freqüências acumuladas e freqüências relativas acumuladas.
Sua construção é bastante simples e segue o roteiro abaixo:
Título:
Fri
Xi Fi fri
Ordem da Intervalos fi Freqüência
(Ponto Freqüência Freqüência
Classe i de classe Freqüência Relativa
médio) Acumulada Relativa
Acumulada
l+L
1 Linf |-- LSup f1 F1 fr1 Fr1
2
...
...
K
n n
Total ∑f
i =1
i =n ∑ fr i
i =1
Fonte:
b) Intervalos de classes
Os intervalos são compostos pelo extremos de cada classe e pela amplitude dos intervalos de classe.
Para determinada classe i, limite inferior é simbolizado por li e o limite superior por Li. De acordo
com o IBGE, as classes devem ser escritas empregando-se os símbolos "|---", "---" ou "|---|",
conforme o caso.
A amplitude dos intervalos de classes hi é o tamanho do intervalo que define a classe. Para cada
classe i , a amplitude do intervalo é simbolizado por hi e é obtido pela diferença entre os seus
limites, ou seja
hi = Li − li
d) Ponto médio de uma classe
É o ponto que divide a classe no meio. O ponto médio da classe i é simbolizado por Xi e calculado
por l + Li
Xi = i
2
O ponto médio é o valor representativo da classe.
e) Freqüências
Obs:
1) Na construção da tabela de distribuição de freqüências, podem ser usado os seguintes
símbolos:
a) "|---": indica que o intervalo irá conter o valor que se encontra à esquerda deste símbolo
(limite inferior - l), mas não irá conter o valor que está à direita (limite superior -L),
equivalente ao seguinte intervalo [a, b[;
b) "---": que indica que tanto o valor da sua esquerda (l) quando o valor da sua direita (L)
não serão incluídos no intervalo, equivalente ao intervalo ]a, b[; e
c) "|---|": que indica que ambos valores (l e L) serão incluídos no intervalo, equivalente ao
intervalo [a, b].
5) O primeiro valor a ser inserido na tabela de distribuição de freqüências deve ser o menor
valor do rol de dados, ou seja, o Xmenor;
Exemplo: sejam 25 valores da variável diâmetro de peças produzidas por uma máquina em
milímetros:
21,5 21,4 21,8 21,5 21,6
21,7 21,6 21,4 21,2 21,7
21,3 21,5 21,7 21,4 21,4
21,5 21,9 21,6 21,3 21,5
21,4 21,5 21,6 21,9 21,5
Para montar a tabela de distribuição de freqüências, devemos antes fazer o ordenamento dos dados,
da seguinte forma:
21,2 21,3 21,3 21,4 21,4
Os cálculos anteriores poderiam ser obtidos com o auxílio do R, por meio dos seguintes comandos:
df<-c(21.5, 21.4, 21.8, 21.5, 21.6, 21.7, 21.6, 21.4, 21.2, 21.7, 21.3, 21.5, 21.7, 21.4,
21.4, 21.5, 21.9, 21.6, 21.3, 21.5, 21.4, 21.5, 21.6, 21.9, 21.5)
df # verificando os resultados
[1] 21.5 21.4 21.8 21.5 21.6 21.7 21.6 21.4 21.2 21.7 21.3 21.5 21.7 21.4 21.4
[16] 21.5 21.9 21.6 21.3 21.5 21.4 21.5 21.6 21.9 21.5
###Amplitude Total###
AT = maior - menor
AT
###Nr de intervalos####
k = ceiling(1 + 3.322*log(n, 10))
k
[1] 6
####Criando os limites####
ini <- menor
br <- 0
for(i in 1:(k+1)){
br[i] <- round(ini, 3)
ini <- ini + h
}
table(Limites)
Limites
[21.2,21.32) [21.32,21.44) [21.44,21.56) [21.56,21.68) [21.68,21.8) [21.8,21.92)
3 5 7 4 3 3
glimpse(dist)
O que resulta:
Uma vez montada a tabela com as devidas freqüências, os dados podem ser representados de
diversas formas. Toda representação gráfica deve obedecer aos seguintes requisitos:
- Simplicidade;
- Clareza; e
- Veracidade.
Os principais tipos de representação gráfica são:
- Diagramas;
- Estereogramas;
- Cartogramas;
- Pictogramas.
12.1 Diagramas
Gráfico polar
Diagrama de Pontos
É útil para avaliar se há ou parece haver alguma estrutura no processo de observação dos dados.
Histograma
Além dos gráficos vistos anteriormente, são usados também os seguintes gráficos para representar
dados estatísticos:
Gráfico de linha
São amplamente empregados para representar fenômenos contínuos no tempo (série temporal)
Neste gráfico, temos no eixo x a variável tempo, que é a principal característica de uma série
temporal.
Boxplot
Este gráfico mostra como está o comportamento da distribuição dos dados. É utilizado para avaliar
a distribuição empírica do dados. Ele será detalhado mais adiante.
São ilustrações em cartas geográficas. Neste tipo de representação se relacionam os valores da série
(que é sempre geográfica ou espacial) com seus respectivos locais de ocorrência.
Ex.:
12.4 Pictogramas
Exercício: com base nas tabelas geradas anteriormente, construa os gráficos apropriados.
Essas medidas fornecem valores que caracterizam o comportamento de uma série de dados,
indicando a posição ou a localização dos dados em relação ao eixo dos valores assumidos pela
variável ou característica em estudo.
As medidas de posição ou localização são subdivididas em medidas de tendência central (média,
mediana e moda) e medidas separatrizes (quartis, quintis, decis e percentis).
São indicadores que permitem que se tenha uma primeira idéia ou resumo, do modo como se
distribuem os dados de uma variável aleatória.
Sevem para localizar a distribuição de freqüências sobre o eixo de variação da variável em questão.
∑ Xi ∑X i fi k
X = i =1
X = i =1
, onde n = ∑ f i
n n i =1
Propriedades da média
∑ ( x − X ) = 0.
i
b) a soma algébrica dos quadrados dos desvios (em relação à média) é mínima.
∑ (x − X ) ≤ ∑ (x − y ) ,
i
2
i i
2
onde X ≠ yi .
c) somando ou subtraindo uma constante a todos valores de uma variável, a média ficará acrescida
ou subtraída dessa constante.
∑ ( x + k ) = ∑ x + ∑ k = ∑ x + nk = X + k .
i i i
n n n
∑ kx i
=
k ∑ xi
= kX .
n n
Obs: além da média aritmética, temos outras médias a saber:
Quando os dados crescem de forma exponencial, a média aritmética pode não representar bem os
dados. Neste caso, utiliza-se a média geométrica.
i i
A média geométrica é menor do que ou igual à média aritmética, mas é maior do que ou igual à
média harmônica, ou seja,
H ≤G≤ X
Ë um tipo de média que é calculada com base nos valores de x elevados ao quadrado. É definida
por:
∑X ∑X
2 2
f k
RMQ = X =
2
RMQ = X = 2
, onde n = ∑ f i
n n i =1
Exemplo:
a) Valores sem freqüência ou não agrupados
x = 2, 2, 3, 5, 6, 8, 8, 8, 10
n
∑X i
2 + 2 + 3 + 5 + 6 + 8 + 8 + 8 + 10 52
X = i =1
= = = 5,78
n 9 9
9 9
= = = 4,14
0.50 + 0.50 + 0.333 + 0.200 + 0.167 + 0.125 + 0.125 + 0.125 + 0.100 2,175
#######Entrada de Dados######
x <- c(2, 2, 3, 5, 6, 8, 8, 8, 10)
#######Transformação em Dataframe####
dist <- data.frame(x)
####Cálculos####
n = length(x)
# Média Aritmética
Xbar = round(dist %>% select(x) %>% sum() / n, 2)
# Média Geométrica
Geo = round(prod(x)^(1/n),2)
# Média harmônica
# Resultados
Nr de defeitos f
0 4
1 7
2 5
3 2
4 1
5 1
Total 20
∑X i fi
X = i =1
k
∑f i =1
i
Nr de defeitos f Xf
0 4 0
1 7 7
2 5 10
3 2 6
4 1 4
5 1 5
Total 20 32
∑X i fi
32
X= i =1
= = 1,60
k
20
∑f i =1
i
Para o cálculo da Média Geométrica(G) e da Média Harmônica (H), devemos adicionar mais coluna
na tabela acima:
f
Nr de defeitos f Xf log x f*log x
x
0 4 0 - - -
1 7 7 0 0 7
2 5 10 0,301 1,505 2,500
3 2 6 0,477 0,954 0,667
4 1 4 0,602 0,602 0,250
5 1 5 0,699 0,699 0,200
Total 20 32 - 3,76 10,617
Usando as fórmulas abaixo, temos:
∑ f i log xi 3,76
G = anti log = anti log = anti log(0,188) = 10 0,188 = 1,54
n 20
n 16
H= = = 1,51
f i 10,617
∑X
i
(Obs: aqui tivemos que considerar como valores de f, os valores 7, 5, 2, 1,1, que dá um total de 16,
isto porque na primeira linha não foi possível calcular o log e a divisão f/x, em virtude do valor
x = 0; isto não acontece quando todos os valores de x são válidos, ou seja, xi ≠ 0)
####Entrada de Dados####
####Contrução da Tabela####
#Média geomátrica
Geo = round(10 ^ (round(dist %>% select(`f*log x`) %>% filter(`f*log x` != -Inf) %>% sum(),
3)/n), 2)
# Média harmônica
Har = round((n - 4) / round(dist %>% select(`f/x`) %>% select(`f/x`) %>% filter(`f/x` != Inf) %>%
sum(), 3), 2)
###Resultados####
Que gera:
∑X i i f
538,46
X = i =1
= = 21,54
k
25
∑f
i =1
i
∑ f i log xi 33,329
G = anti log = anti log = anti log(1,333) = 101,333 = 21,53
n 25
n 25
H= = = 21,53
f i 1,161
∑X
i
Usando o R, teríamos:
# Média aritmética
n <- dist %>% select(f) %>% sum()
# Média geométrica
Geo = round(10 ^ (round(dist %>% select(`f*log x`) %>% sum(), 3)/n), 2)
# Média harmônica
Har = round(n / round(dist %>% select(`f/x`) %>% select(`f/x`) %>% sum(), 3), 2)
###Resultados####
Que gera:
13.1.1.5 Mediana
PM d =
(n + 1)
I) Se n for ímpar, a mediana será o elemento de ordem
2
n n
II) Se n for par, a mediana será o valor médio entre os elementos de ordem P1M d = e P2M d = + 1
2 2
Exemplo:
n n
n par: 5, 5, 7, 9, 11, 12, 15, 18 aqui o n = 8, usando P1M d = e P2M d = + 1 temos:
2 2
8 8
P1Md = = 4 e P2Md = + 1 = 5
2 2
ou seja, vamos usar o valor que está na posição 4 e o valor que está na posição 5, que correspondem
P1Md + P 2 Md
aos valores 9 e 11. Daí, tiramos uma média destes valores que é igual a Md =
2
9 + 11
= 10 , esta é a mediana.
2
Observe que os dados devem estar em rol, ou seja devem estar ordenados em ordem de grandeza.
b) Para dados que apresentam freqüência, mas não estão agrupados em intervalos de classe, deve-se
seguir a idéia acima.
20 20
Como n é par, temos: P1Md = = 10 e P2Md = + 1 = 11
2 2
Aqui, é necessário determinar a freqüência acumulada. Logo:
Nr de defeitos f F
0 4 4
1 7 11
2 5 16
3 2 18
4 1 19
5 1 20
Total 20
Verificando na tabela, percebemos que o valor 0 se repete 4 vezes, e o valor 1 se repete 7 vezes.
Juntos temos 11 valores acumulados. Ou seja, a décima posição é ocupada pelo valor "1", e a
décima primeira é ocupada pelo valor "1", também.
P1Md + P 2 Md 1 + 1
Md = = =1
2 2
(n 2 ) − FantMd
Md = linf Md + hMd
f Md
onde:
linf Md - Limite Inferior da classe que contém a Md
Fant Md = Σf ant Md - Soma das freq. anterior à classe da Md (Freqüência acumulada anterior à
classe da Md)
fMd - Freqüência da classe da Md
hMd - Amplitude da classe da Md
Exemplo:
Existe uma forma mais rápida para este cálculo, que usa a seguinte relação:
hMd X
= Md
f Md Dif Md
Md = l inf Md + X Md
Onde:
XMd – é o valor que se quer achar
hMd – é a amplitude do intervalo da mediana
fMd – é a freqüência do intervalo da mediana
n
DifMd – é a diferença entre e a soma das freqüências anteriores ao intervalo da mediana.
2
###Cálculo da Mediana####
class.md <- (dist %>% filter(Fac < metade) %>% nrow()) + 1 # intervalo de classe da Md
freq.ant <- dist %>% select(Fac) %>% filter(Ord == (class.md - 1)) # Fac anterior ao intervalo Md
freq.md <- dist %>% select(f) %>% filter(Ord == class.md) # Freqüência do intervalo da Md
13.1.1.6 Moda
1) Moda Bruta:
Neste caso, verifica-se o intervalo com a maior freqüência. A moda bruta será o ponto médio
deste intervalo.
2) Método de King
f post
Mo = l inf Mo + hMo
f + f
ant post
Onde:
linf Mo: é o limite inferior do intervalo onde está a moda;
fant: é a freqüência do intervalo anterior ao da moda
fpost: é a freqüência do intervalo posterior ao da moda
hMo: é a amplitude do intervalo da moda
3) Método de Czuber
d1
É o método considerado mais preciso. É definido por: Mo = linf Mo + hMo
d1 + d 2
Exemplos:
Nr de defeitos f
0 4
1 7 Mo = 1
2 5
3 2
4 1
5 1
Total 20
Moda bruta
Método de King
Classes f F f post
2 |--- 4 3 3 Neste caso, usa-se a fórmula Mo = l inf Mo + h , então
f + f Mo
4 |--- 6 5 8 ant post
h = 6 + 4 2 = 6 + 8 = 6,89
6 |--- 8 7 15 f post
Mo = l inf Mo +
8 |--- 10 4 19 f + f Mo 5+ 4 9
ant post
10 |--- 12 1 20
Total 20
###Cálculo da Moda####
class.mo <- dist %>% filter(f == maior.freq) %>% select(Ord) # Intervalo da Moda
f.ant <- dist %>% filter(Ord == (class.mo[,1] - 1)) %>% select(f) # Freq. anterior a Moda
f.pos <- dist %>% filter(Ord == (class.mo[,1] + 1)) %>% select(f) # Frq. posterior a Moda
x − mo ≅ 3( x − md )
Por meio dela, é possível ter uma noção inicial de como está a distribuição dos dados, com relação à
assimetria, ou seja:
Mo < Md < X
X = Md = Mo
No caso da variável Diâmetro, temos: Média = 21,54, Mediana = 21,52, Moda = 21,49, ou seja:
Mo < Md < X
Ass. Positiva
São valores que dividem uma série ordenada de dados ou uma distribuição de freqüência em partes
iguais.
Principais separatrizes:
13.1.2.1 Quartil
Onde n é o
( n) ( n + 1) 3( n) tamanho do
PQ1 = PQ2 = PQ3 =
4 2 4 conjunto de
dados
Uma vez encontrada a posição, utilizar:
O resultado dado pela expressão acima indica a posição que estará o valor do conjunto de dados que
representa o quartil considerado.
Por exemplo: seja o seguinte rol de dados 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15
i ( n) 1(12)
Para determinar o Q1, sabendo que n = 12, faremos PQi = ⇒ PQ1 = = 3 . Então o Q1 é o
4 4
terceiro elemento do rol, no caso 5.
Qi = X ant pq + ( PQi − Pant pq )( X post pq − X ant pq ) ⇒ Q1 = 2 + (3 − 2)(5 − 2) = 2 + 3 = 5
i ( n) 3(12)
Para determinar o Q3: PQi = ⇒ PQ3 = = 9 . Então o Q3 é o nono elemento do rol, no
4 4
caso 12.
Q3 = 11 + (9 − 8)(12 − 11) = 11 + 1 = 12
Exemplo:
(n) 25
Para achar Q1, primeiro temos que achar PQ1 = = = 6,25 . Isto significa que Q1 está na posição
4 4
6,25, que se encontra no segundo intervalo, que vai de 21,32 a 21,44. A freqüência acumulada
anterior Fant = 3, a freqüência deste intervalo f = 5, e h = 0,12, pois 21,44 - 21,32 = 0,12. Então,
temos:
25%n − Fant Q1
Q1 = linf Q1 + hQ = 21,32 + 6,25 − 3 * 0,12 = 21,32 + 0,078 = 21,398 ≅ 21,40
f Q1 1 5
3( n) 3(25)
Para achar Q3, primeiro temos que achar PQ3 = 4 = 4 = 18,75 . Isto significa que Q3 está na
posição 18,75, que se encontra no quarto intervalo, que vai de 21,56 a 21,68. A freqüência
acumulada anterior Fant = 15, a freqüência deste intervalo f = 4, e h = 0,12, pois 21,68 - 21,56 =
0,12. Então, temos:
75%n − Fant Q 3
Q3 = linf Q3 + hQ = 21,56 + 18,75 − 15 * 0,12 = 21,56 + 0,1125 = 21,6725 ≅ 21,67
f Q3 3 4
Usando o R, temos:
###Cálculo da Q1####
E o valor de Q1 é 21,40
###Cálculo da Q3####
class.q3 <- (dist %>% filter(Fac < PQ3) %>% nrow()) + 1 # Intervalo de Q3
E o valor de Q3 é 21,67
Por exemplo: seja o seguinte rol de dados 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15
i ( n) 1(12)
Para determinar o K1, sabendo que n = 12, faremos PK i = ⇒ PK1 = = 2,4 . Então o K1 é
5 5
o elemento do rol, entre o da posição 2 e o da posição 3. Vamos determiná-lo:
K i = X ant pk + ( PK i − Pant pk )( X post pk − X ant pk ) ⇒ K1 = 2 + (2,4 − 2)(5 − 2) = 2 + 1,2 = 3,2
i (n) 4(12)
Para determinar o K4, sabendo que n = 12, faremos PK i = ⇒ PK 4 = = 9,6 .
5 5
(20i )% n − Fant k i
k i = linf k i + hk
f i
ki
Onde:
Linf k – Limite inferior da classe de k
Fant k – Freqüência acumulada anterior a classe de k
fk – Freqüência da classe de k
hk – Amplitude do intervalo de classe de k
i ( n) 1(25)
Para achar K1, primeiro temos que achar Pki = 5 ⇒ PK1 = 5 = 5 . Isto significa que K1 está
na posição 5, que se encontra no segundo intervalo, que vai de 21,32 a 21,44. A freqüência
acumulada anterior Fant = 3, a freqüência deste intervalo f = 5, e h = 0,12, pois 21,44 - 21,32 =
0,12. Então, temos:
PK1 − Fant k1 5 − 3
K1 = linf k 1 + hk 1 = 21,44 + * 0,12 = 21,32 + 0,048 = 21,368 ≅ 21,37
f k1 5
13.1.2.4 Decil
(10i )% n − Fant D i
Di = l inf D i + hD
f Di i
Onde:
Linf D – Limite inferior da classe de D
Fant D = ∑fant D – Soma das freqüências anteriores a classe de D(Freqüência Acumulada anterior)
fD – Freqüência da classe de D
hD – Amplitude do intervalo de classe de D
i ( n) 1(25)
Para achar D1, primeiro temos que achar PDi = ⇒ PD1 = = 2,5 . Isto significa que D1 está
10 10
na posição 2,5, que se encontra no primeiro intervalo, que vai de 21,2 a 21,32. A freqüência
acumulada anterior Fant = 0, a freqüência deste intervalo f = 3, e h = 0,12, pois 21,32 - 21,2 = 0,12.
Então, temos:
PD1 − Fant D1
D1, = linf D1 + hD1 = 21,2 + 2,5 − 0 * 0,12 = 21,2 + 0,10 = 21,30
f D1 3
i % n − F ant P
Pi = linf Pi + i h
f Pi Pi
Onde:
Linf P – Limite inferior da classe de P
Fant P – Freqüência acumulada anterior a classe de P
fP – Freqüência da classe de P
hP – Amplitude do intervalo de classe de P
Nºtel. f F fr Fr i % n − F ant P
Pi = linf Pi + i h
7|--12 3 3 10,00% 10,00% f Pi
Pi
12|--17 10 13 33,33% 43,33%
17|--22 8 21 26,67% 70,00% 20%(30) − 3
P20 = 12 + 5
22|--27 5 26 16,67% 86.67% 10
27|--32 2 28 6,67% 93.34%
32|--37 2 30 6,66% 100% 6−3
P20 = 12 + 5
30 10
P20 = 12 + 1,50
P20 = 13,50
Graficamente, temos:
k1 k2 k3 k4
Md = Q2 = D5 = P50
Após estudar as principais medidas de posição dos dados numéricos, é importante identificar e
descrevê-los em um formato resumido.
2) Boxplot
O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a distribuição empírica do dados.
Ele serve como representação gráfica do esquema de Cinco Números. a utilização do gráfico
permite avaliar a simetria e distribuição dos dados. O boxplot é formado pelo primeiro e terceiro
quartil e pela mediana. As hastes inferiores e superiores se estendem, respectivamente, do quartil
inferior até o menor valor não inferior ao limite inferior e do quartil superior até o maior valor não
superior ao limite superior. Os limites são calculados da forma abaixo:
Q3 + 1,5(Q3 − Q1 )
Maior valor
que não é
um outiler
1,5(Q3 − Q1 )
Q3
Mediana IRQ = Q3 – Q1
Q1
Menor 1,5(Q3 − Q1 )
valor que
não é um
outiler
Q1 − 1,5(Q3 − Q1 )
x 0 < Q1 − 1,5(Q3 − Q1 )
ou
x 0 > Q1 + 1,5(Q3 − Q1 )
Uma vez identificado o outlier, o pesquisador poderá eliminá-lo, caso seja apenas um valor, ou
trocá-los pela média da variável de estudo, calculada sem os referidos valores. Porém, deve-se
investigar as razões que levaram ao surgimento destes valores.
Como exemplo, temos os mesmos valores apresentados para o cálculo de Q1 e Q3, ou seja:
1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15. O valor de Q1 para estes dados foi igual a 5 e de Q3 foi igual
a 12. A mediana foi igual a 9. O boxplot para estes dados fica assim:
###Box-plot####
São medidas que traduzem a variação de um conjunto de dados em torno da média, ou seja, da
maior ou menor variabilidade dos resultados obtidos. Permitem identificar até que ponto os
resultados se concentram ou não ao redor da tendência central de um conjunto de observações.
Quanto maior for a dispersão, menor é a concentração e vice-versa. As medidas de dispersão podem
ser absolutas e relativas.
R = X max − X min
∑ (X − X) ∑ (X − X ) fi
n n
2 2
i i
s2 = i =1
s2 = i =1
n −1 n −1
Temos:
13.2.1.5 Desvio-padrão
s = s2
O desvio-padrão se expressa na mesma unidade da variável, sendo, por isso, de maior interesse que
a variância nas aplicações práticas.
É comum apresentar a média e o desvio-padrão para indicar a amplitude da dispersão da amostra,
da seguinte forma:
X ±s
∑ Xi − X ∑X i − X fi
DAM = i =1
DAM = i =1
n n
4 2 6
DMA = s DQ = s DMA = DQ
5 3 5
Existe uma escala para a verificação do grau de dispersão, em função do coeficiente de variação:
s
CVt = ⋅ 100
Md
Q3 − Q1
C Vq = ⋅ 100
Q3 + Q1
Q3 − Q1
DQR = 2 ⋅ 100 = Q3 − Q1 ⋅ 100
Md 2 Md
∑X i −X
22,22
DAM = i =1
= = 2,469
n 9
∑ (X − X)
n
2
i
69,556
s2 = i =1
= = 8,6945
n −1 9 −1
s = s 2 = 8.6945 = 2,9486
Q3 − Q1 8 − 3
DQ = = = 2,50
2 2
s 2,9486
CV = 100 = 100 = 51,0138%
X 5,78
s 2,9486
CV t = ⋅100 = 100 = 49,1433%
Md 6
Q3 − Q1 8−3
CV q = ⋅ 100 = 100 = 45,45%
Q3 + Q1 8+3
Q3 − Q1
DQR = 2 ⋅ 100 = Q3 − Q1 ⋅ 100 = 8 − 3 100 = 38,07%
Md 2 Md 2*6
Com base nos cálculos anteriores para médias, moda e mediana, usando a tabela abaixo, temos:
Devemos acrescentar algumas colunas após a última coluna f/x. Para efeito didático, vamos retirar
as colunas log x, f*log x e f/x, e em seu lugar vamos digitar outras colunas. Sabendo que
Desvio = X i − X e fazendo os cálculos, temos:
∑X i −X *f
3,792
DAM = i =1
= = 0,16
n 25
∑ (X − X) * f
n
2
i
0,8271
s2 = i =1
= = 0,0345
n −1 25 − 1
s = s 2 = 0,0345 = 0,1857
Q3 − Q1 21,67 − 21,40
DQ = = = 0,137
2 2
s 0,204
CV = 100 = 100 = 0,95%
X 21,54
s 0,204
CV t = ⋅ 100 = 100 = 0,95%
Md 21,52
Q3 − Q1 21,67 − 21,40
CV q = ⋅ 100 = 100 = 0,64%
Q3 + Q1 21,67 + 21,40
Q3 − Q1
DQR = 2 ⋅ 100 = Q3 − Q1 ⋅ 100 = 21,67 − 21,40 100 = 0,64%
Md 2Md 2 * 21,52
n
∑ X fi −
2 i =1
n
s 2 = i =1 s 2 = i =1
n −1 n −1
2
n
∑ Xi
(52) 2
n
∑ X 2 − i =1 370 −
s 2 = i =1
n
= 9 = 370 − 300,4444 = 8,6945
n −1 9 −1 8
2
n
∑ X i f i
(538,46) 2
n
∑ X fi −
2 i =1
n
11598,394 −
25 11598,394 − 11597,5669
s 2 = i =1 = = = 0,0345
n −1 25 − 1 24
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 72
13.3 Momentos de uma distribuição
São quantidades numéricas ou valores de uma distribuição de uma variável X, usadas para a
caracterização de determinadas medidas, tais como a média aritmética e a variância, além de
medidas do formato da distribuição como a assimetria e a curtose.
São determinados por meio do valor esperado (média) das potencias de X. As esperanças das
sucessivas potencias de X constituem o conceito de momentos dessa variável aleatória.
Momento de ordem r
∑ X ir ∑X i
r
fi
mr = i =1
mr = i =1
n n
∑ (X − X) ∑ (X − X ) fi
n n
r r
i i
µr = i =1
µr = i =1
n n
∑ Xi ∑X i fi
m1 = i =1
m1 = i =1
n n
∑ (X i − X) ∑ (X − X ) fi
n n
2 2
i
µ2 = i =1
µ2 = i =1
n n
∑ (X − X) ∑ (X − X ) fi
n n
3 3
i i
µ3 = i =1
µ3 = i =1
n n
∑ (X − X) ∑ (X − X ) fi
n n
4 4
i i
µ4 = i =1
µ4 = i =1
n n
µ 2 = m2 − m12
µ3 = m3 − 3m1m2 + 2m13
µ 4 = m 4 − 4 m1 m 3 + 6 m12 m 2 − 3 m14
13.4.1 Assimetria
Pelo critério de Pearson, à medida que a distribuição deixa de ser simétrica, a média, a moda e a
mediana vão se afastando, aumentando cada vez mais a diferença existente entre elas.
3( X − Md )
As = Segundo coeficiente de assimetria de Pearson
s
Podemos verificar a assimetria de uma distribuição comparando os resultados com:
Pelo critério de Bowley, à medida que a distribuição deixa de ser simétrica, os quartis deixam de
serem eqüidistantes da mediana.
O critério de Bowley despreza 50% das ocorrências. Para evitar isso, Kelley aconselha o uso de
percentis eqüidistantes da mediana, tais como o P10 e P90, surgindo daí a seguinte fórmula:
∑ (X −X) ∑ (X − X ) fi
n n
2 2
i i
µ2 = i =1
µ2 = i =1
n n
∑ (X − X) ∑ (X − X ) fi
n n
3 3
i i
µ3 = i =1
µ3 = i =1
n n
n µ3
α3 = quando n < 25
(n − 1)(n − 2) ( µ2 )
3
µ3
α3 = , quando n ≥ 25
µ 23
Simétrica
Md < X
Ass. Positiva
Ass. Negativa
13.4.2 Curtose
Um dos coeficientes mais utilizados para medir o grau de achatamento ou curtose de uma
distribuição. É calculado a partir do intervalo interquartil, além dos percentis P10 e P90, da seguinte
forma:
Obs: a fórmula acima também pode ser escrita em função dos Decis 1 e 9, uma vez que D1 = P10 e
D9 = P90. Então a expressão fica:
Q3 − Q1
2 Q3 − Q1
k= =
D9 − D1 2( D9 − D1 )
∑ (X i − X) ∑ (X − X ) fi
n n
2 2
i
µ2 = i =1
µ2 = i =1
n n
∑ (X − X) ∑ (X − X ) fi
n n
4 4
i i
µ4 = i =1
µ4 = i =1
n n
n(n + 1) µ4 3(n − 1) 2
α4 = − quando n < 25
(n − 1)(n − 2)(n − 3) µ 22 (n − 2)(n − 3)
µ4
α4 = − 3 , quando n ≥ 25
µ 22
Leptocúrtica
Platicúrtica
∑ (X − X)
n
2
i
69,5556
µ2 = i =1
= = 7,7284
n 9
∑ (X − X)
n
3
i
− 21,5772
µ3 = i =1
= = −2,3975
n 9
O Coeficiente de Assimetria fica:
n µ3 9 − 2,3975
α3 = = = −0,0166
(n − 1)(n − 2) ( µ2 )
3
( )
(9 − 1)(9 − 2) 7,7284 3
Ou seja, temos uma Assimetria Negativa
E o de Curtose fica:
∑ (X − X)
n
2
i
69,5556
µ2 = i =1
= = 7,7284
n 9
∑ (X −X)
n
4
i
858,2496
µ4 = i =1
= = 95,3611
n 9
Apesar de não haver freqüências neste conjunto de dados, e também por ser de uma
quantidade que não seja possível elaborar uma Tabela de Distribuição de Freqüências, é possível
identificar a Assimetria por meio do uso de Box-plot:
Observe que o traço central é a Mediana. A distância dele até o menor valor (lado esquerdo)
é maior que a distância até o maior valor (lado direito) indicando assim a Assimetria Negativa.
A curtose, contudo, fica mais difícil de identificar graficamente, pois não há como elaborar
um histograma com estes dados.
Contudo, forçando um pouco o R, temos:
∑ (X − X) f
n
2
i
0,8272
µ2 = i =1
= = 0,0331
n 25
∑ (X − X) f
n
3
i
0,0376
µ3 = i =1
= = 0,0015
n 25
O Coeficiente de Assimetria fica:
µ3 0,0015
α3 = = = 0,1360
(µ) ( 2
3
0,0331 )3
E o de Curtose fica:
∑ (X − X) f
n
2
i
0,8272
µ2 = i =1
= = 0,0331
n 25
∑ (X −X) f
n
4
i
0,0582
µ4 = i =1
= = 0,0023
n 25
µ4
α4 = − 3 = 2,0993 − 3 = −0,9007 Ou seja, temos uma distribuição platicúrtica.
µ 22
Mo < Md < X
Ass. Positiva
14.1 Introdução
População Amostra
Antes de iniciar qualquer análise dos dados através dos métodos da Estatística Indutiva, é
preciso organizar os dados da amostra, o que é feito com técnicas de Estatística
Descritiva.
Uma outra ferramenta utilizada em Estatística Indutiva, e que surge paralelamente, é a
amostragem, onde certos cuidados básicos devem ser tomados no processo de obtenção
das amostras.
Cálculo das
Estatística
Probabilidades
Descritiva
Estatística
Indutiva
14.2 Amostragem
Amostragem probabilística
Amostragem não-probabilística
• Amostragem de Conveniência
• Amostragem por Julgamentos
• Amostragem por Cotas
• Bola de Neve
Amostras
População
µˆ1
σˆ12
pˆ 1
μ
µˆ k
σ² σˆ k 2
π p̂k
µˆ 3
σˆ 3 2
µˆ 2
pˆ 3
σˆ 2 2
pˆ 2
Seja uma população de tamanho N e X uma variável aleatória dessa população com E[X]
= μ e Var[X] = σ², logo X~N(μ,σ²).
Seja uma amostra aleatória (X1, X2,...,Xn) retirada desta população, onde se tem:
∑X i
X= i =1
n
Podemos calcular E [X ] e Var [X ] da seguinte forma:
n
∑ Xi
E [X ] = E i =1 = 1 E X = 1 E [ X ] = 1 nµ = µ
n n
n n ∑ i =1
i ∑ i n
n i =1
Seja uma população de tamanho N e X uma variável aleatória dessa população com E[X]
= μ e Var[X] = σ², logo X~N(μ,σ²).
Seja uma amostra aleatória (X1, X2,...,Xn) retirada desta população, onde se tem:
∑ (X − X)
n
2
i
S2 = i =1
n −1
[ ] [ ]
Podemos calcular E S 2 e Var S 2 , mas primeiro devemos saber que:
X −µ
a) Se X i ≈ N ( µ , σ 2 ) , então z = i tem distribuição Normal com N(0, 1), ou seja:
σ
X − µ E( X i ) − µ µ − µ
E ( z) = E i = = =0 e
σ σ σ
X −µ 1
= 2 [Var ( X i ) − Var ( µ )] = 2 [σ − 0] = 1 ;
1
Var ( z ) = Var i 2
σ σ σ
b) A distribuição de Qui-quadrado, representada por χ 2 , tem E (χ n2 ) = n e Var (χ n2 ) = 2n ,
n
pois: χ n2 = ∑ z i2 . Aplicando o valor esperado temos:
i =1
n n n n
E ( χ n2 ) = E ∑ z i2 = ∑ E ( z i2 ) = ∑ Var ( z i ) = ∑1 = n . Aqui, devemos recordar que:
i =1 i =1 i =1 i =1
( )
Var ( X ) = E X − ( E ( X )) . Substituindo por z, temos:
2 2
Var ( z ) = E ( z 2 ) − ( E ( z )) 2 = E ( z 2 ) − 0 = E ( z 2 )
n
Xi − µ
Então, vimos que χ n2 = ∑ z i2 . Mas Sabemos que z = , então:
i =1 σ
2
n n
Xi − µ
χ n2 = ∑ z i2 = ∑ . Incluindo neste último termo (− X + X ) , temos:
i =1 i =1 σ
2 2
n
Xi − X + X − µ
n n
(X i − X ) + (X − µ)
χ = ∑ z = ∑
2
2
= ∑ . Aplicando o quadrado, nos
σ σ
n i
i =1 i =1 i =1
termos do somatório, temos:
2
(X − X ) + (X − µ)
n n
( X − X ) 2 + 2( X i − X )( X − µ ) + ( X − µ ) 2
χ = ∑ i
2
= ∑ i . Aplicando o
σ σ2
n
i =1 i =1
somatório, temos:
n n n
∑ ( X i − X ) 2 + 2( X − µ ) ∑ ( X i − X ) + ∑ ( X − µ ) 2
χ n2 = i =1 i =1 i =1 . O termo do meio fica zerado pois
σ 2
n
∑(X
i =1
i − X ) = 0 , de acordo com as propriedades da média. Então:
n n
n n
n
∑ i ( X − X ) 2
+ ∑ (X − µ)2 ∑ i ( X − X ) 2
∑ ( X − µ)2 ∑ ( X i − X )2 2
n
X −µ
χ n2 = i =1 i =1 = i =1 + i =1 = i =1 + ∑
σ 2 σ 2
σ2 σ 2
i =1 σ
∑ (X − X)
2
(n − 1) S 2
=
i
σ2 σ2
2
2 2
X −µ
n
X −µ X −µ
Então, o termo ∑ = n = = z 2 , de acordo com a distribuição
i =1 σ σ σ
n
amostral da média, visto anteriormente.
Z 2 ≈ χ 12
n
∑ (X i − X )2 2
n
X − µ (n − 1) S 2
χ n2 = i =1 + ∑ = + χ 12
σ2 i =1 σ σ 2
(n − 1) S 2
Que resulta em: = χ n2 − χ 12 = χ n2−1 , pois a soma de variáveis aleatórias Qui-
σ 2
quadrado com 1, 2,...,n graus de liberdade é uma variável aleatória Qui-quadrado com a
soma dos graus de liberdade, ou seja:
sendo χ 12 , χ 22 ,..., χ n2 , todas Qui-quadrado, fazendo Y = χ12 + χ 22 + ... + χ n2 , então Y = χ 2n .
∑i
i =1
(n − 1) S 2
Ou seja,
σ 2
( ) (
≈ χ n2−1 , onde E χ n2−1 = n − 1 e Var χ n2−1 = 2(n − 1) , pois: )
( ) ( ) ( )
E χ n2−1 = E χ n2 − E χ12 = n − E ( Z 2 ) = n − Var ( Z 2 ) = n − 1
Var (χ ) = Var (χ ) − Var (χ ) = 2n − Var ( Z
2
n −1
2
n 1
2 2
[ (
) = 2n − E ( Z 4 ) − E ( Z 2 ) ] = 2n − [3 − 1] = 2n − 2 = 2(n − 1)
2
Então: σ2
S2 = χ n2−1
n −1
Logo:
σ2 2 σ2 σ2
E ( S 2 ) = E χ n−1 = E χ n2−1 = (
(n − 1) = σ 2 )
n −1 n −1 n −1
σ2 2 σ4 σ4 2σ 4
Var ( S 2 ) = Var χ n −1 = Var ( χ 2
n −1 ) = [2 ( n − 1) ] =
n −1 (n − 1) (n − 1) 2 n −1
2
2σ 4
Também podemos demonstrar que E ( S ) = σ 2 2
e Var ( S ) =
2
, da seguinte forma:
n −1
∑ (X − X)
n
2
i
σ2
Sabendo que S 2 = i =1
e que E ( X ) = µ e Var ( X ) = , e lembrando que
n −1 n
V ( X ) = E ( X ) − ( E ( X )) , temos que aplicando E em S2, temos:
2 2
n 2 n
( n
)
E ∑ (X i − X ) E ∑ X i2 − 2 X i X − X 2 E ∑ X i2 − 2 X ∑ X i + ∑ X 2
n n
E ( S 2 ) = i =1 = i =1 = i =1 i =1 i =1
n −1 n −1 n −1
∑X i n
Só que X = i =1
n
, que resulta em ∑X
i =1
i = nX . Substituindo, temos:
n n n
n n
E ∑ X i2 − 2 X ∑ X i + ∑ X 2 E ∑ X i2 − 2 XnX + nX 2 E ∑ X i2 − nX 2
E ( S 2 ) = i =1 i =1 i =1 = i =1 = i =1 =
n −1 n −1 n −1
n
∑ E( X i
2
) − nE ( X 2 )
= i =1
n −1
Lembrando V ( X ) = E ( X 2 ) − ( E ( X )) 2 , então, E ( X 2 ) = V ( X ) + ( E ( X )) 2 = σ 2 + µ 2 . Para X ,
σ2
temos: V ( X ) = E ( X 2 ) − ( E ( X )) 2 , logo: E ( X 2 ) = V ( X ) + ( E ( X )) 2 = + µ 2 . Substituindo,
n
temos:
n σ 2 n
∑ σ + µ
∑ E ( X i2 ) − nE ( X 2 )
( 2 2
) − n + µ
= (nσ + nµ ) − (σ + nµ )
2 2 2 2
E ( S 2 ) = i =1 =
i =1 n
n −1 n −1 n −1
(nσ + nµ ) − (σ + nµ ) nσ + nµ − σ − nµ
2 2 2 2 2 2 2 2
nσ − σ
2 2
(n − 1)σ 2
E(S ) =
2
= = = =σ 2
n −1 n −1 n −1 n −1
∑ (X − X) ∑ (X −µ +µ − X) ∑ (( X − µ ) − ( X − µ ))
n n n
2 2 2
i i i
S2 = i =1
= i =1
= i =1
=
n −1 n −1 n −1
∑ (( X ) ∑(X
n n n
i − µ ) 2 − 2( X i − µ )( X − µ ) + ( X − µ ) 2 i − µ ) 2 − 2( X − µ ) ∑ ( X i − µ ) + n ( X − µ ) 2
= i =1
= i =i i =1
=
n −1 n −1
n n n
n n
∑ ( X i − µ ) 2 − 2( X − µ ) ∑ ( X i − µ ) + n ( X − µ ) 2 ∑ (X
i =i
i − µ ) 2 − 2( X − µ ) ∑ X i + ∑ µ + n ( X − µ ) 2
i =1 i =1
= i =i i =1
= =
n −1 n −1
∑ ( X i − µ ) 2 −2( X − µ )(nX + nµ ) + n( X − µ ) 2
n n
∑(X i − µ ) 2 − 2n ( X − µ ) 2 + n( X − µ ) 2
= i =i
= i =i
n −1 n −1
n
∑(X i − µ ) 2 −n( X − µ ) 2
S2 = i =i
n −1
σ2
multiplicando por , temos:
σ2
n
∑(X i − µ ) 2 −n( X − µ ) 2
σ2 σ 2 n Xi − µ X − µ)
2 2
S = 2 i =i
× 2 = ∑ − n
n −1 σ n − 1 i =1 σ σ
σ2 n 2 2 σ4 n 2 2
Var ( S 2 ) = Var
n − 1
∑ Z i − Z
=
( n − 1) 2 Var
∑ Z i
− Var ( Z )
i =1 i = 1
n
i =1
i =1
n n
i =1
[ 2
]
Var ∑ Z i2 = ∑ Var ( Z i2 ) = ∑ E ( Z i4 ) − (E ( Z i2 ) = ∑ [3 − 1] =∑ 2 = 2n
n
i =1
n
i =1
[ (
Var ( Z ) = E ( Z ) − E ( Z = 3 − 1 = 2
2 4 2
)]
Lembrando que, para n ∈ ℵ , temos:
- E ( z 2 n +1 ) = 0
(2n)!
- E ( z 2n ) =
n!2 n
4! 4.3.2!
então para E ( z i4 ) = 2
= = 3 , visto que 2n = 4 →n = 2
2!2 2!4
2! 2 * 1
Para E ( z i2 ) = 1 = = 1 , visto que 2n = 2 → n = 1
1!2 2
Então:
σ4 n 2 2 σ4 2σ 4 2σ 4
Var ( S 2 ) = Var ∑ i
Z − Var ( Z ) = [2 n − 2 ] = ( n − 1) =
(n − 1) 2 i =1 (n − 1)
2
(n − 1) 2 ( n − 1)
Com isto, podemos dizer que a variância amostral é um estimador justo e consistente da
variância populacional
Seja uma população de tamanho N e X uma variável aleatória dessa população com E[X]
= π e Var[X] = π(1-π), logo X~Be(π, π(1-π),).
Seja uma amostra aleatória (X1, X2,...,Xn) retirada desta população, onde se tem:
n
Y = ∑ X i e Y ≈ Bin(n, π ) , logo E (Y ) = nπ e V (Y ) = nπ (1 − π )
i =1
Então, Y conta o número de vezes que um certo evento de interesse A ocorre na amostra.
Assim:
Y
p=
n
Y 1 1
E [ p ] = E = E [Y ] = nπ = π
n n n
Y 1 1 π (1 − π )
Var [ p ] = Var = 2 Var [Y ] = 2 n[π (1 − π )] =
n n n n
Com isto, podemos dizer que a proporção amostral é um estimador justo e consistente da
proporção populacional
Resumindo:
µ
n
∑X i
σ2
X= i =1
n
n
∑ (X −X)
n
2
i σ2 2σ 4
S2 = i =1
n −1
n −1
nS π π (1 − π )
p=
n n
14.3.4 Erro-padrão
Erro-padrão - EP
Estimador
n
∑X i σ
X= i =1
n
n
∑ (X −X)
n
2
i 2
S2 = i =1 σ2
n −1 n −1
p=
nS π (1 − π )
n n
EP
Estimador Erro-padrão - EP
estimado
n
∑X i σ S
X= i =1
n n
n
∑ (X −X)
n
2
2 2
i
σ2 S2
S2 = i =1
n −1 n −1
n −1
p=
nS π (1 − π ) p(1 − p )
n n n
a) Estimador ( θˆ)
Chamamos estimador à quantidade, calculada em função dos elementos da amostra, que será usada
no processo de estimação do parâmetro desejado. O estimador é, como vemos, uma estatística..
Será, portanto, uma variável aleatória caracterizada por uma distribuição de probabilidade e seus
respectivos parâmetros próprios.
b) Estimativa
a) Justeza ou não-tendenciosidade
E (θˆ) = θ
Isso significa que os valores aleatórios de θˆ ocorrerão em torno do valor do parâmetro θ , o que é,
obviamente, desejável.
b) Consistência
(
lim P θ − θˆ ≥ ε = 0
n →∞
)
Vemos que, para estimadores justos e consistentes, podemos obter estimativas tão próximas quanto
desejamos do valor real do parâmetro, desde que aumentemos suficientemente o tamanho da
amostra. Nessas condições, supondo o caso-limite de uma amostra infinitamente grande, a
estimativa obtida iria coincidir exatamente com o parâmetro estimado.
c) Eficiência
Dados dois estimadores, θˆ1 e θˆ2 , a serem usados na estimação de um mesmo parâmetro θ ,
diremos que θˆ é mais eficiente que θˆ como estimador de θ se para o mesmo tamanho de amostra,
1 2
( 2
)
2
(
E θˆ1 − θ < E θˆ2 − θ .
)
Se θˆ1 e θˆ2 forem estimadores justos de θ , essa condição indicará que a variância de θˆ1 é menor que
a variância de θˆ . 2
Se θˆ1 é mais eficiente que θˆ2 como estimador do parâmetro θ , podemos definir a relação:
[
E (θ1 − θ )
2
] <1
E [(θ −θ ) ]
2
2
como sendo a eficiência de θˆ2 em relação a θˆ1 como estimador de θ . Se os estimadores θˆ1 e
θˆ forem ambos justos, a eficiência relativa se reduzirá ao quociente das respectivas variâncias.
2
Uma medida absoluta da eficiência pode ser conseguida por meio da comparação com o estimador
mais eficiente do parâmetro em questão. Logicamente, o estimador mais eficiente possível terá
eficiência absoluta igual a 1, ou 100 %. Tal estimador será dito simplesmente "eficiente".
d) Suficiência
(a) E( Θ̂ ) = Θ .
n
ˆ = a X . Isto é, Θ̂ é uma função linear da amostra.
b) Θ ∑ i i
i =1
ˆ ) ≤ V (Θ ∗ ) , onde Θ * é qualquer outra estimativa de Θ que satisfaça a (a) e (b), acima.
(c) V (Θ
Já foi visto que, na prática, usamos uma estatística ( θˆ ) para se estimar um parâmetro populacional
( θ ), que em geral é desconhecido. Ou seja, realizamos um processo de amostragem, que significa
retirar uma amostra da população de estudo. Ao fazer isto, estamos cometendo um erro, chamado de
erro amostral - ε.
O erro amostral (ε) é expresso na unidade da variável de estudo. Ele representa a máxima diferença
admitida entre o verdadeiro parâmetro populacional (θ) e o seu estimador ( θˆ ), conhecido como
estatística. Então:
θ − θˆ ≤ ε
Se θˆ é um estimador consistente, então:
(
lim P θ − θˆ ≥ ε = 0
n →∞
)
Digamos que esta probabilidade P seja igual a α, então, para uma determinada amostra
de tamanho n, então:
(
P θ − θˆ > ε = α )
O valor α será a probabilidade de erro de estimação, isto é, a probabilidade de errarmos
ao afirmar que a distância entre o valor do parâmetro populacional e o seu estimador, ou
seja o desvio, seja maior que ε, normalmente chamada de nível de significância.
P(θˆ − ε ≤ θ ≤ θˆ + ε ) = 1 − α
σ X −µ
Sabendo que X ≈ N µ , , então Z = . Aqui o estimador é X e o parâmetro
n σ
n
verdadeiro é µ, logo ε = X − µ .
X −µ σ
Z= →ε = Z .
σ n
n
σ σ
IC X − Z ≤µ ≤ X +Z = 1 − α
n n
σ2 Z
Inicialmente, devemos levar em consideração que S 2 = χ n2−1 e que t = tem
n −1 χ n2
n
distribuição t-student com n graus de liberdade.
X −µ
Mas, sabemos que Z = . Fazendo algumas operações, temos:
σ
n
X −µ X −µ X −µ Z X −µ X −µ S
Z= = = → = → t n −1 = → ε = t n −1
σ σ2 S 2 (n − 1) χ n2−1 S2 S n
n n nχ n2−1 n −1 n n
S S
IC X − t n −1 ≤ µ ≤ X + t n−1 = 1 − α
n n
S S
IC X − Z ≤µ ≤ X +Z = 1 − α
n n
Com Z tabelado em função de α/2.
σ2
S2 = χ n2−1
n −1
S 2 (n − 1)
= χ n2−1
σ2
O intervalo fica da seguinte forma:
( )
IC χ 12 ≤ χ 2 ≤ χ 22 = 1 − α
Com algumas adaptações:
S 2 (n − 1) S 2 (n − 1)
IC ≤ σ 2
≤ = 1−α
χ2 χ 2
Sup inf
Onde: χ Inf
2
= χ (21−α ) e χ Sup
2
= χα2
2 2
IC S
(n − 1) ≤ σ ≤S
(n − 1) = 1 − α
χ Sup
2
χ Inf
2
Onde: χ Inf
2
= χ (21−α ) e χ Sup
2
= χα2
2 2
p (1 − p )
Neste caso, sabendo que pˆ ≈ N p, , temos:
n
pˆ − p
Z=
p (1 − p )
n
p (1 − p ) p (1 − p )
IC pˆ − Z ≤ p ≤ pˆ + Z = 1−α
n n
Aqui, Z é tabelado em função de α/2.
Obs: Quando o produto p(1-p) for menor ou igual a 1 , temos o intervalo de confiança
4
conservativo para p ao nível de 1 - α, dado por:
1 1
IC pˆ − Z ≤ p ≤ pˆ + Z = 1 − α
2 n 2 n
Resumidamente, temos
p (1 − p ) p (1 − p )
IC pˆ − Z ≤ p ≤ pˆ + Z = 1−α
n n
Proporção populacional ( p ) 1 1
IC pˆ − Z ≤ p ≤ pˆ + Z = 1 − α , quando
2 n 2 n
1
p (1 − p ) ≤
4
σ σ
Seja X ≈ N ( µ X , σ X2 ) e Y ≈ N ( µY , σ Y2 ) . Desta forma, X ≈ N µ X , X e Y ≈ N µ Y , Y .
nX nY
Fazendo a diferença X − Y e aplicando o valor esperado "E" e a variância "Var", temos:
σ2 σ2
Então X − Y ≈ N µ X − µY , X + Y2
n X nY
( X − Y ) − ( µ X − µY )
Assim, Z α = ≈ N (0,1)
2 σ X2 σ Y2
+
n X nY2
O intervalos de confiança ficaria assim:
( X − Y ) − ( µ X − µY )
P − Z α ≤ ≤ Zα = 1−α
2 σ X2 σ Y2 2
+ 2
n X nY
Que nos dá:
σ X2 σ Y2 σ X2 σ Y2
P ( X − Y ) − Z α + 2 ≤ ( µ X − µY ) ≤ ( X − Y ) + Z α + 2 = 1−α
n n n nY
2 X Y 2 X
Então:
( X − Y ) − (µ X − µY ) ( X − Y ) − (µ X − µY )
Zα = = ≈ N (0,1)
2 1 1 1 1
σ 2 + 2 σ + 2
n X nY n X nY
Logo:
1 1 1 1
P ( X − Y ) − Z α σ + 2 ≤ ( µ X − µY ) ≤ ( X − Y ) + Z α σ + 2 = 1 − α
2
n X nY 2
n X nY
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 100
2º Caso - Variâncias populacionais desconhecidas, mas supostas iguais
σ
Seja agora X ≈ N (µ X ,σ 2 ) e Y ≈ N (µY ,σ 2 ) . Desta forma, X ≈ N µX , e
n X
σ
Y ≈ N µY , . Fazendo a diferença X − Y e aplicando o valor esperado "E", temos:
n
Y
∑ Xi
− E ∑ i = ∑
Y E ( X i ) ∑ E (Yi ) n X µ X nY µY
E ( X − Y ) = E ( X ) − E (Y ) = E n − = − = µ X − µY
n X Y n X nY n X n Y
Com relação à variância, neste caso, temos as variâncias amostrais S X2 e S Y2 que são,
ambas, um estimador não enviesado para σ 2 .
Quando temos k grupos, temos S i2 , com i = 1 a k variâncias amostrais e ni observações,
podemos calcular uma variância chamada de "Variância pooled", com símbolo S p2 , por
meio da seguinte expressão:
k
∑ (n i − 1) S i2
S p2 = i =1
k
∑ (ni =1
i − 1)
Este termo "pooled" vem do inglês "pool" que pode ser traduzido como "quantidade" ou
"conjunto".
∑ (ni − 1) ∑ (n i − 1)
i =1 i =1
Como
σ2 2 σ2 σ2
E(S ) = E
2
χ n−1 =
E χ n−1 =
2
( )
(n − 1) = σ 2 , então:
n −1 n −1 n −1
k k k
∑ (ni − 1) S i2 ∑ (ni − 1) E ( S i2 ) ∑ (ni − 1)σ 2
E ( S p2 ) = E i =1k = i =1 = i =1 k =σ 2
k
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 101
1 1 1 1 (n X − 1) S X2 + (nY − 1) S Y2
Var ( X − Y ) = σ 2 + 2 , onde S p =
2
+ 2 = S p2
n X nY n X nY n X + nY − 2
1 1
Assim: X − Y ≈ N µ X − µ Y , S p2 + 2
n X nY
Então:
( X − Y ) − (µ X − µY ) ( X − Y ) − ( µ X − µY )
tα = = ≈ t n X + nY − 2
2 1 1 1 1
S p2 + Sp +
n X nY n X nY
Logo:
1 1 1 1
P ( X − Y ) − t α Sp + ≤ (µ X − µY ) ≤ ( X − Y ) + t α Sp + = 1−α
n X + nU − 2 ; n n n X + nU − 2 ; n n
2 X Y 2 X Y
S X2 S Y2 S X2 S Y2
P ( X − Y ) − t α + ≤ (µ X − µY ) ≤ ( X − Y ) + t α + = 1−α
w; n X nY w; n X nY
2 2
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 102
4º Caso - Amostras emparelhadas
∑d
i =1
i
∑d i
Xd = i =1
n
Uma estimativa da variabilidade da diferença é dada por:
n n
∑ (d i − d ) 2 ∑d i
2
− nd 2
S d2 = i =1
= i =1
n −1 n −1
Se X A ~ N ( µ A , σ A2 ) e X D ~ N ( µ D , σ D2 ) , então:
n n n
∑ d i ∑ E (d i ) ∑ E ( X A − X D ) nE ( X − X )
E[ X d ] = E i =1 = i =1 = i =1 = A D
= E( X A − X D ) = E( X A ) − E( X D ) =
n n n n
E[ X d ] = E ( X A ) − E ( X D ) = µ A − µ D = µ d
n n n
∑ i ∑
d Var ( d i ) ∑ Var ( X A − X D )
nVar ( X A − X D ) Var ( X A − X D )
i =1 i =1 i =1
Var[ X d ] = Var = 2
= 2
= = =
n n n n2 n
Var ( X A ) Var ( X D ) σ A2 + σ D2 − 2Cov ( X A X D ) σ A2 + σ B2 − 2 ρσ Aσ D
Var[ X d ] = + = =
n n n n
σ + σ B − 2 ρσ Aσ D σ 2 + σ 2 − 2 ρσ 2 2σ 2 (1 − ρ )
2 2
Supondo σ A2 = σ D2 = σ 2 , temos: Var[ X d ] = A = = ,
n n n
onde ρ é o coeficiente de correlação linear. Desta forma ficaria um pouco complicado de
σ2
demonstrar. Então, assume-se que X d ~ N µ d , d , logo:
n
X − µd
Zα = d ~ N (0,1)
2
σd
n
Desta forma, para n ≥ 30, temos:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 103
σ σ
P X d − Z α d ≤ µ d ≤ X d + Z α d = 1 − α
2 n 2 n
Contudo, normalmente, não conhecemos σ d2 . Um estimador muito utilizado para aquele
parâmetro populacional é a variância amostral, dada por:
n n
∑ (d i − d )2 ∑d i
2
− kd 2
S d2 = i =1
= i =1
n −1 n −1
S 2
Com isto, temos: X d ~ N µ d , d
, então:
n
X d − µd
tα = ~ t n −1
2
Sd
n
Assim:
S S
P X d − t α d ≤ µ d ≤ X d − t α d = 1 − α
2 n 2 n
Temos:
E ( pˆ X − pˆ Y ) = E ( pˆ X ) − E ( pˆ Y ) = p X − pY
p (1 − p X ) pY (1 − pY )
Var ( pˆ X − pˆ Y ) = Var ( pˆ X ) + Var ( pˆ Y ) = X +
nX nY
p (1 − p X ) pY (1 − pY )
Logo: pˆ X − pˆ Y ≈ N p X − pY , X +
nX nY
( pˆ X − pˆ Y ) − ( p X − pY )
Assim: Z α = ≈ N (0,1)
p (1 − p ) p (1 − p )
2 X X
+ Y Y
nX nY
Então:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 104
p X (1 − p X ) pY (1 − pY )
P ( pˆ X − pˆ Y ) − Z α + ≤ ( p X − pY ) ≤
nX nY
2
p X (1 − p X ) pY (1 − pY )
( pˆ X − pˆ Y ) + Z α + = 1−α
nX nY
2
X Y
p= +
n X nY
Então:
1 1 1 1
P ( pˆ X − pˆ Y ) − Z α p (1 − p ) + ≤ ( p X − pY ) ≤ ( pˆ X − pˆ Y ) + Z α p (1 − p ) + = 1 − α
n X nY n X nY
2 2
Neste caso, não faremos a diferença entre duas variâncias e sim a razão entre elas.
Seja uma amostra aleatória x1 , x 2 ,..., x n de uma população X, com distribuição N ( µ X , σ X2 )
e uma amostra aleatória y1 , y 2 ,..., y n de uma população Y, com distribuição N ( µ Y , σ Y2 ) .
Sabe-se que:
(n − 1) S 2 (n − 1) S 2
Q X = x 2 X ≈ χ n2X −1 e QY = Y 2 Y ≈ χ n2Y −1
σX σY
Fazendo o quociente entre Qy e Qx, cada uma dividida pelos seus graus de liberdade,
teremos uma distribuição F-Snedecor com nx - 1 e ny - 1 graus de liberdade, ou seja:
QX S X2
n X − 1 σ X2 S X2 σ Y2 σ Y2 S X2
= 2 = 2 × 2 = 2 × 2 ≈ F(n X −1nY −1)
QY SY σ X SY σ X SY
nY − 1 σ Y 2
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 105
1−α
F α Fα
1−
2 2
Temos:
σ 2 S2 S2
P F α ≤ Y2 × X2 ≤ Fα = 1 − α . Passando X2 para o termo da esquerda e da direita, e
1− 2 σ X S Y 2 SY
dividindo, temos:
1 σY2
1 S2 σ 2 S2
P F α 2 ≤ 2 ≤ Fα 2 = 1 − α ⇒ P F α Y2 ≤ Y2 ≤ Fα Y2 = 1 − α
1− S σX SX 1− 2 S X σ X SX
2 X2 2 2
SY 2
SY
Contudo, a distribuição F-Snedecor, tem a seguinte propriedade:
1 1 1 1 1 1 S X2 σ X2 1 S X2
P 2
≥ 2 ≥
σY Fα S Y2 = 1 − α ⇒ P F 2
≥ 2 ≥ = 1−α .
σ Y Fα S Y2
F S
1−α Y2 α SY
2 S σ X2 2
S X2 1− 2 2
X
1 S X2 σ X2 1 S X2
Colocando em ordem: P ≤ 2 ≤ = 1−α
2
Fα S Y σ Y F α S Y2
1−
2 2
1 1
Pelo gráfico acima: F α < Fα , e lembrando que: F α = e Fα =
1− 1− Fα F α
2 2 2 2
1−
2 2
2
S σ 2
S 2
P F α X
≤ X
≤ Fα X = 1−α
2
σ 2 2
1− 2 S
Y Y 2
S Y
1 1
Na prática, em termos de tabela, temos que F α = e Fα =
1− Fα Fα
2 2
; n X −1; nY −1 ; nY −1; n X −1
2 2
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 106
Resumo:
entre Onde: S p2 = X
Médias n X + nY − 2
Amostrais Caso III - Variâncias populacionais desconhecidas e diferentes
S X2 S Y2 S X2 S Y2
P ( X − Y ) − t α + ≤ (µ X − µY ) ≤ ( X − Y ) + t α + = 1−α
w; n X nY w; n X nY2
2 2
p X (1 − p X ) pY (1 − pY )
P ( pˆ X − pˆ Y ) − Z α + ≤ ( p X − pY ) ≤
nX nY
2
para nX e nY < 30
Diferença p X (1 − p X ) pY (1 − pY )
entre ( pˆ X − pˆ Y ) + Z α + = 1−α
nX nY
Proporções 2
Amostrais 1 1 1 1
P ( pˆ X − pˆ Y ) − Z α p (1 − p ) + ≤ ( p X − pY ) ≤ ( pˆ X − pˆ Y ) + Z α p (1 − p ) + = 1 − α ,
n X nY n
X nY
2 2
X Y
para nX e nY ≥ 30, onde p = +
n X nY
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 107
15. Testes de Hipótese
Por outro lado, se o valor experimental da variável de teste cair na região de aceitação,
não terá havido, no nível α considerado, evidência significativa suficiente para a rejeição
da hipótese H0, a qual deverá ser aceita. Note-se que neste caso, estaríamos sujeitos a
cometer o erro tipo II, cuja a probabilidade é β.
É a capacidade do teste em rejeitar H0, sendo H0 falsa, logo o valor de p será dado por 1
-β.
Os estatísticos aplicados dão cada vez mais preferência ao poder do teste p, em lugar
aos testes clássicos, porque um teste clássico envolve a fixação arbitrária de α
(usualmente em 5%). Ao invés de introduzir tal elemento arbitrário, muitas vezes é
preferível indicar o poder do teste p, deixando-se a tarefa de formular o julgamento sobre
H0. (Formalmente, determinado o nível de α que se julgue adequado aos seus propósitos,
pode-se chegar a uma decisão individual).
O poder está relacionado com a natureza do teste escolhido e , de modo geral, o poder
aumenta com o tamanho n da amostra.
15.2 Procedimentos
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 108
1. Enunciar as hipóteses, sendo:
H0: θ = θ0
H1: θ < θ0 ou θ ≠ θ0 ou θ > θ0
2. Estabelecer o nível de significância α;
3. Calcular a variável de teste, de acordo com a distribuição amostral da estatística do
teste;
4. Decidir sobre a rejeição ou não de H0, comparando o valor da variável de teste com o
valor tabelado da distribuição teórica correspondente.
Graficamente, temos:
1- α
H1: θ ≠ θ0
α/2 α/2
-V crítico V crítico
V crítico
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 109
Testes de Hipótese Unilateral à esquerda
H1: θ < θ0 1- α
-V crítico
1. σ² conhecida
A) Estabelecer as hipóteses C) calcular a variável de teste, dada por
H o : µ = µ0 x − µ0 σ
z= , pois x ≈ N µ ;
σ n
µ < µ0
H1 : µ ≠ µ0
n
µ > µ 0
z < − zα , p/ µ < µ 0
z < − z ou z > z , p/ µ ≠ µ
α α
0
2 2
z > zα , p/ µ > µ 0
2. σ² desconhecida
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 110
B) estabelecer o nível de significância α; D) Rejeita-se H0 se
t < −t n −1;α tab , p/ µ < µ 0
t < −t ; ou t > t
n −1 α α , p/ µ ≠ µ 0
n −1;
2 2
2
χ < χ n −1;(1−α ) , p/ σ < σ o
2 2 2
2
χ < χ n −1;(1−α 2 ) ou χ > χ n −1;α , p/σ ≠ σ o
2 2 2 2 2
2
z < − zα , p/ P < P0
z < − z ou z > z , p/ P ≠ P
α α
0
2 2
z > zα , p/ P > P0
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 111
15.4 Testes de hipóteses para duas amostras
z < − zα , p/ µ1 − µ 2 < 0
z < − z ou z > z , p/ µ − µ ≠ 0
α α
1 2
2 2
z > zα , p/ µ1 − µ 2 > 0
t < −tα , p/ µ1 − µ 2 < 0
t < −t ou t > t , p/ µ − µ ≠ 0
α α
1 2
2 2
t > tα , p/ µ1 − µ 2 > 0
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 112
Caso III: variâncias populacionais desconhecidas e diferentes:
t < −tα , p/ µ1 − µ 2 < 0
t < −t ou t > t , p/ µ − µ ≠ 0
α α
1 2
2 2
t > tα , p/ µ1 − µ 2 > 0
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 113
15.4.2 Testes de hipóteses para duas proporções
z < − zα , p/ P1 − P2 < 0
z < − z ou z > z , p/P − P ≠ 0
α α
1 2
2 2
z > zα , p/ P1 − P2 > 0
σ2
σ 12
2 < 1 ⇒ σ1 < σ 2
2 2
σ 2
2
σ
H1 : 1 2 ≠ 1 ⇒ σ 1 ≠ σ 2
2 2
σ 2
2
σ1
σ 2 > 1 ⇒ σ 1 > σ 2
2 2
2
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 114
16. Análise da Variância: ANOVA
Segundo Martins, trata-se de um método estatístico, desenvolvido por Fisher, que, por
meio de teste de igualdade de médias, verifica se fatores (variáveis independentes)
produzem mudanças sistemáticas em alguma variável de interesse (variável dependente).
Os fatores propostos podem ser variáveis quantitativas ou qualitativas, enquanto a
variável dependente deve ser quantitativa e observada dentro das classes dos fatores -
também chamados de tratamentos.
Por exemplo, podemos estar interessado em descobrir variáveis que causam um aumento
no consumo de combustível dos automóveis. Podemos supor que a marca do veículo,
idade etc. são potenciais fatores. Por meio da análise da variância, é possível verificar se
marca, idade - ou uma combinação destes fatores - produzem efeitos apreciáveis sobre o
consumo, ou concluir que tais fatores não têm influência sobre o consumo.
Caso o teste estatístico indique a rejeição de H0, podemos concluir, com probabilidade α,
de que o fator considerado tem influência sobre a variável de estudo.
O nível de significância α deve ser estabelecido, ele servirá para definir o valor do Fcrítico =
Fα ;k −1;n − k , que é tabelado.
S e2 SQE
A estatística de teste é dada por F = 2 , onde S e2 = é a variância entre os
Sr k −1
SQR
tratamentos, e S r2 = é a variância residual. Nestas expressões temos
n−k
ni
2
∑ X ij
k
j =1
SQE = ∑ − C , que é a Soma dos Quadrados entre os tratamentos, e SQR,
i =1 ni
que corresponde à Soma dos Quadrados dos Resíduos, que é obtida por
k ni
SQR = SQT − SQE , onde SQT = ∑∑ xij2 − C é a Soma dos Quadrados Totais. Temos
i =1 j =1
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 115
que corresponde aos graus de liberdade referente aos resíduos. E por fim o termo
2
k ni
∑∑ xij
C= , que é a média dos valores ao quadrado, sendo n = n
k
i =1 j =1
n
∑
i =1
i
i =1 j =1 i =1 j =1
Aplicando o somatório:
k ni k ni k ni
SQT = ∑ ∑ [ xij − xi ] 2 + 2∑∑ [ xij − xi ][ xi − x ] + ∑∑ [ xi − x ] 2
i =1 j =1 i =1 j =1 i =1 j =1
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 116
2 2 2
k ni k ni k ni
∑∑ xij ∑∑ xij ∑∑ xij
k n k n k ni
i
= ∑∑ xij − 22 i =1 j =1 + i =1 j =1 = ∑∑ xij −
i
2 i =1 j =1 = ∑∑ xij2 − C ,
i =1 j =1 n n i =1 j =1 n i =1 j =1
2
k ni
∑∑ xij
onde C =
i =1 j =1
k ni k ni k ni ni ni
SQR = ∑∑ [ xij − xi ] 2 = ∑∑ [ xij2 − 2 xij xi + xi ]2 = ∑ ∑ xij2 − 2 xi ∑ xij + ∑ xi =
i =1 j =1 i =1 j =1 i =1 j =1 j =1 j =1
ni ni
2 ni
2
ni
2
∑ ij n ∑ ij ∑ ij ∑ ij
x x x x
i 2 j =1 i j =1 k i 2
k n n
j =1 j =1 =
∑ ∑ xij − 2 n ∑ xij + ni n = ∑ ∑ xij − 2
i =1 j =1 ni
+
ni
i =1
j =1
i
j =1
i
ni
2
ni
2
∑ xij ∑ xij
k
ni 2 j =1 k ni 2 k j =1
∑ ∑ xij −
i =1 j =1 ni
= ∑ ∑ xij −∑
n
i = 1 j =1 i = i i
k ni k ni k ni ni ni
SQE = ∑∑ [ xi − x ]2 = ∑ ∑ [ xi2 − 2 xi x + x 2 ] =∑ ∑ xi2 − 2 x ∑ xi + ∑ x 2 =
i =1 j =1 i =1 j =1 i =1 j =1 j =1 j =1
ni
2
ni ni
2
∑ xij ∑ xij k ∑ ij
x
k
j =i j =i
− 2x x + n x 2 =
ni
+ ni x 2 = ∑
=
= ∑ ni ∑ ij i
j i
− 2 x ni
n n ni j =i
i =1
i i i =1
ni k ni
2
k ni
2 ni
2
k ni
2
k ni
2
ni k ni
2
2
ni
2
k ni
2
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 117
Logo, temos que:
ni 2
ni
2
x
k ni k
∑ ij
k ∑
xij
k ni
SQR + SQE = ∑ ∑ xij −∑ j =1 + ∑
j =i −C =
2
i =i ni i =1 ni
∑∑ xij2 − C = SQT
i =1 j =1 i =1 j =1
Tratamentos
Observações
T1 T2 ... Tk
1
2
3
:
n
Total ΣT
ni Σ ni
Total 2 Total 2
ni
∑ n
i
Tratamentos ao
Observações Quadrado
T12 T22 ... T K2
1
2
3
:
n
Total ΣQ
2
k ni
∑ ∑ xij
i = 1 j =1
(∑ T ) 2
C= =
n ∑n i
k ni
SQT = ∑∑ xij2 − C = ∑ Q − C
i =1 j =1
ni
2
∑ X ij
k
j =1 2
SQE = ∑ − C = Total − C
∑ n
i =1 ni i
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 118
Exemplo:
O resultado das vendas efetuadas por três vendedores de uma indústria durante certo
período é dado a seguir. Deseja-se saber, ao nível de significância de 5%, se há diferença
de eficiência entre os vendedores:
Tratamentos
Observações
A B C
1 29 27 30
2 27 27 30
3 31 30 31
4 29 28 27
5 32 29
6 30
Tratamentos
Observações
A B C
1 29 27 30
2 27 27 30
3 31 30 31
4 29 28 27
5 32 29
6 30
Total 178 112 147 ΣT 437
ni 6 4 5 Σ ni 15
Total 2 Total 2
ni
5280,67 3136,00 4321,80 ∑ n 12738,47
i
Tratamentos
Observações
A B C
1 841 729 900
2 729 729 900
3 961 900 961
4 841 784 729
5 1024 841
6 900
Total 5296 3142 4331 ΣQ 12769
Assim, temos:
2
k ni
∑∑ xij
i =1 j =1
= (∑ T ) 2
437 2
C= = = 12731,27
n ∑n i 15
k ni
SQT = ∑∑ xij2 − C = ∑ Q − C = 12769 − 12731,27 = 37,73
i =1 j =1
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 119
ni 2
∑ xij
k
j =1 Total 2
SQE = ∑ − C = ∑ n − C = 12738,47 − 13731,27 = 7,20
ni
i =1
i
Uma vez calculado os valores de SQT, SQE e SQR, eles devem ser dispostos numa
tabela, conhecida como Quadro da Análise de Variância - QAV, da seguinte forma:
O valor de F5%; 2;12 = 3,89, tirado da tabela F-Snedecor de 5%. Então, como F < F5%; 2;12 não
se rejeita a H0, concluindo-se com nível de significância de 5% que não há diferenças na
eficiência dos vendedores.
Segundo Fator - B
X11 X12 X13 .... X1k
Primeiro X21
Fator - A X31
:
Xn1
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 120
A análise da variância permitirá testar simultânea e independentemente as seguintes
hipóteses:
H 0 A : µ1. = µ 2. = ... = µ n.
H 0 B : µ.1 = µ.2 = ... = µ.k
A não rejeição de H0A significa a não-comprovação de diferenças significativas entre as
médias devida à classificação segundo o critério das linhas (Fator A), e a não rejeição de
H0B significa a não-comprovação de diferenças significativas entre as médias devida à
classificação segundo o critério das colunas (Fator B).
O nível de significância α deve ser estabelecido, ele servirá para definir os valores críticos
de F, dados por:
Fcrítico L = Fα ;k −1;( k −1)( n −1) ,
Fcrítico C = Fα ;n−1;( k −1)( n −1) ,
n i ∑ ij
k ni
x
SQL = ∑∑ ( x j − x ) = ∑
2 i =1 −C
i =1 j =1 j =1
k
ni 2
∑ xij
k ni k
j =1
SQC = ∑∑ ( xi − x ) 2 = ∑ −C
ni
i =1 j =1 i =1
SQR = SQT − SQC − SQL , onde:
2
k ni
∑∑ xij
k n
i
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 121
O desenvolvimento da Soma dos Quadrados Total é feito somando e subtraindo xi , x j e x
então, temos:
k ni k ni
SQT = ∑∑ ( xij − xi + xi − x j + x j − x + x − x ) 2 = ∑∑ ([ xi − x ] + [ x j − x ] + [ xij − xi − x j + x ])2
i =1 j =1 i =1 j =1
Onde:
k
2
n i ∑ ij
k ni
x
SQL = ∑∑ ( x j − x ) = ∑
2 i =1 −C
i =1 j =1 j =1
k
ni 2
∑ xij
k ni k
j =1
SQC = ∑∑ ( xi − x ) 2 = ∑ −C
ni
i =1 j =1 i =1
k ni
SQR = ∑∑ [ xij − xi − x j + x ]2
i =1 j =1
Tratamentos Total 2
Blocos T1 T2 ... Tk Total ki
ki
1 Σ B1 k1 (∑ B ) 1
2
k1
2 Σ B2 k2 (∑ B ) 2
2
k2
3 Σ B3 k3 (∑ B ) 3
2
k3
: : : :
n Σ Bn kn (∑ B ) n
2
kn
Total ΣT1 ΣT2 ... ΣTk ΣT=ΣB Σ ki TotalL2
∑ k
i
ni n1 n2 ... nk Σ ni
TotalC2 (∑ T ) 1
2
(∑ T ) 2
2 ... (∑ T ) k
2
TotalC2
∑ n
ni n1 n2 nk i
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 122
Valores ao Quadrado
Tratamentos
Blocos Total
T1 T2 ... TK
1 2
x11 2
x12 ... x12k B1
2 2
x21 B2
3 2
x31 B3
: : :
n xn21 Bn
n n ... n
ΣQ
Total ∑ x 2j1
j =1
∑ x 2j 2
j =1
∑x
j =1
2
jk
2
k ni
∑ ∑ xij
i = 1 j =1
(∑ T ) 2
C= =
n ∑n i
k ni
SQT = ∑∑ xij2 − C = ∑ Q − C
i =1 j =1
k
2
n i ∑ ij
x 2
SQL = ∑ − C = Total L − C
j =1
i =1
k ∑ k
ni 2
∑ xij
k
j =1 TotalC2
SQC = ∑ − C = ∑ n −C
ni
i =1
i
Exemplo:
Os dados da tabela seguinte referem-se à pureza de um determinado produto por um
dado método. O fator A corresponde ao tio de solvente que foi aplicado ao produto, e o
Fator B corresponde ao tempo de ebulição aplicado para cada solvente. Ao nível de
significância de 1% pede-se:
a) a pureza é afetada pelo tipo de solvente?
b) e sobre o tempo de ebulição, o que pode ser dito?
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 123
Tempo de Ebulição TotalL2
Solventes 1 2 3 4 TotalL ki
k
1 3,1 2,7 3,3 3,0 12,1 4 36,603
2 4,7 3,5 3,9 3,6 15,7 4 61,622
Totalc 7,8 6,2 7,2 6,6 27,8 8 98,225
ni 2 2 2 2 8
TotalC2 30,42 19,22 25,92 21,78 97,34
ni
Valores ao Quadrado
Tempo de Ebulição
Solventes
1 2 3 4
1 9,61 7,29 10,89 9,00
2 22,09 12,25 15,21 12,96
Total 31,70 19,54 26,10 21,96 99,30
2
k ni
∑∑ xij
C=
i =1 j =1(∑ T ) = 27,8 = 96,605
=
2 2
n ∑n 8 i
k ni
SQT = ∑∑ x − C = ∑ Q − C = 99,30 − 96,605 = 2,695
2
ij
i =1 j =1
k
2
n i ∑ ij
x 2
SQL = ∑ − C = Total L − C = 98,225 − 96,605 = 1,62
j =1
i =1
k ∑ k
ni 2
∑ xij
k
j =1 TotalC2
SQC = ∑ − C = ∑ − C = 97,34 − 96,605 = 0,735
ni ni
i =1
SQR = SQT - SQL - SQC = 2,695 - 1,62 - 0,735 = 0,34
Uma vez calculado os valores de SQT, SQL, SQC e SQR, eles devem ser dispostos
numa tabela, conhecida como Quadro da Análise de Variância - QAV, da seguinte forma:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 124
No caso do exemplo dado, temos:
Quadro de Análise de Variância - QAV
Fonte de Soma dos Quadrados
variação Quadrados Gl médios F
1,62 1,62
Entre linhas 1,62 2 -1=1 S L2 = = 1,62 FL = = 14,34
1 0,113
0,735 0,245
Entre colunas 0,735 4 - 1=3 SC2 = = 0,245 FC = = 2,17
3 0,113
0,34
Residual 0,34 (ni − 1)(k − 1) =3 S R2 = = 0,113
3
Total 2,695 8 - 1=7
O primeiro valor crítico de F é F1%;1;3 = 34,12, tirado da tabela F-Snedecor de 1%. Então,
como F < F1%;1;3 não se rejeita a H0, concluindo-se com nível de significância de 1% que
não há evidências de que a pureza seja afetada pelo tipo de solvente.
Para o segundo valor crítico de F, temos F1%;3;3 = 29,46, também tirado da tabela F-
Snedecor de 1%. Então, como F < F1%;3;3 não se rejeita a H0, concluindo-se com nível de
significância de 1% que, também, não há evidências de que a pureza seja afetada pelo
tempo de ebulição.
Isto porque para cada tipo de ANOVA: one-way ou two-way, temos os seguintes modelos
matemáticos:
- One-way Anova: xˆij = µ + α i + ε ij , onde:
x̂ij - é o valor estimado pelo modelo;
µ - é o efeito médio;
α i - é o efeito específico do tratamento;
ε ij - é o efeito aleatório, ou erro residual.
- Two-way Anova: xˆij = µ + α i + β i + ε ij , onde:
x̂ij - é o valor estimado pelo modelo;
µ - é o efeito médio;
α i - é o efeito específico devido à linha (Blocos);
βi - é o efeito específico devido à coluna (Tratamentos);
ε ij - é o efeito aleatório, ou erro residual.
O erro residual pode ser obtido pela diferença entre xij e x̂ij , ou seja ε ij = xij − xˆij
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 125
17. Análise de dados categorizados
Segundo Barbetta, grande parte das variáveis estudadas nas Ciências não são
mensuradas numericamente, mas indicam certas qualidades, ou atributos, de tal forma
que podemos alocar cada elemento numa categoria preestabelecida, resultando em
dados categorizados. Por exemplo, ao observar a variável "sexo" em cada indivíduo
pesquisado, deve-se alocar ou categoria "masculino" ou na categoria "feminino". È
importante ser lembrado que as variáveis devem estar bem definidas, tal que cada
elementos pesquisado se encaixe em uma e apenas uma categoria.
É um dos testes estatísticos mais utilizado. Ele pode ser empregado nas seguintes situações:
a) Como teste de aderência, para verificar o grau de correspondência entre o número de observações
e uma determinada resposta ou objeto e número esperado destas respostas ou objetos em cada
categoria que se está pesquisando;
b) Como teste de independência entre 2 ou mais amostras, principalmente quando os dados
consistem de freqüências de categorias discretas.
Este é o caso quando está se trabalhando apenas com uma amostra, mas que apresenta k categorias.
O pesquisador observa as Oi freqüências em cada categoria. contudo, dependendo do valor das n
observações, pode calcular as Ei freqüências esperadas, também em cada categoria. Utilizando a
estatística:
k
(Oi − Ei )2
χ =∑
2
i =1 Ei
Pode-se testar a hipótese nula H0: não há diferença significante entre as k categorias contra a
hipótese alternativa H1: há pelo menos uma diferença significativa entre as k categorias.
O valor das freqüências esperadas pode ser obtido por:
n
Ei =
k
Onde n é o numero total de elementos da amostra e k o número de categorias existentes nesta
amostra. A estatística χ 2 ≈ χ α2 ;k −1 , ou seja, ele tem distribuição Qui-quadrado com k - 1 graus de
liberdade, e o teste é realizado segundo o nível de significância α .
Exemplo: fãs de corrida de cavalo frequentemente sustentam que uma corrida em torno de um pista
circular proporciona significante vantagem inicial para os cavalos colocados em certas posições no
local de largada. Cada posição do cavalo corresponde ao posto atribuído no começo do
alinhamento. Em uma corrida de 8 cavalos, a posição 1 é a mais próxima da raia no lado interno da
pista; a posição 8 está no lado externo, mais distante da raia. Pode-se testar o efeito da posição no
local de largada analisando os seguintes dados:
Posições do local de largada
Total
1 2 3 4 5 6 7 8
Número de vitórias 29 19 18 25 17 10 15 11 144
a) Hipóteses: H0: não há diferença no número de vitórias em cada uma das posições do local de
largada.
H1: há pelo menos uma diferença significativa entre número de vitórias em cada uma
das posições do local de largada.
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 126
b) Nível de significância: α = 5%
c) Estatística de Teste:
k
(Oi − Ei )2 n 144
χ =∑
2
, onde Ei = , logo Ei = = 18 . Devemos calcular as diferenças entre Oi e
i =1 Ei k 8
Ei , então:
k
(Oi − Ei )2
Ou seja, χ 2 = ∑ = 16,3334 . Agora, vamos procurar na tabela da distribuição de Qui-
i =1 Ei
quadrado o valor correspondente para χ α2 ;k −1 = χ 02, 05;8−1 = χ 02, 05;7 , já que o nível de significância é de
5% e o grau de liberdade gl = k - 1 = 8 - 1 = 7. Então χ 02,05;7 = 14,07 .
d) Decisão: como o valor de χ 2 = 16,3334 > χ 02, 05;7 = 14,07 , então rejeita-se H0.
Observações:
a) Se tivermos apenas 2 categorias na amostra, ou seja k = 2 (gl = 1), cada freqüência esperada Ei
deve ser pelo menos 5;
b) Se tivermos k > 2 categorias (gl > 1), o teste não deve ser usado se mais de 20% das freqüências
esperadas Ei forem menores que 5 ou se qualquer freqüência esperada é menor do que 1.
c) Poderíamos ter visto o resultado acima em função do p-valor para χ 2 = 16,3334 . Observando na
tabela de Qui-quadrado, este valor 16,3334 na linha onde gl = 7, está entre 16,01 (p = 0,025) e
18,48 (p = 0,01), ou seja, o p-valor dele está 0,025 < p < 0,01 que corresponde a um valor menor do
que 0,05, que foi o nível de significância adotado. Observe abaixo:
p de 16,01 p de 18,48
gl = 7
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 127
Podemos, também, realizar uma interpolação linear para descobrir qual o p-valor referente a
χ 2 = 16,3334 , da seguinte maneira:
Valor de χ 2 p-valor
16,01 0,025
16,3334 X
18,48 0,010
Então, temos:
16,3334 − 16,01 x − 0,025 0,3234 x − 0,025
= ⇒ = ⇒ −0,0049 = 2,47( x − 0,025) ⇒
18,48 − 16,01 0,010 − 0,025 2,4700 − 0,0150
⇒ −0,0049 = 2,47 x − 0,0618 ⇒ 2,47 x = 0,0569 ⇒ x = 0,0230
Ou seja, o p-valor de χ 2 = 16,3334 é igual a 0,0230, valor este menor do que 0,05 (nível de
significância), logo rejeita-se H0.
A hipótese nula é H0: as amostras são independentes e a hipótese alternativa é H1: as amostras não
são independentes. A estatística de teste é dada por:
r k (O − E )2
χ = ∑∑
2 ij ij
i =1 j =1 Eij
Onde, as freqüências esperadas Eij são calculadas por:
Eij =
∑ L ∑C i j
N
A estatística χ tem distribuição Qui-quadrado com (r - 1)(k - 1) graus de liberdade. Ou seja:
2
χ 2 ≈ χ α2 ;( r −1)( k −1)
Exemplo: Uma empresa tem que escolher um entre três planos de saúde. A gerência deseja saber se
a preferência por um dos planos é independente da classe dos empregados a um nível de 5% de
significância. As opiniões dos empregados foram coletadas em uma amostra de 500 pessoas com os
seguintes resultados:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 128
Classe dos Planos de Saúde
Total
empregados 1 2 3
Trabalhador
160 140 40 340
assalariado
Trabalhador
40 60 60 160
horista
Total 200 200 100 500
i =1 j =1 Eij
Eij
160 136 24 4,2353
140 136 4 0,1176
40 68 -28 11,5294
40 64 -24 9
60 64 -4 0,2500
60 32 28 24,5000
500 500 - 49,6353
r k (O − Eij )
2
Então, χ = ∑∑
2
= 49,6353 . Agora, vamos procurar na tabela da distribuição de Qui-
ij
i =1 j =1 Eij
quadrado o valor correspondente para χ α2;( r −1)( k −1) = χ 02,05;( 2−1)( 3−1) = χ 02, 05; 2 , já que o nível de
significância é de 5% e o grau de liberdade gl =(r - 1)(k - 1) = (2-1)(3-1) = 2. Então χ 02,05; 2 = 5,99 .
d) Decisão: como o valor de χ 2 = 49,6353 > χ 02, 05; 2 = 5,99 , então rejeita-se H0.
Observações:
a) Se tivermos r ou k > 2 categorias (gl > 1), o teste não deve ser usado se mais de 20% das
freqüências esperadas Ei forem menores que 5 ou se qualquer freqüência esperada é menor do que
1. Neste caso, o pesquisador deve combinar as categorias para aumentar os Eij nas diversas células.
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 129
b) Poderíamos ter visto o resultado acima em função do p-valor para χ 2 realizando a interpolação
linear. Contudo deve ser observado o limite dos p-valores em cada linha correspondente aos graus
de liberdade dado por gl = =(r - 1)(k - 1). O menor p-valor tabelado é 0,005. Caso o valor calculado
da estatística χ 2 seja superior aos valores tabelados na coluna 0,005 da tabela de Qui-quadrado
então deve-se utilizar a função DIST.QUI(x, gl) do Excel ou do Calc, onde x é o valor calculado, no
caso 49,6353, e gl é o grau de liberdade, no caso gl =(r - 1)(k - 1) = (2-1)(3-1) = 2. Então,
DIST.QUI(49,6353, 2) = 1,6666 E -11, quase zero. No R, deve-se usar o comando pchisq(q, df,
lower.tail = FALSE), onde q é o valor calculado, no caso 49,6353, e df é o valor de gl dado por gl
=(r - 1)(k - 1), que no caso é gl = 2. Então pchisq(49,6353, 2, lower.tail = FALSE) = 1,666601e-11.
Quando estamos estudando a relação entre duas variáveis categóricas, não usamos o termo
"correlação". Neste caso, fala-se em “medida de associação”. Usa-se, então, o Coeficiente de
Contigência C, dado por:
χ2
C=
χ2 + n
r k (O − Eij )
2
Onde: χ = ∑∑ 2 ij
é o valor de Qui-quadrado, calculado a partir de uma tabela de
i =1 j =1 Eij
dupla entrada.
r k
∑ Li ∑ C j
i =1 j =1
é a freqüência esperada da linha i da coluna j
Eij =
N
Oij é a freqüência observada na linha i da coluna j
Estes cálculos são feitos a partir de uma tabela de dupla entrada abaixo:
Observações:
• para o caso 2x2 (gl=1), quando N > 40, utilizar no cálculo de χ2 a correção de continuidade,
2
ou seja: N
N AD − BC −
2
χ =
2
( A + B )(C + D )( A + C )( B + D )
• quando 20≤N≤40, a prova de χ2 , pode ser empregada com a correção de continuidade, desde
que nenhuma freqüência esperada seja inferior a 5
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 130
Para gl>1 (c>2 e r >2), a prova pode ser aplicada somente se o número de células com
freqüência esperada inferior a 5 é inferior a 20% do total de células e se nenhuma célula tem
freqüência esperada inferior a 1. As freqüências esperadas podem ser aumentadas
combinando-se as categorias adjacentes.
Porém, o coeficiente descrito acima não varia entre 0 e 1. O valor máximo de C depende do número
de linhas e colunas da tabela de dupla entrada. Para evitar este inconveniente, costuma-se empregar
o Coeficiente de Contingência Modificado, dado por:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 131
18. Correlação
Interpretação:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 132
Graficamente:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 133
Para o cálculo do coeficiente de correlação, usamos a seguinte expressão:
n ∑ XY − (∑ X )(∑ Y )
r=
[n∑ X 2
− (∑ X ) 2 ] [n∑ Y 2
− (∑ Y ) 2 ]
Onde n é o número de pares de dados amostrais.
X Y XY X2 Y2
... ... ... ... ...
... ... ... ... ...
... ... ... ... ...
ΣX ΣY ΣXY ΣX2 ΣY2
Exemplo:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 134
Primeiramente, devemos fazer o seguinte:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 135
19 Método dos Mínimos Quadrados - MMQ
O Método dos Mínimos Quadrados (MMQ), ou Mínimos Quadrados Ordinários (MQO) ou OLS
(do inglês Ordinary Least Squares) é uma técnica de otimização matemática que procura encontrar
o melhor ajuste para um conjunto de dados tentando minimizar a soma dos quadrados das
diferenças entre o valor estimado Yˆi e os dados observados Y Yi (tais diferenças são chamadas
resíduos - ε ).
O objetivo de ajuste é encontrar uma reta Yˆ = a + bX , estimada a partir dos dados, que minimiza o
parâmetro ε, de Y = α + βX + ε , conhecido como erro aleatório ou ruído branco. O que se deseja
é:
∑ ε 2 = ∑ (Y − Yˆ ) 2 = mínimo
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 136
Fazendo:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 137
19.2 Ajuste a um polinômio
Dado por:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 138
Substituindo os valores da ultima linha no sistema de equações acima, temos:
A estimativa para x = 6 é:
E para x = 7:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 139
19.3 Ajuste de funções linearizáveis
Existem funções que são não-lineares. Estas funções podem ser linearizadas por transformação. São
elas:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 140
20. Análise de Regressão
Suponhamos que Y seja uma variável que nos interessa estudar e prever o seu comportamento. É de
se esperar que os valores da variável Y (dependente) sofram influências dos valores de um número
infinito de variáveis X1, X2, ..., XN (independentes) e que exista uma função g que expresse tal
dependência, ou seja
Y = g ( X 1 , X 2 ,..., X N )
É impraticável a utilização das N variáveis ou por desconhecimento dos valores de algumas ou pela
dificuldade de mensuração e tratamento de outras, logo se usa um número menor de variáveis (k) e
o modelo fica
Y = f ( X 1 , X 2 ,..., X k ) + h( X k +1 , X k + 2 ,..., X N )
Todas as influências das variáveis Xk+1, Xk+2, ..., XN , sobre as quais não exercemos controle, serão
consideradas como casuais, e associaremos uma variável aleatória U, obtendo o seguinte modelo:
Y = f ( X 1 , X 2 ,..., X k ) + U
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 141
c) a Cov(U i ;U j ) = σ 2 para i = j e Cov(U i ;U j ) = 0 para i ≠ j
Quando desejamos fazer inferências sobre a população da qual foi extraída uma amostra, devemos
considerar o modelo matemático que vai nos permitir construir intervalos de confiança e testar
hipóteses.
- Hipóteses simplificadoras
São as hipóteses básicas sobre a regularidade da população:
1ª as distribuições de probabilidade P(Yi | X i ) possuem a mesma variância σ2 para todo Xi;
2ª as médias E (Yi ) = µ i = α + βX i se dispõem sobre uma linha reta, conhecida como a verdadeira
reta de regressão (da população); os parâmetros α e β que especificam esta reta devem ser
estimados a partir da informação da amostra;
3ª as variáveis aleatórias Yi são estatisticamente independentes, com E (Yi ) = µ i = α + βX i e
Var (Yi ) = σ 2
∑ X ∑ Y e S = X 2 − (∑ X )
2
S
b = XY , onde S XY = ∑ XY − XX ∑
S XX n n
a = Y − bX , onde X =
∑X eY =
∑Y
n n
A justificativa principal para utilizarmos o Método dos Mínimos Quadrados para estimar os
parâmetros de Yi = α + βX i + U i é a seguinte:
“Na classe dos estimadores lineares não-tendenciosos, o estimador b de mínimos quadrados tem
variância mínima (é o mais eficiente). Analogamente, o estimador a também tem variância
mínima”.
Aplica-se somente a estimadores simultaneamente lineares e não-tendenciosos.
Prova-se que:
α + β X ; σˆ 2 1 + ( X − X )
1 X 2 σˆ 2 ˆ 2
a ≈ N α ; σˆ 2 + , b ≈ N β ;
S e Y ≈ N
n S XX XX
n S XX
onde σˆ 2 é a variância homoscedástica e desconhecida
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 142
S YY − b 2 S XX S YY − bS XY
Um estimador não-viesado de σ2 é σˆ 2 = S 2 = ou σˆ 2 = S 2 = , onde
n−2 n−2
∑ X ∑Y , S (∑ X )2
(∑ Y ) 2
S XY = ∑ XY − XX =∑X 2
− e S YY = ∑Y − 2
n n n
I) Para os coeficientes:
b) Nível de significância: α
c) Variável de teste:
αˆ
Para α̂ , t =
1 X2
σˆ +
n S XX
b
Para β̂ , t =
σˆ
S XX
Em ambos os casos, t tem distribuição t-Student com n - 2 graus de liberdade.
b) Nível de significância: α
c) Variável de teste:
SQM E
Para o modelo como um todo, se usa a variável de teste F = , que tem distribuição F de
SQM R
Snedecor com α fixado e 1 grau de liberdade no numerador e n-2 graus de liberdade no
denominador.
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 143
Quadro de Análise de variância
Residual VR = VT − VE n–2 VR
SQM R =
n−2
Total VT = S YY n-1
VT = ∑ (Yi − Y ) = ∑ Yi − 2Yi Y + Y ( ) = ∑Y − 2Y ∑ Yi + ∑ Y =∑ Yi
∑Y ∑ Yi
∑
2 2 2 2 2 2
−2 Yi + n =
i
i
n n
(∑ Y ) (∑ Y ) 2 2
(∑ Y ) 2
∑Y 2
−2 + = ∑ Yi 2
− = S YY
i i i
i
n n n
VR = ∑ (
Yi − Yˆ ) = ∑ (Y − [a + bX ]) =∑ (Y − [(Y − bX ) + bX ]) =∑ (Y − [Y − bX + bX ])
2
i i
2
i i
2
i i
2
=
S YY − 2bS XY + b 2 S XX = S YY − 2b(bS XX ) + b 2 S XX = S YY − b 2 S XX = S YY − bS XY
S YY S XX S YY S XX S YY
O R² indica quantos por cento a variação explicada pela regressão representa da variação total do
modelo.
O valor da raiz quadrada de R 2 representa o coeficiente de correlação linear
O R 2 ajustado é dado por
n −1
2
Rajustado
= 1− 1− R2 (
n − k − 1
)
, onde k é número de variáveis independentes
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 144
20.1.7 Previsão
σ2 2 σ
2
(
2 1 )
X −X2
∑Var (Y ) + (X − X ) ( )
1 2 1
= = n σ 2
+ X − X = σ +
n2 S XX n2 S XX n S XX
1 ( X − X )2
2 1 ( X − X)
2
P Yˆi − t α σˆ 2 + ≤ Yi ≤ Yˆ
i + t α σˆ + = 1−α
n S
n S
2 XX 2 XX
Exemplo:
Suponha que exista uma relação linear entre as variáveis X = despesas com propaganda
e Y = vendas de certo produto. Considerando os dados abaixo, determine a reta de
mínimos quadrados, os testes e o coeficiente de explicação:
Graficamente, temos:
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 145
Primeiramente, devemos fazer o seguinte:
Y =
∑Y =
2150
= 195,45 X =
∑X =
86
= 7,82
n 11 n 11
S XY = ∑ XY −
∑ X ∑Y = 19515 −
86(2150)
= 2705,91
n 11
(∑ X ) 2
(86)2
S XX = ∑ X 2
− = 870 − = 197,64
n 11
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 146
(∑ Y ) 2
(2150 )
2
S YY = ∑Y − 2
= 461700 − = 41472,73
n 11
S XY 2705,91
b= = = 13,69
S XX 197,64
a = Y − bX = 195,45 − 13,69(7,82) = 88,39
Então, o modelo Yˆ = a + bX , fica Yˆ = 88,39 + 13,69 X
i i i i
i) hipótese
H0: α e β = 0
H1 α e β ≠ 0
S YY − b 2 S XX S YY − bS XY 41472,73 − 13,69(2705,91)
Onde: S 2 = = → S2 = = 492,06
n−2 n−2 9
S = S 2 = 492,06 = 22,18
Como o valor da variável de teste é maior que valor de t tabulado, rejeitamos H0.
i) hipótese
H0: não existe regressão
H1 : existe regressão
Como o valor da variável de teste é maior que valor de F tabulado, rejeitamos H0.
VE bS XY (13,69)(2705,91)
O Coeficiente de explicação é dado por: R 2 = = = = 0,89 ou 89%.
VT S YY 41472,73
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 147
Saída de um Pacote Estatístico - R
Call:
lm(formula = dados$Y ~ dados$X)
Residuals:
Min 1Q Median 3Q Max
-39.555 -8.984 10.513 14.136 26.284
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 88.413 14.027 6.303 0.00014 ***
dados$X 13.691 1.577 8.680 1.15e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 148
21. Determinação do Tamanho da Amostra
Para determinar o tamanho da amostra, devemos saber qual é a dimensão da população que servirá
de base para o estudo, ou seja, o valor de N.
Uma população é dita finita quando se consegue enumerar todos os elementos que a formam.
Refere-se a um universo limitado em uma dada unidade de tempo. Exemplificando pode-se dizer
que a quantidade de automóveis produzidos por uma fábrica em um mês, a população de uma
cidade e o número de alunos de uma sala de aula são exemplos de uma população finita.
Uma população é dita infinita quando os elementos não podem ser contados. Refere-se a um
universo não delimitado. Os resultados (cara ou coroa) obtidos em sucessivos lances de uma moeda,
o conjunto dos números inteiros, reais ou naturais são exemplos de populações infinitas.
Para média:
Z 2 .σ 2 . N Z .σ
2
n= n=
ε 2 ( N − 1) + Z 2σ 2 ε
Para a proporção:
Quando não se conhecem os valores populacionais σ2, P e Q, utilizam-se os valores amostrais s2, p
e q, nas fórmulas acima.
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 149
Bibliografia:
Bussab, Wilton de O., Morettin, Pedro A. Estatística Básica. 8. Ed. São Paulo: Saraiva, 2013.
Morettin, Luiz Gonzaga. Estatística Básica: Probabilidade e Inferência. Volume único. São Paulo:
Ed. Pearson, 2011.
Pinheiro, João Ismael D. et al. Estatística Básica: a arte de trabalhar com dados. 2. Ed. Rio de
Janeiro: Elsevier, 2015
Martins, Gilberto de Andrade. Estatística Geral e Aplicada. 3. Ed. São Paulo: Atlas, 2008.
Costa Neto, Pedro Luis de Oliveira. Estatística. São Paulo: Edgard Blücher, 1977.
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 150
Tabelas
I - Tabela Distribuição Normal
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 151
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 152
II - Tabela Distribuição Qui-quadrado
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 153
III - Tabela Distribuição t-Student
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 154
IV - Tabela Distribuição F-Snedecor
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 155
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 156
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 157
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 158
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 159
Dados
Apostila de Estatística - Prof. GILBERT QUEIROZ DOS SANTOS - DEMA/UFC - 2022 159