Escolar Documentos
Profissional Documentos
Cultura Documentos
ÚNICA DE
IPATINGA
ESTATÍSTICA
FELIPE CHAVES INÁCIO 1
Menu de Ícones
Com o intuito de facilitar o seu estudo e uma melhor compreensão do conteúdo
aplicado ao longo da apostila, você irá encontrar ícones ao lado dos textos. Eles são
para chamar a sua atenção para determinado trecho do conteúdo, cada um com
uma função específica, mostradas a seguir:
UNIDADE 06
01 3
UNIDADE
02
UNIDADE
03
UNIDADE
04
UNIDADE
05
UNIDADE 2
Su
mári
o
AMOSTRAGEM
1.1 Introdução
1.2. Dimensionamento da Amostra
1.3. Tipos de Amostragem
1.3.1. Amostragem Aleatória Simples
1.3.2. Amostragem Estratificada
1.3.3. Amostragem por Conglomerados
1.3.4. Amostragem Sistemática
-Fixando o Conteúdo
ESTATÍSTICA DESCRITIVA
2.1 Introdução
2.2.Tabelas de Frequências
2.3. Medidas Descritivas
2.3.1. Medidas de Tendência Central
2.3.2. Medidas de Variação ou Dispersão
-Fixando o Conteúdo
MEDIDAS DE
ASSIMETRIA E
CURTOSE
3.1 Introdução
3.2. Medida de Assimetria 19
3.3. Medida de Curtose Mito, Filosofia e
Ciência 20
Fixando o Conteúdo
PRINCÍPIOS DE
PROBABILIDADE
4.1. Introdução
4.1.1. Conceitos Fundamentais
4.2. Definições de Probabilidade
4.2.1. Probabilidade Clássica
4.2.2. Probabilidade Frequentista
4.2.3. Definição Axiomática de Probabilidade
4.3. Regra da Adição
4.3.1 Eventos Excludentes
4.4. Regra do Produto
4.4.1. Eventos Independentes
4.5. Probabilidade Total
4.6. Teorema de Bayes
4.7. Distribuições de Probabilidade
4.7.1. Distribuição Binominal
4.7.1.1. Parâmetros da Distribuição Binominal
4.7.2. Distribuição Normal
4.7.2.1. Distribuição Normal Padrão
-Fixando o Conteúdo
INFERÊNCIAS ESTATÍSTICA:
5.1 Introdução
5.2. Estimação
5.2.1. Estimação por Ponto
-Fixando o Conteúdo
REFERÊNCIAS BIBLIOGRÁFICAS 64
CONFIRA NA APOSTILA
AMOSTRAGEM
4
1.1 INTRODUÇÃO
UNIDADE
A amostragem é um processo pelo qual podemos conhecer as características
de um todo (chamado “universo”) sem termo que analisar todos os elementos que o
compõem. Uma analogia frequentemente utilizada é da prova de um bolo. Se
quisermos saber se um bolo é gostoso, não há a necessidade de comermos o bolo
inteiro, basta uma pequena fatia. Da mesma forma, quando queremos conhecer
alguma característica de um universo, não precisamos pesquisar cada elemento
que o compõe, basta analisarmos uma parte, sendo esta parte chamada de
“amostra”.
Entretanto, assim como na prova de um bolo, essa parte não pode ser
pequena demais, caso contrário, corremos o risco de não ser o suficiente para
termos uma ideia do todo. Também não podemos escolher de forma descuidada os
elementos que irão compor a amostra, pois podemos não ter todas as
características do universo que precisam ser preservadas. Dessa forma, o processo
de escolha de uma amostra é composto, grosso modo, por duas etapas: o
dimensionamento (ou cálculo do tamanho) da amostra e o tipo de amostragem
utilizado para escolher os elementos que irão compor a amostra.
N
n=
NE2+1
Onde
n = tamanho da amostra;
N = tamanho do universo;
E = margem de erro escolhida.
Exemplo: Suponha que uma determinada empresa tenha 3000 clientes em seus
cadastros e pretenda realizar uma pesquisa de satisfação entre eles. Quantos
clientes deverão ser pesquisados para que se tenha uma margem de erro de 5%?
N = 3000
E = 5% = 0,05
n = ? Então:
3000
n=
3000(0, 0025) + 1
n = 3000
7, 5 + 1
3000
n=
8, 5
n ≈ 353
6
1.3 TIPOS DE AOSTRAGEM
Após conhecermos o número de elementos do universo que devemos
pesquisar, precisamos saber como selecionar esses elementos. Existem várias
maneiras de se fazer isso e, dentre elas, veremos as quatro mais utilizadas.
7
Nestes links, vocês encontrarão mais informações acerca dos conceitos que serão
necessários ao longo da disciplina, além de uma explicação bem detalhada dos tipos de
.
amostragem.
https://integrada.minhabiblioteca.com.br/#/books/9788580553949/cfi/16!/4/4@0.00:0.00
https://plataforma.bvirtual.com.br/Leitor/Publicacao/402/pdf/0?code=2ukKXGhd5+
C7YcXq6w9hQ0VOHovqmN4BLEXyWsNE8YRwcYfoJONADScX8In1UsPqreHiD/p
KrwcJVWzoEVZO+g==
2.1 INTRODUÇÃO
A estatística descritiva pode ser entendida como um conjunto de técnicas e
métodos estatísticos que nos permitem descreve um determinado conjunto de
dados para que possamos ”enxergar” as informações nele contidas. Dentre estas
técnicas encontram-se tabelas, gráficos e medidas que irão representar o
conjunto de dados em questão. A estatística descritiva nos permite apenas
descrever um conjunto de dados sem que possamos, a partir dele, fazer
afirmativas acerca do universo do qual tal conjunto foi extraído. A parte da
estatística que nos permite fazer isso é chamada de inferência estatística. Dentre
as técnicas da estatística descritiva, começaremos estudando as tabelas de
frequências e passaremos então para as medidas descritivas.
O símbolo “Σ” significa somatório. Ou seja, indica que estamos somando certas
quantidades de fatores.
9
Supondo que a tabela acima se refira às idades de 25 pessoas de um
determinado grupo, podemos dizer que 8 destas pessoas (ou 32%) possuem idade
entre 10 e 20 anos. Sete pessoas possuem idade entre 20 e 30 anos e assim
sucessivamente. A frequência relativa informa justamente a porcentagem de valores
dentro de cada classe e é obtida dividindo-se a frequência da classe pela frequência
total. Por sua vez, a frequência acumulada é obtida somando-se a frequência da
classe com a frequência das classes anteriores. Por exemplo, a frequência da
terceira classe é obtida somando-se 5 + 7 + 8 = 20 e significa que existem 20
pessoas com idade entre 10 e 40 anos.
Através desta tabela podemos perceber, por exemplo, que 60% das
pessoas deste grupo possuem entre 10 e 30 anos de idade. Isso pode ser percebido
somando- se as frequências relativas das duas primeiras classes. Por outro lado,
somando as frequências relativas das duas últimas classes, podemos perceber que
apenas 20% destas pessoas possuem idade entre 40 e 60 anos. Dessa forma,
podemos concluir que este grupo é constituído basicamente por pessoas mais
jovens.
Uma questão que devemos sempre considerar diz respeito ao número de
classes que serão utilizadas em cada tabela. No exemplo acima, foram utilizadas 5
classes, mas nem sempre será assim. A quantidade de classes de uma tabela
dependerá do número de valores existentes no conjunto (ou seja, o tamanho da
amostra). Chamando de “K” o número de classes e de “n” o tamanho da amostra, a
quantidade de classes que serão utilizadas na tabela pode ser calculada da seguinte
forma:
K = 1 + 3, 22 log n
Entretanto, é importante notar que este cálculo pode ser simplificado quando o
conjunto de dados não possui mais de 50 valores. Neste caso, o número K de
classes poderá ser aproximado pela seguinte fórmula:
K = √𝑛
10
A
H=
K
Média
Moda
Variância
Variação Desvio-padrão
Coef. de variação
Como o próprio nome sugere, esse conjunto de medidas nos dão a ideia de
centralidade, sendo a média a mais importante delas, embora não seja a única.
Existem alguns “tipos” de médias, utilizadas em diferentes situações, conforme
veremos a seguir.
𝑋¯ =∑×
n .
11
Assim, para calcularmos a média simples, basta somar todos os valores e dividir pela
quantidade de valores somados.
Exemplo: Suponha que tenhamos um conjunto como os seguintes números:
2, 4, 5, 7 e 12 . A média deste conjunto seria:
2+4+5+7+1
𝑋¯ = 5
𝑋¯ = 6
Média aritmética ponderada: É utilizada quando nem todos os valores do
conjunto têm a mesma importância. Neste caso, damos pesos maiores para os
𝑋¯P ∑ (x .p)
= ∑p .
𝑋¯P
(98×3)+(97×3)+(85×2)+(90×2)
= 3+3+2+2
𝑋¯P 935
= 10
𝑋¯P = 93,5
Moda: É o valor que aparece com a maior frequência num conjunto de dados.
Iremos representa-la por “mo”.
Exemplo: Seja o seguinte conjunto: 2 8 3 5 4 5 3 5 5 1
O elemento de maior frequência (o que aparece mais vezes) é o 5.
12
Dessa forma, mo = 5. Como o conjunto apresente somente uma moda, dizemos que
se trata de um “conjunto modal”. Entretanto, o conjunto de dados pode apresentar
mais de uma moda. Nestes casos, são chamados de “conjunto bimodal” (quando
tem duas modas) ou “conjunto multimodal” (quando tem mais de duas modas).
Vejamos os exemplos abaixo:
Exemplo: Seja o conjunto: 6 10 5 6 10 2.
Os elementos 6 e 10 aparecem com a mesma frequência máxima. Portanto, o
conjunto apresenta duas modas, sendo assim um conjunto bimodal.
Exemplo: No conjunto 2 2 5 2 8 5 8 8 10 10 10 os números 2,8 e 10 aparecem
com a mesma frequência máxima. Portanto, trata-se de um conjunto multimodal.
13
Neste link vocês encontrarão estes conceitos apresentados de outra maneira, com
vídeos e um mapa mental.
https://brasilescola.uol.com.br/matematica/moda-media-mediana.htm
Nos links abaixo, há também uma explicação detalhada sobre a estatística descritiva.
https://integrada.minhabiblioteca.com.br/#/books/9788580553949/cfi/123!/4/2@100:0.00
https://plataforma.bvirtual.com.br/Leitor/Publicacao/402/pdf/0?code=2ukKXGhd5+C7Yc
Xq6w9hQ0VOHovqmN4BLEXyWsNE8YRwcYfoJONADScX8In1UsPqreHiD/pKrwcJVWz
oEVZO+g==
𝑷𝒓𝒊𝒎𝒆𝒊𝒓𝒐 𝒒𝒖𝒂𝒓𝒕𝒊𝒍: 𝒏 + 𝟏
𝟒
𝒏+𝟏
𝑺𝒆𝒈𝒖𝒏𝒅𝒐 𝒒𝒖𝒂𝒓𝒕𝒊𝒍:
𝟐
𝒏+𝟏
𝑻𝒆𝒓𝒄𝒆𝒊𝒓𝒐 𝒒𝒖𝒂𝒓𝒕𝒊𝒍: 𝟑 × ( )
𝟒
Q1 = 18
Q2 = 25
Por fim, o terceiro quartil é o é o número que ocupa a 12ª posição no conjunto:
Q3 = 33
Dessa forma, podemos afirmar que 25% das pessoas pesquisadas têm idade inferior
a 18 anos. 50% delas têm idade inferior a 25 anos e 75% das pessoas têm idade
inferior a 33 anos.
Conjunto B: 12 ; 13 ; 13 ; 14 ; 12 ; 14 ; 12 ; 14 ; 13 ; 13
𝑥̅ = 4 + 5 + 8 + 5 = 22
4 4
𝑥̅ = 5,5
Os termos (x – 𝑥̅)2 são:
(4 - 5,5)2 = 2,25
(5 – 5,5)2 = 0,25
(8 – 5,5)2 = 6,25
(5 – 5,5)2 = 0,25
s2 = ∑(x–x̅ )2
9
n–1 = 4–1
s2 = 3
s = √3
s ≈ 1,73
16
Neste link vocês poderão encontrar mais sobre as medidas de variação e suas
interpretações.
https://pt.khanacademy.org/math/statistics-probability/summarizing-quantitative-
data#variance-standard-deviation-sample
No link abaixo, há mais um pouco sobre o conceito de desvio-padrão.
104:catid=28&Itemid=23
CV = 𝑠/
𝑥̅ ⋅ 100
Ainda considerando o exemplo anterior, o coeficiente de variação daquele conjunto
será:
1,73 × 100
CV = 5,5
CV ≈ 31,45
A renda per capta de um país é a renda total deste país dividida pelo número de
habitantes, ou seja, trata-se de uma média simples. Por outro lado, a distribuição
de renda nos dá uma medida da variação desta renda ao redor da média, ou
seja, nos dá uma ideia de variabilidade. Um país cuja renda apresenta grande
concentração, apresentará uma variância (da renda) alta ou baixa?
18
17
3.1 INTRODUÇÃO
O conceito de simetria sempre remete à ideia de igualdade. Segundo o
dicionário Michaelis, simetria é:
https://pt.khanacademy.org/math/basic-geo/basic-geo-transformations-congruence/line-
of-symmetry/a/symmetry-review
K¯ – mo
A=
s
10 ; 12 ; 15 ; 18 ; 20 ; 12 ; 21 ; 12
∑(x–K¯ )2
s=√
≈ 4,17
n–1
K¯ –
mo
A= 15–12
s = 4,17
A ≈ 0,72
19
3.3 Medida de curtose
1
k= [ (x– K¯ )4
n ∑ (S)4 ] –3
20
Exemplo: Considerando o conjunto de dados do exemplo anterior, temos:
1 (10–15)4+(12–15)4+(15–5)4+(18–15)4+(20–15)4+(12–15)4+(21–1 )4+(12– )4
k =8 [ 4,174 ]– 3
1 2870
k= ( )–3
8 302,37
2870
k = 2418,96 3
k ≈ – 1,81
PRINCÍPIOS DA UNIDADE
PROBABILIDADE
4.1 INTRODUÇÃO
22
inclusive, ser conhecido mesmo antes de iniciar o percurso. É importante
destacar que este não é o tipo de fenômeno estudado pela probabilidade.
A = sair número 6;
23
Como os eventos são subconjuntos do espaço amostral, podemos
então usar a notação e as operações de conjuntos para os eventos. Sendo
assim, se A e B são dois conjuntos quaisquer, temos as seguintes
operações:
A∪B = {x ∈ Ω | x ∈ A ou x ∈ B}
A∩B = {x ∈ Ω | x ∈ A e x ∈ B}
CA= {x ∈ Ω | x ∉ A}
A – B = { x ∈ Ω | x∈ A e x ∉ B}
A∪B = {1; 2; 3; 6}
A∩C = {2; 3}
CA = {4; 5; 6}
CB = {1; 4; 5}
A – B = {1}
O que desejamos aqui é calcular a probabilidade de ocorrência de
cada evento do experimento e, para isso, podemos utilizar algumas das
definições de probabilidade.
24
favoráveis. Como o espaço amostral é Ω = {1; 2; 3; 4; 5; 6}, temos seis casos
possíveis. Assim a probabilidade de ocorrência deste evento seria calculada
da seguinte forma:
3 1
P(A) = =
6 2
25
tenhamos uma estimativa precisa. Dizer que deve ser um “grande número de
vezes” não ajuda muito, não é mesmo?
1) 0 ≤ P(A) ≤ 1;
2) P(Ω) = 1;
3) Se A e B são eventos tais que A∩B = {∅}, então P(A∪B) = P(A) + P(B).
Por fim, o terceiro axioma afirma que, se A e B forem dois eventos tais
que não possam ocorrer simultaneamente (A∩B = {∅}), então a probabilidade
da união dos dois eventos é igual à soma das probabilidades de cada evento
isoladamente.
27
4.4 REGRA DO PRODUTO
28
Isso porque temos 5 bolas brancas e um total de 12 bolas na caixa.
Essa probabilidade mudaria se alguma bola fosse retirada antes (lembremos
que uma bola retirada não retorna para a caixa). Imagine, agora, que uma
bola preta tenha sido retirada. Neste caso, qual a probabilidade de retirarmos
uma bola branca?
5
P(branca | preta) = .
11
29
R3 Ω
R2
B
R1
R1 ∩ R2 = ∅
R1 ∩ R3 = ∅
R2 ∩ R3 = ∅
R1 ∪ R2 ∪ R3 = Ω
Considerando um evento B qualquer (conforme figura), ele pode ser
escrito como:
B=B∩Ω
𝑃(𝐵|𝐴) ∙ 𝑃(𝐴)
𝑃(𝐴|𝐵) =
𝑃(𝐵)
31
Exemplo: Suponha que uma fábrica de peças disponha de duas
máquinas: A e B. Sabe-se que a máquina A é responsável pela produção de
60% das peças e a máquina B é responsável pela produção de 40% delas.
Além disso, sabe-se também que 3% das peças produzidas pela máquina A
e 7% das peças produzidas pela máquina B são defeituosas. Dessa forma,
ao encontrar uma peça defeituosa, qual a probabilidade de que ela tenha
sido produzida pela máquina B? Para resolver, vamos definir os seguintes
eventos:
d = peça defeituosa.
0,028
𝑃(𝐵|𝑑) =
0,046
32
Exemplo: Uma situação muito utilizada como exemplo da aplicação
do teorema de Bayes se refere aos testes usados para detectar doenças. É
sabido que o resultado destes testes pode estar errado em uma proporção
muito pequena dos casos. São os chamados falso positivo e falso negativo.
Um falso positivo ocorre quando uma pessoa está sadia, mas o teste indica
que ela tem a doença. No falso negativo ocorre o oposto: a pessoa tem a
doença, mas o teste dá negativo. Em geral, quando um teste é desenvolvido,
já se estima a probabilidade destes erros ocorrerem, de forma que estas
probabilidades são conhecidas (além de serem muito pequenas, via de
regra). Então, ao se deparar com o resultado positivo de um teste, como
saber se a pessoa está mesmo doente ou se trata de um falso positivo? Na
verdade, não podemos saber com certeza (com base unicamente no teste)
mas podemos calcular a probabilidade de uma pessoa estar realmente
doente, uma vez que o resultado deu positivo. Podemos fazemos isso
através da fórmula de Bayes.
𝑃(𝐴) = 0,01
𝑃(𝐵|𝐴̅) = 0,096 (Probabilidade de dar positivo, dado que não tem câncer)
33
Então, pela fórmula de Bayes:
𝑃(𝐵|𝐴) ∙ 𝑃(𝐴)
𝑃(𝐴|𝐵) =
𝑃(𝐵)
(0,80) ∙ (0,01)
𝑃 ( 𝐴| 𝐵 ) =
(0,80)(0,01) + (0,096)(0,99)
0,008
𝑃(𝐴|𝐵) =
0,008 + 0,09504
0,008
𝑃(𝐴|𝐵) =
0,10304
Uma variável aleatória é uma variável cujos valores são influenciados pelo acaso,
ou seja, os valores assumidos por uma variável aleatória são imprevisíveis.
34
Soma dos Probabilida
resultados de
2 2,8%
3 5,6%
4 8,3%
5 11,1%
6 13,9%
7 16,7%
8 13,9%
9 11,1%
10 8,3%
11 5,6%
12 2,8%
Total 100%
18,0%
16,0%
PROBABILIDADE
14,0%
12,0%
10,0%
8,0%
6,0%
4,0%
2,0%
0,0%
2 3 4 5 6 7 8 9 10 11 12
SOMA DOS RESULTADOS
35
Por serem funções, as distribuições de probabilidade admitem
diversas representações e algumas (...) podem ser expressas por
uma expressão algébrica ou por uma tabela que resume os
principais valores assumidos pela função. A maior parte dos
usuários da estatística nas mais diversas áreas de atuação
precisa aprender a usar essas representações de forma a otimizar
e potencializar o uso desta ferramenta tão importante. Não basta
saber aplicar uma fórmula ou usar uma tabela, mas interpretar o
problema proposto adequadamente, escolhendo assim os
recursos adequados para sua resolução e interpretando seus
resultados dentro do contexto no qual o problema foi proposto
(NOVAIS & COUTINHO, 2013, p. 142).
𝑛!
𝑃(𝑥) = x n–x
𝑥! (𝑛 − 𝑥)! ∙ 𝑝 ∙ (1 − 𝑝)
Onde:
36
p = probabilidade de sucesso (deve permanecer constante em cada
repetição).
Exemplo: Suponha que uma moeda não viciada seja arremessada 5 vezes.
Assim, qual seria a probabilidade de sair “cara” 3 vezes?
n=5
x=3
p = 0,5 (perceba que a moeda não é viciada, então a probabilidade de sair
cara é 50%)
Logo:
5!
𝑃(𝑥) =
3! (5 − ∙ (0,5)3 ∙ (1 − 0,5)5–3
3)!
120
𝑃 (𝑥) = ∙ (0,125) ∙ (0,25)
6×
2
𝑃(𝑥) = 10 × 0,03125
n=4
x=3
p=
0,45
4!
𝑃(𝑥) = ∙ (0,45)3 ∙ (1 − 0,45)4–3
3! (4 −
3)!
37
𝑃 (𝑥) = 24
∙ (0,091125) ∙ (0,55)
6×
1
𝑃(𝑥) = 4 × 0,050
𝑃(𝑥) = 0,2 𝑜𝑢 20
n = 10
x=5
p = 0,03
10!
𝑃(𝑥) =
5! (10 − ∙ (0,03)5 ∙ (1 − 0,03)10–5
5 )!
𝑋~ 𝐵𝑖(3; 5)
39
Cabe ressaltar que a distribuição normal tem certas características que
precisamos conhecer:
o desvio-padrão (σ). Dessa forma, se “X” é uma variável aleatória que segue
uma distribuição normal, então podemos escrever da seguinte forma:
𝑋 ~𝑁(𝜇; 𝜎2). Para cada valor da média e da variância, existe uma curva
(gráfico) diferente. Assim, a forma da curva depende da variância e, quanto
menor ela for, mais alta e estreita será a curva.
–(x–μ)2
𝑒 2σ2
𝑓(𝑥) =
𝜎√2𝜋
Onde:
𝜋 = 3,1416 …
𝑒 = 2,7183 …
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑜 − 𝑝𝑎𝑑𝑟ã𝑜 𝑑𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜
𝜇 = 𝑚é𝑑𝑖𝑎 𝑑𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜
40
Apesar de ser uma função aparentemente complexa, na maioria dos
casos práticos (inclusive naqueles que estudaremos aqui) não é necessário
manuseá-la, desde que entendamos suas características mais importantes.
100%
50% 50%
41
34,13% 34,13
μ-σ μ+σ
μ
μ - 2σ μ μ + 2σ
47,72 47,72
42
μ - 3σ μ μ + 3σ
49,87% 49,87%
aleatória “X” segue uma distribuição normal com média igual a μ e desvio-
média que é 1,70 (1,90 = μ + 1σ). Como vimos acima, 34,13% dos valores
encontram-se neste intervalo. Sendo assim a probabilidade de encontrarmos
alguém neste intervalo é exatamente 34,13%.
43
34,13%
1,70 1,90
0,341 0,1587
1,70 1,90
0,4772 0,341
45
A distribuição normal padrão (geralmente simbolizada por Z) é uma distribuição
normal cuja média é igual a zero e cujo desvio-padrão é igual a um. Assim
Z~N(0;1).
𝑥−𝜇
𝑧=
𝜎
Exemplo: Suponha que o tempo necessário para concluir uma prova siga
uma distribuição normal com média igual a 60min e desvio padrão igual a
15min. Se um aluno for selecionado ao acaso, qual a probabilidade de que
demore mais de 40min para concluir a prova? O gráfico abaixo ilustra esta
situação. Percebam que procuramos pela área que se encontra à direita de
40. Isso inclui a área que vai de 40 a 60 e toda a área que está acima de 60.
Sabemos que esta área que está acima de 60 é igual a 0,5 (uma vez que 60
é a média). Mas qual o tamanho da área que vai de 40 a 60? Ou seja, qual a
probabilidade de uma pessoa concluir a prova com tempo entre 40min e
60min? Para descobrirmos, vamos primeiramente padronizar a distribuição.
𝑥−𝜇
𝑧=
𝜎
40 − 60
𝑧=
15
𝑧 = −1,33
Lembre-se que o sinal negativo indica apenas que o valor se encontra abaixo
da média.
46
45 60 X
-1,33 0 Z
𝑃(−1,33 ≤ 𝑧 ≤ 0) = 0,40824
Obs.: Para consultar a tabela, temos que a parte inteira e a 1ª decimal é 1,3
e a segunda decimal é 3. Assim, nosso valor está no cruzamento da 14ª linha com a
4ª coluna. Observe que não é necessário incluir o sinal negativo.
47
Mas, como mencionado acima, precisamos acrescentar a
probabilidade de Z assumir um valor maior que zero (que é igual à
probabilidade de X assumir um valor maior que 60). Como vimos, essa
probabilidade é igual a 0,5. Então temos que:
48
Nos links abaixo vocês encontrarão mais detalhes sobre probabilidade e
distribuição de probabilidades.
https://integrada.minhabiblioteca.com.br/#/books/9788580553949/cfi/183!/4/4@0.
00:0.00
https://plataforma.bvirtual.com.br/Leitor/Publicacao/402/pdf/0?code=2ukKXGhd5+
C7YcXq6w9hQ0VOHovqmN4BLEXyWsNE8YRwcYfoJONADScX8In1UsPqreHiD/
pKrwcJVWzoEVZO+g==
INFERÊNCIA UNIDADE
ESTATÍSTICA
5.1 INTRODUÇÃO
UNIVERSO
AMOSTRAGEM
INFERÊNCIA
AMOSTRA
51
estatísticas calculadas a partir de um conjunto de amostras diferentes do
mesmo universo.
5.2 ESTIMAÇÃO
52
Teorema Central do Limite: a média de uma distribuição amostral de
médias sempre será igual à média populacional.
Exemplo: Imagine que uma turma tenha apenas quatro alunos e que suas
notas (elementos do universo ou da população em questão) sejam: 9; 6; 8; 5.
Neste caso, a média populacional será:
9+6+8+5
𝜇=
4
𝜇=7
𝑋¯1 9+6+8
= = 7,67
3
𝑋¯2 9+8+5
= = 7,33
3
𝑋¯3 6+8+5
= = 6,33
3
𝑋¯4 5+9+6
= = 6,67
3
53
A partir de agora, discutiremos como podemos estimar o desvio-
padrão de uma distribuição amostral. Para isso, precisamos considerar duas
possiblidades: se conhecemos ou não o desvio-padrão da população. Em
ambas as considerações, assumimos que os dados seguem uma distribuição
normal.
No caso em que o desvio-padrão da população é conhecido ou o
número de elementos da amostra é grande (n > 30), o desvio-padrão da
distribuição amostral poderá ser calculado da seguinte forma:
𝜎
𝜎x =
√𝑛
Onde:
σ = desvio-padrão da população;
n = tamanho da amostra.
𝜇 = 𝑋¯ = 150
54
50
𝜎x = ≈ 4,56
√120
O vídeo que pode ser acessado através do link abaixo traz uma explicação bem
didática sobre estimadores e parâmetros populacionais.
https://www.youtube.com/watch?v=jKGhnQ1WCHY
Nos links abaixo vocês encontrarão uma explicação completa e mais detalhada
sobre o processo de estimação de parâmetros.
https://integrada.minhabiblioteca.com.br/#/books/9788580553949/cfi/303!/4/2@10
0:0.00
https://plataforma.bvirtual.com.br/Leitor/Publicacao/402/pdf/0?code=2ukKXGhd5+
C7YcXq6w9hQ0VOHovqmN4BLEXyWsNE8YRwcYfoJONADScX8In1UsPqreHiD/
pKrwcJVWzoEVZO+g==
6.1. INTRODUÇÃO
Na unidade anterior, vimos que o valor de uma estatística calculada
com base em uma única amostra do universo, não é necessariamente igual
ao parâmetro populacional que estamos tentando conhecer. Imagine que
estamos tentando conhecer a média μ de uma determinada população (ou
universo). Para isso, retiramos uma amostra (de tamanho “n”) e, com os
valores desta amostra, calculamos a estatística 𝑋¯ . Como vimos, se tivéssemos
selecionado uma outra amostra do mesmo tamanho, a estatística teria
provavelmente um valor diferente. Então, como fazer alguma afirmação
sobre um
parâmetro populacional, é natural que queiramos saber se os dados
provenientes de uma amostra contrariam ou não esta afirmação. Neste caso,
o que deveríamos fazer é um “teste de hipóteses”. Vejamos o seguinte
exemplo:
𝐻0: 𝜇 = 1,70
{𝐻1: 𝜇 > 1,70
Onde:
𝐻0: 𝜇 = 1,70
{𝐻1: 𝜇 < 1,70 (teste unilateral)
𝐻0: 𝜇 = 1,70
{𝐻1: 𝜇 ≠ 1,70 (teste bilateral)
Decisão Se H0 é Se H0 é
verdadeira falsa
Rejeitar Erro tipo I Nenhum
H0 erro
Aceitar Nenhum erro Erro tipo II
H0
57
A probabilidade de cometermos um erro do tipo I é chamada de “nível de
𝑋¯ − 𝜇0
𝑍= 𝜎
√𝑛
Aqui, μ0 é o valor que se supõe para o parâmetro (valor que está sendo
𝐻0: 𝜇 = 1,70
{𝐻1: 𝜇 > 1,70
𝑋¯ − 𝜇0
𝑍= 𝜎
√𝑛
1,72 − 1,70
𝑍=
0,5
√100
0,02 59
𝑍=
𝑍=
0,5 0,02
10 0,05
𝑍 = 0,4
Para obtermos o valor de referência, vamos estabelecer um nível de
significância de 5% (ou 0,05). Sabendo que Z segue uma distribuição normal
padrão, podemos usar a tabela desta distribuição. O valor correspondente a
uma probabilidade igual a 0,05 é 1,64. Como nossa estatística de teste foi
menor que este valor, não rejeitamos a hipótese nula. Isso significa que os
dados não contêm evidência suficiente para afirmarmos que a média de
altura dos habitantes seja maior que 1,70. Uma outra forma de chegarmos a
esta conclusão é através do p-valor associado à estatística de teste.
Consultando o valor desta estatística na tabela, encontramos uma
probabilidade igual a 0,15542 (quinta linha com a primeira coluna). Este valor
é claramente maior que o nível de significância (0,05). Sempre que o p-valor
for maior que o nível de significância, não rejeitamos H0.
𝐻0: 𝜇 = 1,70
{𝐻1: 𝜇 ≠ 1,70
60
6.2.2 Teste com variância populacional desconhecida
𝑋¯ − 𝜇0
𝑇= 𝑠
√𝑛
𝐻0: 𝜇 = 1,70
{𝐻1: 𝜇 > 1,70
𝑋¯ − 𝜇0
𝑇= 𝑠
√𝑛
1,72 − 1,70
𝑇=
0,6
√25
0,02 61
𝑇=
0,6 ≈ 1,17
5
Consultando a tabela abaixo com nível de significância de 0,05 (na
tabela consta 0,95 na primeira linha pois trás o a probabilidade acumulada) 1
com v = 24 graus de liberdade (v = 25 – 1), encontramos o valor de
referência igual a 1,711. Como nossa estatistica de teste é menor que o valor
de referência, então não rejeitamos a hipótese nula. Da mesma forma, isso
significa que os dados da amostra não contêm evidência suficiente para
afirmarmos que a média de altura dos habitantes deste município seja maior
que 1,70m.
Nos links abaixo, você encontrará mais sobre testes de hipóteses como testes
para outros parâmetros populacionais e exemplos de aplicações.
http://www.portalaction.com.br/inferencia/testes-de-hipoteses
https://pt.wikipedia.org/wiki/Testes_de_hip%C3%B3teses#Teste_de_hip%C3%B3
teses_usando_p%E2%80%93valor
Nestes outros links, vocês encontrarão mais explicações sobre o teste de
hipóteses e sua aplicação na gestão.
https://integrada.minhabiblioteca.com.br/#/books/9788580553949/cfi/349!/4/2@10
0:0.00
https://plataforma.bvirtual.com.br/Leitor/Publicacao/402/pdf/0?code=2ukKXGhd5+
C7YcXq6w9hQ0VOHovqmN4BLEXyWsNE8YRwcYfoJONADScX8In1UsPqreHiD/
pKrwcJVWzoEVZO+g==
1
O nível de significância desejado deve ser subtraído de 1 para que possamos usar a tabela. Assim, o
nível de significância de 0,05 será α = 1 – 0,05 (α = 0,95). Obviamente, o nível de significância de 0,01
seria α = 1 – 0,01 (α = 0,99).
62
63
REFERÊNCIAS BIBLIOGRÁFICAS
DOANE, David P.; SEWARD, Lori E. Estatística Aplicada à Administração
e Economia [recurso eletrônico]. 4 ed.- Dados eletrônicos. Porto Alegre:
AMGH, 2014.
MCCLAVE, James T. Estatística para administração e economia. São
Paulo: Pearson Prentice Hall, 2009.
NOVAES, Diva V.; COUTINHO, Cileida Q. Estatística para educação
profissional e tecnológica. 2 ed. São Paulo: Atlas, 2013
SILVA, Ermes M. et al. Estatística para os cursos de economia,
administração e ciências contábeis. 4 ed. São Paulo: Atlas, 2010.
TRIOLA, Mário F. Introdução à estatística. 10 ed. Rio de Janeiro: 2013.
64