Você está na página 1de 202

Inferência Estatística

Conceitos básicos

Prof. Paulo Cerqueira Junior


Introdução e conceitos básicos
Papel da estatística

▶ No planejamento, auxilia na escolha de situações experimentais e na determinação


da quantidade de indivíduos a serem examinados;
Papel da estatística

▶ No planejamento, auxilia na escolha de situações experimentais e na determinação


da quantidade de indivíduos a serem examinados;
▶ Na análise, indica técnicas para resumir e apresentar as informações, bem como
para comparar as situações experimentais;
Papel da estatística

▶ No planejamento, auxilia na escolha de situações experimentais e na determinação


da quantidade de indivíduos a serem examinados;
▶ Na análise, indica técnicas para resumir e apresentar as informações, bem como
para comparar as situações experimentais;
▶ Na elaboração das conclusões, os vários métodos estatísticos permitem generalizar
a partir dos resultados obtidos.
Papel da estatística

Estatística como parte de um processo:


Conceitos básicos

Estatística é a ciência que tem por objetivo orientar a coleta, o resumo, a


apresentação, a análise e a interpretação de dados.
Conceitos básicos

Estatística é a ciência que tem por objetivo orientar a coleta, o resumo, a


apresentação, a análise e a interpretação de dados.
Conceitos básicos

Estatística é a ciência que tem por objetivo orientar a coleta, o resumo, a


apresentação, a análise e a interpretação de dados.

▶ Estatística descrtiva:
Descrever através de tabelas, gráficos e
medidas de resumo o fenômeno em
questão.
Conceitos básicos

Estatística é a ciência que tem por objetivo orientar a coleta, o resumo, a


apresentação, a análise e a interpretação de dados.

▶ Estatística descrtiva: ▶ Inferência estatística:


Descrever através de tabelas, gráficos e Obter e generalizar conclusões em uma
medidas de resumo o fenômeno em amostra baseado na Teoria das
questão. probabilidades.
Conceitos básicos

Estatística é a ciência que tem por objetivo orientar a coleta, o resumo, a


apresentação, a análise e a interpretação de dados.

▶ Estatística descrtiva: ▶ Inferência estatística:


Descrever através de tabelas, gráficos e Obter e generalizar conclusões em uma
medidas de resumo o fenômeno em amostra baseado na Teoria das
questão. probabilidades.

A combinação das duas completam uma análise estatística.


Conceitos básicos

Unidade experimental ou unidade de observação é a menor unidade a fornecer


informação.
Conceitos básicos

Unidade experimental ou unidade de observação é a menor unidade a fornecer


informação.
Ex: pessoas, animais, plantas, objetos, fatos, etc
Conceitos básicos

Unidade experimental ou unidade de observação é a menor unidade a fornecer


informação.
Ex: pessoas, animais, plantas, objetos, fatos, etc

Dados são as informações obtidas de uma unidade experimental ou observacional.


Conceitos básicos

Unidade experimental ou unidade de observação é a menor unidade a fornecer


informação.
Ex: pessoas, animais, plantas, objetos, fatos, etc

Dados são as informações obtidas de uma unidade experimental ou observacional.


Ex: “Vitor tem 25 anos e é fumante”, os dados são “25 anos” e “fumante”
Conceitos básicos

Unidade experimental ou unidade de observação é a menor unidade a fornecer


informação.
Ex: pessoas, animais, plantas, objetos, fatos, etc

Dados são as informações obtidas de uma unidade experimental ou observacional.


Ex: “Vitor tem 25 anos e é fumante”, os dados são “25 anos” e “fumante”
Conceitos básicos

Variável é toda característica que, observada em uma unidade experimental, pode


variar de um indivíduo para outro.
Conceitos básicos

Variável é toda característica que, observada em uma unidade experimental, pode


variar de um indivíduo para outro.
Ex: idade, sexo, altura em centímetros, peso em gramas, classificação das águas, nível
de oxigênio em lagos em mg/L, etc. . .
Conceitos básicos

Variável é toda característica que, observada em uma unidade experimental, pode


variar de um indivíduo para outro.
Ex: idade, sexo, altura em centímetros, peso em gramas, classificação das águas, nível
de oxigênio em lagos em mg/L, etc. . .

É importante identificar que tipo de variável está sendo estudado, uma vez que
são recomendados procedimentos estatísticos diferentes em cada situação.
Conceitos básicos
Conceitos básicos
Exercício

Classifique as variáveis com respeito ao tipo.


▶ Perguntas:
1. Cor dos olhos.
2. Número de casos de COVID-19 no
estado do Pará.
3. Velocidade média (em km/h) de
um avião ao aterrissar em um
aeroporto.
4. Nível de poluição no ar (Baixo,
Médio e Alto).
5. Tipos de processador para celular.
6. Idade dos alunos da UFPA.
7. Precipitação pluviométrica de um
dia no estado do Pará.
Exercício

Classifique as variáveis com respeito ao tipo.


▶ Perguntas: ▶ Respostas:
1. Cor dos olhos. 1. Qualitativa nominal.
2. Número de casos de COVID-19 no
estado do Pará.
3. Velocidade média (em km/h) de
um avião ao aterrissar em um
aeroporto.
4. Nível de poluição no ar (Baixo,
Médio e Alto).
5. Tipos de processador para celular.
6. Idade dos alunos da UFPA.
7. Precipitação pluviométrica de um
dia no estado do Pará.
Exercício

Classifique as variáveis com respeito ao tipo.


▶ Perguntas: ▶ Respostas:
1. Cor dos olhos. 1. Qualitativa nominal.
2. Número de casos de COVID-19 no 2. Quantitativa discreta.
estado do Pará.
3. Velocidade média (em km/h) de
um avião ao aterrissar em um
aeroporto.
4. Nível de poluição no ar (Baixo,
Médio e Alto).
5. Tipos de processador para celular.
6. Idade dos alunos da UFPA.
7. Precipitação pluviométrica de um
dia no estado do Pará.
Exercício

Classifique as variáveis com respeito ao tipo.


▶ Perguntas: ▶ Respostas:
1. Cor dos olhos. 1. Qualitativa nominal.
2. Número de casos de COVID-19 no 2. Quantitativa discreta.
estado do Pará. 3. Quantitativa contínua.
3. Velocidade média (em km/h) de
um avião ao aterrissar em um
aeroporto.
4. Nível de poluição no ar (Baixo,
Médio e Alto).
5. Tipos de processador para celular.
6. Idade dos alunos da UFPA.
7. Precipitação pluviométrica de um
dia no estado do Pará.
Exercício

Classifique as variáveis com respeito ao tipo.


▶ Perguntas: ▶ Respostas:
1. Cor dos olhos. 1. Qualitativa nominal.
2. Número de casos de COVID-19 no 2. Quantitativa discreta.
estado do Pará. 3. Quantitativa contínua.
3. Velocidade média (em km/h) de 4. Qualitativa ordinal.
um avião ao aterrissar em um
aeroporto.
4. Nível de poluição no ar (Baixo,
Médio e Alto).
5. Tipos de processador para celular.
6. Idade dos alunos da UFPA.
7. Precipitação pluviométrica de um
dia no estado do Pará.
Exercício

Classifique as variáveis com respeito ao tipo.


▶ Perguntas: ▶ Respostas:
1. Cor dos olhos. 1. Qualitativa nominal.
2. Número de casos de COVID-19 no 2. Quantitativa discreta.
estado do Pará. 3. Quantitativa contínua.
3. Velocidade média (em km/h) de 4. Qualitativa ordinal.
um avião ao aterrissar em um 5. Qualitativa nominal.
aeroporto.
4. Nível de poluição no ar (Baixo,
Médio e Alto).
5. Tipos de processador para celular.
6. Idade dos alunos da UFPA.
7. Precipitação pluviométrica de um
dia no estado do Pará.
Exercício

Classifique as variáveis com respeito ao tipo.


▶ Perguntas: ▶ Respostas:
1. Cor dos olhos. 1. Qualitativa nominal.
2. Número de casos de COVID-19 no 2. Quantitativa discreta.
estado do Pará. 3. Quantitativa contínua.
3. Velocidade média (em km/h) de 4. Qualitativa ordinal.
um avião ao aterrissar em um 5. Qualitativa nominal.
aeroporto. 6. Quantitativa discreta.
4. Nível de poluição no ar (Baixo,
Médio e Alto).
5. Tipos de processador para celular.
6. Idade dos alunos da UFPA.
7. Precipitação pluviométrica de um
dia no estado do Pará.
Exercício

Classifique as variáveis com respeito ao tipo.


▶ Perguntas: ▶ Respostas:
1. Cor dos olhos. 1. Qualitativa nominal.
2. Número de casos de COVID-19 no 2. Quantitativa discreta.
estado do Pará. 3. Quantitativa contínua.
3. Velocidade média (em km/h) de 4. Qualitativa ordinal.
um avião ao aterrissar em um 5. Qualitativa nominal.
aeroporto. 6. Quantitativa discreta.
4. Nível de poluição no ar (Baixo, 7. Quantitativa contínua.
Médio e Alto).
5. Tipos de processador para celular.
6. Idade dos alunos da UFPA.
7. Precipitação pluviométrica de um
dia no estado do Pará.
Conceitos básicos

População ou universo: esse termo é usado em estatística com um sentido bem mais
amplo do que na linguagem coloquial. É entendido aqui como todo conjunto de
unidades experimentais (ou observacionais) que apresenta uma ou mais características
em comum.
Conceitos básicos

População ou universo: esse termo é usado em estatística com um sentido bem mais
amplo do que na linguagem coloquial. É entendido aqui como todo conjunto de
unidades experimentais (ou observacionais) que apresenta uma ou mais características
em comum.
Ex: a população de universitários de 20 anos de Belém (que têm em comum a idade e
o local onde vivem)
Conceitos básicos

Amostra: é qualquer fração de uma população. Como sua finalidade é representar a


população, deseja-se que a amostra escolhida apresente as mesmas características da
população de origem, isto é, que seja uma amostra “representativa” ou
“não-tendenciosa”.
Conceitos básicos

Amostra: é qualquer fração de uma população. Como sua finalidade é representar a


população, deseja-se que a amostra escolhida apresente as mesmas características da
população de origem, isto é, que seja uma amostra “representativa” ou
“não-tendenciosa”.
Tanto o número de indivíduos selecionados para a amostra quanto a técnica de seleção
são extremamente importantes para que os resultados obtidos no estudo sejam
generalizados para a população.
Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Pode ser classificada de duas formas:
Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Pode ser classificada de duas formas:
▶ Probabilística: envolvendo conceitos de probabilidade no sorteio dos indivíduos;
Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Pode ser classificada de duas formas:
▶ Probabilística: envolvendo conceitos de probabilidade no sorteio dos indivíduos;
▶ Não-Probabilística: os elementos amostrais são obtidos por cotas, conveniência.
Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Pode ser classificada de duas formas:
▶ Probabilística: envolvendo conceitos de probabilidade no sorteio dos indivíduos;
▶ Não-Probabilística: os elementos amostrais são obtidos por cotas, conveniência.
Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Pode ser classificada de duas formas:
▶ Probabilística: envolvendo conceitos de probabilidade no sorteio dos indivíduos;
▶ Não-Probabilística: os elementos amostrais são obtidos por cotas, conveniência.

Vantagens de realizar uma amostragem:


Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Pode ser classificada de duas formas:
▶ Probabilística: envolvendo conceitos de probabilidade no sorteio dos indivíduos;
▶ Não-Probabilística: os elementos amostrais são obtidos por cotas, conveniência.

Vantagens de realizar uma amostragem:


▶ Economia, quando o número de dados é muito grande, e além do mais a
qualidade da informação e maior;
Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Pode ser classificada de duas formas:
▶ Probabilística: envolvendo conceitos de probabilidade no sorteio dos indivíduos;
▶ Não-Probabilística: os elementos amostrais são obtidos por cotas, conveniência.

Vantagens de realizar uma amostragem:


▶ Economia, quando o número de dados é muito grande, e além do mais a
qualidade da informação e maior;
▶ Custo reduzido, já que se trabalha com um número reduzido de informações;
Conceitos básicos
Amostragem: é a estratégia utilizada para a obtenção de uma amostra em uma
população de interesse.
Pode ser classificada de duas formas:
▶ Probabilística: envolvendo conceitos de probabilidade no sorteio dos indivíduos;
▶ Não-Probabilística: os elementos amostrais são obtidos por cotas, conveniência.

Vantagens de realizar uma amostragem:


▶ Economia, quando o número de dados é muito grande, e além do mais a
qualidade da informação e maior;
▶ Custo reduzido, já que se trabalha com um número reduzido de informações;
▶ Ganho de tempo, pois se consegue uma informação mais rápida em menos tempo
do que quando se trabalha com toda população.
Conceitos básicos
Organização e apresentação de dados
Organização dados

Exemplo 1: Deseja-se avaliar a idade (anos) e altura (cm) de alunos de 20 alunos da


disciplina de probabilidade e estatística da UFPA.
Idade:

[1] 21 20 20 20 22 21 21 23 21 20 19 19 20 21 21 20 19 21 22 21

Altura:

[1] 1.62 1.83 1.70 1.72 1.75 1.66 1.70 1.77 1.80 1.64 1.61 1.71 1.60 1.43 1.59
[16] 1.61 1.86 1.80 1.80 1.59
Organização dados

Exemplo 2: Deseja-se avaliar ao gênero (anos) e linguagem de programação peferida


para trabalho de alunos de 20 alunos da disciplina de probabilidade e estatística da
UFPA.

[1] "Masc." "Masc." "Fem." "Fem." "Masc." "Masc." "Masc." "Masc." "Masc."
[10] "Masc." "Masc." "Masc." "Masc." "Masc." "Masc." "Masc." "Fem." "Fem."
[19] "Masc." "Masc."

Altura:

[1] "Phyton" "R" "C++" "Phyton" "R" "R" "Outra" "Phyton"


[9] "Outra" "R" "C++" "Phyton" "Phyton" "C++" "Phyton" "C++"
[17] "C++" "Phyton" "C++" "Outra"
Organização dados
A tabela completa dos dados é:

Idade Altura Gênero Linguagem


1 21 1.62 Masc. Phyton
2 20 1.83 Masc. R
3 20 1.70 Fem. C++
4 20 1.72 Fem. Phyton
5 22 1.75 Masc. R
6 21 1.66 Masc. R
7 21 1.70 Masc. Outra
8 23 1.77 Masc. Phyton
9 21 1.80 Masc. Outra
10 20 1.64 Masc. R
11 19 1.61 Masc. C++
12 19 1.71 Masc. Phyton
13 20 1.60 Masc. Phyton
14 21 1.43 Masc. C++
15 21 1.59 Masc. Phyton
16 20 1.61 Masc. C++
17 19 1.86 Fem. C++
18 21 1.80 Fem. Phyton
19 22 1.80 Masc. C++
20 21 1.59 Masc. Outra
Medidas de Resumo para dados brutos.
Organização de dados
Organização de dados

São medidas muito úteis para resumo de dados brutos de natureza qualititativa (dados
em intervalos) e quantitativa.
Organização de dados

São medidas muito úteis para resumo de dados brutos de natureza qualititativa (dados
em intervalos) e quantitativa.
▶ Medidas de tendência central:
Organização de dados

São medidas muito úteis para resumo de dados brutos de natureza qualititativa (dados
em intervalos) e quantitativa.
▶ Medidas de tendência central:
▶ Média, mediana, Moda
Organização de dados

São medidas muito úteis para resumo de dados brutos de natureza qualititativa (dados
em intervalos) e quantitativa.
▶ Medidas de tendência central:
▶ Média, mediana, Moda
▶ Medidas de dispersão:
Organização de dados

São medidas muito úteis para resumo de dados brutos de natureza qualititativa (dados
em intervalos) e quantitativa.
▶ Medidas de tendência central:
▶ Média, mediana, Moda
▶ Medidas de dispersão:
▶ Amplitude, variância, desvio-padrão.
Organização de dados

São medidas muito úteis para resumo de dados brutos de natureza qualititativa (dados
em intervalos) e quantitativa.
▶ Medidas de tendência central:
▶ Média, mediana, Moda
▶ Medidas de dispersão:
▶ Amplitude, variância, desvio-padrão.
Medidas de tendência central - Média

Média: Interpretado como o “centro de gravidade”, ponto de equilíbrio ou o valor


esperado.

Seja X1 , X2 , . . . , Xn valores de uma determinada variável X , temos que a média é


expressa por

n
P
Xi
X1 + X2 + · · · + Xn i=1
X̄ = = .
n n
Medidas de tendência central - Média

Média: Interpretado como o “centro de gravidade”, ponto de equilíbrio ou o valor


esperado.

Seja X1 , X2 , . . . , Xn valores de uma determinada variável X , temos que a média é


expressa por

n
P
Xi
X1 + X2 + · · · + Xn i=1
X̄ = = .
n n

Comumente chamada de média artimética, ou “x-barra”.


Medidas de tendência central - Média

Exemplo 1: Sejam dez valores de medições de dados de velocidade do vento (km/h):

1.7 2.6 2.7 2.9 3.17 3.37 3.47 3.7 3.8 3.9
Medidas de tendência central - Média

Exemplo 1: Sejam dez valores de medições de dados de velocidade do vento (km/h):

1.7 2.6 2.7 2.9 3.17 3.37 3.47 3.7 3.8 3.9

Assim, a expressão para o cálculo da média da velocidade do vento é,

1.7 + 2.60 + 2.7 + 2.9 + 3.17 + 3.37 + 3.47 + 3.7 + 3.8 + 3.9
X̄ = = 3.131.
10
Medidas de tendência central - Média

Exemplo 1: Sejam dez valores de medições de dados de velocidade do vento (km/h):

1.7 2.6 2.7 2.9 3.17 3.37 3.47 3.7 3.8 3.9

Assim, a expressão para o cálculo da média da velocidade do vento é,

1.7 + 2.60 + 2.7 + 2.9 + 3.17 + 3.37 + 3.47 + 3.7 + 3.8 + 3.9
X̄ = = 3.131.
10

Logo, a velocidade média do vento é de 3.131 km/h .


Medidas de variabilidade
Medidas de variabilidade

As medidas de tendência central nos dão uma ideia da concentração dos dados em
torno de um valor.

Entretanto, é preciso também conhecer suas características de espalhamento ou


dispersão - medidas de variabilidade(ou dispersão).
Variância

Definição: É uma medida de variabilidade em torno da média.


Variância

Definição: É uma medida de variabilidade em torno da média.

Exemplo: Suponha que tenhamos os valores de alturas em cm de crianças


diagnosticadas com Chagas e que X̄ = 75cm. Assim, poderíamos ter os seguintes
cenários:
Variância

Definição: É uma medida de variabilidade em torno da média.

Exemplo: Suponha que tenhamos os valores de alturas em cm de crianças


diagnosticadas com Chagas e que X̄ = 75cm. Assim, poderíamos ter os seguintes
cenários:
Variância
A expressão para o calculo da variância é dada por:
Populacional

N
(Xi − X̄ )2
P
i=1
σ2 = .
N

Amostral

n
(Xi − X̄ )2
P
i=1
S2 = .
n−1
Variância
A expressão para o calculo da variância é dada por:
Populacional

N
(Xi − X̄ )2
P
i=1
σ2 = .
N

Amostral

n
(Xi − X̄ )2
P
i=1
S2 = .
n−1

Geralmente estaremos utilizando S 2 por estarmos trabalhando com amostras.


Desvio Padrão
Também é uma medida de variabilidade em torno da média.
Está diretamente relacionado com a variâcia.
Expresso pela raiz quadrada da variância, ou seja:
Populacional
v
u N
u (Xi − X̄ )2
uP
t i=1
σ= .
N
Amostral
v
u n
uP
u (Xi − X̄ )2
t i=1
S= .
n−1
Desvio Padrão
Também é uma medida de variabilidade em torno da média.
Está diretamente relacionado com a variâcia.
Expresso pela raiz quadrada da variância, ou seja:
Populacional
v
u N
u (Xi − X̄ )2
uP
t i=1
σ= .
N
Amostral
v
u n
uP
u (Xi − X̄ )2
t i=1
S= .
n−1
Geralmente estaremos utilizando S por estarmos trabalhando com amostras.
Desvio Padrão
Também é uma medida de variabilidade em torno da média.
Está diretamente relacionado com a variâcia.
Expresso pela raiz quadrada da variância, ou seja:
Populacional
v
u N
u (Xi − X̄ )2
uP
t i=1
σ= .
N
Amostral
v
u n
uP
u (Xi − X̄ )2
t i=1
S= .
n−1
Geralmente estaremos utilizando S por estarmos trabalhando com amostras. Qual a
Desvio Padrão
Também é uma medida de variabilidade em torno da média.
Está diretamente relacionado com a variâcia.
Expresso pela raiz quadrada da variância, ou seja:
Populacional
v
u N
u (Xi − X̄ )2
uP
t i=1
σ= .
N
Amostral
v
u n
uP
u (Xi − X̄ )2
t i=1
S= .
n−1
Geralmente estaremos utilizando S por estarmos trabalhando com amostras. Qual a
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37


Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

S2
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

S2 =
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 =
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 +
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 +
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)

+
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)

+(3.17
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)

+(3.17 − 2.75)
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)

+(3.17 − 2.75)2
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)

+(3.17 − 2.75)2 +
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)

+(3.17 − 2.75)2 + (3.37


Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)

+(3.17 − 2.75)2 + (3.37 − 2.75)


Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

S2
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

S2 =
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 =
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 +
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2 +
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2 + (0.15)
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2 + (0.15)2
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2 + (0.15)2 +
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2 + (0.15)2 + (0.42)
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2 + (0.15)2 + (0.42)2
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2 + (0.15)2 + (0.42)2 +
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h
S2 = (−1.05)2 + (−0.15)2 + (0.15)2 + (0.42)2 + (0.62)
4
Exemplo
Exemplo Sejam os seguintes valores de dados de velocidade do vento (km/h):

1.70 2.60 2.90 3.17 3.37

A média dos dados é igual à 2.75. Logo, para o cálculo iremos subtrair de cada valor o
valor da média e elevar o resultado ao quadrado. Dessa forma, temos a variância da
seguinte forma,

1 h
S2 = (1.70 − 2.75)2 + (2.60 − 2.75)2 + (2.90 − 2.75)2 +
(5 − 1)
i
+(3.17 − 2.75)2 + (3.37 − 2.75)2

Realizando as diferenças temos,

1h i
S2 = (−1.05)2 + (−0.15)2 + (0.15)2 + (0.42)2 + (0.62)2
4
Exemplo
Elevando as diferenças ao quadrado,
Exemplo
Elevando as diferenças ao quadrado,

S2
Exemplo
Elevando as diferenças ao quadrado,

S2 =
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025)
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) +
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225)
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) +
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225)
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) +
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764)
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) +
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por


Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

S2
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 =
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = =
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = = 0.43 km/h2
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = = 0.43 km/h2
4

Para encontrar o desvio-padrão, basta tomar a raiz quadrada de S 2


Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = = 0.43 km/h2
4

Para encontrar o desvio-padrão, basta tomar a raiz quadrada de S 2

S
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = = 0.43 km/h2
4

Para encontrar o desvio-padrão, basta tomar a raiz quadrada de S 2

S=
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = = 0.43 km/h2
4

Para encontrar o desvio-padrão, basta tomar a raiz quadrada de S 2

r
1.7083
S=
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = = 0.43 km/h2
4

Para encontrar o desvio-padrão, basta tomar a raiz quadrada de S 2

r
1.7083
S= =
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = = 0.43 km/h2
4

Para encontrar o desvio-padrão, basta tomar a raiz quadrada de S 2

r
1.7083
S= = 0.65 km/h.
4
Exemplo
Elevando as diferenças ao quadrado,

1
S2 = [(1.1025) + (0.0225) + (0.0225) + (0.1764) + (0.3844)]
4

Somando o numerador, a variância é dada por

1.7083
S2 = = 0.43 km/h2
4

Para encontrar o desvio-padrão, basta tomar a raiz quadrada de S 2

r
1.7083
S= = 0.65 km/h.
4

Portanto, o valor da variância para os dados de velocidade do vento é da ordem de 0.43 km/h2 e o
desvio-padrão igual a $ 0.65 km/h$.
Inferência Estatística
Inferência Estatística

Definição: Conjunto de técnicas cujo objetivo é estudar a população através de


evidências fornecida pelas observações contidas em uma amostra.
Notação:
▶ X é uma variável de interesse na população.
▶ Lembre que X é uma característica observada em uma população, como por
exemplo: Idade, altura, comprimento de uma árvore, etc.
▶ (X1 , X2 , ..., Xn ): Amostra aleatória retirada de X na população, em que n é o
tamanho amostral.
Inferência Estatística

Exemplo:
Em um determinado estudo decidiu-se avaliar o tempo até a falha de um equipamento
sob stress até a falha.
Inferência Estatística

Exemplo:
Em um determinado estudo decidiu-se avaliar o tempo até a falha de um equipamento
sob stress até a falha.

Assim, após um tempo pré estabelecido, será verificado se cada equipamento falhou ou
não.
Inferência Estatística

Exemplo:
Em um determinado estudo decidiu-se avaliar o tempo até a falha de um equipamento
sob stress até a falha.

Assim, após um tempo pré estabelecido, será verificado se cada equipamento falhou ou
não.

Dessa forma, avaliou-se uma amostra de 10 equipamentos.


Inferência Estatística

Exemplo:
Em um determinado estudo decidiu-se avaliar o tempo até a falha de um equipamento
sob stress até a falha.

Assim, após um tempo pré estabelecido, será verificado se cada equipamento falhou ou
não.

Dessa forma, avaliou-se uma amostra de 10 equipamentos.

O tamanho amostral igual à 10 é suficiente para estimar a proporção de falha?


Inferência Estatística

Exemplo:
Em um determinado estudo decidiu-se avaliar o tempo até a falha de um equipamento
sob stress até a falha.

Assim, após um tempo pré estabelecido, será verificado se cada equipamento falhou ou
não.

Dessa forma, avaliou-se uma amostra de 10 equipamentos.

O tamanho amostral igual à 10 é suficiente para estimar a proporção de falha?

Qual função você usaria para obter um valor resumo sobre a proporção de falha?
Inferência Estatística

▶ Os 10 equipamentos devem ser representativos com respeito a população.


▶ O esquema de amostragem em relação a verificação da falha:
▶ 0: não falhou.
▶ 1: falhou.
▶ A amostra aleatória (X1 , X2 , X3 , X4 , X5 , . . . , X10 ) poderia ser:

(1, 0, 1, 0, 1, 1, 1, 1, 0, 1) ou (1, 0, 0, 1, 1, 1, 0, 1, 1, 1) e etc.


Conceitos importantes da Inferência

Definição (Parâmetro): As quantidades da população, em geral desconhecidas, sobre


as quais temos interesse são denominadas parâmetros.Usualmente representados θ, p,
µ ou σ, entre outras.

Definição (Estimador e estimativa): Combinação de elementos da amostra


(qualquer função da amostra), usado com finalidade de estimar algum parâmetro de
interesse da população. Em geral, usa-se θ̂, µ̂, p̂, σ̂. Os valores numéricos assumidos
pelos estimadores são chamados de estimativas.
Conceitos importantes da Inferência

▶ A relação dos parâmetros com os estimadores:

Medida População Amostra


n
P
Xi
i=1
Média µ X̄ =
n
Mediana θ θ̃ = mediana(X1 , X2 , . . . , Xn )
n
(Xi − X̄ )2
P
i=1
Variância σ2 S2 =
n−1
n
P
Xi
i=1
Proporção p p̂ =
n
Exemplo

▶ Estamos interessados na média das alturas de jovens com idades de 15 a 18 anos,


nascidos em Belém.
▶ Estamos interessados na média das alturas de jovens com idades de 15 a 18 anos,
nascidos em Belém.
▶ Suponha que você tem uma amostra de tamanho 10 (para simplificar!).
▶ A população é composta por todos os jovens com idades entre 15 a 18 anos,
nascidos em Belém.
▶ O parâmetro de interesse será denotado por µ.
Exemplo

Os dados referentes a alturas (em metros) são as seguintes:

[1] 1.65 1.57 1.72 1.66 1.71 1.74 1.81 1.68 1.60 1.77

▶ Alguma propostas:
mínimo + máximo
▶ µ̂ = f1 (X1 , X2 , . . . , X10 ) = = 1.69.
2
▶ µ̂ = f1 (X1 , X2 , . . . , X10 ) = X1 = 1.65
X + · · · + X10
▶ µ̂ = f1 (X1 , X2 , . . . , X10 ) = 1 = 1.691
10
Exemplo

Os dados referentes a alturas (em metros) são as seguintes:

[1] 1.65 1.57 1.72 1.66 1.71 1.74 1.81 1.68 1.60 1.77

▶ Alguma propostas:
mínimo + máximo
▶ µ̂ = f1 (X1 , X2 , . . . , X10 ) = = 1.69.
2
▶ µ̂ = f1 (X1 , X2 , . . . , X10 ) = X1 = 1.65
X + · · · + X10
▶ µ̂ = f1 (X1 , X2 , . . . , X10 ) = 1 = 1.691
10
Com qual valor nos baseamos?
Propriedades de estimador

Definição (Vício): Um estimador θ̂ é não viciado (não viesado) para um parâmetro θ


se E (θ̂) = θ. Ou seja, um estimador é não viciado para θ se o seu valor esperado
coincide com o parâmetro de interesse.

Definiçao (Consistência): Com um tamanho amostral grande, θ̂ se torna um ótimo


estimador.
Propriedades de estimador

A variabilidade de um estimador nos dá ideia de precisão de um determinado


estimador.

Inclusive num contexto de eficiência entre possíveis estimadores.

Definição (Eficiência): Dados dois estimadores θˆ1 e θˆ2 , não viciados para um
parâmetro θ, diz-se que θˆ1 é mais eficiente que θˆ2 se Var (θˆ1 ) < Var (θˆ2 ).
Propriedades de estimador
Precisão de estimadores

Dessa forma precisamos de estimadores que sejam:

▶ Não viciados.
▶ Ter menor variabilidade.

Eis a questão! Qual é esse estimador??

Em algumas situações a média terá melhores propriedades.


Distribuições amostrais
Distribuições amostrais

▶ Por definição o estimador é qualquer funçao da amostra.


▶ E dessa forma como são funções de variáveis aleatórias também são variáveis
aleatórias.
▶ E dessa forma poderá seguir alguma distribuição de probabilidade.
Distribuição amostral da média

▶ Suponha que X ∼ N(µ, σ 2 ).


▶ E tome uma amostra aleatória de X como (X1 , X2 , · · · , Xn ), independentes e
identicamente distribuídas (iid), com distribuição Normal de média µ e variância
σ2.
▶ Assim,

X̄ ∼ N(µ, σ 2 /n)
▶ Uma vez que,

σ2
E (X̄ ) = µ e Var (X̄ ) = .
n
Distribuição amostral da média
▶ Como também,
 n 
X
 Xi  n
! n n
 i=1  1 X 1 X 1 X
Var (X̄ ) = Var 
 n  = n2 Var
 Xi = Var (Xi ) = σ2 =
  i=1
n2 i=1 n2 i=1

1 2 σ2
nσ =
n2 n
▶ Assim, quando X ∼ N(µ, σ 2 ) a média amostral X̄ ∼ N(µ, σ 2 /n).
##Distribuição amostral da média - Exercício
Uma v.a. tem distribuição normal, com média 100 e desvio padrão 10

a) Qual a P(90 < X < 110) ?

b) Se X̄ for a média de uma amostra de 16 elementos retirados dessa população.


Calcule P(90 < X̄ < 110) ?
Erro amostral
Definição:
O erro amostral da média é definido como a diferença entre a média amostral X̄ e a
média populacional µ, isto é,

ϵ = X̄ − µ.

Corolário:
A distribuição de probabilidade do erro amostral da média aproxima-se de uma normal,
com valor médio zero e variância ou seja σ 2 /n

 
ϵ ∼ N 0, σ 2 /n .
Determinação do Tamanho da Amostra
Qual o tamanho da amostra, para obtermos um erro de estimação previamente
estipulado, com determinada probabilidade?

Suponha que se queira determinar o tamanho da amostra n, de modo que o erro


amostral seja no máximo ϵmax , com determinada probabilidade de condiança γ, ambos
fixados. Dessa forma,

P(| ϵ |< ϵmax ) = γ.

Neste caso, como ϵ ∼ N 0, σ 2 /n , temos a seguinte padronização




 
ϵ−0 −

ϵmax 0
P  q < q =γ
σ 2 /n 2

σ /n
ou
 
Determinação do Tamanho da Amostra

Após alguns algebrismos,

√ √ !
ϵmax n ϵmax n
P − <Z < = γ.
σ σ

Dado o valor de γ, podemos obter zγ da N(0, 1), de modo que


ϵmax n zγ σ 2
 
zγ = →n= .
σ ϵmax
Determinação do Tamanho da Amostra - Exercício

Uma instituição financeira possui uma carteira de 5000 títulos a receber, da qual quer
conhecer o valor médio, com 90% de confiança. Dado que o desvio padrão da carteira
é de R$ 100,00, qual a amostra mínima para que o erro da estimativa seja inferior a
$R$$50,00?
Distribuição amostral - Questionamento

▶ Usamos sempre a distribuição normal para resolver os problemas?


Distribuição amostral - Questionamento

▶ Usamos sempre a distribuição normal para resolver os problemas?


▶ E se a distribuição na população não for normal?
Distribuição amostral - Questionamento

▶ Usamos sempre a distribuição normal para resolver os problemas?


▶ E se a distribuição na população não for normal?
▶ Qual alternativa deveremos tomar?
Distribuição amostral - Questionamento

▶ Usamos sempre a distribuição normal para resolver os problemas?


▶ E se a distribuição na população não for normal?
▶ Qual alternativa deveremos tomar?
▶ Temos uma saída: Teorema Central do limite.
Distribuição amostral - Questionamento

▶ Usamos sempre a distribuição normal para resolver os problemas?


▶ E se a distribuição na população não for normal?
▶ Qual alternativa deveremos tomar?
▶ Temos uma saída: Teorema Central do limite.
▶ Que sobre certas condições de regularidade a distribuição de probabilidade da
média amostral pode ser aproximada por uma distribuição normal.
Distribuição amostral - Teorema Central do Limite (TCL)

Teorema Central do Limite:


Suponha uma amostra aleatória simples de tamanho n retirada de uma população com
média µ e variância σ 2 . Representando tal amostra por n v.a’s independentes
(X1 , X2 , · · · , Xn ) e, denotando sua média por X̄ , temos

X̄ − µ em dist.
√ −→ Z
σ/ n

em que Z ∼ N(0, 1).


Simulando TCL no R (Dados simulados de X ∼ N(10, 4))

12
Médias

10

10 20 30 50 80 100 200 500 700 1000


Tamanhos amostrais
Distribuição amostral - Tamanho da amostra

Figure 1: Impacto do tamanho de amostra sobre a dist. de X̄ .


Distribuição amostral da proporção

▶ Uma aplicação direta do TCL.


Distribuição amostral da proporção

▶ Uma aplicação direta do TCL.


▶ Quando se tem interesse em estimar a proporção amostral.
Distribuição amostral da proporção

▶ Uma aplicação direta do TCL.


▶ Quando se tem interesse em estimar a proporção amostral.
▶ Relembrando
Distribuição amostral da proporção

▶ Uma aplicação direta do TCL.


▶ Quando se tem interesse em estimar a proporção amostral.
▶ Relembrando

número de indiv. na amostra com dada caracter.


p̂ =
n

▶ Temos que a v.a nesse caso é dada por,

(
1, Se o indivíduo apresenta a caracte.
Yi =
0, cc.

para i = 1, · · · , n.
Distribuição amostral da proporção

▶ Podemos reescrever a proporção amostral como,


Distribuição amostral da proporção

▶ Podemos reescrever a proporção amostral como,

$$\hat{p}=\dfrac{Y_{1}+Y_{2}+\cdots +Y_{n}}{n}=\dfrac{\sum_{i=1}^{n}Y_{i}}{

▶ Assumindo que Y ∼ Ber (p) e como (Y1 , Y2 , · · · , Yn ) é uma amostra de Y então


E (Yi ) = p e Var (Yi ) = p(1 − p). Assim,

$E\left(\hat{p}\right)=E\left(\dfrac{\sum_{i=1}^{n}Y_{i}}{n}\right)=p$ e $V
Distribuição amostral da proporção

▶ Usando o TCL:
Distribuição amostral da proporção

▶ Usando o TCL:

Ȳ − E (Ȳ ) p̂ − p em dist.
q =p −→ Z
Var (Ȳ ) p(1 − p)/n

em que Z ∼ N(0, 1).


▶ De forma geral, temos

p̂ ∼ N(p, p(1 − p)/n).


Exercício

Suponha que 60% da população de uma certa cidade seja a favor da criação de um
fundo público para fins de instalação de uma área de lazer. Se 150 pessoas
selecionadas aleatoriamente são entrevistadas, qual a probabilidade de que a proporção
amostral favorecendo essa questão seja menor que 0,52?
Tamanho da Amostra Para Estimar a Proporção

No caso da proporção, para determinar o tamanho da amostra n, de modo que o erro


amostral seja no máximo ϵmax , com determinada probabilidade γ, ambos fixados,
temos

P (|ϵ| < ϵmax ) = γ → P (|p̂ − p| < ϵmax ) = γ.

P (−ϵmax < p̂ − p < ϵmax ) = γ.

Logo, temos o que o erro amostral é dados por,

p(1 − p)
 
ϵ = p̂ − p ∼ N 0,
n
Tamanho da Amostra Para Estimar a Proporção
Logo,

√ √ !
ϵmax n ϵmax n
P −p <Z < p =γ
p(1 − p) p(1 − p)

Dado γ, podemos determinar zγ de modo que:

2


n= p(1 − p).
ϵmax

Para uma pré-amostra, substituimos p por p̂,

2


n= p̂(1 − p̂).
ϵmax
Exercício

Um instituto de pesquisa pretende avaliar a proporção de eleitores que votarão em


determinado candidato, com 95% de confiança de que não errará por mais de 3%.

Para isto, levantou uma pré-amostra de 100 eleitores selecionados ao acaso na


população. A proporção de eleitores deste candidato foi de 20%. Determine o
tamanho da amostra necessário para atingir a precisão desejada.
Intervalos de confiança
Intervalos de confiança

Tudo que vimos até agora estava relacionado a estimação pontual.

Dessa forma a inferência é baseada somente em um valor.

E como cada estimador pontual é uma variável aleatória e uma dist. de probabilidade,
podemos obter uma estimativa mais informativa para o parâmetro de interesse.

Que implica em encontrar maior precisão para o valor obtido, dando uma ideia de
variabilidade do estimador.
Intervalo de confiança para populações normais
Intervalo de confiança para populações normais

Suponha que uma amostra aleatória de tamanho n, (X1 , X2 , . . . , Xn ), de uma


população X normalmente distribuída com média µ e variância σ 2 .

Vimos que a média amostral segue uma distribuição normal com média µ e variância
σ 2 /n, dessa forma,

X̄ − µ
Z= √ ∼ N(0, 1).
σ/ n
Intervalo para média com variância conhecida

Fixando um valor γ ∈ [0, 1], podemos encontrar um valor zγ/2 em que,

P(|Z | < zγ/2 ) = P(−zγ/2 < Z < zγ/2 ) = γ.

No diz que o valor zγ/2 tal que divide a probabilidade por 2.


Representação gráfica

0.4
0.3
Densidade

0.2

γ 2 γ 2
0.1
0.0

−4 −2 0 2 4
Intervalo para média com variância conhecida
zγ/2 é um valor encontrado na tabela da distribuição normal.

Dessa forma o intervalo:

X̄ − µ
−zγ/2 < Z < zγ/2 → −zγ/2 < √ < zγ/2 .
σ/ n

Reescrevendo,

σ σ
X̄ − zγ/2 √ < µ < X̄ + zγ/2 √ .
n n

O intervalo de confiança para a média com variância conhecida,

σ σ
 
IC (µ; γ) = X̄ − zγ/2 √ ; X̄ + zγ/2 √ .
n n
Intervalo para média com variância desconhecida

Na maioria da situações práticas a variância populacional é desconhecida.

Em tais situações, ele é substituído pelo estimador S 2 , ou no caso de desvio padrão σ,


por S.

No entanto, essa simples substituição altera a distribuição de probabilidade a ser


utilizada no intervalo de confiança, consequentemente alterando γ.

O valor de zγ/2 será obtido por uma distribuição t− de Student com parâmetro n − 1.

Conhecido com grau de liberdade (gl), o gl é dependente do tamanho amostral n.


Representação gráfica

0.4
N(0,1)
t_1
t_5
f(x)
0.2
t_20
0.0

−6 −2 0 2 4 6
Intervalo para média com variância desconhecida

Dessa forma, o intervalo de confiança para a média com variância desconhecida,

S S
 
IC (µ; γ) = X̄ − t(n−1;γ) √ ; X̄ + t(n−1;γ) √ .
n n

Assim como na distribuição normal os valores de t(n−1;γ) estão tabelados.


Intervalo para média com variância desconhecida
Interpretação do IC

Vale a pena lembrar que, por exemplo, µ̂ = X̄ é uma v.a.

Como o intervalo de confiança é função de X̄ então o IC é aleatório também.

Interpretação: Se obtivermos várias amostras de mesmo tamanho e, para cada uma


delas, calcularmos os correspondentes IC’s com coeficiente de confiança γ, esperamos
que a proporção de intervalos que contenham o valor real θ seja igual a γ.
Interpretação do IC empírica

10.2
9.8
9.6

0 20 40 60 80 100

Amostras
Amplitude e erro

Amplitude: É a diferênça entre o limite superior e inferior do intervalo de confiança.

Erro(Semiamplitude): É o erro envolvido na estimação.

A variabilidade é um fator muito importante também.

Uma grande variabilidade nos indica um considerável distanciamento dos valores


amostrais do valor populacional.
Exercícios

Ex1 :
A distribuição dos pesos de pacotes de sementes de milho, enchidos automaticamente
por uma certa máquina, é normal, com desvio padrão igual a 0,02kg. Uma amostra de
15 pacotes retirada ao acaso apresentou um peso médio igual a 20,02kg. Construa um
intervalo de confiança de 95%.

Ex2 :
O peso médio ao nascer e o desvio padrão de bezerros da raça Ibagé, examinada uma
amostra de 20 partos, foram 26kg e 2kg, respectivamente. Apresente a estimativa do
intervalo de confiança de 95%.
Intervalos de confiança para populações não normais
Intervalo para a grandes amostras

E se a variável X avaliada em uma determinada população não é normal.

Como podemos construir intervalos de confiança para o nosso parâmetro de interesse?

Há alguma aproximação usando o TCL, como vimos anteriormente?


Intervalo para a grandes amostras

Sim podemos!!

E dessa forma podemos obter intervalos de confiança para o parâmetro de interesse.

Nesse caso, o intervalo será construído com um coeficiente de confiança


aproximadamente igual à γ.

Como na definição do TCL, quanto maior o tamanho amostral (n), melhor. (Muito
melhor).

σ σ
 
IC (µ; γ) ≃ θ̂ − zγ/2 √ ; θ̂ + zγ/2 √ .
n n
Intervalo para a proporção

Vimos que pelo TCL, a distribuição amostral da proporção,

p(1 − p)
 
p̂ ∼ N p,
n

Dessa forma o IC é dado por,


" p p #
p(1 − p) p(1 − p)
IC (p; γ) ≃ p̂ − zγ/2 √ ; p̂ + zγ/2 √ .
n n
Intervalo para a proporção
Note que na formula acima p está como desconhecido.

Uma solução é usar p̂(1 − p̂) ao invés de p(1 − p).

Assim,
" p p #
p̂(1 − p̂) p̂(1 − p̂)
IC (p; γ) ≃ p̂ − zγ/2 √ ; p̂ + zγ/2 √ .
n n

Outra abordagem é baseada no fato que a expressão p(1 − p) ter valor máximo igual à
1/4. Assim,
" p p #
1/4 1/4
IC (p; γ) ≃ p̂ − zγ/2 √ ; p̂ + zγ/2 √ .
n n
Exercícios

Em um certo lago, uma amostra aleatória de 1000 peixes acusou 290 Tilápias.
Construa o intervalo de confiança de 95% para a proporção verdadeira de Tilápias.
Interprete-o.

Você também pode gostar