Você está na página 1de 34

Estatística Aplicada

Revisão : Amostragem, Medidas de posição, estimação e


distribuição amostral.
Conteúdo : Distribuição T, Intervalo de confiança.

Prof.Me. Roberto Dib Bittar


rdbittar@yahoo.com.br
AMOSTRAGEM
População

• População Finita : consiste em um número finito, ou fixo, de elementos,


medidas ou observações.
• Pesos líquidos de todas 3000 latas de tintas produzidas no mês de fevereiro de 2016.
• registro de temperaturas mais altas em um posto meteorológico no ano de 2015.

• População infinita : população que pelo menos hipoteticamente possui um


número infinito de elementos.
• Resultado da soma de dois dados jogados simultaneamente ( não há limite explícito
para quantidade de jogadas)
Amostragem aleatória
• Uma amostragem extraída de uma população FINITA é considerada
aleatória (também chamada aleatória simples) quando cada uma das
amostras possíveis tem a mesma chance de ser escolhida.
• Exemplo: em uma população finita de 100 elementos, escolha 3 (obs:3 = qtd fatorial N)
= 161.700 amostras

• Uma amostragem de tamanho n de uma população infinita é aleatória se


consiste de valores de variáveis aleatórias independentes que tem a mesmo
proporção.
• Exemplo: Jogar dados doze vezes. A cada jogada a distribuição de probabilidade de um
número sair se mantém a mesma = 1/6
Planejamento de amostras
• Existem diferentes maneiras de se extrair amostras além da amostragem
aleatória. Serão apresentadas algumas, mas lembre-se, existem outras na
literatura.
• Amostragem sistemática
• Amostragem estratificada
• Amostragem por conglomerado

• Planejamento de amostras significa ter um plano definido, determinado,


antes da coleta de quaisquer dados, e tem por objetivo a obtenção de uma
amostra de uma dada população.
• Diferentes amostragens podem ser usadas na mesma pesquisa.
Amostragem sistemática

• Estabelecer uma regra de seleção do elemento antes de iniciar a coleta.


• Pode-se usar aleatoriedade para se estabelecer qual será o valor N do
elemento.
• A cada 20ª pessoa
• A cada 12ª frenagem
• A cada 50ª peça produzida
• A cada 10 casas do lado direito da rua

• Por ter regularidade tem dois aspectos


• Pode esconder erros recorrentes (máquina falha a cada 15 peças)
• Dá maior uniformidade sobre toda população
Amostragem estratificada
• Trata-se de um processo de estratificar (dividir) a população em determinado
número de subpopulações (estratos) que não se superpõem. Posteriormente
utiliza-se a amostragem aleatória.
• Objetivo é formar estratos de tal modo que haja relação entre o fato e a resposta
procurada no estudo estatístico. E que haja tanta uniformidade quanto possível
no estrato.
• Tamanhos da amostra para Alocação Proporcional
• Exemplo : Extrair uma amostra estratificada n = 60 de uma população de 4000,
que consiste de três estratos de tamanho N1 = 2000, N2= 1200 e N3=800. Para que
alocação deve ser o tamanho da amostra de cada estrato.

Outras formas podem ser usada.


Amostragem por conglomerado
• Outro tipo importante de amostragem, onde a população total é
subdividida em várias partes relativamente pequenas, e algumas dessas
subdivisões (conglomerados) são selecionadas para integrarem a amostra
global.
• Conglomerados por subdivisões geográficas = amostragem por área.
• Exemplo : Estudar a variação de despesas de famílias na área de São Paulo. A amostragem
aleatória é praticamente impossível por não dispor das listas necessárias e também pelo
alto custo para contatar diretamente as famílias em uma grande área. Solução : divide-se a
área total em áreas menores, disjuntas (quarteirões) e faz-se a pesquisa nas casas desses
quarteirões.

• Estimativas baseadas em amostragem por conglomerado em geral não são


tão confiáveis quanto as baseadas em amostras aleatórias simples de
mesmo tamanho, elas são mais confiáveis por custo unitário.
Amostragem não probabilística

• Tipo de amostragem é utilizada quando não temos acesso a lista completa dos
indivíduos que formam a população (marco amostral), portando não sabemos a
probabilidade que cada indivíduo ser selecionado para a amostra.
• Ao usar a amostragem não probabilística o pesquisador não sabe qual é a
probabilidade de que um elemento da população tem de pertencer à amostra.
• Portanto, os resultados da amostra não podem ser estatisticamente
generalizados para a população, porque não se pode estimar o erro amostral.
• Se as características da população acessível forem semelhantes às da
população alvo os resultados podem ser equivalentes aos de uma amostragem
probabilística, mas não podemos garantir a sua confiabilidade
Amostragem por conveniência

• Amostragem não probabilística (em alguns casos pode-se valer técnicas de


escolha aleatória)
• Consiste em selecionar uma amostra da população que seja acessível. Ou
seja, os indivíduos empregados nessa pesquisa são selecionados porque eles
estão prontamente disponíveis, não porque eles foram selecionados por
meio de um critério estatístico.
• Geralmente essa conveniência representa uma maior facilidade operacional
e baixo custo de amostragem, porém tem como consequência a
incapacidade de fazer afirmações gerais com rigor estatístico sobre a
população.
MEDIDAS DE POSIÇÃO

Revisão de alguns conceitos em estatística descritiva (fractis = frações do conjunto de dados)


• Quartil : dividem o conjunto de dados em 4 partes iguais
• Q1 ; Q2 (mesma posição da Mediana) e Q3
• Amplitude interquartílica = AIQ = Q3-Q1

• Decis : dividem o conjunto de dados em 10 partes iguais


1 Quartil 52.75 =QUARTIL.EXC($B$4:$U$4;1)
2•Quartil
Percentis 59.50
: dividem o conjunto de dados em 100 partes iguais
3 Quartil =QUARTIL.EXC($B$4:$U$4;2)
68.75
=QUARTIL.EXC($B$4:$U$4;3)
Gráficos do tipo boxPlot ou maria-Chiquinha

Gerar no excel usando opção: todos gráficos // caixa


e caixa estreita
Escore z ou escore padrão

• Representa o número de desvios padrão no qual está um valor dado x a


partir da média .

• Z= =
Estimação

• Frequentemente necessitamos, por meio das amostras, conhecer


informações gerais da população.
•A estimação é o processo que consiste no uso de dados da
amostra (dados amostrais) para estimar valores de parâmetros
populacionais desconhecidos, tais como média, desvio padrão,
proporções etc.
Estimativas e nível de confiança
• Estimativa pontual : é uma estimativa de um único valor para um parâmetro
populacional. A estimativa pontual menos enviesada da média populacional é
𝑥
a média amostral
• Uma estimativa intervalar é um intervalo de valores usados para estimar um
parâmetro populacional.

• Nível de confiança c é a probabilidade de que o intervalo estimado contenha


o parâmetro populacional
• Níveis de confiança normalmente utilizados e score Zc
• 90% 1,645 =INV.NORMP.N(95%)
• 95% 1,960 =INV.NORMP.N(97.5%)
• 99% 2,575 =INV.NORMP.N(99.5%)
Estimativa Pontual

• É quando fazemos uma única estimativa (um valor) para um


determinado parâmetro populacional. Vejamos os exemplos:
Estimativa Intervalar

• É quando fazemos uma estimativa de um intervalo de valores


possíveis, no qual se admite esteja o parâmetro populacional.

• Neste tipo de estimativa temos um intervalo de valores em torno


do parâmetro amostral, no qual julgamos, com um risco
conhecido de erro, estar o parâmetro da população. A esse
intervalo chamamos intervalo de confiança
Estimativa de Médias de uma População

• Para efetuar a Estimativa de Médias de uma População


utiliza-se desvio padrão da distribuição que constitui a
amostra (distribuição amostral), deve-se levar em
consideração se o desvio padrão da população é ou não
conhecido.
Distribuição Amostral
•É a distribuição de probabilidade de uma estatística que é formada
quando amostras de tamanho n são repetidamente “colhidas” de uma
população. Se a estatística da amostra é a sua média, temos uma
distribuição amostral de médias das amostras.
Amostra Amostra Amostra
1, 1 3, 3 5, 5
Amostra
Amostra
4,4
2, 2

Propriedades das distribuições de médias das amostras


1. A média das médias das amostras é igual à média da população =
2. O desvio padrão das médias das amostras é igual ao desvio padrão populacional dividido pela
raiz quadrada de n. Ou seja :

O DESVIO PADRÃO DA DISTRIBUIÇÃO AMOSTRAL DAS AMOSTRAS É CHAMADO DE ERRO


PADRÃO DA MÉDIA AMOSTRAL
Teorema do Limite Central
• Fornece a base para o ramo inferencial da
estatística
• Descreve a relação entre as distribuições
amostrais de médias das amostras e a
população de onde foram tiradas.
• Se as amostras de tamanho n, onde n >=30,
forem tiradas de uma população qualquer,
com uma média e um desvio padrão então a
distribuição amostral das médias das amostras
se aproximará de uma distribuição normal.
• Quanto maior for o tamanho da amostra,
melhor será a aproximação.
• Se a própria amostra for normalmente
distribuída, a distribuição amostral das médias
da amostra será normalmente distribuída em
qualquer tamanho n da amostra
Teorema do Limite Central
Em ambos os casos, a distribuição amostral de médias das amostras tem uma média das igual à média da
população

Média =

E a distribuição amostral de médias das amostras tem uma variação 1/ n vezes a variância da população e
um desvio padrão igual ao desvio padrão populacional dividido pela raiz quadrada de n.

Variância

Desvio padrão = E = Erro máximo da estimativa

O DESVIO PADRÃO DA DISTRIBUIÇÃO AMOSTRAL DAS AMOSTRAS


É CHAMADO DE ERRO PADRÃO DA MÉDIA
Intervalos de confiança
Grandes amostras
(Distribuição Normal)
Intervalos de confiança
• Intervalos de confiança são usados para indicar a confiabilidade de uma
estimativa.
• Portanto, podemos interpretar o intervalo de confiança como um intervalo
que contém os valores "plausíveis" que um determinado parâmetro pode
assumir.
• A amplitude do intervalo está associada a incerteza que temos a respeito do
parâmetro.

Fonte: http://www.portalaction.com.br/inferencia/intervalo-de-confianca
Calcular Intervalo de confiança
9 25 14
20 17 6 Calcule utilizando o excel a estimativa intervalar utilizando os
18 23 11
16 7 12 dados apresentados. Intervalo confiança = 95%
9 10 11
16 9 15 Lembre-se de encontrar o valores
16 10 6 N =
9 10 12 média =
11 5 14 Desvio padrão =
13 11 11 Score Z ou t =
22 18 4
16 18 9
5 9 18 Como n =54 usaremos score Z
18 9 12 Limites = média + ou – ( z * desvio padrão / raiz(N))
6 17 12
6 13 17 E = Erro máximo da estimativa = ( z * desvio padrão / raiz(N))
5 11 11
12 7 20
Definir o tamanho da amostra
• Dados um nível de confiança c e um erro máximo de estimativa E, o
tamanho mínimo da amostra necessária para estimar a média
populacional é

• Se é desconhecido, você pode estimá-lo usando s (desvio padrão amostral), desde


que tenha uma amostra preliminar com no mínimo 30 ocorrências.
Calcular o tamanho da amostra
• Exemplo : Considerando os dados do exercício anterior, você deseja calcular o número
médio de frases e anúncios de revistas. Quantos anúncios devem ser incluídos na amostra
se você quer ter 95% de confiança de que a média amostral esteja dentro do intervalo de
uma sentença da média populacional?

• C= 0,95, logo Zc = 1,96


• E foi dado no enunciado = 1
• Desvio padrão da amostra (encontrado no exercício anterior) = 5
• , ou seja , = 96, 04, deve-se arredondar para valor maior
Resolva os exercícios a seguir
Distribuição t de student
Distribuição t de student
• A função densidade da distribuição t de Student tem a mesma forma em sino da
distribuição Normal, mas reflete a maior variabilidade (com curvas mais alargadas) que é de
se esperar em amostras pequenas (n < 30)
• Foi publicada por um autor que se chamou de Student, pseudônimo de William Sealy
Gosset, que não podia usar seu nome verdadeiro para publicar trabalhos enquanto
trabalhasse para a cervejaria Guinness.
Distribuição t de student
O excel fornece via função
INV.T.BC
O valor de T

Para isso deve-se informar o nível de confiança


= (100- Intervalo de confiança)
Ou seja para 95% para o intervalo, o nível é 5%

E os graus de liberdade (gl).


Quando analisamos uma variável, o número de
gl é igual (N – 1)

Exemplo: n = 23, intervalo de confiança = 90%


=INV.T.BC(10%;22)
Resposta = 1.717

Exemplo: n = 23, intervalo de confiança = 95%


=INV.T.BC(5%;22)
Resposta = 2.074
Distribuição t de student

Resolva:

1) Utilizando a função do excel INVT obtenha os valores críticos de tc

A. 90% , n =22
B. 95%, n = 22
C. 75%, n =27
D. 75%, n =12
Distribuição t de student
Resolva: Usar Distribuição Normal ou Distribuição t

2) Você seleciona ao acaso 20 casas hipotecárias e


verifica a taxa de juro que cada uma cobra. A taxa
média amostral é de 6,93% com desvio padrão de
0,42%. Obtenha o intervalo de confiança de 99%
para população da taxa média de juro para as
hipotecas. Suponha que as taxas de juro tenham
distribuição aproximadamente normal.
Resolva os exercícios a seguir
continuação

Você também pode gostar