Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introdução...............................................................................................................................2
2. Objectivos...............................................................................................................................2
2.1. Objectivos gerais.............................................................................................................2
2.2. Objectivos específicos....................................................................................................2
3. Revisão da literatura...............................................................................................................3
4. Metodologia............................................................................................................................4
5. TESTE DE HIPÓTESE..........................................................................................................5
5.1. HIPÓTESE NULA.........................................................................................................6
5.2. HIPÓTESE ALTERNATIVA.........................................................................................7
6. NÍVEL DE SIGNIFICÂNCIA............................................................................................7
7. TIPOS DE ERROS.................................................................................................................8
7.1. Erro do tipo I...................................................................................................................8
7.2. Erro do tipo II.................................................................................................................8
8. DISTRIBUIÇÃO DAS DIFERENÇAS..................................................................................8
8.1. ERRO PADRÃO DA DIFERENÇA...............................................................................9
9. ESTATÍSTICA Z..................................................................................................................10
10. ESTATÍSTICA T..............................................................................................................11
10.1. Pequenas amostras....................................................................................................11
10.2. Dados pareados.........................................................................................................12
10.3. Variâncas iguais........................................................................................................12
10.4. Variâncas diferentes..................................................................................................13
11. ESTATÍSTICA F..............................................................................................................14
12. Lema de Neyman-Person..................................................................................................14
13. Conclusões e recomendacões............................................................................................15
II. Referências bibliográficas.....................................................................................................16
1
1. Introdução
A inferência estatística é o processo de tirar conclusões sobre uma população com base
em uma amostra representativa dessa população. Ela involve a análise de dados amostrais
para fazer previsões sobre parametros desconhecidos da população. Envolve a apliocação
de técnicas estatistícas para estimar parâmetros desconhecidos e fazer afirmações sobre a
incerteza associada a essas estimativas. Uma dessas técnicas estatistícas são os testes de
hipóteses que são essênciais na inferência estatística. Eles permitem que os pesquisadores
avaliem se uma afirmação sobre determinada população é verdadeira com base em uma
amostra dos dados. No presente ensaio abordar-se-a sobre a inferência estatística
concretamente sobre o teste das hipóteses, que são métodos de avaliação de informações
sobre uma característica de determinada população, ou seja, provar uma afirmação sobre
a distribuição de uma variável aleatória usando critérios estatistícos que permitem rejeitar
ou não hipóteses testadas, baseada em valores amostrais.
2. Objectivos
2.1. Objectivos gerais
2
3. Revisão da literatura
A história da inferência estatística do tese das hipóteses, remota aos trabalhos pioneiros
de Ronald A. Fisher, Jerzy Neyman e Egon Pearson isto no início do século XX. Fisher é
considerado pai da inferência estatística moderna. Pois foi o primeiro a introduzir o
conceito de teste de significância estatística e propôs o uso do valor-p como medida da
evidência estatística, foi Fisher que desenvolveu a ideia de que a inferência estatística
poderia ser baseada em testes de hipóteses, onde uma hipótese nula é testada em relação a
uma hipótese alternativa.
Ronal Fisher defendia o uso do valor-p, que é uma medida estatística que fornece uma
maneira de quantificar a eidência contra a hipótese nula em um teste de hipóteses, e
efantizava a inportância da significância estatística, por outro lado Neyman e Pearson
propuseram uma abordagem mais formal e objectiva baseada na teoria das hipóteses, com
foco no controle do erro tipo I e II.
3
A controvérsia entre a perispectiva bayesiana e a frequentista esta relacionada a
interpretação da probabilidade e a forma como a evidência é usada. Esta controvérsia
entre as duas reflete diferenças fundamentais na interpretação da probabilidade, na
modelagem da incerteza e na forma como as evidências são usadas para fazer inferências
estatísticas. Ambas abordagens tem suas vantagem e limitações, e a escolha entre elas
depende do contexto específico do problema em questão e das preferências do
pesquizador.
4. Metodologia
Para a elaboração do presente ensaio foi feita uma pesquisa bibliográfica, qualitativa, e
esplicativa que consistiu na consulta e revisão de vários manuais existentes sobre o tema,
extração de informação e cruzamento dos diversos dados obtidos, encontrando conteudos
que satifizeram as inquietações sobre este assunto.
4
5. TESTE DE HIPÓTESE
O teste de hipótese é uma técnica estatística usada para tomar decisões sobre uma
população com base em uma amostra de dados. Envolve a formulação de duas hipóteses:
a hipótese nula (HO) e a hipótese alternativa (H1). O teste estatístico calcula uma
estatística de teste a partir dos dados da amostra e determina se os resultados são
suficientemente diferentes do esperado sob a hipótese nula para rejeitá-la em favor da
hipótese alternativa.
Um teste é uma regra que pernite introduzir uma partição do espaço amostra em duas
regiões, a região de rejeição e a região de não rejeição.
Ao realizar um teste de hipóteses, e verificar que (x1, x2, ...xn), não pertecem a W, é
preferível não rejeitar a hipótese nula do que aceitar a hipótese nula.
Ex. Considere uma certa população X, com media μ desconhecida, supõe se que se
pretende testar H0: μ=2 contra H1≠ 2. Não rejeitar H0, não invalida que tambem possa se
rejeitar H0; μ =2.01, não se pode aceitar as duas hipóteses nulas, porque as afirmações ´´
μ=2´´ e ´´ μ=2.01´´ não podem ser ambas verdadeiras, só se pode afirmar que os dados
não permitem rejeitar qualquer uma das hipóteses nulas, ou usar a expressão “ a
evidência estatística e favorável a hipótese nula” quando concluir que a hipótese não é
rejeitada.
5
Para realizar um teste de hipótese deve-se seguir os seguintes passos;
2º passo- obter uma estatística , com distribuição conhecida, que fique completamente
definida sob H;
Uma hipótese nula H0, que é defendida até que a evidência mostre o contrário;
Uma hipótese altrnativa H1, que é adoptada se a hipótese nula for rejeitada
Uma estatística teste T=T(x1, x2, ...xn)
Uma região crítica W(t)
Os testes de hipóteses são uma modalidade da inferência estatística por isso são incertos,
e todo o caminho que vai do particular ao geral, pode induzir ao erro, e nos testes de
hipóteses considera-se 2 tipos de erros a saber;
µ1 =µ2
Uma hipótese nula, por exemplo, afirma que as notas dos alunos não dependem da renda
familiar. Analisa-se amostras, então, diferenciadas por essa característica e procura-se
confirmar Ho.
6
5.2. HIPÓTESE ALTERNATIVA
Caso a hipótese nula possa ser rejeitada, o que normalmente se procura provar, pois é
quando se encontra uma correlação, aceita-se a chamada hipótese alternativa Ha – diz-se
“agá-á”. A hipótese alternativa ou experimental, significa que as diferenças das variáveis
encontradas nas amostras decorrem de diferenças efetivamente existentes nas populações
e não são frutos do erro amostral. Ha é, portanto, o complemento de Ho, isto é, ou uma
ou outra. Assim a hipótese alternativa garante:
µ1≠ µ2
No exemplo citado anteriormente, significaria concluir que as notas dos alunos dependem
da renda familiar.
6. NÍVEL DE SIGNIFICÂNCIA
Quando são encontradas diferenças entre as variáveis para amostras diferentes, surge o
questionamento se isto é, ou não, estatisticamente significante. Estabelece-se um nível de
significância ou de confiança que é a probabilidade de se rejeitar a hipótese nula com
segurança. Considera-se, então, a hipótese nula falsa sempre que a probabilidade da
diferença amostral encontrada for menor do que o nível de significância adotado. Assim,
define-se zonas ou regiões de aceitação e rejeição. Se superado o valor limite,
denominado valor crítico, entra-se na região de rejeição. Em caso contrário, aceita-se a
hipótese nula que é a única que é testada
7
7. TIPOS DE ERROS
Nos testes de hipótes a que considerar 2 tipos de erros;
7.1. Erro do tipo I
Como foi visto, pode-se rejeitar a hipótese nula mesmo ela sendo verdadeira, já que em
5% dos casos as diferenças amostrais podem ser explicadas pelo acaso e não por
diferenças populacionais. Comete-se, nesse caso, um erro do tipo I, ou erro alfa. Este erro
deve ser evitado e, para isso, uma solução seria aumentar o nível de confiança - passar de
0,05 para 0,01. Então, a probabilidade de se rejeitar Ho indevidamente seria reduzida.
Infelizmente, isso aumenta a chance de se cometer outro tipo de erro.
8
analogicamente, é estimar o erro padrão da diferença á partir do erro padrão das médias
do par de amostras das populações a analisar.
Para fazer a distribuição das diferenças é necessário calcular o erro padrão, e este erro
padrão é obtido da seguinte forma;
x 1=
∑x1 x 12 =
∑ x 12
n1 n1
σ 1= √ σ 2 2
2 2 2
σ 1 =x 1 −x 1
2
n 1−σ 2
s 1=√ s 12
2
s1 =
n 1−1
x 2=
∑x2 2
x2 =
∑ x 22
n2 n2
σ 2=√ σ 22
2 2 2
σ 2 =x 2 −x 2
2
n 2−σ 2
s 2=√ s 22
2
s2 =
n 2−1
2º-De seguida achar-se o erro padrão de média para cada amostra usando as seguintes
formúlas;
σ1 σ2
S x1 = S x 2=
√ n1−1 √ n2−1
9
s1 s2
S x= S x=
√ n1 n2
Apartir dos erros padrão das médias estimar o erro padrão da diferença, mediante;
S ∆=√ sy 12 +sy 22
No caso das amostras tiverem o mesmo tamanho n, este valor pode ser obtido de forma
facíl partindo das varianças populacionais, sem que seja necessário determinar os desvios
padrões amostrais e erros padrões amostrais, usando a seginte formúla;
√ √
2 2
2 +¿σ 2 2+¿ s2
σ1 s1
S ∆= = ¿¿
n−1 n
9. ESTATÍSTICA Z
A distribuição amostral das diferenças entre as médias pode ser considerada normal á
partir de duas amostras suficientemente grandes ( maiores que 30 elementos). Isso
permite que seja usada a tabela normal padronizada, mediante a determinação do escorrez
z. Assim a partir de duas amostras extraídas de duas populaçóes que se pretendam testar,
cujos valores médios, desvios padrões, erros padrões médios e erro padrão da diferença
foram determinados, é possível encontrar a escorez z, mediante;
x 1−x 2
z= n≥ 30
S∆
Com o valor obido com esta operação, vai-se a tabela e acha-se a percentagem que
corresponde ao total de diferenças inferiores a ela. Como existe simetria, deve-se
multiplicar essa taxa por 2, achando asim a percentagem total(%), de casos cujas médias
diferem menos do que o valor encontrado.
10
nível de significância, rejeita-se a hipótese nula H0 e aceita-se a hipótese alternativa H1.
Caso seja inferior aceita-se logo a hipótese nula H0.
10. ESTATÍSTICA T
10.1. Pequenas amostras
Quando se pretende analisar amostras cujo o numero de dados obtidos em cada uma
delas for inferior a 30, nao pode-se considerar a disribuição das diferenças como normal,
e nestes casos a estatística z anteriormente estudada não pode ser aplicada. Para amostras
com menos de 30 elementos usa-se a estatística t, ou razão t, para realizar os testes que
ainda podem ser chamados de t de student.
Para realizar esse treste primeiro é feito o cálculo para detrminar o t0, e é feito da
seguinte forma;
x 1−x 2
¿= n<30
S∆
t0- valor observado, calculado pelo metodo acima, que é identico ao usado na
estatística z;
tc- valor crítico, encontrado na tabela á partir do nível de significância desejado e
número de garus de liberdade gl;
t0<tc- nestas condições aceita-se a hipótese nula e rejeita-se a hipótese alternativa.
As diferenças são fruto do erro amostral para o este nível de significância.
t0≥tc- rejeita-se a hipótese nula e aceita-se a hipótese alternativa. As diferenças
não podem ser esplicadas pelo erro amostral para este nível de significância.
Existem outas tabelas para a estatistíca t, para os níveis de significância 0,05 e 0,01.
Nelas entra-se com o número de grau de liberdade (gl) e acha-se o valor crítico (tc).
11
Os cálculos de S∆ e gl, vão depender da natureza do problema em análise. Se as
variâncas das populações de onde foram extraídas as amostras são iguais ou
diferentes o tratamento é diferente. Se os dados forem pareados, quando os dados das
duas amostras estiverem vinculados aos pares, há um modo diferente de realizar os
testes.
Vale o que foi feio na estatistica t, com um cuidado de se calcular o devio padrão das
diferenças e o erro padrão da diferença, atraves das expressões seguintes;
σ
2 −2
σ =∆ -∆
2
e S ∆=
√n−1
Como o tamanho da amostra, no cálculo do numero de grau de liberdade para ser usado
na tabela da razão t, deve ser n, que é o tamanho da amostra, antes assim como depois ,
pois a amostra é a mesma;
gl=n-1
Quando não se conhece a variânca da população, mesmo que as amostras possam ser
consideradas como se fossem retiradas de uma mesma população, diz se que as variâncas
são as mesmas e as amostras são chamadas homocedásticas. Neste caso, calcula-se o
erro padrão da diferença S∆ , atraves da seginte formúla;
12
1 1
S ∆=√ S ´ [
2
+ ]
n1 n2
Onde S´, e a estimativa do desvio padrão da população a partir das duas amostras. Ele
pode ser calculado a partir de;
2 2
n 1 σ 12+ n 2σ 22 ( n 1−1 ) S 1 +(n 2−1)S 2
s ´ 2= =
n 1+n 2−2 n 1+n 2−2
E o número do grau de liberdade, a ser usado para que possa ir a tabela é dado por:
A regram prática para que se possa admitir uma unica população e por sequencia adotar o
método exposto, e que a relação entre as variâncas amostrais seja inferior a 4.
No caso das amostras tiverem o mesmo tamanho n os valores acima podem ser
calculados mais facilmente com o uso das seguintes formúlas;
√ √
2 2
2 +¿σ 2 2+ ¿S 2
σ1 S1
S ∆= ¿= ¿ ; e gl=2(n-1)
n−1 n
S ∆=
√ s 12 S 22 = σ 2
+
n1 n2 √
+
σ 22
n1−1 n 2−1
O número de graus de liberdade, a ser usado para que possa ir a tabela e calculado através
da seguinte formula;
gl=¿ ¿
13
11. ESTATÍSTICA F
As estatistícas acima citadas são úteis para comparar 2 médias, quando se pretende
comparar 3 ou mais médias independentes usa-se a razão F ou estatistica F. Nesta
estatistica F só são consideradas amostras com o mesmo tamanho n.
Cada amostra terá sua própria variânca σi 2. Pode se imaginar uma amostra de variânca σ 2,
que contenha todos elementos de R amostras. O valor de F observado, tambem
simbolizado por Fo é dado pela equação;
R (n−1) R σ 2 .
F0= [ −1]
R−1 ∑ σi2 .
O valor obtido deverá ser comparado ao valor de F que foi tabelado, o valor crítico Fc.
Habitualmente essas tabelas são dadas para os níveis de significância 0,05 e 0,01. Como
entradas na tabela são usados os graus de liberdade gl para o numerador e denominador,
que são definidos por;
N=gl (numerador)=R-1
D=gl (denominador) =R(n-1)
Este lema foi formulado por Jerzy Neyman e Egon Person na década de 1930 e é
amplamente usada em inferência estatística. Este lema estabelece que, ao realizar um
teste de hipõteses entre duas hipóteses estatísticas, a regra de decisão que maximiza a
probabilidade de detecção de um efeito real (poder do teste) para um certo nível de
significância é aquela que minimiza a probabilidade de erro do tipo I acima estudado, sob
a restriçáo da probabilidade de erro do tipo II. A aplicação do lema de Neyman-Person
envolve a definição das duas hipóteses, a nula e a alternativa, a escolha de um nível de
14
significância e a determinação da região crítica do teste( probabilidade de rejeitar
correctamenta hipótese nula quando é falsa) e avaliar a eficácia da decisão tomada.
O teste de hipoteses é uma feramenta poderosa da inferência estatística que permite tirar
conclusões sobre populações com base em dados amostrais. Ao formular hipteses claras,
escolher estatísticas de teste apropriadas e interpretar os resultados com cautela, pode se
usar o teste de hipóteses de forma eficaz para avancar o entendimento em variadas áreas.
Na estatistica Z a distribuição da variável observada não precisa ser normal, porque pelo
teorema do limite central, o fato das amostras serem grandes assegurava distribuição
normal para as medias das diferenças. A estatística t de student exige que a variável
observacional siga uma distribuição normal.
15
II. Referências bibliográficas
16