Você está na página 1de 16

Indice

1. Introdução...............................................................................................................................2
2. Objectivos...............................................................................................................................2
2.1. Objectivos gerais.............................................................................................................2
2.2. Objectivos específicos....................................................................................................2
3. Revisão da literatura...............................................................................................................3
4. Metodologia............................................................................................................................4
5. TESTE DE HIPÓTESE..........................................................................................................5
5.1. HIPÓTESE NULA.........................................................................................................6
5.2. HIPÓTESE ALTERNATIVA.........................................................................................7
6. NÍVEL DE SIGNIFICÂNCIA............................................................................................7
7. TIPOS DE ERROS.................................................................................................................8
7.1. Erro do tipo I...................................................................................................................8
7.2. Erro do tipo II.................................................................................................................8
8. DISTRIBUIÇÃO DAS DIFERENÇAS..................................................................................8
8.1. ERRO PADRÃO DA DIFERENÇA...............................................................................9
9. ESTATÍSTICA Z..................................................................................................................10
10. ESTATÍSTICA T..............................................................................................................11
10.1. Pequenas amostras....................................................................................................11
10.2. Dados pareados.........................................................................................................12
10.3. Variâncas iguais........................................................................................................12
10.4. Variâncas diferentes..................................................................................................13
11. ESTATÍSTICA F..............................................................................................................14
12. Lema de Neyman-Person..................................................................................................14
13. Conclusões e recomendacões............................................................................................15
II. Referências bibliográficas.....................................................................................................16

1
1. Introdução
A inferência estatística é o processo de tirar conclusões sobre uma população com base
em uma amostra representativa dessa população. Ela involve a análise de dados amostrais
para fazer previsões sobre parametros desconhecidos da população. Envolve a apliocação
de técnicas estatistícas para estimar parâmetros desconhecidos e fazer afirmações sobre a
incerteza associada a essas estimativas. Uma dessas técnicas estatistícas são os testes de
hipóteses que são essênciais na inferência estatística. Eles permitem que os pesquisadores
avaliem se uma afirmação sobre determinada população é verdadeira com base em uma
amostra dos dados. No presente ensaio abordar-se-a sobre a inferência estatística
concretamente sobre o teste das hipóteses, que são métodos de avaliação de informações
sobre uma característica de determinada população, ou seja, provar uma afirmação sobre
a distribuição de uma variável aleatória usando critérios estatistícos que permitem rejeitar
ou não hipóteses testadas, baseada em valores amostrais.

2. Objectivos
2.1. Objectivos gerais

 Compreender os processos envolvidos nos testes de hipóteses

2.2. Objectivos específicos

 Estudar os tipos de hipóteses


 Conhecer os tipos de erros das hipóteses
 Conhecer e comprender os tipos de testes estatistícos

2
3. Revisão da literatura

A história da inferência estatística do tese das hipóteses, remota aos trabalhos pioneiros
de Ronald A. Fisher, Jerzy Neyman e Egon Pearson isto no início do século XX. Fisher é
considerado pai da inferência estatística moderna. Pois foi o primeiro a introduzir o
conceito de teste de significância estatística e propôs o uso do valor-p como medida da
evidência estatística, foi Fisher que desenvolveu a ideia de que a inferência estatística
poderia ser baseada em testes de hipóteses, onde uma hipótese nula é testada em relação a
uma hipótese alternativa.

Jerzy e Pearson, desemvolveram uma abordagem mais formal para a inferência


estatística, conhecida como teste de hipóteses. Eles introduziram os conceitos dos erros
do tipo I e II, poder do teste e região crítica. Propuseram uma estrutura mais sistemática
para realizar testes de hipóteses baseadas em critérios objectivos e probabilísticos.

Ronal Fisher defendia o uso do valor-p, que é uma medida estatística que fornece uma
maneira de quantificar a eidência contra a hipótese nula em um teste de hipóteses, e
efantizava a inportância da significância estatística, por outro lado Neyman e Pearson
propuseram uma abordagem mais formal e objectiva baseada na teoria das hipóteses, com
foco no controle do erro tipo I e II.

Esta controvérsia entre Fisher e Neyman- Pearson, reflete diferenças filosóficas e


metodológicas na abordagem aos testes de hipóteses e na interpretação dos resultados
estatísticos. Ambos pontos de vista contribuiram muito para o desenvolvimento da teoria
estatística.

Outra discusão importante sobre a inferência estatística envolve a abordagem bayesiana


versus a abordagem frequentista.

Os frequentistas se concentram na frequência com que um envento ocorre em uma série


de experimentos repetidos. Os bayesianos imcorporam imformações prévias (prior) para
atualizar suas crencas sobre um parâmetro desconhecido com base em dados observados.

3
A controvérsia entre a perispectiva bayesiana e a frequentista esta relacionada a
interpretação da probabilidade e a forma como a evidência é usada. Esta controvérsia
entre as duas reflete diferenças fundamentais na interpretação da probabilidade, na
modelagem da incerteza e na forma como as evidências são usadas para fazer inferências
estatísticas. Ambas abordagens tem suas vantagem e limitações, e a escolha entre elas
depende do contexto específico do problema em questão e das preferências do
pesquizador.

4. Metodologia

Para a elaboração do presente ensaio foi feita uma pesquisa bibliográfica, qualitativa, e
esplicativa que consistiu na consulta e revisão de vários manuais existentes sobre o tema,
extração de informação e cruzamento dos diversos dados obtidos, encontrando conteudos
que satifizeram as inquietações sobre este assunto.

4
5. TESTE DE HIPÓTESE
O teste de hipótese é uma técnica estatística usada para tomar decisões sobre uma
população com base em uma amostra de dados. Envolve a formulação de duas hipóteses:
a hipótese nula (HO) e a hipótese alternativa (H1). O teste estatístico calcula uma
estatística de teste a partir dos dados da amostra e determina se os resultados são
suficientemente diferentes do esperado sob a hipótese nula para rejeitá-la em favor da
hipótese alternativa.

Teste de hipóteses; o teste de hipóteses é uma regra que permite específicar um


subconjunto do espaço amostral, W deve estar contido em X, tal que;

 Se (x1,x2,x3...xn), pertencer a W, rejeita-se o H0;


 Se (x1, x2, x3 ...xn) não pertencer a W, não se rejeita H0.

Ao conjunto denominado W chama-se região critica ou região de rejeicão.

O complementar do conjunto W pode designar-se por região de não reijeição.

Um teste é uma regra que pernite introduzir uma partição do espaço amostra em duas
regiões, a região de rejeição e a região de não rejeição.

Ao realizar um teste de hipóteses, e verificar que (x1, x2, ...xn), não pertecem a W, é
preferível não rejeitar a hipótese nula do que aceitar a hipótese nula.

Ex. Considere uma certa população X, com media μ desconhecida, supõe se que se
pretende testar H0: μ=2 contra H1≠ 2. Não rejeitar H0, não invalida que tambem possa se
rejeitar H0; μ =2.01, não se pode aceitar as duas hipóteses nulas, porque as afirmações ´´
μ=2´´ e ´´ μ=2.01´´ não podem ser ambas verdadeiras, só se pode afirmar que os dados
não permitem rejeitar qualquer uma das hipóteses nulas, ou usar a expressão “ a
evidência estatística e favorável a hipótese nula” quando concluir que a hipótese não é
rejeitada.

5
Para realizar um teste de hipótese deve-se seguir os seguintes passos;

1º passo- etabelecer as hipóteses (H0 e H1);

2º passo- obter uma estatística , com distribuição conhecida, que fique completamente
definida sob H;

3º passo- estabelecer os critérios do teste

Os testes de hipóteses são compostos por;

 Uma hipótese nula H0, que é defendida até que a evidência mostre o contrário;
 Uma hipótese altrnativa H1, que é adoptada se a hipótese nula for rejeitada
 Uma estatística teste T=T(x1, x2, ...xn)
 Uma região crítica W(t)

Os testes de hipóteses são uma modalidade da inferência estatística por isso são incertos,
e todo o caminho que vai do particular ao geral, pode induzir ao erro, e nos testes de
hipóteses considera-se 2 tipos de erros a saber;

5.1. HIPÓTESE NULA


A análise estatística inicia pelo teste da chamada hipótese nula Ho – diz-se “agá-zero”. A
hipótese nula, também denominada hipótese probanda, afirma que duas ou mais amostras
podem ser consideradas como se fossem extraídas de uma mesma população no que
concerne à variável considerada. Ela assume que eventuais diferenças entre as amostras
são decorrentes do erro amostral, ou seja, são casuais. Considerando duas populações,
com médias µ1 e µ2, a hipótese nula garante:

µ1 =µ2

Uma hipótese nula, por exemplo, afirma que as notas dos alunos não dependem da renda
familiar. Analisa-se amostras, então, diferenciadas por essa característica e procura-se
confirmar Ho.

6
5.2. HIPÓTESE ALTERNATIVA
Caso a hipótese nula possa ser rejeitada, o que normalmente se procura provar, pois é
quando se encontra uma correlação, aceita-se a chamada hipótese alternativa Ha – diz-se
“agá-á”. A hipótese alternativa ou experimental, significa que as diferenças das variáveis
encontradas nas amostras decorrem de diferenças efetivamente existentes nas populações
e não são frutos do erro amostral. Ha é, portanto, o complemento de Ho, isto é, ou uma
ou outra. Assim a hipótese alternativa garante:

µ1≠ µ2

No exemplo citado anteriormente, significaria concluir que as notas dos alunos dependem
da renda familiar.

6. NÍVEL DE SIGNIFICÂNCIA
Quando são encontradas diferenças entre as variáveis para amostras diferentes, surge o
questionamento se isto é, ou não, estatisticamente significante. Estabelece-se um nível de
significância ou de confiança que é a probabilidade de se rejeitar a hipótese nula com
segurança. Considera-se, então, a hipótese nula falsa sempre que a probabilidade da
diferença amostral encontrada for menor do que o nível de significância adotado. Assim,
define-se zonas ou regiões de aceitação e rejeição. Se superado o valor limite,
denominado valor crítico, entra-se na região de rejeição. Em caso contrário, aceita-se a
hipótese nula que é a única que é testada

O nível de confiança adotado, normalmente, é de 5% ( ou de 0,05, em termos


probabilísticos). Apenas em casos onde é exigido muito rigor usa-se 1%. Encontradas
diferenças entre as amostras retiradas de duas populações, testa-se a hipótese nula dentro
do limite de 0,05, por exemplo. Se o valor crítico for superado, rejeita-se Ho e aceita-se
Ha ,pois somente em 5% dos casos isso poderia ocorrer ao acaso.

7
7. TIPOS DE ERROS
Nos testes de hipótes a que considerar 2 tipos de erros;
7.1. Erro do tipo I
Como foi visto, pode-se rejeitar a hipótese nula mesmo ela sendo verdadeira, já que em
5% dos casos as diferenças amostrais podem ser explicadas pelo acaso e não por
diferenças populacionais. Comete-se, nesse caso, um erro do tipo I, ou erro alfa. Este erro
deve ser evitado e, para isso, uma solução seria aumentar o nível de confiança - passar de
0,05 para 0,01. Então, a probabilidade de se rejeitar Ho indevidamente seria reduzida.
Infelizmente, isso aumenta a chance de se cometer outro tipo de erro.

7.2. Erro do tipo II


O erro do tipo II, ou erro beta, consiste em aceitar a hipótese nula, mesmo ela sendo falsa.
Quando se adota um nível de significância muito rigoroso para rejeitar Ho , acaba-se
atribuindo indevidamente ao acaso discrepâncias exageradas entre as amostras. Deste
modo, ao se procurar evitar o erro do tipo I, aumenta-se o risco de se cometer um erro do
tipo II e vice-versa. Prioriza-se, dentro de certos limites, evitar erros do tipo I, até porque
o erro do tipo II pode ser evitado na forma de expressar a conclusão. Diz-se que não se
pode afirmar em tal nível de significância que a hipótese nula deva ser rejeitada, ao invés
de afirmar que nesse nível de significância a hipótese nula deva ser aceita.

8. DISTRIBUIÇÃO DAS DIFERENÇAS

Em uma situação onde se pretende determinar de duas populações com características


diferentes, apresentam resultados significamente diferentes em relação a um certo
resultado. Por exemplo querer saber se as notas de filhos de pais rigorosos são
equivalentes as notas de filhos de pais liberais. Para resolver esse problema irá-se tomar
amostras de cada população e de seguida determinar a média de cada população. Pode se
então encontrar a diferença entre as médias obtidas, se este experimento for repetido para
um número muito grande de pares de amostras, a distribuição das diferencas entre as
médias de cada par, será, pelo teorema do limite central, uma distribuição normal.
Derterminar o desvio padrão desta distribuição é muito dificíl de calcular, o que se fará,

8
analogicamente, é estimar o erro padrão da diferença á partir do erro padrão das médias
do par de amostras das populações a analisar.

8.1. ERRO PADRÃO DA DIFERENÇA

Para fazer a distribuição das diferenças é necessário calcular o erro padrão, e este erro
padrão é obtido da seguinte forma;

1º -Encontrar as médias e os desvios padrões de cada amostra extraída das duas


populações, para a primeira é feita das seguintes formas:

x 1=
∑x1 x 12 =
∑ x 12
n1 n1

σ 1= √ σ 2 2
2 2 2
σ 1 =x 1 −x 1

2
n 1−σ 2
s 1=√ s 12
2
s1 =
n 1−1

Para o a segunda amostra é feito da seguinte forma;

x 2=
∑x2 2
x2 =
∑ x 22
n2 n2

σ 2=√ σ 22
2 2 2
σ 2 =x 2 −x 2

2
n 2−σ 2
s 2=√ s 22
2
s2 =
n 2−1

2º-De seguida achar-se o erro padrão de média para cada amostra usando as seguintes
formúlas;

σ1 σ2
S x1 = S x 2=
√ n1−1 √ n2−1

Ou ainda dessa forma;

9
s1 s2
S x= S x=
√ n1 n2

Apartir dos erros padrão das médias estimar o erro padrão da diferença, mediante;

S ∆=√ sy 12 +sy 22

No caso das amostras tiverem o mesmo tamanho n, este valor pode ser obtido de forma
facíl partindo das varianças populacionais, sem que seja necessário determinar os desvios
padrões amostrais e erros padrões amostrais, usando a seginte formúla;

√ √
2 2
2 +¿σ 2 2+¿ s2
σ1 s1
S ∆= = ¿¿
n−1 n

9. ESTATÍSTICA Z

A distribuição amostral das diferenças entre as médias pode ser considerada normal á
partir de duas amostras suficientemente grandes ( maiores que 30 elementos). Isso
permite que seja usada a tabela normal padronizada, mediante a determinação do escorrez
z. Assim a partir de duas amostras extraídas de duas populaçóes que se pretendam testar,
cujos valores médios, desvios padrões, erros padrões médios e erro padrão da diferença
foram determinados, é possível encontrar a escorez z, mediante;

x 1−x 2
z= n≥ 30
S∆

Com o valor obido com esta operação, vai-se a tabela e acha-se a percentagem que
corresponde ao total de diferenças inferiores a ela. Como existe simetria, deve-se
multiplicar essa taxa por 2, achando asim a percentagem total(%), de casos cujas médias
diferem menos do que o valor encontrado.

Na prática, determina-se um nível de significância de 0,05, que corresponde na tabela a


um valor de 1,96 para z. Se fosse adotado o nível de confiança 0,01, o valor de z seria
2,58. Para obter o z usa-se a formúla acima referida e se ele superar aquele detrminado

10
nível de significância, rejeita-se a hipótese nula H0 e aceita-se a hipótese alternativa H1.
Caso seja inferior aceita-se logo a hipótese nula H0.

10. ESTATÍSTICA T
10.1. Pequenas amostras

Quando se pretende analisar amostras cujo o numero de dados obtidos em cada uma
delas for inferior a 30, nao pode-se considerar a disribuição das diferenças como normal,
e nestes casos a estatística z anteriormente estudada não pode ser aplicada. Para amostras
com menos de 30 elementos usa-se a estatística t, ou razão t, para realizar os testes que
ainda podem ser chamados de t de student.

Para realizar esse treste primeiro é feito o cálculo para detrminar o t0, e é feito da
seguinte forma;

x 1−x 2
¿= n<30
S∆

Na estatística t, observa-se as segintes características

 t0- valor observado, calculado pelo metodo acima, que é identico ao usado na
estatística z;
 tc- valor crítico, encontrado na tabela á partir do nível de significância desejado e
número de garus de liberdade gl;
 t0<tc- nestas condições aceita-se a hipótese nula e rejeita-se a hipótese alternativa.
As diferenças são fruto do erro amostral para o este nível de significância.
 t0≥tc- rejeita-se a hipótese nula e aceita-se a hipótese alternativa. As diferenças
não podem ser esplicadas pelo erro amostral para este nível de significância.

Existem outas tabelas para a estatistíca t, para os níveis de significância 0,05 e 0,01.
Nelas entra-se com o número de grau de liberdade (gl) e acha-se o valor crítico (tc).

11
Os cálculos de S∆ e gl, vão depender da natureza do problema em análise. Se as
variâncas das populações de onde foram extraídas as amostras são iguais ou
diferentes o tratamento é diferente. Se os dados forem pareados, quando os dados das
duas amostras estiverem vinculados aos pares, há um modo diferente de realizar os
testes.

10.2. Dados pareados

Este procedimento é usado quando se pretende fazer testes comparativos em tempos


diferentes para a mesma amostra, para identificar mudanças em função de certas
condições. Sempre que for possível organizar os dados em pares assim se deve fazer, pois
assim reduz diferenças ocasionadas por outras variáveis que não são a que é estudada. A
variável tratada estatisticamente passa a ser a diferença dos pares nas duas situações.

Vale o que foi feio na estatistica t, com um cuidado de se calcular o devio padrão das
diferenças e o erro padrão da diferença, atraves das expressões seguintes;

σ
2 −2
σ =∆ -∆
2
e S ∆=
√n−1

Onde ∆ e a diferença para cada um dos n pares de medidas da variavel.

Como o tamanho da amostra, no cálculo do numero de grau de liberdade para ser usado
na tabela da razão t, deve ser n, que é o tamanho da amostra, antes assim como depois ,
pois a amostra é a mesma;

gl=n-1

10.3. Variâncas iguais

Quando não se conhece a variânca da população, mesmo que as amostras possam ser
consideradas como se fossem retiradas de uma mesma população, diz se que as variâncas
são as mesmas e as amostras são chamadas homocedásticas. Neste caso, calcula-se o
erro padrão da diferença S∆ , atraves da seginte formúla;

12
1 1
S ∆=√ S ´ [
2
+ ]
n1 n2

Onde S´, e a estimativa do desvio padrão da população a partir das duas amostras. Ele
pode ser calculado a partir de;

2 2
n 1 σ 12+ n 2σ 22 ( n 1−1 ) S 1 +(n 2−1)S 2
s ´ 2= =
n 1+n 2−2 n 1+n 2−2

E o número do grau de liberdade, a ser usado para que possa ir a tabela é dado por:

gl=n 1+n 2−2

A regram prática para que se possa admitir uma unica população e por sequencia adotar o
método exposto, e que a relação entre as variâncas amostrais seja inferior a 4.

No caso das amostras tiverem o mesmo tamanho n os valores acima podem ser
calculados mais facilmente com o uso das seguintes formúlas;

√ √
2 2
2 +¿σ 2 2+ ¿S 2
σ1 S1
S ∆= ¿= ¿ ; e gl=2(n-1)
n−1 n

10.4. Variâncas diferentes

Quando as amostras vem de populações que apresentam variâncas desiguais, as amostras


são heterocedásticas. O critério é que a relação entre as variâncas amostrais seja superior
a 4. Calcula-se o erro padrão da diferença através da seguinte formúla;

S ∆=
√ s 12 S 22 = σ 2
+
n1 n2 √
+
σ 22
n1−1 n 2−1

O número de graus de liberdade, a ser usado para que possa ir a tabela e calculado através
da seguinte formula;

gl=¿ ¿

13
11. ESTATÍSTICA F

As estatistícas acima citadas são úteis para comparar 2 médias, quando se pretende
comparar 3 ou mais médias independentes usa-se a razão F ou estatistica F. Nesta
estatistica F só são consideradas amostras com o mesmo tamanho n.

Querendo comparar R médias, toma-se R amostras de n elementos.

Cada amostra terá sua própria variânca σi 2. Pode se imaginar uma amostra de variânca σ 2,
que contenha todos elementos de R amostras. O valor de F observado, tambem
simbolizado por Fo é dado pela equação;

R (n−1) R σ 2 .
F0= [ −1]
R−1 ∑ σi2 .

O valor obtido deverá ser comparado ao valor de F que foi tabelado, o valor crítico Fc.
Habitualmente essas tabelas são dadas para os níveis de significância 0,05 e 0,01. Como
entradas na tabela são usados os graus de liberdade gl para o numerador e denominador,
que são definidos por;

 N=gl (numerador)=R-1
 D=gl (denominador) =R(n-1)

12. Lema de Neyman-Person

Este lema foi formulado por Jerzy Neyman e Egon Person na década de 1930 e é
amplamente usada em inferência estatística. Este lema estabelece que, ao realizar um
teste de hipõteses entre duas hipóteses estatísticas, a regra de decisão que maximiza a
probabilidade de detecção de um efeito real (poder do teste) para um certo nível de
significância é aquela que minimiza a probabilidade de erro do tipo I acima estudado, sob
a restriçáo da probabilidade de erro do tipo II. A aplicação do lema de Neyman-Person
envolve a definição das duas hipóteses, a nula e a alternativa, a escolha de um nível de

14
significância e a determinação da região crítica do teste( probabilidade de rejeitar
correctamenta hipótese nula quando é falsa) e avaliar a eficácia da decisão tomada.

13. Conclusões e recomendacões

O teste de hipoteses é uma feramenta poderosa da inferência estatística que permite tirar
conclusões sobre populações com base em dados amostrais. Ao formular hipteses claras,
escolher estatísticas de teste apropriadas e interpretar os resultados com cautela, pode se
usar o teste de hipóteses de forma eficaz para avancar o entendimento em variadas áreas.

Na estatistica Z a distribuição da variável observada não precisa ser normal, porque pelo
teorema do limite central, o fato das amostras serem grandes assegurava distribuição
normal para as medias das diferenças. A estatística t de student exige que a variável
observacional siga uma distribuição normal.

O lema de Neyman-Person é um princípio importante na teoria estatística que orienta a


escolha ótima das regras de decisão em testes de hipóteses, com vista a maximizar a
capacidade de detecção de efeitos verdadeiros e controlar os erros associados a infêrencia
estatística.

15
II. Referências bibliográficas

ASSIS,P. Janilson; DE SOUSA, P.Roberto; LINHARES,F.C.Paulo, Testes de hipóteses


estatísticas, Mossoró-RN, Edufersa

CAETANO, R. Reginaldo,(2004), Estatística.

MURTEIRA, Bento; ANTUNES , Marilia(2013) Probabilidades e estatística, Lisboa,


Escolar editora. Volume II.

MURTEIRA, Bento; RIBEIRO, S. Carlos;PIMENTA, Carlos;PIMENTA, Filomena;


SILVA, Joao Andrade, (2023) Introdução a estatística. ( Lisboa), Escolar editora.3ª
edição

16

Você também pode gostar