Você está na página 1de 24

Divisão de Engenharia

Engenharia Eléctrica

3º Semestre

Probabilidade e Métodos Estatísticos

Testes de Hipóteses

Correlação e Regressão

Discentes: Alberto Manuel

Barnabé José Alberto Carlos

Elton Leonor Gastão

Esselino Luís Raimundo

Docentes: Justino Mário Buanali

Silva Muhate

Songo, Julho de 2022


ÍNDICE
INTRODUÇÃO .................................................................................................................................. 1
TESTES DE HIPÓTESES .................................................................................................................. 2
Hipóteses estatísticas ....................................................................................................................... 2
Hipótese Nula: Ho............................................................................................................................ 2
Hipótese Alternativa: H1 ................................................................................................................. 2
Tipo de erros ................................................................................................................................... 3
Configuração das regiões críticas .................................................................................................... 3
TESTES DE SIGNIFICÂNCIA .......................................................................................................... 5
Teste de significância da média ...................................................................................................... 5
Teste de significância da proporção ................................................................................................ 7
Teste de significância da variância.................................................................................................. 8
TESTES DE IGUALDADE DE DOIS PARÂMETROS ................................................................... 9
Teste de igualdade de duas médias ................................................................................................. 9
Teste de igualdade de duas proporções ......................................................................................... 10
Teste de igualdade de duas variâncias........................................................................................... 11
Pontos críticos ............................................................................................................................... 12
CORRELAÇÃO ................................................................................................................................ 13
TIPOS DE CORRECÇÃO ................................................................................................................ 13
COEFICIENTE DE CORRELAÇÃO AMOSTRAL (r) ................................................................... 14
COEFICIENTE DE CORRELAÇÃO POPULACIONAL (ρ).......................................................... 16
HIPÓTESES E CORRELAÇÃO ...................................................................................................... 16
Teste de Hipótese .......................................................................................................................... 17
CORRELAÇÃO E CAUSALIDADE ............................................................................................... 18
REGRESSÃO ................................................................................................................................... 18
Regressão Linear Simples ............................................................................................................. 18
Regressão Linear Múltipla ............................................................................................................ 19
Resíduos ........................................................................................................................................ 19
Linha de regressão......................................................................................................................... 19
CONCLUSÃO .................................................................................................................................. 21
REFERÊNCIAS BIBLIOGRÁFICAS .............................................................................................. 22
INTRODUÇÃO

No presente trabalho se pretende dar a conhecer acerca dos testes de hipóteses que constitui
grande parte da subdivisão da inferência estatística, em que esta, busca testar hipóteses
sobre características (parâmetros, formas de modelo) do modelo probabilístico da variável
de interesse na população, a partir de dados de uma amostra probabilística desta mesma
população), Os testes de hipóteses permitem fazer inferências sobre outras características
do modelo probabilístico da população além dos parâmetros.

Assim, os testes de hipóteses têm como objectivo decidir, com base na informação
fornecida pelos dados de uma amostra, sobre a aceitação ou não de uma dada hipótese
(conjectura sobre aspectos desconhecidos da/s população/ões).

Também será abordado neste trabalho o tópico “correlação e regressão”, que busca estudar
o comportamento conjunto de uma ou mais variáveis em certas situações. Em muitos casos,
a explicação de um fenómeno de interesse pode estar associado a outros factores (variáveis)
que contribuem de algum modo para a ocorrência deste fenómeno, o comportamento
conjunto de duas variáveis quantitativas pode ser observado por meio do gráfico de
dispersão.

Assim, correlação e regressão são duas técnicas estreitamente relacionadas, que visa
estimar uma relação que possa existir entre duas variáveis na população. O objectivo do
estudo da correlação é determinar (mensurar) o grau de relacionamento entre duas
variáveis. Por outro lado, quando se analisa dados que sugerem a existência de uma relação
funcional entre duas variáveis, surge então o problema de se determinar uma função
matemática que exprima esse relacionamento, nesse caso, uma equação de regressão.

Neste trabalho, os tópicos acima introduzidos serão mais aprofundados, com a utilização de
uma linguagem clara e objectiva, de modo a facilitar a percepção do leitor acerca do que
neste se pretende transmitir. O presente trabalho apresenta a seguinte estrutura:

• Elementos pré-textuais: Capa, contracapa e índice;

• Corpo do trabalho: Introdução e desenvolvimento;

• Elementos pós-textuais: Conclusão e referências bibliográficas.

1
TESTES DE HIPÓTESES
Os testes de hipóteses têm como objectivo decidir, com base na informação fornecida pelos
dados de uma amostra, sobre a aceitação ou não de uma dada hipótese (conjectura sobre
aspectos desconhecidos da/s população/ões).

Os testes de hipóteses paramétricas supõem que é conhecida, pelo menos aproximadamente


a forma da distribuição e as hipóteses a formular dizem respeito ao(s) parâmetros(s) ou a
distribuições populacionais

Enquanto os teste de hipóteses não paramétricas como em geral pretende-se estabelecer


algo sobre a distribuição ou então não se admite o conhecimento da distribuição para o
estudo dos parâmetros.

Uma hipótese estatística – é uma afirmação ou suposição sobre o valor de um parâmetro


populacional ou sobre a natureza da distribuição de probabilidade de uma variável e que
precisa testar para se tomar uma decisão estatística.

Exemplo: São exemplos de hipóteses estatísticas as afirmações:

a) A estatura média da população moçambicana é de 1.70 cm;

b) A variância dos salários de empresa XY é de 5000,00 meticais;

c) A proporção de alunas na Escola Secundária Josina Machel é de 66%.

Hipóteses estatísticas
De um modo geral, para a realização de um teste estatístico, começa – se por emitir a
hipótese nula (Ho) é a hipótese a ser testada e depois a hipótese alternativa (H1) que é
qualquer outra afirmação ou hipótese diferente da hipótese nula. Tem sido comum a
hipótese nula ser formulada com uma igualdade, enquanto a alternativa com sinais que
indicam a diferença ou desigualdade.

Hipótese Nula: Ho
A hipótese nula engloba o valor do parâmetro que se assume como verdadeiro para a
população. Tem que ser uma afirmação escrita na forma de uma igualdade (=).

Hipótese Alternativa: H1
A hipótese alternativa (denotada por H1 ou Ha) é a afirmação que indica que o parâmetro
tem um valor que é diferente do indicado na hipótese nula.

Exemplo: Consideremos as seguintes situações de formulação de hipóteses estatísticas. a)


Um psicólogo, mantém sua ideia de que o coeficiente de inteligência de uma pessoa de 20
anos de idade não é igual a 100%. 100 . H0: μ=100; μ≠100; teste bilateral.

2
b) Um médico afirma numa entrevista que a proporção de pessoas que diariamente na
cidade MN é infectada pelo vírus de malária está acima de 10%. H0: p=0.10; H0: p>0.10
teste unilateral a direita.

c) Um produtor de viaturas nas justificações afirma que a camada de cromo que é usada
para embelecer os carros de marca KIA tem uma variância menor do que 225 gramas.

H0: σ2=225grs; H1: σ2<225grs teste unilateral a esquerda.

Tipo de erros
Já é conhecido que o objectivo dos testes de hipóteses é com base nas observações de uma
amostra generalizar os resultados para a população, entretanto deve-se estar claro de que a
tomada de decisões possui riscos, isto é, podem cometer-se erros.

Configuração das regiões críticas

Um teste é bilateral quando a sua hipótese alternativa é dada por um ponto definido
demarcando duas regiões de rejeição. A figura a seguir mostra a localização das regiões de
aceitação e de rejeição bem como as probabilidades para um teste bilateral.

3
Um teste é unilateral a direita, quando sua hipótese alternativa é dada por um intervalo
semifechado, apresentando uma região de rejeição situada a direita.

Um teste é unilateral a esquerda, quando a sua hipótese alternativa é dada por um intervalo
semi – fechado, apresentando uma região de rejeição situada a esquerda.

Os testes estatísticos de uma forma geral podem ser divididos em duas categorias: testes
paramétrios e não paramétricos:

Os testes paramétricos – são aqueles em que na sua realização, são necessariamente


calculadas medidas estatísticas como a média, o desvio padrão, etc., para além de terem o
pressuposto de que a população onde foi extraída a amostra segue a distribuição normal.

Os testes não paramétricos – são aqueles em que os dados estão muitas vezes na escala
nominal, ordinal ou por intervalo. Sendo assim, não são calculados os parâmetros
populacionais. Estes testes são também aplicados para amostras pequenas.

Ainda que esta classificação possa existir também podem –se realizar testes de significância
da média, proporção ou mesmo vari6ancia; testes de igualdade das médias, das proporções

4
ou das variâncias; testes de ajustamento a distribuições; testes de associação ou
independência, etc.

Passos para a realização de um teste das hipóteses

TESTES DE SIGNIFICÂNCIA

Teste de significância da média

5
Exemplo: As estatísticas dos últimos quatro anos mostraram que as pessoas que auferem
um salário superior a 27000,00 meticais possuem uma poupança de 11500,00 meticais
mensalmente. Uma breve consulta ao gerente de uma dependência do Millennium Bim
mostrou para uma amostra de 20 clientes uma média de 11800,00 meticais com desvio
padrão de 200,00 meticais. Use o nível de significância de 0.05 e verifique se a média das
poupanças mudou significativamente ou não.

6
Teste de significância da proporção

Exemplo: O presidente de uma certa associação, pretende avançar com um projecto que
tem suscitado controversas no grupo. Ele afirma em sua defesa que mais de 50% dos
associados concordam com o projecto. O que se deve concluir da afirmação do presidente,
sabendo que dos 70 associados escolhidos aleatoriamente 60 se manifestaram a favor da
opinião. Use um nível de significância de 5%.

7
Teste de significância da variância

Exemplo: Para diminuir a emissão do monóxido de carbono, uma fábrica de produção de


carros depois de 4 anos de experiência estimou que a média e desvio padrão do monóxido
emitido era 0.3% e 0.025% por unidade de volume de óxido de carbono. No sexto ano de
funcionamento com os mesmos padrões uma amostra de 20 carros foi retirada e foram
medidos os valores de monóxido de carbono emitidos. Testar ao nível de significância de
0.10 se a variância actual excede os 0.025%.

8
TESTES DE IGUALDADE DE DOIS PARÂMETROS

Teste de igualdade de duas médias


O problema consiste em conhecidas as médias de duas amostras, extraídas de duas
populações independentes e normais, verificar se as médias populacionais são diferentes ou
iguais. Geralmente a hipótese nula é emitida a cerca da igualdade das médias populacionais
e a alternativa pode ser qualquer uma das situações entre as três já referidas.

Exemplo: Uma empresa está analisar as suas despesas relativas a energia, água,
combustíveis, gastos em chamadas internas, etc. Um dos problemas é essencialmente
diminuir a elevada conta dos gastos em chamadas telefónicas no fim de cada mês.
Investigações preliminares de uma amostra revelaram que metade das chamadas realizadas
não era de serviço. Supondo que os trabalhadores solteiros são os responsáveis pelas contas
elevadas, retirou-se duas amostras aleatórias de 65 solteiros e 90 casados para averiguar o
facto. A tabela abaixo resume as informações referentes as durações médias e variâncias
das chamadas privadas por mês.

9
Teste de igualdade de duas proporções
Perguntas como, a proporção de alunas que aprovou nos exames de admissão é igual a
proporção de alunos? A percentagem de eleitores do candidato A na mesa m1 é igual a
percentagem de eleitores que do mesmo candidato na mesa m2? Etc. Estas e outras
perguntas podem ser resolvidas usando o teste de igualdade de proporções.

O teste consiste em verificar a igualdade de duas proporções, assumindo que as amostras


com as proporções p1 e p2 são normalmente distribuídas. Dadas estas condições o valor do
teste é calculado pela expressão.

10
Exemplo: Deseja – se testar se são iguais as proporções de homens e mulheres que lêem
jornais noticiosos e se lembram de um determinado anúncio depois de alguns dias depois.
Sejam dados os seguintes resultados de amostras aleatórias e independentes de homens e
mulheres que foram entrevistadas. Use 10% para fazer o teste.

Teste de igualdade de duas variâncias


O teste consiste em verificar a igualdade de duas variâncias de duas populações normais, a
partir das observações de duas amostras. O teste é baseado na distribuição de Fisher “ F -
teste”

11
O ponto crítico obtém-se na tabela dos valores críticos da distribuição F de Fisher –
Snedecor, os graus de liberdade k1 e k2 e o nível de significância vária em função da
hipótese alternativa que for considerada.

Pontos críticos

Exemplos: Dois programas de formação de funcionários realizados a dois grupos


diferentes. Os 21 funcionários treinados no programa antigo apresentaram uma variância de
146 pontos em suas taxas de erro. No novo programa, foram treinados 13 funcionários
apresentando uma variância de 200 pontos. Sendo α=0.10, pode – se concluir que a
variância é diferente para os dois programas.

12
CORRELAÇÃO
A análise de Correlação diz respeito ao estudo da dependência de uma variável, a variável
dependente, em relação a uma ou mais variáveis explanatórias, visando estimar e/ou prever
o valor médio (da população) da primeira em termos dos valores conhecidos ou fixados (em
amostragens repetidas) das segundas. Na análise de correlação não há distinção entre as
variáveis dependentes e explanatórias. Os dados podem ser representados por pares
ordenados (x, y)

Onde: x é a variável independente (ou explanatória).

y é a variável dependente (ou resposta).

TIPOS DE CORRECÇÃO
Correlação Linear Negativa: Nesta correlação quando o Valor da variável independente
aumenta (X) a variável dependente (Y) decresce.

Figura 1. Correlação Linear Negativa

Correlação Linear Positiva: Quando o valor das variável independente (X) aumenta os
valores da variável dependente Também Aumentam.

13
Figura 2. Correlação Linear Positivas

Por outro lado, podemos ter Correlações não lineares ou Variáveis que não proporcionam
correlação alguma, são exemplos os seguintes gráficos.

Sem Correlação Correlação não linear

COEFICIENTE DE CORRELAÇÃO AMOSTRAL (r)


O coeficiente de correlação de Pearson (r) ou coeficiente de correlação produto-momento
mede o grau da correlação linear entre duas variáveis quantitativas, é também uma medida
da força e direcção de uma relação linear entre duas variáveis. É um índice adimensional
com valores situados ente -1 e 1 inclusive, que reflecte a intensidade de uma relação linear
entre dois conjuntos de dados. E podendo ser determinado através da seguinte equação
abaixo:

Onde:

n : Número de Par de Dados

x :Variável independente

y : Variável dependente
14
Se r = 1 Significa uma correlação perfeita positiva entre as duas variáveis.

Se r = -1 Significa uma correlação negativa perfeita entre as duas variáveis - Isto é, se uma
aumenta, a outra sempre diminui.

Se r = 0 Significa que as duas variáveis não dependem linearmente uma da outra. No


entanto, pode existir uma outra dependência que seja "não linear". Assim, o resultado r=0
deve ser investigado por outros meios.

Entretanto o valor do coeficiente de correlação “r” For maior que 0,5 (independentemente
si positivo ou não) então temos uma correlação Forte, e si menor que 0,5
(independentemente do seu sinal) então a correlação e fraca.

Exemplo1:

Calcule o coeficiente de correlação para os gastos com propaganda e vendas da


empresa informados no Exemplo.

Construindo o diagrama de dispersão

15
Usando a Equação (Eq.1) Teremos:

∑ ∑ ∑
√ ∑ ∑ √ ∑ ∑

√ √

Então podemos classificar o coeficiente como sendo um coeficiente de Correlação positiva


Forte.

COEFICIENTE DE CORRELAÇÃO POPULACIONAL (ρ)


Uma vez calculado o coeficiente de correlação Amostral “r”, precisamos determinar se há
evidência suficiente para decidir se o coeficiente de correlação populacional ρ é significante
em um nível de significância especificado.

O Coeficiente de correlação populacional de Pearson (ρ) entre duas variáveis aleatórias X e


Y, com desvio padrão diferente de zero, mede a direcção e o grau com que as variáveis se
associam linearmente.

Tal como o coeficiente de correlação amostral, também se pode provar que o coeficiente de
correlação populacional assume valores no intervalo [-1,1]. Se as variáveis aleatórias X e Y
são independentes (ver independência), então o coeficiente de correlação ρ vem igual a 0.

No entanto, o inverso não é necessariamente verdadeiro, pois pode o coeficiente de


correlação ser nulo, sem que as variáveis aleatórias sejam independentes, já que ρ só mede
a associação linear.

HIPÓTESES E CORRELAÇÃO

16
Na hipótese remota se o coeficiente de correlação ter um valor negativo (abaixo de 0), ele
demonstra uma conexão negativa entre os factores. Isto implica que os factores se movem
de forma inversa (ou seja, quando se constrói reduções diferentes, ou quando se diminui
incrementos diferentes), então diz-se que há correlação negativa significante.

Na hipótese remota se o coeficiente de correlação ter um valor positivo (acima de 0) ele


demonstra uma conexão positiva entre os factores implicando que os dois factores
movimentam um casal, por exemplo, à medida que uma variável diminui a outra
adicionalmente diminui, ou quando uma variável constrói a outra da mesma forma
aumenta, então diz-se que há relação positiva significante

Quando o coeficiente de conexão é 0 isso demonstra que não há conexão entre os factores
(uma variáve3l pode permanecer estável enquanto diferentes incrementos ou diminuições),
Então não há qualquer relação significante

Teste de Hipótese
Um teste de hipótese também pode ser usado para determinar se o coeficiente de correlação
da amostra r fornece evidência suficiente para concluir que o coeficiente de correlação
populacional ρ é significante em um nível de significância especificado.

Um teste de hipótese pode ser unicaudal ou bicaudal.

1. Teste unicaudal à esquerda:


H0 : ρ  0 (não há correlação negativa significante)

Ha : ρ < 0 (há correlação negativa significante)

2. Teste Unicaual a Direita

H0 : ρ  0 (não há correlação positiva significante)

Ha : ρ > 0 (há relação positiva significante)

3. Teste bicaudal
H0 : ρ = 0 (não há correlação significante)

Ha : ρ  0 (há correlação significante)

Onde:

H0 é a Hipótese Nula;

17
Há é a Hipótese Alternativa

CORRELAÇÃO E CAUSALIDADE
O fato de duas variáveis serem fortemente correlacionadas não implica uma relação de
causa e efeito entre elas.

A confusão entre a correlação e causalidade está na base de muitas concepções erradas. Daí
que se torna imperativo falar sobre este assunto em maior profundidade. Os nossos cérebros
são autênticas máquinas de reconhecimento de padrões, mas este processo está longe de ser
perfeito, o que resulta na detecção de padrões que não existem de verdade.

A correlação, isto é, a ligação entre dois eventos, não implica necessariamente uma relação
de causalidade, ou seja, que um dos eventos tenha causado a ocorrência do outro. A
correlação pode no entanto indicar possíveis causas ou áreas para um estudo mais
aprofundado, ou por outras palavras, a correlação pode ser uma pista

REGRESSÃO
A análise de regressão mede e descreve a forma de relacionamento entre duas variáveis e
permite a estimativa dos valores de uma variável em relação aos valores das demais.
Regressão está condicionada à premissa de que a variável dependente é estocástica, mas as
variáveis explanatórias são fixas.

Regressão Linear Simples


Após verificar se a correlação linear entre duas variáveis é significante, o próximo passo é
determinar a equação da linha que melhor modela os dados (linha de regressão). Pode ser
usada para prever o valor de y para um dado valor de x. A partir da equação:

Onde:

 Y e X representam as variáveis dependentes e independentes, respectivamente;


 β é o coeficiente de regressão na população amostrada;
 α é o valor previsto para Y na população quando X é igual a zero •
 i indica o i th par de dados X e Y na amostra

18
Regressão Linear Múltipla
Em algumas situações, Y pode ser considerado dependente em relação a mais do que uma
variável.

Neste caso, Y é linearmente dependente em relação à variável X1 e também em relação à


variável X2 . Aqui i denota a i th variável independente, e Xij a jth observação da variável i

Neste caso, há uma variável dependente e duas variáveis independentes.

 Β1 indica quanto varia Y com a mudança de uma unidade em X1 , se X2 for


mantido constante. Isto é, β1 é uma medida do relacionamento de Y com X1 após
controlar o efeito de X2 .
 Similarmente, β2 descreve a taxa de mudança em Y à medida que X2 varia, com X1
permanecendo constante.
 Os dois parâmetros da população, β1 e β2, são chamados de coeficientes de
regressão parcial porque cada um expressa somente parte do relacionamento de
dependência.

Resíduos
A diferença entre o valor y observado e o valor y previsto para um dado valor x na linha.
Para um dado valor x, di = (valor y observado) – (valor y previsto)

Linha de regressão
Linha de regressão é linha para a qual a soma dos quadrados dos resíduos é um mínimo.

19
A equação de uma linha de regressão para uma variável independente x e uma variável
dependente y é: ŷ = mx + b

Onde:

Exemplo2:

Usando os valores do exemplo1 podemos então calcular a estimativa, pela Regressão


Linear.

∑ ∑ ∑
∑ ∑

̅ ̅

Assim podemos escrever a nossa Equação de Estimativa Y(x) que nos fornece valores
aproximados ŷ = mx + b

20
CONCLUSÃO
Após concluído pode afirmar-se que:

• Em Estatística, uma hipótese é uma afirmação ou asserção sobre uma propriedade da


população. Um teste de hipóteses (ou teste de significância) é um procedimento padrão para
testar uma afirmação sobre uma propriedade da população. Se, sob uma certa hipótese, a
probabilidade de ocorrência de um determinado acontecimento for muito pequena,
concluímos que essa hipótese não deve ser verdadeira;

• Correlação e regressão são duas técnicas estreitamente relacionadas, que visam estimar
uma relação que possa existir entre duas variáveis na população;

• O objectivo do estudo da correlação é determinar (mensurar) o grau de relacionamento


entre duas variáveis;

• Quando se analisa dados que sugerem a existência de uma relação funcional ente duas
variáveis, surge então o problema de se determinar uma função matemática que exprima
esse relacionamento, ou seja, uma equação de regressão.

21
REFERÊNCIAS BIBLIOGRÁFICAS
MURTEIRA, B., RIBEIRO, C. S., Silva, J. A., PIMENTA, C. Introdução à Estatística.
McGraw-Hill de Portugal, Lda. 2002

PESTANA, D., VELOSA, S. (2010). Introdução à Probabilidade e à Estatística,


Volume I, 4ª edição, Fundação Calouste Gulbenkian. 2010

MULENGA, Alberto. Testes de hipóteses. cap.7. s/l: s/ed. s/d.

TESTES DE HIPÓTESES: pdf, Disponível em: <www.fcav.unesp.br >. Acessso em:


27/06/2021.

22

Você também pode gostar