Escolar Documentos
Profissional Documentos
Cultura Documentos
Engenharia Eléctrica
3º Semestre
Testes de Hipóteses
Correlação e Regressão
Silva Muhate
No presente trabalho se pretende dar a conhecer acerca dos testes de hipóteses que constitui
grande parte da subdivisão da inferência estatística, em que esta, busca testar hipóteses
sobre características (parâmetros, formas de modelo) do modelo probabilístico da variável
de interesse na população, a partir de dados de uma amostra probabilística desta mesma
população), Os testes de hipóteses permitem fazer inferências sobre outras características
do modelo probabilístico da população além dos parâmetros.
Assim, os testes de hipóteses têm como objectivo decidir, com base na informação
fornecida pelos dados de uma amostra, sobre a aceitação ou não de uma dada hipótese
(conjectura sobre aspectos desconhecidos da/s população/ões).
Também será abordado neste trabalho o tópico “correlação e regressão”, que busca estudar
o comportamento conjunto de uma ou mais variáveis em certas situações. Em muitos casos,
a explicação de um fenómeno de interesse pode estar associado a outros factores (variáveis)
que contribuem de algum modo para a ocorrência deste fenómeno, o comportamento
conjunto de duas variáveis quantitativas pode ser observado por meio do gráfico de
dispersão.
Assim, correlação e regressão são duas técnicas estreitamente relacionadas, que visa
estimar uma relação que possa existir entre duas variáveis na população. O objectivo do
estudo da correlação é determinar (mensurar) o grau de relacionamento entre duas
variáveis. Por outro lado, quando se analisa dados que sugerem a existência de uma relação
funcional entre duas variáveis, surge então o problema de se determinar uma função
matemática que exprima esse relacionamento, nesse caso, uma equação de regressão.
Neste trabalho, os tópicos acima introduzidos serão mais aprofundados, com a utilização de
uma linguagem clara e objectiva, de modo a facilitar a percepção do leitor acerca do que
neste se pretende transmitir. O presente trabalho apresenta a seguinte estrutura:
1
TESTES DE HIPÓTESES
Os testes de hipóteses têm como objectivo decidir, com base na informação fornecida pelos
dados de uma amostra, sobre a aceitação ou não de uma dada hipótese (conjectura sobre
aspectos desconhecidos da/s população/ões).
Hipóteses estatísticas
De um modo geral, para a realização de um teste estatístico, começa – se por emitir a
hipótese nula (Ho) é a hipótese a ser testada e depois a hipótese alternativa (H1) que é
qualquer outra afirmação ou hipótese diferente da hipótese nula. Tem sido comum a
hipótese nula ser formulada com uma igualdade, enquanto a alternativa com sinais que
indicam a diferença ou desigualdade.
Hipótese Nula: Ho
A hipótese nula engloba o valor do parâmetro que se assume como verdadeiro para a
população. Tem que ser uma afirmação escrita na forma de uma igualdade (=).
Hipótese Alternativa: H1
A hipótese alternativa (denotada por H1 ou Ha) é a afirmação que indica que o parâmetro
tem um valor que é diferente do indicado na hipótese nula.
2
b) Um médico afirma numa entrevista que a proporção de pessoas que diariamente na
cidade MN é infectada pelo vírus de malária está acima de 10%. H0: p=0.10; H0: p>0.10
teste unilateral a direita.
c) Um produtor de viaturas nas justificações afirma que a camada de cromo que é usada
para embelecer os carros de marca KIA tem uma variância menor do que 225 gramas.
Tipo de erros
Já é conhecido que o objectivo dos testes de hipóteses é com base nas observações de uma
amostra generalizar os resultados para a população, entretanto deve-se estar claro de que a
tomada de decisões possui riscos, isto é, podem cometer-se erros.
Um teste é bilateral quando a sua hipótese alternativa é dada por um ponto definido
demarcando duas regiões de rejeição. A figura a seguir mostra a localização das regiões de
aceitação e de rejeição bem como as probabilidades para um teste bilateral.
3
Um teste é unilateral a direita, quando sua hipótese alternativa é dada por um intervalo
semifechado, apresentando uma região de rejeição situada a direita.
Um teste é unilateral a esquerda, quando a sua hipótese alternativa é dada por um intervalo
semi – fechado, apresentando uma região de rejeição situada a esquerda.
Os testes estatísticos de uma forma geral podem ser divididos em duas categorias: testes
paramétrios e não paramétricos:
Os testes não paramétricos – são aqueles em que os dados estão muitas vezes na escala
nominal, ordinal ou por intervalo. Sendo assim, não são calculados os parâmetros
populacionais. Estes testes são também aplicados para amostras pequenas.
Ainda que esta classificação possa existir também podem –se realizar testes de significância
da média, proporção ou mesmo vari6ancia; testes de igualdade das médias, das proporções
4
ou das variâncias; testes de ajustamento a distribuições; testes de associação ou
independência, etc.
TESTES DE SIGNIFICÂNCIA
5
Exemplo: As estatísticas dos últimos quatro anos mostraram que as pessoas que auferem
um salário superior a 27000,00 meticais possuem uma poupança de 11500,00 meticais
mensalmente. Uma breve consulta ao gerente de uma dependência do Millennium Bim
mostrou para uma amostra de 20 clientes uma média de 11800,00 meticais com desvio
padrão de 200,00 meticais. Use o nível de significância de 0.05 e verifique se a média das
poupanças mudou significativamente ou não.
6
Teste de significância da proporção
Exemplo: O presidente de uma certa associação, pretende avançar com um projecto que
tem suscitado controversas no grupo. Ele afirma em sua defesa que mais de 50% dos
associados concordam com o projecto. O que se deve concluir da afirmação do presidente,
sabendo que dos 70 associados escolhidos aleatoriamente 60 se manifestaram a favor da
opinião. Use um nível de significância de 5%.
7
Teste de significância da variância
8
TESTES DE IGUALDADE DE DOIS PARÂMETROS
Exemplo: Uma empresa está analisar as suas despesas relativas a energia, água,
combustíveis, gastos em chamadas internas, etc. Um dos problemas é essencialmente
diminuir a elevada conta dos gastos em chamadas telefónicas no fim de cada mês.
Investigações preliminares de uma amostra revelaram que metade das chamadas realizadas
não era de serviço. Supondo que os trabalhadores solteiros são os responsáveis pelas contas
elevadas, retirou-se duas amostras aleatórias de 65 solteiros e 90 casados para averiguar o
facto. A tabela abaixo resume as informações referentes as durações médias e variâncias
das chamadas privadas por mês.
9
Teste de igualdade de duas proporções
Perguntas como, a proporção de alunas que aprovou nos exames de admissão é igual a
proporção de alunos? A percentagem de eleitores do candidato A na mesa m1 é igual a
percentagem de eleitores que do mesmo candidato na mesa m2? Etc. Estas e outras
perguntas podem ser resolvidas usando o teste de igualdade de proporções.
10
Exemplo: Deseja – se testar se são iguais as proporções de homens e mulheres que lêem
jornais noticiosos e se lembram de um determinado anúncio depois de alguns dias depois.
Sejam dados os seguintes resultados de amostras aleatórias e independentes de homens e
mulheres que foram entrevistadas. Use 10% para fazer o teste.
11
O ponto crítico obtém-se na tabela dos valores críticos da distribuição F de Fisher –
Snedecor, os graus de liberdade k1 e k2 e o nível de significância vária em função da
hipótese alternativa que for considerada.
Pontos críticos
12
CORRELAÇÃO
A análise de Correlação diz respeito ao estudo da dependência de uma variável, a variável
dependente, em relação a uma ou mais variáveis explanatórias, visando estimar e/ou prever
o valor médio (da população) da primeira em termos dos valores conhecidos ou fixados (em
amostragens repetidas) das segundas. Na análise de correlação não há distinção entre as
variáveis dependentes e explanatórias. Os dados podem ser representados por pares
ordenados (x, y)
TIPOS DE CORRECÇÃO
Correlação Linear Negativa: Nesta correlação quando o Valor da variável independente
aumenta (X) a variável dependente (Y) decresce.
Correlação Linear Positiva: Quando o valor das variável independente (X) aumenta os
valores da variável dependente Também Aumentam.
13
Figura 2. Correlação Linear Positivas
Por outro lado, podemos ter Correlações não lineares ou Variáveis que não proporcionam
correlação alguma, são exemplos os seguintes gráficos.
Onde:
x :Variável independente
y : Variável dependente
14
Se r = 1 Significa uma correlação perfeita positiva entre as duas variáveis.
Se r = -1 Significa uma correlação negativa perfeita entre as duas variáveis - Isto é, se uma
aumenta, a outra sempre diminui.
Entretanto o valor do coeficiente de correlação “r” For maior que 0,5 (independentemente
si positivo ou não) então temos uma correlação Forte, e si menor que 0,5
(independentemente do seu sinal) então a correlação e fraca.
Exemplo1:
15
Usando a Equação (Eq.1) Teremos:
∑ ∑ ∑
√ ∑ ∑ √ ∑ ∑
√ √
Tal como o coeficiente de correlação amostral, também se pode provar que o coeficiente de
correlação populacional assume valores no intervalo [-1,1]. Se as variáveis aleatórias X e Y
são independentes (ver independência), então o coeficiente de correlação ρ vem igual a 0.
HIPÓTESES E CORRELAÇÃO
16
Na hipótese remota se o coeficiente de correlação ter um valor negativo (abaixo de 0), ele
demonstra uma conexão negativa entre os factores. Isto implica que os factores se movem
de forma inversa (ou seja, quando se constrói reduções diferentes, ou quando se diminui
incrementos diferentes), então diz-se que há correlação negativa significante.
Quando o coeficiente de conexão é 0 isso demonstra que não há conexão entre os factores
(uma variáve3l pode permanecer estável enquanto diferentes incrementos ou diminuições),
Então não há qualquer relação significante
Teste de Hipótese
Um teste de hipótese também pode ser usado para determinar se o coeficiente de correlação
da amostra r fornece evidência suficiente para concluir que o coeficiente de correlação
populacional ρ é significante em um nível de significância especificado.
3. Teste bicaudal
H0 : ρ = 0 (não há correlação significante)
Onde:
H0 é a Hipótese Nula;
17
Há é a Hipótese Alternativa
CORRELAÇÃO E CAUSALIDADE
O fato de duas variáveis serem fortemente correlacionadas não implica uma relação de
causa e efeito entre elas.
A confusão entre a correlação e causalidade está na base de muitas concepções erradas. Daí
que se torna imperativo falar sobre este assunto em maior profundidade. Os nossos cérebros
são autênticas máquinas de reconhecimento de padrões, mas este processo está longe de ser
perfeito, o que resulta na detecção de padrões que não existem de verdade.
A correlação, isto é, a ligação entre dois eventos, não implica necessariamente uma relação
de causalidade, ou seja, que um dos eventos tenha causado a ocorrência do outro. A
correlação pode no entanto indicar possíveis causas ou áreas para um estudo mais
aprofundado, ou por outras palavras, a correlação pode ser uma pista
REGRESSÃO
A análise de regressão mede e descreve a forma de relacionamento entre duas variáveis e
permite a estimativa dos valores de uma variável em relação aos valores das demais.
Regressão está condicionada à premissa de que a variável dependente é estocástica, mas as
variáveis explanatórias são fixas.
Onde:
18
Regressão Linear Múltipla
Em algumas situações, Y pode ser considerado dependente em relação a mais do que uma
variável.
Resíduos
A diferença entre o valor y observado e o valor y previsto para um dado valor x na linha.
Para um dado valor x, di = (valor y observado) – (valor y previsto)
Linha de regressão
Linha de regressão é linha para a qual a soma dos quadrados dos resíduos é um mínimo.
19
A equação de uma linha de regressão para uma variável independente x e uma variável
dependente y é: ŷ = mx + b
Onde:
Exemplo2:
∑ ∑ ∑
∑ ∑
̅ ̅
Assim podemos escrever a nossa Equação de Estimativa Y(x) que nos fornece valores
aproximados ŷ = mx + b
20
CONCLUSÃO
Após concluído pode afirmar-se que:
• Correlação e regressão são duas técnicas estreitamente relacionadas, que visam estimar
uma relação que possa existir entre duas variáveis na população;
• Quando se analisa dados que sugerem a existência de uma relação funcional ente duas
variáveis, surge então o problema de se determinar uma função matemática que exprima
esse relacionamento, ou seja, uma equação de regressão.
21
REFERÊNCIAS BIBLIOGRÁFICAS
MURTEIRA, B., RIBEIRO, C. S., Silva, J. A., PIMENTA, C. Introdução à Estatística.
McGraw-Hill de Portugal, Lda. 2002
22