Você está na página 1de 21

Profa.

Mariana Vieira Coronas


mariana.coronas@ufsm.br

χ2
Muito utilizada em
estatística inferencial

1
 Adequado para variáveis qualitativas com duas ou
mais categorias

 Intervalos discretos

 Mede a discrepância entre um conjunto de


frequências observadas (O) e o conjunto de
frequências esperada (E) segundo determinada
hipótese

 Cálculo do χ2

χ2calc = Σ
 Função densidade de probabilidade

2
 Função densidade de probabilidade

 Devido ao modo como é calculado, o χ2 será zero quando não


houver diferença entre os números observados e aumentará
conforme aumentam as discrepâncias

 Na distribuição χ2 a área de significância é unilateral e está


localizada na extremidade direita da curva
 Mas há testes em que a área de
interesse pode estar a direita (<):
para encontrar o valor crítico,
nesses casos, 1-α

3
 O valor crítico deve ser procurado na tabela do χ2 para o nível

de significância desejado (α) e um número de graus de

liberdade dado por:

 gl (graus de liberdade)= n° de categorias - n ° de parâmetros

independentes estimados a partir da amostra - 1

 de maneira geral, não há necessidade de se estimarem

parâmetros a partir da amostra

Com o qui-quadrado podem ser resolvidos vários problemas:

 Verificar se uma distribuição observada de dados se


ajusta a uma distribuição esperada (teórica): Teste de
aderência ou de ajustamento

 Comparar duas ou mais populações com relação a uma


variável categórica: Teste de heterogeneidade

 Verificar se existe associação entre duas variáveis


qualitativas: Teste de associação

Em tabelas de contingência observar o cálculo


do valor esperado e dos graus de liberdade

4
Exercício – Faça você!

 Os dados abaixo referem-se a cor do pelo observada em


uma amostra de roedores de determinada espécie. Verifique
se está característica está associada com o sexo. (α=0,05)

Machos: preto:22 marrom: 13 manchado:15

Fêmeas: preta: 16 marrom: 17 manchada: 17

Qual o Esperado?
Assista o vídeo!

5
Exercício – Faça você!

 Os dados abaixo referem-se a cor do pelo observada em uma amostra


de roedores de determinada espécie. Verifique se está característica
está associada com o sexo. (α=0,05)

Machos: preto:22 marrom: 13 manchado:15

Fêmeas: preta: 16 marrom: 17 manchada: 17

·
E=


χ2calc =1,60
χ2 calc

gl L‐1 · C‐1 , onde L número de linhas n° de


χ20,05;2 =5,99
categorias nas linhas e C número de colunas n° de
categorias nas colunas

Exercício
 Há dúvidas sobre os desempenhos dos alunos, na disciplina de
Estatística, de alguns cursos de Engenharia. Alguns argumentam
que, dependendo do curso, o percentual de aprovação pode ser
diferente, mesmo que a disciplina tenha o mesmo programa. Um
estudo foi realizado, selecionando aleatoriamente alunos de três
cursos, registrando os aprovados e reprovados na disciplina. Os
resultados estão na tabela a seguir:

Curso
Eng Civil Eng Química Eng Mecânica TOTAL

Aprovados 44 26 35 105
Reprovados 11 26 15 52
55 52 50 157

Considerando nível de significância de 5%, os percentuais de


aprovados podem ser considerados iguais?

6
 Consideremos uma amostra aleatória X1,X2,......Xn de tamanho
n de uma população com distribuição normal com média μ e
variância . Um estimador para é a variância amostral
 Seja a probabilidade da variável , com graus de liberdade, tomar
valores entre / e / , valores obtidos na tabela da distribuição
qui-quadrado

 Logo, o intervalo com nível


100(1-α)% de confiança para
será dado por:

 com n-1 graus de liberdade

 O peso de componentes mecânicos produzidos por uma


determinada empresa é uma variável aleatória que se supõe ter
distribuição normal. Pretende-se estudar a variabilidade do
peso dos referidos componentes. Para isso, uma amostra de
tamanho 11 foi obtida, cujos valores em grama são:
98 97 102 100 98 101 102 105 95 102 100

Construa um intervalo de confiança para a variância do peso,


com um grau de confiança igual a 95%

7
 O peso de componentes mecânicos produzidos por uma
determinada empresa é uma variável aleatória que se supõe ter
distribuição normal. Pretende-se estudar a variabilidade do
peso dos referidos componentes. Para isso, uma amostra de
tamanho 11 foi obtida, cujos valores em grama são:
98 97 102 100 98 101 102 105 95 102 100
Construa um intervalo de confiança para a variância do peso,
com um grau de confiança igual a 95%
n=11
̅ 100
=8

 O peso de componentes mecânicos produzidos por uma


determinada empresa é uma variável aleatória que se supõe ter
distribuição normal. Pretende-se estudar a variabilidade do
peso dos referidos componentes. Para isso, uma amostra de
tamanho 11 foi obtida, cujos valores em grama são:
98 97 102 100 98 101 102 105 95 102 100

Construa um intervalo de confiança para a variância do peso,


com um grau de confiança igual a 95%
n=11
· ·
̅ 100 ( , 3,90; 24,61)
, ,
=8

8
 A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de
uma população normal. Construa o intervalo de confiança de
90% para
̅ 100
=8

· ·
( , 3,90; 24,61)
, ,

 A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de


uma população normal. Construa o intervalo de confiança de
90% para

̅ 8,7
= 4, 01

9
 A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de
uma população normal. Construa o intervalo de confiança de
90% para

̅ 8,7
= 4, 01

· ·
I.C. (90%)= ( , 2,13 10,85)
, ,

 Para estimar o desvio padrão ( ) tire a raiz


quadrado de cada extremo

 Determine os I.C.s para dos exemplos


anteriores

10
 Para estimar o desvio padrão ( ) tire a raiz
quadrado de cada extremo

 Determine os I.C.s para dos exemplos


anteriores

Ex.1 = I.C. (95%) = 3,90 24,61) → 1,98 4,96)

Ex. 2 = I.C. (90%) 2,13 10,85) → 1,46 3,29)

Verificar associação
entre duas variáveis
quantitativas

11
 Utilizada para estudar a associação entre duas
variáveis quantitativas
 Exemplo
 Deseja-se saber se existe correlação entre o
número de horas estudadas e o desempenho dos
alunos em uma disciplina de Estatística
 Como podemos fazer essa avaliação?

 Exemplo
 Deseja-se saber se existe correlação entre o número de horas
estudadas e o desempenho dos alunos em uma disciplina de
Estatística
 Como podemos fazer essa avaliação?
 Vamos sortear 8 estudantes na disciplina para se obter as
informações seguintes:
Aluno x (horas) Y (nota)
A 8 10
B 7 8
C 6 4
D 3 8
E 3 6
F 6 9
G 5 7
H 2 4

12
 Para se avaliar inicialmente se representam os dados em um
gráfico cartesiano de pontos, denominado diagrama de pontos
ou diagrama de dispersão
 Cada ponto do gráfico corresponde a um aluno e é marcado
segundo seu valor para x e para y.

10
9 O que
8 podemos
7
6
observar?
Nota (y)

5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9
Horas de estudo (x)

Coeficiente de correlação produto-momento ou


coeficiente de correlação de Pearson (r)
 Uma maneira de se avaliar a correlação é usar um
coeficiente, que representará um número independente
da unidade de medida das variáveis
 O coeficiente de relação pode variai de -1 a +1
 Valores negativos indicam relação inversa (quando x
aumenta, y, em média, diminui – ou vice-versa)
 Valores positivos para r ocorrem quando a correlação é
direta
 Não é acompanho de qualquer unidade de medida

13
Coeficiente de correlação produto-momento ou
coeficiente de correlação de Pearson (r)

Coeficiente de correlação produto-momento ou


coeficiente de correlação de Pearson (r)

14
Coeficiente de correlação produto-momento ou
coeficiente de correlação de Pearson (r)
 Cálculo do coeficiente de correlação em uma amostra


r= = =
· · ·

 O numerados do coeficiente de correlação é chamado de soma


dos produtos xy (SPxy) e os elementos dentro da raiz quadrada
são as somas de quadrados de x e y (SQx e SQy)

Coeficiente de correlação produto-momento ou


coeficiente de correlação de Pearson (r)
 Fórmula alternativa, mais conveniente para o cálculo de r, já
que não envolve o cálculo dos desvios para x y, exige um
número menor de operações aritméticas

15
Coeficiente de correlação produto-momento ou
coeficiente de correlação de Pearson (r)
 Usando a fórmula para os dados do exemplo (horas
estudadas e nota):

Coeficiente de correlação produto-momento ou


coeficiente de correlação de Pearson (r)
 Usando a fórmula para os dados do exemplo (horas
estudadas e nota):

r 0,58
,

16
Teste de hipóteses para correlação
 Quando se calcula o coeficiente r em uma amostra, é
necessário ter em mente que se está, na realidade,
estimando a associação verdadeira entre x e y existente
na população
 Para avaliar a significância do coeficiente de correlação,
geralmente testa-se a hipótese nula de que ρ = 0
(correlação na população é designada por ρ) utilizando
para tanto a distribuição t.1

Teste de hipóteses para correlação


As etapas para o teste estatístico de um coeficiente de
correlação para o coeficiente obtido no exemplo anterior:

17
Teste de hipóteses para correlação
continuação

Avaliação qualitativa do coeficiente de


correlação

18
Coeficiente de determinação
 O coeficiente de determinação é o quadrado do

coeficiente de correlação (r2)

 Informa que fração da variabilidade de uma variável

é explicada estatisticamente pela outra variável

37. Cinco pessoas, que se submeteram a uma mesma cirurgia de joelho, usaram dois
instrumentos de avaliação para indicar o nível de dor 12 horas após a operação. A
seguir estão os escores de dor de cada pessoa, em cada instrumento.

Pessoa A B C D E
Dor (Instrumento 1) 8 6 4 3 4
Dor (Instrumento 2) 9 7 4 4 6

37.1. Desenhe o diagrama de dispersão dos pontos, considerando como x os


resultados obtidos no primeiro instrumento de avaliação e como y, os do
segundo.

37.2. Calcule o coeficiente de correlação entre os escores determinados nos dois


instrumentos.

37.3. Verifique se o coeficiente de correlação é estatisticamente significativo,


para α = 0,05.

19
37. Cinco pessoas, que se submeteram a uma mesma cirurgia de joelho, usaram dois
instrumentos de avaliação para indicar o nível de dor 12 horas após a operação. A
seguir estão os escores de dor de cada pessoa, em cada instrumento.

Pessoa A B C D E
Dor (Instrumento 1) 8 6 4 3 4
Dor (Instrumento 2) 9 7 4 4 6

37.1. Desenhe o diagrama de dispersão dos pontos, considerando como x os


resultados obtidos no primeiro instrumento de avaliação e como y, os do
segundo.

37.2. Calcule o coeficiente de correlação entre os escores determinados nos dois


instrumentos. r = 0,94
37.3. Verifique se o coeficiente de correlação é estatisticamente significativo,
para α = 0,05. ; tcalc = 4,77 > t0,05;3 = 3,182. Existe correlação positiva
muito forte entre os resultados dos dois instrumentos.

Um estudo apresentou uma análise de correlação para investigar a relação


entre o nível máximo de lactato x e a resistência muscular y:

x 400 750 770 800 850 1025 1200 1250 1300 1400 1475 1480 1505 2200

y 3,8 4,0 4,9 5,2 4,0 3,5 6,3 6,88 7,55 4,95 7,80 4,45 6,6 8,9

Verifique se existe uma correlação positiva entre o nível máximo de


lactato e a resistência muscular na população da qual esses dados foram
selecionados.

∑xy=99949,5 ∑x=16405 ∑y= 78,83 ∑x2=477.513.181.805.625


∑y2= 232017,45 (∑x)2 = 269124025 (∑y)2 = 6214,17

20
Um estudo apresentou uma análise de correlação para investigar a relação
entre o nível máximo de lactato x e a resistência muscular y:

x 400 750 770 800 850 1025 1200 1250 1300 1400 1475 1480 1505 2200

y 3,8 4,0 4,9 5,2 4,0 3,5 6,3 6,88 7,55 4,95 7,80 4,45 6,6 8,9

Verifique se existe uma correlação positiva entre o nível máximo de


lactato e a resistência muscular na população da qual esses dados foram
selecionados.

∑xy=99949,5 ∑x=16405 ∑y= 78,83 ∑x2=477.513.181.805.625


∑y2= 232017,45 (∑x)2 = 269124025 (∑y)2 = 6214,17
r = 0,76; tcalc = 4,05 > t0,05;12 = 2,179. Existe correlação positiva forte e
significativa entre x e y

21

Você também pode gostar