Você está na página 1de 16

Como calcular um intervalo de confiança para a média

O principal motivo para querermos um modelo é a perspectiva


de usá-lo para fazer inferência sobre os parâmetros
populacionais.

Suponha que ao invés de serem pesados 140 caroços, tenha-se


pesado apenas um (0,1188 g).

A partir desse valor que conclusões poderão ser tiradas a


respeito do peso médio populacional, m?
Como calcular um intervalo de confiança para a média

Caso trate-se de uma distribuição normal, pode-se afirmar que o


intervalo

[m – 1,96s ; m + 1,96s]

representa 95% de todos os pesos dos caroços de feijão contidos


em 1 kg de feijão.
Como calcular um intervalo de confiança para a média

Isso significa que um feijão pesar 0,1188 g tem 95% de


probabilidade de acontecer dentro desse intervalo.

E é óbvio que também há a probabilidade deste acontecer fora


deste intervalo.
Como calcular um intervalo de confiança para a média
Aceitando o modelo normal, pode-se dizer então que há 95% de confiança de
que
m – 1,96s <0,1188 g < m + 1,96s

Considerando-se a desigualdade da esquerda e somando-se 1,96s aos dois


lados, obtém-se
m < 0,1188 g + 1,96s

Adotando-se o mesmo procedimento para a desigualdade da direita, obtém-


se 0,1188 g - 1,96s < m

Combinando-se as duas, obtém-se um intervalo de confiança de 95% de


confiança para a média populacional
0,1188 g - 1,96s < m < 0,1188 g + 1,96s
Como calcular um intervalo de confiança para a média

Para determinar numericamente os limites desse intervalo, falta o valor do


desvio padrão populacional. Supondo, por exemplo, que s = 0,0363 g (que é
realmente, como foi determinado, apenas um valor amostral), tem-se

0,0477 < m < 0,1899 g


A partir desses valores, e com todas as suposições feitas, podemos dizer que
o número total de caroços de feijão no pacote de um quilo deve estar entre
5.266 e 20.964. Mesmo assim, ainda há 5% de probabilidade de se ter
cometido um engano.

Isto não parece animador, mas não deve ser esquecido que isto está baseado
apenas no peso de um único caroço.
Como calcular um intervalo de confiança para a média

- Intervalo de confiança para média populacional, a partir de uma observação


Como interpretar um intervalo de confiança

A interpretação formal dos intervalos de confiança é:

Se forem construídos todos os possíveis intervalos correspondentes a um


certo nível de confiança a, então a por cento deles conterão a média
populacional, e os outros (100 – a) por cento não a conterão.

Isto significa que, determinando-se todos os intervalos de 95% de confiança


correspondentes aos pesos individuais dos caroços no pacote, se dirá que o
valor da média populacional deverá estar dentro de 95% e fora dos 5%
restantes.
Como interpretar um intervalo de confiança

Não se poderá, porém, distinguir entre os intervalos corretos e


incorretos, sem se pode atribuir probabilidades que diferenciem os
valores contidos num dado intervalo.

O ponto médio do intervalo, em particular, não tem nada de


especial.

Dizer que o número de caroços deve estar entre 5.266 e 20.964, por
exemplo, não significa de forma alguma que o seu valor mais
provável seja a média de dois desses valores extremos, ou seja
13.115. Nenhum dos valores do intervalo é “mais provável” que
qualquer outro.
Exercício 11

Calcule, a partir do peso do segundo caroço na tabela dos pesos dos 140 caroços,
um intervalo de 95% de confiança para o número total de caroços em um quilo de
feijão.
Covariância e correlação

Dizemos que há covariância entre duas variáveis, quando estas variam de


forma parecida às respectivas médias. O valor numérico da covariância é, por
definição, a média dos produtos:
Covariância e correlação

Covariância amostral das variáveis aleatórias x e y:


Covariância e correlação
Covariância amostral normatizada – coeficiente de correlação:

Dessa forma, o coeficiente de correlação de qualquer par de variáveis


aleatórias fica obrigatoriamente restrito ao intervalo [-1, 1].
Covariância e correlação

- Variáveis estaticamente independentes têm coeficiente de correlação igual a


zero.

- A recíproca não é verdadeira, porque o coeficiente de correlação é uma


medida da associação linear entre duas variáveis.

- Um coeficiente de correlação nulo significa apenas que uma relação linear


não está presente.

- Pode no entanto haver outros tipos de dependência, que não sejam


refletidos pelo valor numérico do coeficiente de correlação.
Exercício 12

Sejam duas variáveis x e y, obedecendo à equação y = x2 no intervalo [-a, +a].

a) Qual o valor do coeficiente de correlação entre x e y?

(Não faça contas; faça um gráfico da função e utilize argumentos geométricos


entre x e y).

b) Você pode pensar em outras funções que cheguem ao mesmo resultado?


Covariância e correlação
As médias e desvios padrão usados nas equações de covariância amostral e de
correlação amostral são valores amostrais. Às vezes precisamos medir os desvios
em relação a valores populacionais, e substituir 𝑥 por 𝜇𝑥 e 𝑦 por 𝜇𝑦 .

Quando isso acontecer, devemos também usar N ao invés de N – 1, porque as


médias em relação às quais são calculados os desvios não são obtidas a partir
dos valores amostrais.

Os desvios não sofrem mais restrição nenhuma, e portanto mantêm todos os N


graus de liberdade das observações originais.

Note que mesmo assim a covariância e o coeficiente de correlação continuam


sendo valores amostrais. A diferença é que passaram a ser calculados em
relação a médias populacionais.
Exercício 13

Os valores abaixo são os volumes, em mililitros, dos caroços cujos pesos


aparecem na primeira linha da tabela dos 140 pesos dos feijões. Calcule a
covariância e o coeficiente de correlação entre os pesos e os valores desses
caroços.

0,108 0,214 0,143 0,195 0,148 0,144 0,174