Você está na página 1de 36

Universidade federal do Pará

Instituto de Ciências Biológicas


Curso de Biotecnologia e Engenharia de Bioprocessos

Prof. Dr. Ricardo de Deus


Estatística Aplicada
• Um intervalo de confiança é
uma amplitude de valores,
derivados de estatísticas de
amostras, que têm a
probabilidade de conter o
valor de um parâmetro
populacional desconhecido.
• OBSERVAÇÃO:
• Devido à sua natureza aleatória, é improvável que duas
amostras de uma determinada população irá render
intervalos de confiança idênticos. Mas, se você repetir sua
amostra várias vezes, uma determinada porcentagem dos
intervalos de confiança resultantes conteria o parâmetro
populacional desconhecido.
• O intervalo de confiança é determinado calculando-se uma
estimativa de ponto e, depois, determinando sua margem de
erro.
• Estimativa de ponto: Este valor único estima um parâmetro
populacional usando os seus dados amostrais.
• Margem de erro:
1. Para um intervalo de confiança de dois lados, a margem de
erro é a distância da estatística estimada para cada valor de
intervalo de confiança.
2. Quando um intervalo de confiança é simétrico, a margem de
erro é metade da largura do intervalo de confiança.
✓ Intervalo de Confiança Bilateral
• O nível de confiança desejado é determinado pelo pesquisador,
não pelos dados. Os intervalos de confiança são tipicamente
estabelecidos no nível de confiança de 95%.Entretanto, quando
apresentados graficamente os intervalos de confiança podem
ser mostrados em vários níveis de confiança como 90%, 95% e
99%. Certos fatores podem afetar o tamanho do intervalo de
confiança, incluindo o tamanho da amostra, o nível de
confiança e a variabilidade da população. Um tamanho de
amostra maior normalmente levará a uma estimativa melhor
do parâmetro populacional.
• Conforme o tamanho n da amostra aumenta, o erro padrão σ/√n diminui, o
que resulta em um intervalo de confiança mais estreito.
n Limites de confiança de 95% Comprimento do intervalo
para µ
10 Ẋ ± 0,620σ 1,24σ
100 Ẋ ± 0,196σ 0,392σ
1.000 Ẋ ± 0,062σ 0,124σ
• Para interpretar o intervalo de confiança da média, assumimos
que os valores foram amostrados de forma independente e
aleatória de um população com distribuição normal com media µ
e variância ø². Dado que estas suposições são válidas, temos
95% de "chance" do intervalo conter o verdadeiro valor da
média populacional. Em outras palavras, se produzirmos diversos
intervalos de confiança provenientes de diferentes amostras
independentes de mesmo tamanho, podemos esperar que
aproximadamente 95% destes intervalos devem conter o
verdadeiro valor da média populacional.
Exemplo
• Considere a distribuição de níveis séricos de colesterol para
todos os homens hipertensos e fumantes nos EUA. Essa
distribuição é aproximadamente normal com uma média µ
desconhecida e desvio-padrão σ = 46mg/100ml. (mesmo
que a média seja diferente, assumimos, por ora , que σ é
igual ao que era para a população geral dos homens adultos
que viviam nos EUA). Antes que selecionemos uma amostra
aleatória, a probabilidade de que o intervalo.

(Ẋ - 1,96 46/√n , Ẋ + 1,96 46/√n).

• Contenha a média µ verdadeira da população é 0,95.


• Suponha que extraímos uma amostra de tamanho 12 da população de fumantes hipertensos e
que esses homens tenham um nível médio sérico de colesterol de Ẋ= 217mg/100ml.

• Com base nessa amostra, um intervalo de confiança de 95% para µ é


(217 – 1,96 46/√12, 217 + 1,96 46/√12).
Ou
(191, 243).

Conjunto de intervalos de confiança


de 95% construídos de amostras de
tamanho 12 extraídas de uma
população normal com média 211
(marcada pela linha vertical) e
desvio-padrão 46.
• Em vez de gerar um intervalo de confiança de 95% para o nível
sérico de colesterol, poderíamos calcular um intervalo de
confiança de 99% para µ. Ao usarmos a mesma amostra de 12
fumantes e hipertensos, encontramos os limites como sendo

(217 – 2,58 46/√12, 217 + 2,58 46/√12).

Ou

(183, 251)

• Estamos 99% confiantes de que esse intervalo contenha o nível


médio sérico verdadeiro de colesterol da população.
• Intervalos de dois lados testam se a média está fora ou
dentro de uma variação definida pelos dois lados do
intervalo.

• Teste de intervalos de um único lado são úteis somente


quando se está interessado em um limite.
• Intervalo de 95% de Confiança (Unilateral).

95% = 1,645
Assim, pode-se definir que:
X= média
Z = valor tabelado
σ = desvio padrão
√n = número da amostra

Sendo que:
+ 1,645 (σ/ √n ) > Limite de confiança superior de
95% para µ.

- 1,645 (σ/ √n ) > Limite de confiança inferior de


95% para µ.
Exemplo I: Suponha que selecionemos uma amostra de 74 crianças
expostas a elevados níveis de chumbo, as quais têm um nível médio
de hemoglobina de 10,6 g/100ml. Com base nessa amostra, um
intervalo de confiança unilateral de 95% para µ - somente o limite
superior é ? Dados: σ = 0,85g/100ml
+ 1,645 (σ/√n)

μ ≤ 10, 6 + 1,645(0,85 / 74 )
≤ 10,6 + 1,645(0,099)
≤ 10,6 + 0,163

μ ≤ 10,762 ~= 10,8

Estamos 95% confiantes de que a média verdadeira de nível de hemoglobina para


essa população de crianças é no máximo 10,8 g/100ml.
▪ Século 20
▪ William Gosset
- Pseudônimo: STUDENT
• É utilizado para medir um intervalo de
confiança bilateral, quando o desvio-
padrão e a média forem desconhecidos;

• É unimodal e simétrica ao redor da média


zero;

• A área total sob a curva é igual a um;

• Suas extremidades são mais densas;

• Apresenta graus de liberdade (gl)


Fórmula
Em que:
da distribuição de Student
• t é a distribuição de Student;
• é a variabilidade amostral;
• µ é a média;
• s é o desvio-padrão;
• n é o tamanho da amostra

Avaliar as diferenças
das médias entre
dois Grupos

Comparar a média
da amostra de uma
população
• Intervalo de confiança bilateral

X − ✓ Se n possuir um valor

Z= alto, a distribuição
normal padrão será
/ n aproximada.

• Distribuição T de Student

X −
✓ Utilizada quando o

T=
desvio padrão não é
conhecido

s/ n ✓ A distribuição padrão
não será normal.
Média da amostra
Média da
população

X − ou

T=
referência

s/ n
Desvio padrão Nº de sujeitos

• É provável que o valor de s varie de amostra


para amostra
• s não pode ser uma estimativa confiável
• A distribuição t é unimodal e simétrica ao redor
de sua média 0
• A área total sobre a curva é igual a 1, tendo
extremidades mais densas
• Valores extremos são mais prováveis de ocorrer
com a Distribuição T de Student do que com a
normal padrão.
• A forma da distribuição t reflete a variabilidade
extra introduzida pelo estimador s
• A distribuição t possui uma propriedade
denominada de GRAUS DE LIBERDADE
• Mede o volume de informações disponíveis nos
dados
• Podem ser usadas para estimar σ2 (variância da população)
✓ É perdido um gl,
gl= n – 1 quando é estimado a
média da amostra

É a quantidade pela qual é dividida a soma dos



n
(x − X )
2
desvios da média ao quadrado, a fim de obter a
i =1
variância da amostra
• Para cada valor de gl existe uma diferente
distribuição t.
• Uma distribuição com:

A distribuição t se
+ dispersa aproxima da normal
padrão

• Conforme o tamanho da amostra aumenta, s


(desvio padrão) torna-se mais confiável

• Se n é muito grande, conhecer o valor de s é quase


é equivalente conhecer σ.
• É utilizado um programa ou uma tabela
condensada que lista as áreas sob a curva

• Linhas: gl da distribuição de T de Student


• Colunas: soma das áreas
Considere uma amostra aleatória de dez crianças selecionadas
da população de bebês que recebe antiácidos que contêm
alumínio e são frequentemente usados para tratar desarranjos
pépticos e digestivos. A distribuição de níveis de alumínio no
plasma é conhecida como aproximadamente normal. No entanto,
sua média (µ) e seu desvio padrão (σ) não são conhecidos. O
nível médio de alumínio para a amostra de dez bebês é X =
37,2µg/l , e seu desvio padrão s= 7,13µg/l,

gl= n – 1
• Intervalo de confiança:
s s
( X − Z / 2 , X + Z / 2 )
n n
Se for fornecido uma informação adicional de que o nível médio
de alumínio no plasma para a população é 4,3 µg/l, de acordo
com o intervalo de confiança de 95% , é sugerido que dar
antiácidos aumenta em muito os níveis de alumínio no plasma
das crianças
O metilfenidato é uma droga amplamente usada no tratamento do distúrbio de déficit
de atenção. Como parte de um estudo dez crianças entre 7 e 12 anos que sofrem desse
distúrbio foram designadas para receber a droga e dez receberam placebo. Depois de
um certo período, o tratamento foi suspenso para as 20 crianças. Subsequentemente,
às crianças que receberam metilfenidato foi dado o placebo e as que tinham recebido o
placebo agora receberam o medicamento. Medidas da atenção e do status
comportamental de cada criança, tanto no medicamento como no placebo, foram
obtidos por meio de um instrumento chamado de “Parent Rating Scale”. As
distribuições são aproximadamente normais com média e desvios padrões
desconhecidos. Em geral, escores baixos indicam aumento na atenção. Desejamos
estimar o escore médio da avaliação de atenção paras as crianças que tomam
metilfenidato e para os que tomam placebo. A amostras tem escore médio da
avaliação de atenção X M = 10,8 e desvio padrão SM= 2,9 quando tomado
metilfenidato , e XP = 14,0 e desvio padrão SP= 4,8 quando tomado placebo.
• Intervalo de confiança:
s s
( X − Z / 2 , X + Z / 2 )
n n
Observando os intervalos, o escore médio da avaliação da atenção é mais baixo
quando as crianças com distúrbio de déficit de atenção tomam metilfenidato, o
que implica melhora da atenção. No entanto, existe uma certa sobreposição entre
os dois intervalos.

Você também pode gostar