Você está na página 1de 6

28/09/2022

Módulo
Selecção da dimensão de uma amostra
para intervalos de confiança (IC).

2.5
Arlindo Gomes
Ano Letivo 2022/23

Selecção da dimensão de uma amostra para intervalos de confiança (IC).

Pretende-se a apresentação de critérios para a determinação da dimensão


apropriada de uma amostra em função dos objectivos de um estudo, por
exemplo, para produzir um determinado intervalo de confiança (i.e., IC)
com uma determinada margem de erro (i.e., precisão).

Ou seja, as análises de inferência estatística devem ser planeadas de tal


forma que as amostras tenham um número de elementos (mínimo) que
satisfaçam os respectivos objectivos.

Atendendo aos métodos disponíveis para estimar intervalos de confiança


em diversos contextos (i.e., µ - média, p - proporção, (µ1 - µ2) – diferença
de médias e µd – média das diferenças) e respectiva expressão como
estimativa pontual ± margem de erro.

1
28/09/2022

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Uma amostra e variável contínua

Podemos deduzir que o ajuste entre o número de elementos da amostra e a


margem de erro pretendida (i.e., E) pode ser obtido através de:

onde Z pode corresponder ao valor da distribuição Normal (i.e., se fosse


utilizada a distribuição t-student tal como aconteceu com os IC o valor de Z
variava com o n, determinando a impossibilidade de fixar um valor). Notar que o
objectivo para a “margem de erro” (i.e., E) corresponde a

ou seja, ao planear um estudo podemos ajustar a dimensão da


amostra de tal forma que E seja suficientemente pequeno para
cumprir o objectivo do estudo.

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Uma amostra e variável contínua

Exemplo Contexto:
Numa ETAR uma avaliação da Carência Química de Oxigénio do efluente tratado
determinou para um nível de confiança de 95% 125±40 mg/L (i.e., para uma
certeza de 95% varia entre 85 e 165 mg/L). Para melhorar a avaliação da ETAR
pretende-se conservar o nível de confiança, mas reduzir a largura do intervalo
para 10 ou 20 mg/L.
A equação anterior pode ser desenvolvida para obter o valor de n:
onde:
Z – é o valor obtido na tabela da distribuição aplicável, por defeito considera-se a
distribuição Normal com o valor correspondente ao nível de confiança pretendido
(p.e., Z = 1,96 para 95%);
E – margem de erro pretendida de acordo com os objectivos do investigador;
𝝈 – desvio padrão do resultado pretendido;

2
28/09/2022

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Uma amostra e variável contínua

Muitas vezes é difícil estimar 𝝈. Pois, no planeamento de um estudo para


estimar o valor médio de uma variável não se conhece o respectivo desvio
padrão.

Assim, é comum o recurso à experiência anterior concretizada no mesmo


contexto e com populações semelhantes.

Como é evidente os valores de n obtidos devem ser arredondados por excesso e


assumidos numa perspetiva conservadora (p.e., 32 em vez de 31,2, 32 em vez de
31,01).

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Uma amostra variáveis dicotómicas

Nos estudos onde se pretende determinar uma proporção de sucesso


relativamente a uma variável dicotómica (p.e., sim/não) num população o
cálculo da dimensão da população é obtido por:

onde,
Z – valor obtido na tabela da distribuição normal para o nível de
confiança pretendido (i.e., Z = 1,96 para 95%);
E – margem de erro pretendida;
p – proporção da população com resultado “sucesso”
Notar que estamos a planear um estudo para obter uma proporção da população
(i.e., p) sem o conhecer o respectivo valor. Assim, o valor p = 0,50 é utilizado
porque é o resulta no valor mais elevado para o termos p(1-p) da equação
anterior e, consequentemente permite obter uma estimativa da dimensão da
amostra conservadora.

3
28/09/2022

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Uma amostra variáveis dicotómicas

Exemplo contexto:
Um investigador pretende estimar a proporção de alunos inscritos no 1º ano
com acesso a internet 4G nos respectivos computadores. Quanto estudantes deve
envolver no estudo para assegurar um intervalo de confiança de 95% e um IC de
5% relativamente ao valor de p obtido.

Vamos considerar p = 0,50, uma vez que desconhecemos o valor de p na


população.

Ou seja, para assegurar um IC com 95% relativamente à proporção de


estudantes com acesso à rede 4G a dimensão da amostra a considerar deverá
ser 385.

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Duas amostras independentes, variáveis contínuas
Em estudos nos quais se pretenda estimar a diferença entre as médias de duas
populações independentes, o valor de ni (i.e., a dimensão de cada amostra):
onde,
Z – valor obtido na tabela da distribuição normal para o nível de
confiança pretendido (i.e., Z = 1,96 para 95%);
E – margem de erro pretendida;
𝝈 – corresponde ao desvio padrão da variável obtida. Porém,
quando no cálculo do IC para uma variável que é a diferença entre
médias utiliza-se Sp, que é uma estimativa do desvio padrão (i.e.,
se conhecermos os valores de cada amostra – s12 e s22):

Assim, se a informação disponível permitir obter s12 e s22


podemos usar a equação anterior para obter a dimensão das
amostras (i.e., n1 = n2).

4
28/09/2022

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Duas amostras independentes, variáveis contínuas

Exemplo contexto:
Um investigador pretende comparar o efeito de um pesticida no controlo de uma
praga em árvores de fruto. O plano é pesar os frutos produzidos nas árvores
pulverizadas ou não com o pesticida. A selecção da árvores para pulverização ou
não foi realizada de forma aleatória e decorreu durante 8 semanas, após as
quais os frutos foram recolhidos e pesados. Baseado em resultados obtidos com
árvores de outra espécie, o investigador antecipa que por motivos vários 20%
das árvores não completem o estudo (p.e., alteração das condições ambientais
significativa, falhas no sistema de rega, etc.). Considere ainda que num estudo
anterior o desvio padrão para a massa de frutos nas árvores não pulverizadas foi
de 8,4 kg e nas pulverizadas de 7,7 kg. Pretende-se um IC a 95% de certeza para a
diferença e que a diferença entre a pesagem dos frutos não seja superior a 3.
Quantas árvores manifestando a doença devem ser incluídas no estudo.

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Duas amostras independentes, variáveis contínuas

Os dados disponíveis permitem estimar o desvio padrão da operação de


pesagem dos frutos em amostras de 100 árvores:

O valor do desvio padrão pode ser usado para estimar a dimensão da amostra:

Ou seja, n1 = n2 = 56 assegura uma certeza de 95% para a diferença entre o peso


de frutos nas árvores pulverizadas e não pulverizadas inferior a 3 kg. Porém,
como 20% das árvores deixam de ter condições para concluir o estudo o valor
deve ser corrigido para 140 árvores (i.e., 112/0,8 = 140, 70 serão pulverizadas e
outras 70 não serão pulverizadas).

10

5
28/09/2022

Selecção da dimensão de uma amostra para intervalos de confiança (IC).


Duas amostras independentes, variáveis contínuas

Os estudos neste contexto requerem que a determinação da dimensão da


amostra para média das diferenças seja obtida através de:

onde,
Z – valor obtido na tabela da distribuição normal para o nível de
confiança pretendido (i.e., Z = 1,96 para 95%);
E – margem de erro pretendida;
𝝈𝒅 – corresponde ao desvio padrão das diferenças (i.e., diferença
entre medições realizadas entre pares de pontos, tipo “antes” e
“depois”).

11

Você também pode gostar