Você está na página 1de 12

CLCULO AMOSTRAL

A representatividade da Quantidade e Qualidade. Qualidade:

amostra

depende

de

dois

fatores:

1. Delimitar o universo capaz de ser representado


2. Representar todos os estratos 3. Utilizar mtodo aleatrio (sorteio) para selecionar os elementos

da amostra. Quantidade:
1. Caractersticas da populao (homogenia ou heterogenia)

2. Grau de preciso desejado pelo pesquisador 3. Tamanho da populao

TAMANHO DA AMOSTRA PARA COMPARAO DE DUAS MDIAS

EX:

AJUSTE PARA O TAMANHO DA POPULAO

DETERMINAO DO TAMANHO DA AMOSTRA PARA POPULAES FINITAS As frmulas para determinao do tamanho da amostra que vimos at agora trabalhavam com a idia de que a populao de onde se retirava a amostra era to grande, que poderamos consider-la infinita. Entretanto, a maior parte das populaes no to grande em comparao com as amostras. Caso a amostra tenha um tamanho (n) maior ou igual a 5% do tamanho da populao (N), considera-se que a populao seja FINITA. Neste caso, aplica-se um fator de correo s frmulas vistas anteriormente e teremos as seguintes frmulas corrigidas:

Frmula para determinao do tamanho da amostra (n) com base na estimativa da mdia populacional.

ESTIMAO DE UMA MDIA

Problema: Estimar um valor mdio referente populao de interesse. Ao calcular a amostra para este problema, estaremos supondo que a varivel que contm a resposta de interesse segue uma distribuio normal com desvio-padro supostamente conhecido. Exemplo: Um mdico de um determinado hospital est interessado em saber qual a idade mdia das mulheres que morrem devido problemas cardacos. Sabe que a maioria desses bitos ocorre entre 40 e 75 anos, com um desvio padro de 10 anos. Se escolher um erro mximo de 2 anos e um nvel de significncia de 5%, encontrar como resposta que deve analisar 96 casos. Obs.: Neste exemplo, se no houvesse informao sobre a variabilidade, o desvio-padro poderia ser calculado como aproximadamente igual a 1/4 do intervalo entre a maior e a menor idade esperada ((75-40)/4 aproximadamente igual a 9). Neste caso o tamanho da amostra seria de 78 casos. Os parmetros necessrios so:

Desvio-Padro. Erro mximo da estimativa. Nvel de significncia.

Referncias: Bolfarine e Bussab (1994). Desvio-padro: corresponde raiz quadrada da varincia e informa sobre a variabilidade da resposta de interesse na populao. Os critrios mais usados para estimar o desvio-padro so: o uso de pesquisas anteriores, dados de literatura e amostras piloto. Outra alternativa menos precisa, porm menos trabalhosa, seria considerar um intervalo onde estivessem concentrados 95% da populao e igualar o comprimento deste intervalo a 4 vezes o desvio-padro. Este procedimento baseado no fato de que, para populaes aproximadamente simtricas, no intervalo compreendido entre a mdia mais ou menos 2 desvios-padro, esto aproximadamente 95% da populao.

Erro mximo da estimativa: indica o quanto a estimativa deve se distanciar da verdadeira mdia. Considerando o exemplo em que o erro mximo de 2 anos, se a estimativa para a idade mdia for de 63 anos, a verdadeira mdia deve estar entre 61 e 65 anos. Nvel de significncia: neste caso indica a porcentagem de casos na populao que estaro fora do intervalo estimado para a mdia. Calcular uma estimativa a um nvel de significncia de 5% significa que a estimativa estar cobrindo 95% da populao. No exemplo dado, se a idade mdia das mulheres viesse a ser calculada como 63 +- 8 anos, poderamos dizer que aproximadamente 95% das mulheres que morrem devido a problemas cardacos teriam entre 55 e 71 anos.

Como calcular o tamanho de uma amostra Como calcular a amostra de uma populao infinita (acima de 100.000 habitantes):

n = . p . q e

n = Tamanho da Amostra = Nvel de confiana escolhido, expresso em nmeros de desvio padro p = Percentagem com a qual o fenmeno se verifica q = Percentagem complementar (100-p) e = Erro mximo permitido Como calcular a amostra de uma populao finita (at 100.000 habitantes):

n = . p . q . N e (N-1) + . p . q

n = Tamanho da Amostra = Nvel de confiana escolhido, expresso em nmeros de desvio padro p = Percentagem com a qual o fenmeno se verifica q = Percentagem complementar (100-p) e = Erro mximo permitido N = Tamanho da populao Obs:

95,5 % de nvel de confiana () equivale a 2 desvios padro 99,7 % de nvel de confiana () equivale a 3 desvios padro Usualmente trabalha-se com uma estimativa de erro mximo permitido (e) de 3 e 5%. Quando no possvel estabelecer previamente a percentagem com o qual o fenmeno se verifica, adota-se o valor mximo de 50 para p. Postado por Larissa Harres Zucchelli Bittencourt

Amostragem - Presentation Transcript <http://www.slideshare.net/pnrocha/amostragem -3518133>


1. Paulo Novis Rocha Nefrologista Professor Adjunto do Depto. Medicina FMB-UFBA Professor Colaborador do PPgCS Coordenador da Disciplina de Bioestatstica 2. o 1. Definir a populao de interesse o 2. Selecionar uma amostra da populao o 3. Coleta de dados o 4. Estatstica descritiva o 5. Estatstica inferencial 3. POPULAO: Ideal! AMOSTRA: Vivel! Todo pesquisador quer estudar apenas uma AMOSTRA, mas obter resultados generalizveis para toda a POPULAO

4. Identificao da POPULAO adequada Mtodo adequado de escolha dos indivduos a serem estudados (AMOSTRAGEM) Seleo de um nmero adequado de indivduos (TAMANHO da amostra) 5. o Populao amostrada: da qual tiramos uma amostra o Populao alvo: para a qual queremos generalizar os resultados o IMPORTANTE: os testes estatsticos permitem generalizao apenas da amostra para a populao amostrada!!! 6. POPULAO ALVO: TODOS OS HIPERTENSOS DO BRASIL POPULAO AMOSTRADA: HIPERTENSOS DO SEU AMBULATRIO AMOSTRA Uma amostra feita na Bahia, ser representativa nvel de Brasil? 7. Neto, AMS 2008. Bioestatstica Sem Segredos POPULAO-ALVO Populao para a qual se deseja generalizar os resultados POPULAO AMOSTRADA Populao da qual retiramos a amostra AMOSTRA Indivduos selecionados para o estudo AMOSTRAGEM Processo pelo qual a amostra selecionada 8. Neto, AMS 2008. Bioestatstica Sem Segredos TIPOS DE AMOSTRAGEM o Aleatria Com reposio Sem reposio Simples Sistemtica Por conglomerados Estratificada Proporcional No-aleatria Por convenincia Por auto-seleo 9. POPULAO-ALVO N = 23.400 Estratificao por tipo de escola Professores de escolas grandes N = 9.240 39,5% do total Professores de escolas mdias N = 7.849 33,5% do total Professores de escolas pequenas N = 6.311 27,0% do total Amostra n = 490 39,5% de 490 194 professores de escolas grandes 33,5% de 490 164 professores de escolas mdias 27,0% de 490 132 professores de escolas grandes Sorteio proporcional por tipo de escola 10. o Por convenincia X auto-seleo (voluntrios) o Maioria dos ensaios clnicos e estudos caso-controle o Muito vulnerveis a vieses de seleo o Problemas com generalizao dos achados 11. o Amostragem aleatria com reposio o Populao infinita 12. o Se o tamanho mnimo da amostra representar mais de 5% do tamanho da populao-alvo ou amostrada, a populao finita. o Quando o tamanho da populao-alvo no muito maior que o da amostra, a populao finita. 13. o Amostragem aleatria com reposio o Populao infinita o Quando: amostragem feita sem reposio e populao finita,

O erro padro precisa ser multiplicado por um fator de correo

14. Isto porque quando uma amostra pequena retirada aleatoriamente de uma populao muito grande, a probabilidade de ser sorteado praticamente igual para cada indivduo 15.Para uma mdia Para uma proporo 16. o Situao ideal: estudar toda populao o Invivel (por vrios motivos j espostos)... o Quantos indivduos devo estudar? 1? 10? 100? 1000? o Qual o meu objetivo? Estimar uma mdia (ex: glicemia mdia em uma populao) Estimar uma proporo (ex: prevalncia de diabete) 17. o Qual a mdia de glicemia em uma determinada capital brasileira com populao = 2.600.000 habitantes? 18. o J aprendemos a calcular intervalos de confiana: o Em todos os casos, a amplitude do IC95% depende do tamanho da amostra Amostra grande IC95% pequeno Amostra pequena IC95% grande o Se pr-determinarmos o IC95%, podemos calcular o tamanho da amostra 19. ONDE: z = valor da distribuio normal padro correspondente ao nvel de confiana desejado 2 = a varincia do parmetro a ser estudado na populao-alvo d = margem de erro permitida 20. o Definido arbitrariamente o Exemplo: reviso da literatura mostra que outros estudos encontraram mdia populacional de glicemia = 90 mg/dl o Margem de erro = 10 mg/dl (80 a 100 mg/dl) o Margem de erro = 5 mg/dl (85 a 95 mg/dl) 21.90 90-(1,96xEP) = 85 90+(1,96xEP) = 95 22. 23. o Procurar estimativas de na literatura; o Realizar estudo piloto e usar o DP obtido no estudo como estimador de ; o Se a mdia da varivel cuja mdia queremos estimar tem uma distribuio normal na populao de onde a amostra ser retirada e sabendo que a amplitude de variao de uma distribuio normal 6, temos que: = Amplitude/6 24.
o

o o

o o o o o o o

o o o

29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40.

Qual a mdia de glicemia em uma determinada capital brasileira com populao = 2.600.000 habitantes? J sabemos: d = 5 mg/dl z = 1,96 s = 19,7 mg/dl (estudo piloto com apenas 30 indivduos) Como o n mnimo amostral (60) bem menor que o N populacional (2.600.000), a populao infinita. 25. Antecipar recusas (o n mnimo o que voc precisa ter ao final da pesquisa) Amostras por conglomerados (maior semelhana entre os indivduos resulta em menor varincia) n final = (n mnimo calculado) x (fator) O fator definido arbitrariamente pelo pesquisador Um fator de 1,2 significa ampliar o n em 20% No exemplo anterior: (60) x (1,2) = 70 indivduos 26. Qual a mdia de glicemia em professores de primeiro e segundo graus de escolas particulares, de uma cidade de mdio porte de um dos estados brasileiros (digamos N = 500) ? J sabemos: d = 5 mg/dl z = 1,96 s = 19,7 mg/dl (estudo piloto com apenas 30 indivduos) J sabemos que n = 60 Como 60/500 = 0,12 = 12%, a populao finita. 27. SITUAO: Populao finita (n / N > 5%) porque: Nestes casos o EP no ser /n, necessitando ser multiplicado por um fator de correo 28. Qual a mdia de glicemia em professores de primeiro e segundo graus de escolas particulares, de uma cidade de mdio porte de um dos estados brasileiros (digamos N = 500) ? J sabemos: d = 5 mg/dl z = 1,96 s = 19,7 mg/dl (estudo piloto com apenas 30 indivduos) Corrigindo p/ 20% de perdas: (54) x (1,2) = 65 indivduos

41.

Qual a prevalncia de diabete melito em uma determinada capital brasileira com populao = 2.600.000 habitantes? o Reviso da literatura: Escore de corte: 110 mg/dl (mtodo enzimtico) Prevalncia (p) = 13% o Ponto de partida: determinar arbitrariamente a margem de erro (d). Digamos, 3%. 42.13% 10% 16% 43. 44. ONDE: z = valor da distribuio normal padro correspondente ao nvel de confiana desejado p = a prevalncia do parmetro a ser estudado na populao-alvo q=1p d = margem de erro permitida
o

ou 45. Qual a prevalncia de diabete melito em uma determinada capital brasileira com populao = 2.600.000 habitantes? J sabemos: Prevalncia (p) = 13% q = 1-p = 87% d = 3% Corrigindo p/ 20% de perdas: 478x1,2 = 574 indivduos 46. Se no souber o valor de p, chute 0.5 (50%), que resultar num worst-case scenario (pois pq atinge valor mximo quando p = 0.5), superestimando o n amostral mnimo. 47. Qual a prevalncia de diabete melito em professores de primeiro e segundo graus de escolas particulares, de uma cidade de mdio porte de um dos estados brasileiros (digamos N = 500) ? J sabemos: Prevalncia (p) = 13% q = 1-p = 87% d = 3% n/N = 478/500 = 0,956 = 95,6% = populao finita Corrigindo p/ 20% perdas: 247x1,2 = 297 indivduos

o o

o o

48. 49. 50. 51. 52. 53. 54. 55.Qual a prevalncia de DRC estgios III e IV em SSA ? o DRC III e IV= ClCr estimado entre 15 e 60 ml/min o p = preval ncia de DRC na literatura

q = 1-p d = margem de erro a ser definida Z (97,5%) = 1,96 N = populao de SSA Calcular o n mnimo Determinar se necessrio correo para populao finita Inflacionar o n mnimo em cerca de 20% Proceder amostragem aleatria representativa da populao de SSA 56.Prvalncia no estgio III = 4,3% Prevalncia no estgio IV = 0,2% Somando, a prevalncia estimada (p) nos estgios III e IV seria de 4,5% Annals of Internal Medicine 2003 57.Qual a prevalncia de DRC estgios III e IV em SSA ? (DRC III e IV= ClCr estimado entre 15 e 60 ml/min) o p = preval ncia de DRC na literatura = 0,045 (4,5%) o q = 1-p = 0,955 (95,5%) o d = margem de erro a ser definida = 0,005 (0,5%) o Z (97,5%) = 1,96 o N = populao de SSA = 2.948.733 ( http://www.ibge.gov.br/home/estatistica/populacao/estimativa 2008/POP_2008_TCU.pdf ) o Calcular o n mnimo o Populao finita? n/N = 6603/2948733 = 0,2% o Inflacionar o n mnimo calculado em 20%: 6603 x 1,2 = 7.924 o Proceder amostragem aleatria representativa da populao de SSA 58. 59. 60. 61.Outras perguntas sobre clculo amostral o Ser que estas frmulas servem para ensaios clnicos com 2 grupos diferentes onde o desfecho primrio : Uma comparao entre duas mdias? Uma comparao entre duas propores? Uma comparao entre curvas de sobrevida? o H ajustes necessrios para estudos que propem regresso logstica multivariada? 62.Clculo amostral para atingir significncia estatstica: ensaios clnicos o Variveis essenciais: tipicamente definido em 0.05 (nvel de significncia) tipicamente definido em 0.20 (probabilidade de erro tipo II, ou seja, deixar de identificar uma diferena importante) Poder = 1- (tipicamente definido em 0.80) - diferena mnima entre as mdias (ou propores) que voc quer ser capaz de identificar com significncia estatstica preciso mais sujeitos para identificar pequenas diferenas ! desvio padro estimado (deve ser igual entre os grupos)
o o o o o o o o

Obviamente irrelevante ao compararmos 2 propores

Motulsky, H . Intuitive Bioestatistics. 63.Comparao de 2 mdias o pode vir de um estudo piloto ou da literatura o Z valor crtico de z para um determinado valor de . o Z valor crtico de z para um determinado valor de . o (Z +Z ) 2 power index o - diferena entre as mdias Motulsky, H . Intuitive Bioestatistics. IMPORTANTE: O resultado n o nmero de indivduos em cada grupo Pressuposto: DPs iguais nas 2 populaes 64.Values of the Power Index *As the values are already squared, dont make the mistake of squaring again! **Most commonly used power index (for a 2-sided = 5% and 80% power). Motulsky, H . Intuitive Bioestatistics. *Power Index = (z +z ) 2 =0.01 =0.05 =0.10 =0.20 =0.50 1-sided 2-sided Power=99% Power=95% Power=90% Power=80% Power=50% 0.05 0.10 15.8 10.9 8.6 6.2 2.7 0.025 0.05 18.3 13.0 10.5 7.9** 3.8 0.005 0.01 23.9 17.8 14.9 11.7 6.6 65.Variveis o pode vir de um estudo piloto ou da literatura = 10 mmHg o 0,05. o 0,20. o (Z +Z ) 2 power index = 7,9 o 5
o o o

Motulsky, H . Intuitive Bioestatistics. Quantos pacientes EM CADA GRUPO precisamos incluir num estudo para ter 80% de poder de detectar uma diferena entre as mdias de TA diastlica de 5 mmHg com p bicaudado < 0,05? 66. 67.Comparao de 2 propores o p av proporo mdia estimada o Z valor crtico de z para um determinado valor de . o Z valor crtico de z para um determinado valor de . o (Z +Z ) 2 power index o - diferena entre as propoes Motulsky, H . Intuitive Bioestatistics.
o o o

Pode ser usada em: Estudos de corte transversal as propores so as prevalncias em cada grupo. Estudos prospectivos e experimentais as propores so as taxas de incidncia em cada grupo.

Estudos caso-controle as propores so as fraes de casos e controles expostos ao fator de risco. 68.Variveis o 0,05. o 0,10. o p av 0,13 (0,10+0,16/2) o (Z +Z ) 2 power index = 10,5 o 0,06
o

Motulsky, H . Intuitive Bioestatistics. Voc sabe que a incidncia de hipertenso em uma populao de 10% e suspeita que seja mais elevada em uma segunda populao. De quantos sujeitos voc precisa EM CADA GRUPO para ter 90% de poder para detectar um aumento de 6% (para 16%) na incidncia, com p bi-caudado < 0,05? 69. 70.Variveis o 0,05. o 0,10. o p av 0,15 (0,20+0,10/2) o (Z +Z ) 2 power index = 10,5 o 0,10 Motulsky, H . Intuitive Bioestatistics. Voc sabe que 20% dos pacientes tratados para um certo tipo de tumor morrem dentro de 3 anos. Um tratamento alternativo pode ser melhor! De quantos sujeitos voc precisa EM CADA GRUPO para ter 90% de poder para detectar uma queda na mortalidade para 10%, com p bi-caudado < 0,05? 71. 72.Limitaes do clculo amostral o As equaes se baseiam em pressupostos e definies um tanto arbitrrias ( , , , ). O resultado deve ser encarado como uma estimativa e no um valor preciso. o O n mnimo calculado pela equaes o que voc vai precisar ao final do estudo. prudente inflacionar o n (fator de correo) para antecipar perdas. o O clculo amostral feito assumindo que voc vai medir e analisar um nico desfecho (desfecho primrio). o O clculo amostral deveria ser feito baseado em valores prdeterminados de , , . S que muitas vezes, esses valores resultam num n muito grande... O pesquisador vai ento alterando estes valores at chegar num valor de n razovel.

Você também pode gostar