Você está na página 1de 87

Introduo Bioestatstica Faculdade de Sade Pblica Programa de Vero - 2005

Autores: Denise Pimentel Bergamaschi Jos Maria Pacheco de Souza Patrcia Emlia Braga

Obra protegida por direitos autorais. Proibida a reproduo total ou parcial sem a prvia autorizao dos autores. Em caso de utilizao obrigatria a citao da fonte no texto, com respectiva referncia bibliogrfica. Sugesto de referncia: Bergamaschi DP, Souza JMP, Braga PE. Introduo Bioestatstica. So Paulo, 2005. [Material de apoio Didtico de Curso de Atualizao do Programa de Vero da Faculdade de Sade Pblica da Universidade de So Paulo]

ndice
pgina 1. Elementos estatsticos para anlise exploratria de dados 1.1- Nveis de mensurao 1.2- Tpicos iniciais de amostragem 1.3- Apurao de dados 1.4- Apresentao tabular 1.5- Apresentao grfica 1.5.1 Diagrama de barras 1.5.2 Diagrama de setores circulares 1.5.3 Diagrama linear 1.5.4 - Histograma 1.5.5 Polgono de freqncia simples 1.5.6 Representao grfica de duas variveis qualitativas 1.5.7 Representao grfica de duas variveis quantitativas 1.5.8 Escalas aritmtica e logartmica 1.6- Medidas de tendncia central 1.6.1 Mdia aritmtica 1.6.2 - Mediana 1.7- Medidas de disperso 1.7.1 Valores mnimo e mximo 1.7.2 Amplitude de variao 1.7.3 - Varincia 1.7.4 Desvio padro 1.7.5 Coeficiente de Variao de Pearson 1.7.6 Quartil, percentil 1.8 Box plot (Stata) 1.9 - Noes de correlao Medidas de associao 2.1 Razo de prevalncias 2.2 Razo de incidncias 2.3 Razo de odds (odds ratio) 2.4 Qui quadrado de Pearson Distribuio de probabilidade 3.1- Noes de probabilidade 3.2 Distribuio Bernoulli 3.3 - Distribuio binomial 3.4 Odds e probabilidade 3.5 - Distribuio normal 3.6 - Distribuio amostral da mdia Estimao de parmetros populacionais por ponto e por intervalo 4.1 Estimao por ponto 4.2 Estimao por intervalo Intervalo de Confiana (IC) 4.2.1 - IC para a mdia populacional com varincia populacional conhecida 4.2.2 - IC para a mdia populacional com varincia populacional desconhecida 4.2.3 - IC aproximado para a proporo populacional Tomada de deciso 5.1- Teste de hipteses para uma proporo populacional 5.2- Teste de hipteses para uma mdia populacional 5.2.1 - Reviso de conceitos bsicos 5.2.2 - Teste de hipteses para uma mdia populacional com varincia conhecida 5.2.3 - Teste de hipteses para uma mdia populacional com varincia desconhecida 5.3- Teste de hipteses de associao pelo qui-quadrado de Pearson Bibliografia Resumos dos artigos utilizados nos exerccios 3 3 4 6 7 12 12 14 15 15 17 18 19 21 26 26 27 28 28 28 28 28 28 30 32 35 38 38 39 39 40 44 44 47 48 52 53 56 57 57 58 59 59 59 62 68 71 71 73 75 76 79 81

2.

3.

4.

5.

6. 7.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Populao, amostra, varivel, coleta e apurao de dados


1- Elementos estatsticos para anlise exploratria de dados
Estatstica: uma coleo de mtodos para planejar experimentos, obter e organizar dados, resumi-los, analis-los, interpret-los e deles extrair concluses (Triola, 1999). Bioestatstica Estatstica aplicada s cincias da vida.

1.1 - Nveis de mensurao

Escala nominal Os indivduos so classificados em categorias segundo uma caracterstica. Ex: sexo (masculino, feminino), hbito de fumar (fumante, no fumante), sobrepeso (sim, no). No existe ordem entre as categorias e suas representaes, se numricas, so destitudas de significado numrico. Ex: sexo masculino=1, sexo feminino = 2. Os valores 1 e 2 so apenas rtulos. Escala ordinal Os indivduos so classificados em categorias que possuem algum tipo inerente de ordem. Neste caso, uma categoria pode ser "maior" ou "menor" do que outra. Ex: nvel scio-econmico (A, B, C e D; onde A representa maior poder aquisitivo); nvel de retinol srico (alto, aceitvel, baixo, deficiente) onde alto: maior ou igual a 50,0 g/dl; aceitvel: 20,0 a 49,9 g/dl, baixo: 10,0 a 19,9 g/dl e deficiente: menor ou igual a 10,0 g/dl. Estes critrios so do Commitee on Nutrition for National Defense ICNND/USA, 1963 (in Prado MS et al, 1995). Embora exista ordem entre as categorias, a diferena entre categorias adjacentes no tem o mesmo significado em toda a escala. Escalas numricas Escala intervalar Este nvel de mensurao possui um valor zero arbitrrio. Ex: temperatura em graus Celsius. Escala de razes possui zero verdadeiro Escala de razes discreta: o resultado numrico da mensurao um valor inteiro. Ex: nmero de refeies em um dia (nenhuma, uma, duas, trs, quatro, ...), freqncia de consumo semanal de determinado alimento (1 vez, 2 vezes, 3 vezes, 4 vezes, 5 vezes, 6 vezes, 7 vezes) . Escala de razes contnua: o resultado numrico um valor pertencente ao conjunto dos nmeros reais R ={-;...; -38; ...; -0,3;...; 0;...0,2;...0,73;...; 1;...; 2,48;...; +}. Ex: idade (anos), peso (g), altura (cm),nvel de retinol srico (g/dl), circunferncia da cintura (cm) De acordo com o nvel de mensurao, os fenmenos ao serem medidos, resultam em variveis que podem ser classificadas em qualitativas e quantitativas. Esquematicamente tem-se: Qualitativa nominal VARIVEL: ordinal discreta Quantitativa contnua

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

O tipo da varivel ir indicar a melhor forma para o dado ser apresentado em tabelas e grficos, em medidas de resumo e, a anlise estatstica mais adequada.

1.2 - Tpicos iniciais de amostragem

Coleta de dados a observao e registro da categoria ou medida de variveis relacionadas ao objeto de estudo que ocorrem em unidades (indivduos) de uma amostra ou populao. Populao: totalidade de elementos sob estudo. Apresentam uma ou mais caractersticas em comum. Na prtica, a populao de estudo nem sempre corresponde populao alvo. Por exemplo, no estudo sobre a ocorrncia de sobrepeso em crianas de 7 a 12 anos no Municpio de So Paulo, no ano de 2003, a populao alvo o conjunto de todas as crianas nesta faixa etria, deste municpio, neste ano. Porm, pode ser que algumas crianas estejam ausentes no momento da entrevista (crianas que esto internadas, que trabalham, que no permanecem no domiclio durante o dia ou esto viajando) fazendo com que a populao de estudo represente um subconjunto da populao alvo. Elementos: so unidades de anlise; podem ser pessoas, domiclios, escolas, creches, clulas ou qualquer outra unidade. Amostra: uma parte da populao de estudo. Amostragem: processo para obteno de uma amostra. Tem como objetivo estimar parmetros populacionais Parmetro: Quantidade fixa de uma populao Ex: peso mdio ao nascer de crianas que nascem no municpio de So Paulo ( = 3100 g); proporo de crianas de 7 a 12 anos classificadas como obesas, no municpio de So Paulo ( = 12%). Estimador: uma frmula matemtica que permite calcular um valor (estimador por ponto) ou com um conjunto de valores (estimador por intervalo) para um parmetro. Ex: Mdia aritmtica: X =

x
i =1

onde

x
i =1

= x1 + x2 + ... + xn

e n= nmero de observaes.

Estimativa: Valor do estimador calculado em uma amostra. Estima o valor do parmetro. Ex: Peso mdio ao nascer, calculado em uma amostra de 120.000 crianas nascidas no Municpio de So Paulo no ano de 2000: mdia amostral

x = 3000 g

Tipos de Amostragem Probabilstica: cada unidade amostral tem probabilidade conhecida e diferente de zero de pertencer amostra. usada alguma forma de sorteio para a obteno da amostra No probabilstica: no se conhece a probabilidade de cada unidade amostral pertencer amostra. Algumas unidades tero probabilidade zero de pertencer amostra. Ex: amostragem intencional; por voluntrios; acesso mais fcil; por quotas.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Tipos de amostragem probabilstica - aleatria simples (com e sem reposio) - sistemtica - com partilha proporcional ao tamanho do estrato - por conglomerado Amostragem aleatria simples (AAS) o processo de amostragem onde qualquer subconjunto de n elementos diferentes de uma populao de N elementos tem mesma probabilidade de ser sorteado (Kalton G. 1983, Silva, NN, 1998). Tamanho da populao: N; tamanho da amostra: n; frao global de amostragem ou probabilidade de sortear um indivduo =

- necessrio ter um sistema de referncia que contenha todos os elementos da populao da qual ser retirada a amostra. - Utilizao da tabela de nmeros aleatrios - mecnica - Utilizao de programas computacionais Amostragem sistemtica Utiliza-se a ordenao natural dos elementos da populao (pronturios, casa, ordem de nascimento).

n N

- Intervalo de amostragem

k=

N n

, onde N= tamanho da populao e n = tamanho da amostra

- Incio casual i, sorteado entre 1 e k, inclusive - Amostra sorteada composta pelos elementos: i, i+k, i+2k, ...., i+(n-1)k OBS: necessrio ter cuidado com a periodicidade dos dados, por exemplo se for feito sorteio de dia no ms, pode cair sempre em um domingo onde o padro de ocorrncia do evento pode ser diferente. Exemplo: N=80; n=10; k =

N 80 = =8; n 10

incio casual:

1 i 8

Comeo casual sorteado: i=4 Amostra composta dos elementos:


i i+k i+2k . . . i+(n-1)k 4 12 20 . . . 76

Se o intervalo de amostragem no for inteiro proceder da seguinte forma: N= 321 ; n=154;

K=

i deve ser um nmero sorteado entre 1 e 2,084 Sortear um nmero entre 1000 e 2084 e dividir o resultado por 1000 Nmero sorteado = 1941, portanto i=1,941

N 321 = = 2,084 n 154

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Indivduos:
I i+k i+2k I+3k . . . i+(n-1)k 1,941 1,941+2,084 = 4,025 1,941+4,1680 = 6,109 1,941+6,252 = 8,193 . . . 1,941+318,852 = 320,793

elemento
1 4 6 8

320

Amostragem por conglomerado o processo no qual os elementos da populao so reunidos em grupos que constituem a unidade amostral e, por sua vez, alguns destes so sorteados para comporem a amostra. Se o interesse residir no sorteio de escolares, em um processo de amostragem por conglomerados, seria possvel sortear escolas (unidade amostral) e considerar todos os alunos destas para comporem a amostra (Silva, 1998).

1.3 - Apurao de dados


Processo no qual conta-se o nmero de vezes que a varivel assumiu um determinado valor (freqncia de ocorrncia). Pode ser manual, mecnica ou eletrnica (programas estatsticos: Epi info, Stata, Excel, SPSS, SAS, R, S-Plus) Distribuio de freqncias - correspondncia entre categorias (valores) e freqncia de ocorrncia. Distribuio de freqncias

valores pontuais valores em intervalos de classe

Notao: X : varivel xi : valor observado para o indivduo i Apresentao pontual Ex: 10 indivduos X: nmero de refeies dirias x: 2, 3, 3, 1, 5, 2, 3, 2, 3 Apurao:
nmero de refeies 1 2 3 5

freqncia absoluta 1 3 4 1

X: idade (anos inteiros) x: 5, 5, 15, 20, 20, 20, 21, 21, 22, 22
idade 5 15 20 21 22

freqncia 2 1 3 2 2

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

X: peso ao nascer em gramas X: 2250, 3025, 1600, 2725, 3750, 3950, 2400, 2180, 2520, 2530 freqncia peso
1600 2180 2250 2400 2520 2530 2725 3025 3750 3950 1 1 1 1 1 1 1 1 1 1

Altura em metro X: 1,63; 1,60; 1,59; 1,60; 1,45; 1,73; 2,05; 1,85 freqncia altura
1,45 1,59 1,60 1,63 1,73 1,85 2,05 1 1 2 1 1 1 1

1.4 - Apresentao tabular


Elementos essenciais: ttulo, corpo, cabealho e coluna indicadora. Tabela 1 - Ttulo: o que (natureza do fato estudado)?como (variveis)?onde? quando? Varivel % n

Total Fonte notas, chamadas OBS: nenhuma casela (interseco entre linha e coluna) deve ficar em branco.

A tabela deve ser uniforme quanto ao nmero de casas decimais e conter os smbolos ou 0 quando o valor numrico nulo e ... quando no se dispe do dado. Exemplo: Distribuio de Municpios brasileiros segundo prevalncia de bcio em escolares de 6 a 14 anos. Inqurito Nacional, Brasil, 1994 a 1996. Prevalncia de bcio (%) Freqncia % < 5,0 (no endmico) 326 5,0 a 19,9 (leve) 83 20,0 a 29,9 (moderado) 15 4 30 (grave) Total 428 Fonte: Corra Filho HR et al., 2002 (adaptado). 76,18 19,39 3,50 0,93 100

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Como idade varivel quantitativa contnua, a melhor forma de apresent-la em tabelas utilizando intervalos de valores denominados intervalos de classe. Exemplo: x: 5, 5, 15, 20, 20, 20, 21, 21, 22, 22
Idade 5 |-- 10 10 |-- 15 15 |-- 20 20 |-- 25 Total freqncia 2 0 1 7 10 % 20 10 70 100

Intervalos de classe: conjunto de observaes contidas entre dois valores limite (limite inferior e limite superior) Representao: 5 | -- 10 5 -- 10 5 |-- | 10

intervalo fechado no limite inferior e aberto no limite superior (contm o valor 5 mas no contm o valor 10) intervalo aberto nos limites inferior e superior (no contm os valores 5 e 10) intervalo fechado nos limites inferior e superior (contm os valores 5 e 10)

OBS: Representar o intervalo 0 |-- | 11 meses equivalente a represent-lo como 0 |-- 12 meses X: 2250, 3025, 1600, 2725, 3750, 3950, 2400, 2180, 2520, 2530
Peso 1500|--2000 2000|--2500 2500|--3000 3000|--3500 3500|--4000 Total freqncia 1 3 3 1 2 10 % 10 30 30 10 20 100

Considerando-se a altura (m) de 7 indivduos X: 1,63; 1,60; 1,59; 1,60; 1,45; 1,73; 2,05; 1,85
Altura 1,45|--1,55 1,55|--1,65 1,65|--1,75 1,75|--1,85 1,85|--1,95 1,95|--2,05 2,05|--2,15 Total freqncia 1 3 1 0 1 0 1 7 % 14,3 42,8 14,3 14,3 14,3 100

Os intervalos de classe devem ser mutuamente exclusivos (um indivduo no pode ser classificado em dois intervalos ao mesmo tempo) e exaustivos (nenhum indivduo pode ficar sem classificao). A amplitude do intervalo o tamanho do intervalo de classe. A amplitude do intervalo e o nmero de intervalos dependem basicamente do problema especfico e da literatura existente sobre o assunto. O ponto mdio do intervalo calculado somando-se o limite inferior e limite superior, dividindo-se o resultado por dois.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Tabela de dupla entrada ou de contingncia Valores nacionais de dosagens de iodo salino e bcio clnico em crianas de 6 a 14 anos. Inqurito nacional, Brasil, 1994 a 1996.
Grau de Bcio Zero b I e II Total
a b

Suficiente n % 1967 97,5 50 2,5 2017 100

n 18293 493 18786

Leve

% 97,4 2,6 100

Iodao salinaa Moderada n % 61497 95,1 3140 4,9 64637 100

Grave n % 15450 95,8 669 4,2 16119 100

Total n 97207 4352 101559

% 95,7 4,3 100

suficiente 40 mg/kg; leve 20-39 mg/kg; moderada 10-19 mg/kg; grave < 10 mg/kg. normal Fonte: Corra Filho HR et al., 2002. Exemplo: Tabela retirada do artigo Cartografia do retardo estatural em escolares do estado da Paraba. Brasil. Carvalho AT et al. Rev Sade Pblica 2000; 34(1):3-8.

Questo 1 Classificar quanto a natureza, as seguintes variveis


Varivel condio de sade (doente, no doente) tipo de parto (normal, cesrio) nvel de colesterol srico (mg/100cc) tempo de um procedimento cirrgico (minutos) nmero de praias consideradas poludas custo do procedimento (reais) Tipo (natureza)

Questo 2 Os dados a seguir so de peso (kg) de 80 mulheres identificadas pela varivel id (identificao).
Id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Peso 65 65 58 59 67 68 74 81 66 61 64 65 67 68 70 Id 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 peso 71 84 63 64 65 74 81 66 69 71 71 72 73 75 77 Id 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 Peso 70 72 75 76 77 78 80 82 63 66 72 72 72 73 73 Id 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Peso 75 79 79 82 83 65 68 75 76 78 78 81 85 66 68 Id 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 Peso 68 69 76 77 80 81 59 64 70 80 85 70 71 72 72 Id 76 77 78 79 80 Peso 75 79 73 82 76

Fonte: Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979. (adaptado)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Sorteie uma amostra sistemtica de tamanho 20. Indique o intervalo de amostragem e o comeo casual sorteado. Indique o nmero de identificao de cada elemento da amostra. Questo 3 Os dados a seguir so de altura de uma amostra de 351 mulheres idosas selecionadas aleatoriamente de uma comunidade para um estudo de osteoporose. Faa uma apurao dos dados e represente-os em uma tabela. Interprete os resultados.
142 145 145 145 146 147 147 147 147 148 148 149 150 150 150 150 150 150 151 151 151 151 151 151 152 152 152 152 152 152 152 152 152 152 152 152 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 153 154 154 154 154 154 154 154 154 154 154 154 155 155 155 155 155 155 155 155 155 155 155 155 155 155 155 155 155 155 155 155 155 156 156 156 156 156 156 156 156 156 156 156 156 156 156 156 156 156 156 156 156 157 157 157 157 157 157 157 157 157 157 157 157 157 157 157 157 157 157 157 157 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 158 159 159 159 159 159 159 159 159 159 159 159 159 159 159 159 159 159 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 161 161 161 161 161 161 161 161 161 161 161 161 161 161 161 161 161 161 161 161 162 162 162 162 162 162 162 162 162 162 162 162 162 162 162 162 162 162 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 163 164 164 164 164 164 164 164 164 164 164 164 164 164 164 164 164 164 165 165 165 165 165 165 165 165 165 165 165 165 165 165 165 165 165 165 166 166 166 166 166 166 166 166 166 166 166 167 167 167 167 167 167 167 168 168 168 168 168 168 169 169 169 169 169 169 169 169 170 170 170 170 170 170 170 170 170 170 170 171 171 171 173 173 173 174 176 177 178 178

Fonte: Hand DJ et al., 1994. Questo 4 Os dados a seguir so relativos ao peso ao nascer (g) de recm nascidos com sndrome de desconforto idioptico grave. Algumas crianas foram a bito (*) e outras sobrevieram.
1050* 1175* 1230* 1310* 1500* 1600* 1720* 1750* 1770* 2275* 2500* 1030* 1100* 1185* 1225* 1262* 1295* 1300* 1550* 1820* 1890* 1940* 2200* 2270* 2440* 2560* 2730* 1130 1575 1680 1760 1930 2015 2090 2600 2700 2950 2550 2570 3005 2830 1410 1715 1720 2040 2200 2400 3160 3400 3640

Fonte: Hand DJ et al., 1994.

a) Classifique a varivel peso ao nascer em duas categorias: baixo peso (abaixo de 2500 g) e no baixo peso (2500 g e mais) e faa uma tabela bidimensional cruzando as variveis: condio do recm-nascido (sobrevivente ou no sobrevivente) e peso ao nascer (baixo peso e no baixo peso). b) Interprete os resultados.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

10

Questo 5 Os dados abaixo so de um estudo de prevalncia de doena cardaca e investigao de fatores de risco associados. Calcular os valores relativos (percentuais). Distribuio de pacientes segundo ronco noturno e doena cardaca
Ronco noturno Sim No Ocasional Quase todas as noites Sempre Total N 24 35 21 30 110 Doena cardaca No % N 1355 603 192 224 2374 Total % N 1379 638 213 254 2484 %

Fonte: Hand DJ et al., 1994.

Questo 6 Com base nos dados da tabela abaixo, a) Calcular o percentual de mes com dieta boa, razovel e pobre entre os casos de spina bfida e entre os controles (fixando o 100% no total de casos e de controles); b) Analise e discuta os resultados. Distribuio de recm-nascidos casos (acometidos de spina bfida) e controles segundo dieta da me.
Dieta materna Boa Razovel Pobre Total Casos No 34 110 100 244 Controles No 43 48 32 123 Total No 77 158 132 367

Fonte: Hand DJ et al., 1994.

Questo 7 A tabela abaixo foi extrada do artigo Tendncia secular do peso ao nascer na cidade de So Paulo (19761998) de MONTEIRO CA et al. (Rev. Sade Pblica; 2000:34 (6, supl): 26-40). Comente os resultados apresentados.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

11

Questo 8 A tabela abaixo foi extrada do artigo Infeco pelo HIV durante a gestao: Estudo-Sentinela Parturiente, Brasil, 2002 de Souza Jnior et al. (Rev. Sade Pblica; 2004:38(6):764-72). Comente os resultados apresentados.

Caractersticas: barras separadas e bases de mesmo tamanho. Apropriados para representar as variveis: qualitativa nominal, ordinal e quantitativa discreta. Varivel qualitativa O Inqurito Brasileiro de Nutrio (IBRANUTRI) foi um estudo de pacientes maiores de 18 anos, internados em hospitais da rede pblica, conveniados, filantrpicos e universitrios de 12 estados do Brasil e do Distrito Federal, realizado de maio a novembro de 1996 (Correia, 1997). Os dados da tabela so retirados deste estudo. Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996
Estado nutricional Nutrido Desnutrido Sem diagnstico Total n 2061 1905 34 4000 % 51,5 47,6 0,9 100

1.5 - Apresentao grfica 1.5.1 - Diagrama de barras

Fonte: adaptado de Soares JF et al., 2002.


2500 2000 Nmero 1500 1000 500 0 Nutrido

Desnutrido

Sem diagnstico

Estado nutricional

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996 Excluindo-se os registros com informao ignorada

Fonte: adaptado de Soares JF et al., 2002.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

12

2500 2000 Nmero 1500 1000 500 0 Nutrido Desnutrido Estado nutricional

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996 A representao grfica abaixo est correta?
2100 2050 Nmero 2000 1950 1900 1850 1800 Nutrido Desnutrido nutricional Ateno:Estado cuidado com a origem!

Fonte: adaptado de Soares JF et al., 2002.

Varivel qualitativa ordinal Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996
Estado nutricionala n Nutrido 2061 Desnutrido moderado 1407 Desnutrido grave 498 Total 3966 a excluindo-se 34 (0,9%) de pacientes sem diagnstico Fonte: adaptado de Soares JF et al, 2002. % 52,0 35,5 12,5 100

60 50 40 30 20 10 0

Nutrido
a

Desnutrido moderado

Desnutrido grave

Estado nutricional
excluindo-se 34 (0,9%) de pacientes sem diagnstico Fonte: adaptado de Soares JF et al., 2002.

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996. Varivel quantitativa discreta

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

13

Foi realizada, no perodo de outubro de 1998 a outubro 1999, a pesquisa Alimentao no primeiro ano de vida, onde estudou-se uma coorte de recm-nascidos da maternidade do Hospital Universitrio (HU). Os dados a seguir so parte da caracterizao scio-econmica da amostra estudada. Distribuio de famlias segundo nmero de bens* que possuem.
Nmero de bens n % 0 146 40,6 1 97 26,9 2 87 24,2 3 26 7,2 4 4 1,1 Total 360 100 * automvel, telefone, TV a cabo e computador

Distribuio de famlias segundo nmero de bens*


50 40 30 20 10 0 0 1 2 3 Nmero de bens 4 %

1.5.2 - Diagrama de setores circulares

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.


Estado nutricionala n Nutrido 2061 Desnutrido moderado 1407 Desnutrido grave 498 Total 3966 a excluindo-se 34 (0,9%) de pacientes sem diagnstico Fonte: adaptado de Soares JF et al., 2002. % 52,0 35,4 12,6 100

12,6%

52,0% 35,4%

Nutrido
a

Desnutrido moderado

Desnutrido grave

Distribuio de pacientes(a) segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.

excluindo-se 34 (0,9%) de pacientes sem diagnstico Fonte: adaptado de Soares JF et al., 2002.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

14

1.5.3 - Diagrama linear

Produo de leite (milhes de toneladas).ndia e Estados Unidos, 1966 2000.


Ano 1966 1970 1980 1990 2000 ndia 20 23 29 50 80 Estados Unidos 58 56 60 70 75

Fonte: State of the World, 2001. W W Norton&Company, N.Y.


100 milhes de toneladas 80 60 40 20 0 1970 1980 1990 Ano 2000 ndia EUA

Produo de leite (milhes de toneladas). ndia e Estados Unidos, 1966 2000.

Fonte: State of the World, 2001. W W Norton&Company, N.Y.

1.5.4 - Histograma

Adequado para representar uma varivel quantitativa contnua Intervalos de classe com mesma amplitude Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g)
Peso(g) 1000 |-- 1500 1500 |-- 2000 2000 |-- 2500 2500 |-- 3000 3000 |-- 3500 3500 |-- 4000 Total Fonte: van Vliet PKJ et al., 1973. No 13 15 9 9 3 1 50 % 26 30 18 18 6 2 100

35 30 25 20 15 10 5 0

1000

1500

2000

2500

3000

3500

4000

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g).

Peso ao nascer (g) Fonte: van Vliet PKJ et al., 1973.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

15

Ateno: O grfico construdo considerando-se pessoas por unidade de medida (densidade)


Peso(g) 1000 |-1500 |-2000 |-2500 |-3000 |-3500 |-Total 1500 2000 2500 3000 3500 4000 No 13 15 9 9 3 1 50 % 26 30 18 18 6 2 100 amplitude 500 500 500 500 500 500 No/amplitude 0,026 0,030 0,018 0,018 0,006 0,002 (No/amplitude)x10000 26 30 18 18 6 2

0,030 0,025 0,020 0,015 0,010 0,005 0


1000 1500 2000 2500 3000 3500 4000

nmero/g

peso ao nascer (g)

OBS: notar que com intervalos iguais, no necessrio fazer ajuste na altura dos retngulos dado que as bases so de mesmo tamanho (mesma amplitude) e, portanto, com proporcionalidade assegurada. Intervalos de classe com amplitudes diferentes Distribuio de mulheres idosas segundo a altura.
Altura (cm) 140|--150 150|--155 155|--160 160|--170 170|--180 Total Fonte: Hand DJ et al., 1994. No 12 52 109 156 22 351 % 3,4 14,8 31,1 44,4 6,3 100

necessrio fazer o ajuste


Altura (cm) 140|--150 150|--155 155|--160 160|--170 170|--180 Total

No 12 52 109 156 22 351

Amplitude 10 5 5 10 10

No/amplitude 1,2 10,4 21,8 15,6 2,2

Distribuio de mulheres idosas segundo a altura.


25 20 15 10
Mulheres/cm

Fonte: 5 Hand DJ et al., 1994.


0
140 145 150 155 160 165 170 175 180

Cuidado: Sem fazer o ajuste, o grfico fica errado e pode levar a concluses erradas! altura (cm) 16

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

50 45 40 35 30 25 20 15 10 5 0

140

150

160
Altura (cm)

170

180

1.5.5- Polgono de freqncia simples


Intervalos de classe com mesma amplitude Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g).
Peso(g) 1000 |-- 1500 1500 |-- 2000 2000 |-- 2500 2500 |-- 3000 3000 |-- 3500 3500 |-- 4000 Total Fonte: Hand DJ et al., 1994. No 13 15 9 9 3 1 50 % 26 30 18 18 6 2 100

16 14 12 10 8 6 4 2 0 0

Nmero

500

1000 1500 2000 2500 3000 3500 4000 4500 peso (g)

Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g).

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

17

Intervalos de classe com amplitudes diferentes Distribuio de mulheres idosas segundo a altura.
Altura (cm) 140|--150 150|--155 155|--160 160|--170 170|--180 Total Fonte: Hand DJ et al., 1994. No 12 52 109 156 22 351 % 3,4 14,8 31,1 44,4 6,3 100

Fazendo-se o ajuste:
Altura (cm) 140|--150 150|--155 155|--160 160|--170 170|--180 Total

No 12 52 109 156 22 351

Amplitude 10 5 5 10 10

No/amplitude 1,2 10,4 21,8 15,6 2,2

25 nmero de pessoas/cm 20 15 10 5 0 130 135 140 145 150 155 160 165 170 175 180 185 190 Altura (cm)

Fonte: Hand DJ et al., 1994. Distribuio de mulheres idosas segundo a altura (cm).

1.5.6 - Representao grfica de duas variveis qualitativas


Os dados so de um estudo de obesidade em mulheres, que estuda a relao entre idade da menarca e a medida do trceps.
Idade da menarca < 12 anos 12 anos e mais Fonte: Hand DJ et al., 1994. Pequeno 15 156 Medida do trceps Intermedirio 29 197 Grande 36 150

Calculando-se as porcentagens tem-se:


Idade (anos) <12 12 e + Total Pequeno n 15 156 171 % 18,8 31,0 29,3 Medida do trceps Intermedirio n 29 197 226 % 36,2 39,2 38,8 n 36 150 186 Grande % 45,0 29,8 31,9 n 80 503 583 Total % 100 100 100

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

18

50 45 40 35 30 25 20 15 10 5 0

% Pequeno Intermedirio Grande

<12 Idade da menarca

12 e +

Distribuio de mulheres segundo idade da menarca e medida do trceps.

1.5.7 - Representao grfica de duas variveis quantitativas


Fixando-se os percentuais na condio do recm-nascido Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido
Peso(g) 1000 |-- 1500 1500 |-- 2000 2000 |-- 2500 2500 |-- 3000 3000 |-- 3500 3500 |-- 4000 Total Fonte: Hand DJ et al., 1994. Sobrevivente No % 2 9 6 26 5 22 6 26 3 13 1 4 23 100 No sobrevivente No % 11 41 9 33 4 15 3 11 0 0 27 100 No 13 15 9 9 3 1 50 Total % 26 30 18 18 6 2 100

45 40 35 30 25 20 15 10 5 0

1000 1500 2000 2500 3000 3500 4000

1000 1500 2000 2500 3000

Sobrevivente

No sobrevivente

Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

Condio do recm nascido

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

19

Polgono de freqncias

45 40 35 30 25 20 15 10 5 0

Sobrevivente No sobrevivente

500

1000

1500 2000 2500 3000 peso ao nascer (g)

3500 4000

4500

Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

Fixando-se os percentuais no peso ao nascer: Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.
Peso(g) 1000 |-1500 |-2000 |-2500 |-3000 |-3500 |-Total 1500 2000 2500 3000 3500 4000 Sobrevivente No % 2 15 6 40 5 56 6 67 3 100 1 100 23 46 No sobrevivente No % 11 85 9 60 4 44 3 33 0 0 27 54 No 13 15 9 9 3 1 50 Total % 100 100 100 100 100 100 100

Fonte: Hand DJ et al., 1994.


120 100 %

Sobrevivente No sobrevivente

80 60 40 20 0 1000 |--1500 1500 |--2000 2000 |--2500 2500 |--3000 3000 |--3500 3500 |--4000

peso (g)

Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

20

Outro grfico possvel:


100 80 60 40 20 0
1000 1500 2000 2500 3000 3500 4000

no sobreviviente sobrevivente

peso (g)
Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

1.5.8 - Escalas aritmtica e logartmica


Ano 2000 2002

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.


Sobrepeso 300 150 Obesas 100 50

Fonte: dados hipotticos Grfico em escala aritmtica


400 300 Nmero 200 100 0 2000 Ano 2002
Sobrepeso Obesa

Fonte: dados hipotticos

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002. Grfico em escala logartmica
1000

100 Nmero

10

Sobrepeso Obesa

1 2000 Ano 2002

Fonte: dados hipotticos

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

21

Grfico em escala aritmtica Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 19901995.
Ano 1990 1991 1992 1993 1994 1995 Doena X 123,5 121,4 111,9 85,9 77,1 62,2 Doena Y 28,7 22,4 17,7 13,9 14,8 10,5

Fonte: Dados hipotticos

150
Coeficiente

Doena X Doena Y

100 50 0
1990 1991 1992 1993 1994 1995

Ano
Fonte: Dados hipotticos

Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 19901995. Grfico em escala logartmica

1000 Coeficiente

Doena X Doena Y

100

10

1
1990 1991 1992 1993 1994 1995

Ano
Fonte: dados hipotticos

Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 19901995.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

22

Questo 9 Apresente os dados da tabela em um grfico apropriado. Distribuio de crianas segundo nvel de retinol srico. Cansao, Bahia, 1992.
Retinol srico (g/dl) Aceitvel (20-49) Baixo (10-19,9) Deficiente (<10 ) Total No 89 65 7 161 % 55,3 40,4 4,3 100

Fonte: Prado MS et al, 1995.

Questo 10 Apresente os dados da tabela em: a) um histograma. b) um polgono de freqncias. Distribuio de homens adultos segundo comprimento do ante-brao
Comprimento (polegadas) 16,0 |-- 16,5 16,5 |-- 17,0 17,0 |-- 17,5 17,5 |-- 18,0 18,0 |-- 18,5 18,5 |-- 19,0 19,0 |-- 19,5 19,5 |-- 20,0 20,0 |-- 20,5 20,5 |-- 21,0 21,0 |-- 21,5 Total No 4 3 12 11 21 25 23 19 10 10 2 140 % 2,9 2,1 8,6 7,9 15,0 17,9 16,4 13,6 7,1 7,1 1,4 100

Fonte: Hand DJ et al., 1994.

Questo 11 Apresente os dados da tabela em um grfico apropriado. Distribuio de homens segundo presena de doena coronariana (CHD) e consumo de caf
Condio Alto consumo de caf (>=100xcaras/ms) n % 38 4,8 752 790 95,2 100 Moderado consumo de caf (<100 xcaras/ms) n % 39 4,2 889 928 95,8 100 Total n 77 1641 1718 % 4,5 95,5 100

Com CHD Sem CHD Total

Questo 12 Interprete os grficos dos itens a seguir a) artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critrios para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica, 2000;34(5):506-13).

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

23

b) Artigo: Mortalidade por desnutrio em idosos, regio Sudeste do Brasil, 1980-1997 de OTERO UB et al. (Rev. Sade Pblica, 2002; 36(2):141-48).

(adaptado) b) Artigo: Cartografia do retardo estatural em escolares do Estado da Paraba, Brasil de CARVALHO AT et al. (Rev. Sade Pblica, 2000; 34(1):3-8).

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

24

d) Artigo: Aflatoxinas e ocratoxina A em alimentos e riscos para a sade humana de CALDAS ED et al. (Rev. Sade Pblica, 2002; 36(3):319-23).

e) Artigo: Tendncia secular da anemia na cidade de So Paulo (1984-1996) de MONTEIRO CA et al. (Rev. Sade Pblica, 2000; 34(6, sup):62-72).

f) Artigo: FORNES NS et al. Escores de consumo alimentar e nveis lipmicos em populao de So Paulo, Brasil. Rev. Sade Pblica, 2002; 36(1):12-8.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

25

(adaptado)

1.6 - Medidas de tendncia central 1.6.1 - Mdia aritmtica


Notao: X varivel N tamanho da populao n tamanho da amostra

mdia populacional (parmetro, geralmente desconhecido)


X

x mdia amostral (estimativa, valor calculado na amostra)

Estatstica (frmula)

Mdia aritmtica o valor que indica o centro de equilbrio de uma distribuio de freqncias de uma varivel quantitativa. Definio: a soma dos valores de uma varivel, dividida pelo nmero de valores. Em uma amostra aleatria simples de tamanho n, composta das observaes x1, x2, ..., xn, a mdia aritmtica ( x ) igual a:

OBS:

x + x 2 + ...+ x n = x= 1 n

x
i =1

s existe para variveis quantitativas e seu valor nico; da mesma natureza da varivel considerada; e sofre influncia dos valores aberrantes.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

26

Exemplo: Os dados a seguir so provenientes do grupo Western Collaborative Group Study, criado na Califrnia em 1960-61. Foram estudados 3154 homens de meia idade para investigar a relao entre padres de comportamento e risco de doena coronariana. Os dados apresentados so de 40 homens para os quais foram medidos os nveis de colesterol (mg por 100ml) e realizada uma categorizao segundo comportamento. O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio. O de tipo B relaxado, no competitivo e menos preocupado. Tipo A: nvel de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325 Tipo B: nvel de colesterol 344 185 263 226 175 242 Colesterol mdio:

246 252

224 153

212 183

188 137

250 202

148 194

169 213

xA = xB =

233 + 291 + ... + 212 + 325 = 245,05 mg / 100 ml 20

Se todos os homens do tipo A tivessem o mesmo nvel de colesterol, este seria 245,1 mg/100ml e do tipo B, ____________.

1.6.2 - Mediana
o valor que ocupa a posio central de uma srie de n observaes, quando estas esto ordenadas de forma crescente ou decrescente. Quando nmero de observaes (n) for mpar: a mediana o valor da varivel que ocupa o posto Quando o nmero de observaes (n) for par: a mediana a mdia aritmtica dos valores da varivel que ocupam os postos OBS: existe para varivel quantitativa e qualitativa ordinal; da mesma natureza da varivel considerada; torna-se inadequada quando h muitos valores repetidos; no sofre influncia de valores aberrantes;

n+1 2
n 2

n+2 2

pode ser calculada mesmo quando os dados esto agrupados em intervalos de classe e os extremos de algum intervalo no esteja definido (a no ser que a mediana caia neste intervalo). Exemplo: Tipo A: nvel de colesterol
233 254 291 276 312 234 250 181 246 248 197 252 268 202 224 218 239 212 239 325

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

27

Tipo B: nvel de colesterol


344 226 185 175 263 242 246 252 224 153 212 183 188 137 250 202 148 194 169 213

Ordenando-se os valores: Tipo A: nvel de colesterol


181 197 202 212 218 224 233 234 239 239 246 248 250 252 254 268 276 291 312 325

Mediana: (239+246)/2=242,5 mg/100ml Tipo B: nvel de colesterol

Mediana: (

)/2=

mg/100ml

1.7 - Medidas de disperso 1.7.1 - Valores mnimo e mximo


Valores extremos da distribuio

1.7.2 - Amplitude de variao 1.7.3 Varincia

a diferena entre os 2 valores extremos da distribuio

Indica o quanto, em mdia, os quadrados dos desvios de cada observao em relao mdia aritmtica esto afastados desta mdia.

Varincia populacional:

2 =

(X
i =1

X )2
n

N S2 =

(x
i =1

x)2

Varincia amostral:

n 1

1.7.4 - Desvio padro


a raiz quadrada da varincia , ou seja

= 2
S = S2

1.7.5 - Coeficiente de Variao de Pearson (CV) S o quociente entre o desvio padro e a mdia, ou seja C V = x100 x

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

28

Exemplo: Tipo A: nvel de colesterol


233 254 291 276 312 234 250 181 246 248 197 252 268 202 224 218 239 212 239 325

Varincia: S 2 =

(233 245,05) 2 + ... + (325 245,05) 2 = 1342,37(mg / 100ml ) 2 19

Desvio padro: S = 1342,37 = 36,64mg / 100ml Coeficiente de variao:

36,64 x100 = 14,95% 245,05


246 252 224 153 212 183 188 137 250 202 148 194 169 213

Tipo B: nvel de colesterol


344 226 185 175 263 242

Varincia: S 2 = Desvio padro S = Coeficiente de variao: Questo 13 So fornecidos valores de nvel de triglicrides (mg/dL) de 9 pessoas
166 158 202 162 135 82 150 86 121

Calcule, apresentando o desenvolvimento da frmula: a) o nvel mdio de triglicrides; b) o nvel mediano de triglicrides; c) o desvio padro do nvel de triglicrides e d) o coeficiente de variao do nvel de triglicrides. Questo 14 A tabela abaixo foi extrada do artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critrios para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica, 2000;.34(5):506-13). Discuta os resultados obtidos ignorando a coluna do valor de p ( este tpico ser abordado posteriormente).

Questo 15 A tabela abaixo foi extrada do artigo: Avaliao da capacidade preditiva da circunferncia da cintura para obesidade global e hipertenso arterial em mulheres residentes na Regio Metropolitana de Belo Horizonte, Brasil de VELASQUEZ-MELENDEZ G et al. (Cad. Sade Pblica, 2002; 18(3): 765-771). Calcule e interprete os coeficientes de variao de Pearson para cada uma das variveis apresentadas.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

29

1.7.6 - Quartil

Valores da varivel que dividem a distribuio em quatro partes iguais. 25% 25% 25% 25% Q1: deixa abaixo 25% das observaes 25% 75% Q2: deixa abaixo 50% das observaes 50% Q3: deixa abaixo 75% das observaes 25% ; Terceiro quartil:

50%

75% Primeiro quartil:

Q1 = x

1 ( ( n +1)) 4

Q3 = x

3 ( ( n +1)) 4

onde x o valor da varivel e ( ( n + 1)) e ( ( n + 1)) so ndices que representam as posies ocupadas por x.

1 4

3 4

Os dados abaixo so referentes ao peso ao nascer de 50 recm-nascidos que tiveram sndrome de desconforto respiratrio idioptico grave. 23 crianas sobreviveram e 27 foram a bito (*).
1.050* 1.175* 1.230* 1.310* 1.500* 1.600* 1.720* 1.750* 1.770* 2.275* 2.500* 1.030* 1.100* 1.185* 1.225* 1.262* 1.295* 1.300* 1.550* 1.820* 1.890* 1.940* 2.200* 2.270* 2.440* 2.560* 2.730* 1.130 1.575 1.680 1.760 1.930 2.015 2.090 2.600 2.700 2.950 2.550 2.570 3.005 2.830 1.410 1.715 1.720 2.040 2.200 2.400 3.160 3.400 3.640

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

30

Ordenando-se os dados, em cada grupo, obtm-se:


1.030* 1.050* 1.100* 1.175* 1.185* 1.225* 1.230* 1.262* 1.295* 1.300* Fonte: van Vliet PK et al. 1973. 1.310* 1.500* 1.550* 1.600* 1.720* 1.750* 1.770* 1.820* 1.890* 1.940* 2.200* 2.270* 2.275* 2.440* 2.500* 2.560* 2.730* 1.130 1.410 1.575 1.680 1.715 1.720 1.760 1.930 2.015 2.040 2.090 2.200 2.400 2.550 2.570 2.600 2.700 2.830 2.950 3.005 3.160 3.400 3.640

Entre os recm-nascidos que sobreviveram:

Q1 = x

1 ( ( 23+1)) 4 3 ( ( 23+1)) 4

= x6 = 1720 g

Q3 = x

= x18 = 2830 g
( ( 23+1)) 2

Observe que

Q2 = x 1

= x12 = 2200g

Entre os recm-nascidos que foram a bito

Q1 = x

1 ( ( 27 +1)) 4
( ( 27 +1)) 4

= x 7 = 1230 g

Q3 = x 3

= x21 = 2200g e Q 2 = x

1 ( ( 27 +1)) 2

= x14 = 1600 g

No clculo dos quartis os ndices 6, 7, 12, 14, 18 e 21 so valores inteiros. Isto ir acontecer sempre que o nmero de observaes (n) for mpar. Se n for par, o clculo do ndice resultar em um valor fracionrio. Por exemplo, para n=22

Q1 = x 1

( ( 22 +1)) 4

=x

23 ) 4

=x

3 (5 ) 4

que do caminho entre x5=1715 e x6=1720

3 Q1 = 1715 + (1720 1715) = 1718,8 g 4 =x 1 Q3 = x 3


( ( 22 +1)) 4 (17 ) 4

que do caminho entre x17=2700 e x18=2830

1 Q3 = 2700 + ( 2830 2700) = 2732,5 g 4

Percentil Valores da varivel que dividem a distribuio em cem partes iguais. Entre os recm-nascidos que sobreviveram Percentil 5:

P5 = x

5 ( 23+1)) 100

= x 120 = x
( 100 )

1 (1 ) 5

1 P5 = 1130 + (1410 1130) = 1186 g 5

que 1/5 do caminho entre x1=1130 e x2=1410

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

31

Percentil 10:

P10 = x

10 ( 23+1)) 100

= x 240 = x
( 100 )

2 ; (2 ) 5

P10 = 1410 +

2 (1575 1410 ) = 1476 g 5

Percentil 50:

P50 = x

50 ( 23+1)) 100

= x 1200 = x(12) ; P50 = 2200 g ) (


100

Percentil 75:

P75 = x

75 ( 23+1)) 100

= x 1800 = x(18) ; P75 = 2830g ( )


100

Percentil 90:

P90 = x

90 ( 23+1)) 100

= x 2160 = x
( 100 )

3 ; ( 21 ) 5

3 P90 = 3160 + (3400 3160) = 3304 g 5

Percentil 95:

P95 = x

95 ( 23+1)) 100

= x 2280 = x
( 100 )

4 ; ( 22 ) 5

4 P95 = 3400 + (3640 3400 ) = 3592 g 5

1.8 - Box plot e identificao de valores aberrantes (outliers) O Box plot representa graficamente dados de forma resumida em um retngulo onde as linhas da base e do topo so o primeiro e o terceiro quartis, respectivamente. A linha entre estas a mediana. Linhas verticais que iniciam no meio da base e do topo do retngulo, terminam em valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60). O valor adjacente superior o maior valor das observaes que menor ou igual a Q3+1,5(Q3-Q1) e o valor adjacente inferior definido como o menor valor que maior ou igual a Q1-1,5(Q3-Q1), sendo a diferena Q3-Q1 denominada intervalo inter-quartil (IIQ). Valores outliers (discrepantes ou aberrantes) so valores que fogem da distribuio dos dados. O box plot alm de apresentar a disperso dos dados torna-se til tambm para identificar a ocorrncia destes valores como sendo os que caem fora dos limites estabelecidos pelos valores adjacentes superior e inferior. Exemplo: Tipo A: nvel de colesterol
181 197 202 212 218 224 233 234 239 239 246 248 250 252 254 268 276 291 312 325

Tipo B: nvel de colesterol


137 148 153 169 175 183 185 188 194 202 212 213 224 226 242 246 250 252 263 344

Tipo A: n=20;

Q1 = x 1
4

( n +1)

= x 21 = x
4

1 5 4
3 4

= 218 +
= 254 +

1 (224 218) = 218 + 1,5 = 219,5 4


3 (268 254) = 254 + 10,5 = 264,5 4

Q3 = x 3
4

( n +1)

= x3
4

( 21)

=x

15

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

32

325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332, onde 332 dado por: 264,5 + 1,5 x 45 = 332 . 181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde 152 dado por: 219,5 1,5 x 45 = 152 . Tipo B n=20

Q1 = x 1
4

( n +1)

= x 21 = x
4

1 4

= 175 +
3 4

1 (183 175) = 175 + 2 = 177 4

Q3 = x 3
4

( n +1)

= x3
4

( 21)

=x

15

3 = 242 + (246 242) = 242 + 3 = 245 4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347, onde 347 dado por: 245 + 1,5 x 68 = 347 . 137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75 dado por: 177 1,5 x68 = 75 .
colesterol 380 360 340 320 300 280 260 240 220 200 180 160 140 120 A B

Grfico - Box plot da varivel nvel de colesterol segundo tipo de personalidade. OBS: A confeco do box plot utilizando um programa estatstico para microcomputador ir utilizar o algoritmo especfico de cada programa. Por exemplo, o STATA, verso 7, para os dados acima, calcularia o primeiro e terceiro quartis como a mdia entre dois valores da varivel que ocupam as posies 5 e 6; 15 e 16, respectivamente. Neste caso o grfico pelo Stata identificaria os valores 325 e 344 como outliers. Pelo Stata, verso 7, teramos: Tipo A: n=20; para clculo de Q1: clculo de Q3:

Q1 =

Q3 =

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 40 Valor adjacente superior: maior valor igual ou abaixo de 321 ( Q 3 + 1,5 x 40 = 321 ) =312

x15 + x16 2

x 5 + x 6 218 + 224 = = 221 2 2 254 + 268 = = 261 2

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

33

Valor adjacente inferior: menor valor igual ou acima de 161 ( Q1 1,5 x 40 = 161 ) = 181 Outlier: valor 325 Importante: note como Q1 e Q3 so calculados. Tipo B

n=20; para clculo de Q1: Q1 = clculo de Q3: Q3 =

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 65 Valor adjacente superior: maior valor abaixo de 341,5 ( Q3 + 1,5 x 65 = 341,5 ) =263 Valor adjacente inferior: menor valor acima de 81,5 ( Q1 1,5 x 65 = 81,5 ) = 137 Outlier: valor 344 Box plot da varivel nvel de colesterol segundo tipo de personalidade (pelo Stata).
colesterol 380 360 340 320 300 280 260 240 220 200 180 160 140 120 A B

x15 + x16 2

x 5 + x 6 175 + 183 = = 179 2 2 242 + 246 = = 244 2

Questo 16 Os dados a seguir so de uma pesquisa que investigou as concentraes de minerais no leite materno, no perodo de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mes foram divididas em perodo de lactao: colostro e leite maduro.
clcio (g/mL de leite) grupo colostro 113 181 254 163 225 275 167 241 303 clcio (g/mL de leite) grupo maduro 159 175 181 238 238 242 277 279 281 311 313 325 188 244 293 334 372 375 200 256 302 145 163 437 206 259 303 221 231 213 260 314 256 296 214 263 344 312 323 217 264 394 344 375 231 275

a) Calcule a quantidade mdia de clcio (g/mL de leite) em cada grupo. b) Calcule a quantidade mediana de clcio (g/mL de leite) em cada grupo. c) Desenhe o box plot da concentrao de clcio (g/mL de leite) representando os dois grupos em um s grfico. d) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberrantes e igualdade de medianas.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

34

Questo 17 O boxplot abaixo foi extrado do artigo: Vigilncia epidemiolgica e avaliao da assistncia s meningites de ESCOSTEGUY CC et al. (Rev. Sade Pblica, 2004;38(5):657-63). Avalie os resultados apresentados.

1.9 -Noes de correlao


Grficos de disperso
Y Y

X e Y so variveis aleatrias quantitativas


Y

Coeficiente de correlao de Pearson ( ): Mede o grau de associao entre 2 variveis quantitativas X e Y. Definio:

correlao positiva

correlao negativa

correlao inexistente

=
onde

XY X Y
XY a covarincia de X e Y (disperso conjunta de X e Y) X o desvio padro de X (disperso de X) Y o desvio padro de Y (disperso de Y)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

35

Covarincia: o valor mdio do produto dos desvios de X e Y, em relao s suas respectivas mdias.

XY =

_ X n

_ Yi Y

n X i Yi

( X )( Y ) =
i i

X iYi n X Y

_ _

estimador (r)

r=

_ _ x i x y i y _ 2 _ 2 x i x y i y

Propriedades a) 1 +1 b) no possui dimenso, isto , no depende da unidade de medida das variveis X e Y Exemplo: Os dados a seguir so provenientes de um estudo que investiga a composio corporal e fornece o percentual de gordura corporal (%), idade e sexo para 18 adultos com idades entre 23 e 61 anos. a) Qual a relao entre a idade e o % de gordura? Existe alguma evidncia de que a relao diferente entre pessoas do sexo masculino e feminino? Explore os dados graficamente. b) Calcule o coeficiente de correlao de Pearson entre a idade e o % de gordura para homens e mulheres. Interprete os resultados.
Idade 23 23 27 27 39 41 45 49 50 % gordura 9,5 27,9 7,8 17,8 31,4 25,9 27,4 25,2 31,1 sexo M F M M F F M F F Idade 53 53 54 56 57 58 58 60 61 % gordura 34,7 42,0 29,1 32,5 30,3 33,0 33,8 41,1 34,5 sexo F F F F F F F F F

Fonte: Hand DJ et al., 1994.

M=masculino ; F= feminino Disperso entre % de gordura e idade


70

60

f
50 idade

f ff f f

f f

f f

f m f

40

30

m m
5 10 15

m f
20 25 gordura 30 35 40 45

20

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

36

Clculo do coeficiente de correlao de Pearson Sexo: masculino


Idade 23 27 27 45 =30,5 % gordura 9,5 7,8 17,8 27,4

( y y)
-7,5 -3,5 -3,5 14,5

(x x)
-6,13 -7,83 2,18 11,78 Total

( x x )( y y ) ( y y ) 2
45,94 27,39 -7,61 170,74 236,45 56,25 12,25 12,25 210,25 291,00

(x x)2
37,52 61,23 4,73 138,65 242,13

x =15,63

Coeficiente de correlao Sexo: feminino


Idade 23 39 41 49 50 53 53 54 56 57 58 58 60 61 = 50,86 % gordura 27,9 31,4 25,9 25,2 31,1 34,7 42 29,1 32,5 30,3 33 33,8 41,1 34,5

(idade,%gordura) masculino:

r=

236,45 291x 242,13

= 0,89

( y y ) ( x x ) ( x x )( y y )
-27,86 -11,86 -9,86 -1,86 -0,86 2,14 2,14 3,14 5,14 6,14 7,14 7,14 9,14 10,14 -4,42 -0,92 -6,42 -7,12 -1,22 2,38 9,68 -3,22 0,18 -2,02 0,68 1,48 8,78 2,18 Total 123,17 10,93 63,30 13,23 1,05 5,10 20,74 -10,12 0,92 -12,42 4,85 10,56 80,26 22,10 333,64

( y y) 2
776,02 140,59 97,16 3,45 0,73 4,59 4,59 9,88 26,45 37,73 51,02 51,02 83,59 102,88 1389,71

(x x)2
19,55 0,85 41,23 50,71 1,49 5,66 93,67 10,38 0,03 4,09 0,46 2,19 77,06 4,75 312,12

32,32

Coeficiente de correlao

(idade,%gordura) feminino:

r=

333,64 1389,71x312,12

= 0,51

Questo 18 Abaixo temos o peso (kg) e a altura (cm) de 30 meninas de 11 anos de idade atendidas na escola Heaton Midldlel em Bradford, Inglaterra. a) Fazer o diagrama de disperso e investigue como a relao entre as variveis. b) Calcular o coeficiente de correlao de Pearson.
Altura (cm) 135 146 153 154 139 131 149 137 Peso (kg) 26 33 55 50 32 25 44 31 Altura (cm) 133 149 141 164 146 149 147 152 Peso (kg) 31 34 32 47 37 46 36 47
2

( x x )( y y ) = 1275 ; ( x x )

Altura (cm) 136 154 151 155 149 141 137 135

= 1716,80 ;

( y y)

Peso (kg) 28 36 48 36 32 29 34 30

Altura (cm) 146 143 148 143 140 141

Peso (kg) 35 42 32 36 33 28

= 1718,17

Questo 19 Os grficos abaixo foram extrados do artigo: Excesso de peso e gordura abdominal para a sndrome metablica em nipo-brasileiros de LERARIO DG et al. (Rev. Sade Pblica, 2002;36(1):4-11). Interprete as figuras apresentadas no artigo.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

37

2 Medidas de associao
Anlise da distribuio conjunta de duas variveis qualitativas

2.1 Razo de prevalncias


Estudo de prevalncia: n indivduos so observados e classificados segundo duas variveis X e Y, por exemplo X: ronco noturno (X1 sim, X0 no) e Y: presena de problema cardaco (Y1 sim, Y0 no). Varivel Y Varivel X X1 (sim) X0 (no) Total p= prevalncia de Y1= m1/n p1= prevalncia de Y1|X1= a/n1 p0= prevalncia de Y1|X0= c/n0 rp= razo de prevalncias= p1/p0 dp=diferena de prevalncias= p1-p0 Exemplo: So apresentados dados sobre o estado nutricional de 1226 crianas brasileiras de 2 anos de idade, segundo sexo. Estado nutricional (Y) Masculino (X1) Feminino (X0) Total (Y1) Desnutridas 29 20 49 (Y0) Normais 574 603 1177 Total 603 623 1226 Prevalncia de desnutrio: Y1 (sim) a c m1 Y0 (no) b d m2 Total (%) n1 (100) n0 (100) n (100)

49 = 0,040 ou 4% 1226

Prevalncia de desnutrio segundo sexo:

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

38

Masculino:

29 20 = 0,05 ou 5,0%; Feminino: = 0,032 ou 3,2% 603 623 0,05 = 1,56 0,032

Razo de prevalncias:

Diferena de prevalncias: 0,05-0,032=0,018 ou 1,8% A prevalncia de desnutrio parece ser maior entre as crianas do sexo masculino. Os meninos apresentam uma prevalncia 56% maior do que as meninas. A prevalncia de desnutrio entre meninos 1,56 vezes (uma vez e meia) a prevalncia de desnutrio entre meninas

2.2 Razo de incidncias


Estudo de incidncia Varivel Y Varivel X Y1 X1 a X0 c Total m1 r= incidncia de Y1= m1/n r1= incidncia de Y1 entre os X1= a/n1 r0= incidncia de Y1 entre os X0= c/n0 ri= razo de incidncias= r1/r0 di= diferena de incidncias= r1-r0 incidncia r1 r0 risco r1/r0 r1-r0 Y0 b d m2 Total n1 (100%) n0 (100%) n (100%)

ri=rr=razo de riscos=risco relativo=r1/r0 di= ra= risco atribuvel= r1-r0 Exemplo: Fumar Sim No Total r= 472/2789= 0,17 = 17% r1=208/1058= 0,20= 20% r0=264/1731= 0,15=15% rr=0,20/0,15= 1,33 ra= 0,20- 0,15= 0,05= 5% A incidncia de mortes parece ser maior entre as pessoas que fumam. Os fumantes apresentam uma incidncia 33% maior do que os no fumantes. A mortalidade entre fumantes 1,33 vezes a mortalidade entre no fumantes. Morte em 5 anos por DIC Sim 208 264 472 No 850 1467 2317 Total 1058 1731 2789

2.3 Razo de odds (odds ratio)


FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

39

Estudo do tipo caso-controle Varivel Y Varivel X X1 X0 Total Y1 a c m1 Y0 b d m2 Total n1 (100%) n0 (100%) n (100%)

odds a favor de Y1: na categoria X1= na categoria X0=

(a/n1)(b/n1) (c/n0)(d/n0)

Razo de odds ou odds ratio: [(a/n1)(b/n1)][(c/n0)(d/n0)]= (a b ) (c d ) =

b = a.d c b.c d

Exemplo: Os dados a seguir so de um estudo sobre cncer de esfago e consumo de lcool. Condio Casos Controles Total Fonte: Tuyns et al.,1977. Consumo mdio de lcool (g/dia) 80 e + 0-79 96 104 109 666 205 770 Total 200 775 975

(entre expostos) odds a favor de casos entre consumidores de 80 e + g/dia:

96 109 96 = = 0,88 : 205 205 109 104 666 104 = = 0,16 : 770 770 666

(entre no expostos) odds a favor de casos entre consumidores de 0-79g/dia:

odds ratio:

96 104 96 x666 : = = 5,6 109 666 109 x104

A fora de morbidade de cncer de esfago entre consumidores de 80 e + g/dias de bebida alcolica 5,6 a fora de morbidade entre os que consomem de 0 a 79g/dia. Odds ratio utilizando-se os dados de DIC: OR=(208x1467)/850x265)=1,36

2.4 - Qui-quadrado de Pearson


Duas variveis qualitativas: X - curso universitrio e Y sexo do aluno Questo: sexo do indivduo influi na escolha do curso?

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

40

Situao 1 Curso Economia Administrao Total Masculino n 24 16 40 Feminino n 36 24 60 Total n 60 40 100

Curso Economia Administrao Total n 24 16 40

Masculino proporo 0,6 0,4 1

n 36 24 60

Feminino proporo 0,6 0,4 1

n 60 40 100

Total proporo 0,6 0,4 1

As propores de escolha dos cursos no diferem segundo sexo do estudante Situao 2 Curso Fsica Cincias Sociais Total Masculino n 100 (a) 40 (c) 140 Feminino n 20 (b) 40 (d) 60 Total n 120 80 200

Curso Fsica Cincias Sociais Total n 100 40 140

Masculino Proporo 0,7 0,3 1

n 20 40 60

Feminino proporo 0,3 0,7 1

n 120 80 200

Total proporo 0,6 0,4 1

A distribuio de alunos em cada curso, segundo sexo no a mesma. Sexo e curso podem estar associados. Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Fsica, entre os homens? Esperaramos : 0,6x140 ou

120 x140 = 84 200

Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Cincias Sociais, entre os homens? Esperaramos: 0,4x140 ou

80 x140 = 56 200

Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Fsica, entre as mulhres? Esperaramos : 0,6x60 ou

120 x60 = 36 200

Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Cincias Sociais, entre as mulheres?

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

41

Esperaramos: 0,4x60 ou

80 x60 = 24 200

Tabela esperada, sob a condio de independncia Curso Fsica Cincias Sociais Total Masculino n 84 56 140 Feminino n 36 24 60 (O-E)2 256 256 256 256 Total n 120 80 200

Valores observados O 100 40 20 40

Valores esperados E 84 56 36 24

(O-E) 16 -16 -16 16

(O E ) 2 E
3,048 4,571 7,11 10,667 Qui-quadrado=25,397

O Qui-quadrado obtido somando-se a diferena ao quadrado entre as freqncias observadas e as esperadas, dividido pelas freqncias esperadas

(O E) 2 = E
2

Se o Qui-quadrado for igual a zero, ento no existe associao entre as variveis. Quanto maior o valor do Qui-quadrado, maior a chance de existir associao entre as variveis, entretanto, o Qui-quadrado no mede fora de associao. Exemplo: Com o objetivo de investigar a associao entre histria de bronquite na infncia e presena de tosse diurna ou noturna em idades mais velhas, foram estudados 1.319 adolescentes com 14 anos. Destes, 273 apresentaram histria de bronquite at os 5 anos de idade sendo que 26 apresentaram tosse diurna ou noturna aos 14 anos. Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou noturna aos 14 anos de idade. Local X, ano Y.
Bronquite Tosse Sim No Total Sim 26 247 273 No 44 1002 1046 Total 70 1249 1319

Fonte: Holland WW et al.,1978.

Clculo do qui-quadrado de Pearson Valores Valores esperados observados E O 26 247 44 1002 14,488 258,512 55,512 990,488

(O-E)

(O-E)2

(O E ) 2 E
9,147 0,513 2,387 0,134

11,512 -11,512 -11,512 11,512

132,526 132,526 132,526 132,526

Qui-quadrado= 12,181 Questo 20

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

42

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo condio de sobrevivncia e peso ao nascer (g).
Peso ao nascer Baixo peso (<2500) No baixo peso (2500 e mais) Total bito 24 3 27 Sobrevida 13 10 23 Total 37 13 50

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994. Com base nos dados apresentados na tabela calcule: a) a incidncia de bitos entre crianas com baixo peso, b) a incidncia de bitos entre crianas sem baixo peso, c) a razo de incidncias d) a diferena de incidncias e) o qui-quadrado do Pearson f) interprete os resultados

Questo 21 Defeitos do tubo neural so malformaes congnitas que surgem durante o desenvolvimento fetal. conhecida como spina bfida. Estes dados so de um estudo conduzido no pas de Gales Reino Unido, para investigar possvel associao entre defeitos do tubo neural e dieta materna. O estudo do tipo casocontrole: mes que tinham tido bebs com defeitos do tubo neural (casos) e suas irms que no tinham tido (controles) foram avaliadas segundo suas dietas e classificadas em boa, razovel e ruim. Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural; controle recm-nascidos que no tinham defeitos do tubo neural e dieta materna.
Dieta Boa Razovel Pobre Total n 34 110 100 244 Casos % 13,9 45,1 41,0 100 n 43 48 32 123 Controles % 35,0 39,0 26,0 100 n 77 158 132 367 Total % 21,0 43,0 36,0 100

Considere a dieta boa como categoria de referncia (basal) e calcule: a) o odds ratio de dieta razovel em relao a dieta boa; b) o odds ratio de dieta pobre em relao a boa; c) o qui-quadrado de Pearson e d) interprete os resultados. Questo 22 A tabela abaixo foi extrada do artigo: Excesso de peso e gordura abdominal para a sndrome metablica em nipo-brasileiros de LERARIO DDG et al. (Rev de Sade Pblica, 2002; 36(1): 4-11). Analise as razes de prevalncias obtidas no estudo.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

43

Questo 23 A tabela abaixo foi extrada do artigo: Evoluo do padro de aleitamento materno de Kummer SC et al. (Rev de Sade Pblica, 2000; 34(2): 143-8). Analise as razes de chances obtidas no estudo. Observe os intervalos de confiana apresentados e tire suas concluses.

3. Distribuies de probabilidade 3.1 - Noes de probabilidade


Probabilidade (probability, chance, likelihood) uma afirmao numrica sobre a possibilidade de que algum evento ocorra. Quantifica o grau de incerteza de eventos, variando de 0 (0%) a 1 (100%). Um evento impossvel de ocorrer tem probabilidade 0 (zero) Um evento certo tem probabilidade 1 (um) Quando se joga uma moeda, no se sabe se vai sair cara. Mas sabe-se que a probabilidade de sair cara 0,5 = 50% = 1/2. Dizer que a eficcia de uma vacina de 70% corresponde a dizer que cada indivduo vacinado tem probabilidade 0,7 de ficar imune. Probabilidade em espaos finitos contveis Espao amostral (S) o conjunto de todos os resultados possveis de um experimento. Supor o experimento lanar uma moeda; S= {cara, coroa} H dois pontos neste espao amostral, sendo um favorvel ao evento A={cara}.
FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

44

Definio clssica de probabilidade

P( A) =

numero de elementos de A 1 = = 0,5 numero de elementos de S 2 13 1 = 52 4

Exemplo: probabilidade de (ouros) em um baralho de 52 cartas

Probabilidade de eventos mutuamente excludentes Diz-se que dois eventos so mutuamente excludentes (ou mutuamente exclusivos) quando no podem ocorrer simultaneamente Exemplo: A = {cara} ; B= {coroa}, no lanamento de uma moeda; A e B so mutuamente exclusivos C = {sexo feminino}; D={sexo masculino}, no nascimento de uma criana; C e D so mutuamente exclusivos. A probabilidade da ocorrncia de um evento A ou de um evento B : P(A ou B) = P(A B) = P(A) + P(B) P(A B)

A probabilidade da ocorrncia simultnea de eventos mutuamente exclusivos zero. P(cara e coroa) = P(cara coroa) = 0, no lanamento de uma moeda. Se A e B forem mutuamente excludentes, P(A B) = 0 e P(A ou B) = P(A B) = P(A) + P(B) Exemplo 1: P(Face 2 ou Face 3) no lanamento de um dado P(2 ou 3)= P(2)+P(3)= 1/6 + 1/6 = 2/6 = 1/3. P(Resultado mpar)= P(1 ou 3 ou 5)= P(1)+P(3)+P(5)= 3/6 = 1/2. Regra da adio: P(A ou B) = P(A B) = P(A) + P(B) P(A B) Probabilidade de eventos independentes Os eventos A e B so independentes quando o resultado de um no influi no resultado do outro. Exemplo: no lanamento simultneo de duas moedas, o resultado de uma no interfere no resultado da outra. A probabilidade da ocorrncia de eventos independentes o produto das probabilidades de cada evento. P(A e B)= P(A B) = P(A) x P(B)

P(face 2 no primeiro dado e face 3 no segundo dado), no lanamento seqencial de dois dados = P(2 e 3) = P(2)xP(3)= 1/6 x 1/6= 1/36= 0,0278= 2,78%. Probabilidade condicional A probabilidade condicional do evento A dado que ocorreu o evento B

P( A | B) =

P( A B) , para P( B) 0 P( B)

L-se P(A|B) como probabilidade de A dado B. Exemplo: Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou noturna aos 14 anos de idade. Local X, ano Y. 45

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Bronquite Tosse Sim No Total Sim 26 247 273 No 44 1002 1046 Total 70 1249 1319

Fonte: Holland, WW et al., 1978.

Sorteia-se um paciente. Qual a probabilidade dele ter tosse aos 14 anos dado que teve bronquite aos 5 anos de idade? P(tosse|bronquite)= P(tosse e bronquite)/P(bronquite)= 26/1319 273/1319= 9,5% Regra da multiplicao

P ( A B ) = P( A | B) xP( B)
se A e B forem independentes, P(A|B) = P(A) e como conseqncia, P ( A B ) = P ( A) xP( B ) Os eventos tosse e bronquite no so independentes porque P(tosse e bronquite) P(tosse) x P(bronquite), pois 26/1319 (70/1319) x (273/1319), ou seja, 0,02 0,011. Exemplo: Considerar uma populao de homens que foram classificados segundo o hbito de fumar e doena respiratria crnica. Nesta populao sabe-se que 5% dos homens tm doena respiratria e so no fumantes, 15% tm doena e so fumantes, 50% no tm doena e so no fumantes e 30% no tm a doena e so fumantes. Fumante Total Problema respiratrio No fumante No ( R ) 0,50 = P( F R ) 0,05 = P( F R ) 0,55 = P( F )

Sim ( R ) Total

F 0,30 = P( F R ) 0,15 = P( F R ) 0,45 = P( F )

0,80 = P( R ) 0,20 = P( R )

Escolhe-se um homem ao acaso, qual a probabilidade dele ter doena respiratria dado que era fumante?

P( R | F ) =

P( R F ) = 0,15/0,45 = 0,33 P( F )

Os eventos no so independentes porque P ( F R ) P ( F ) xP( R ) Relao entre eventos mutuamente exclusivos e independentes: Os eventos mutuamente exclusivos A e B satisfazem a condio que P(A e B) = 0, ento dois eventos mutuamente exclusivos A e B so no independentes a menos que P(A)=0 ou P(B)=0. Caso contrrio, eles so claramente dependentes pois P(A).P(B)>0 se ambos P(A)>0 e P(B)>0, portanto P ( A B) P( A) P( B) porque P ( A B) = 0 . Assim, dois eventos mutuamente exclusivos A e B so dependentes exceto nos casos onde P(A)=0 ou P(B)=0. Definio freqentista de probabilidade: n repeties do evento A; A ocorre m vezes, ento a freqncia relativa de A = Para n suficientemente grande, Quando n cresce,

m n

m m P ( A) ou seja, lim n = P( A) n n

m tende a se estabilizar em torno de uma constante, P(A) n

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

46

Varivel aleatria discreta Varivel aleatria qualquer funo de nmero real, definida no espao amostral, com uma probabilidade de ocorrncia associada. Exemplo: No lanamento de 1 moeda, o nmero de caras uma varivel aleatria. Se esta varivel for denominada X, tem-se que os valores possveis para X so 0 e 1. Assim escreve-se X:0,1. A probabilidade de cara 0,5: P(cara)= P(X=1)= 0,5= 1/2. No lanamento de 10 moedas, X:0, 1, 2,....,10; e a probabilidade de cara = 0,5. Sair cara (ou coroa) so eventos mutuamente exclusivos. Um particular resultado de cada lanamento exclui a ocorrncia do outro. possvel calcular a probabilidade da varivel assumir cada valor x, ou seja, P(X=x). O conjunto de valores da varivel aleatria e das probabilidades obtidas define uma distribuio de probabilidades. Se X assume valores inteiros, a varivel denominada discreta. Se X assume valores no conjunto dos nmeros reais, a varivel denominada contnua.

3.2 - Distribuio Bernoulli


Estrutura bsica: duas possibilidades de resultado (sucesso e fracasso). Exemplo 1: Joga-se uma moeda uma vez. A moeda equilibrada, ou seja, os lados possuem peso igual, no favorecendo nenhum dos lados, ao ser lanada. Tem-se como sucesso sair a face cara. Define-se uma varivel aleatria X que assume valor 1 se ocorrer sucesso e 0 se ocorrer fracasso. X: 0,1 Parmetro: probabilidade da varivel assumir valor 1. Notao: ou p. Se probabilidade de sucesso = p, a probabilidade de fracasso ser igual a q=(1-p), porque p+q=1. Probabilidade de sair cara = P(X=1) = p(1) = p = 0,5 Probabilidade de sair coroa = P(X=0) = p(0) = q = 1-p = 0,5 Graficamente:
1 0,8 0,6 0,4 0,2 0 0 1 x p(x)

p=0,5

Exemplo 2: Uma droga cura 15% dos pacientes. Administra-se a droga a um paciente. Qual a probabilidade do paciente ficar curado? Qual a probabilidade do paciente no ficar curado? X: 0,1 (X ser 0 se o paciente no se curar e 1 se houver cura)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

47

P(X=1) =p(1)=p= 0,15 ; P(X=0) =p(0)= q=0,85


1 0,8 0,6 0,4 0,2 0 0 1 p(x)

p=0,15

Os exemplos pertencem a mesma famlia de distribuies, mas tm parmetros diferentes. A distribuio de Bernoulli pode ser escrita como P(X=1) = p(1)=p e P(X=0) =p(0) =1-p; ou, de forma mais genrica,

p( x ) = p x (1 p)1 x , x=0,1
para x=0, p(0) = P(X = 0) = p (1 p)
0 1 0

Isto significa que

=1 p ,

para x=1,

p(1) = P(X = 1) = p (1 p)
1

11

=p

Mdia de uma varivel aleatria discreta: Na distribuio de Bernoulli:

= E (X) = xp( x )
x

= E(X) = xp( x ) = 1p( x = 1) + 0p( x = 0) = p


x

Mdia da distribuio Bernoulli p (probabilidade de ocorrer o sucesso) Varincia de uma varivel aleatria discreta:

2 = V ( X ) = E[(X ) 2 ] = ( x ) 2 p( x )
x

Desvio padro:

SD(X) = V(X) =

Desvio padro da distribuio Bernoulli

(0 p) 2 .p( x = 0) + (1 p) 2 .p( x = 1) = (p) 2 .(1 p) + (1 p) 2 p = (1 p)p(p + (1 p)) = p(1 p) = pq


Resumindo, Modelo de probabilidade Bernoulli Uma varivel aleatria discreta X que pode assumir valores 0 e 1, com funo de probabilidade dada por com x=0,1 segue uma distribuio Bernoulli com parmetro p , 0<p<1. p a probabilidade de obter o resultado X=1. Isto pode ser escrito como X~Bernoulli(p) com mdia p e desvio padro

p( x ) = p x (1 p)1 x

p(1 p) .

O smbolo ~ l-se tem distribuio ou se distribui segundo.

3.3 - Distribuio binomial


Distribuio Binomial a soma de n distribuies Bernoulli

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

48

Populao: 2 categorias Ex: sexo (masculino, feminino), faces de uma moeda (cara, coroa), desfecho de um tratamento (cura, no cura)

Cara (K) probabilidade(K) = p Lanamento de uma moeda Coroa (C) probabilidade (C) = q p + q = 1 q = 1 - p
p = probabilidade de sucesso; q= probabilidade de fracasso Realiza-se o experimento n vezes, onde cada ensaio independente do outro e os resultados so mutuamente exclusivos. X: Nmero de vezes que sai cara A moeda lanada uma vez (n=1) X: 0,1 X resultado P(X=x) 0 C P(X=0) = q 1 K P(X=1) = p X~Bernoulli(p)

X: 0,1,2 A moeda lanada duas vezes (n=2) X resultado P(X=x) 0 C,C P(X=0) = q.q = 1 K,C ou C,K P(X=1) = p.q+q.p= 2 K,K P(X=2) = p.p=

X~B(n=2, p) q2 2.p.q p2 X~B(n=3, p) q3 3 p.q2

X: 0,1,2,3 A moeda lanada trs vezes (n=3) X resultado P(X=x) 0 C,C,C P(X=0) = q.q.q =
1 K,C,C ou C,K,C ou C,C,K K,K,C ou K,C,K ou C,K,K K,K,K P(X=1) = p.q.q+q.p.q +q.q.p =

P(X=2) = p.p.q +p.q.p +q.p.p =

3 p2.q p3

P(X=3) = p.p.p =

Probabilidade (X=x) calculada pelo produto de 3 fatores: 1o - nmero (combinao de n elementos combinados x a x) 2o - probabilidade de sucesso elevado a um expoente (valor de x) 3o - probabilidade de fracasso elevado a um expoente (valor de n-x)

n x n x n! P( X = x) = p q p x q n x = x x!(n x)!
Resumindo Modelo de probabilidade Binomial Seja E um experimento com 2 resultados (mutuamente exclusivos): S (sucesso) e F (fracasso) p = probabilidade de ocorrncia de S e q= probabilidade de ocorrncia de F sendo que p+q=1.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

49

Se E for repetido n vezes, de forma independente, mantendo-se p e q, a probabilidade da varivel aleatria X= nmero de vezes que S ocorre dada por

P( X = x ) =

n! p x q n x x !(n x )!

X~B(n,p) onde n e p so os parmetros da

distribuio; a mdia = m = n.p, a varincia = n.p.q e o desvio padro =

npq

Exemplo 1: Uma suspenso contendo organismos de Leishmania preparada e quando uma determinada quantidade inoculada em ratos, 30% deles se tornam infectados. Se 3 ratos forem inoculados independentemente, qual a probabilidade de: a) Nenhum rato ficar infectado? P(X=0) = (0,3) 0 (0,7) 3 = (0,7) 3 = 1x0,343 = 0,343 = 34,3% 0 0! (3 0)! b) Um rato ficar infectado? P(X=1) = (0,3) 1 (0,7) 31 = (0,3) 1 (0,7) 31 = 0,3 x0,49 = 0,441 = 44,1% 1 1! (3 1)! 1x 2 x1 c) Dois ratos ficarem infectados? P(X=2) = (0,3) 2 (0,7) 3 2 = (0,3) 2 (0,7) 3 2 = 0,09 x0,7 = 0,189 = 18,9% 2 2 ! ( 3 2 )! 2 1 1 x x d) Todos os ratos ficarem infectados? P(X=3) = (0,3) 3 (0,7) 33 = (0,3) 3 (0,7) 0 = 0,027 x1 = 0,027 = 2,7% 3 3 ! ( 3 3 )! 3 x 2 x1x1 e) Pelo menos 2 fiquem infectados? f) No mximo 1 fique infectado?

3!

3!

3 x 2 x1

3!

3x 2 x1

3!

3 x 2 x1

Exemplo 2: Lanamento de moedas. n= nmero de ensaios (n de lanamentos)= 10 X= varivel aleatria (n de caras) x= resultado particular de X (0, 1, 2, ...,10) p= probabilidade de ocorrer cara (sucesso); p=P(cara)= 0,5

n x n x P( X = x) = x p (1 p )

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

50

Distribuio de probabilidade B(n=10; p=0,5)


X= n de caras 0 1 2 3 4 5 6 7 8 9 10 P(X=x) 0,0010 0,0098 0,0439 0,1172 0,2051 0,2461 0,2051 0,1172 0,0439 0,0098 0,0010 1

Mdia = np = 10x0,5 = 5 Varincia = npq = 2,5 Desvio padro =

0,30 0,25 0,20 0,15 0,10 0,05 0,00

p(X=x)

npq = 10 x 0,5 x 0,5 = 2,5 = 1,58


X : n

Se estivermos trabalhando com a proporo de sucessos,

p = p = 0,5 n p q pq Varincia = nx x = = 0,025 n n n npq npq pq Desvio padro = = 0,158 = = 2 n n n


Mdia = nx

5 X

10

Exemplo 3 Um programa de incentivo amamentao exclusiva ao seio nos primeiros 3 meses est sendo executado em um hospital universitrio. Verificou-se que a eficcia do programa era de = 60%. Para uma amostra de 20 mes que deram luz neste hospital, a distribuio de probabilidade da varivel aleatria nmero de mes amamentando exclusivamente ao seio a seguinte:
X= n de amamentando 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 mes P(X=x|p=0,6) 0,000 0,000 0,000 0,000 0,000 0,001 0,005 0,015 0,035 0,071 0,117 0,160 0,180 0,166 0,124 0,075 0,035 0,012 0,003 0,000 0,000
0,2 0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X

p(X=x)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

51

3.4 - Odds e probabilidade


Probabilidade: Supor o estudo de seguimento de 50 fumantes. No final do estudo observa-se que 30 pessoas desenvolveram bronquite crnica e 20 no desenvolveram. Denominando-se p a probabilidade de desenvolver bronquite e q a probabilidade de no desenvolver bronquite, tem-se que p =

30 20 e q onde q = 1 p . = 50 50

Odds: Define-se odds a favor de bronquite como a razo entre a probabilidade de desenvolver bronquite e a p probabilidade de no desenvolver a doena. Portanto, odds = 1 p Aplicando-se os dados do exemplo tem-se 30 30 p ou simplesmente 1,5. = 50 = = 1,5 : 1 odds a favor de bronquite = 20 20 1 p 50 L-se o odds da seguinte forma: entre fumantes a probabilidade de desenvolver bronquite 50% maior que a probabilidade de no desenvolver bronquite entre no fumantes ou a probabilidade de desenvolver bronquite entre fumantes uma vez e meia a probabilidade de no desenvolver bronquite entre no fumantes.
Probabilidade escrita como funo de Odds Tem-se, ainda, que a probabilidade de doena pode ser escrita como odds, da seguinte forma:

odds p= 1 + odds

30 30 30 odds e de fato, a probabilidade de bronquite igual a p . = = 20 = 20 = 50 30 50 1 + odds 1+ 20 20

Exemplo Com base no exemplo da tosse e bronquite tem-se que: o odds de uma criana ter tido bronquite na infncia 273/1046=0,261. A probabilidade de bronquite igual a 0,261/(1+0,261)=0,207=20,7%. ou o odds de uma criana no ter tido bronquite na infncia 1046/273=3,8. A probabilidade de no ter tido bronquite na infncia igual a 3,8/(1+3,8)=0,792=79,2%. Questo 24 Considerando um estudo conduzido para comparar os efeitos adversos e a eficcia de duas drogas antidepressivas, 18 pacientes so alocados aleatoriamente em um de trs grupos (6 pacientes em cada grupo). Os pacientes do primeiro grupo so tratados com a droga A, os do segundo, com a droga B e os do terceiro, com placebo. Estudos anteriores sugerem que a proporo de abandono de tratamento entre os pacientes do grupo placebo 15%. Pressupondo-se que exista independncia entre cada realizao do experimento, calcule: a) a probabilidade que todos os 6 pacientes do grupo 3 iro abandonar o estudo; b) a probabilidade que nenhum paciente do grupo 3 abandonar o estudo; c) a probabilidade que 2 pacientes do grupo 3 abandonem o estudo;

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

52

3.5- Distribuio normal ou de Gauss


Os dados abaixo so medidas do trax (polegadas) de 5732 soldados escoceses, tomadas pelo matemtico belga, Adolphe Quetelet (1796-1874). medidas | Freq. Percent Cum. ------------+----------------------------------33 | 3 0.05 0.05 34 | 19 0.33 0.38 35 | 81 1.41 1.80 36 | 189 3.30 5.09 37 | 409 7.14 12.23 38 | 753 13.14 25.37 39 | 1062 18.53 43.89 40 | 1082 18.88 62.77 41 | 935 16.31 79.08 42 | 646 11.27 90.35 43 | 313 5.46 95.81 44 | 168 2.93 98.74 45 | 50 0.87 99.62 46 | 18 0.31 99.93 47 | 3 0.05 99.98 48 | 1 0.02 100.00 ------------+----------------------------------Total | 5732 100.00

Distribuio de medidas do trax (polegadas) de soldados escoceses


1000

800

Frequency

600

400

200

0 33 34 35 36 37 38 39 40 41 medidas 42 43 44 45 46 47 48

Fonte: Daly F et al. Elements of Statistics, 1999 Funo densidade de probabilidade da distribuio normal: Se a varivel aleatria X normalmente distribuda com mdia

e desvio padro

(varincia

2 ),

funo densidade de probabilidade de X dada por onde

f ( x) =

( x )2 2 2

, < x < +

: constante 3,1416 e: constante 2,718 : constante (mdia aritmtica da populao) : constante (desvio padro populacional)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

53

Propriedades: campo de variao : < X < + simtrica em torno da mdia m (ou

a mdia e a mediana so coincidentes a rea total sob a curva igual a 1 ou 100% a rea sob a curva pode ser entendida como medida de probabilidade

Exemplo: Depois de tomarmos vrias amostras, decidiu-se adotar um modelo para as medidas de permetro do trax de uma populao de homens adultos com os parmetros: mdia ( ) = 40 polegadas e desvio padro ( ) = 2 polegadas

_ X = 68,2% _ X 1,96 = 95,0% _ X 2,58 = 99,0%

40 43 X Qual a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax entre 40 e 43 polegadas?
[ 1 P (40 < X < 43) = e 40 2 2 43 ( x 40 ) 2 ] 2x4

dx

Pode-se responder pergunta sem calcular a integral e sim utilizando o nmero de desvios padro que o valor 43 est em torno da mdia para calcular a probabilidade por meio da tabela da distribuio Normal reduzida N(0,1). Normal reduzida:

Z ~ N (0;1) onde Z =
P ( 40 < X < 43) = P (

x-

40 40 X 43 40 ) = P (0 < Z < 1,5) < < 2 2

1,5

Utilizando a tabela da curva normal reduzida, P(0<Z<1,5)=0,43319=43,3%

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

54

Com base na distribuio de X~N( =40, =2), do exerccio 34, calcular: a) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax maior ou igual a 43 polegadas.

P ( X > 43) = P (

43 40 ) = P ( Z > 1,5) > 2

40

43

1,5

Utilizando a tabela da curva normal reduzida, P(Z>1,5)=0,5-0,43319=0,06681= 6,7% b) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax entre 35 e 40 polegadas;

c) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax menor que 35;

d) Qual o valor do permetro do trax, que deixaria 75% da populao abaixo dele?

Questo 25 Considerar a altura de 351 mulheres idosas como seguindo uma distribuio normal com mdia 160cm e desvio padro 6 cm. Sorteia-se uma mulher; qual a probabilidade de que ela tenha a) altura entre 160 cm e 165 cm? b) altura maior do que 170 cm? c) altura menor do que 150 cm?

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

55

3.6- Distribuio amostral da mdia


Apresentao do Teorema que fornece as bases tericas necessrias para inferncia estatstica e estimao. Teorema central do limite: X varivel aleatria com mdia

e varincia

2 , ento X ~ N ( ,

) n

Supor a situao onde uma populao composta por 6 elementos, para os quais observou-se a caracterstica X, cujos valores esto apresentados abaixo.
elementos A B C D E F Xi 11 16 12 15 16 14

Fonte: Dixon WJ & Massey FJ, 1957. Mdia populacional ( ) = 14 Varincia populacional ( ) = 3,667 Desvio padro populacional ( ) = 1,9149
2

Parmetros populao Mdia ( ) Varincia ( ) Desvio padro ( )


2

valor 14 3,67 1,91

Estimador amostra

Valor (estimativa) Par(A,D)=(11,15)

X
S S

x = 13 s2 = 8

s = 2,828

Todas as possveis amostras de tamanho 2, determinadas pelo processo de amostragem aleatrio, com reposio (N=6, n=2)
Amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Elementos que compem a amostra A,A A,B A,C A,D A,E A,F B,A B,B B,C B,D B,E B,F C,A C,B C,C C,D C,E C,F valores (11,11) (11,16) (11,12) (11,15) (11,16) (11,14) (16,11) (16,16) (16,12) (16,15) (16,16) (16,14) (12,11) (12,16) (12,12) (12,15) (12,16) (12,14) Mdia( x i ) 11 13,.5 11,5 13 13,5 12,5 13,5 16 14 15,5 16 15 11,5 14 12 13,5 14 13 Amostra 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Elementos que compem a amostra D,A D,B D,C D,D D,E D,F E,A E,B E,C E,D E,E E,F F,A F,B F,C F,D F,E F,F valores (15,11) (15,16) (15,12) (15,15) (15,16) (15,14) (16,11) (16,16) (16,12) (16,15) (16,16) (16,14) (14,11) (14,16) (14,12) (14,15) (14,16) (14,14) Mdia( x i ) 13 15,5 13,5 15 15,5 14,5 13,5 16 14 15,5 16 15 12,5 15 13 14,5 15 14

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

56

Distribuio de freqncia de todas as possveis mdias: Distribuio amostral da mdia


i 1 2 3 4 5 6 7 8 9 10 11 Total freqncia 1 2 1 2 4 6 5 2 5 4 4 36

xi
11 11,5 12 12,5 13 13,5 14 14,5 15 15,5 16

Mdia das mdias ( x ) =

x
i =1

11

fi

n
11 i =1

= 14
i

2 Varincia das mdias x =

(x

x)2 fi n = 1,833
2 x = x

Desvio padro das mdias = erro padro da mdia = Erro padro da mdia =

1,833 = 1,354 1,915 2 = 1,354)

No exemplo, X ~ N ( = 14, = 1,915) , portanto X ~ N ( x = 14, x =

Questo 26 Entre homens adultos sadios, a concentrao de ferro srico segue uma distribuio normal com mdia 120 microgramas para 100ml e desvio padro 15 microgramas para 100ml. Calcule a probabilidade que uma amostra de 50 homens resulte em nvel mdio de ferro srico entre 115 e 125 microgramas por 100ml.

4. Estimao de parmetros populacionais por ponto e intervalo 4.1 Estimao por ponto
Seja X1, X2, X3, ...Xn uma amostra aleatria de tamanho n de uma distribuio normal com mdia e varincia 2 (desvio padro ). Os parmetros ( e 2 ) podem ser estimados com base na amostra. Se o estimador for um nico valor, a estimao chamada de estimao por ponto. Mdia aritmtica Populacional

Parmetro

estimador :

X=

X
i =1

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

57

Varincia

S
Parmetro

2 (n)

(X
i =1 n

X) ou
i

n =

estimador :

2 ( n 1)

(X
i =1

X)

n 1
X ~ N ( ,

Ateno: os estimadores so variveis aleatrias. Pelo teorema central do limite,

). n

4.2 - Estimao por intervalo


Padronizando-se a mdia

X ~ N ( ,

), n

obtm-se

Z=

~ N (0,1) , que permite calcular

P( z Z z ) = 1 , X

ou

seja, P( z

z) = 1 .

Para

= 5% ,

tem-se:

P(1,96

P(1,96

X +1,96 ) = 0,95 ; P( X 1,96 X + 1,96 ) = 0,95 , n n n n


X + 1,96 ) = 0,95 . n n

+1,96) = 0,95 , com manipulao algbrica tem-se:

obtendo-se P( X 1,96

Tem-se um intervalo aleatrio centrado na mdia amostral que possui 95% de probabilidade de conter a verdadeira mdia populacional. Neste caso o parmetro ser estimado por um conjunto de valores provenientes de uma amostra. Quando

= x e o intervalo deixa de ser uma varivel aleatria. isto feito, X


O intervalo x 1,96

x + 1,96 n n

contm ou no contm a verdadeira mdia. Diz-se ento que a

confiana que se deposita neste intervalo de 95% porque antes de tomada a amostra de tamanho n, existia, associada a ele, uma probabilidade de 95% de que contivesse a mdia populacional. Por isso chama-se intervalo de confiana para a mdia populacional IC(95%) : ( x 1,96

) e ( x + 1,96 ) n n

ou

x 1,96

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

58

4.2.1 - Intervalo de confiana para a mdia populacional com varincia populacional conhecida

IC( ) = x z / 2.

x n

4.2.2 - Intervalo de confiana para a mdia populacional com varincia populacional desconhecida
Define-se a estatstica

X- X- T= _ = SX SX n

, onde T ~ tn 1 ,

n - 1: graus de liberdade

obs : quando n T ~ N (0 ; 1)
T uma varivel aleatria que segue uma distribuio t de "Student", com (n-1) graus de liberdade. Student o pseudnimo de W. S. Gosset que, em 1908, props esta distribuio. T segue uma famlia de distribuies, dependendo do tamanho da amostra.

Assim como Z, T simtrica em torno do zero. Quanto maior o nmero de graus de liberdade, mais a distribuio t(n-1) vai se aproximar da distribuio normal.

IC( ) = xtn1, / 2.

Sx n

4.2.3 - Intervalo de confiana aproximado para a proporo populacional


Seja X uma varivel aleatria que segue uma distribuio binomial; X~ B(n, ). A proporo de sucessos = Para n grande,

X X , estimada na amostra por p = N n

~ N ( = p, =

pq ). n

Intervalo de confiana para: IC( ) = p z / 2.

pq . n

Onde p e q so propores estimadas na amostra.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

59

Exemplo Em uma pesquisa sobre propriedades teratognicas de uma droga, foram observadas 85 camundongos fmeas grvidas que no foram expostas a droga. Do total de 85 ninhadas, 12 tiveram pelo menos 1 filhote com malformao. Apresente o intervalo de confiana de 95% para a verdadeira proporo de malformao na populao de camundongos de onde os 85 que participaram do estudo foram provenientes.

1,96 p
IC(95%) aproximado para a proporo populacional:

q p 12 = p = 0,1412 n = 85

IC(95%)

0,1412 1,96

0,1412 x0,8588 85

(0,067 0,2153)

Exemplo Os dados a seguir so provenientes do grupo Western Collaborative Group Study, criado na Califrnia em 1960-61. Foram estudados 3154 homens de meia idade para investigar a relao entre padres de comportamento e risco de doena coronariana. Os dados apresentados so de 40 homens para os quais foram medidos os nveis de colesterol (mg por 100ml) e realizada uma categorizao segundo comportamento. O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio. O de tipo B relaxado, no competitivo e menos preocupado. Tipo A: nvel de colesterol
233 54 291 276 312 234 250 181 246 248 197 252 268 202 224 218 239 212 239 325

Tipo B: nvel de colesterol


344 226 185 175 263 242 246 252 224 153 212 183 188 137 250 202 148 194 169 213

Medidas(mg/100ml) Mdia Varincia (n-1) Desvio padro (n-1)

Tipo A 245,05 1342,37 36,64

Tipo B 210,3 2336,747 48,33991

Com base nos valores fornecidos, calcule o intervalo de confiana para o nvel mdio populacional de colesterol para cada um dos tipos. Compare os resultados e discuta. IC(95%) para a mdia populacional com desvio padro populacional desconhecido: IC(95%) Tipo A: 245,05 2,093 IC(95%) Tipo B:

x t n1

S n

36,64 20

(227,9 261,2) ;

Questo 27 Em uma pesquisa sobre sade bucal na Inglaterra observou-se que de uma amostra de 262 mulheres com idade entre 25 e 34 anos, 7,6% no tinham dentes. Calcule o intervalo de confiana de 95% para a proporo de mulheres inglesas naquela faixa etria, que no possuem dentes. Questo 28 So apresentadas medidas de presso arterial sistlica de uma amostra aleatria de 20 pacientes. Construa o intervalo de confiana de 90% para a presso sistlica mdia populacional.
98 160 136 125 128 129 130 132 114 154 123 115 134 126 128 132 107 136 123 130

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

60

Valores de mdia e desvio padro das observaes: 128 Mdia ( x ) Desvio padro (Sn-1) 13,91 Questo 29 O grfico abaixo foi extrado e adaptado do artigo: Avaliao da capacidade preditiva da circunferncia da cintura para obesidade global e hipertenso arterial em mulheres residentes na Regio Metropolitana de Belo Horizonte, Brasil de Velasquez-Melendez G et al. (Cad. Sade Pblica, 2002; 18 (3):765-71). Analise os resultados obtidos.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

61

5. Tomada de deciso
Teste de hipteses: um processo de tomada de deciso, com base probabilstica. Duas abordagens: de Neyman e Pearson (clssica) e de Fisher (valor de p) Abordagem de Neyman e Pearson (Jerzy Neyman e Egon Pearson) A deciso tomada sobre hipteses referentes a parmetros da populao de estudo, com probabilidades de erro de deciso fixadas a priori (antes da realizao do estudo). No caso mais simples, tem-se duas hipteses: Hiptese nula H0 HA ou H1 Hiptese alternativa Rejeita-se ou no rejeita-se H0 (aceita-se H0) com base nos resultados da amostra. Est, portanto, sujeita a erro, devido variabilidade inerente ao processo de amostragem. A possibilidade de cometer erro na deciso entre as hipteses medida probabilisticamente, usando-se um modelo adequado (binomial, normal, t de Student, qui-quadrado). Erros possveis na tomada de deciso e probabilidade a eles associada

DECISO (com base na amostra) H0 HA

H0 Correta Errada

VERDADE estado da natureza (populao)

(erro tipo I)

(erro tipo II) correta

HA errada

= Probabilidade (erro tipo I)


= Probabilidade de rejeitar H0 (aceitar HA) quando a verdade H0

= Nvel de significncia do teste = Probabilidade (erro tipo II)


= Probabilidade de aceitar H0 quando a verdade HA

1-= Probabilidade de rejeitar H0 quando H0 falsa (aceitar HA quando HA a verdade) 1-= Poder do teste
Conduta: Antes do experimento, fixa-se Exemplo:

e trabalha-se com o menor possvel.

= Proporo de pacientes com efeitos adversos, no uso de uma droga a ser lanada.
usual= Proporo de pacientes com efeitos adversos a uma droga usual. Espera-se que a droga nova tenha menos efeitos adversos do que a droga usual. <usual, ou seja, <0,6. O experimento para verificar isto leva a um teste de hipteses, da forma: H0: =0,6 HA: <0,6 Podendo ser conduzido por exemplo, com 20 pacientes.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

62

Modelo estatstico - probabilstico: Distribuio binomial de probabilidades, pois, para cada paciente, o resultado da forma, tem efeito adverso/no tem efeito adverso e o resultado de um paciente no influencia os resultados nos outros. Varivel aleatria: N de pacientes com efeitos adversos = K. No de sabe qual das duas hipteses a verdadeira, mas pode-se construir a distribuio de probabilidades de K para o caso de H0 verdadeira. Bin(n=20; =0,6)
K 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 P(K=k|=0,6) 0,000 0,000 0,000 0,000 0,000 0,001 0,005 0,015 0,035 0,071 0,117 0,160 0,180 0,166 0,124 0,075 0,035 0,012 0,003 0,000 0,000

Para se decidir entre H0 e HA, h que se definir um conjunto de valores que levem a esta escolha. Isto feito de forma probabilstica, definindo-se um nvel de significncia (probabilidade de rejeitar H0 mas H0 verdadeira) Tomada de deciso: Se, no experimento, o valor observado de K estiver entre aqueles da regio de rejeio de H0, a hiptese H0 ser rejeitada. H0: =0,6 HA: <0,6, = 5% Para
K 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 P(K=k|=0,6 ) 0,000 0,000 0,000 0,000 0,000 0,001 0,005 0,015 0,035 0,071 0,117 0,160 0,180 0,166 0,124 0,075 0,035 0,012 0,003 0,000 0,000

rea de rejeio de H0 resultados mais compatveis com HA

Resultados mais compatveis com H0

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

63

Realiza-se o estudo e verifica-se que 3 pacientes apresentaram efeitos adversos. QUAL A DECISO?
K 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 P(K=k|=0,6) 0,000 0,000 0,000 0,000 0,000 0,001 0,005 0,015 0,035 0,071 0,117 0,160 0,180 0,166 0,124 0,075 0,035 0,012 0,003 0,000 0,000

= 5%

Qual a deciso se, entre os 20 pacientes, 14 tiverem efeitos adversos?


K 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0,000 0,000 0,000 0,000 0,000 0,001 0,005 0,015 0,035 0,071 0,117 0,160 0,180 0,166 0,124 0,075 0,035 0,012 0,003 0,000 0,000 P(K=k|=0,6)

= 5%

Supor agora que ser lanada uma droga que pode reduzir o peso de pessoas em uma proporo maior do que a droga usual Probabilidade da droga usual = usual = 0,6 Hipteses:

H 0 : = 0,6 ; Teste monocaudal a direita H A : > 0,6 H 0 : = 0,6 ; Teste bicaudal H A : 0,6

Supor agora que ser lanada uma droga que pode, como efeito colateral, tanto reduzir como aumentar o peso de pessoas em uma proporo maior do que a droga usual Hipteses:

Onde est ?

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

64

Supor que se deseja comparar a eficcia de uma nova droga (EN) com eficcia de uma droga antiga (EA). A nova droga foi desenvolvida para ter maior eficcia. Hipteses:

H 0 : EN = E A ; Teste monocaudal a direita H A : EN > E A

Supor que a droga antiga tenha uma eficcia de 50% e que o estudo realizado com uma amostra de 10 pacientes. X: nmero de curas X: 0, 1, 2, 3,..., 10 X~B(n=10; p=0,5) Hipteses:

H 0 : E N = 0,5 H A : E N > 0,5

Valor esperado de curas = np= 10x0,5 = 5 curas Distribuio de probabilidade (sob H0): B(n=10; p=0,5) e 0,05
X (nmero de curas) 0 1 2 3 4 5 6 7 8 9 10 P(X=x) 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 Regio

aceitao de H0

rejeio de H0

Supor que no necessrio uma diferena entre as eficcias EN e EA menor do que 10%, ento supor =0,6
X 0 1 2 3 4 5 6 7 8 9 10 p=0,5 P(X=x) 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 Regio p=0,6 0,000 0,002 0,011 0,042 0,111 0,201 0,251 0,215 0,121 0,040 0,006 Regio

(1 )
aceitao de H0

0,833

rejeio de

(1-

H0 = 0,055

0,167

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

65

Valores de e de 1 para o teste de H0:EN=EP=50% contra H1: EN>50%, quando n=10; 5% (a rigor 5,47%) e 1% (a rigor 1,075%) segundo diferentes valores de EN .
EN 60% 70% 80% 90%

em %
83,27 61,72 32,22 7,02

5%

1 em %
16,73 38,28 67,78 92,98

em %
95,36 85,07 62,42 26,39

1%

1 em %
4,64 14,93 37,58 73,61

Valores de e de 1 para o teste de H0: EN =EP=50% contra H1: EN =60%, quando 5% para diferentes valores de n.
Tamanho da amostra (n) 10 15 20 25 30 35 40 Valor de

mais prximo de 5% 5,5 5,9 5,7 5,4 4,9 4,5 4,0

Valor de

(%)

Valor de

(%)

83,3 78,3 75,0 72,6 70,9 69,4 68,3

16,7 21,7 25,0 27,4 29,1 30,6 31,7

Abordagem de Fisher (Ronald Aylmer Fisher) (clculo do valor de p valor descritivo do teste) Fisher props um mtodo de anlise que tambm envolvia a tomada de deciso e consistia em verificar a probabilidade de ocorrncia de um valor amostral observado ou de um valor mais extremo de uma estatstica, sendo a probabilidade calculada com base em uma curva de probabilidade especificada. Assim se na amostra de 10 pacientes fosse encontrada uma proporo de 65% de curas, Fisher recomendava que se calculasse a probabilidade desta proporo ou um valor mais extremo ocorrer em uma curva com proporo de cura conhecida (como por exemplo, 50%). Se esta probabilidade for pequena conclui-se que possivelmente a droga cura mais do que 50% porque os dados no mostram evidncia de pertencer a uma populao com proporo de cura igual a 50%. Se a probabilidade do valor observado ou de um valor mais extremo pertencer curva especificada, for grande, ento diz-se que os dados provavelmente vm de uma populao que possui como parmetro 50% de curas. Esta probabilidade conhecida como valor de p; ou nvel descritivo do teste e fornecido pelos pacotes estatsticos de anlise de dados. Valor de p= probabilidade de ocorrncia do valor observado ou de um valor mais extremo, em uma curva de probabilidade especificada (conhecida, verdadeira). Fisher dizia que antes de dar uma forma matemtica a um problema, propondo hipteses a serem testadas, era necessrio um amplo conhecimento dos dados, o que poderia ser realizado com base no valor de p. Exemplo: Em uma determinada comunidade, estudos tm apontado que a proporo de mes que amamentam at o 30 ms de 60%. Deseja-se aumentar esta proporo e para tanto, desenvolve-se um programa educativo com a comunidade. Deseja-se saber se, aps o trmino do programa, pode-se considerar que a proporo de mes que amamentam at o 30 ms foi maior do que 60%. Proposio: proporo de mes que amamentam vem de uma populao= 60%

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

66

A idia verificar se aps a campanha, a proporo observada em uma amostra compatvel com 60% (proporo especificada na proposio). Se no for compatvel, pode-se argumentar que a populao que representa a proposio no compatvel com os resultados. Para tanto, realiza-se o estudo que consiste em sortear, aps uma campanha de incentivo ao aleitamento materno, um nmero de mes que deram luz (nos ltimos 12 meses), contar quantas amamentaram at o 30 ms e calcular a proporo. Supor que foram selecionadas 10 mes e destas, 9 amamentaram at o 30 ms. Como vamos decidir se o programa teve efeito ou se este resultado foi somente um artifcio da amostra selecionada? Ou seja, devido ao acaso? Para decidir calcula-se a probabilidade de pelo menos 9 mes amamentarem se elas tivessem vindo de uma populao onde 60% das mes amamentam. Clculo da probabilidade de ocorrer 9 ou mais mes em uma populao com 60% de amamentao. Definio da distribuio de probabilidade: Amamentar uma varivel dicotmica (amamenta ou no) A probabilidade de amamentar conhecida = 0,6 ; Amamentar exclui no amamentar (eventos mutuamente exclusivos); O comportamento de uma me no interfere no comportamento de outra (eventos independentes); O tamanho da amostra conhecido, n=10; possvel definir a varivel X: nmero de mes que amamentam, que assume os valores x: 0,1, 2, ..., 10. Distribuio de probabilidade Binomial com parmetros n=10 e = 0,6 . Clculo da probabilidade: Observou-se que 9 mes, do total de 10, amamentaram seus filhos at o 30 ms. Se com 9 mes amamentando conclumos que o programa foi eficiente, com 10 mes tambm seria. Portanto, calcula-se a probabilidade de 9 ou mais mes amamentarem, se elas tivessem vindo de uma populao onde 60% amamenta. Pela distribuio Binomial, (n=10; = 0,6 ), obtm-se

P( X 9) = P( X = 9) + P( X = 10) = 0,040 + 0,006 = 0,046 ou 4,6%


Valor de p=4,6% A probabilidade de observar 9 ou mais mes amamentando, se elas tivessem vindo de uma populao de mes que 60% amamentam 4,6%. Os resultados observados so compatveis com a proposio de que as mes vm de populao que amamenta 60%? Em outras palavras, com base nos resultados, voc diria que existe evidncia de que estas mes vm de uma populao onde 60% amamenta o perodo recomendado? Se p for considerado, pelo investigador, pequeno diz-se que os dados observados mostram evidncia favorvel campanha. A proporo de mes que amamentaram, depois da campanha mais compatvel com a populao de mes em uma populao onde uma proporo maior do que 60% amamenta. Se p for considerado grande, pelo investigador, diz-se que os dados no mostram evidncia desfavorvel proposio e portanto, a campanha no surtiu efeito. A diferena observada na amostra no ocorreria na populao. O julgamento sobre o valor de p, se grande ou pequeno, arbitrrio e quem decide o investigador.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

67

5.1- Teste de hiptese de uma proporo populacional


Abordagem de Neyman e Pearson Supor a situao onde um fabricante quer lanar um bolo mais doce do que est no mercado (cdigo 15). Para tanto desenvolvido um novo produto (cdigo 23). O estudo consiste em oferecer uma fatia de cada produto a 20 degustadores e contar quantos acham o produto novo mais doce. O investigador fixa o nvel de significncia em 5% ( = 0,05 ). No teste comparao de par, direcionada, o nmero K de degustadores que achou o bolo com cdigo 23 mais doce foi k= 8. Pode-se admitir que os bolos diferem quanto doura? Se os bolos no forem diferentes quanto ao sabor, metade dos degustadores vai escolher um produto e a outra metade vai escolher o outro. Probabilidade de escolher o cdigo 15 = 0,5

H 0 : = 0,5 H A : > 0,5


Distribuio de probabilidade: X: nmero de degustadores que escolhem o produto novo. X:0, 1, 2,...,18, 19, 20 Cada degustador escolhe o produto independente do outro degustador e se for feita a escolha por um produto (eventos independentes), o outro fica eliminado (mutuamente exclusivos). X~B(n=20; p=0,50)
X 0 1 2 3 . . . 13 14 15 16 17 18 19 20 P(X=x) Regio do teste

0,03696 0,01479 0,00462 0,00109 0,00018 0,00002 0,00000

= 0,058

Rejeio de H0

Como k=8, toma-se a deciso de no rejeitar H0. Pode-se dizer que os produtos so semelhantes quanto ao sabor adocicado, para um nvel de significncia de 5%. Abordagem de Fisher Proposio: Proporo de degustadores que escolhem cdigo 15=0,5 n=20 K:nmero de degustadores que escolhem cdigo 15 K:0, 1, 2, ..., 20 K~B(n=20; p=0,5) Observou-se que 8 degustadores escolheram cdigo 23 (k=8). Valor de p=probabilidade de ocorrer 8 ou um valor mais extremo, se os dados vierem de uma populao que escolhe os produtos em propores iguais. Valor de p= P(K8) = P(k=8)+P(k=9)+...+P(k=20)= 0,868 ou 86,8%.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

68

Conclui-se que os dados mostram evidncia favorvel proposio sendo possivelmente provenientes de uma populao que escolhe igualmente os cdigos 15 e 23. O novo produto no foi considerado mais doce que o antigo. OBS: Como np=10 e nq=10, para o clculo de p poderia ter sido utilizada a distribuio normal.

K ~ N ( = np = 20 x0,5 = 10; = npq = 20 x0,5 x0,5 = 2,24 7,5 10 P( K 8) = P( Z ) = P( Z 1,12) = 0,5+0,36864=0,86764 ou 86,8% 2,24
Questo 30 Em um julgamento jurdico o jri tem que decidir sobre a culpa ou inocncia de um ru. Considere dois fatos: 1) o sistema jurdico admite que toda pessoa inocente at que se prove o contrrio. 2) s vai a julgamento pessoas sobre as quais existe dvida de sua inocncia. Fazendo uma analogia com teste de hipteses, responda a) Apresente as hipteses nula e alternativa sobre a culpa ou inocncia do ru; b) O jri pode errar se decidir que o ru culpado quando na verdade ele inocente; qual o outro erro de deciso que o jri pode cometer? c) Qual dos dois erros o mais srio? d) Na terminologia de teste de hiptese, qual tipo de erro (I ou II) pode-se vincular a cada uma das decises do item b? Questo 31 Quando um diagnstico mdico fornecido, qual dos erros geralmente mais srio: um resultado falso positivo que diz que a pessoa tem a doena quando na verdade ela no tem ou um resultado falso negativo, que diz que a pessoa no tem a doena quando na verdade ela tem? Imagine duas situaes: 1) a pessoa est fazendo parte de um screening para cncer de mama. 2) a pessoa realiza o teste para detectar anticorpos anti-HIV. Questo 32 Com base na questo anterior a) Apresente as hipteses nula e alternativa sobre a situao de sade do paciente; b) Que tipo de erro (I ou II) seria cometido se o resultado do teste fosse falso positivo? c) Que tipo de erro (I ou II) seria cometido se o resultado do teste fosse falso negativo?

Questo 33 Um estudo foi desenvolvido para investigar se aleitamento materno um fator que protege a criana contra diabetes, em idades maiores. Considerando H0: aleitamento materno no protege contra diabetes e Ha: aleitamento materno protege contra diabetes, responda a) Tomando qual deciso (aceitar ou rejeitar) sobre H0 voc poderia estar cometendo o erro tipo I? b) Tomando qual deciso (aceitar ou rejeitar) sobre H0 voc poderia estar cometendo o erro tipo II? c) Como denominada a probabilidade de ocorrer o erro tipo I? d) Como denominada a probabilidade de ocorrer o erro tipo II? e) O que o poder do teste? f) Se voc fosse fixar valores de probabilidades associadas ocorrncia dos erros tipo I e II para este estudo, qual deles seria menor? Justifique. Questo 34 Supor o experimento onde existe interesse em investigar se o odor de determinado alimento atrai camundongos. O experimento consiste em colocar um animal em um corredor que no final dividido para a direita e para a esquerda. O alimento colocado no final do corredor da esquerda, fora da viso do animal. Entretanto, antes da realizao do experimento, decide-se eliminar a possibilidade de incluir no estudo

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

69

camundongos que tm predileo por um lado, independentemente do odor do alimento. Neste caso, decide-se investigar inicialmente se os camundongos escolhem os lados em propores iguais. Para tanto, realiza-se o experimento com 12 camundongos sem a colocao do alimento e verifica-se que 7 viram para a esquerda. a) realize um teste de hipteses segundo o modelo clssico de Newman e Pearson, com nvel de significncia =5%, para verificar se os camundongos vm de uma populao que escolhe mais um lado do que o outro;

b) realize um teste de hipteses seguindo a proposta de Fisher, com clculo do valor descritivo do teste, para verificar se os camundongos vm de uma populao que escolhe mais um lado do que o outro.

Questo 35 Supor, agora, o experimento para investigar se o odor de determinado alimento atrai camundongos. Realiza-se o experimento colocando o alimento no final do corredor da esquerda, fora da viso dos camundongos.Observa-se que de 12 camundongos, 10 viram para a esquerda. a) realize um teste de hipteses segundo o modelo clssico de Neyman e Pearson, com nvel de significncia =5%, para verificar se os camundongos vm de uma populao que escolhe mais o lado onde est o alimento;

b) realize um teste de hipteses seguindo a proposta de Fisher, com clculo do valor descritivo do teste, para verificar se os camundongos vm de uma populao que escolhe mais o lado onde est o alimento.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

70

5.2 Teste de hipteses de uma mdia populacional ( ) (com varincia conhecida e desconhecida) 5.2.1 - Reviso de conceitos bsicos
Distribuio Normal Medindo-se a altura de muitas mulheres (populao), obtm-se o grfico a seguir.
.35 .3 .25 .2 .15 .1 .05 0 140 145 150 155 160 Altura(cm) 165 170 175 180 proporo

Aos dados pode ser ajustada uma curva terica


.35 .3 .25 .2 .15 .1 .05 0 140 145 150 155 160 Altura (cm) 165 170 175 180 proporo

A curva ajustada aos dados uma curva terica (curva de Gauss) que representa a altura de mulheres idosas. X: altura, X ~ N (m = 160, = 10) A curva tem propriedades conhecidas: - Soma da rea sob a curva igual a 1 ou 100%; - Pode-se calcular probabilidade trabalhando-se com a rea sob a curva; - Sorteia-se uma mulher ao acaso; P(desta mulher ter mais de 160) = 50%;

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

71

P(esta mulher tenha mais de 180)= P ( X > 180) = P ( Z > 2,3%

180 160 ) = P( Z > 2) =0,5-0,47725=0,02275 ou 10

Sortear uma mulher com altura 180 ou mais desta populao uma coisa comum? P(esta mulher tenha mais de 170)=

P ( X > 170) = P ( Z >

170 160 ) = P ( Z > 1) = 0,5-0,34134 = 0,15866 ou 15,9% 10

Sortear uma mulher com altura 170 ou mais desta populao uma coisa comum? O limite para decidir o que comum arbitrrio. O investigador que decide, com base no problema que est sendo estudado. Supor agora uma outra distribuio de altura, por exemplo, entre homens.
proporo

.35 .3 .25 .2 .15 .1 .05 0 160

165

170

175 180 Altura (cm)

185

190

195

200

X: altura, X ~ N (m = 180, = 10) P(homem tenha mais de 180)= P(X>180)=0,5 ou 50% Supor que as pessoas da primeira curva tenham uma marca vermelha e as pessoas da segunda curva tenham uma marca azul. Misturam-se todas as pessoas e sorteia-se uma pessoa ao acaso e ela tem altura 180. De qual populao seria este indivduo? Agora no estamos mais interessados em um indivduo e sim em vrios indivduos portanto, vamos trabalhar com a altura mdia. Supor X: altura, X ~ N (m = 160, = 20) . Toma-se uma amostra de tamanho n=30 desta populao e calcula-se a altura mdia ( x = 170 ). Deseja-se saber a probabilidade desta amostra vir de populao com altura mdia maior ou igual a 170.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

72

m=160

170

Pelo Teorema do Limite Central


170 160 170 160 ) = P(Z X > ) = P( Z > 2,74) 20 3,6515 30 Na curva da Normal reduzida tem-se P( X > 170) = P( X m >

m=0

2,74

ZX

=0,5- 0,49693 = 0,0031 ou 0,31% Sortear uma amostra que apresenta altura mdia igual a 170 cm ou mais da populao que tem altura mdia 160 cm uma coisa comum? Para decidir se a amostra representa uma populao com altura mdia maior e que o resultado no devido ao acaso, realiza-se o teste de hipteses.

5.2.2 - Teste de hipteses para uma mdia populacional com varincia conhecida
Abordagem de Fisher: Situao: Estudos mostram que crianas sadias possuem peso mdio (m) ao nascer igual a 3100 gramas e desvio padro = 610gramas . Suspeita-se que crianas que nascem com sndrome de desconforto idioptico grave possuem peso ao nascer abaixo do peso ao nascer da populao de crianas sadias.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

73

Proposio: Crianas com sndrome vm de uma populao com peso mdio =3100 gramas Realiza-se um estudo em uma amostra de n=50 crianas que nasceram com esta sndrome, onde observouse peso mdio ( x ) igual a 2800 gramas. Supondo-se que as crianas da amostra (com sndrome) vm de uma populao com mesma disperso do peso ao nascer de crianas sadias, teste a hiptese de que crianas com sndrome idioptica grave possuem peso mdio ao nascer igual ao peso mdio ao nascer de crianas sadias. Distribuio de probabilidade: Distribuio do peso mdio: segue uma distribuio normal com mdia m=3100 gramas e desvio padro

610 = = 86,27 gramas n 50

2800

m=3100

Clculo da probabilidade de observar um peso mdio ao nascer igual ou menor que 2800 se H0 for verdade.

P ( X < 2800) = P (

X m

<

2800 3100 300 ) = P ( Z X < 3,48) ) = P(Z X < 610 86,27 50

-3,48

m=0

ZX

Pela distribuio Normal reduzida tem-se que P( Z < 3,48) = 0,5 0,49975 = 0,00025 ou 0,025% Os resultados no so compatveis com uma distribuio que tem peso mdio igual a 3100. Possivelmente a amostra vem de uma populao com mdia menor que 3100. Pode-se dizer que crianas com sndrome de desconforto idioptico grave possivelmente possuem peso ao nascer menor do que o peso mdio de crianas sadias.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

74

5.2.3 - Teste de hipteses para uma mdia populacional com varincia desconhecida
Abordagem de Fisher: Supor a mesma situao anterior, s que neste caso somente a mdia populacional conhecida. O peso mdio de crianas sadias (m) igual a 3100 gramas. Proposio: Crianas com sndrome de desconforto idioptico grave vm de uma populao com peso mdio =3100 gramas Seleciona-se uma amostra de 50 crianas com a sndrome e calcula-se o peso mdio e o desvio padro do peso, obtendo-se n=50; x = 2800 e s=510 Distribuio de probabilidade: Distribuio do peso mdio ao nascer de crianas sadias: como no se sabe o desvio padro populacional, este estimado utilizando-se os dados da amostra. Neste caso a varivel a varivel segue uma distribuio t de Student com n-1=50-1=49 graus de liberdade.
P( X < 2800) = P( 300 X m 2800 3100 < ) = P(t X < ) = P(t X < 4,159) 510 SX 72,12 50

-4,16

m=0

Pela distribuio t de Student com 49 graus de liberdade, tem-se P(t X < 4,159) < 0,05% Os resultados no so compatveis com uma distribuio que tem peso mdio igual a 3100. Pode-se dizer que crianas com desconforto idioptico grave provavelmente vm de uma populao com peso mdio ao nascer menor do que o peso mdio ao nascer de crianas sadias. Questo 36 Uma companhia de produtos alimentcios utiliza uma mquina para embalar salgadinhos cujas embalagens especificam 454gramas. Com o propsito de verificar se a mquina est trabalhando corretamente, selecionou-se 50 pacotes de salgadinhos, obtendo-se os seguintes valores de peso:
464 442 448 463 468 450 438 450 449 447 450 452 439 447 433 456 447 452 466 464 452 460 459 446 469 433 450 454 447 457 446 453 456 450 454 446 456 454 449 451 450 446 452 457 453 447 433 449 464 443

mdia da amostra, x =451,22 gramas e desvio padro amostral, s=8,40 gramas Testar a hiptese de que a mquina est trabalhando corretamente. Utilizar o valor de p para tomada de deciso Questo 37
FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

75

O nvel mdio de protombina em populaes normais 20 mg/100ml de sangue. Em uma amostra de 40 pacientes que tinham deficincia de vitamina K foram observadas as estatsticas: nvel mdio de protombina de 18,5mg/100ml e desvio padro 4mg/100ml. Seria razovel concluir que a verdadeira mdia de pacientes com deficincia de vitamina K a mesma que a da populao normal? Realize um teste de hipteses segundo a abordagem de Fisher para responder a pergunta.

5.3 - Teste de hipteses de associao pelo Qui-quadrado de Pearson (2)


O Qui-quadrado obtido somando-se a diferena ao quadrado entre as freqncias observadas e as esperadas, dividido pelas freqncias esperadas.

(O E) 2 = E
2

Se o Qui-quadrado for igual a zero, ento no existe associao entre as variveis. Quanto maior o valor do Qui-quadrado, maior a chance de existir associao entre as variveis, entretanto, o Qui-quadrado no mede fora de associao. Distribuio Qui-quadrado ( ( n 1) ) com (n-1) graus de liberdade
2

Seja uma populao com distribuio normal N ( , ) . Se desta populao se obtiver um nmero infinito de amostras de tamanho n, calculando-se as quantidades x e S2 em cada amostra, a varivel aleatria

(n 1) S 2

~ (2n 1) , onde (2n 1) se l "qui-quadrado com n-1 graus de liberdade" (Berqu, 1981).

A distribuio Qui quadrado assimtrica e se torna menos assimtrica a medida que os graus de liberdade aumentam. Os valores da distribuio so sempre positivos (maior ou igual a zero). Existe uma famlia de distribuies qui quadrado, dependendo do nmero de graus de liberdade. Para grandes amostras, a distribuio qui quadrado tende para uma distribuio normal.

Teste de hipteses de associao pelo Qui-quadrado de Pearson (2)

H 0 : No existe associao
Estatstica do teste:

Qui quadrado =

onde r e c representam o nmero de linhas e de colunas, respectivamente Correo de continuidade:

(O E ) 2 ~ (2r 1)( c1) E

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

76

Qui quadradocorrecao de Yates =

(| O E | 0,5) 2 ~ (2r 1)( c1) E

Limitaes: Para n<20, utilizar o teste exato de Fisher Para 20 n 40 , utilizar o Qui-quadrado somente se os valores esperados forem maiores ou iguais a 5 Exemplo: Com o objetivo de investigar a associao entre histria de bronquite na infncia e presena de tosse diurna ou noturna em idades mais velhas, foram estudados 1.319 adolescentes com 14 anos. Destes, 273 apresentaram histria de bronquite at os 5 anos de idade sendo que 26 apresentaram tosse diurna ou noturna aos 14 anos. Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou noturna aos 14 anos de idade. Local X, ano Y. Bronquite Tosse Sim No Total Sim 26 44 70 No 247 1002 1249 Total 273 1046 1319 Fonte: Holland, WW et al, 1978. Valores observados (O) 26 247 44 1002 p
no corrigido=0,0004829

Valores esperados (E) 14,488 258,512 55,512 990,488

(O-E) 11,512 -11,512 -11,512 11,512

(O-E)2 132,526 132,526 132,526 132,526 Qui-quadrado=

(O E ) 2 E
9,147 0,513 2,387 0,134 12,181

Questo 38 Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo condio de sobrevivncia e peso ao nascer (g) Peso ao nascer bito Sobrevida Total Baixo peso (<2500) 24 13 37 No baixo peso (2500 e mais) 3 10 13 Total 27 23 50 Fonte: Hand DJ et al., 1994. Com base nos dados apresentados na tabela realize o teste de hiptese para investigar a existncia de associao entre o peso do recm-nascido e a condio de sobrevivncia.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

77

Questo 39 Defeitos do tubo neural so malformaes congnitas que surgem durante o desenvolvimento fetal. conhecida como spina bfida. Estes dados so de um estudo conduzido no pas de Gales Reino Unido, para investigar possvel associao entre defeitos do tubo neural e dieta materna. O estudo do tipo casocontrole: mes que tinham tido bebs com defeitos do tubo neural (casos) e suas irms que no tinham tido (controles) foram avaliadas segundo suas dietas e classificadas em boa, razovel e ruim. Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural; controle recmnascidos que no tinham defeitos do tubo neural e dieta materna. Dieta Casos Controles Total n % n % n % Boa 34 13,9 43 35,0 77 21,0 Razovel 110 45,1 48 39,0 158 43,0 Pobre 100 41,0 32 26,0 132 36,0 Total 244 100 123 100 367 100 Com base nos dados apresentados na tabela realize o teste de hiptese para investigar existncia de associao entre as variveis. Questo 40 A tabela apresenta dados de classificao de pessoas segundo doena coronariana (DIC) e hbito de consumo de caf, para uma coorte de 1718 homens com idade 40-55 anos. Distribuio de homens segundo consumo de caf e incidncia de doena coronariana (DIC). Consumo mdio de caf condio Alto (>=100 xcaras/ms) Moderado (<100 xcaras/ms) Com DIC 38 39 Sem DIC 752 889 total 790 928

total 77 1641 1718

Com base nos dados apresentados na tabela realize o teste de hiptese para associao entre consumo de caf e doena coronariana.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

78

6. Bibliografia
Berqu ES; Souza JMP. e Gotlieb SLD. Bioestatstica. EPU, So Paulo, 1981. Caldas ED, Silva SC, Oliveira JN. Aflatoxinas e ocratoxina A em alimentos e riscos para a sade humana. Rev. Sade Pblica, 2002;36(3):319-23. Carvalho AT, Costa MJC, Ferreira LOC, Batista Filho M et al. Cartografia do retardo estatural em escolares do estado da Paraba. Brasil. Rev Sade Pblica 2000;34(1):3-8. Chambers JM, Cleveland WS, Kleiner B, Tukey PA. Graphical methods for data analysis. Wadsworth & Brooks/Cole Publishing Company, Advanced Books & Software. Pacific Grove, California, 1983. Corra Filho HR, Vieira JBF, Silva YS, Coelho GE, Cavalcante FAC, Pereira MP. Inqurito sobre a prevalncia de bcio endmico no Brasil em escolares de 6 a 14 anos: 1994 a 1996. Rev Panam Salud Publica 2002;12(5):317-325. Daly F, Hand DJ, Jones MC, Lunn AD, McConway KJ. Elements of Statistics, 1999. Dixon WJ e Massey FJ. Introduction to Statistical Analysis. 2nd edit. The Maple Press Company, York, 1957. Escosteguy CC, Medronho RA, Madruga R et al. Vigilncia epidemiolgica e avaliao da assistncia s meningites. Rev. Sade Pblica, 2004;38(5):657-63. Fornes IS, Martins IS, Velasques-Melendez G et al. Escores de consumo alimentar e nveis lipmicos em populao de So Paulo, Brasil. Rev. Sade Pblica, 2002;36(1):12-8. Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994. Holland WW, Bailey R, Bland JM. Long-term consequences of respiratory disease in infancy. Journal of Epidemiology and Community Health 1978;32: 256-9. Kummer SC, Giugliani ERJ, Susien LO et al. Evoluo do padro de aleitamento materno. Rev de Sade Pblica, 2000;34(2):143-8. Lerario DG, Gimeno SG, Franco LJ et al. Excesso de peso e gordura abdominal para a sndrome metablica em nipo-brasileiros. Rev. Sade Pblica, 2002;36(1):4-11. Monteiro CA, Benicio MHDA, Ortiz LP. Tendncia secular do peso ao nascer na cidade de So Paulo (19761998) Rev. Sade Pblica; 2000:34(6, supl):26-40. Monteiro CA, Szarfarc SC, Mondini L. Tendncia secular da anemia na cidade de So Paulo (1984-1996). Rev. Sade Pblica, 2000; 34(6, sup):62-72. Monteiro POA, Victora CG, Barros F et al. Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critrios para o ndice de Massa Corporal. Rev. Sade Pblica, 2000;34(5):50613. Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979. Otero UB, Rozenfeld S, Gadelha AMJ et al. Mortalidade por desnutrio em idosos, regio Sudeste do Brasil, 1980-1997. Rev. Sade Pblica, 2002;36(2):141-8. Prado MS, Assis AMO, Martins MC, Nazar MPA, Rezende IFB, Conceio MEP. Hipovitaminose A em crianas de reas rurais do serto semi-rido baiano. Revista de Sade Publica, 1995;29(4):295-300. Soares JF, Siqueira AL. Introduo Estatstica Mdica, COOPMED, 2002.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

79

Souza Jnior PRB, Szwarcwald CL, Barbosa Junior A et al. Infeco pelo HIV durante a gestao: EstudoSentinela Parturiente, Brasil, 2002. Rev. Sade Pblica, 2004:38(6):764-72. Triola MF. Introduo Estatstica. LTC Livros Tcnicos e Cientficos Editora, 1999. Tuyns AJ, Pequignot G, Jensen OM. Esophageal cancer in Ille-et-Vilaine in relation to levels of alcohol and tobacco consumption. Risks are multiplying. Bull Cancer 1977;64:45-60. van Vliet PKJ e Gupta JM. THAM v. sodium bicarbonate in idiopathic respiratory distress syndrome. Archives in Disease in Childhood, 1973;48:249-55. Velasquez-Melendez G, Kac G, Valente JG et al. Avaliao da capacidade preditiva da circunferncia da cintura para obesidade global e hipertenso arterial em mulheres residentes na Regio Metropolitana de Belo Horizonte, Brasil. Cad. Sade Pblica, 2002;18(3): 765-771.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

80

7. Resumos dos artigos citados


CALDAS, Eloisa Dutra, SILVA, Saulo Cardoso e OLIVEIRA, Joo Nascimento. Aflatoxinas e ocratoxina A em alimentos e riscos para a sade humana. Rev. Sade Pblica, jun. 2002, vol.36, no.3, p.319-323. OBJETIVOS: A presena de micotoxinas em alimentos tem sido correlacionada a vrias patologias humanas, e as autoridades de sade no mundo todo tm implementado aes para diminuir a ingesto desses compostos pela dieta. Realizou-se pesquisa para analisar os nveis de aflatoxinas e ocratoxina A de alimentos para consumo e avaliar o potencial de risco da exposio humana a essas micotoxinas. MTODOS: Foram analisadas 366 amostras de alimentos consumidos no Distrito Federal, no perodo de julho de 1998 a dezembro de 2001, como amendoim e derivados, castanhas, milho, produtos de trigo e/ou aveia, arroz e feijo. As amostras foram processadas, e as micotoxinas extradas, detectadas e quantificadas por fluorescncia aps separao em cromatografia camada delgada. RESULTADOS: Foram detectadas aflatoxinas em 19,6% das amostras, em amendoim cru e derivados, milho de pipoca, milho em gro e castanha-do-par (>2 g/kg). Amendoim e derivados apresentaram maior incidncia de contaminao por aflatoxinas (34,7%) com amostras contendo at 1.280 g/kg de AFB1+AFG1 e 1.706 g/kg de aflatoxinas totais. Das amostras positivas, AFB1 estava presente em 98,5%, AFB2 em 93%, AFG1 em 66,7% e AFG2 em 65,4%. A ocratoxina A no foi detectada (<25 g/kg) em nenhuma amostra analisada. CONCLUSO: Os nveis de contaminao encontrados em amendoim e derivados ultrapassaram os nveis mximos permitidos pela legislao brasileira, podendo significar fator de risco para a populao que os consome regularmente. A conscientizao dos produtores de alimentos e as aes de vigilncia sanitria permanentes so essenciais para diminuir a exposio humana a esses compostos e prevenir doenas crnicas advindas dessa exposio. Palavras-chave: Aflatoxinas; Ocratoxinas; Anlise de alimentos; Contaminao de alimentos; Vigilncia sanitria; Amendoim; Milho.

CARVALHO, Alice T, COSTA, Maria JC, FERREIRA, Luiz OC et al. Cartografia do retardo estatural em escolares do Estado da Paraba, Brasil. Rev. Sade Pblica, fev. 2000, vol.34, no.1, p.3-8. ISSN 00348910. OBJETIVO: Parte de um projeto promovido pelas Naes Unidas (FAO) e pelo Ministrio da Educao do Brasil (Fundao de Assistncia ao Escolar) para estudar a condio nutricional de alunos de educandrios pblicos, visa a avaliar, com um enfoque cartogrfico, a magnitude e a distribuio espacial do dficit estatural de alunos de escolas pblicas do Estado da Paraba. MTODOS: Fez-se levantamento de carter censitrio da estatura de 50.144 escolares com idade de 6 a 9 anos, matriculados na primeira srie do primeiro grau de todos municpios do Estado da Paraba, considerando-se como dficit estatural os valores classificados abaixo de -2 "scores" z do padro do National Center of Health Statistics. RESULTADOS: Em todo o Estado, 14,5% dos escolares foram considerados casos de nanismo, com uma distribuio heterognea para as quatro mesorregies fisiogrficas estudadas: 18,7% no Serto, 13,8% no Agreste, 11,9% na Borborema e 10,9% na Zona da Mata. Nas escolas da rea rural, 17,8% dos alunos apresentavam dficit estatural, enquanto no meio urbano a prevalncia de nanismo foi de 11,8%. CONCLUSES: Os dados encontrados so indicativos de um processo de interiorizao da desnutrio, contrastando substancialmente com as descries histricas sobre a cartografia do problema na regio. Palavras-chave: Estatura; Inquritos nutricionais; Distribuio espacial; Transtornos nutricionais; Nanismo nutricional. Correa Filho HR, Vieira JB, Silva YS, Coelho GE, Cavalcante Fdos A, Pereira Mda P. Endemic goiter prevalence survey in Brazilian schoolchildren 6 to 14 years old, 1994-1996. Rev Panam Salud Publica. 2002 Nov;12(5):317-26. OBJECTIVE: To determine the national and state-level prevalence of endemic goiter associated with iodine deficiency in schoolchildren between 6 and 14 years of age in Brazil, based on data from a national survey carried out from 1994 to 1996. MATERIALS: Thyroid inspection and palpation were performed on 178,774 schoolchildren between 6 and 14 years of age, in all the states of Brazil. A subsample was selected to

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

81

measure the iodine content in their urine as well as the iodine content of the table salt used for cooking in their homes. RESULTS: The last survey before this one was carried out in 1975. We found an 86% decrease in the median prevalence of grade 1 and 2 grade 2 goiter, from 12% to 1%. In 21% of the municipalities, the observed prevalence was zero. From the 16,803 urine samples collected for iodine measurement, 7,702 were matched with the corresponding clinical record (a loss of 54%). The median urinary iodine level was 14.0 micrograms/dL, and without a significant correlation with the clinical data on goiter. The median iodine excretion level for the population in the states of Acre, Amapa, and Tocantins was equal to or below 9.0 micrograms/dL. In three municipalities, urinary iodine was below 2.5 micrograms/dL in all the samples: Parana (in the state of Tocantins), Conceicao (Paraiba), and Nova Roma (Goias). The supplementary iodine found in the salt collected from households (458 samples collected) was below recommended levels, with 50% of them below 20 mg/kg (20 ppm). In 7% of the samples, the level of iodine was below 10 mg/kg of salt, even in salt-producing states such as Rio Grande do Norte. CONCLUSIONS: There is evidence goiter is expanding to parts of Brazil that more recently have been opened up for agriculture, with children in those areas being exposed to low levels of supplementary iodine in the salt used for cooking. We found an increased risk of goiter in areas with deficient iodine supplementation (< 10 mg/kg) (odds ratio = 1.85; Cornfield 95% confidence interval: 1.68-2.03).

ESCOSTEGUY, Claudia Caminha, MEDRONHO, Roberto de Andrade, MADRUGA, Roberto et al. Vigilncia epidemiolgica e avaliao da assistncia s meningites. Rev. Sade Pblica, out. 2004, vol.38, no.5, p.657-663. ISSN 0034-8910. OBJETIVO: Analisar o perfil clnico-epidemiolgico dos casos de meningite internados em hospital pblico e os fatores associados evoluo hospitalar. MTODOS: Foram analisados 694 casos confirmados, notificados e investigados pelo servio de epidemiologia de um hospital pblico de 1986 a 2002. Os dados foram coletados do Sistema de Informao de Agravos de Notificao (Sinan), como parte da rotina local de vigilncia epidemiolgica. Foi realizada anlise multivariada por regresso logstica. RESULTADOS: Etiologias mais freqentes: criptoccica (12,3%; letalidade =37,7%); meningoccica (8,7%; letalidade =13,3%); pneumoccica (7,2%; letalidade =46%); tuberculosa (6,1%; letalidade =40,5%); estafiloccica (5,2%; letalidade =38,9%), viral (5,5%; letalidade =7,9%); hemfilo (2,9%; letalidade =20%). 38,8% dos casos apresentavam etiologia no especificada (letalidade =36%) e 17,3% estavam associados infeco pelo HIV. Observou-se meningite hospitalar em 27,1% e seqelas em 9,2% dos casos com alta hospitalar. Variveis associadas a uma maior chance de bito: etiologia (referncia viral) - tuberculose, criptococo, estafilococo, meningococo, no especificada, outros gram negativos, cndida e pneumococo; infeco pelo HIV; coma. A trade febre, vmitos e rigidez de nuca associou-se a uma menor chance de bito. CONCLUSES: A elevada proporo de etiologia no especificada e letalidade alta podem refletir problemas de processo de assistncia e/ou seleo dos casos relacionada ao perfil do hospital. A vigilncia epidemiolgica operante no nvel hospitalar foi capaz de retro-alimentar os servios com indicadores da assistncia, sendo pertinente o uso do Sinan neste nvel. Palavras-chave: Meningite [epidemiologia]; Sistemas de informao; Notificao de doenas; Vigilncia epidemiolgica; Meningite [etiologia]; Meningite [mortalidade]; Pacientes internados.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

82

Holland WW, Bailey R, Bland JM. Long-term consequences of respiratory disease in infancy. Epidemiol Community Health. 1978 Dec;32(4):256-9. In a study of Kent schoolchildren it has been shown that those who had a history of bronchitis under the age of five were more likely to have reported respiratory symptoms as the age of 11 (Bland et al., 1974). After this finding, it was necessary to test whether these differences would continue or diminish as the children grew older. One thousand three hundred schoolchildren in four areas of Kent were studied by physical examination and parental questionnaire at the ages of 5, 11, and 14. The relative risk of having reported respiratory symptoms for children with a history of early bronchitis, asthma, or pneumonia, compared with other children, was the same at the age of 14 as it was at the age of 11. These relationships could not be explained by social class effects, and were probably not due to parental bias in reporting.

KUMMER, Suzane C, GIUGLIANI, Elsa RJ, SUSIN, Lulie O et al. Evoluo do padro de aleitamento materno. Rev. Sade Pblica, abr. 2000, vol.34, no.2, p.143-148. ISSN 0034-8910. OBJETIVO: Acompanhar a evoluo da prtica do aleitamento materno na clientela de maternidade e avaliar as aes para sua promoo. MTODOS: Foram comparadas duas coortes de crianas nascidas em pocas diferentes em hospital de Porto Alegre, RS, quanto s prevalncias do aleitamento materno nos primeiros seis meses de vida das crianas bem como as taxas de interrupo precoce da amamentao. Os dois estudos foram prospectivos, envolvendo 202 crianas na coorte de 1987 e 187 na de 1994, todas saudveis, com peso de nascimento igual ou superior a 2.500 g, tendo iniciado o aleitamento materno e cujos pais morassem juntos. O acompanhamento foi realizado atravs de correspondncia, no estudo de 1987, e de visitas domiciliares, no estudo de 1994. RESULTADOS: As curvas de sobrevida do aleitamento materno revelaram que o percentual de crianas amamentadas ao longo dos primeiros seis meses foi semelhante nas duas coortes. A prevalncia do aleitamento materno exclusivo, apesar de baixa nos dois grupos, foi superior na populao de 1994, especialmente entre as crianas cujas mes tinham maior escolaridade. No houve diferena no ndice de interrupo precoce entre as duas coortes (36% na coorte de 1987 e 39% na de 1994). CONCLUSES: Os resultados apontam para uma apatia do servio com relao promoo do aleitamento materno no perodo estudado, justificando plenamente o investimento na promoo da amamentao, especialmente nas famlias menos privilegiadas. Palavras-chave: Aleitamento materno; Desmame; Promoo da sade; Fatores socioeconmicos; Maternidades; Leite humano; Lactao.

LERARIO, Daniel D G, GIMENO, Suely G, FRANCO, Larcio J et al. Excesso de peso e gordura abdominal para a sndrome metablica em nipo-brasileiros. Rev. Sade Pblica, fev. 2002, vol.36, no.1, p.4-11. ISSN 0034-8910. OBJETIVO: A obesidade, especialmente de distribuio abdominal, associa-se a fatores de risco cardiovasculares como a dislipidemia, a hipertenso arterial (HA) e o diabetes mellitus (DM). A importncia desses fatores em nipo-brasileiros foi previamente demonstrada, apesar de a obesidade no ser caracterstica marcante dos migrantes japoneses. Realizou-se estudo com o objetivo de avaliar a prevalncia de excesso de peso e a adiposidade central (AC) em nipo-brasileiros e suas relaes com distrbios metablicos. MTODOS: A amostra incluiu 530 nipo-brasileiros (40-79 anos) de primeira e segunda geraes, submetidos a medidas antropomtricas de presso arterial, perfil lipdico e teste oral de tolerncia glicose. A prevalncia (por ponto e intervalo de confiana) de excesso de peso foi calculada pelo valor de corte >26,4 kg/m2. O diagnstico de AC foi baseado na razo entre as circunferncias da cintura e do quadril (RCQ), sendo que valores 0,85 e 0,95, para mulheres e homens, respectivamente, firmavam esse diagnstico. RESULTADOS: A prevalncia de excesso de peso foi de 22,4% (IC95% 20,6-28,1), e a de AC, de 67,0% (IC95% 63,1-70,9). Alm de maiores prevalncias de DM, HA e dislipidemia, estratificando-se pelo ndice de massa corporal (IMC) e RCQ, indivduos com excesso de peso e adiposidade central apresentaram pior perfil metablico: a presso arterial foi significantemente maior naqueles com excesso de peso, sem e com AC; indivduos com AC apresentaram maiores ndices de glicemia,

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

83

triglicerdeos, colesterol total e LDL e menor HDL quando comparados aos sem excesso de peso e sem AC; a insulinemia de jejum foi significantemente maior em indivduos com excesso de peso (sem e com AC) do que naqueles sem excesso de peso e sem AC. CONCLUSO: A comparao de subgrupos com e sem adiposidade central foi compatvel com a hiptese de que a deposio abdominal de gordura representa fator de risco para doenas interligadas pela resistncia insulina, inclusive em populao de origem oriental. A alta prevalncia de sndrome metablica nos migrantes japoneses pode ser decorrente da deposio visceral de gordura, implicada na gnese da resistncia insulina. Palavras-chave: Obesidade [epidemiologia]; Prevalncia; Presso arterial; Diabetes mellitus; Hiperlipidemia; Resistncia insulina; Fatores de risco; ndice de massa corporal; Pesos e medidas corporais; Migrao; Antropometria; Abdome; Adiposidade central.

FORNES, Nlida Schmid de, MARTINS, Ignez Salas, VELASQUEZ-MELENDEZ, Gustavo et al. Escores de consumo alimentar e nveis lipmicos em populao de So Paulo, Brasil. Rev. Sade Pblica, fev. 2002, vol.36, no.1, p.12-18. ISSN 0034-8910. OBJETIVO: Analisar o padro de consumo alimentar avaliado por meio de escores de consumo e relacionar esses escores com os nveis de colesterol total e de lipoprotenas de baixa e alta densidades em populao da rea metropolitana de So Paulo. MTODOS: Estudo transversal realizado no municpio de Cotia, So Paulo, em amostra representativa de 1.045 adultos, foram determinados nveis de lipdeos sricos e a ingesto de alimentos por meio da freqncia de consumo alimentar. Foram utilizados escores de padro de consumo, estabelecendo um peso para cada categoria de consumo baseado na freqncia anual, obtendose, assim, a distribuio quintilar do escore I (alimentos considerados de risco para doenas cardiovasculares) e escore II (alimentos protetores). Foram comparados os valores mdios das lipoprotenas para cada um dos quintis pela anlise de varincia, e foram verificadas possveis relaes entre os escores de consumo e as fraes de lipdeos sricos, mediante modelos de regresso linear mltipla (stepwise forward). RESULTADOS: Observou-se aumento significativo dos nveis mdios de lipdeos, segundo quintis de consumo do escore I para colesterol total e para lipoprotena de baixa densidade-colesterol, e constatouse um comportamento inverso e significativo dos nveis desses lipdeos sricos em relao ao escore II. O escore I correlacionou-se positivamente e significativamente a esses lipdeos, e o escore II apresentou correlao inversa e significativa com esses constituintes sangneos. CONCLUSES: Em estudos populacionais, a anlise da freqncia de consumo de alimentos por meio de escores pode ser um mtodo de escolha para avaliar qualidade de dieta e de seu potencial efeito nos nveis sricos de colesterol total e de lipoprotenas de baixa densidade. Palavras-chave: Consumo de alimentos; Lipdios [sangue]; Colesterol [sangue]; Lipoprotenas; Gorduras na dieta; Hiperlipidemia; Lipoprotenas do colesterol HDL [sangue]; Lipoprotenas do colesterol LDL [sangue]; Doenas cardiovasculares; Escores.

MONTEIRO, Carlos Augusto, BENICIO, Maria Helena D'Aquino e ORTIZ, Luiz Patricio. Tendncia secular do peso ao nascer na cidade de So Paulo (1976-1998). Rev. Sade Pblica, dez. 2000, vol.34, no.6, supl, p.26-40. ISSN 0034-8910. OBJETIVO: Resgatar a tendncia secular da distribuio do peso ao nascer na cidade de So Paulo, SP, bem como examinar suas possveis causas, com base em dados coletados por dois inquritos domiciliares sobre condies de sade na infncia realizados em 1984/85 e em 1995/96, complementados por informaes procedentes de levantamento de pronturios de maternidades e por informaes do Sistema Estadual de Declaraes de Nascidos Vivos. MTODOS: Os inquritos domiciliares estudaram amostras probabilsticas da populao infantil de So Paulo com idade inferior a cinco anos (n=1.016 em 1984/85; n=1.280 em 1995/96). O levantamento de pronturios estudou uma amostra probabilstica dos partos ocorridos nas maternidades da cidade no ano de 1976 (n=5.734). As declaraes de nascidos vivos referemse s coortes de crianas nascidas na cidade entre 1993 e 1998 (cerca de 200 mil crianas por ano). O estudo da distribuio social do peso ao nascer levou em conta a renda familiar per capita e a escolaridade materna. A estratgia analtica para estudar os determinantes da tendncia secular do peso ao nascer empregou modelos hierrquicos de causalidade, anlises multivariadas de regresso e procedimentos anlogos aos utilizados para calcular riscos atribuveis populacionais. RESULTADOS/CONCLUSES: A
FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

84

distribuio do peso ao nascer na cidade de So Paulo (mdia de 3.160 g com 8,9% de pesos <2.500 g) inferior quela esperada quando so timas as condies do crescimento fetal (mdia de 3.400-3.500 g com cerca de 4-5% de pesos <2.500 g). Essa distribuio pouco se modificou nos ltimos 22 anos (1976-1998). Entretanto, no perodo, h evidncias de evoluo desigual do peso ao nascer segundo o nvel socioeconmico (NSE) da populao. Nos estratos de baixo NSE, a evoluo tem sido favorvel e isso se deve, aparentemente, ao melhor desempenho do crescimento intra-uterino, o qual poderia decorrer de melhorias em condies econmicas, no peso e na altura das gestantes, na assistncia pr-natal e, possivelmente, do declnio no hbito de fumar. Nos estratos de alto NSE, a evoluo do peso ao nascer tem sido desfavorvel devido, aparentemente, ao aumento na freqncia de recm-nascidos prematuros, tendncia provocada por fatores ainda no conhecidos. Palavras-chave: Levantamentos epidemiolgicos; Peso ao nascer [tendncias]; Fatores socioeconmicos; Escolaridade; Renda familiar; Prematuro; Tabagismo; Sries de tempo.

MONTEIRO, Carlos Augusto, SZARFARC, Sophia Cornbluth e MONDINI, Lenise. Tendncia secular da anemia na infncia na cidade de So Paulo (1984-1996). Rev. Sade Pblica, dez. 2000, vol.34, no.6, supl, p.62-72. ISSN 0034-8910. OBJETIVO: Estimar a prevalncia e a distribuio social da anemia na infncia, estabelecer a tendncia secular dessa enfermidade e analisar sua determinao, com base em dados coletados por dois inquritos domiciliares realizados na cidade de So Paulo, SP, em 1984/85 e em 1995/96. MTODOS: Os inquritos estudaram amostras probabilsticas da populao residente na cidade com idade entre zero e 59 meses (1.016 em 1984/85 e 1.280 em 1995/96). Amostras de sangue capilar obtidas por punctura digital foram coletadas nos dois inquritos e analisadas com relao concentrao de hemoglobina. O diagnstico da anemia correspondeu a concentraes inferiores a 11 g/dL. O estudo da distribuio social da anemia levou em conta tercis da renda familiar per capita em cada um dos inquritos. A estratgia analtica para estudar os determinantes da evoluo da prevalncia da anemia na populao empregou modelos hierrquicos de causalidade, anlises multivariadas de regresso e procedimentos anlogos aos utilizados para calcular riscos atribuveis populacionais. RESULTADOS/CONCLUSES: Houve entre os inquritos reduo significativa na concentrao mdia de hemoglobina (de 11,6 g/dL para 11,0 g/dL) e aumento significativo na prevalncia de anemia (de 35,6% para 46,9%). Essa evoluo desfavorvel foi observada em ambos os sexos, em todas as faixas etrias e em todos os estratos econmicos da populao. A evoluo tendeu a ser ainda mais desfavorvel para o tero mais pobre das crianas da cidade, o que determinou o agravamento das desvantagens desse estrato frente aos demais. Determinantes distais (renda familiar e escolaridade materna) e proximais (tipo de aleitamento) da anemia evoluram favoravelmente entre os inquritos e, assim, no puderam explicar o aumento da enfermidade. A estabilidade apurada quanto densidade de ferro na dieta, em valores inferiores s necessidades, justifica a elevada prevalncia da enfermidade, mas no explica seu aumento. Palavras-chave: Anemia [epidemiologia]; Levantamentos epidemiolgicos; Inquritos nutricionais; Anemia ferropriva; Hemoglobinas [deficincia]; Aleitamento materno; Fatores socioeconmicos; Sries de tempo; Criana.

MONTEIRO, Paulo Orlando Alves, VICTORA, Cesar G, BARROS, Fernando C et al. Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critrios para o ndice de Massa Corporal. Rev. Sade Pblica, out. 2000, vol.34, no.5, p.506-513. ISSN 0034-8910. OBJETIVO: Pela simplificao da triagem para obesidade na adolescncia, avaliou-se o desempenho de diferentes pontos de corte para o ndice de Massa Corporal (IMC) em uma coorte populacional nascida em 1982, em Pelotas, no sul do Brasil. MTODOS: Foram estudados 493 adolescentes, com idades de 15 a 16 anos, residentes na zona urbana de Pelotas, RS. A obesidade foi definida pelo percentil 85 de IMC mais o percentil 90 das dobras cutneas tricipital e subescapular, conforme a Organizao Mundial da Sade (OMS). Diversos pontos de corte para sobrepeso tiveram sua sensibilidade e especificidade avaliadas. RESULTADOS: Nos meninos, o IMC 25 kg/m apresentou sensibilidade superior a 90% e 5% de falsopositivos. O critrio proposto para adolescentes brasileiros apresentou sensibilidade de 100%, mas os falso-

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

85

positivos chegaram a 23%. Nas meninas, os pontos de corte coincidiram, apresentando sensibilidade superior a 90%, com at 13% de falso-positivos. Pontos de corte mais altos foram testados, porm pouco melhoraram a especificidade, que foi acompanhada de reduo na sensibilidade. CONCLUSES: O IMC 25 kg/m mostrou o melhor desempenho na deteco de obesidade, parecendo adequado para triagem de adolescentes de ambos os sexos com 15 anos ou mais. Tem a vantagem de ser nico, de fcil determinao e compatvel com o ponto de corte recomendado pela OMS para adultos. Dispensa o uso de valores de IMC especficos para idade, sexo e medida de dobras cutneas, sendo, portanto, recomendvel para uso em servios de sade.Palavras-chave: Adolescncia; Obesidade [diagnstico]; ndice de Massa Corporal; Sensibilidade e especificidade; Dobras cutneas; Peso corporal; Sobrepeso. Palavras-chave: Adolescncia; Obesidade [diagnstico]; ndice de Massa Corporal; Sensibilidade e especificidade; Dobras cutneas; Peso corporal; Sobrepeso.

OTERO, Ubirani Barros, ROZENFELD, Suely, GADELHA, Angela Maria Jourdan et al. Mortalidade por desnutrio em idosos, regio Sudeste do Brasil, 1980-1997. Rev. Sade Pblica, abr. 2002, vol.36, no.2, p.141-148. ISSN 0034-8910. OBJETIVO: Conhecer a freqncia da desnutrio como causa de morte na populao idosa. MTODOS: Foram selecionados indivduos com 60 anos ou mais de ambos os sexos, dos municpios da regio Sudeste, entre 1980 e 1997. As fontes de dados foram o registro de bitos do Sistema de Informao Sobre Mortalidade (1980-1998) e a populao estimada pelo Centro de Desenvolvimento e Planejamento Regional (Cedeplar). Para classificao dos bitos, empregou-se a CID-9 (260 a 263.9), para os anos de 1980 at 1995, e a CID-10 (E40 a E46), para os anos mais recentes. RESULTADOS: No Brasil, entre 1980 e 1997, ocorreram 36.955 bitos por desnutrio em idosos. A regio Sudeste concentrou o maior nmero 23.968 (64,9%) dentre as demais regies brasileiras. No Estado de So Paulo, ocorreram 11.067 bitos por desnutrio em idosos, e, no Rio de Janeiro, 7.763, obtendo, esses dois estados em conjunto, os maiores valores da regio. maior a proporo de bitos e maiores os coeficientes de mortalidade em indivduos de 70 anos ou mais do que em indivduos da faixa etria de 60 a 69 anos, independentemente do sexo. CONCLUSO: Os resultados preliminares do estudo levantam algumas questes: o papel da desnutrio como causa associada; a tendncia de aumento dos bitos por desnutrio na velhice; o comportamento diferenciado entre estados da mesma regio. Anlises estatsticas do tipo sries-temporais possivelmente conseguiriam explicar melhor os fenmenos apontados. Ser preciso aprofundar o estudo do papel da desnutrio na populao com 60 anos ou mais para estabelecer estratgias de interveno adequadas. Palavras-chave: Mortalidade; Idoso; Transtornos nutricionais; Atestados de bito; Causa bsica da morte; Coeficiente de mortalidade; Distribuio espacial; Desnutrio.

PRADO, Matildes da Silva, ASSIS, Ana Marlcia Oliveira, MARTINS, Maisa Cruz et al. Hipovitaminose A em crianas de reas rurais do semi-rido baiano. Rev. Sade Pblica, ago. 1995, vol.29, no.4, p.295-300. ISSN 0034-8910. Objetivou-se avaliar a distribuio e a magnitude da deficincia de vitamina A e o consumo diettico de 161 crianas de 6 a 72 meses de idade, de reas rurais do Municpio de Cansano-Bahia, Brasil. Os nveis de retinol srico foram medidos pelo mtodo espectrofotomtrico (Bessey-Lowry modificado por Arajo e Flores, 1978). A mdia do retinol srico distribuiuse homogeneamente entre as diferentes faixas etrias. Nveis inadequados de retinol srico (deficiente <10,0 g/dl e baixos <20,0 g/dl) foram detectados em 44,7% das crianas, caracterizando a deficincia como problema de sade pblica. Os nveis de retinol srico no mostraram associao estatisticamente significante com sexo e idade das crianas, contudo as menores de 24 meses apresentaram prevalncia mais alta de nveis inadequados. A principal fonte de vitamina A, disponvel para essas crianas, representada pelos carotenides, em especial beta-caroteno. Foi observada maior diversificao no consumo dos alimentos de contedos moderado e baixo em vitamina A no grupo de 24 a 72 meses de idade, sem contudo assegurar nveis adequados de retinol srico para este grupo etrio. Palavras-chave: Deficincia de Vitamina A [epidemiologia]; Inquritos sobre dieta; Populao rural.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

86

SOUZA JUNIOR, Paulo Roberto Borges de, SZWARCWALD, Clia Landmann, BARBOSA JUNIOR, Aristides et al. Infeco pelo HIV durante a gestao: estudo-Sentinela Parturiente, Brasil, 2002. Rev. Sade Pblica, dez. 2004, vol.38, no.6, p.764-772. ISSN 0034-8910. OBJETIVO: Avaliar a cobertura efetiva da deteco da infeco pelo HIV durante a gestao, em mbito nacional. MTODOS: A cobertura efetiva do teste de HIV na gestao foi definida como a proporo de gestantes que teve atendimento pr-natal (pelo menos uma consulta), pedido de teste de HIV e conhecimento do resultado antes do parto, sendo estimada por processo de amostragem, utilizando-se as informaes coletadas no Estudo-Sentinela Parturiente, 2002. As desigualdades da cobertura efetiva foram analisadas por: grande regio; tamanho populacional do municpio de ocorrncia do parto; e grau de instruo da me. RESULTADOS: A cobertura efetiva do teste de HIV durante a gestao foi estimada em 52%. As enormes desigualdades socioespaciais ficaram evidenciadas na comparao entre as regies Nordeste (24%) e Sul (72%); entre parturientes analfabetas (19%) com as que tm o ensino fundamental completo (64%); entre as que realizaram o parto em municpios pequenos (36%) com as que o realizaram em municpios com mais de 500 mil habitantes (66%). As recomendaes do Ministrio da Sade foram atendidas, completamente, por somente 27% parturientes. CONCLUSES: Os resultados estabelecem a necessidade de haver medidas voltadas para maior cobertura da deteco do HIV na gestao, e indicam que os programas do Programa Nacional de DST e Aids e os programas de sade da mulher devem ser intensificados, com estratgias conjuntas entre eles. Palavras-chave: Infeces por HIV, diagnstico; Transmisso vertical de doena; Efetividade; Distribuio espacial; Fatores socioeconmicos; Cuidado pr-natal; Vigilncia de evento sentinela. TUYNS AJ, Pequignot G, Jensen OM. Esophageal cancer in Ille-et-Vilaine in relation to levels of alcohol and tobacco consumption. Risks are multiplying. Bull Cancer. 1977;64(1):45-60. A retrospective case-control study of 200 male cases of oesophageal cancer and 778 population controls has been carried out in Ille-et-Vilanine (France). The logarithms of the relative risks of developing the disease increase linearly with daily consumption of alcohol and tobacco independently. The combined effect of both fit with a multiplicative model which is proposed. This model could be applicable to other situations. It explains the sex ratio and the urban/rural differences observed in Ille-er-Vilaine. The practical implications for public health purposes are briefly discussed.

VELASQUEZ-MELENDEZ, Gustavo, KAC, Gilberto, VALENTE, Joaquim Gonalves et al. Evaluation of waist circumference to predict general obesity and arterial hypertension in women in Greater Metropolitan Belo Horizonte, Brazil. Cad. Sade Pblica, May/June 2002, vol.18, no.3, p.765-771. ISSN 0102-311X.

Avaliou-se a capacidade que a Circunferncia da Cintura (CC) tem em identificar valores de IMC 25 (sobrepeso) e 30 (obesidade) a partir de nveis de ao recomendados internacionalmente. Setecentas e noventa e uma mulheres entre 15-59 anos foram recrutadas. Foram calculadas a sensibilidade e a especificidade no diagnstico de sobrepeso e obesidade e a sensibilidade e especificidade na predio da hipertenso, a partir de valores de CC. As associaes foram testadas por anlise de regresso linear e regresso logstica controlando para o efeito de fatores de confuso. A CC 80 e 88cm discriminou corretamente 89,8% de mulheres com IMC 25 e 88,5% com IMC 30. A obesidade abdominal (CC 88cm) esteve associada significativamente com a hipertenso na anlise multivariada (OR = 2,88, IC 95%: 1,77-4,67). A hipertenso foi identificada com sensibilidade de 63,8 e 42,8% e especificidade de 68,0 e 83,3% para CC 80 e 88, respectivamente. A obesidade abdominal nos pontos de corte propostos pode discriminar adequadamente indivduos em risco de se tornarem obesos, no entanto, apresenta um poder apenas moderado para discriminar indivduos com nveis pressricos .
Keywords: Obesidade; Sade da Mulher; Quadril; Hipertenso; ndice de Massa Corporal.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica. Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

87

Você também pode gostar