Bioestatistica Basica

Dr. Paulo R.
Margotto
Prof. do Curso de Medicina da Escola Superior de Cincias da Sade/ESCS/SES/DF www.paulomargoitto.com.br pmargotto@terra.com.br
ENTENDENDO BIOESTATSTICA BSICA Paulo R Margotto

I. Introduo II. Variveis Qualitativa ou Nominal Ordinal Quantitativa ou Contnua III. Populao e amostra IV. Apresentao dos dados em tabelas Componentes das tabelas Tabelas de contingncia ou de dupla entrada Tabelas de distribuio de freqncias V. Apresentao dos dados em grficos Grficos de barras Grficos de setores Histograma Polgono de freqncias VI. Medidas de tendncia central Mdia aritmtica Medidas de disperso de uma amostra Varincia Desvio Padro VII. Distribuio Normal Clculo de probabilidades associadas distribuio normal VIII. Correlao e Regresso IX. Risco Relativo/Qui-quadrado/Risco Atribuvel/Odds Ratio X. Teste de Hiptese XI. Teste de Fisher ou da Probabilidade Exata XII. Teste t XIII. Estadgrafo de Sandler XIV. Anlise de Varincia (ANOVA) XV. Escolha do Teste Estatstico XVI. Testes Estatsticos no paramtricos XVII. Sensibilidade/Especificidade/Valor Predictivo XVIII. Exerccio da Medicina/Neonatologia baseado em evidncias XIX. Tabelas XX. Referncias Bibliogrficas.
ENTENDENDO BIOESTATSTICA BSICA Paulo R. Margotto (Professor do Curso de Medicina da Escola Superior de Cincias da Sade-SES/DF) PARTE I de 10 partes (a Parte X contm as tabelas) I. INTRODUO A conduo e a avaliao de uma pesquisa dependem, em boa parte, do conhecimento do pesquisador sobre estatstica. Freqentemente a determinao da eficcia de um agente ou procedimento de natureza preventiva, curativa ou diagnstico requer a comparao entre dois ou mais grupos ou amostras (grupo tratado e o grupo controle que no foi submetido interveno). A comparao entre ambos os grupos possibilitar avaliar se realmente (significativamente) o tratamento eficaz, devendo o pesquisador estar alerta sobre variveis interferentes nos resultados, como, variaes amostrais, diferenas existentes entre os grupos, alm de outras. Freqentemente os testes estatsticos so utilizados com os seguintes aspectos: comparar amostras (houve modificaes nos grupos inicialmente semelhantes aps a instituio do tratamento, detectar relao entre variveis, detectar variveis interferentes, isto , se o tratamento institudo depende tambm de outras variveis, como peso, idade, sexo). Neste estudo sobre Noes Bsicas de Bioestatstico propomos o seu entendimento bsico, para que possamos ter um ponto de vista objetivo sobre as tcnicas do mtodo cientfico e para sabermos avaliar o grau de importncia da informao que constantemente buscamos nos mais diferentes meios. Segundo Snia Vieira, a cincia no um conhecimento definitivo sobre a realidade, mas um conhecimento hipottico que pode ser questionado e corrigido; ensinar cincia no significa apenas descrever fatos, enunciar leis e apresentar novas descobertas, mas ensinar o mtodo cientfico, que a maneira crtica e racional de buscar conhecimento. II-VARIVEIS Aos pesquisadores nas reas mdicas e biolgicas, interessam-lhes os dados referentes mortalidade infantil, eficincia de medicamentos,
incidncia de doenas, causas de mortes, etc. Os dados referem-se a variveis que por sua vez podem ser qualitativas, ordinais e quantitativas. Varivel qualitativa ou nominal: Os dados podem ser distribudos em categorias mutuamente exclusivas. Exemplo: Sexo - permite distinguir duas categorias, masculina e feminina. Cor, causa de morte, grupo sangneo. Varivel ordinal: Os dados podem ser distribudos em categorias mutuamente exclusivas que tm ordenao natural. Exemplo: grau de instruo (as pessoas podem ser distribudas em categorias mutuamente exclusivas, na seguinte ordem: primrio, 2 ano e superior), aparncia, status social, estgio da doena Varivel quantitativa ou contnua: os dados so expressos por nmeros Exemplo: idade, estatura, peso corporal. III - POPULAO E AMOSTRA Populao: refere-se a um conjunto de elementos com uma determinada caracterstica. Amostra: refere-se a um subconjunto com menor nmero de elementos do que a populao. Independncia das amostras: as amostras so ditas independentes quando os grupos selecionados recebem tratamento distinto; as amostras so ditas dependentes quando para cada elemento do "grupo tratamento" existir um novo grupo controle com caractersticas semelhantes (sexo, idade, etc) ou quando se realiza a comparao intra-indivduo, ou seja, um grupo submetido ao tratamento e ele o seu prprio controle. VI - APRESENTAO DOS DADOS EM TABELAS -Componentes das tabelas: . Ttulo Corpo Cabealho Coluna indicadora
Opcional: fonte, notas (esclarecem aspectos relevantes da apurao) e chamadas (esclarecimentos sobre os dados em algarismos arbicos escritos entre parnteses). TABELA 1 Nascidos vivos na Maternidade do HRAS segundo o ano de registro
Ano de registro 1998 (1) 1999 (1) 2000 (1)
Freqncia 8328 8214 8898
freqncia relativa 32,88 32,22 34,90
Total 25.494 100 Fonte: Margotto, PR (2001). Nota: dados retirados do livro da sala de parto (1): os RN < 500g no foram includos. Ttulo: explica o contedo da tabela. Nascidos vivos na Maternidade do HRAS segundo o ano de registro. Corpo: formado pelas linhas e colunas dos dados No de nascidos vivos: 8.382 8.214 8.898 Cabealho: especifica o contedo das colunas. Ano de registro freqncia / freqncia relativa Coluna indicadora: especifica o contedo das linhas. 1998 1999 2000 As tabelas podem apresentar, alm da freqncia, a freqncia relativa que obtida pelo quociente da freqncia desta categoria pela soma das freqncias, multiplicado por 100. No exemplo a freqncia relativa referente a 1998 foi de 32,88% (8.832 25.494 X 100) Toda tabela deve ser delimitada por traos horizontais. O cabealho separado do corpo por um trao horizontal. O total de colunas escrito entre dois traos horizontais.
- Tabelas de contingncia ou tabelas de dupla entrada: estas tabelas referem-se a elementos da amostra ou da populao que so classificados de acordo com dois fatores; nestas tabelas, cada entrada relativa a um dos fatores. Veja o exemplo: Gestantes sem pr natal / gestantes com Pr natal e mortalidade perinatal. Fator Mortalidade Perinatal Total Sim No Gestante sem pr natal 55 883 938 Gestantes com pr natal 156 6720 6876 Como estudaremos mais adiante, as tabelas de dupla entrada nos possibilita o clculo de riscos, ou seja, clculos de freqncia (incidncia) entre expostos e no expostos a um determinado fator. No exemplo que estamos estudando, a incidncia de morte perinatal em gestante sem pr-natal (que um fator de risco) : 55 / 938 = 5,86% e nas gestantes com pr-natal, a incidncia de morte perinatal 156 / 6876 = 2,3%%. Assim, dizemos que o risco relativo de morte perinatal nas gestantes que no fizeram o pr natal maior (na verdade 2,3 vezes mais: 5,86 / 2,3 = 2,3) em relao s gestantes que fizeram o pr natal. - Tabelas de distribuio de freqncia As tabelas de distribuio de freqncias do ao leitor uma viso rpida e global do fenmeno. Observe a tabela abaixo com os pesos ao nascer de 100 RN
Peso ao nascer de nascidos vivos, em Kg. 2,522 3,200 1,900 4,100 4,600 3,400 2,720 3,720 3,600 2,400 1,720 3,400 3,125 2,800 3,200 2,700 2,750 1,570 2,250 2,900 3,300 2,450 4,200 3,800 3,220 2,950 2,900 3,400 2,100 2,700 3,000 2,480 2,500 2,400 4,450 2,900 3,725 3,800 3,600 3,120 2,900 3,700 2,890 2,500 2,500 3,400 2,920 2,120 3,110 3,550 2,300 3,200 2,720 3,150 3,520 3,000 2,950 2,700 2,900 2,400 3,100 4,100 3,000 3,150 2,00 3,450 3,200 3,200 3,750 2,800 2,720 3,120 2,780 3,450 3,150 2,700 2,480 2,120 3,155 3,100 3,200 3,300 3,900 2,450 2,150 3,150 2,500 3,200 2,500 2,700 3,300 2,800 2,900 3,200 2,480 3,250 2,900 3,200 2,800 2,450 Para transformar a tabela acima em uma tabela de distribuio de freqncias fazemos o seguinte procedimento. Definir as faixas de peso (classes). Observem que o menor peso e 1.570Kg e o maior 4.600Kg, podendo ento ser definidas classes de 1,5Kg a 2kg, 2Kg a 2,5Kg, e assim por diante. 1,5 /----- 2,0 (RN com peso de 1,5Kg at 1,999Kg) 2,0 /----- 2,5 (RN com peso de 2,0 Kg at 2,499Kg) 2,5 /----- 3,0 3,0 /----- 3,5 3,5 /----- 4,0 4,0 /----- 4,5 4,5 /----- 5,0 Observem que cada intervalo de classe de 0,5Kg ( o intervalo coberto por cada classe). Os extremos de classe so os limites dos
intervalos de classe. A anotao 1,5 /---- 2,0 significa que o intervalo fechado esquerda, isto , pertencem classe os valores iguais ao extremo inferior (valor 1,5), mas no pertencem classe os valores iguais ao extremo superior (valor 2,0). Na tabela a seguir dada a distribuio das freqncias: CLASSE FREQNCIA 1,5 /------ 2,0 3 2,0 /------ 2,5 16 2,5 /------ 3,0 31 3,0 /------ 3,5 34 3,5 /------ 4,0 11 4,0 /------ 4,5 4 4,5 /------ 5,0 1 Ponto mdio: dado pela soma dos extremos da classe, dividida por 2. Para a classe de 1,5/---- 2,0 o ponto mdio 1,5 + 2,0 = 1,75. 2 Portanto, uma tabela tpica de distribuio de freqncias tem 3 colunas: da esquerda, corresponde s classes, a do meio, aos pontos mdios e a da direita, s freqncias (o nmero de elementos de cada classe). Observem na tabela 3: Tabela 3: Nascidos vivos segundo o peso ao nascer em Kg. Classe Ponto mdio Freqncia 1,5/ ---- 2,0 1,75 3 2,0/ ---- 2,5 2,25 16 2,5/ ---- 3,0 2,75 31 3,0/ ---- 3,5 3,25 34 3,5/ ----4,0 3,75 11 4,0/ ---- 4,5 4,25 4 4,5/ ---- 5,0 4,75 1 As tabelas de distribuio de freqncia mostram a distribuio da varivel, mas perdem na exatido, pois todos os dados passam a ser representados pelo ponto mdio da classe a que pertencem. O nmero de classes em geral de 5 a 20 classes, podendo ser determinado pela frmula. K = 1 + 3,222 log n (o n0 de classes um inteiro prximo de K) n.: n0 de dados No exemplo da tabela 1, com n= 100, temos:
K = 1 + 3,222. log 100 = 7,444 (ou seja, devem ser construdas 7 ou 8 classes). importante lembrar que cabe ao pesquisador determinar o n 0 de classes que pretende organizar. V APRESENTAO DOS DADOS EM GRFICOS Todo o grfico deve apresentar ttulo (pode ser colocado tanto acima como abaixo) e escala (crescem da esquerda para a direita e de baixo para cima). As legendas devem ser colocadas direita do grfico. Grfico de barras: usado para apresentar variveis qualitativas ou variveis ordinais. Veja no grfico de barras os dados da tabela 1.
35 30 25 20 15 10 5 0 1998 1999 2000
Nascidos vivos na maternidade do HRAS segundo o ano de registro. Grfico de setores: usado para apresentar variveis qualitativas ou variveis ordinais. Calcular os ngulos centrais das diversas categorias, marcando os na circunferncia e separando os com o traado de raios. Veja o grfico de setores correspondente tabela 1.
1998 ( 118,4) 1999 ( 116) 2000 (125,6) Como calcular o ngulo central de cada categoria: 100 360 Freqncia relativa (f) valer X e o ngulo central X = 360 x f 100
Nascidos vivos na Maternidade do HRAS segundo o ano de registro. Histograma: Os dados apresentados em tabelas de distribuio de freqncia so apresentados graficamente em histogramas. Veja a tabela 3 representada num histograma.
40 35 30 25 20 15 10 5 0
Frequncia
Peso ao nascer Se os intervalos de classe so diferentes, ao se construir um histograma, devemos calcular as densidades de freqncia relativa (quociente da freqncia relativa e o intervalo de classe) que determinam as alturas. Observem a tabela 4, na qual os intervalos de classe so diferentes e o histograma referente a esta tabela representando os dados. As densidades de classes esto apresentadas na tabela. Tabela 4. Mulheres com 30 anos de idade segundo a presso sangnea sistlica, em milmetros de mercrio. Classes Freqncia Freqncia Densidade Relativa 90/ ------100 6 6 0,6 100/ ---- 105 11 11 2,2 105/ ---- 110 12 12 2,4 110/ ---- 115 17 17 3,4 115/ ---- 120 18 18 3,6 120/ ---- 125 11 11 2,2 125/ ---- 130 9 9 1,8 130/ ---- 135 6 6 1,2
1 2 3 4 5
135/ ---- 140
0,8
140/ ---- 150 150/ ---- 160 160 e mais
4 1 1
4 1 1
0,4 0,1 0,1
Mulheres com 30 anos de idade segundo a presso sangunea sistlica, em mmHg Polgono de freqncia : Os dados apresentados em tabela de distribuio de freqncias tambm podem ser apresentados em grficos denominados polgonos de frequncia. Aps serem marcados os pontos na abscissa (pontos mdios das classes) e na ordenada (freqncia relativas), fechar o polgono unindo os extremos nos pontos de abscissas iguais aos pontos mdios de uma classe imediatamente inferior a primeira e de uma classe imediatamente superior ltima. Veja o Polgono a seguir construdo para apresentar os dados da tabela 3.
Nascidos vivos segundo o peso ao nascer, em quilogramas
VI MEDIDAS DE TENDNCIA CENTRAL

Quando dizemos que a durao de uma viagem entre duas cidades de 2 h, no quer dizer que sempre que algum realizar esta viagem o far exatamente em 2h, mas a maior parte dos viajantes far em 2h. Assim, os valores que se caracterizam por se aproximar a maior parte a populao, so denominados de medidas de tendncia central. As medidas de tendncia central do o valor do ponto em torno do qual os dados se distribuem. A mdia d a abscissa em torno do qual os dados se distribuem, sendo importante que seja avaliado o grau de disperso de um conjunto de dados, ou seja, quanto cada dado se desvia em relao mdia ( o que chamamos de varincia e desvio padro). Clculo da mdia aritmtica: a soma de todos os dados dividido pelo nmero deles. A mdia d a abscissa do centro de gravidade do conjunto de dados. A Tabela 5 fornece o peso ao nascer em kg de 10 RN. Tabela 5 Peso ao nascer em kg de 10 RN 2,5 2,0 3,0 4,0 3,0 1,0 1,5 3,5 1,5 2,5 A mdia aritmtica (representa-se por X) : 2,5 + 3,0 + 3,5 + ...... 4 = 2,45 10 Clculo da mdia de dados em tabela de distribuio de freqncia. Considere os dados da Tabela 6. Nascidos vivos segundo o peso ao nascer, em quilogramas. Classe Ponto Mdio Freqncia 1,5/ ---- 2,0 1,75 3 2,0/ ---- 2,5 2,25 16 2,5/ ---- 3,0 2,75 31 3,0/ ---- 3,5 3,25 34 3,5/ ---- 4,0 3,75 11
4,0/ ---- 4,5 4,25 4 4,5/ ---- 5,0 4,75 1 O nmero de nascidos vivos nesta amostra : n = 3 + 16 + 31 + 34 + 11 + 4 + 1 =100 A mdia (X) dos pesos ao nascer dos nascidos vivos da amostra calculada multiplicando se o ponto mdio de cada classe pela respectiva freqncia, somando se a seguir os produtos e dividindo a soma por n: X = 1,75 x 3 + 2,25 x 16 + ......... 4,25 x 4 + 4,75 x 1 = 300 = 3 Kg 100 Medidas de disperso para uma amostra: As medidas de disperso so indicadores do grau de variabilidade demonstrada pelos indivduos em torno das medidas de tendncia central. Varincia: os dados se distribuem em torno da mdia; medindo os desvios em relao mdia (diferena entre cada dado e a mdia) estamos avaliando o grau de disperso de um conjunto de dados. No h mdia dos desvios, porque a soma sempre igual a zero: Exemplo: 0,4,6,8,7 - Mdia: X = 0 + 4+ 6 + 8 + 7 = 25 = 5 5 -Desvio em relao mdia: (X X): 05=-5 4 5 = -1 6-5= 1 85= 3 75= 2 A soma dos desvios igual a zero: - 5 1 +1 3 + 2 + - 6 + 6 = 0 - Soma de quadrados dos desvios: Clculo: Tabela 7 Clculo da soma de quadrados dos desvios Dados Desvios Quadrado dos desvios (x) (x x) (X X ) 2 0 -5 25 4 -1 1 6 1 1 8 3 9 7 2 4
x = 5 (x x) = 0 (x x) 2 = 40 A soma de quadrados dos desvios no usada como medida de disperso porque seu valor cresce com o nmero de dados. Vamos entender esta idia: pesos de 2 grupos de pessoas: Grupo A: 60, 70 e 80 Kg. Grupo B: 60, 60, 70, 70, 80, 80,... Veja na tabela 8 que a disperso dos dados em torno da mdia a mesma em ambos grupos, mas a soma de quadrados dos desvios maio no grupo B, pois este grupo tem mais dados. Tabela 8 Clculo da soma de quadrados dos desvios Grupo I Grupo II X 60 70 80 (x -x) - 10 zero 10 (x x) 2 100 zero 100 X 60 60 70 70 80 80 (x - x) - 10 - 10 zero zero 10 10 zero (x x) 2 100 100 zero zero 100 100 400
zero
200
Assim, para medir a disperso dos dados em relao mdia, usamos a Varincia (S 2), que leva em considerao o tamanho da amostra. S 2 = soma de quadrados dos desvios n1 Clculo da S 2 dos dados: 0,4,6,8 e 7 , colocados na tabela 7 S 2 = 40 = 40 = 10 5 -1 4 - Desvio padro a raiz quadrada da Varincia, sendo representado por s; o desvio padro (s) tem as mesmas propriedades da Varincia e tem a mesma unidade de medida dos dados. O desvio padro dos dados 0, 4, 6, 8, 7 colocados na tabela 7 : s2 (varincia); 10
s (desvio padro): 10 = 3,16 Coeficiente de variao: (CV) O CV a razo entre o desvio padro (s) e a mdia (X) x 100 (resultado em porcentagem). CV: s x 100 X Para melhor entender. Dado 2 grupos de pessoas com idades: Grupo A: 3,1,5 ----- X : 3 anos ; s2 = 4 Grupo B: 55, 57,53 ----- X: 55 anos ; s2 = 4 Observem que a disperso dos dados em ambos os grupos a mesma (a varincia S 2 igual a 4, j os CV so diferentes. No 1o grupo, o CV : 2/3 x100 = 66,67% No 2o grupo, o CV : 2/55 x 100 = 3,64% . Vejam que no 1o grupo (grupo A), a disperso os dados em relao mdia grande, ou seja, a disperso relativa alta. Na tabela a seguir, o peso de 10 RN. Calcular mdia e o desvio padro dos dados Peso ao nascer de recm- nascidos vivos 2,5 2,0 3,0 3,0 1,0 1,5 3,5 1,5 2,5 Passos: - calcular: X (mdia ) os desvios em relao mdia: X X a soma de quadrados dos desvios a s2 (varincia): soma de quadrados de desvio n1 2 o desvio padro (s) = s coeficiente de variao CV = s x 100 x 4,0
VII Distribuio Normal

As variveis so aleatrias porque elas tm um componente que varia ao acaso, como por exemplo, a variabilidade dos pesos ao nascer de RN vivos de mesmo sexo, mesma raa, mesma idade gestacional e filho de mes em condies similares de sade e alimentao. Assim, o peso ao nascer uma varivel aleatria. Utilizando grandes amostras de certas variveis aleatrias, podemos construir grficos que tm aparncia tpica, no qual podemos observar que h uma variao contnua na populao com dois extremos, um mximo e um mnimo e entre eles, uma distribuio gradativa, sendo que a maioria dos valores, localiza-se ao redor da mdia (Curva de Gauss).
Peso ao nascer de nascidos vivos brancos do sexo masculino com cerca de 40 semanas de gestao As medidas que do origem a grficos semelhantes ao apresentado, dizemos que so variveis que tem distribuies que se aproximam da distribuio normal, com apresentado na figura a seguir
Grfico da distribuio normal A distribuio normal tem as seguintes caractersticas: - A varivel (peso ao nascer) pode assumir qualquer valor real - O Grfico da distribuio normal uma curva em forma de sino, simtrico em torno da mdia () (se l mi). - A rea total da curva vale 1, significando que a probabilidade de ocorrer qualquer valor real 1. - Pelo fato da curva ser simtrica em torno da mdia, os valores maiores do que a mdia e os valores menores do que a mdia ocorrem com igual probabilidade. Uma das propriedades associadas distribuio normal a sua capacidade para predizer as probabilidades de encontrar um valor entre dois nmeros quaisquer. As probabilidades associadas distribuio normal so facilmente obtidas em tabelas. Vejamos alguns exemplos: Com vemos na figura a seguir a rea total sob a curva vale 1. Isto significa que a probabilidade de ocorrer qualquer valor real 1. A curva simtrica em torno da mdia zero. A probabilidade de ocorrer valer maior que zero 0,5, mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25 ?
Probabilidade de ocorrer valor entre zero e z=1,25 A probabilidade da ocorrncia do valor entre zero e z = 1,25 , corresponde rea pontilhada na figura acima . Podemos encontrar esta probabilidade na tabela de distribuio normal ( Tabela A -1). Como usar esta tabela? - Localizar na 1a coluna o valor 1,2 - Na 1a linha, est o valor 5. - n0 1,2 compe com o algarismo 5, o n0 z = 1,25. - No cruzamento da linha 1,2 com a coluna 5 est o nmero 0,3944. Est a probabilidade (39,44%) do ocorrer valor entre zero e z= 1,25. 0 1 2 3 4 5 6 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 0,1915 0,2257 0,2580 0,2881 0,3159 0,1950 0,2291 0,2611 0,2910 0,3186 0,1985 0,2324 0,2642 0,2939 0,3212 0,2019 0,2357 0,2673 0,2967 0,3238 0,2054 0,2389 0,2703 0,2995 0,3264 0,2088 0,2422 0,2734 0,3023 0,3289 0,2123 0,2454 0,2764 0,3051 0,3315
0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 Probabilidade de ocorrer valor entre zero e 1,25 Suponhamos que o colesterol sangneo tem distribuio normal com mdia de 200mg e desvio padro de 20 mg. Veja o grfico desta distribuio.
Distribuio normal da taxa de colesterol no plasma sanguneo humano Qual a probabilidade de um indivduo apresentar um colesterol entre 200 e 225 mg%. Est probabilidade corresponde a figura a seguir.
Probabilidade de taxa de colesterol entre 200 e 225
Para calcular a probabilidade associada distribuio normal, usa - se a frmula: Z=X- - = mdia ; = desvio padro - X = valor pesquisado A estatstica Z - Standard score -baseia-se na curva normal. Ela mede quanto um determinado resultado (valor) afasta-se da mdia em
unidades de desvio-padro. Um resultado cujo valor coincide com a mdia tem escore z=0. Como a quantidade de colesterol tem distribuio normal com mdia = 200 e desvio padro ( ) de 20, a varivel Z = X - 200 tem distribuio normal reduzida. 20 Nesta distribuio, a mdia zero e, ao valor X = 225, corresponde: Z = X - 200 = 1,25 20 Consultando a tabela A-1 de distribuio normal vemos que a probabilidade de Z assumir valor entre zero e z = 1,25 de 0,3944 ou 39,44%. Outro exemplo: Qual a probabilidade uma pessoa apresentar menos do que 190mg% de colesterol. Para resolver este problema, preciso "reduzir" o valor X = 190. Obtm-se ento: Z = 190 - 200 = - 0,50 . 20 A probabilidade de z assumir o valor menor que z = - 0,50 igual a probabilidade de ocorrer valor maior do que z = 0,50. Consultando a tabela A-1 de distribuio normal reduzida, vemos que no cruzamento entre a linha e a coluna - na primeira coluna, temos o valor 0,5 e na primeira linha o valor zero para compor o nmero z = 0,50 est o valor 0,1915, que a probabilidade de ocorrer valor zero e z = 0,50. Como a probabilidade de ocorrer valor maior do que a mdia zero 0,5, a probabilidade pedida dada por: 0,5 - 0,1915 = 0,3085 08 30,85%. Faa o seguinte exerccio: Em mulheres, a quantidade de hemoglobina por 100ml de sangue uma varivel aleatria com distribuio normal de mdia = 16g e desvio padro = 1g. Calcule a probabilidade de uma mulher apresentar uma hemoglobina de 16 - 18g por 100ml de sangue. - Calcule z - Consulte a tabela de distribuio normal reduzida - Com certeza voc encontrar a probabilidade de 47,72%.
ENTENDENDO BIOESTATSTICA BSICA PARTE II Paulo R. Margotto Professor do Curso de Medicina da Escola Superior de Cincias da Sade/SES/DF VIII-CORRELAO E REGRESSO
O termo correlao descreve a associao entre duas variveis. No exemplo, peso e altura, em quanto aumenta o peso medida que a estatura aumenta? O comportamento conjunto de duas variveis quantitativas pode ser observado atravs de um grfico denominado Diagrama de Disperso e medido atravs do Coeficiente de correlao. Diagrama de Disperso: Na representao grfica , importante sempre colocar no eixo das abscissas (horizontal) a varivel independente ou explanatria (X) e no eixo das ordenadas (vertical), a varivel dependente (Y). A correlao quantifica quo bem X e Y variam em conjunto Seja o exemplo do comprimento e peso de ces apresentados na tabela e o diagrama de disperso a seguir: Comprimento, em centmetros, e peso, em quilograma, de ces Comprimento Peso Comprimento Peso 104 23,5 98 15,0 107 22,7 95 14,9 103 21,1 92 15,1 105 21,5 104 22,2 100 17,0 94 13,6 104 28,5 99 16,1 108 19,0 98 18,0 91 14,5 98 16,0 102 19,0 104 20,0 99 19,5 100 18,3 Fonte: ARAJO e HOSSNE (1997)
Comprimento, em centmetros, e peso, em quilogramas, de ces O peso (varivel dependente), est representado no eixo das ordenadas e comprimento (varivel independente) est representado no eixo das abscissas . Observem que medida que o comprimento dos ces aumenta, o peso tambm aumenta e dizemos ento, que ambas variveis tm correlao positiva. Se uma varivel X cresce e Y diminui, dizemos que as duas variveis tm correlao negativa. Analisando o consumo dirio mdio de protenas em 14 pases (veja a figura a seguir), observamos que h uma relao inversa entre o consumo dirio de protenas e o coeficiente de natalidade, ou seja, nos pases onde o consumo dirio de protenas maior, o coeficiente de natalidade menor. Assim dizemos que estas variveis tem correlao negativa. bem provvel que a melhora da qualidade de vida de um pas , determine maior consumo de protenas e uma diminuio no coeficiente de natalidade. Consumo individual dirio de protenas de origem animal, em gramas, e coeficiente de natalidade, em 14 pases.
Consumo Pas individual dirio de protenas Formosa 4,7 Malsia 7,5 ndia 8,7 Japo 9,7 Iugoslvia 11,2 Grcia 15,2 Itlia 15,2 Bulgria 16,8 Alemanha 37,3 Irlanda 46,7 Dinamarca 56,1 Austrlia 59,9 Estados Unidos 61,4 Sucia 62,6 Fonte: CASTRO (1961)
Coeficiente de Natalidade 45,6 39,7 33,0 27,0 25,9 23,5 23,4 22,2 20,0 19,1 18,3 18,0 17,9 15,0
Consumo individual dirio de protenas de origem animal e coeficiente de natalidade em 14 pases
Coeficiente de correlao: O coeficiente de correlao (r de Pearson) expressa quantitativamente as relaes entre duas variveis. um nmero puro, usado para classificar a correlao em forte (r = 0,8-1), moderada (r = 0,5 - 0,8), dbil (r = 0,2 - 0,5), e insignificante (r = 0 - 0,2). O coeficiente de correlao um ndice de magnitude na qual se associam duas variveis. Clculo do r : xy - xy n r=
x2 (x)2 n y2 (y)2 n
Para entender, vejamos o seguinte exemplo de uma correlao positiva e negativa: Correlao Positiva X Y 1 1 2 2 3 4 4 5 5 8 Negativa X Y 1 7 2 4 3 4 4 3 5 1
Um exemplo de correlao perfeita positiva, um exemplo de correlao perfeita negativa e um exemplo de correlao nula
Para se obter o coeficiente de correlao, fazemos os clculos intermedirios e aplicamos na frmula: Clculos intermedirios para a obteno do coeficiente de correlao no caso do exemplo de correlao positiva
x y X2 Y2 1 1 1 1 2 2 4 4 3 4 9 16 4 5 16 25 5 8 25 64 15 20 55 110
xy 1 4 12 20 40 77
Com os valores apresentados na tabela, obtm-se:
r=
77 15.20 5 =
55 - 152 5 110 - 20 5
2
77 - 60 (55 45) (110 80)
= 17 = 0,98 300
Vejam que existe uma forte correlao entre X e Y Como vimos, a correlao indica o grau de associao entre duas variveis, ao passo que a regresso diz respeito capacidade de prever um valor baseado no conhecimento do outro (de prever Y dado que X seja conhecido). No Diagrama de Disperso, unindo os pontos correspondentes para cada par de valores de X e Y obtemos um segmento de reta (reta de regresso). Vejam os dados da tabela e a Reta de Regresso. Idade Peso mdio 3 14,6 4 16,3 5 17,8 6 19,8 7 21,6 8 23,8 9 26,3 10 28,4 11 30,9 Fonte: IBGE (1978) Idade 12 13 14 15 165 17 18 19 Peso mdio 34,2 38,7 43,4 49,7 52,7 57,3 58,1 59,4
Peso mdio, em quilogramas, de indivduos do sexo masculino, segundo a idade, no Distrito Federal
Para entendermos melhor regresso, veja o exemplo da quantidade de procana hidrolisada no plasma humano em funo do tempo decorrido aps a sua administrao. Tempo Quantidade (Minutos) Hidrolisada 2 3,5 3 5,7 5 9,9 8 16,3 10 19,3 12 25,7 14 28,2 15 32,6 Fonte: AVEN e FOLDES (1951)
Vejam que a quantidade de procana hidrolizada no plasma em funo do tempo decorrido aps a sua administrao pode ser descrita atravs de uma reta que em estatstica recebe o nome de Reta de Regresso. Agora,como fazer predices quanto aos valores de Y correspondentes aos valores de X que o papel da matemtica da regresso: para ajustar uma regresso linear simples, isto , a equao de uma reta, so necessrias a obteno dos coeficientes linear e angular da reta: - coeficiente angular: d a inclinao da reta ( representada por b) : na figura - coeficiente linear: a interseo da reta com o eixo X (representado por "c"): na figura
Para fazer uma anlise de regresso, o primeiro passo determinar a melhor reta de ajuste e para isto aplica-se o mtodo dos mnimos quadrados - method of least squares. Nenhuma reta passa por todos os pontos , sempre haver uma distncia vertical entre a linha e a maioria dos pontos do diagrama de disperso-resduo. O mtodo determina esta distncia para cada ponto e eleva o resultado ao quadrado. A linha considerada como a que melhor se ajusta a que resulta na menor soma dos quadrados dos afastamentos, ou seja, a reta de regresso a linha que faz mnima soma dos quadrados das desviaes de um e de outro lado dela (veja figura). Obtida a curva, encontra-se a equao matemtica correspondente e a capacidade de predizer um valor de Y e para cada valor de X. Frmulas b=
xy - xy n a = y - bx Y : media de Y ; X : media de X
x2 - (x)2 n
Voltando ao exemplo da quantidade de procana hidrolisada no plasma em funo do tempo decorrido aps a sua administrao, os clculos intermedirios esto representados na tabela a seguir: x y Xy X2 2 3,5 7,0 4 3 5,7 17,1 9 5 9,9 49,5 25 8 16,3 130,4 64 10 19,3 193,0 100 12 25,7 308,4 144 14 28,2 394,8 196 15 32,6 489,0 225 69 141,2 1589,2 767 x y xy x2
Aplicando as frmulas , temos: 1589,2 69.141,2 b=

8
767 - 69 8 a=
= 371,35 = 2,16 171,875
141,2 - 2,16 69 = - 0,98 8 8
Assim, a equao da reta de regresso : = - 0,98 + 2,16 X ( : so os valores calculados de Y) A equao da reta de regresso, permite calcular os valores de Y para quaisquer valores de X dentro do intervalo estudado, mesmo que estes valores no existam na amostra. Assim, o valor X = 13 no existe na tabela da quantidade de procana hidrolisada no plasma em funo do tempo decorrido, mas para calcular o Y, fazer = - 0,98 + 2,16 . 13 = 27,10 O valor de = 27,10 uma previso para a quantidade de procana que estaria hidrolisada 13 minutos aps a sua administrao. No estudo realizado por ns no Centro Latinoamericano de Perinatologia e Desenvolvimento Humano, sobre Curvas de Crescimento Intra-Uterinas, a correlao entre o peso pr-gravdico e o peso do RN foi de 0,22. A equao da reta foi: = 2547,79+12,8x Assim uma me com o peso pr-gravdico de 60kg espera-se um peso de 3315g Podemos utilizar o r2 ( r squared) ao invs do r. O r 2 chamado de coeficiente de determinao , cujo valor obviamente ser sempre menor ou igual a 1. Ele deve ser interpretado como a proporo da variao total que explicada ..
No exemplo do peso pr-gravdico e o peso ao nascer do nosso estudo em Montevidu, o coeficiente de determinao (r 2) foi de 0,222 = 4,84 5, sendo que o peso ao nascer e explicado pelo peso pr-gravdico em apenas 5%.
ENTENDENDO BIOESTATSTICA BSICA PARTE III Paulo R. Margotto Professor do Curso de Medicina da Escola Superior de Cincias da Sade/SES/DF
IX- RISCO RELATIVO/ RISCO ATRIBUVEL/ ODDS RATIO QUI- QUADRADO

O enfoque de risco se baseia na observao de que nem todos tm a mesma probabilidade (risco) de padecer um dano, mas que para alguns este risco (probabilidade) maior do que para outros. Esta diferena gera um gradiente de necessidade de cuidados, que vai deste um mnimo para os indivduos de baixo risco a um mximo para aqueles de alto risco (alta probabilidade de padecer o dano na sua sade no futuro). Neste estudo vamos discutir os fatores de risco, o clculo do risco relativo (para fatores isolados e fatores combinados) e a seleo de fatores de risco com fins de interveno (o risco atribuvel populao, ou seja, o impacto do controle do fator de risco no grupo exposto se neutralizssemos este fator: corresponde a meta do programa). Com estes conhecimentos, estaremos aptos a compreender com maior facilidade que os cuidados da sade no so igualitrios e requer que os recursos sejam redistribudos e usados com maior efetividade, de acordo com as necessidades dos indivduos ou grupos (dar mais aqueles com maior necessidade). I - Conceito de Risco
Conceituamos risco como probabilidade que tem um indivduo ou grupo de indivduos de apresentar no futuro um dano em sua sade. O conceito de risco probabilstico e no determinista. A primeira caracterstica do risco que incerto. Veja: RN com peso entre 500 - 1500g tem maior probabilidade de morrer (na Unidade de Neonatologia do HRAS: 19,58- ano 2000), mas muito deles no morrem. No se fala de risco de morrer nos que apresentam peso menor que 500g, pois a mortalidade neste grupo de 1000/mil nascidos vivos. Assim, risco uma medida que reflete a probabilidade de que ocorra um dano a sade.
II - Grau de Risco O grau de risco (alto, baixo) mede, antes da ocorrncia do dano, a probabilidade de que o dano ocorra no futuro. Dano aqui se refere a um resultado no desejando e no deve ser confundido com o risco; enquanto o dano em um RN seria a sua morte no perodo neonatal ou seqelas neurolgicas consecutivas asfixia, o risco a probabilidade de que o dano venha ocorrer neste RN, medindo-o como um gradiente que vai de risco alto a baixo risco de morte neonatal ou de seqelas neurolgicas, neste exemplo. O risco de que um evento ocorra (ou de que um resultado no desejado acontea, ou seja, o dano) varia de uma probabilidade zero (ou seja, de que nunca ocorra) a uma probabilidade uma (ou seja, de ocorrem em todas as pessoas). Quanto mais se aproxima do zero, se tratar de baixo risco de ocorrncia do dano e tanto quanto se aproxima a um, se tratar de alto risco para este dano. Como j enfatizamos inicialmente, o risco se refere a uma probabilidade: quando dizemos que uma gestante de Alto Risco por apresentar desnutrio e anemia e alm do mais, menor que 15 anos e me solteira, estamos mencionando que ela tem uma probabilidade maior que outras gestantes de ter problemas de sade no futuro, seja para ela mesma, para o feto ou para o RN. No temos certeza de que isto vai ocorrer, mas sabemos que a probabilidade (risco) de que venha a parecer algum determinado dano ou problema de sade maior para ela (Alto Risco) do que seria para uma mulher grvida que no apresenta estas caractersticas (baixo risco).
Assim, a importncia de graduar o risco para que possamos programar ateno segundo o enfoque de risco, priorizando o grupo, dentro da populao de maior necessidade. O esquema abaixo resume.
se obtm maior impacto controlar preferencialmente : Fundamento do enfoque de risco
ao
Os problemas de sade no tem a mesma importncia
Os problemas mais importantes nos subgrupos mais afetados, concentrando esforos nos indivduos de Alto Risco
III - Fator de Risco: O fator de risco definido como a caracterstica ou atributo cuja presena Os problemas no ocorrem se associa com um aumento da probabilidade de padecer o dano. Veja o exemplo: a igualmente na populao gestante que fuma tem maior probabilidade (risco) de ter um RN de baixo peso ao nascer em comparao com a gestante no fumante. Assim, o fumo um fator de risco para padecer o dano ou problema (o baixo peso ao nascer). Os fatores O risco do dano no o de risco so caractersticas que tem uma associao prtica e mesmo para todos os estatstica significativas com um resultado no desejado especfico e definido (dano). O conceito de risco est vinculado a um dano especfico. Assim, devera definir-se qual o dano a que referimos (mortalidade infantil, neonatal, perinatal, baixo peso ao nascer, etc) e em funo deste dano, os fatores que se associam devero se analisados.
Exemplo 1: Dano Baixo peso Fatores de Risco Pobreza, analfabetismo da me Desnutrio, baixa estatura, doenas intercorrentes
Exemplo 2: Dano Morte Perinatal Fatores de Risco Hipertenso, idade avanada da me, baixo peso, ausncia de pr-natal
O mesmo fator de risco em um determinado caso, segundo seja o objetivo, pode ser qualificado como dano por outro trabalhador em sade com propsitos diferentes. O Obstetra considera o baixo peso ao nascer como um dano que se pode prevenir com o controle pr-natal e com o seguimento da gravidez de alto risco. Para o Neonatologista, o baixo peso ao nascer um fator de risco para a asfixia, desconforto respiratrio, hipoglicemia, sepse, hemorragia intracraniana, etc. Os fatores de risco podem ter ou no relao causal com o dano e til selecion-los quanto a sua capacidade ou poder de predico da ocorrncia futura do dano (isto , sua direta relao com a fora da associao entre o fator e o dano observado no passado). Assim, os fatores de risco podem ser classificados em: causais, no causais. Os critrios para determinar se uma relao causal incluem: - Ter forte associao com o dano - Reduo do dano ao reduzir a exposio ao fator suspeito de causalidade (controlar a progresso da toxemia, evitar o baixo peso ao nascer). - Precedncia do fator em relao ao dano
- Consistncia da associao em estudos repetidos - Coerncia dos resultados com os conhecimentos existentes. A possibilidade de modificar os fatores de risco constituem outro critrio de classificao a) modificveis pelo setor de sade (ou seja, se h disponibilidade de tecnologias eficazes, factveis e viveis para reduzir a prevalncia do fator ou a exposio ao mesmo; exemplo: - hbito de fumar com relao ao cncer de pulmo - A m nutrio como causante de baixo peso pode ser modificada com campanhas educativas e de vigilncia nutricional. b) modificveis por ao de outros setores - exemplo: deficiente abastecimento de gua potvel com o dano diarria infantil. c) No modificveis - exemplo: me com idade menor que 16 anos em relao com o dano baixo peso ao nascer. Neste caso, pode ser efetuado, pelo menos intervenes a nvel populacional para se obter modificao no futuro (diminuir os nascimento de mes com idade nas quais tem sido encontrada maior freqncia de baixo peso em comparao com outras idades). Ao selecionar um determinado fator com fim de control-lo ou diminuir seus efeitos, alm de que este fator deve estar estreitamente associado com um resultado no desejado (dano), que, tambm deva ter uma freqncia na comunidade que o torne operacional o seu controle. Os fatores com uma alta freqncia na populao devem se selecionados na medida em que se pode intervir a nvel comunitrio para seu controle. Por outro lado, a seleo de indivduos de alto risco tem por objetivo concentrar em uma minoria com maior necessidade, o mximo de recurso, j seja referindo-os a um nvel mais superior de ateno ou aumentando a ateno no seu nvel. A nvel individual, os fatores no devem ter uma freqncia que por ser muito alta, impea de separar do total uma porcentagem operativa de indivduos com uma determinada condio de risco.
Vantagens de aplicao do enfoque de risco na ateno da sade: - Se conhecemos as probabilidades de adoecer ou morrer em um indivduo ou grupo, podemos evit-las ou reduzilas com aes. O enfoque de risco constitui um mtodo de carter essencialmente preventivo e o fundamento epidemiolgico da regionalizao do cuidado da sade. - Pode ser considerado como uma estratgia com possveis efeitos favorveis na qualidade do cuidado da sade incluindo os aspectos relacionados com a humanizao. Favorece um timo aproveitamento dos recursos ao permitir a adequao deles com as necessidades. Acelera o impacto favorvel sobre a sade sem um crescimento paralelo do gasto em sade. IV - Risco Relativo/Qui-quadrado Na seleo dos fatores de risco de acordo com o seu valor operacional importante eleger ento os numerosos fatores suspeitos, aqueles que, alm de estar fortemente associados ao dano, sejam controlveis e no sejam nem excepcionais e nem demasiado freqentes e que sirvam para: 1. Constituir um instrumento de deteco ou predico de risco (permite separar na populao, indivduos ou grupos com diferentes graus de risco (alto ou baixo risco) de apresentar o dano futuro. 2. Obter uma dimenso do dano na populao (mediante estratgias de interveno dirigidas a sua erradicao, reduo de sua intensidade ou freqncia nas pessoas ou grupos. O fato de existir uma diferena de freqncia do dano entre os expostos e os no expostos ao fator de risco indica uma associao de fator, com o dano, sempre que esta diferena no seja facilmente atribuvel ao azar (significao estatstica). A fora desta associao constitui um critrio importante na seleo do fator de risco. Duas medidas desta fora so: - RR: risco relativo (risco de um em relao ao outro: mede a potncia da associao)
- RA: risco atribuvel - Risco Relativo (RR): a relao do quociente entre o risco de ter um dano nos que esto expostos ao (s) fator(s) de risco em estudo, comparado com o risco dos que no esto. Mede o excesso de risco para um dado dano nos indivduos expostos ao fator de risco, comparado com os que no esto expostos. Para facilitar o clculo Fator Sim No Total Patologia Sim a c a+c No b d b+d Total a+b c+d n(a+b+c+d)
RR = a/ a+b c/c+d
RR = incidncia do dano nos que tem o fator (p 1 = a/a+b) Incidncia do dano entre os que no tm fator (p2 = c/c+d) IV-1) Clculo do risco em estudo : baixo peso - populao total estudada: 6.373 - mortes perinatais observadas: 211 - % da populao com fator baixo peso: 11,36% (11,36% de 6.373 = 724) - % de mortes perinatais com o fator baixo peso: 71% (71% de 211 = 150)
Hiptese a ser examinada: o risco de morte perinatal maior nos produtos com peso menor que 2500g de que nos produtos com peso maior que 2500g. Apresentao dos dados: Morte perinatal Total Sim No 150 (a) 574 (b) 724 a+b 61 (c) 5.588 (d) 5.649 c+d 211 6.162 6.373 (a+c) (b+d) n(a+b+c+d) Observem os quadrinhos a,b,c,d, a+b, a+c, b+d, c+d e n; a: presena do fator e o dano (150 produtos de baixo peso e com morte perinatal): verdadeiros positivos. b: presena do fator sem o dano (574 produtos de baixo peso sem morte perinatal): falsos positivos c: ausncia do fator com o dano (61 produtos com peso maior ou igual a 2500g com morte perinatal) falsos negativos. d: ausncia do fator sem o dano (5.588 produtos com peso maior ou igual a 2500g sem morte perinatal) verdadeiros negativos. a+b: total exposto ao fator de risco (724 produtos com baixo peso) c+d: total de no expostos ao fator de risco (5.649 produtos com peso maior ou igual a 2500g) a+c: total dos produtos com dano (211) b+d: total dos produtos sem dano (6.162) a+b+c+d (n): total dos produtos estudados (6.373) n: populao estudada Tcnica da prova de hiptese RR = a/a+b, ou seja, p1 Fator baixo Peso Sim No Total
c/c+d RR = 150/724 = 19,2 61/5.649
p2
Leitura dos resultados: o risco de morte perinatal de um produto de baixo peso excede 19,2 vezes a de um produto de peso maior ou igual a 2500g. Uma vez feito o clculo do RR, torna-se necessrio demonstrar que: 1. o dado no contm erros de registros, computo ou transcrio. 2. o baixo peso um fator independente de outro, queremos dizer, no atua sobre o dano atravs de outros fatores e tem uma relao direta sobre o dano ainda que na presena de outros fatores. 3. RR prtico e estatisticamente significativo. Um risco relativo menor que 1,5 geralmente no de valor prtico. Mais adiante mostraremos como se faz o clculo da significao estatstica do RR O risco relativo mede a incidncia do dano (mortalidade perinatal, neste caso) em um grupo exposto ao fator (baixo peso no caso) em relao ao grupo no exposto. Vejamos outro exemplo: ausncia de pr-natal como fator de risco para morte perinatal e neonatal. a) fator de risco em estudo: ausncia do pr-natal - populao estudada: 6.373 - mortes perinatais observadas: 211 - % da populao com o fator ausncia de pr-natal: 43% - % de mortes perinatais com o fator ausncia de prnatal: 55,45% Hiptese a se examinar: o risco de morte perinatal maior nos produtos com ausncia de pr-natal do que nos produtos com prnatal presente
dano Ausncia
de pr-natal
Fator Mortalidade Perinatal Total
sim
no
Sim
117 (a)
No
2.625 (b) 2. 742 (a+b)
Total
94 (c) 3.537 (d) 211 (a+c) 6.162 (b+d)
3.631 (c+d) 6.373(n= a+b+c+d)
Tcnica da prova de hiptese RR = 1,6 Leitura do resultado: o risco de morte perinatal de um produto sem pr-natal excede 1,6 vezes a de um produto com pr-natal. Realizando o X2 (qui-quadrado), calculado pela frmula: ( [axd b x c] )2 (a+b) x (d+c)x (b+d)x (a+c) (com correo de Yates ou correo de continuidade). Temos X2 = 13,71. Comparando o valor calculado de X 2 (qui-quadrado) com o valor da tabela ( tabela A-2, no final) ao nvel de significncia estabelecido e com n 1 graus de liberdade (n de colunas 1 x fila 1), toda vez que o X 2 for igual ou maior do que o valor da tabela, dizemos que significativo. O valor 13,71 com grau de liberdade 1 maior que 3,84(nvel de significncia 5%) e maior que 6,64 (nvel de significncia 1%). O X 2 tem restries entre as quais: s deve ser aplicado quando a amostra tem mais de 20 elementos, todas as freqncias esperadas tem que ser menor que 1. Se amostra for menor que 20 e conter zero na freqncia esperada, fazer a prova de Fisher (vide adiante). Assim, podemos dizer que h uma associao significativa (p < 0,01) entre ausncia de pr-natal e morte perinatal, sendo que grau de associao : o risco de morte perinatal 60% maior nos produtos sem pr-natal (1,6 x 100 = 160: aumento de 60%: 100 + 60) ou o risco de morte perinatal nos produtos sem pr-natal excede 1,6 vezes dos produtos com pr-natal. Realizando os mesmos clculos, o risco de morte neonatal (nos primeiros 7 dias de vida) de um produto sem pr-natal excede 2 vezes a de um produto com pr-natal. Vejamos a apresentao dos dados:
Fator dano Ausncia de Sim Pr-natal No Total
Morte Neonatal Sim No 58 2.625 38 3.573 96 6.162
Total 2.683 3.575 6.258
Risco Relativo (RR): 2,0 X2 - 11,8 (p< 0,01) Interpretao do RR e intervalo de confiana Como vimos, o risco se define com a probabilidade de que a patologia se desenvolva, isto , o nmero de casos novos de uma populao em um tempo dado: varia de 0 (nenhum caso) a 1 (todos esto doentes). O RR o risco de adoecer em um grupo (grupo exposto) em relao ao risco de adoecer em outro grupo (pessoas no expostas). Se no houver associao entre a exposio e a doena, o risco de adoecer no depende da exposio e o RR igual a 1. Um risco menor que 1 implica em uma reduo da doena com exposio, enquanto que um RR maior que 1, sugere um aumento da doena com exposio. Quanto maior for o RR, maior ser a associao entre a exposio e o dano. Junto com a obteno do RR se deve estimar o seu intervalo de confiana de 95%, uma vez que possvel obter um valor do RR alto, mas se o tamanho da amostra for pequeno, o seu valor ser duvidoso. Se o extremo inferior do intervalo de confiana exceder o valor de 1, se pode considerar igual um teste de significao estatstica. H vrias frmulas simplificadas para estimar o intervalo de confiana: para o RR (risco relativo), o limite de confiana de 95% igual a: 1 RR X2 1,96: valor de z para freqncia de 0,025 x2 : raiz quadrada do qui-quadrado Os valores superior e inferior se calculam elevando o RR ao resultados da soma e diminuio do valor da razo 1,96/ x 2. 1,96
Os limites de confiana esto muito relacionados com os valores de p e se no inclui o valor de 1, equivalente a significao estatstica a um nvel de 5%. Vamos ao exemplo: - no caso de ausncia pr-natal/mortalidade perinatal RR calculado: 1,6 X2 = (qui-quadrado sem a correo de Yates): 13,8
1 1 ,96 13,8 RR 1,96 3,7 1 + 0,53 RR RR1 - 0,53 1,53
1,61,53 = 2,05 e 1,6 0,47 = 1,2 O intervalo de confiana a 95% : ...1...1,2_____________2,05
RR RR
0,47
Como o extremo inferior deste intervalo de confiana excede o valor 1, se pode dizer, neste caso, que h uma associao estatisticamente significativa em um nvel de 5% entre a ausncia de pr-natal e mortalidade perinatal, sendo que o risco de morte perinatal nos produtos sem pr-natal excede, significativamente 1,6 vezes a dos produtos com pr-natal. No caso de ausncia de pr-natal/mortalidade neonatal: (faa voc mesmo os clculos, usando uma calculadora cientfica): RR = 2 Intervalo de confiana a 95% ...1...1,3 2,9 Vemos assim, que h uma associao estatisticamente significativa em um nvel de 5% entre ausncia de pr-natal e mortalidade neonatal, sendo que o risco de morte neonatal nos RN cujas mes no fizeram pr-natal excede 2 vezes a dos RN cujas mes fizeram pr-natal. IV-Clculo do Risco Relativo dos Fatores Associados O clculo do Risco Relativo de ter um problema de sade associado a fatores combinados no ser apresentado aqui pela sua
complexidade. No entanto, frisamos que no processo de seleo dos fatores importante determinar se os que podem encontrar-se em um mesmo indivduo so independentes um dos outros, isto , esto associados ao dano, mas no entre si. Sendo independentes, devem ser considerados para a construo do instrumento de predico. Caso sejam dependentes, ou seja, um atua atravs do outro, basta incluir somente um deles. A prova de independncia de 2 ou mais fatores se faz comparando o RR resultante do produto do RR de cada fator isolado (RR esperado com RR dos fatores de risco combinados: veja o exemplo: (de Sarue, E. e cl) Gestante com 40 anos ou mais: RR = 1,8 Paridade de 5 ou mais : RR = 1,4 Produto do RR dos fatores isolados (RR esperado): RR = 2,5 Fazendo clculo do RR dos fatores combinados, temos o valor de 1,3. Como interpretamos: como o RR dos fatores combinados (gestantes com 40 anos ou mais e paridade de 5 ou mais) MENOR que o RR esperado, podemos concluir que estes dois fatores so independentes. No caso do RR dos fatores combinados for MAIOR que o RR esperado (produto dos fatores isolados), podemos concluir que os fatores esto misturados em alguma proporo, no so independentes e que a influncia de um potencia a influncia do outro. IV-3-Seleo dos fatores de risco com fins de interveno (Risco Atribuvel) Na formulao de programas de cuidados da sade preciso identificar em que medida um fator de risco contribui para o dano na comunidade. Assim, alm de conhecer o RR do fator (ou seu grau de associao com o dano) vamos agora conhecer que nvel de risco representa este fator pela sua freqncia na comunidade (se a freqncia for baixa, no ter importncia para a ao de controle, uma vez que representa baixo risco para a comunidade). Assim, temos a definio de Risco Atribuvel (RA): este mede a percentagem da incidncia do dano que se reduz no grupo exposto ao fator, se este fosse neutralizado (impacto do controle no grupo
exposto). Quando se refere populao, temos o risco Atribuvel Populao (RAP): RA TAXA DE INCIDNCIA NO GRUPO Com fator de risco (P1) MENOS Taxa de incidncia no grupo sem o fator de risco (P2)
O RA outra medida de associao entre fatores e danos e pode ser definido com a diferena entre a probabilidade ter o dano nos que esto expostos ao fator e a probabilidade de ter o dano nos que no esto expostos. Assim, a diferena de probabilidade atribuvel exposio ao fator e se expressa como: RA = P1 P2 Vejamos um exemplo: No exemplo do fator ausncia de pr-natal e o dano mortalidade perinatal visto anteriormente, o risco atribuvel : (consulte a matriz de deciso anterior). RA = P1 P2 P1 = 117/ 2.742 = 0,043 P2 = 94/ 3.631 = 0,26 RA = 0,043 0,26 = 0,017 Como interpretar este valor de RA: significa que 17 mortes perinatais de cada 1.000 (mil) gestantes so atribuveis presena do fator ausncia de pr-natal. Para saber o que isto significa em uma comunidade especfica, necessrio relacionar esta probabilidade (0,017) com a freqncia do fator na populao. Se a sua freqncia for excepcional, esta probabilidade atuar sobre poucas gestantes. Se for muito freqente, o impacto ser maior. A forma de estimar o impacto calculando o Risco Atribuvel ao fator da populao (RAP). Para calcular o RAP emprega-se a seguinte frmula:
RAP%
F% (P1 P2) P (geral)
P1 P2 = a probabilidade encontrada F% = a freqncia do fator na populao P (geral) = a probabilidade do dano entre todas as gestantes
No caso, temos: RAP% = 43 X 0,017 = 22 % 211 / 6.373
Significa que 22% da probabilidade de mortalidade perinatal da rea em estudo, est associada freqncia do fator ausncia de pr-natal em 43% das gestantes.
Portanto, se fosse possvel controlar este fator em todas as gestantes que o apresentam, o impacto (meta do programa) que poderia obter seria a reduo da taxa de mortalidade perinatal em 22%. Vamos a seguir calcular o RAP para ausncia de pr-natal e morte neonatal.(consulte a matriz de deciso anterior) RAP = 43. (0,021 - 0,010) = 30% 96/6258 Como interpretar? Significa que 30% da probabilidade mdia de mortalidade neonatal da rea em estudo est associada freqncia do fator ausncia de pr-natal em 43% das gestantes. Qual a importncia de conhecer este fato: se fosse possvel controlar este fator em todas as gestantes que o apresentam, o impacto que se poderia obter seria a reduo da taxa de mortalidade neonatal em 30%. Tal como o RR, o RAP merece calcular o seu intervalo de confiana de 95%. Neste caso, o extremo inferior do intervalo deve ser
superior a zero e no a 1, como no RR. Por ser muito complexo o seu clculo matemtico, deixaremos de apresent-lo. V-Odds Ratio (OR) ou Razo das chances. Os estudos de casos-controles comparam a freqncia de expostos a um determinado fator entre um grupo de indivduos que apresenta a doena casos e outro que no a tem controle. Nestes estudos se ingressa pelo dano, isto , um grupo de indivduos doentes se estuda a exposio ao(s) fator(es) comparado contra um grupo de indivduos sem esta patologia, expostos ao(s) mesmo(s) fator(es). Aqui estamos lidando com grupos: um portador da condio (doena) e outro no portador da condio (controle). Estes estudos tambm so chamados de estudos retrospectivos, pois a partir da doena-dano se busca para trs fator (es) de exposio. Veja o esquema: Fator Sim No DANO Sim No a B c D a+b b+d
n (a+b+c+d)
Assim, a soma horizontal no tem sentido (se pode conhecer todos os enfermos e s um nmero muito pequeno dos no doentes). Assim, torna-se impossvel calcular o RR como aprendemos anteriormente e ento, usamos um estimador indireto do RR que a razo dos produtos cruzados ou de chance (Odds Ratio OR): OR = a x d Este um bom estimador do RR sempre que a prevalncia do b x c dano nos no expostos seja igual ou menor que 5%. A razo das chances (OR) definida como a probabilidade de que um evento ocorra dividido pela probabilidade de que ele no ocorra. Quando o(a) pequeno com relao a (b) e o (c) pequeno em relao a (d), os resultados entre RR e o OR so muitos semelhantes. Uma vez calculada a OR, preciso estimar o seu intervalo de confiana de 95%: se o extremo inferior deste exceder o valor de 1, se pode considerar igual que um teste de significao estatstica.
Como fazemos: 1. tirar o logaritmo neperiano (ln) da OR (logaritmo dos nmeros naturais) 2. calcular o desvio padro (dp) do ln OR com a seguinte frmula: dp (ln 0R) = 1+1+1+1 a b c d
3. multiplicar o dp (ln OR) por 1,96 4. o resultado obtido em 3, se soma e se resta do ln OR 5. aos valores obtidos , se calcula o antilogartmo neperiano e assim, se obtm o limite inferior e superior do intervalo de confiana: se no incluir o valor 1, equivalente a significao estatstica a um nvel de 5% ( frente, um exemplo para ficar mais claro). Vamos calcular o intervalo de confiana da OR = 1,7 1. 2. log neperiano: ln OR = 0,53 dp(lnOR)= 1 + 1 + 1 +1
= 0,14 2625 117
94 3537
3. 0,14 x 0,2744 4. 0,53 - 0,2744 = 0,25 antilogartmo = 1,28 0,53 + 0,2744 = 0,80 antilogartmo = 2,2 5. 1,28 lnOR - 1,96 dp(lnOR) 1,7 2,2 lnOR + 1,96 dp(lnOR)
Este intervalo de confiana (1,28 ...2,2) no contm 1: equivalente a significao estatstica a um nvel de 5%.
ENTENDENDO BIOESTATSTICA BSICA PARTE IV Paulo R. Margotto Professor do Curso de Medicina da Escola Superior de Cincias da Sade/SES/DF
X- Teste de Hipteses
Na maioria das vezes, o pesquisador toma deciso para toda populao, tendo examinado apenas parte desta populao (amostra). Este processo chama-se de inferncia. Na pesquisa cientfica, a inferncia feita com a ajuda de testes estatsticos. Para a compreenso de um teste estatstico preciso que entendamos o que vem a ser Hiptese Nula (H0) e Hiptese Alternativa (H1). Hiptese uma conjectura, uma resposta presumida e provisria que, de acordo com certos critrios, ser ou no rejeitada. Hiptese Nula (H0): aquela que simplesmente afirma que no h diferena entre os grupos estudados; trata-se de uma hiptese que atribui ao acaso a ocorrncia do fenmeno ou resultado observado. Hiptese Alternativa ou experimental (H1): aquela que afirma que h diferena entre os grupos estudados. O principal objetivo de testar uma hiptese responder seguinte questo: dadas duas amostras so elas realmente diferentes ou pertencem a uma mesma populao, ou em outras palavras, as diferenas encontradas entre duas ou mais amostras so verdadeiras ou podem ser explicadas pelo acaso. O processo de testar hiptese consiste em seis etapas: 1. Estabelecer a H1 ( se l ag 1) 2. Estabelecer a H0 ( se l ag zero) 3. Determinar o tamanho da amostra 4. Colher os dados 5. Realizar teste estatstico para verificar a probabilidade de que a H0 seja verdadeira 6. Rejeitar ou no a H0
Segundo R. A Fisher, se pode dizer que todo experimento existe somente com o propsito de dar aos fatos uma oportunidade de afastar a hiptese nula. Ao afastar a hiptese nula, estamos afirmando a validez da hiptese alternativa. Todo experimento realizado para testar uma hiptese. O pesquisador formula uma hiptese, observa, analisa e em seguida conclui. Aps observar, o pesquisador descreve e mede. Jamais atribuindo juzos de valor ao que est sendo visto; o pesquisador pode decidir erroneamente e rejeitar a hiptese nula sendo ela verdadeira (Erro tipo I). Assim, o pesquisador aceita como verdade uma diferena que na realidade no existe e que na verdade, se deve variabilidade das amostras. Quando a hiptese H0 falsa e o pesquisador no a rejeita, dizemos que ele cometeu um Erro tipo II, significando que existia, de fato, uma diferena que no foi reconhecida. Assim: Erro tipo I: (erro alfa) Erro tipo II : (erro beta) rejeita a H0 sendo verdadeira (fato obtido por azar: rara ocorrncia estatstica) aceita a H0 sendo falsa (erro mais freqente)
A probabilidade (p) de rejeitar a H 0 quando a H0 verdadeira, o que chamamos de nvel de significncia do teste. O estatstico no sabe quando rejeita a H0, se est ou no cometendo erro, mas sabe a probabilidade de cometer este tipo de erro. Se a probabilidade for suficientemente pequena (< 5%), a deciso de rejeitar a H 0 est bem fundamentada. O nvel de significncia representado pela letra grega (l-se alfa). O nvel de significncia o nome com que se designa a probabilidade . Vejamos o exemplo: Feito um experimento com duas drogas (A, B), o pesquisador pergunta se a droga A cura tanto quanto a droga B. O estatstico v a pergunta do pesquisador como duas hipteses: a) H0: a proporo de pacientes curados com a droga A igual proporo de pacientes curados com a droga B
b) H1: a proporo de pacientes curados com a droga A diferente da proporo de pacientes curados com a droga B. Feitas as hipteses, o estatstico estabelece o nvel de significncia do teste. O nvel de significncia seria a probabilidade (p) de afirmar que uma das drogas determina maior proporo de curas, quando na verdade, a proporo de pacientes curados a mesma, seja a droga A ou B. usual manter o nvel de significncia de 1% e 5% um de 5% significa que cometemos um erro (tipo I) de 5% em rejeitar a H0 (sendo verdadeiro) e aceitar H 1 (1 em cada 20 se comete o Erro tipo I ao rejeitar a H 0). Um de 1% (0,01), significa que ao rejeitar a H0 e aceitar a H1, o risco de estarmos errando, ou seja, cometendo um erro tipo I de 1%. O nvel de significncia representa a mxima probabilidade de tolerar um erro tipo I. Assim: erro I e erro II erro I e erro II
Os erros ocorrem ao testar hipteses por diferentes motivos: - Erro tipo I: amostras pequenas (h uma maior chance de serem diferentes quanto menores forem; numa amostra maior, estas diferenas se diluiriam). - Erro tipo II: amostras pequenas grande quantidade de amostras Algum erro sempre ocorre, sendo til admitir que para o Erro tipo I ou alfa, considera-se que 5% aceitvel e para o tipo II ou beta, aceita-se geralmente 10 - 20%. Tamanho da Amostra Para determinar o tamanho da amostra preciso estabelecer qual a diferena deve ser considerada significativa. Esta uma
deciso arbitrria do pesquisador, baseada na experincia, na literatura e/ou na relevncia clnica. Para determinar o tamanho da amostra, deve-se considerar o nvel de significncia adequado: quanto de probabilidade aceitvel para que H0 seja verdadeira. Geralmente considera-se uma probabilidade menor ou igual a 5% como adequada (p 0,05). Devese tambm definir um erro beta (erro tipo II) aceitvel: se aceitamos um erro beta de 0,1 estamos aceitando uma chance de 10% de deixar de reconhecer uma diferena que realmente existe. Para fins prticos: - Amostras grande: n > 100 - Amostras mdias: n > 30 - Amostras pequenas: n < 30 - Amostras muito pequenas: n < 12 Lembrar que: quanto menor a diferena a ser detectada, maior dever ser o tamanho da amostra quando menor o nvel de significncia (p), maior deve ser o tamanho da amostra. A etapa seguinte consiste na coleta de dados, lembrando que maus dados levam igualmente a ms concluses. Uma vez obtidos os dados, faz-se a anlise estatstica aplicandose testes escolhidos em funo do tipo de dados disponveis.
XI- TESTE DE FISHER OU DA PROBABILIDADE EXATA

O teste de Fisher usado para amostras pequenas e produz menos erro tipo I e II em relao ao teste do qui-quadrado. O teste de Fisher permite calcular a probabilidade de associao das caractersticas que esto em anlise, ou seja, de elas serem independentes. Assim, o teste de Fisher utilizado nas seguintes situaes: - n < 20 - n > 20 e < 40 e a menor freqncia esperada for menor que 5.
O teste de Fisher calcula a probabilidade de que a matriz de deciso usada tenha sido obtida por acaso e, portanto, sem mudar os totais das colunas e linhas, o teste de Fisher contrai todas as tabelas possveis. Os softwares estatsticos, na sua maioria so capazes de aplic-lo. Vejamos os exemplos: a) quando houver uma clula na matriz de deciso com o valor zero: Supondo a presena de uma determinada enzima em pessoas submetidas a uma reao sorolgica Enzima Presente Ausente 5 1 0 3 5 4
Reao + Total
Total 6 3 9
A probabilidade igual ao produto dos fatoriais dos totais marginais pelo fatorial do total geral multiplicado pelo inverso dos produtos dos fatoriais dos valores observados em cada classe. P = (a + b !) x (c + d !) x (a + c !)x (b + d !) n ! x 1 / a! b! c! d! Aplicando a frmula temos: P = [ (6! 3! 5! 4!)/ 9!] x [ 1/(5! 1! 0! 3!)] 10 de fatoriais de 0 - 20) (consulte no final a tabela A-
P= [ (720 x 6 x 120 x 24)/ 362880] x [ 1/(120 x 1x 1x 6)] ! : fatorial; 0!: fatorial de 0 = 1 Resolvendo, temos p = 0,046 = 4,76% Como este valor menor que 5%, a hiptese das caractersticas serem independentes rejeitada dizendo-se que a sua associao no casual, ou seja, as pessoas submetidas a uma reao sorolgica apresentam significativamente uma determinada enzima (afastamos a H0).
b) se no houver clula com valor zero na matriz de deciso. Para isto devemos fazer: 1. calcular a probabilidade idntica ao escrito acima 2. construir outra tabela 2 x 2, subtraindo-se uma unidade dos valores da diagonal que contenha o menor nmero de casos e adicionando esta unidade aos valores da outra diagonal. 3. Calcular novamente a probabilidade 4. Este processo continuar at que se atinja o valor 0 5. Somar todas as probabilidades calculadas Exemplo: supondo que os valores obtidos sejam: Reao + Total Enzima Presente Ausente 5 3 2 5 7 8 Total 8 7 15
Calcularamos: total 5 3 8 2 5 7 7 8 15 total 6 2 8 1 6 7 7 8 15 P = (8! 7! 7! 8!/15) (1/5! 3! 2! 5!) P = 0,1828
total
total
P = (8! 7! 7! 8!/15) (1/6! 2! 1! 6!) P = 0,0305
total
total 7 1 8 0 7 7 7 8 15
P = (8! 7! 7! 8!/15) (1/0! 7! 1! 7!) P = 0,0012
p = 0,1828 + 0,0305 + 0,0012 = 0,2145 = 21,45% Neste caso, como o valor encontrado de P maior que 5%, a hiptese das caractersticas serem independentes aceita, dizendo-se que a sua associao casual, ou seja, neste exemplo as pessoas submetidas a uma reao sorolgica no apresentam significantemente uma determinada enzima (no afastamos a H 0).
ENTENDENDO BIOESTATSTICA BSICA PARTE V Paulo R. Margotto Professor do Curso de Medicina da Escola Superior de Cincias da Sade/SES/DF XII- Teste t
s vezes os pesquisadores necessitam de testar se o QI mdio de uma amostra de crianas nascidas prematuramente ( que igual a 100) igual ao QI das demais crianas nascidas a termo ( valor j conhecido na literatura). Outras vezes necessrio a comparao de condies experimentais, como, testar uma droga: um grupo recebe a droga (grupo tratado) e o outro grupo no recebe o tratamento (grupo controle). O efeito do tratamento ser dado pela comparao dos dois grupos (comparao de duas mdias). O teste mais comumente usado para analisar um grupo simples ou comparao de dois grupos o teste estatstico Students t-test ou o Teste t . O nome deste teste refere-o ao pseudnimo usado por W.L. Gosset, uma vez que a companhia na qual trabalhava (Guinnes Brewing Company) no permitiu publicar sua pesquisa usando seu prprio nome e assim publicou com o nome Student. importante para a aplicao do Teste t que a varivel em estudo tenha distribuio normal ou aproximadamente normal. Passos: Nvel de significncia: letra grega Mdia de cada grupo: X1: mdia do grupo 1 X2: mdia do grupo 2 Varincia de cada grupo: S2 1: varincia do grupo S2 2 varincia do grupo 2 Varincia Ponderada: S2 = (n1 - 1)2 + (n2 1)S22 n1 + n 2 2
n1 o nmero de elementos do grupo 1 e n 2 o nmero de elementos do grupo 2. O valor t definido pela frmula t=
S
2
X2 - X1 1 n1
+
1 n2
Uma vez obtido o valor de t (t0 calculado), devemos comparar o t0 com o t crtico (tc) que obtido em uma tabela de valores de t (tabela A-6 no final), ao nvel de significncia estabelecido e com ( n1 + n2 2) graus de liberdade (consulte no final a tabela de valores de t, segundo os graus de liberdade e o valor de ). Se o valor de t0 for maior ou igual a tc (t 0 tc), significa que as mdias no so iguais ao nvel de significncia, podendo-se assim afastar a H0 (hiptese nula), ou seja, podemos afirmar que o valor observado tem < 5% de chance de ocorrer por acaso e 95% de chance de no ocorrer. Vamos a um exemplo: Verificar se duas dietas para emagrecer so igualmente eficientes ou se uma determinada dieta foi melhor (produziu significativamente menor perda de peso) em um determinado grupo. Vejamos os dados: Perda de peso em kg segundo a dieta Dieta 1 Dieta 2 12 15 8 19 15 15 13 12 10 13 12 16 14 15 11 12 13 Inicialmente, vamos estabelecer o nvel de significncia: = 5%
Clculos: Mdia de cada grupo X1 = 12 + 8 +... + 13 = 120 = 12 10 10 X2 = 15 + 19 + ... 15 = 105 = 15 7 7 Varincia de cada grupo S21 = 4 S22 = 5 Varincia ponderada S22 = 9 x 4 + 6 x 5 = 4,4 9+6 Valor de t 15 12 t= = 2,902
Graus de liberdade: n1+ n2 - 2 = 10 + 7 2 = 15 graus 4,4 ( 1+ 1) de liberdade ( os graus de liberdade nada mais 10 7 so do que uma forma de fazer uma correo em funo do tamanho da amostra e do nmero de combinaes possveis). Observado os valores de tc na tabela A-6, vemos que o t0 de 2,902 maior que o tc (valor encontrado na tabela com de 5% e 15 graus de liberdade).Assim, conclumos que a perda de peso dos dois grupos de pacientes submetidos aos dois tipos de dieta diferente e assim, afastamos a hiptese nula que afirma que no h diferena entre os grupos e aceitamos a hiptese alternativa (H 1), podendo ser afirmado que a perda de peso significativamente maior no grupo de pacientes submetidos dieta 2. Outro exemplo: Um pesquisador testou uma nova droga e quis verificar se ela era melhor para tratar determinada doena que o tratamento clssico vigente. Para isso, mediu os tempos de recuperao em dois grupos, A e B, obtendo os seguintes resultados.
Tempo de recuperao X Tratamento Tempos de recuperao (dias) Tratamento Tratamento Clssico Novo Grupo A Grupo B 10 6 8 7 14 6 12 8 15 7 9 9 8 6 A H0 diz que no h diferena entre os dois grupos. A primeira vista parece que o novo tratamento reduziu o tempo de recuperao, mas para termos certeza, temos que afastar a H 0. Realizando os clculos, o t0 = 3,315. Recorrendo a tabela A-6 com os valores de tc, vemos que o tc com 12 graus de liberdade e = 5% (nvel de significncia) 2,179, portanto o t 0 > tc e assim, podemos rejeitar a H0, ou seja, podemos dizer que h uma diferena estatisticamente significativa entre os dois tratamentos. Quando a varincias so desiguais, a frmula do teste t : X2 X1 S2 1 + S 2 2 n1 n2
t=
O nmero de graus de liberdade associado ao valor de t, que o inteiro mais prximo do nmero g, obtido pela frmula:
+
g= S21 n1
S21 n1
2
S22 n2 S22 n2
2
n1 - 1
n2 - 1
Como saber se as varincias so iguais: na prtica se a maior varincia for igual a 4 vezes a menor, admite-se que as duas populaes tm varincias iguais. Seja o exemplo: Se as amostras tm varincias S21 = 15,64 e S22 = 6,80, temos 15,64 = 2,30 que < 4. S 6,80 Assim, razovel admitir que as varincias so iguais. Podemos aplicar um teste estatstico para termos certeza de que as varincias so iguais: Teste F F = S21 S22 Graus de liberdade: n - 1(numerador) e n - 2 (denominador). Realizados os clculos, procure o valor de F na tabela de valores de F (tabelas A-3, A-4, A-5 no final) com o nvel de significncia igual a metade do nvel de significncia escolhido, e segundo o nmero de graus de liberdade do numerador e do denominador. Toda vez que o F calculado for igual ou maior que o F da tabela, rejeita-se a hiptese de que as varincias das duas populaes so iguais ao nvel de significncia estabelecida. Vejamos exemplo: Um mdico aplicou uma dieta a um grupo de pacientes e o outro (controle) continuou com os mesmos hbitos alimentares. Vejam as perdas de peso em kg de pacientes segundo o grupo:
2 2
S21 =
Grupo Tratado Dieta 12 1 14 0 12 0 9 1 14 0,5 14 1 9 0
Nvel de significncia estabelecido: = 5% 1. mdia de cada grupo: X1 = 12 X2 = 0,5 2. varincia de cada grupo: S21 = 5,0 S22 = 0,23 Para saber se as varincias so ou no iguais, aplicar o teste S21 = 5 = 20 F= S22 0,25 O valor de F est associado a 6 (numerador) e 6 (denominador) graus de liberdade. Na tabela de F para = 2,5% (tabela A-3) com 6 e 6 graus de liberdade, encontramos o valor de 5,82. Assim, rejeita-se a hiptese de que as varincias so iguais ao nvel de significncia de 5%. Ento, o valor de t passa ser calculado da seguinte forma: t= 0,5 - 12 5,0 + 0,25 7 7 O nmero de graus de liberdade: 5,0 + 0,25 7 7 5,0 7 6
2 2
t=
11,5 5,25 7
= 13,28
g=
g = 0,5625 0,085247
= 6,6 7 graus de liberdade
0,25 7 6
Consultando a tabela para verificar o valor de tc com 7 graus de liberdade, ao nvel de significncia de 5% observamos que o to > tc e assim dizemos que podemos rejeitar a hiptese (nula) de que as mdias so iguais, ou seja, a perda de peso foi significativamente maior no grupo submetido dieta.
Test t para observaes pareadas s vezes os pequisadores estudam os efeitos de um tratamento comparando-se: - pares de indivduos (um gmeo recebe um tratamento e o outro, no). - dois lados de um mesmo indivduo (aplicao de um tratamento para a preveno de cries em um lado da arcada dentria e o outro lado sem tratamento-controle). - mesmo indivduo duas vezes (presso arterial antes e aps o tratamento em um mesmo indivduo). Como fazer o teste t nestas observaes pareadas: - nvel de significncia () - diferena entre as unidades de cada um dos n pares d = X2 - X1 - mdia das diferenas d = d (d: somatria das diferenas) n - varincia das diferenas S2 = d2 - (d) 2 n n-1 - o valor de t d t= 2 S n Graus de liberdade : n - 1 Vejamos o exemplo: Observem o peso de 9 pessoas antes e depois de estas pessoas se submeterem a uma dieta para emagrecer:
Antes 77 62 61 80 90 72 86 59 8
Dieta Depois 80 58 61 76 79 69 90 51 81
Seja de 1% ( 0,01) a) as diferenas entre os valores observantes e depois da dieta so: 80 77 = 3 58 2 = 4 61 61 = 0 76 80 = - 4 79 90 = -11 69 72 = -3 90 86 = 4 51 59 = -8 81 88 = -7 b) mdia das diferenas d = 30 = 3,333 9 c) varincia das diferenas 300 (30)2 2 S = = 25 9 9 - 1 d)valor de t t = - 3,333 25 9 = -2,0
Graus de liberdade : n 1 = 9 1 = 8 graus de liberdade. Consultado a tabela de tc (t crtico- tabela A-6), vemos que o tc com 8 graus de liberdade e no nvel de significncia de 1% 3,36. Como o valor (absoluto) de t0 foi de 2,0, ou seja, t0< tc, no podemos afastar a H0 que diz no haver diferena de perda de peso com a dieta testada. Assim, podemos dizer que o tratamento no tem efeito significativo, ao nvel de 1% (o tratamento no provou que a dieta emagrece).
XIII ESTADGRAFO DE SANDLER

Para amostras correlacionadas: mesmos indivduos ANTES e DEPOIS. A = D2 (D) 2 soma dos quadrados das diferenas quadrado das soma das diferenas
Graus de liberdade: N 1. Consultar tabela A-11 para os valores crticos de A (Ac). Se Aobs Ac, rejeitar a H0 e aceitar a H1, isto , o resultado foi significativo. Vamos a um exemplo: Um grupo de 10 estudantes assistiram a um filme e foi realizada a avaliao da atitude destes estudantes antes e depois de assistir o filme. Houve mudana de atitude destes estudantes? Lembrem-se que a H0 diz que no h mudanas e a H 1 diz que h. Temos ento que rejeitar a H0 para afirmar com certeza (estatisticamente significativa) que houve mudana de atitude dos estudantes. Se no podermos afastar a H0, conclumos que no houve alterao na atitude destes alunos.
Antes Depois Diferena (D) 1 2 3 4 5 6 7 8 9 10 25 23 30 7 3 22 12 30 5 14 28 19 34 10 6 26 13 47 16 9 -3 4 -4 -3 -3 -4 -1 -17 -11 5 D = -37
Quadrado da 2 Diferena (D ) 9 16 16 9 9 16 1 289 121 25 D2 = 511
A= D2 = 511 = 0,373 2 (D) (-37)2 Examinando a tabela A-11 para valores crticos de A, para um nvel de significncia de 0,05 (5%), o valor Ac 0,368 para 9 graus de liberdade. Como o A0bs (0,373) maior que o Ac (0,368), no podemos rejeitar a H0 e dizemos que o filme no ocasionou mudanas na atitude dos nossos estudantes que assistiram o filme.
ENTENDENDO BIOESTATSTICA BSICA PARTE VI Paulo R. Margotto Professor do Curso de Medicina da Escola Superior de Cincias da Sade/SES/DF XIV- ANLISE DA VARINCIA (ANOVA) (ESTATSTICA F) TESTE DE TUKEY
At o presente momento discutimos formas de comparar dois grupos de pacientes ou duas amostras. Muitas vezes torna-se necessrio comparar mdias de mais de duas populaes. Suponhamos que queiramos testar quatro drogas diferentes ao mesmo tempo (quatro diurticos diferentes A,B,C,D) e que desejamos avaliar o efeito de cada uma das drogas sobre o dbito urinrio em 16 voluntrios. Para sabermos se os grupos so significativamente diferentes uns dos outros, se algum dos diurticos testados tem um efeito diurtico importante, utilizando o teste t, podemos comparar os grupos dois a dois, por meio de 6 testes t separados, o que poder revelar uma diferena significativa entre os diurticos. Alm da perda de tempo com este procedimento, poderamos estar incorrendo num erro tipo I, pois ao aceitar 5% de erro em cada uma das 6 anlises separadas, haveria uma chance de 30% ( 6X 5%) de encontrar, por mero acaso uma diferena estatisticamente significativa. O uso da anlise da varincia ( ANOVA: Analysis of Variance) indicar a probabilidade de que a hiptese nula seja verdadeira, ou seja, probabilidade de que nenhuma diferena existe entre quaisquer dos grupos. Se a hiptese nula (H 0) for rejeitada, ser o indcio de que h diferena de potncia em algum dos diurticos testados. Para localizar o diurtico envolvido, ser necessrio um teste ANOVA de comparao de pares.
Os testes de ANOVA se apiam na hiptese de que se os grupos so semelhantes, a varincia em cada um (dentro) dos grupos semelhante quela entre os grupos; o que estes fazem comparar a variabilidade das mdias de todas as amostras coma variabilidade dentro das amostras. Assim , o teste precisa determinar a variabilidade dentro de cada amostra, bem como a variabilidade que existe entre mdias das amostras. Ao fazermos isto, geramos uma estatstica chamada F, cuja frmula : F = estimao da varincia ENTRE os grupo estimao da varincia DENTRO dos grupos F: distribuio F de R.A Fischer; o F observado ao F crtico, rechaa a hiptese nula de que no h diferena entre as varincias. Lembrem-se sempre que: H0 (hiptese nula): no h diferena entre os grupos H1 (hiptese experimental) : h diferena entre os grupos Vejamos um exemplo: 3 grupos de crianas (ao azar) receberam diferentes nveis de motivao para aritmtica . Depois se fez um exame.H diferenas significativas entre os 3 nveis de motivao (baixa, mdia e alta)? Vejamos: Grupo 1 4 16 5 5 25 4 4 16 3 3 9 6 6 36 10 10 100 1 1 1 8 64 81 4 25 X1 X12 X1 = 5,11 Grupo 2 12 144 8 64 10 100 5 25 7 49 9 81 5 14 196 9 81 4 16 X2 X22 X2= 8,67 Grupo 1 1 3 9 4 16 6 36 8 64 5 25 3 9 2 4 2 4 X3 X32 X3 = 3,78
X : Mdia
Anlise das Varincias Soma dos quadrados Entre a Dentro c Total b
Graus de liberdade K -1 NK N1
quadrado mdio = estimao da varincia
(a) : (X1)2 + X22 + X23 - (X total)2 N1 N2 N3 N (b): X2 - (X)2 N c= b-a K = nmero de grupos ( no exemplo K = 3) N = nmero de indivduos (no exemplo N = 27) Graus de liberdade de F: F(K 1) (N K) = 2 (numerador) e 24 ( denominador) Realizando os clculos: Clculo de (a): entre os grupos: a = (46)2 + (78) 2 + (34) 2 + (158) 2 = 235,11 + 676 + 128,49 + 924,60 9 9 9 27 (a) = 114,96 Clculo de (b): total dos grupos (b) = 292 + 756 + 168 - (46+78+34)2 = 1216 - 924,6 27 (b) = 291,4 Clculo de (c): dentro dos grupos ( c) = b - a = 291,4 - 114,96 = 176,45
Estimao da varincia entre os grupos: = 14,96 = 57,48 K1 3-1 Estimao da varincia dentro dos grupos: c N-K 27 - 3 7,35 = 176,45 = 7,35 a
F = estimao da varincia (a) = 57,48 = 7,82 Estimao da varincia (c)
Consultando o valor de F na tabela (Fcrtico), observamos o valor de Fc de 3,37 ao nvel de significncia de 5% com 2 e 24 de liberdade (Tabela A-4) no final. graus de liberdade : K - 1 = 2 (numerador): entre N - K = 24 (denominador): dentro Interpretao: Como o valor de F observado (7,82) foi maior que o valor de F encontrado na tabela dos valores de F, podemos dizer que rechaamos a hiptese nula e podemos dizer que houve diferenas significativas entre os grupos ao nvel de significncia de 5%. Quanto maior for o valor do F observado, maior ser a variao entre os grupos em relao variao dentro dos grupos e, conseqentemente , maior probabilidade de rejeitar a hiptese nula e aceitar a hiptese experimental. A ANOVA informa somente se h ou no diferena estatisticamente significativa entre dois ou mais grupos, mas no informa quais os grupos envolvidos. Para identificar os grupos, devese realizar uma comparao entre os pares - pair wise comparision test - que ir comparar cada grupo com cada um dos outros. Entre os testes capazes de realizar esta anlise, vamos comentar sobre o Teste de Tukey: O Teste de Tukey (1953) permite estabelecer a diferena mnima significante ou seja, a menor diferena de mdias de amostras que deve ser tomada como estatisticamente significante, em determinado nvel. Esta diferena (d.m.s) dado pela frmula:
d.m.s =q varincia estimada dentro dos grupos (c) N (nmero de indivduos em cada estudo ou nmero de repeties de cada tratamento) valor obtido na tabela (Tabela A-7, no final)no nvel de significncia e graus de liberdade: qK1, N K, No nosso exemplo: q3, 24,0,05 d.m.s= 3,53 7,35 = 3,19 9
Interpretao: Como vimos, aplicando a ANOVA, as mdias dos 3 grupos no so estatisticamente iguais. Mas qual ou quais so as mdias diferentes entre si? De acordo com o Teste de Tukey, duas mdias so estatisticamente diferentes toda vez que o valor absoluto da diferena entre eles for igual ou superior ao valor da d. m. s. No nosso exemplo, o valor da d.m.s 3,19 e os valores absolutos das diferenas entre as mdias so: X1 - X2 = 5,11 - 8,67 = 3,56 X2 - X3 = 8,67 - 3,78 = 4,89 X1 - X3 = 5,11 - 3,78 =1,33 X1 versus X2 e X2 versus X3 so maiores que 3,19. Assim, vemos que as diferenas entre as mdias dos grupos 1 e 2 e dos grupos 2 e 3 so estatisticamente significativas ao nvel de significncia de 5% (0,05) o que no ocorreu entre os grupos 1 e 3, porque X1 - X3 menor que a d.m.s Outros autores chamam esta diferena mnima significativa como prova da diferena honestamente significativa (DHS). No caso em que h um nmero diferente de repetio do
tratamento, a d.m.s calculada pela frmula: d.m.s =
ri : 2 nmero de repeties de i - simo tratamento rj: nmero de repeties do j - simo tratamento. Nesta situao, o teste de Tukey aproximado, porque os tratamentos tem nmeros diferentes de repeties. Seja o exemplo: Dados segundo o tratamento e os respectivos totais A B C 15 23 19 10 16 15 13 19 21 18 18 24 15 16 13 Total 84 76 85 F = 3,96 Graus de liberdade: 2 e 12 Fc = 3,89 Como Fobservado > Fc, conclui-se que as mdias no so iguais. Teste de Tukey: para comparar mdia de A com a mdia de B: d.m.s=3,77 Para
1 + 1 6 4 8 = 4,87 2 comparar mdia de A com C:
1+1 ri rj
X variao estimada dentro do grupo (c)
d.m.s=3,77
1+1 6 5
8 2
= 4,87
Para comparar a mdia de B com C:
d.m.s=3,77
1+1 4 5
8 2
= 5,6
Os valores absolutos das diferenas das mdias entre os grupos so: A e B : 14 - 19 = 5 A e C: 14 - 17 = 3 B e C: 19 - 17 = 2
Vemos que o valor absoluto da diferena entre A e B maior do que a respectiva d.m.s e assim, conclui-se que , em mdia , A diferente de B, ao nvel de significncia de 5%.
XV - Escolha do Teste Estatstico

Estabelecendo o nvel de significncia, o estatstico escolhe o teste apropriado. Existe hoje grande variedade de testes disposio dos interessados. Todos tm indicao precisa e todos tm vantagens e desvantagens. A escolha do teste exige conhecimento de estatstica. A escolha de um teste de significncia depende de caractersticas dos dados coletados: - Tipos de dados: nominais, ordinais ou contnuos - Amostras isoladas, duas amostras ou mais de dois grupos - Emparelhamento ou no - Amostras grandes ou pequenas ( dados nominais) - Distribuio normal ou no (dados contnuos) O teste a ser aplicado varia em funo do tipo de dados, sendo ento a primeira etapa na escolha do teste, caracterizar o tipo de
dados. A deciso a seguir consiste em determinar quantos grupos sero comparados. Quando se trata de dois grupos de dados, o teste de significncia determina a probabilidade de eles se originarem ou no da mesma populao. Quando se deseja comparar mais de dois grupos, s vezes 5 ,10 ou mais, deve-se usar anlise de varincia.
ENTENDENDO BIOESTATSTICA BSICA PARTE VII Paulo R. Margotto Professor do Curso de Medicina da Escola Superior de Cincias da Sade/SES/DF VI-TESTES ESTATSTICOS NO - PARAMTRICOS
Os estatsticos imaginaram testes quando a distribuio da populao altamente assimtrica. Quando em dvida, os estatsticos escolhem um teste paramtrico (a maioria dos testes de hipteses vistos anteriormente) quando no esto seguros de que a distribuio normal foi violada e testes no paramtricos porque no esto seguros de que a distribuio normal foi encontrada (estes ltimos no so to eficientes quanto aos paramtricos para detectar diferenas na populao). Teste do Sinal - Sign Test: variveis qualitativas ou nominais. Este teste recebe este nome porque a diferena em cada par convertida nos sinais de (+), de (-) ou (zero) - quando no houver diferena. - H0: 1/2 dos sinais so (+) e 1/2 dos sinais so (-) - H1: a proporo de vezes (p) em que aparece o sinal (+) ou (-), seja igual a 0,5; valendo-se disto, possvel gerar um escore Z, utilizando a frmula:
Z = 2 (p - 0,5) n
n: nmero de pares em que houve a diferena p,: a freqncia de sinais (+) ou negativos (-). Este teste constitui uma alternativa no-paramtrica (menos poderosa) do teste t, para amostras emparelhadas. Seja o exemplo:
Considere a populao em que se deseja escolher dois equipamentos de laboratrio, A e B capazes de realizar 12 anlises diferentes e que a rapidez da execuo seja um ponto a ser considerado. Foi feita uma aferio dos tempos gastos para executar cada tarefa, com a finalidade de verificar se os equipamentos diferiam entre si.
Tarefa Tempo A Tempo B Diferenas (A - B) 1 40 29 + 2 22 16 + 3 22 29 4 45 41 + 5 68 61 + 6 33 24 + 7 48 54 8 75 68 + 9 41 36 + 10 44 36 + 11 47 42 + 12 31 25 + Aferio dos sinais negativos: p= 2/12 = 1/6 Z = 2 (1/6 - 0,5)12 = - 2,28 O valor crtico de Z para um alfa de 5% 1,96; logo, pode-se dizer que os equipamentos de A e B diferem entre si quanto velocidade para um nvel de significncia de 5%. Wilcoxon Signed Rank Sum Test: variveis ordinais Este teste destina-se a comparar dois grupos emparelhados; usado exatamente da mesma situao do teste t para amostras emparelhadas. Como calcular: - Calcular a diferena entre os valores - Atribuir postos aos valores absolutos das diferenas (a menor diferena recebe o posto 1)
- Somar todos os postos das diferenas positivas e das negativas obtendo-se somas chamadas de T - Na tabela apropriada (tabela A-8 no final), encontrar os valores de p correspondentes aos valores dos T obtidos, considerando como n o nmero de pares em que a diferena 0. Se os dois valores estiverem bastante afastados, o valor de p ser pequeno: algumas tabelas usam apenas o menor valor de T. Seja o exemplo: Considere o estudo de um frmaco, em que os usurios do mesmo parecem ter o nmero de certo tipo de clula sangnea alterada durante o seu uso e que se tenha obtido os seguintes resultados: Contagem do nmero de Clulas Grupo Droga Controle 1162 890 1095 800 1420 1104 1361 1002 1101 1101 999 858 1333 988 1235 875 1000 1000 Vamos calcular as diferenas e classific-las: Controle 1162 1095 1420 1361 1101 999 1333 1235 1000 Droga 890 800 1104 1002 1101 858 988 875 1000 Diferena - 272 - 295 - 316 - 359 0 -141 -345 -360 0 Classificao da diferena -2 -3 -4 -6 -1 (a menor) -5 -7 (a maior) -
Vemos que as diferenas foram todas negativas ou nulas; a soma dos postos, rank, das diferenas negativas (-28) (T=28) e a soma das classificaes das diferenas positivas zero (no houve nenhuma). O n = (8 - 1) = 7 (foi excludo 1 par em que no houve diferena). Consultando a Tabela A-8, obtm-se um valor de T = 2 (Tcrtico), considerado significativo, ou seja, a droga provavelmente altera a contagem da clula sangnea estudada. (Tobservado > Tcrtico).
Teste U de Mann-Whitney
Constitui a alternativa mais comumente usada para o teste t para amostras independentes; um teste para provar se os dois grupos independentes tm sido tomados da mesma populao. Todos os clculos tambm so feitos como postos ( ranks) e no com os valores reais. Exemplo: aferiu-se a presso arterial de dois grupos de estudantes (A e B). Deseja-se saber se h diferena estatisticamente significativa entre as medianas dos grupos A e B. Resultado das presses arteriais para os grupos A e B com os respectivos postos. Presses do Grupo A 110 Postos de A 5,5 Presses do Grupo B 110 Postos de B 5,5 90 2 150 10 100 4 125 9 85 1 120 8 95 3 115 7
Ao classificar os dados atribuindo postos aos mesmo, havendo valores iguais, atribui-se aos valores empatados um posto igual mdia dos postos que seriam ocupados se no houvesse empate. A seguir, somam-se os postos dos dois grupos e assim obtmse: Grupo A: 5,5 + 2 + 4 + 1 + 3 = 15,5 Grupo B: 5,5 + 10+ 9 + 8 + 7 = 39,5
Para testar a diferena entre as somas dos postos, calcula-se o estatstico U para ambos os grupos, utilizando as seguintes frmulas:
U1 = n1 n2 + n (n+ 1) - R1 2 U2= n1 n2 + n2(n2+ 1) - R2
n1: tamanho da amostra menor n2: tamanho da amostra maior R1 e R2: soma dos postos de cada grupo Chama-se de U observado (U0) o menor dos valores obtidos para U1 e U2, o qual deve ser comparado com o U crtico (U c) obtido em tabela especfica, considerando os valores de n 2 e alfa. (existem vrias tabelas de U em funo de n 2 ser menor que 8, estar entre 9 e 20 ou ser maior que 20) Fazendo os clculos: U1 = (5 x 5) + 5 ( 5+1) - 15,5 = 24,5 2 U2 = (5 x 5) + 5 ( 5+1) - 39,5 = 0,5 2 Observando a tabela A-9 no final das probabilidades associadas ao U de Mann-Whitney para n2 = 5. Vemos que a probabilidade para U0 = 0,5 situa-se entre 0,004 e 0,008 e, portanto, menor que 0,05. Assim, rejeita-se a H0 e considera a H1 em que a mediana das presses do grupo B estatisticamente maior que a mediana das presses do grupo A. Toda vez que o valor observado de U tem uma probabilidade associada igual ou menor que , rejeita-se a H0 e aceitase a H1
VII I- SENSIBILIDADE/ESPECIFICIDADE VALOR PREDICTIVO

Quando realizam provas ou exames, surgem de imediato duas perguntas: 1. se a doena est presente, qual a probabilidade de que o resultado seja positivo? 2. Se a doena est ausente, qual a probabilidade de que o resultado seja negativo? A resposta primeira pergunta determina a sensibilidade e segunda, especificidade - Sensibilidade: capacidade do procedimento de efetuar diagnsticos corretos quando esta est presente (verdadeiros, positivos ou doentes). - Especificidade: capacidade do procedimento de efetuar diagnsticos corretos da ausncia de doena quando esta est ausente (verdadeiros, negativos ou sem esta patologia). Como estes dados so qualitativos, j que indicam a presena ou a ausncia confirmada de doena, usam-se as tabelas de dupla entrada (matriz de deciso) para a sua apresentao numrica. Patologia Confirmada Sim no a b Verdadeiros falsos positivos positivos c d falsos negativos verdadeiros negativos a+c b+d
Sentido da anlise a+b c+d a+b+c+d (n)
Resultado do procedimento
+ -
Sensibilidade: mede a proporo de indivduos nos quais o procedimento teve resultado positivo em relao ao total dos que tem a doena ( a anlise da primeira coluna da tabela no sentido vertical)
Sens = a
x 100 a+c
Especificidade: mede a proporo de indivduos com diagnstico negativo sem a patologia em relao ao total dos que no tem esta doena (anlise da segunda coluna da tabela no sentido vertical) E b+d Lembrar sempre que a sensibilidade considera os acertos positivos e a especificidade considera os acertos negativos Quanto mais prximos de 100% estiverem a sensibilidade e a especificidade, maior a capacidade da prova de descriminar os que tm a doena dos que no tem. medida que se aumenta a sensibilidade, perde-se em especificidade e vice-versa, por isso, ambos valores devem ser estudados em conjunto. A sensibilidade e a especificidade no variam com a prevalncia (esta mede a totalidade dos vasos da doena que h na populao durante um perodo especfico), mas sim com o valor de corte utilizado. Veja o exemplo:
Infeco Fngica presente ausente 84(a) 1(b) 26(c) 180(d) 110 181
x 100
Hemocultura + Totais
totais 85 206 291
S=
84 x 100 = 76% 110
Interpretao Embora a hemocultura tenha um elevado valor predictivo positivo (veja adiante) elas no so sensveis, visto que 24% (100-76) dos
pacientes com infeco fngica sistmica tm hemocultura negativa para fungos. E = 180 x 100 = 99% 181 Interpretao Significa que se o paciente no possui uma infeco fngica sistmica, h uma chance muito elevada (de 99%) de que ele tenha uma hemocultura negativa para fungos. Sempre existe uma margem de erro e para afirmar se existe ou no a doena empregando um procedimento diagnstico, deve-se considerar: - Se o procedimento tem resultado positivo, qual a probabilidade de que a doena esteja realmente presente? (de que se confirme a doena). o que chamamos de valor Predictivo Positivo (VPP) - Se o procedimento tem resultado negativo, qual a probabilidade de que a doena esteja realmente ausente (de que se descarte a doena)? o que chamamos de Valor Predictivo Negativo (VPN). Para calcularmos o VPP e o VPN, recorremos matriz de deciso, sendo que agora, a anlise feita por linha (sentido horizontal).
Patologia Sim + Resultado do procedimento a c a + c b d b + d a+b c+d a +b +c+d (n) Sentido da Anlise no
VPP =
x 100 a+b
VPN c+d
No exemplo anterior hemocultura e infeco fngica, observem que: VPP = 84 X 100 = 98,8% 85 VPN 206 Vejam que o VPP expresso pela porcentagem de doentes reais entre os que tiveram resultados positivos (expressa a confiabilidade de um resultado de exame positivo) e o VPN expresso pela porcentagem de doentes sem patologia entre os que tiveram resultados negativos (expressa a confiabilidade de um resultado de exame negativo). Exatitude: um indicador que considera, de maneira conjunta, as predices corretas do procedimento, positivas e negativas E = verdadeiros positivos + verdadeiros negativos x 100 total de indivduos com ou sem a doena E= a+d x 100 a+b+c+d = 180 X 100 = 87,4%
Cohen descreveu um ndice, chamado ndice Kappa para avaliar o grau de acerto do procedimento, ou seja, para avaliar o quanto o resultado do procedimento escapa do azar: 0,75 - 1 : muito bom 0,4< 0,74: regular a bom 0,35: ruim (o diagnstico no explicado pelo procedimento e sim pelo azar em 95% das vezes).
O clculo do ndice Kappa baseia-se na exatitude: ndice Kappa = exatitude observada - exatitude esperada 1 - exatitude esperada Vejamos o seguinte exemplo: Sim + 20 4 total 24 No Total 2 22 30 34 32 56
Procedimento
Exatitude observada: 30 + 20 = 0,89 56
Observem que para calcular o ndice de Kappa (ndice de acordo), falta apenas calcular a exatitude esperada que no se espera em (a) e (d) por azar: Exatitude esperada = fila total x total coluna N (total geral)
Para o patologia (+)). 56 Para o patologia (-)). 56 (a): 22 x 24 = 9,42 (fila de exames (+) x coluna de
(d):
34 x 32 = 19,42 (fila de exames (-) x coluna de
Assim, a matriz de deciso anterior fica:

Patologia Sim + 20 (9,42) (a) 2(b) no
Procedimento 4 (c) 30 (19,42) (d)
Exatitude esperada: a + d = 9,42 + 19,42 = 0,52 N 56 Agora, aplicando a frmula do ndice Kappa temos: ndice Kappa = 1 - 0,52 Interpretao O procedimento analisado um procedimento muito bom. importante conhecer o intervalo de confiana a 95% do ndice Kappa para dar-lhe mais peso ao resultado achado. Para isto, se calcula o erro standard do ndice Kappa, e logo, multiplicando- se por 1,96 (valor de Z para probabilidade de 0,025); esse resultado se soma e diminui do ndice Kappa previamente obtido. A significncia dar-se- pela ausncia da unidade no intervalo de confiana. O erro standard do ndice Kappa calculado utilizando a seguinte frmula nas tabelas de dupla entrada (matriz de deciso): ESk = (p2+p2) pe: probabilidade esperada pe exatitude esperada (exatitude esperada) Veja o exemplo: Patologia + + 20 p11 2 p12 p1 Procedimento 4 p21 30 p22 p2 24 32 56 p.1 p.2 p11 = a/N ; p12= b/N; p21=c/N ; p22= d/N; p2 c+d/N p1 = a+b/N pe = 0,52 1 (1 - pe) n pe+pe2 - p1.p1 (p1+p1)+ p2.p2 0,89 - 0,52 = 0,77
ESk =
0,52+(0,61)2 0,39 x 0,39 (0,39+0,39)+ ,61x0,61(0,61+0,61)
(1-0,52)56
ESk =
1 X 1,24 3,6
= 0,28 X 0,11 = 0,31
0,31X1,96 = 0,60 O intervalo de confiana ser: 0,17 0,77 + 0,60 = 1,37 0,77 0,60 = 0,17
1,37
interessante citar que o valor da predico de uma prova e a exatitude modificam-se substancialmente com a prevalncia . Para uma dada prevalncia (nmero de doentes para o total de casos considerados) pode-se espera um alto valor de predico ( fcil diagnosticar numa epidemia); com baixa prevalncia diminui o valor da predico , apesar da sensibilidade e especificidade no variarem. Veja o exemplo: Patologia Sim no + 40 2 10 23 aq 40 25 75
Sensibilidade: 40 x 100 = 80% 50 Especificidade: 23 x 100 = 92% 25
42 33 75
Prevalncia: 50 x 100 = 67%
VPP= 40 x 100 = 95% 42 VPN= 23 x 100 = 70% 33 Patologia Sim no 40 20 60 10 230 240 50 250 300 Prevalncia: 50 x 100 = 17% 300
+ -
VPP= 40 x 100 = 67% 60 VPN= 230 x 100 = 96% 240 Vejam que ao diminuir a prevalncia, o VPP diminui, enquanto do VPN aumenta. Conclui-se que no se deve fazer comparao direta dos valores de predico de procedimentos desenvolvidos Sensibilidade: 40 x 100 = 80% 50 em grupos com diferentes prevalncias. O Teorema de Especificidade: 230 x 100 = 92% Bayes, da probabilidade 250 condicionada permite ajustar o valor da predico a uma prevalncia dada da doena:
VPP = prevalncia da doena x sensibilidade Prevalncia x sensibilidade + ( 1 - prevalncia) x (1 - especificidade)
Propsito dos procedimentos: Para os procedimentos de triagem (dosagem de glicemia para detectar diabetes, exame de Papanicolau para detectar cncer genital), so necessrios procedimentos que tenham alta sensibilidade ( que captem o maior nmero possvel de doentes) e que sejam fceis de realizar, rpidos, no invasivos e de baixo custo. Aceita-se certo nmero de erros ou de falsos positivos da prova. Assim, os procedimentos de triagem ("screening") quando so positivos, requerem sempre outras provas para confirmar a doena. Os casos com resultado positivo no deve ser considerados como doentes, mas sim como tendo possibilidade de ter a doena. Deve-se ser comedido a solicitar provas confirmatrias que deve ir da mais simples a mais complexa (broncoscopia, bipsia de cervix), procedimentos estes que devem ter alta especificidade de maneira que no haja falsos positivos, alm do alto valor predictivo positivo.
ENTENDENDO BIOESTATSTICA BSICA PARTE IX Paulo R. Margotto Professor do Curso de Medicina da Escola Superior de Cincias da Sade/SES/DF VIII-COMO EXERCER A MEDICINA/ NEONATOLOGIA BASEADO EM EVIDNCIAS
O novo paradigma para a prtica clnica, ou seja, bases para tomar decises tm que incluir a evidncia da pesquisa clnica. Os nossos tratamentos que usamos para os bebs devem ter sempre mais benefcios do que prejuzos. Para isto, devemos adquirir informao atravs da procura de evidncias que isto seja verdadeiro na literatura. Este o novo paradigma da medicina: um esforo para tentar melhorar a situao do paciente baseado na evidncia das pesquisas clnicas. J chegando ao novo milnio, a estratgia mais poderosa a procura eletrnica da informao. Temos que ter um modo sistemtico de estudar a literatura mdica de uma maneira eficaz. A evidncia vlida apenas uma pequena parte da literatura que est disponvel. Temos que ter uma forma eficiente de busca. Somos mdicos muito ocupados e temos que encontrar uma evidncia vlida (artigos de alta qualidade). Nos ltimos 3 anos foi possvel para qualquer parte do mundo ter acesso Internet gratuitamente, procurando o MEDLINE atravs deste endereo: www.ncbi.nlm.gov/PubMed (S permitido acesso apenas ao resumo do artigo- abstract tal como fora publicado, o que permite o mdico fazer uma primeira seleo de artigos de maior relevncia para questo clnica que motivou a pesquisa).
No exerccio da medicina neonatal baseado em evidncias, citamos um endereo da Internet (www.cochrane.org) que nos possibilita acessar metanlises de diversas situaes colocadas em ordem alfabtica, como: cafena versos teofilina no tratamento da apnia no RN pr-termo; CPAP versos teofilina para a apnia do prtermo; uso profiltico de CPAP nasal em RN muito prematuros; uso profiltico de anticonvulsivante na asfixia perinatal do RN a termo e muitos outros temas polmicos na prtica clnica diria. O endereo especfico neonatal : www.nichd.nih.gov/cochrane/cochrane.htm O nome Cochrane uma homenagem ao Dr. Archibald Lemon Colchrane (1909-1988), pesquisador mdico britnico que muito contribuiu para o desenvolvimento da epidemiologia como cincia. A biblioteca Cochrane um compndio de revises sistemticas de estudos randomizados de todos os campos da medicina. * Para os que querem investir 19,5 dlares/ms, citamos o site www. mdconsult.com; neste endereo possvel obter artigos completos de mais de 45 peridicos, assim como referncias em livros e o MEDLINE completo, de 1966 a 1999. * Outros sites indicados: www.neonatology.org e no deixe de consultar o Portal da AMBr: www.medico.org.br Conhecimento da Estrutura de um estudo da Avaliao de um Tratamento:
Resultados Evento a C Total No Evento b d n1 n2
EXPOSIO Sim ( tratado ) No (controle)
Medidas do efeito de tratamento: RR (Risco Relativo): a/n1 c/n2 RRR (Reduo do Risco Relativo): 1 RR DR (Diferena de Risco): a/n1 c/n2
1 Nmero necessrio para tratamento (NNT): Diferena de risco Quando RR igual a 1, significa que no h efeito do tratamento, ou seja, o efeito do tratamento o mesmo nos dois grupos. Se o RR < 1, significa que o risco do evento menor no grupo tratado que no controle. A da amostra do estudo pode ser avaliado atravs de testes de significncia ou via intervalo de confiana. Aqui daremos preferncia segunda abordagem. Assim, desejando-se saber se um RR=0,40 para a reduo de ductus arteriosus patente foi significativo no grupo de RN exposto a um menor regime de oferta hdrica versos maior regime de oferta hdrica (restricted vs liberal intake in prematures: Bell EF, Acarregui MJ. Cochrane Library, 1999), pode-se calcular um intervalo de confiana para esta estimativa. Para um dado nvel de significncia ( = 0,05), o intervalo de confiana representa o intervalo onde deve estar o parmetro, ou seja, o risco relativo verdadeiro. Se o valor 1, que se refere nulidade da associao, no estiver contido no intervalo, temos uma confiana que na populao de onde nossa amostra foi extrada, o RR diferente de 1, sendo, portanto significativo o achado da amostra. Para a realizao dos clculos do intervalo de 95% de confiana, do RR, consulte Margotto, PR BIP N 52, 1992. Uma vez calculado o intervalo de 95% de confiana para o nosso exemplo, temos: RR = 0,40 (95% IC: 0,26 0,63): a interpretao deste resultado a de que o RR significativo na reduo do ductus arteriosus patente no grupo exposto ao regime de menos lquido. O intervalo de confiana no contm o valor 1, que indica nulidade de associao, ou seja, a mostra estudada reflete um efeito real da menor oferta hdrica na reduo do ductus arteriosus patente. Reduo do Risco Relativo (RRR): determina, em termos percentuais, que reduo o tratamento provoca na ocorrncia da doena no grupo tratado quando comparado com o grupo controle. RRR: 1 RR No exemplo anterior; Ductus arteriosus patente: regime de menor x regime de maior oferta hdrica. RR: 0,40 RRR: 1 0,40= 0,60 x 100 = 60% (h uma reduo de 60% do ductus arteriosus patente no grupo de menor oferta hdrica).
Diferena de Risco (DR): a/n1 c/n2. No exemplo anterior do ductus arteriosus patente com oferta hdrica menor ou maior, a DR foi de 0,190. Nmero necessrio para tratamento (NNT): 1 DR A importncia de se conhecer a DR que nos possibilita calcular a NNT, que nos informa quantos indivduos devem ser tratados para que se possa evitar a ocorrncia de um evento (quanto melhor o tratamento, menor o NNT). No caso do ductus arteriosus patente frente a dois regimes, de oferta hdrica (maior x menor), o NNT : NNT = 1 DR DR= - 0,190 ; NNT=
= 5,26 = 5,3
-0,190 Ou seja, o nmero necessrio para tratar com restrio hdrica para prevenir um caso de ductus arteriosus patente 5,3. Mais 2 exemplos: * Hemorragia peri/intraventricular (todos os grupos): grupo com menor x maior oferta hdrica. RR= 0,94 (95% IC: 0,52 1,72) RRR= 1 0,94 = 0,06 x 100= 6% DR= - 0,011 NNT = 1 = 90,9 -0,011 Interpretao: o risco de hemorragia peri/intraventricular (todos os graus) no foi significativamente afetado pela ingesta hdrica (veja, o intervalo de confiana do RR contem a unidade). A reduo da hemorragia peri/intraventricular, que o RRR, de 6%, ou seja, h uma diminuio de 6% na incidncia desta patologia no grupo com restrio hdrica, mas no foi significativa esta reduo. O NNT de 90,9 significa que necessrio restringir lquido em 90,9 para evitar a ocorrncia de 1 caso de hemorragia. Lembramos que quanto melhor o tratamento, menor o NNT. * Morte neonatal: ingesta hdrica restrita x ingesta liberal RR= 0,52 (95% IC: 0,28 0,96) RRR= 1 0,52 = 0,48 x 100= 48%
DR= - 0,063 NNT = 1 -0,063
= 15,87 = 15,9
Vejam que h uma reduo significativa de 48% de morte neonatal no grupo com restrio hdrica e o nmero necessrio para o tratamento com restrio hdrica para prever uma morte neonatal de 15,9.
Vejam a apresentao dos resultados: RR(95% IC) Ingesta hdrica restrita x ingesta liberal Ductus arteriosus patente Hemorragia peri/intraventricular Morte neonatal 1 Quando a linha horizontal estiver esquerda (RR<1) significa reduo do evento; quando direita, aumento do evento e quando toda vez que a linha horizontal tocar a linha vertical significa que o RR no significativo. Veja agora um exemplo do RR localizado a direita: meta-anlise revista por Halliday e EhrenKranz para determinar se o uso de esteride entre 7-14 dias de vida versos controle benfico na preveno e/ou tratamento da Doena Pulmonar Crnica no prematuro, se observaram, como efeito colateral: - hiperglicemia: RR= 1,27, IC=0,99-1,63. Como interpretar: h um aumento da glicemia em 27% destes bebes (1,27 x 100 = 127: aumento de 27% : 100 + 27), porm no foi significativo (veja que o intervalo de confiana - IC - contm a unidade: 0,99....1....1,63). - Hipertenso arterial: RR = 5,30. IC 95% : 1,59 -21,29%: H um aumento significativo -o intervalo de confiana no contm a unidade - de 5,3 vezes mais.
- (Hipertrofia do miocrdio: RR = 9. IC: 95%: 1,2 - 67,69) , aumento significativo (o intervalo de confiana no contm a unidade: 1....1,2....67,69) de 9 vezes mais. Vejam como fica a apresentao dos resultados: Esteride com 7-14 dias nos RN ventilados x controle: Hiperglicemia Hipertenso arterial Hipertrofia do miocrdio 1 Odds Ratio Como vemos o RR (Risco Relativo) uma medida da fora da associao entre a exposio e o evento (resultado). definido como a razo entre a incidncia nos indivduos expostos. O Odds Ratio (OR) uma estimativa do risco relativo. Possui a mesma interpretao apesar de ser baseada numa frmula diferente. A expresso odds no possui equivalente em portugus; alguns epidemiologistas referem-se ao Odds Ratio (OR) como razo de chances, razo de produtos cruzados ou ainda razo de odds. Usaremos o termo original. Como calcular a Odds Ratio (OR):
Resultado EXPOSIO Evento No evento Sim a b No c d
OR = axd bxc Utilizando o mesmo grupo de dados, o valor obtido para a medida de associao pela frmula do OR geralmente maior do que se obtm atravs da frmula tradicional do RR.
Do mesmo modo que o RR, avalia-se a variabilidade amostral da OR atravs do clculo do intervalo de confiana e a interpretao a mesma do RR, ou seja, se no intervalo de confiana da OR contiver a unidade, significa ausncia de associao. Para os clculos, consulte Margotto, PR. BIP N 52, 1992. ANTIGO PARADIGMA DA PRTICA CLNICA Tomada de decises que se baseavam em: Boa experincia clnica Bastante conhecimento de fisiopatologia Informao em bons livros Opinio de especialistas (professores) NOVO PARADIGMA DA PRTICA CLNICA Tomada de decises se baseiam em: Evidncias das pesquisas clnicas, evidentemente com embasamento na experincia clnica. A seguir, a TABELAS:
ENTENDENDO BIOESTATSTICA BSICA PARTE X Paulo R. Margotto Professor do Curso de Medicina da Escola Superior de Cincias da Sade/SES/DF TABELAS TABELAS
TABELA
A2
TABELA A. 2 VALORES DE N, SEGUNDO OS GRAUS DE LIBERDADE E O VALOR DE CZ GRAUS DE LIBERDADE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
10% 2,71 4,60 6,25 7,78 9,24 10,64 12,02 13,36 14,68 15,99 17,28 18,55 19,81 21,06 32,31 23,54 24,77 25,99 27,20 28,41 29,62 30,81 32,01 33,20 34,38 35,56 36,74 37,92 39,09 40,26
5% 3,84 5,99 7,82 9,49 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 38,88 40,11 41,34 42,56 43,77
1% 6,64 9,21 11,34 13,28 15,09 16,81 18,48 20,09 22,67 23,21 24,72 26,22 27,69 29,14 30,58 32,00 33,41 34,80 36,19 37,57 38,93 40,29 41,64 42,98 44,31 45,64 46,96 48,28 49,59 50,89
TABELA
A3
TABELA A. 3 Valoresde F para &=2,5% , segundo o nmero de graus de liberdade do numerador e do denominador N de 1 do denoNmero de graus de liberdade do numerador mina1 2 3 4 5 6 7 dor 1 648 830 864 900 922 937 948 2 38,5 39,0 39,2 39,2 39,3 39,3 39,4 3 17,4 16,0 15,4 15,1 14,9 14,7 14,6 4 12,2 10,0 9,98 9,60 9,36 9,20 9,07 5 6 7 8 9 10 11 12 13 14 15 16 17 18 10,0 8,81 8,07 7,57 7,21 6,94 6,72 6,55 6,41 6,30 6,20 6,12 6,04 5,95 8,43 7,26 6,54 6,06 5,71 5,46 5,26 5,10 4,97 4,86 4,77 4,69 4,62 4,56 7,76 6,60 5,89 5,42 5,08 4,83 4,63 4,47 4,35 4,24 4,15 4,08 4,01 3,95 7,39 6,23 5,52 5,05 4,72 4,47 4,28 4,12 4,00 3,89 3,80 3,73 3,66 3,61 7,15 5,99 5,29 4,82 4,48 4,24 4,04 3,89 3,77 3,66 3,58 3,50 3,44 3,38 6,98 5,82 5,12 4,65 4,32 4,07 3,88 3,73 3,60 3,50 3,41 3,34 3,28 3,22 6,85 5,70 4,99 4,53 4,20 3,93 3,76 3,61 3,48 3,38 3,29 3,22 3,16 3,10
8 957 39,4 14,5 8,98 6,76 5,60 4,90 4,43 4,10 3,85 3,66 3,51 3,39 3,29 3,20 3,12 3,06 3,01
9 963 39,4 14,5 8,90 6,68 5,52 4,82 4,36 4,03 3,78 3,59 3,44 3,31 3,21 3,12 3,05 2,98 2,93
TABELA
A4
TABELA A. 4 Valoresde F para &=2,5% , segundo o nmero de graus de liberdade do numerador e do denominador N de 1 do denoNmero de graus de liberdade do numerador mina1 2 3 4 5 6 7 dor 1 161 200 216 225 230 234 237 2 18,3 19,0 19,2 19,2 19,3 19,3 19,4 3 10,1 9,55 9,28 9,12 9,01 8,94 8,39 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,12 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 3,93 2,90 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54
8 239 19,4 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48
9 241 19,4 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,39 2,54 2,49 2,46 2,42
TABELA A4- CONTINUAO

Continuao da Tabela A.4 N de 1 do denominador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Nmero de graus de liberdade do numerador 10 242 19,4 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 12 244 19,4 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 15 246 19,4 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 20 248 19,4 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 24 249 19,5 8,64 5,77 4,53 3,84 3,41 3,12 2,90 2,74 2,61 2,51 2,42 2,35 2,29 2,24 2,19 2,15 2,11 30 250 19,5 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,13 2,11 2,07 40 251 19,5 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 60 252 19,5 8,57 5,69 4,43 3,74 3,30 3,01 2,79 2,62 2,49 2,38 2,30 2,22 2,16 2,11 2,06 2,02 1,98 120 253 19,5 8,55 5,66 4,40 3,70 3,27 2,97 2,75 2,58 2,45 2,34 2,25 2,18 2,11 2,06 2,01 1,97 1,93 254 19,5 8,53 5,63 4,36 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88
TABELA
A5
TABELA A. 5 Valoresde F para &=10% , segundo o nmero de graus de liberdade do numerador e do denominador N de 1 do denoNmero de graus de liberdade do numerador mina1 2 3 4 5 6 7 dor 1 39,9 49,5 53,6 55,8 57,2 58,2 58,9 2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 4,06 3,78 3,59 3,46 3,36 3,29 3,23 3,18 3,14 3,10 3,07 3,05 3,03 3,01 2,99 3,78 3,46 3,26 3,11 3,01 2,92 2,86 2,81 2,76 2,73 2,70 2,67 2,64 2,62 2,61 3,62 3,29 3,07 2,92 2,81 2,73 2,66 2,61 2,56 2,52 2,49 2,46 2,44 2,42 2,40 3,52 3,18 2,96 2,81 2,69 2,61 2,54 2,48 2,43 2,39 2,36 2,33 2,31 2,29 2,27 3,45 3,11 2,88 2,73 2,61 2,52 2,45 2,39 2,35 2,31 2,27 2,24 2,22 2,20 2,18 3,40 3,05 2,83 2,67 2,55 2,46 2,39 2,33 2,28 2,24 2,21 2,18 2,15 2,13 2,11 3,37 3,01 2,78 2,62 2,51 2,41 2,34 2,28 2,23 2,19 2,16 2,13 2,10 2,08 2,06
8 59,4 9,37 5,25 3,95 3,34 2,98 2,75 2,59 2,47 2,38 2,30 2,24 2,20 2,15 2,12 2,09 2,06 2,04 2,02
9 59,9 9,38 5,24 3,94 3,32 2,96 2,72 2,56 2,44 2,35 2,27 2,21 2,16 2,12 2,09 2,06 2,03 2,00 1,98
TABELA A5- CONTINUAO

Continuao da Tabela A.5 N de 1 do denominador 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Nmero de graus de liberdade do numerador 10 60,2 9,39 5,23 3,92 3,30 2,94 2,70 2,54 2,42 2,32 2,35 2,19 2,14 2,10 2,06 2,03 2,00 1,98 1,96 12 60,3 9,41 5,22 3,94 3,27 2,90 2,67 2,50 2,38 2,28 2,21 2,15 2,10 2,05 2,02 1,99 1,96 1,93 1,91 15 61,2 9,42 5,20 3,87 3,24 2,87 2,63 2,46 2,34 2,24 2,15 2,10 2,05 2,01 1,97 1,94 1,91 1,89 1,86 20 61,3 9,44 5,19 3,84 3,21 2,84 2,59 2,42 2,30 2,2 2,12 2,06 2,01 1,96 1,92 1,89 1,86 1,84 1,81 24 62,0 9,45 5,18 3,83 3,19 2,82 2,58 2,40 2,28 2,18 2,10 2,04 1,98 1,94 1,90 1,87 1,84 1,81 1,79 30 62,3 9,45 5,17 3,82 3,17 2,80 2,56 2,38 2,25 2,16 2,08 2,03 1,96 1,91 1,87 1,84 1,82 1,78 1,76 40 62,5 9,47 5,16 3,80 3,16 2,78 2,54 2,36 2,23 2,13 2,05 1,99 1,95 1,89 1,85 1,81 1,78 1,75 1,73 60 62,8 9,47 5,15 3,79 3,14 2,76 2,51 2,34 2,21 2,11 2,03 1,96 1,90 1,86 1,82 1,78 1,75 1,72 1,70 120 63,1 9,48 5,14 3,78 3,12 2,74 2,49 2,32 2,18 2,08 2,00 1,93 1,88 1,83 1,79 1,75 1,72 1,69 1,67 63,3 9,49 5,13 3,76 3,10 2,72 2,47 2,29 2,16 2, 06 1,97 1,90 1,85 1,80 1,76 1,72 1,69 1,66 1,63
TABELA
A6
TABELA A. 6 VALORES DE t SEGUNDO OS GRAUS DE LIBERDADE E O VALOR DE & GRAUS DE LIBERDADE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
10% 6,91 2,92 2,35 2,13 2,02 1,94 1,90 1,86 1,83 1,81 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73
5% 12,71 4,3 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10
1% 63,66 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,11 3,06 3,01 2,98 2,95 2,92 2,90 2,88
Valores da amplitude total estudentizada(q) para a = 5%, segundo o nmero de tratamento (k) e os graus de liberdade do resduo N de graus de lib. do Nmero de tratamento (k) resduo 2 3 4 5 6 7 8 9 10 11 12 13 1 8,0 27,0 32,8 37,1 40,4 43,1 45,4 47,4 49,1 50,6 52,0 53,2 2 6,08 8,33 9,80 10,9 11,7 12,4 13,0 13,5 14,0 14,4 14,7 15,1 3 4,50 5,91 6,82 7,50 8,04 8,48 8,85 9,18 9,46 9,72 9,95 10,2 4 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,60 7,83 8,03 8,21 8,37 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 3,64 3,46 3,34 3,26 3,20 3,15 3,11 3,08 3,02 3,03 3,01 3,00 2,98 2,97 2,96 2,95 4,60 4,34 4,16 4,04 3,95 3,88 3,82 3,77 3,73 3,70 3,64 3,65 3,63 3,61 3,59 3,58 5,22 4,90 4,68 4,53 4,41 4,33 4,26 4,20 4,15 4,11 4,08 4,50 4,02 4,00 3,98 3,96 5,67 5,30 5,06 4,89 4,76 4,65 4,54 4,51 4,45 4,41 4,37 4,33 4,30 4,28 4,25 4,23 6,03 5,63 5,36 5,17 5,02 4,91 4,82 4,75 4,69 4,64 4,59 4,56 4,52 4,49 4,47 4,45 6,33 5,90 5,61 5,40 5,24 5,12 5,03 4,95 4,88 4,83 4,78 4,74 4,70 4,67 4,65 4,62 6,58 6,12 5,82 5,60 5,43 5,30 5,20 5,12 5,05 4,99 4,94 4,90 4,86 4,82 4,79 4,77 6,80 6,32 6,00 5,77 5,59 5,46 5,35 5,24 5,19 5,13 5,08 5,03 4,99 4,96 4,92 4,90 6,99 6,49 6,16 5,92 5,74 5,60 5,49 5,39 5,32 5,25 5,20 5,15 5,11 5,07 5,04 5,01 7,17 6,65 6,30 6,05 5,84 5,72 5,61 5,51 5,43 5,36 5,31 5,26 5,21 5,17 5,14 5,11 7,32 6,79 6,43 6,18 5,98 5,83 5,71 5,61 5,53 5,46 5,40 5,35 5,31 5,27 5,23 5,20 7,47 6,92 6,55 6,29 6,09 5,30 5,81 5,71 5,63 5,55 5,49 5,44 5,39 5,35 5,31 5,28
T AB E L A
A- 7
TABELA A8 - Valores crticos de T - teste de Wilcoxon

Nvel de significncia para uma prova unilateral
.025
.01
.005
Nvel de significncia para uma prova bilateral .05 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 0 2 4 6 8 11 14 17 21 25 30 35 40 46 52 59 .02 .01
0 2 3 5 7 10 13 16 20 24 28 33 38 43 49
0 2 3 5 7 10 13 16 20 23 28 32 38 43
grupo A. Toda vez que o valor observado de U tem uma probabilidade associada igual ou menor que , rejeita-se a H0 e aceita-se a H1
Tabela A-9- Probabilidade associadas ao U de Man- Whitney para n2=5
1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 .167 .333 .500 .667
2 .047 .095 .190 .286 .429 .571
3 .018 .036 .071 .125 .196 .286 .393 .500 .607
4 .008 .016 .032 .056 .095 .143 .206 .278 .365 .452 .548
5 .004 .008 .016 .028 .048 .075 .111 .155 .210 .274 .345 .421 .500 .579
TABELA A-10 - Fatoriais dos nmeros de 0 a 20
N 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
2 1 0 5 2 5 2 3 9 6 3 1 0
N!
1 1 7 6 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
2 1 7 0 3 8 8 8 6 8 2 0 0 0 0 0 0 2 2 4 2 8 0 0 0 0 0 0 0 0 0 0 0
3 3 9 9 7 8 4 9 8 5 8 6 6 9 0 0 2 3 8 0 7 8 6
4 6 2 1 0 2 9 6 8 9 2 3 4
5 0 2 8 6 1 0 1 8 8 6 8 2 0
8 0 2 8 7 0 0
6 7 7 2 7 3 0 8
4 2 1 6 7 4 7 4 1
3 7 2 7 7 8 2 0 0 7
1 4
2 3
6 1 2
3 4 6 9
2 5 0 4 0
Tabela A-11 Valores Crticos de A

Graus de Liberdade N-1* 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 .05 10 Nvel de significao para uma prova unilateral .025 .01 .005 .0005 Nivel de significao par uma prova bilateral .05 .02 .01 .001 N - 1* 0.5000012 0.5031 0.50049 0.50012 1
0.5125 0.412 0.385 0.376 0.372 0.370 0.369 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.368 0.369
0.369 0.324 0.304 0.293 0.286 0.281 0.278 0.276 0.274 0.273 0.271 0.270 0.270 0.269 0.268 0.268 0.267 0.267 0.266 0.266 0.266 0.266 0.265 0.265 0.265 0.265 0.265 0.264 0.264 0.263 0.262
0.347 0.286 0.257 0.240 0.230 0.222 0.217 0.213 0.210 0.207 0.205 0.204 0.202 0.201 0.200 0.199 0.198 0.197 0.197 0.196 0.196 0.195 0.195 0.194 0.194 0.193 0.193 0.193 0.193 0.191 0.189
0.340 0.272 0.238 0.218 0.205 0.196 0.190 0.185 0.181 0.178 0.176 0.174 0.172 0.170 0.169 0.168 0.167 0.166 0.165 0.165 0.164 0.163 0.163 0.162 0.162 0.161 0.161 0.161 0.160 0.158 0.155
0.334 0.254 0.211 0.184 0.167 0.155 0.146 0.139 0.134 0.130 0.126 0.124 0.121 0.119 0.117 0.116 0.114 0.113 0.112 0.111 0.110 0.109 0.108 0.108 0.107 0.107 0.106 0.106 0.105 0.102 0.099
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60
XX - BIBLIOGRAFIA
1. Runyon RP, Haber A. estatistica para las ciencias sociales. Fondo Educativo Interamericano, Mxico, 1984 2 Dorantes LC. Investigacin Clnica. Interamericana, 1986 3. Nieto F. Funciones, tablas y grficos; la funcion normal; medidas de resumen; estatstica inferencial. Prueba de t para muestras dependientes y muestras independientes, Doc Int CLAP 91-79,1979 4. Fescina RH. Epidemiologia en perinatologia. Publ. Cient. CLAP n. 1147, 1988 5. Wagner MB, Callegari. Jacques SM. Medidas de Associao em estudos epidemolgicos: Risco relativo e Odds ratio. J Pediatr (Rio J) 1998;74:247-251 6. Doria Filho U. Introduo bioestatstica para simples mortais. Negocio Editora, 2 edio, So Paulo, 1999. 7. Lima DD. Como escolher o teste estatstico em ensaios clnicos. Braslia Md 1996; 33 (suplemento n.1); 10-12 8. Vieira S. Introduo Bioestatstica. 2 Edio, Editora Campus, Rio de Janeiro, 1991. 9. Fescina R, Simini F, Belitzky R. Avaliao dos procedimentos diagnsticos: aspectos metodolgicos. Sade Perinatal - artigos selecionados de Salud Perinatal, Boletim do CLAP, Montevidu, pg 29,1988. 10. Nieto F, Curso de Bioestatstica. CLAP, Montevidu, 7/06/1988 a 7/7/1988
Miller: Anesthesia, 5th ed. Research design and satistics in anesthesia, Churchill Livingstone pg 753-791,2000 11. Sinclair J. como praticar medicina/neonatologia baseada em Rio de evidncias. I Simpsio Internacional de Neonatologia, Janeiro, 26-28/08/1999. 12. 13. Margotto , PR. Risco Perinatal. Boletim Informativo Peditrico Margotto, PR. Como exercer a medicina/neonatologia baseado (BIP)- Braslia, n 52, 1989. em evidncias. In. Margotto PR. Alto Risco em Neonatologia, Portico, Braslia, pg 21-24,2002. 14. Margotto, PR. Crescimento intra-uterino percentis de peso,estatura e permetro ceflico ao nascer de recm-nascidos nicos de gestaes normais e seus correspondentes pesos placentrios em diferentes perodos gestacionais (Tese de Doutorado). Montevideo, Uruguay: Centro Latinoamericano de Perinatologia Y Desarrollo Humano ( CLAP-OPS/OMS)1992 15. Fescina HR, Belitzky R. Evaluacin de los procedimientos diagnsticos aspectos metodolgicos. Tecnologas Perinatales. Publ. Cient.CLAP n. 1166,1988. 16. Margotto PR. Related Articles, Links [Intrauterine growth curves: study of 4413 single live births of normal pregnancies] J Pediatr (Rio J). 1995 Jan-Feb;71(1):11-21. Portuguese. PMID: 14689030 [PubMed] 17. Crescimento Intra-uterino-Tese de Doutorado (CLAP/OMS/OPS) Autor (s): Paulo R. Margotto

Bioestatistica Basica

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Bioestatistica Basica

Enviado por

Direitos autorais:

Formatos disponíveis

Dr. Paulo R.

ENTENDENDO BIOESTATSTICA BSICA Paulo R Margotto

Ano de registro 1998 (1) 1999 (1) 2000 (1)

Freqncia 8328 8214 8898

freqncia relativa 32,88 32,22 34,90

135/ ---- 140

140/ ---- 150 150/ ---- 160 160 e mais

0,4 0,1 0,1

Nascidos vivos segundo o peso ao nascer, em quilogramas

VI MEDIDAS DE TENDNCIA CENTRAL

VII Distribuio Normal

Probabilidade de taxa de colesterol entre 200 e 225

Consumo individual dirio de protenas de origem animal e coeficiente de natalidade em 14 pases

Com os valores apresentados na tabela, obtm-se:

77 - 60 (55 45) (110 80)

Aplicando as frmulas , temos: 1589,2 69.141,2 b=

= 371,35 = 2,16 171,875

141,2 - 2,16 69 = - 0,98 8 8

IX- RISCO RELATIVO/ RISCO ATRIBUVEL/ ODDS RATIO QUI- QUADRADO

se obtm maior impacto controlar preferencialmente : Fundamento do enfoque de risco

Os problemas de sade no tem a mesma importncia

c/c+d RR = 150/724 = 19,2 61/5.649

Fator Mortalidade Perinatal Total

94 (c) 3.537 (d) 211 (a+c) 6.162 (b+d)

3.631 (c+d) 6.373(n= a+b+c+d)

Fator dano Ausncia de Sim Pr-natal No Total

Morte Neonatal Sim No 58 2.625 38 3.573 96 6.162

Total 2.683 3.575 6.258

1,61,53 = 2,05 e 1,6 0,47 = 1,2 O intervalo de confiana a 95% : ...1...1,2_____________2,05

F% (P1 P2) P (geral)

No caso, temos: RAP% = 43 X 0,017 = 22 % 211 / 6.373

= 0,14 2625 117

XI- TESTE DE FISHER OU DA PROBABILIDADE EXATA

Calcularamos: total 5 3 8 2 5 7 7 8 15 total 6 2 8 1 6 7 7 8 15 P = (8! 7! 7! 8!/15) (1/5! 3! 2! 5!) P = 0,1828

P = (8! 7! 7! 8!/15) (1/6! 2! 1! 6!) P = 0,0305

P = (8! 7! 7! 8!/15) (1/0! 7! 1! 7!) P = 0,0012

Grupo Tratado Dieta 12 1 14 0 12 0 9 1 14 0,5 14 1 9 0

= 6,6 7 graus de liberdade

XIII ESTADGRAFO DE SANDLER

Antes Depois Diferena (D) 1 2 3 4 5 6 7 8 9 10 25 23 30 7 3 22 12 30 5 14 28 19 34 10 6 26 13 47 16 9 -3 4 -4 -3 -3 -4 -1 -17 -11 5 D = -37

Quadrado da 2 Diferena (D ) 9 16 16 9 9 16 1 289 121 25 D2 = 511

Anlise das Varincias Soma dos quadrados Entre a Dentro c Total b

quadrado mdio = estimao da varincia

F = estimao da varincia (a) = 57,48 = 7,82 Estimao da varincia (c)

tratamento, a d.m.s calculada pela frmula: d.m.s =

X variao estimada dentro do grupo (c)

Para comparar a mdia de B com C:

Os valores absolutos das diferenas das mdias entre os grupos so: A e B : 14 - 19 = 5 A e C: 14 - 17 = 3 B e C: 19 - 17 = 2

XV - Escolha do Teste Estatstico

VII I- SENSIBILIDADE/ESPECIFICIDADE VALOR PREDICTIVO

Sentido da anlise a+b c+d a+b+c+d (n)

totais 85 206 291

84 x 100 = 76% 110

Exatitude observada: 30 + 20 = 0,89 56

34 x 32 = 19,42 (fila de exames (-) x coluna de

Assim, a matriz de deciso anterior fica:

Procedimento 4 (c) 30 (19,42) (d)

0,52+(0,61)2 0,39 x 0,39 (0,39+0,39)+ ,61x0,61(0,61+0,61)

= 0,28 X 0,11 = 0,31

Prevalncia: 50 x 100 = 67%

VPP = prevalncia da doena x sensibilidade Prevalncia x sensibilidade + ( 1 - prevalncia) x (1 - especificidade)

EXPOSIO Sim ( tratado ) No (controle)

DR= - 0,063 NNT = 1 -0,063

TABELA A. 2 VALORES DE N, SEGUNDO OS GRAUS DE LIBERDADE E O VALOR DE CZ GRAUS DE LIBERDADE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30