Você está na página 1de 2

Por dentro da estatstica

O uso de mtodos estatsticos vem crescendo vigorosamente em pesquisas da rea mdica. Com frequncia, mdicos e profissionais da Sade so expostos a informaes provenientes de anlises de dados, nem sempre claras e de fcil interpretao. Esta seo visa familiarizar pesquisadores com conceitos e termos estatsticos comumente presentes em artigos cientficos. Com nfase na discusso conceitual em detrimento a frmulas matemticas, o objetivo esclarecer algumas dvidas frequentes e contribuir com o desenvolvimento do senso crtico na hora de analisar, descrever e interpretar dados. ngela Tavares Paes
Editora da seo

Posso usar o teste t de Student quando preciso comparar trs ou mais grupos?
Gisele Huang1, ngela Tavares Paes2
Acadmica em Estatstica pelo Instituto de Matemtica e Estatstica da Universidade de So Paulo IME-USP, So Paulo (SP), Brasil. 2 Doutora em Estatstica do Centro de Pesquisa Clnica do Instituto Israelita de Ensino e Pesquisa Albert Einstein IIEPAE, So Paulo (SP), Brasil.
1

Com a popularizao da Estatstica e as facilidades computacionais, os pesquisadores da rea da sade tm ganhado certa independncia no sentido de realizar suas prprias anlises sem auxlio de um profissional. Se por um lado essa autonomia bastante positiva, por outro, erros metodolgicos graves podem ser cometidos. Mesmo para anlises mais simples, a escolha do mtodo estatstico mais adequado pode no ser trivial. Ao analisar certo tipo de dados, devemos considerar vrios aspectos, como o desenho do estudo, a natureza dos dados e o propsito da anlise. Uma anlise muito comum e simples utilizada na rea mdica a comparao de duas mdias de dois grupos dependentes ou independentes. Para testar a igualdade entre duas mdias, o teste t de Student, muito utilizado nos dias de hoje, seria o mais apropriado por ser um teste paramtrico, o que nos d maior poder estatstico e, consequentemente, maior confiabilidade dos resultados(1). Nesse cenrio, dois tipos de desenho devem ser considerados: quando os grupos so independentes (por exemplo, homens e mulheres) e quando so pareados, ou seja, o mesmo grupo de indivduos analisado duas vezes (antes e aps um procedimento ci-

rrgico, por exemplo)(2). Em ambos os desenhos, o teste supe independncia e normalidade das observaes. Alm disso, as varincias de grupos independentes podem ser iguais ou diferentes, havendo alternativas de teste para ambas as situaes. Para a comparao de dois grupos, em geral no h dificuldade em se aplicar o teste t de Student (para grupos independentes) ou o teste t pareado (para grupos dependentes). O problema surge quando o estudo envolve trs ou mais grupos. E ento? O que fazemos quando queremos comparar trs grupos? Podemos fazer vrios testes t para cada comparao dois a dois? Sim, possvel, porm no seria uma boa aproximao e nem a mais adequada. Primeiro, porque seria necessrio realizar muitos testes, o que daria muito trabalho. Por exemplo, se tivermos quatro grupos (A, B, C e D) teramos que fazer seis comparaes (A versus B, A versus C, A versus D, B versus C, B versus D, C versus D). No caso de cinco grupos, teramos dez pares de comparaes e assim por diante. Em segundo lugar, mesmo que os grupos sejam testados em pares, no poderamos generalizar os resultados para toda a populao, pois os mltiplos testes no podem, de forma alguma, ser considerados independentes(3). Por ora, vamos focar no caso de trs grupos. Um exemplo disso poderia ser um estudo que compara pacientes submetidos a uma cirurgia cardaca, no qual foram separados aleatoriamente entre trs grupos de ventilao. O grupo A recebeu 50% de xido nitroso e 50% de oxignio continuamente por 24 horas; o grupo B recebeu 50% de xido nitroso e 50% de oxignio somente durante a cirurgia; e o grupo C recebeu de 35 a 50% somente de oxignio por 24 horas. Nesse exemplo,
einstein: Educ Contin Sade. 2009;7(2 Pt 2): 63-4

64

teramos no total trs comparaes dois a dois: grupo A com B, grupo A com C e grupo B com C. Se compararmos o grupo A com o grupo B, o resultado do teste ser estatisticamente significativo se a hiptese nula, que supe igualdade de mdias, for rejeitada a um nvel de significncia determinado previamente. Esse nvel, comumente considerado a 5%, representa a probabilidade de ocorrer o erro tipo I, ou seja, a probabilidade de rejeitar a hiptese nula dado que ela verdadeira. Se considerarmos as trs comparaes como testes independentes e quisermos calcular a probabilidade de obteno de um resultado estatisticamente significante para os trs testes simultaneamente, devemos multiplicar as probabilidades de que cada teste obtenha individualmente um resultado significativo. Assim, considerando o nvel de significncia a 5% para cada teste, a probabilidade dos trs testes serem significativos 0,05 x 0,05 x 0,05 = 0,000125(3). Seguindo o mesmo raciocnio, a probabilidade de que nenhum dos testes seja estatisticamente significante 0,95 x 0,95 x 0,95 = 0,8574. Ou seja, a probabilidade de que ao menos um seja significante 1 0,8574 = 0,14, que aproximadamente trs vezes o nvel de significncia estipulado anteriormente(3). medida que o nmero de grupos aumenta, a probabilidade de termos pelo menos um resultado significativo tambm aumenta, tornando-se muito maior que o nvel de significncia usualmente adotado. Ou seja, quando fazemos vrias comparaes de forma independente, o erro real que podemos cometer muito maior que 5% e, com isso, podemos detectar erroneamente significncia estatstica em diferenas que no existem. por essa razo que o uso de mltiplos testes t se torna inadequado quando queremos comparar mais de dois grupos simultaneamente. Esse erro causa um falso aumento na probabilidade de encontrarmos pelo menos uma diferena significativa. Nesse caso em particular, podemos utilizar o mtodo da Anlise de Varincia, mais conhecida como ANOVA, para evitar

este tipo de problema(1). Na ANOVA, aps a rejeio da hiptese de igualdade das (trs ou mais) mdias, podemos utilizar mtodos de comparaes mltiplas que garantem um nvel de significncia global, por exemplo de 5%, para todas as comparaes de interesse. Neste artigo, apresentamos o caso mais simples da comparao entre trs grupos. No entanto, a mesma regra vale para desenhos mais complexos. Um exemplo muito comum quando temos trs grupos independentes (por exemplo, trs tratamentos medicamentosos) avaliados ao longo do tempo, por exemplo, em trs momentos distintos (inicial, trs meses e um ano aps o incio do tratamento). Uma prtica comum, embora totalmente inadequada, aplicar testes t de Student (ou mesmo ANOVA) para comparaes entre os grupos e testes t pareados (ou mesmo ANOVA com medidas repetidas) para comparaes intragrupo (entre os momentos de avaliao). Da mesma forma que no exemplo dado anteriormente, as comparaes feitas de forma independente inflacionam o nvel de significncia e, assim, o verdadeiro erro infinitamente maior do que o estabelecido no planejamento do estudo. Este artigo no pretende absolutamente desmotivar a realizao de anlises estatsticas por profissionais de outras reas. Nosso objetivo alertar os pesquisadores, usurios da Estatstica, para que conheam as limitaes dos mtodos. O uso indiscriminado dos testes e a produo abusiva de valores de p podem trazer srias implicaes e comprometer a confiabilidade de muitos estudos, inclusive os j publicados em peridicos conceituados.

RefeRncias
1. Altman DG. Practical statistics for medical research. London: Chapman & Hall; 1991. 2. Vieira S. Anlise de Varincia (ANOVA). So Paulo: Atlas SA; 2006. 3. Bekiroglu N. Multiple t tests or ANOVA (analysis of variance). Turkish Resp J. 2001;2(1):21-2.

einstein: Educ Contin Sade. 2009;7(2 Pt 2): 63-4

Você também pode gostar