Escolar Documentos
Profissional Documentos
Cultura Documentos
DOI: 10.5935/0034-7280.20140004
16
Bioestatsticas: conceitos
fundamentais e aplicaes prticas
Biostatistics: fundamental concepts and practical applications
Bernardo Lopes1,Isaac Carvalho de Oliveira Ramos , Guilherme Ribeiro, Rosane Correa, Bruno de Freitas
Valbon; Allan Cezar da Luz; Marcella Salomo, Joo Marcelo Lyra, Renato Ambrsio Junior1
RESUMO
A bioestatstica ganha crescente importncia e relevncia nos ltimos anos, sendo um dos principais pilares da investigao cientfica. Possui uma srie de conceitos e regras que devem ser bem compreendidos para se realizar ou analisar um artigo. Nesta reviso
so abordadas algumas das principais ferramentas utilizadas nos trabalhos de interesse da rea oftalmolgica, suas aplicaes e
limitaes.
Descritores: Bioestatstica/mtodos; Distribuies estatsticas; Interpretao estatstica de dados
ABSTRACT
The biostatistics has gaine d significant importance in recent years, being one of the mainstays of current scientific research. It has a
series of concepts and rules that must be understood to carry out or analyze an article. In this review we will discuss some of main tools
utilized in works of interest in ophthalmology, its applications and limitations.
Keywords: Biostatistics/methods; Statistical distributions; Data interpretation, statistical
Rio de Janeiro Corneal Tomography and Biomechanics Study Group, Rio de Janeiro, RJ, Brasil.
Brazilian Study Group of Artificial Intelligence and Corneal Analysis (BrAIn), Brazil.
INTRODUO
17
advento da Medicina Baseada em Evidncias determinou novos padres e exigncias, o que marcou uma importante mudana na prtica mdica. A obteno de
conhecimento deixou de ser baseada apenas na sempre importante, mas limitada, experincia clnica, para ser adquirida por
meio de metodologia cientfica. Esta envolve, de forma fundamental, o emprego de anlise estatstica(1). Com isso, o conhecimento em Bioestatstica habilidade fundamental para se realizar, avaliar ou interpretar adequadamente um trabalho cientfico. Entretanto, tal rea representa um campo de dificuldades e
preconceitos para o mdico. Nesta reviso, abordamos de forma
prtica alguns dos principais testes para estudos de interesse em
Oftalmologia.
Teste de hipteses
Ao realizar um teste estatstico, em primeiro lugar, elaboramos hipteses. Por exemplo, ao avaliarmos se espessura
corneana central (ECC), espessura no ponto mais fino (EPMF)
e valores de ceratometria central (K1 e K2) podem ser utilizados para diferenciar olhos normais de olhos com ceratocone, formulamos duas hipteses. A hiptese de no haver diferena nos
valores destas variveis entre os grupos, chamada de hiptese
nula (H0). E a hiptese alternativa (H1), que assume haver diferena entre os grupos normal e com ceratocone.
Amostras
Para iniciarmos o teste proposto necessrio estabelecer
as amostras de investigao. Para que os resultados do trabalho
sejam vlidos imprescindvel que a amostra em cada grupo
represente, da forma mais fidedigna possvel, os diversos matizes da populao. Entre as caractersticas mais relevantes da
amostra devemos considerar sua forma de obteno, tamanho,
distribuio de suas variveis e pareamento. Assim, podemos
identificar potenciais fontes de vis e escolher a melhor
metodologia e os melhores testes estatsticos para contorn-los.
Distribuio da amostra
A distribuio da amostra deve ser testada para verificar
se ela ou no paramtrica. Os testes estatsticos so altamente
dependentes do tipo de distribuio dos valores obtidos na amostra. A distribuio normal ou gaussiana (paramtrica) uma das
formas de distribuio mais estudadas em bioestatstica. Ela
definida por dois parmetros: a mdia () e a varincia (). Dentre as suas caractersticas observamos o formato em sino simtrico ao redor do centro, a presena de dois pontos de inflexo,
um direita e outro esquerda, cuja distncia do centro
corresponde ao desvio padro ou sigma (). Com estes dados,
possvel calcular as probabilidades relacionadas a uma varivel contnua com essa distribuio(2).
Quando a amostra relativamente grande, podemos aplicar o teorema do limite central e inferir a normalidade de sua
distribuio. Esse teorema afirma que quando o tamanho de uma
amostra aumenta, a distribuio amostral da sua mdia aproximase cada vez mais de uma distribuio normal(3).
Entretanto, testes de aderncia normalidade podem ser
utilizados. Entre eles, temos o teste de Kolmogorov-Smirnov, o
teste de Lillefors, o teste de Shapiro-Wilk. Este ltimo inicialmente descrito para amostras pequenas(4). Nesses testes buscase encontrar a hiptese nula, na qual no existe diferena entre
a distribuio da amostra estudada e a distribuio normal. De
forma geral, estes testes so bastante rigorosos e facilmente rejeitam a hiptese de Normalidade.
Outras ferramentas que podem ser utilizadas so os mtodos descritivos, como a anlise de histogramas (figura 1), coeficientes de assimetria e curtose. Quando a normalidade no pode
ser inferida podemos utilizar testes no paramtricos ou realizar a transformao dos dados. A transformao mais comumente
empregada a transformao logartmica cuja principal indicao a assimetria dos dados. Outras transformaes, como a raiz
quadrada ou a recproca tambm podem ser utilizadas em casos
determinados(5).
Amostras dependentes e independentes
Para escolhermos o tipo de teste a ser empregado, outra
caracterstica da amostra deve tambm ser considerada: se ela
pareada (dependente) ou no-pareada (independente). Um
estudo com amostras pareadas ocorre quando cada observao
no primeiro grupo for pareada com a mesma observao no segundo grupo. Em oftalmologia esse tipo de estudo mais frequentemente empregado em casos em que h a observao da
mesma amostra em dois ou mais tempos distintos, como o pr e o
ps-operatrio. Nesse caso, os dois grupos so compostos pelos
mesmos indivduos.
Nos casos no pareados, cada grupo composto por indivduos distintos, assim podemos comparar, por exemplo, grupos
de saudveis com grupos de portadores de alguma doena.
importante ressaltar essa caracterstica da amostra, pois
duas observaes em um mesmo indivduo so mais provveis
de serem semelhantes que duas observaes em dois indivduos
diferentes e, portanto, estatisticamente dependentes. Isso deve
ser considerado pelo teste empregado para encontrar a validade estatstica da diferena encontrada entre essas amostras.
Outra implicao do pareamento o fato de os olhos serem rgos pares. Existe uma simetria entre o olho direito e o
esquerdo de um mesmo indivduo. Se forem utilizados ambos os
olhos de um paciente, podero estar sendo mesclados dados dependentes com independentes, criando assim um erro
metodolgico(6). Dessa forma, utilizar apenas um olho de cada
paciente escolhido de forma aleatria uma boa maneira de se
realizar os estudos(7).
Tipos de testes
Os testes estatsticos devero obedecer s caractersticas
da amostra citadas anteriormente: distribuio e pareamento.
18
Lopes B, Ramos ICO, Ribeiro G, Correa R, Valbon BF; Luz AC; Salomo M, Lyra JM, Ambrsio Jr. R
Esquema 1
Entretanto, para escolha do melhor teste a ser empregado devemos considerar a quantidade de grupos ou observaes. Os principais testes para cada situao esto resumidos no esquema 1.
Exemplo de estudo
No exemplo a seguir vamos considerar a comparao de
dois grupos. As amostras consistem em um olho randomicamente
selecionado de 114 olhos normais e 44 casos de ceratocone(8). O
prximo passo estabelecer as variveis que sero estudadas.
Considerando o objetivo de avaliar a capacidade de uma varivel como teste diagnstico, devemos testar se as diferenas entre os grupos so significantes. Sabendo-se que as amostras no
so pareadas, a escolha do teste deve ser feita considerando-se
a existncia ou no de distribuio normal (paramtrica). Este
teste confirma se a diferena no seria fruto do acaso. Um teste,
como o de Kolmogorov-Smirnov deve ser realizado para verificar se as variveis em cada grupo apresentam distribuio normal (com p>0,05), ou seja, ausncia de diferena estatisticamente
significante entre a distribuio dos dados na amostra e a distribuio normal. Histogramas tambm podem ser realizados para
visualizar a distribuio em sino ou gaussiana.
O teste t de Student pode ser utilizado se ambas as amostras so paramtricas. De acordo com o teorema do limite central, por se tratar de amostra grande com mais de 30 indivduos,
a utilizao do teste paramtrico a priori j poderia ser considerada como correta. Entretanto, se a amostra fosse pequena e
a normalidade no fosse verificada, poderamos como mencionado anteriormente recorrer transformao dos dados ou utilizar um teste no paramtrico. O teste no paramtrico como o
de Mann-Whitney (MannWhitney U test ou Wilcoxonrank-sum
Tabela 1
Diferenas entre grupos
Normais
K1
K2
ECC
EPMF
Eixo Astig
Ceratocone
Intervalo
Intervalo
p valor*
42.68 1.47
43.66 1.58
550 35
544 35
97 71
39.5 - 46.7
39.8 - 48.2
444 - 632
443 - 629
1 - 180
49.35 7.64
51.58 9.1
460 57
443 60
76 64
38.6 - 71.6
42.6 - 77.5
283 - 548
254 - 542
0 - 179
< 0.001
<0.001
<0.001
<0.001
0.12
19
Tabela 2
Resultados de um teste diagnstico
Teste
Grupo Doente
Grupo Normal
(sem doena)
Positivo
para Doena
Deciso correta
Verdadeiro
Positivo (VP)
Erro do tipo I
ou Falso
Positivo (FP)
Erro do tipo II
ou Falso
Negativo (FN)
Deciso correta
Verdadeiro
Negativo (VN)
Negativo
para Doena
Tabela 3
Sensibilidade e Especificidade de cada ponto de corte
Ponto de Corte
< 283
<= 435
<= 444
<= 456
<= 459
<= 460
<= 462
<= 477
<= 479
<= 483
<= 493
<= 496
<= 498
<= 501
<= 502
<= 504
<= 505
<= 506
<= 507
<= 508
<= 509
<= 516
<= 523
<= 524
<= 529
<= 532
<= 547
<= 548
<= 632
(1)
(2)
Sensibilidade (%)
Especificidade (%)
0
20.45
20.45
34.09
34.09
36.36
36.36
61.36
63.64
63.64
68.18
68.18
72.73
72.73
75
77.27
79.55
79.55
81.82
81.82
88.64
93.18
93.18
95.45
95.45
97.73
97.73
100
100
100
100
99.12
99.12
98.25
98.25
97.37
97.37
96.49
95.61
95.61
93.86
93.86
91.23
91.23
90.35
88.6
87.72
87.72
86.84
85.96
85.96
78.07
77.19
72.81
71.05
53.51
53.51
0
Sensibilidade =
VP
(VP+FN)
Especificidade =
VN
(VN+FP)
Os conceitos de sensibilidade e especificidade sero utilizados, a seguir, para descrever quantitativamente o desempenho de um teste diagnstico por meio da construo de sua respectiva curva ROC.
Curva ROC 1 e Acurcia de um teste
A curva ROC construda em um plano cartesiano. No
eixo Y encontra-se a sensibilidade e no eixo X, 1 menos a
especificidade (1-E), ambos em valores decimais. Para cada ponto de corte utilizado pelo teste so calculadas a sensibilidade e a
especificidade e inserido um ponto no grfico. A unio desses
pontos forma a curva ROC.
No caso da ECC, o melhor ponto de corte foi 517m, com
sensibilidade de 86% e especificidade de 93,2%. A respectiva
curva ROC pode ser visualizada na figura 3.
A rea sob a curva (AUC 2) representa a acurcia ou
performance global do teste, pois leva em considerao todos os
valores de sensibilidade e especificidade para cada valor da varivel do teste. Quanto maior o poder do teste em discriminar os
indivduos doentes e no doentes, mais a curva se aproxima do
canto superior esquerdo, no ponto que representa a sensibilidade e 1-especificidade do melhor valor de corte. Quanto melhor o
teste, mais a rea sob a curva ROC se aproxima de 1. Um teste
com pequeno poder diagnstico tem curvas mais retilneas. Um
teste que represente simplesmente o acaso (como jogar uma
moeda para alto e obter resultados binrios aleatrios) teria cerca
Rev Bras Oftalmol. 2014; 73 (1): 16-22
20
Lopes B, Ramos ICO, Ribeiro G, Correa R, Valbon BF; Luz AC; Salomo M, Lyra JM, Ambrsio Jr. R
Tabela 4
rea sob a curva ROC
AUC
K1
K2
ECC
EPMF
0.865
0.859
0.939
0.957
Tabela 5
Comparao par a par da AUC
com mtodo de DeLong (p-valores)
21
tar p-valor pequeno, com menor significncia prtica de seus resultados. Por outro lado, amostras pequenas podem afetar o pvalor, de modo que fique mais alto.
Nesse caso, apesar de haver relevncia clnica, devido ao
tamanho inadequado da amostra, h uma interpretao equivocada dos resultados(11). O valor p, portanto, no determinar a
acurcia de um teste, mas sim, como dito anteriormente, a AUC.
Intervalo de confiana
O conceito de intervalo de confiana est relacionado com
a variabilidade das estimativas de acurcia. O seu clculo est
diretamente relacionado com o erro tipo I ou , como pode ser
visualizado na figura 6. Quanto menor o , mais amplo o intervalo de confiana, ou seja, mais confivel aquele estimador. No
exemplo da figura 6 em um teste bicaudal o escolhido foi 5%.
Ento, com probabilidade de 95%, o valor estar dentro do intervalo entre /2 e +/2. Tanto o intervalo de confiana como
o erro padro so calculados de acordo com as caractersticas e
resultados obtidos nas amostras, servindo para interpretao da
relevncia clnica do varivel diagnstica(12).
Aprimoramento das ferramentas diagnsticas
Enquanto os valores de curvatura corneana centrais (K1
e K2) e a ECC, no podem ser utilizados isoladamente para separar normais de ceratocone, outras variveis derivadas do estudo tomogrfico podem ser considerados de forma isolada ou
combinada(13).O mapa de curvatura topomtrico nos fornece o
dado do ponto mais curvo da superfcie anterior. Esse ndice
apresenta maior acurcia (AUC maior) que os ndices de curvatura central. No mapa tomogrfico de espessura podemos obter
a EPMF, que, como visto anteriormente, representa uma melhora na capacidade de deteco de ceratocone quando comparada
ECC.
Combinao de variveis
Para aumentarmos ainda mais a acurcia no diagnstico,
podemos combinar diferentes variveis. Essa combinao pode
ser feita atravs de uma operao matemtica fundamental como
o caso do Ambrsios Relational Thickness (ART), que representa a razo da espessura corneana no ponto mais fino pela
progresso paquimtrica. Tal ndice demonstrou elevado poder
diagnstico na deteco do ceratocone(8).
Outras formas mais sofisticadas de se combinar variveis
so a anlise discriminante linear e a regresso logstica, que a
partir de um conjunto de variveis, de maneira ponderada, capaz de separar os indivduos em grupos. Esse tipo de combinao tem grande valor em testes diagnsticos, pois pode separar
com mais preciso os indivduos normais dos doentes por meio
dos diversos dados obtidos nos testes.
Com as amostras citadas anteriormente podemos realizar
uma regresso logstica incluindo os dados dos estudos dos mapas topogrfico (Kmx) e tomogrfico (EPMF). Obtermos a frmula:
Figura 7: Grficos Dot-Plot, Box-Plot da regresso logstica (RL) criada a partir de Kmax e EPMF e curva ROC com mxima aproximao do canto superior esquerdo (normal: n=114, ceratocone: n=44)
CONCLUSO
Buscamos com essa reviso citar os principais conceitos
em bioestatstica e alguns testes para anlise dos resultados de
um estudo cientfico e sua aplicabilidade. Por ser um tema basRev Bras Oftalmol. 2014; 73 (1): 16-22
22
Lopes B, Ramos ICO, Ribeiro G, Correa R, Valbon BF; Luz AC; Salomo M, Lyra JM, Ambrsio Jr. R
REFERNCIAS
9.
10.
11.
12.
13.
14.
1.
2.
3.
4.
5.
6.
7.
8.
15.
Autor correspondente:
Renato Ambrsio Jnior
Rua Conde de Bonfim, n 211/712 - Tijuca
CEP 20520-050 - Rio de Janeiro (RJ), Brasil