Você está na página 1de 5

Lunet N et al

NOTAS METODOLGICAS

Desvio Padro ou Erro Padro?


ISSN 0871-3413 ArquiMed, 2006

Desvio Padro ou Erro Padro

Nuno Lunet, Milton Severo, Henrique Barros Servio de Higiene e Epidemiologia da Faculdade de Medicina da Universidade do Porto

A distino fundamental entre estatstica descritiva e inferncia estatstica pode ser ilustrada pelo diferente significado dos termos desvio padro e erro padro. Contudo, o uso do erro padro da mdia para descrever a variabilidade das observaes numa amostra dos erros mais frequentemente observados na literatura mdica (1), muitas vezes por desconhecimento de princpios bsicos da estatstica. Neste texto procuraremos definir estas duas medidas, colocando em evidncia as suas diferenas e as situaes em que cada uma delas pode ser, adequadamente, utilizada.

DESVIO PADRO O desvio padro uma medida de disperso e o seu valor reflecte a variabilidade das observaes em relao mdia. A disperso das observaes que constituem uma amostra pode ser caracterizada pelos desvios de cada observao em relao mdia (i - ), podendo tomar valores positivos ou negativos, e o somatrio dos desvios de cada observao em relao mdia amostral zero. Contudo, os desvios ao quadrado(i - )2, tomam sempre um valor positivo, e a respectiva mdia a varincia da amostra. Se existir uma grande disperso das observaes a varincia grande. Se os valores de cada uma das observaes forem prximos da mdia a varincia pequena. Uma vez que a varincia obtida a partir dos quadrados dos desvios, esta exprime-se na unidade da varivel ao quadrado (e.g. se as observaes tiverem "cm" como unidade, a varincia exprime-se em "cm2"). O desvio padro a raiz quadrada da varincia (frmula 1), pelo que as suas unidades so as mesmas da mdia da varivel. O clculo do desvio padro exemplificado no anexo 1. (1)

da forma como as observaes se distribuem em torno da mdia, cerca de 68,2% das observaes esto contidas no intervalo definido por mdia 1 desvio padro, 95,4% no intervalo mdia 2 desvios padro e 99,7% no intervalo mdia 3 desvios padro. O desvio padro, para alm de sumariar a informao relativa disperso das observaes relativamente mdia amostral, uma estimativa da disperso na populao de que a amostra proveniente. Contudo, esta estimativa sistematicamente inferior ao valor real do desvio padro da populao, principalmente nas amostras pequenas, pelo que habitualmente calculado o desvio padro corrigido (frmula 2), que no apresenta o referido erro sistemtico (2).

(2)

ERRO PADRO Quando extramos uma amostra aleatria da populao e calculamos o valor mdio de uma determinada varivel, o objectivo ltimo inferir sobre a mdia da populao de onde a amostra originria, ou seja, a mdia na amostra avaliada uma estimativa da mdia na populao, cuja preciso depende da disperso da populao e do tamanho da amostra. Se vrias amostras aleatrias forem obtidas de uma dada populao, elas vo diferir relativamente ao valor mdio da populao em cada uma e, semelhana do que acontece com as observaes de cada amostra individualmente, a distribuio das mdias amostrais tem tambm um desvio padro. O erro padro da mdia de uma amostra uma estimativa do desvio padro da distribuio das mdias de amostras com o mesmo tamanho obtidas da mesma populao, e dessa forma uma medida da incerteza associada estimativa da mdia na populao (anexo 2). No caso do erro padro da mdia, este obtido dividindo o desvio padro da amostra pela raiz quadrada do nmero de observaes na amostra. O erro padro da estimativa diminui com o aumento do tamanho da amostra, reflectindo o aumento de preciso da estimativa com o tamanho da amostra (anexo 2).
55

A magnitude do desvio padro depende da disperso das observaes relativamente mdia, no variando com o aumento do tamanho das amostras. Quando a varivel segue uma distribuio normal, o desvio padro fornece uma informao adicional acerca

ARQUIVOS DE MEDICINA

Vol. 20, N 1/2

QUANDO UTILIZAR O DESVIO PADRO E O ERRO PADRO DA MDIA? Se o objectivo descrever a variabilidade observada numa amostra deve-se utilizar o desvio padro. O desvio padro, como medida de disperso, no deve ser usado quando a populao no segue uma distribuio normal ou aproximadamente normal. Nestes casos, o desvio padro pode no ser uma boa estimativa de disperso, pelo facto da mdia, que utilizada no seu clculo, ser pouco resistente a observaes extremas. Tambm quando a distribuio da populao normal podem ocorrer observaes extremas se o tamanho das amostras for pequeno. Nestas situaes, poder ser mais adequada a descrio da disperso com outras medidas (e.g. distncia inter-quartis) ou indicando percentis prximos dos dois extremos da distribuio (e.g. percentis 25 e 75 ou os percentis 10 e 90). Se o objectivo for indicar a impreciso associada estimativa de um determinado parmetro (e.g. mdia), pode utilizar-se o erro padro. Contudo, de uma forma geral, os intervalos de confiana podem ser interpretados de forma mais directa que os erros padro, sendo prefervel a apresentao dos primeiros. O erro padro um passo intermdio no clculo de intervalos de confiana. O facto do erro padro ser quantitativamente menor do que o desvio padro pode contribuir para que alguns autores optem por apresentar o erro padro quando pretendem quantificar a disperso das observaes da amostra, transmitindo uma falsa ideia de preciso aos leitores menos atentos e com poucos conhecimentos de estatstica.

erro padro (e.g. 0,350 0,062 g/cm2) sem que seja indicada qual a quantidade a que o nmero colocado aps o sinal se refere. necessrio indicar de forma clara no texto se apresentada a mdia e a respectiva medida da incerteza (e.g. os resultados apresentados so mdia (erro padro)) ou a mdia e uma medida da disperso (e.g. os resultados apresentados so mdia (desvio padro)) (4).

Leitura recomendada Altman DG, editor. Practical statistics for medical research. Chapman &Hall; 1991. Bland M, editor. An inroduction to medical statistics, 3 ed. Oxford University Press; 2000. Coggon D. Statistics in clinical practice, 2nd ed. BMJ books, 2003.

REFERNCIAS
1 - Lunet N, Barros H. Sobre a necessidade da metodologia. Arq Med 2003;17:132-5. 2 - Murteira BJF. Anlise exploratria de dados: estatstica descritiva. McGraw-Hill, 1993. 3 - Olsen CH. Review of the use of statistics in Infection and Immunity. Infect Immun 2003;71:6689-92. 4 - Altman DG, Bland JM. Standard deviations and standard errors. BMJ 2005;331:903.

APRESENTAO DOS RESULTADOS O desvio padro e o erro padro tm as mesmas unidades das medidas das quais resultam. frequente (3) a utilizao do smbolo entre o valor numrico da mdia e o do respectivo desvio padro ou

Correspondncia: Prof. Nuno Lunet Servio de Higiene e Epidemiologia Faculdade de Medicina da Universidade do Porto Alameda Prof.. Hernni Monteiro 4200-319 Porto e-mail: nlunet@med.up.pt

56

Lunet N et al

Desvio Padro ou Erro Padro?

Anexo 1 - Clculo do desvio padro para os valores do permetro de cintura (PC) numa amostra de 10 indivduos.

PC (cm)
i

observao mdia i - 87,1-88,1= -1,0 87,8-88,1= -0,3 90,9-88,1= 2,8 78,8-88,1= -9,3 97,7-88,1= 9,6 84,9-88,1= -3,2 82,5-88,1= -5,6 74,2+88,1= -13,9 104,8-88,1= 16,7 92,3-88,1= 4,2

(observao mdia)2 (i - )2 1,0 0,1 7,8 86,5 92,2 10,2 31,4 193,2 278,9 17,6

Observa0 1 Observao 2 Observao 3 Observao 4 Observao 5 Observao 6 Observao 7 Observao 8 Observao 9 Observao 10

87,1 87,8 90,9 78,8 97,7 84,9 82,5 74,2 104,8 92,3

mdia

A varincia obtida dividindo o somatrio dos quadrados das diferenas entre cada observao e o valor mdio das observaes pelo nmero de observaes (718,9/10=71,9). O desvio padro a raiz quadrada da varincia 71,9=8,5). Uma vez que o tamanho da amostra pequeno deve ser calculado o desvio padro corrigido:

57

ARQUIVOS DE MEDICINA

Vol. 20, N 1/2

Anexo 2 - Clculo do erro padro da mdia em amostras aleatrias com diferente tamanho.

Considere que a distribuio da varivel permetro da cintura da seguinte populao segue uma distribuio normal com mdia=88,8 cm e desvio padro (dp)=12,5 cm.

Extramos 30 amostras com tamanho fixo (9, 25 e 100)

58

0.000

0.005

0.010

0.015

0.020

0.025

0.030

Lunet N et al

Desvio Padro ou Erro Padro?

Mdia para cada amostra de tamanho fixo 9, 25 e 100

Amostras

Mdia n=9 87,7 90,4 92,5 91,8 94,1 94,1 91,6 81,5 88,8 91,8 87,9 95,7 89,6 92,0 90,9 87,1 87,2 86,2 90,6 91,0 88,8 84,9 81,0 98,3 85,8 92,9 88,5 86,3 85,8 91,1

Mdia n=25 89,8 89,2 92,8 87,7 91,9 87,7 86,4 91,1 90,7 87,6 86,4 85,2 81,5 86,6 87,8 88,7 87,9 89,1 88,1 91,4 85,3 86,1 92,7 89,4 84,6 90,6 87,9 86,5 88,8 86,0 88,1

Mdia n=100 89,2 88 87,9 88,2 89,7 88,1 86,4 88,6 88,9 87,2 88,6 89,6 90,2 88,7 89,8 90,3 88,7 90,3 90,8 89,3 92,4 88,8 88,4 87,3 89,2 88,5 90,1 87,9 89,1 87,5 88,9

O erro pado igual ao desvio padro a dividir pela raiz quadrada de n. O desvio padro da populao neste caso conhecido, pelo que podemos calcular o erro padro para cada tamanho amostral. O erro padro da mdia para n=9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Pode verificar-se que estes valores so muito semelhantes aos dos desvios padro das mdias, apresentando na tabela, ilustrando que o erro padro da mdia de uma amostra uma estimativa do desvio padro da distribuio das mdias de amostras com o mesmo tamanho obtidas da mesma populao. Tambm se verifica que o erro padro da estimativa diminui com o aumento da amostra 3,9>2,6>1,2 para respectivamente n=9, 25 e 100, reflectindo o aumento de preciso da estimativa com o tamanho da amostra.

Mdia das medias 89,5 das amostras Desvio padro das 3,9 medias das amostras

2,6

1,2

59