Você está na página 1de 5
3 Medidas de dispersdo ou de variabilidade s medidas de tendéncia central sio insuficientes para representar adequada- ente conjuntos de dados, pois nada revelam sobre sua variabilidade. Veja este exemplo: dois alunos realizaram 5 verificagées, obtendo as notas indicadas abaixo. Aluno A: 6; 6; 6;6;6 Total de pontos: 30, média : 6 Aluno B: 7; 5; 6;4;8 Total de pontos: 30, média : 6 Ambos 0s altnos tém média 6, mas o primeiro aluno apresenta um compor- tamento regular, ao passo que o aluno B apresenta um desempenho mais varidvel. Para mostrar a diversidade de desempenho de ambos, necessita-se de um valor que mega a dispersao ou a variabilidade dos valores nos dois casos. AMPLITUDE DE VARIAGAO Amedida mais simples de dispersdo é a amplitude de variagdo (a), que é a diferen- ca entre os valores extremos. Para o aluno A, a amplitude é zero (6 —6 = 0) ¢ para o aluno B, é 4, Quanto maior a amplitude, maior a variacéo. No entanto, a amplitude tem dois defeitos como medida de variacao: (1) sé utiliza os valores extremos, nada informando sobre os intermedidrios e (2) quan- do avaliada em amostras, freqiientemente fornece uma subestimativa da amplitu- de populacional, j4 que dificilmente a amostra vai apresentar tanto o valor mais baixo como o mais alto (geralmente os mais raros) da populagao. VARIANCIA Para levar em conta todos os valores observados na série, foi sugerido o uso dos desvios de cada valor em relacdo & média, reunindo-se tais informacdes em uma quantidade denominada varidncia. Usa-se 0 simbolo ? (sigma mintisculo ~ “s” no alfabeto grego — ao quadrado) para representar a variancia calculada com os da- dos de uma populacdo e s?, para a varidncia calculada em uma amostra. Em uma populaciio de dados, a formula da varidncia é Ye-m* n onde y= média da populacao. 34° Sidia M. Callegari-Jacques Na pratica, onde 0 uso de amostras é comum, costuma-se utilizar uma fér- mula ligeiramente modificada. Calcula-se a variancia, em amostras, do seguinte modo!: Pet outed nol Se os dados estiverem grupados, a formula da variancia amostral é Dfe-x ayo O numerador da variancia é, muitas vezes, chamado de soma dos quadrados (SQ), e o denominador, o ntimero de graus de liberdade (gl). Entao, gs Ha uma férmula alternativa para a varincia que é titil quando a média no é um valor exato. Na verdade, essa formula altemativa produz um valor mais correto, pois ndo envolve a média, que pode ter sido arredondada. A formula alternativa, Para dados nao-grupados é: Para dados grupados é: 2 on pe Dae = yr n-1 DF-i As Tabelas 3.1 a 3.3 apresentam exemplos de como calcular a variancia para dados nao-grupados e grupados, respectivamente. Note que a formula alternativa fornece para a varidncia o mesmo valor que a formula tradicional. TABELA 3.1 Espessura do endosperma (mm) em sementes da espécie E (dados ficticios): calcula da variancia para quatro observagées nao-grupadas x (x=) (x= 5 x 2 ~15 2,25 4 4 05 0,25 16 5 15 2,25 25 3 0,5 0,25 9 z 14 5,00 54 14/4 = 3,5 mm ey 1A subtracdo de uma unidade no denominador tem o objetivo de tornar s? um estimador nao ten- dencioso de a?. Com essa correcdo, a média de todas as variancias de amostras de tamanho n, de uma populagdo, é igual a o2 Bioestatistica 36 TABELA 3.2 Numero de visitas anuais ao dentista em uma amostra de 95 criangas de 7 anos de idade: calculo da variancia para dados em grupamento simples x f fe WR) =P fee fe 0 43 0 0,83 069 2967 0 0 1 34 34 0.17 0,03 1,02 1 34 2 10 20 1,17 137 13,70 4 40 3 a 21 217 471 32,97 9 63 4 1 4 317 10,05 10,05 16 16 zi 95 79 5 = e744 = 153 3-242 osssisias df 95 YSe-7" _ 37,41 OS Fa 94 7088 _ Yt 8 TABELA 3.3 Idade, em anos, em uma amostra de criangas da primeira série de uma escola rural: calculo da variancia para dados grupados em intervalos de classe (™) Idade t x fe ete 55}-65 1 6 6 36 36 85-75 20 7 140 49° 980 75-85 7 8 56 64 ae 85-95 2 9 18 81162 z 30 = 220 1626 = -7.3anos 1626—(220)*/30 _ 4, eae 0 Quanto maior a variancia de uma série, maior a disperstio dos valores que a compéem. Assim, se uma amostra tem varidncia igual a 0,34 e outra, da mesma varidvel, igual a 0,93, nesta tiltima os dados variam mais do que na primeira. Quando nao houver variabilidade, a variancia é zero. DESVIO PADRAO Uma dificuldade com a varidncia, como medida descritiva da dispersio, é 0 fato de nao poder ser apresentada com a mesma unidade com que a varidvel foi medi- da (se observamos como 0 céilculo da varidncia foi feito, veremos que a unidade que acompanha o valor da varidncia ¢ 0 quadrado da unidade de mensuracao de x). 36 Sidia M. Callegari-Jacques Asolugao é extrair a raiz quadrada positiva da varidncia, j4 que, com isso, se volta a unidade original da varidvel. Essa nova medida de variabilidade é denominada desvio padrao, usando-se 0 simbolo ¢, se for calculado na populacao, ou s, se os dados pertencem a uma amostra (em artigos cientificos publicados em portugués, € comum encontrar-se também a abreviatura DP). Os desvios padrao correspondentes aos dados das Tabelas 3.1 a 3.3 sio: s= 1,67 = 1,29 mm, para a espessura das sementes; s= 0,93 = s=,0.4 = 0,63 anos de idade. ),96 visitas ao dentista; E interessante observar que 0 desvio padrao de uma série de dados pode ter um valor numérico maior que o da média. Isso geralmente é uma indicacio de que a distribuigao ¢ assimétrica, como ocorre com o mimero de visitas ao dentista (Tabela 3.2). Neste exemplo, hd uma clara assimetria na distribuicao dos valores, e a média (0,83) é menor do que o desvio padrao (0,96). COEFICIENTE DE VARIAGAO. Quando se analisa a mesma varidvel em duas amostras, pode-se comparar os des- vios padrao observados e verificar onde a variacéo é maior. Por exemplo, se em uma delas a espessura da semente tem desvio padrao igual a 1,29 mm e na outra, 8 = 0,51 mm, conclui-se que a variacao é maior na primeira amostra. No entanto, o mesmo nao pode ser feito em se tratando de varidveis diferen- tes. Se as sementes da amostra 1 foram também pesadas, e o desvio padrao foi 0,009 g, nao se pode afirmar que o peso das sementes é uma caracteristica menos varidvel do que a sua espessura. Trata-se de caracteristicas diferentes, medidas em unidades diferentes. Para comparar variabilidades, neste caso, deve-se usar 0 coeficiente de variagao (CV), que é uma medida de disperséo independente da unidade de mensuracio da varidvel. O coeficiente de variacao representa a variabilidade como uma fracio em relacio a média e ¢ calculado do seguinte modo: cv =5 ou Cv% =1004. ¥ ¥ A média e o desvio padrao para a espessura do endosperma das sementes mencionadas na Tabela 3.1 € para o seu peso (dados nao-apresentados) sao: Espessura: ¥= 3,5 mmes = 1,29 mm; Peso: ¥ = 0,020 ges = 0,009 g. Ent&o, © coeficiente de variacao para cada varidvel é: 29mm CV (espessura) =! 0,37 (ou 37%); 1,45 (ou 45%). Pode-se, agora, verificar que o peso das sementes é, na verdade, uma carac- terfstica mais varidvel do que a espessura. Bioestatistica 3] Note que, se 0 peso for expresso em outra unidade, por exemplo, em mg, 0 Coeficiente de variacio nao se altera (CV= 9 mg/20 mg = 0,45). AMPLITUDE ENTRE QUARTIS, DESVIO ENTRE QUARTIS ou DISTANCIA INTERQUARTILICA Quartis sao valores de x que dividem uma série ordenada de dados em quatro srupos, cada um reunindo 25% das observacées. O primeiro quartil (Q,) é 0 valor abaixo do qual estdo os 25% valores menores. O segundo quartil (Q,) é'4 mediana € Qs € 0 valor de x abaixo do qual esto 75% dos valores da série. A amplitude ou 0 desvio entre quartis é a diferenca Q, ~ Q,. Note que entre Q, ¢ Q, estio os 50% valores mais centrais da distribuicao. Quando se descreve um conjunto de dados de distribuicéo assimétrica, a disténcia entre quartis representa melhor a variagéo do que a amplitude ou o desvio padrao, porque nao € afetada pelos valores extremos, Em uma amostra de 95 recém-nascidos prematuros de Porto Alegre, a Dra. Rosimeri da Silva Alves (comunicacao pessoal) obteve os valores de TGP apresen. tados na Tabela 3.4. A grande diferenca encontrada entre a média (20) e a medi. ana (10) € indicadora de que a distribuicao é assimétrica (se fosse simétrica, tais valores seriam iguais ou muito semelhantes). O valor do desvio padrao também é indicador de assimetria, pois seu valor ¢ proporcionalmente muito alto, se compa- rado com a média, Para esse tipo de dados, o desvio interquartilico (11) é a me- Ihor representagao da variabilidade, enquanto a mediana é a melhor medida de tendéncia central. TABELA 3.4 Valores de TGP” (U/mL) observados em 95 recém-nascidos prematuros TGP, t Of 10 42. n=05 10} 20 31 média=20 20}-30 10 median = 10 30}-40 4 desvio padrao = 30,6 40 50 1 intervalo de variagao (obtido dos valores ndo-grupados): 3-211 50 | 60 A quattis: Q, = 7; Q: Q,= 18 60 | 70 1 desvio interquartilico = 11 100 oumais 5 95 eeansaminase-glutamico-prdvica sérica, E um indicador da fungao hepatica; quanto maior o valor de TGP, plot esta a funcao hepatica

Você também pode gostar