Medidas de Localiza¸c˜ao Uma outra maneira de resumir as observac¸˜oes ´e atrav´es de
medidas num´ericas que resumem a s´erie de observac¸˜oes em um unico n ´ umero. ´
Destacaremos algumas medidas de localizac¸˜ao e de dispers˜ao. Exemplos de medidas de localizac¸˜oes s˜ao o m´ınimo, o m´aximo, os quartis, a moda, a mediana e a m´edia, dentre outras. De medidas de dispers˜oes s˜ao a amplitude, o intervalo interquartil, a variˆancia, o desvio m´edio absoluto, etc.. A Moda (mo) ´e o valor mais frequente das observac¸˜oes e pode ser calculada para qualquer conjunto de dados. Em nosso exemplo a moda da vari ´avel Sexo ´e a observac¸˜ao mo = masculino. A vari´avel Perfil do Investidor tem por moda o valor mo = perfil conservador. 2 / 13 Medidas Resumos Para simplificar nossas anotac¸˜oes denotaremos as vari´aveis quantitativas por letras latinas maiusculas e os seus valores por letras latinas min ´ usculas. ´ Assim poderemos denotar a vari´avel Idade por X e seus valores por x. Valores distintos da vari´avel podem ser anotados por xi . A vari´avel X = Idade tem moda igual a mo = 31. A vari´avel Y = Investimento n˜ao apresenta uma moda pois seus valores s˜ao distintos. Se adotamos sua forma resumida, como na tabela de frequˆencia, podemos dizer que a moda ´e, aproximadamente, mo = 115, o ponto m´edio da classe [110, 120). na tabela 1.1. Para a vari´avel qualitativa nominal sexo um resumo das observac¸˜oes ´e Uma outra medida de localizac¸˜ao ´e a Mediana (MDd). Esta medida de tendˆencia central ´e o valor que ocupa a posic¸˜ao central da s´erie de observac¸˜oes quando est˜ao ordenadas segundo sua ordem de grandeza. Como nao podemos ordenar as observac¸˜oes de uma vari´avel qualitativa nominal n˜ao podemos calcular a mediana da vari´avel Sexo. A mediana da vari´avel Perfil do Investidor ´e a observac¸˜ao moderado por aceitarmos, em sequˆencia, a ordem natural dos perfis como conservador, moderado e arrojado. Nesta ordenac¸˜ao temos os primeiros 40% das observac¸˜oes como conservadoac¸ ´ ˜oes ´e ´ımpar, a mediana ´e o valor que ocupa a posic¸˜ao central da s´erie ordenadSe os dados encontram-se resumidos, como na Figura ??, podemos utilizar o histograma e uma relac¸˜ao entre ´areas de retˆangulos de mesma altura para encontrar a mediana aproximada. No exemplo notamos que a frequˆencia acumulada at´e 110 ´e 50% e conclu´ımos que o valor aproximado para a mediana MDd = 110, ´e quase igual ao verdadeiro valor, MDd = 110, 07. De maneira semelhante ao c´alculo da mediana podemos considerar os c´alculos do p-´esimo percentil, 0 < p < 1, valor que deixa `a sua esquerda 100 · p% das observac¸˜oes quando est˜ao ordenadas segundo a ordem de suas grandezas. Exemplos de percentis s˜ao: O decil, que deixa `a sua esquerda 10% das observac¸˜oes; O primeiro quartil (Q1), que deixa `a sua esquerda 25% das observac¸˜oes; O segundo quartil (Q2 = MDd), que deixa `a sua esquerda 50% das observac¸˜oes; O terceiro quartil (Q3), que deixa `a sua esquerda 75% das observac¸˜oesMedidas de Localizac¸˜ao Como para o c´alculo da mediana, no c´alculo dos percentis considera-se os dados ordenados segundo suas grandezas. Se n ´e o numero de ´ observac¸˜oes, o p- ´esimo percentil ´e o valor de ordem p · (n + 1), se este for um numero inteiro. Caso contr ´ ´ario ser´a a m´edia entre os valores antecessor e o sucessor deste valor, p · (n + 1). Assim, para calcular o primeiro quartil da vari´avel Perfil do Investidor consideramos o valor de ordem 0.25.41 = 10, 25. Como tal valor n˜ao ´e inteiro consideramos a d´ecima e d´ecima primeira posic¸˜oes e Q1 ´e o valor conservador. Os valores de ordens antecessor e sucessor de 0, 5.41 = 20, 5 mostra que Q2 ´e o valor moderado, assim como Q3. Os quantis da vari´avel Idade, Q1, Q2 e Q3, s˜ao, respectivamente, as m´edias dos valores das posic¸˜oes dos inteiros, antecessores e sucessores dos numeros 10 ´ , 25, 20, 5 e 30, 75 os quais s˜ao 28, 31 e 38. Com o mesmo procedimento, ordenamos os valores da vari´avel Y = Investimento e obtemos Q1 = 88,11+93,08 2 = 90, 6, Q2 = 109,74+110,4 2 = 110, 07 e Q3 = 119,89+120,58 2 = 120, 2. 7 / 13 Medidas de Localizac¸˜ao observa¸c˜ao Quando a vari ´avel cont´ınua apresenta-se resumida, como na figura da vari´avel investimento, podemos utilizar o histograma e uma relac¸˜ao entre retˆangulos para o c´alculo aproximado dos percentis. Consideremos o histograma da vari´avel Y = investimento e calculemos, para exemplificar, o primeiro quartil aproximado. Comec¸amos por contar a frequˆencia acumulada da esquerda para a direita at´e perfazer 25% das observac¸˜oes. Temos 8% das observac¸˜oes `a esquerda do valor 80. Quando do valor 90 acumulamos 24% das observac¸˜oes `a sua esquerda que n˜ao perfazem os 25% necess´arios para definir Q1. 8 / 13 Medidas de Localizac¸˜ao Observamos que a frequˆencia acumulada at´e o valor 100 ´e 37% e conclu´ımos que o valor Q1 est´a na classe de investimentos [90, 100). Nessa classe, que define um retˆangulo de ´area 0, 13 e base igual a 10, constru´ımos, do lado esquerdo, um retˆangulo de mesma altura e ´area igual a 0, 01, que somada com as ´areas dos retˆangulos anteriores completam os 25% necess´arios para definir Q1. A base desse retˆangulo, [90, Q1), tem comprimento Q1 − 90. A esses dois retˆangulos chamaremos retˆangulo maior, com ´area A, base B e altura H e retˆangulo menor com ´area a, base b e altura h. Os retˆangulos tem mesma altura e conclu´ımos que: A B = a b 9 / 13 Medidas de Localizac¸˜ao Para calcular, aproximadamente, Q1 procedemos 0, 13 10 = 0, 01 Q1 − 90 ⇔ Q1 − 90 = 0, 77 ⇔ Q1 = 90, 77. Observe que este ´e um valor aproximado e que o verdadeiro valor de Q1 ´e 90, 6. Tal procedimento pode ser realizado para o c´alculo aproximado de qualquer percentil. Figura: Histograma da vari´avel Investimento. 10 / 13 Medidas de Localizac¸˜ao A medida de localizac¸˜ao mais utilizada ´e a “m´edia amostral”, definida pela m´edia aritm´etica das observac¸˜oes (amostra). Sua interpretac¸˜ao ´e o da m ´edia aritm´etica: da frase “a m´edia da classe na prova de Estat´ıstica foi 7”, entendemos que as notas dos alunos est˜ao em torno de sete, `as vezes maior do que 7, `as vezes menor. Apesar de muito utilizada a m´edia amostral n˜ao pode ser empregada quando trabalhamos com vari´aveis qualitativas. Se observamos os valores xi , 1 ≤ i ≤ n de uma vari ´avel quantitativa X, a m´edia amostral destes valores, denotada por x ´e definida por x = x1 + . . . + xn n = Pn i=1 xi n = 1 n X k j=1 nj · xj = n1 · x1 + n2 · x2 + . . . + nk · xk n = X k j=1 fj · xj , onde k ´e o numero de classes, os ´ nj s˜ao as frequˆencias absolutas das observac¸˜oes e os fj as frequˆencias relativas.