Você está na página 1de 37

Descrio de Dados: Medidas de Posio 3.

1MEDIDAS DE POSIO EM CONJUNTOS DE DADOS Uma medida de posio um valor calculado a partir de um grupo

de dados e utilizado para descrever estes dados de alguma forma. Normalmente, desejamos que o valor seja representativo do grupo de valores, e dessa forma

algum tipo de mdia desejado. No sentido estatstico uma mdia uma medida de tendncia central para uma coleo de valores. Este captulo aborda os vrios

procedimentos estatsticos interessados nas medidas de posio. 3.2A MDIA ARITMTICA A mdia aritmtica definida como a soma dos valores no grupo de dados

dividida pelo nmero de valores. Em estatstica, uma medida descritiva de uma populao, ou parmetro da populao, freqentemente representada por

uma letra grega, enquanto uma medida descritiva de uma amostra, ou uma estatstica da amostra, representada por uma letra romana. Dessa forma, a media aritmtica de uma populao

de valores e representada pelo smbolo , enquanto a mdia aritmtica de uma amostra de valores representada pelo smbolo (lse X barra). As frmulas para a mdia da amostra

e mdia da populao so: = = (3.1) (3.2)

Operacionalmente, as duas frmulas so idnticas. Em ambos os casos elas realizam uma

soma de todos os valores ) e em seguida a dividem pelo nmero de valores. Entretanto, a distino de denominadores ocorre porque na anlise estatstica a letra maiscula

N indica o nmero de itens da populao, enquanto a letra minscula n indica o nmero de itens na amostra. Exemplo 1 Durante um determinado ms de vero, os oito

representantes de venda de uma empresa de aquecedores e arcondicionado venderam o seguinte nmero de unidades de arcondicionado central: 8, 11, 5, 14, 8, 11, 16, 11.

Considerando este ms como uma populao estatstica de interesse, o nmero mdio de unidades vendidas = = = 10,5 unidades

Nota: Para fins de apresentao de resultados, geralmente divulga-se as medidas de localizao com um dgito alm dos dgitos da medida original.

Exemplo 4 Os oito representantes de vendas descritos no Exemplo 1 venderam os seguintes nmeros de unidades de arcondicionado central: 8, 11, 5, 14, 8, 11, 16 e 11.

A moda para este grupo de valores o valor com a maior freqncia, ou moda = 11,0. 3.6 RELAO ENTRE A MDIA E A MEDIANA Para qualquer distribuio simtrica, a mdia,

a mediana e a moda coincidem em seus valores [ver Fig. 3-1 (a)]. Para uma distribuio positivamente assimtrica a mdia, sempre maior que a mediana [ver Fig.

3-1(b)]. Para uma distribuio negativamente assimtrica, a mdia sempre menor que a mediana [ver Fig. 3-1(c)]. Estas duas ltimas relaes so sempre verdadeiras,

independente da distribuio ser ou no unimodal. Uma medida de simetria em estatstica, que se concentra na diferena entre os valores da mdia e da mediana para um grupo de

valores, o coeficiente de assimetria de Pearson, descrito na Seo 4.12. Os conceitos de simetria e assimetria so explorados na Seo 2.4.

(a) Simtrica

(b) Positivamente assimtrica

(c) Negativamente assimtrica

Figura 3-1 Exemplo 5 - Para os dados de vendas

considerados nos exemplos 1, 3 e 4, a mdia 10,5, enquanto a mediana 11,0. Devido mdia ser menor que a mediana, a distribuio dos valores observados

negativamente assimtrica, ou seja, inclinada para a esquerda. 7 CRITRIO MATEMTICO SATISFEITO PELA MDIA E MEDIANA Um propsito para a

determinao de qualquer medida de tendncia central, assim como a mediana ou mdia, o de utiliz-la para representar o nvel geral dos valores includos no grupo. Tanto a mdia

como a mediana so boas medidas representativas, mas do ponto de vista de diferentes critrios matemticos ou objetivos. A mediana o valor representativo que

minimiza a soma dos valores absolutos das diferenas entre cada valor no grupo e a mediana. Ou seja, a mediana minimiza a soma dos desvios absolutos

em relao ao valor individual sendo representado. Em comparao, a mdia aritmtica se concentra na minimizao da soma dos desvios quadrticos em relao aos

valores individuais no grupo. O critrio pelo qual o objetivo de minimizar a soma dos desvios quadrticos associado com o valor representativo chamado critrio

dos mnimos quadrados. Este critrio o de maior importncia na inferncia estatstica baseada em dados amostrados, como discutido na prxima seo.

Exemplo 6 - Para os dados das vendas que foram considerados nos exemplos anteriores, a mediana 11,0 e a mdia 10,5. Os valores ordenados das vendas so apresentados na

primeira coluna da Tabela 3.2. As outras colunas desta tabela esto interessadas na determinao da soma dos desvios absolutos e dos desvios quadrticos dos valores individuais

em relao mediana e mdia. Note que a soma dos desvios absolutos para a mediana, 20, menor que a soma correspondente para a mdia. Por outro lado, para o critrio dos

mnimos quadrados, a soma dos desvios quadrticos para mdia, 86,00, menor que a soma correspondente para a mediana. Nenhum valor diferente da mdia pode ter uma

menor soma dos desvios quadrticos que a mdia. Tabela 3.2 Critrio matemtico satisfeito pela mediana e mdia (Mediana =11,0; Mdia = 10,5)

X |X - Mediana | |X- Mdia| (X-Mediana)2 (X --- Mdia) 5 8 8 11 11 11 14 16 Soma 3.8 6 3 3 0 0 0 3 5 20 5,5 2,5 2,5 0,5 0,5 0,5 3,5 5,5 21,0 36 9 9 0 0 0 9 25 88 30,25 6,25 6,25 0,25 0,25 0,25 12,25 30,25 86,00

USO DA MDIA, MEDIANA E MODA

Primeiramente consideramos o uso destas medidas de representao de dados populacionais. O valor da moda indica onde esto localizados a maioria dos valores observados, como o salrio por hora em uma companhia. Ela pode ser til como medida descritiva para um grupo da populao, mas somente se existir uma moda bem definida. Por outro lado, a mediana sempre uma excelente medida que representa o nvel tpico dos valores observados, assim como os salrios em uma populao. Isso verdadeiro independente da existncia de mais de uma moda ou se a distribuio da populao simtrica ou assimtrica. A falta de simetria no um problema especial porque a mediana dos salrios, por exemplo, sempre o salrio da pessoa central quando os salrios esto listados em ordem de magnitude. A mdia aritmtica tambm um excelente valor representativo para uma populao, mas somente se a populao simtrica. Para dados no-simtricos, os valores extremos (por exemplo, alguns salrios muito elevados de tcnicos especialistas) serviro para distorcer o valor da mdia como um valor representativo. Dessa forma, a mediana geralmente a melhor medida de posio dos dados para descrever os dados de uma populao. Consideramos agora o uso de trs medidas de posio em relao a dados amostrados. Recorde do Captulo 1 que o propsito da inferncia estatstica com a posio dos dados da amostra

fazer possveis afirmaes sobre a populao da qual os dados foram retirados. A moda no uma boa medida de localizao em relao a dados da amostra porque seu valor pode variar muito de uma amostra para outra. A mediana melhor que a moda porque seu valor mais estvel de uma amostra para outra. Entretanto, o valor da mdia o mais estvel das trs medidas. Como ser introduzido posteriormente na Seo 4.9 e explorado totalmente no Captulo 8, a razo para a relativa estabilidade da mdia de uma amostra para outra porque ela a medida de posio que satisfaz o critrio dos mnimos quadrados. Dessa forma, para dados amostrados, a melhor medida de posio geralmente a mdia aritmtica. Exemplo 7 Os salrios por hora de 650 empregados em uma fbrica foram reunidos. A melhor medida representativa dos salrios tpicos a mediana, porque uma populao est envolvida e a mediana relativamente no afetada pela falta de simetria dos salrios. De fato, dados como salrios so provavelmente positivamente assimtricos, com relativamente poucos valores de salrios sendo excepcionalmente altos na cauda direita da distribuio. Exemplo 8 Uma amostra aleatria de n = 100 salrios foi obtida de uma companhia que tem milhares de empregados. O melhor salrio representativo para milhares de empregados a mdia da amostra. Apresar de ser pouco provvel que a mdia da amostra seja igual mdia dos salrios de toda a populao, ela geralmente mais prxima da mdia populacional que seria a mediana populacional, usada como um estimador para o salrio mdio da populao. 3.9 USO DA MDIA EM CONTROLE ESTATSTICO DE PROCESSOS Na Seo 2.12 observamos que um grfico corrido (run chart) um grfico dos valores dos dados na seqncia temporal em que eles foram observados, e que os valores plotados podem ser valores individuais ou mdias de amostras seqencial. Preferimos plotar mdias que valores individuais porque qualquer medida de posio ser geralmente mais estvel (ou menos varivel) de uma amostra para outra que as observaes individuais. Como observamos na seo anterior, a mdia da amostra mais estvel

que a mediana ou a moda. Por esta razo, o foco dos grficos corridos interessados em dados representativos plotar as mdias das amostras. Dessa forma um grfico chamado de grfico, e serve como base na determinao da estabilidade do processo ou se existe variao neste que tenha uma causa atribuvel que deva ser corrigida.