Você está na página 1de 27

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

MEDIDAS DE TENDENCIA CENTRAL, e DISPERSAO, POSIC AO, ASSOCIAC AO BOX-PLOT


Prof. Dr. Ivan Bezerra Allaman
Universidade Estadual de Santa Cruz - UESC

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Cronograma

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot
uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Mediana Moda M edia

o valor que divide os dados ao meio, ou seja, 50% dos E valores estar ao a esquerda e 50% dos valores estar ao a direita da mediana. Para n par, a mediana e calculada como a m edia dos dois valores centrais,

Para n mpar, a media e o valor central.

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Mediana Moda M edia

o valor que ocorre com maior frequ E encia. poss E vel que os dados n ao apresentem moda (denominando amodal), apresentem uma moda (modal), duas modas (bimodal) e assim por diante.

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Mediana Moda M edia

a medida de posi E c ao mais importante. Deni c ao: Se n observa c oes em uma amostra s ao denotadas por x1 , x2 , , xn a m edia amostral e x =
x1 +x2 ++xn n

n i=1

xi

Deni c ao: Se N observa c oes em uma popula c ao nita s ao denotadas por x1 , x2 , , xn a m edia populacional e =
x1 +x2 ++xn N

n i=1

xi

N
uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Mediana Moda M edia

Exemplo 1: Considerem o pH de uma solu c ao mensurada 8 vezes por um operador utilizando o mesmo instrumento. Os dados mensurados foram: x1 = 7,15; x2 = 7,20; x3 = 7,18; x4 = 7,19; x5 = 7,21; x6 = 7,20; x7 = 7,16 e x8 = 7,18. A m edia amostral e: x =
x1 +x2 ++xn n

8 i=1

7,15+7,20++7,18 8

= 7,18

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Mediana Moda M edia

Importante: A m edia e inuenciada por valores extremos, sejam eles muito baixos ou muito altos

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Amplitude Vari ancia Desvio Padr ao Coeciente de Varia c ao

S ao medidas estat sticas usadas para avaliar o grau de

variabilidade ou dispers ao dos valores em torno da m edia.

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Amplitude Vari ancia Desvio Padr ao Coeciente de Varia c ao

a medida mais simples de dispers E ao


O c alculo e efetuado quando os dados est ao ordenados em

ordem crescente.

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Amplitude Vari ancia Desvio Padr ao Coeciente de Varia c ao

Deni c ao: Se n observa c oes em uma amostra est ao em ordem crescente, a amplitude e dada por: A = xn x1 Exemplo 2: Considerando os dados do exemplo 1, tem-se os seguintes valores ordenados: 7,15; 7,16; 7,18; 7,18; 7,19; 7,20; 7,20; 7,21. Logo a amplitude dos valores ser a: A = x8 x1 = 7,21 7,15 = 0,06
uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Amplitude Vari ancia Desvio Padr ao Coeciente de Varia c ao

a medida mais utilizada dentre as medidas de dispers E ao, pois dentre v arios aspectos positivos, est a o fato de contemplar todos os valores da amostra.
A vari ancia e uma dist ancia m edia de cada observa c ao em

rela c ao a m edia. No entanto, por motivos que fogem ao escopo desta disciplina, esta dist ancia precisa ser elevada ao quadrado e dividida pelo o que n os chamamos de graus de liberdade da amostra, de acordo com a seguinte deni c ao: Deni c ao: Sejam x1 , x2 , , xn observa c oes provenientes de uma amostra, a vari ancia e dada por:
i S 2 = i=1 n1 no caso de uma popula c ao n 2 2 i=1 (xi ) = N Allaman, I.B. Medidas estat sticas n

(x x )2

uesclogo

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Amplitude Vari ancia Desvio Padr ao Coeciente de Varia c ao

Exemplo 3: Considerando ainda os dados do exemplo 1, tem-se o seguinte c alculo da vari ancia. S2 =
(7,157,18)2 +(7,207,18)2 ++(7,187,18)2 81

0,0004 unidades2

Observa c ao!!! Percebam que a unidade de medida est a elevada ao quadrado, o que diculta a interpreta c ao. Conseguem imaginar uma popula c ao cuja a variabilidade da altura e de 1,3m2 ? Ou de 22kg 2 ?

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Amplitude Vari ancia Desvio Padr ao Coeciente de Varia c ao

O desvio padr ao e uma medida utilizada para contornar o

inconveniente de unidade de medida apresentada pela vari ancia.


A unidade de medida do desvio padr ao e igual a unidade de

medida mensurada na vari avel. Deni c ao: Sejam x1 , x2 , , xn observa c oes provenientes de uma amostra, o desvio padr ao e dada por: n )2 i=1 (xi x S= = S2 n1 no caso de uma popula c ao n 2 i=1 (xi ) = = 2 N
uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Amplitude Vari ancia Desvio Padr ao Coeciente de Varia c ao

Tanto a vari ancia como o desvio padr ao s ao medidas

dependentes da grandeza, escala ou unidade de medida da vari avel. Conjunto de dados com diferentes unidades de medida n ao podem ter suas dispers oes comparadas pela vari ancia ou pelo desvio padr ao, e at e mesmo dados com uma mesma unidade n ao podem ser comparados se possuem m edias de diferentes magnitudes. Logo, um estimador que n ao seja dependente desses fatores se faz necess ario. Deni c ao: Sejam x1 , x2 , , xn observa c oes provenientes de uma amostra, o coeciente de varia c ao e dado por: CV = S x 100 no caso de uma popula c ao CV = 100
Allaman, I.B. Medidas estat sticas uesclogo

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Amplitude Vari ancia Desvio Padr ao Coeciente de Varia c ao

Exemplo 4: Considere os seguintes dados sobre emiss oes de HC e CO para um determinado ve culo: HC (gm/mi)13,8 18,3 32,2 32,5 CO(gm/mi)118 149 232 236 Em m edia, o ve culo emite com maior homogeneidade qual g as?

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Percentil Quartil

S ao medidas utilizadas para dividir os dados em partes iguais

e orientar quanto a posi c ao da observa c ao nos dados.

Dentre as medidas utilizadas ser a abordado os percentis e os

quartis.

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Percentil Quartil

O p - esimo percentil e um valor tal que pelo menos p por

cento das observa c oes s ao menores ou iguais a esse valor e pelo menos (100-p ) por cento das observa c oes s ao maiores ou iguais a esse valor. Para calcular o p - esimo percentil tem-se os seguintes passos:
Organize os dados em ordem crescente, Calcule um ndice i,

i=

p 100

em que p e o percentil procurado e n, o n umero de observa c oes. a)Se i n ao for um n umero inteiro, arredonde-o para cima. O n umero inteiro seguinte maior que i denota a posi c ao do p - esimo percentil. b)Se i for um n umero inteiro, o p - esimo percentil ser a a m ediauesclogo dos valores nas posi c oes i e i+1.
Allaman, I.B. Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Percentil Quartil

Exemplo 5: Considere os dados do exemplo 4: HC (gm/mi)13,8 18,3 32,2 32,5 CO(gm/mi)118 149 232 236 Qual o 65 percentil dos dados acima?

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Percentil Quartil

Muitas vezes e desej avel dividir os dados em quatro partes,

tendo cada parte aproximadamente um quarto, ou 25% das observa c oes.


Os quartis s ao muito utilizados para elabora c ao do box-plot. Tem-se os seguintes quartis: 1 Quartil - corresponde ao 25 percentil. 2 Quartil - corresponde ao 50 percentil. Coincide com a mediana. 3 Quartil - corresponde ao 75 percentil.

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Covari ancia Coeciente de Correla c ao de Pearson

S ao medidas utilizadas para avaliar a rela c ao entre duas

vari aveis.
Ser ao abordados duas medidas: a covari ancia e a correla c ao.

importante ter em mente que as medidas que ser E ao abordadas empressam a rela c ao linear entre duas vari aveis.

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Covari ancia Coeciente de Correla c ao de Pearson

Mede a associa c ao linear entre duas vari aveis.

No entanto, e imposs vel saber qual o grau de associa c ao

entre as vari aveis pois os valores podem variar de menos innito a mais innito. Sua f ormula e dada por:

cov =

n )(yi y ) i=1 (xi x

n 1
uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Covari ancia Coeciente de Correla c ao de Pearson

Exemplo 6: O elevado consumo de energia durante o exerc cio continua ap os o m do treino. Como as calorias queimadas ap os o exerc cio contribuem para a perda de peso e t em outras consequ encias, e importante entender esse processo. O estudo Eect of Weight Training Exercise and Treadmill Exercise on Post-Exercise Oxygen Consumption (Medicine and Science in Sports and Exercise, 1998, p. 518-522) relatou os dados a seguir de um estudo em que o consumo de oxig enio (litros) foi medido continuamente por 30 minutos para cada um dos 15 indiv duos ap os um exerc cio de levantamento de peso e ap os um exerc cio em esteira rolante.
uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Covari ancia Coeciente de Correla c ao de Pearson

Indiv duo Levantamento de peso Esteira rolante 1 14,6 11,3 2 14,4 5,3 3 19,5 9,1 4 24,3 15,2 5 16,3 10,1 6 22,1 19,6 7 23,0 20,8 8 18,7 10,3 9 19,0 10,3 10 17,0 2,6 11 19,1 16,6 12 19,6 22,4 13 23,2 23,6 14 18,5 12,6 15 15,9 4,4 Qual a rela c ao entre a vari avel levantamento de peso e esteira rolante ?

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Covari ancia Coeciente de Correla c ao de Pearson

Tamb em mede a associa c ao linear entre duas vari aveis, mais e

preferida por que os resultados cam entre -1 e 1, valores estes que nos permite avaliar qual o grau de associa c ao entre as vari aveis estudadas.

rxy =

covxy sx sy

uesclogo

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Covari ancia Coeciente de Correla c ao de Pearson

Existem as seguintes possibilidades de rela c ao entre duas

vari aveis:
Relao positiva
q q q q q q q q q q q q q q qq q q q q q q q q q q q q q q q q qq q q qq q qq q q q q q q q q q q q q qq q q qq q q q q q q qq q q q qq q q q q qq q q q q q q q q q q q q q q q q q q q q q q

Relao negativa
q q q q q q q q q qq q qq qq q q q q qq q q q q qq q qq q qq qq q q qq q q qq q q q q q q q q q qq q q q qq qq qq qq q q q q q q q qq q qq q q q q q q q q q q q q q q q q q q q q q q

200

150

20

40 x

60

80

100

200 150 100

50

100

50

20

40 x

60

80

100

Relao nula
q

q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q q qq q q qq q q qq q q q qq q q q q q q q q q q q qq q q q q q q

q q q q q

q q q qq q q q q q q

q q

qq q q

uesclogo

0 x

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

O box-plot ou gr aco de caixa e um desenho esquem atico

utilizado para descrever as caracter sticas mais proeminentes de conjuntos de dados. Essas caracter sticas incluem:

1 2 3 4

centro dispers ao extens ao e a natureza de qualquer desvio em rela c ao ` a simetria identica c ao de outliers.
uesclogo

Logo, tem-se o seguinte box-plot:

Allaman, I.B.

Medidas estat sticas

Medidas de Tend encia Central Medidas de Dispers ao Medidas de Posi c ao Medidas de Associa c ao Box-plot

Outliers

Q11.5*(Q3Q1)

Q1

Q2

Q3

Q3+1.5*(Q3Q1)

uesclogo
3 2 1 0 1 2 3

Allaman, I.B.

Medidas estat sticas

Você também pode gostar