Você está na página 1de 7

Nota de aula 7 Estatstica descritiva para dados no agrupados Professor: Kleison Freitas

Nota de Aula 7 Estatstica descritiva para dados no


agrupados
1. Medidas de tendncia central As medidas de tendncia central so usadas para indicar um valor que tende a representar melhor o centro de um conjunto de nmeros. As medidas de tendncia central mais usadas so: Mdia, Moda e Mediana. 1.1. Mdia Aritmtica Simples ( x ) : x= Xi = Valores da varivel n = Nmero de valores OBS: A mdia uma medida influenciada por valores extremos, ento, para isso, necessrio conhecer todos os valores. Propriedades: a) A mdia de um grupo de dados sempre ser nica e independente da sua localizao; b) O resultado de multiplicar a mdia pela quantidade n de valores da varivel X igual a soma dos n valores da varivel; c) Somando-se ou subtraindo-se uma constante c (valor invarivel) a todos os valores de uma varivel, a mdia do conjunto ficar aumentada ou diminuda dessa constante, respectivamente, de forma anloga, se multiplicar ou dividir, a mdia ficar multiplicada ou dividida, respectivamente. n n n X Ci (X i C ) ( X i .C ) x = i =1 e x = i =1 e x = i =1 n n n 1.2. Moda (Mo): o valor que ocorre com maior frequncia, podendo ser nico, se existir, como pode tambm no existir. Quando dois valores ocorrem com a mesma frequncia mxima, cada um deles uma moda. Das diferentes medidas de tendncia central que estamos considerando, a moda a nica medida que pode ser usada com dados em nvel nominal de mensurao, conforme o exemplo 1: Exemplo 1: Um estudo sobre tempos de reao de pessoas em um teste foi composto por 30 canhotos, 50 destros e 20 ambidestros. Embora no possamos tomar a mdia numrica dessas caractersticas, podemos afirmar que a moda destro, que a caracterstica com maior frequncia. Exemplo 2: Qual a moda para batimentos cardacos dos pacientes asmticos em estado de parada respiratria 167 150 125 120 40 136 150
Soluo: Moda =

X
i =1

, Onde

Nota de aula 7 Estatstica descritiva para dados no agrupados Professor: Kleison Freitas

Exemplo 3: Tempos de sobrevivncia (aps a posse) dos 10 primeiros presidentes americanos 10 29 26 28 15 23 17 25 0 20


OBS: 1 presidente George Washington (1789 1797) e o atual (Barak Hussein Obama, o 44). Soluo: Moda =

Exemplo 4: Precipitao pluviomtrica (em polegadas) de uma certa cidade do Brasil, de 1948 a 1954 43,3 53,02 63,52 62,53 43,3 53,02
Soluo: Moda =

Acima de 2 modas multimodal. A moda tem a facilidade em encontr-la, mas dificilmente utilizada em equaes matemticas. 1.3. Mediana (Md): a realizao que ocupa a posio central da srie de observaes, quando esto ordenados em ordem crescente ou decrescente (rol). Se o conjunto de dados (n) constitudo por um nmero mpar de dados, a mediana o valor que fica no centro dos dados ordenados ou encontra-se a mediana atravs da posio ordenada, com a frmula
n +1 2

Exemplo 1: Idade de crianas de uma determinada escola: 8 7 3 4 8


Soluo: Ordenar os dados: 3 4 7 8 8 Mediana (Md) = Interpretao:

Se o conjunto de dados (n) constitudo por um nmero par de dados, a mediana a mdia aritmtica dos dois valores que ficam na posio central dos dados ordenados ou atravs da posio o o n n + + 1 2 2 ordenada, com a frmula 2 Exemplo 2: Idade de crianas de uma determinada escola: 8 7 3 4 8 9
Soluo: Ordenar os dados: 3 4 7 8 8 9 Mediana (Md) = Interpretao:

A mediana tem como vantagem a no afetao por valores extremos, mas uma medida difcil de ser includa em equaes matemticas.

Nota de aula 7 Estatstica descritiva para dados no agrupados Professor: Kleison Freitas

Exerccios: A lei seca implantada no Brasil em 18 de Junho de 2008 estabelece que a concentrao permitida de lcool por litro de sangue de 0,2 g ou 0,1 mg de lcool por litro de ar expelido no exame do bafmetro. Segue as concentraes em miligramas de lcool por litro de ar de 15 motoristas envolvidos em acidentes que perderam a carteira de habilitao por 12 meses: 0,27 0,17 0,18 0,16 0,13 0,24 0,29 0,24 0,14 0,16 0,12 0,18 0,21 0,19 0,19 Calcule e interprete a: a) Mdia aritmtica
Soluo:

b) Moda
Soluo:

c) Mediana
Soluo:

2. MEDIDAS DE DISPERSO: Quando realizamos uma medida precisamos estabelecer a confiana que o valor encontrado representa. Medir um ato de comparar e esta comparao envolve erros dos instrumentos, do operador, do processo de medida e outros. Podemos ter erros sistemticos que ocorrem quando h falhas no mtodo empregado, defeito dos instrumentos, erros acidentais que ocorrem quando h impercia do operador, erro de leitura em uma escala, erro que se comete na avaliao da menor diviso da escala utilizada, dentre outros. Em qualquer situao deve-se adotar um valor que melhor represente a grandeza e uma margem de erro dentro da qual deve estar compreendido o valor real. Para isso, vamos aprender como analisar os dados dispersos do conjunto de dados com relao s medidas de tendncia central, especialmente com relao mdia. Ento preciso entender quais as medidas de disperso que analisam esses dados dispersos. Para compreenso, segue um exemplo prtico: Muitos bancos costumavam exigir que os clientes formassem filas separados para os diversos guinches, mas recentemente passaram adotar a fila nica. Qual o motivo dessa modificao? O tempo mdio de espera no se modifica, por que a fila de espera no afeta a eficincia dos caixas. A adoo de fila nica ocorreu ao fato de os clientes preferirem tempos de espera mais consistentes com menor variao. Assim, que milhares de bancos efetuaram essa modificao que resultou em uma variao menor (e clientes mais satisfeitos), mesmo que a mdia no tenha sido afetada. Com isso, pode-se concluir que as medidas de disperso avaliam a variabilidade dos dados com relao sua mdia. As medidas de disperso mais usadas so:

Nota de aula 7 Estatstica descritiva para dados no agrupados Professor: Kleison Freitas

2.1. Amplitude total (At): a medida mais simples de variao que existe, e obtida atravs da diferena entre o maior e o menor dos valores da srie. At = Vmx Vmin Exemplo: Notas de duas turmas de 9 alunos Turma 1: 1, 1, 1, 2, 2, 2, 3, 3, 3 At = 3-1 =2 Turma 2: 8, 8, 8, 9, 9, 9, 10, 10, 10 At = 10-8 =2 A amplitude total a mesma para ambas as turmas, mas os valores de cada uma delas so visivelmente diferentes, portanto, essa medida (At) nem sempre confivel por envolver apenas dois resultados, mximo e mnimo, nada informando sobre a distribuio dos dados intermedirios, o que poder conduzir o analista a interpretaes equivocadas. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de clculo rpido sem muita exatido. 2.2. Varincia (S): a mdia do quadrado dos desvios pela quantidade de valores da varivel menos um, ou seja, S =
2

(X
n i =1

X)

n 1

, Onde

Xi = Valores da varivel X = Mdia aritmtica simples n = Nmero de valores Para entender a concepo da frmula da varincia, basta entender que a soma dos desvios (diferena entre um valor obtido ao se medir uma grandeza e um valor adotado que mais se aproxima do valor real) nula. Este valor real adotado a mdia aritmtica, isto :

(X
n i =1

X ) = 0 , ou seja,

X X = nX nX = 0 .
i =1 i i =1

Para termos uma estatstica que realmente mea a variao (em lugar de ser sempre zero), poderamos tomar a soma dos valores absolutos, como em:

X
i =1

X . Determinando a mdia deste

somatrio, obtendo o desvio mdio (ou absoluto, que considera o valor do nmero apenas positivo), dado pela seguinte expresso: DM =

X
i =1

Com o desvio padro mdio possvel visualizar a margem de erro cometida nas medidas ocorridas. Muitos acham que muito difcil gerar amostras diferentes que gerem a mesma varincia e desvio mdio diferente, portanto o espalhamento (disperso) dos dados vai depender do critrio utilizado (ou varincia ou desvio mdio), pois se utilizar a varincia vai verificar que os dados esto mais espalhados do que quando se utiliza o desvio mdio. Portanto, o melhor a ser utilizado a varincia porque ela d certeza absoluta que as amostras so diferentes. O mdulo no d essa informao, ao contrrio, ele nos d evidncias de que as amostras so iguais.

Nota de aula 7 Estatstica descritiva para dados no agrupados Professor: Kleison Freitas

Por exemplo: Uma turma fez uma prova e a mdia desta foi 7,0, e um aluno tirou 8,0, ou seja, a disperso foi de 1 ponto para mais. Se outro aluno tirar 6,0, a disperso 1 ponto para menos. Se usar o mdulo, a disperso ao invs de ser -1 e 1, ser 1 e 1, mostrando que no h diferena na disperso, no mostrando a realidade dos dados. E ao elevar ao quadrado, eleva-se todos os valores, tanto os negativos quanto os negativos. Como a varincia considera as diferenas de cada valor com relao sua mdia elevadas ao quadrado, a unidade de medida dos valores que compem tambm ser elevada ao quadrado, o que dificulta a interpretao. No clculo da varincia da amostra (S), deve-se dividir por (n-1) em vez de n para corrigir a tendncia de S subestimar a varincia populacional (), isto , para que S seja um estimador no viciado de , pois pois E (S) = (que ser visto em Inferncia Estatstica), pois se usarmos o estimador , E (S) , mostrando que ele um estimador viciado para . n OBS: Para n 30, no h praticamente diferena entre S e . S2 =
i =1

(X
n

X)

Propriedades: a) A varincia de uma constante C igual a zero: S(C) = 0 b) Ao somar ou subtrair uma mesma constante C a todos os valores do conjunto de dados, a varincia no ficar alterada.
Demonstrao:

c) Se multiplicar ou dividir cada valor do conjunto de dados por uma mesma constante C, a varincia ficar multiplicada ou dividida, respectivamente, pela constante ao quadrado (C).
Demonstrao:

2.3. Desvio Padro (S): Medida de variao dos valores em relao mdia utilizando mesma unidade de medida dos dados originais, portanto utilizado com maior frequncia que a varincia (S). Valores prximos um dos outros originam desvios-padro menores e mais prximos de sua mdia, enquanto que valores muito afastados um dos outros do um desvio-padro maior e mais distante de sua mdia.

S=

(X
i =1

x)2

n -1
5

Nota de aula 7 Estatstica descritiva para dados no agrupados Professor: Kleison Freitas

2.4. Coeficiente de Variao (CV): uma medida que avalia o quanto representa o desvio padro com relao mdia aritmtica de um conjunto de dados ou compara a variabilidade de dois ou mais conjuntos de dados, com relao sua mdia aritmtica.
S CV = 100 X

OBS: Quanto menor for o CV, mais homogneo ser o conjunto de dados, ou seja, a mdia encontrada mais representativa ou a mediana, se a mdia no existir, mas nesse caso, se os desvios forem calculados com quaisquer outros valores diferentes da mdia da varivel (a mediana, por exemplo), a soma dos quadrados desses desvios ser sempre maior do que o resultado obtido com a mdia da varivel. Assim: CV 0 (Os dados so homogneos, ou seja, h baixa disperso e a mdia representativa) CV (Os dados no so homogneos, ou seja, h alta disperso e a mdia no representativa). Para estabelecer um ponto de corte percentual, a tomada de deciso ser baseada em: Se CV 50% (Os dados no so homogneos, ou seja, h alta disperso e a mdia no representativa) Se CV < 50% (Os dados so homogneos, ou seja, h baixa disperso e a mdia representativa) Exerccio: Tempo de espera (em minutos) de clientes de dois bancos (A e B), por tipo de fila (nica e mltipla). No banco A, os clientes entram em uma fila nica que atendida por 3 caixas, enquanto que no banco B, os clientes entram em qualquer uma das trs filas que conduzem at os guinches. Dois clientes utilizam durante 10 dias os bancos, um o banco A e outro o banco B, e anotam o tempo que cada um levou para ser atendido, como segue abaixo: 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 Banco A (Fila nica) Banco B (Fila mltipla) 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10 Calcule e Interprete para ambos os bancos a: Mdia, Moda, Mediana, Desvio padro e Coeficiente de Variao. Que concluso voc chegou com a anlise estatstica destes dados?

Nota de aula 7 Estatstica descritiva para dados no agrupados Professor: Kleison Freitas

Manual para clculo de Estatstica descritiva, Correlao e Regresso Linear Calculadora Cientfica Modelo: Casio fx 82MS 1. Mdia e Desvio Padro: Colocar no modo estatstico: Clicar em Mode 2 (Sd) Digitar: 1 M+ 2 M+ 3 M+ Encontrar o valor da mdia: Clicar em Shift 2 (S-VAR) 1 = (Sair o valor da mdia igual a 2) Encontrar o valor do desvio padro: Clicar em Shift 2 (S-VAR) 3 = (Sair o valor do desvio padro igual a 1) Manual para clculo de Estatstica descritiva, Correlao e Regresso Linear Calculadora Financeira HP Modelo: 12C 1. Mdia e Desvio Padro: Limpar a memria: f CLx Adicionar valores (1, 2, 3) na memria da calculadora: 1 + 2 + 3 + Calcular a mdia: g 0 Calcular o desvio padro: g (ponto)

Você também pode gostar