Você está na página 1de 29

INTRODUO ESTATSTICA

Prof. Mauricio Carias


2012

Sumrio
1

Apresentao.......................................................................................................................4

A Estatstica.........................................................................................................................5

Populao e Amostra...........................................................................................................5

Estatstica Descritiva e Indutiva ...........................................................................................6

Tipos de Variveis ...............................................................................................................6


5.1

Exerccios: ....................................................................................................................7

Amostragem ........................................................................................................................7
6.1

Exerccios: ....................................................................................................................8

Tcnicas de descrio grfica..............................................................................................9


7.1

Tabelas.........................................................................................................................9

7.2

Grficos ........................................................................................................................9

7.2.1

Diagramas .............................................................................................................9

7.2.2

Cartogramas........................................................................................................11

7.2.3

Pictogramas.........................................................................................................12

7.3
8

Exerccios...................................................................................................................12

Distribuio de frequncia..................................................................................................13
8.1

Exemplo Resolvido: ....................................................................................................13

8.2

Exerccios: ..................................................................................................................15

Representao grfica de uma distribuio .......................................................................17


9.1

10

Exerccios...................................................................................................................17
Medidas de posio .......................................................................................................18

10.1

Medidas de tendncia central ....................................................................................18

10.1.1

Mdia Aritmtica (x) .............................................................................................18

10.1.2

Moda (Mo) ...........................................................................................................19

10.1.3

Mediana (Md).......................................................................................................19

10.2

Exerccios...................................................................................................................20

10.3

Medidas Separatrizes .................................................................................................21

10.3.1

Quartis.................................................................................................................21

10.3.2

Percentis..............................................................................................................21

11

Medidas de Disperso....................................................................................................23

11.1

Amplitude Total...........................................................................................................23

11.2

Varincia.....................................................................................................................23
2

11.3

Desvio Padro ............................................................................................................24

11.3.1

Propriedades: ......................................................................................................24

11.3.2

Exemplo resolvido:...............................................................................................25

11.4

Coeficiente de variao (CV) ......................................................................................25

11.5

Exerccios...................................................................................................................26

12

Noes de assimetria.....................................................................................................27

13

A distribuio Normal .....................................................................................................28

13.1

Propriedades: .............................................................................................................28

13.2

Exemplo Resolvido: ....................................................................................................28

14

Noes de Probabilidade ...............................................................................................30

14.1

Exemplos resolvidos:..................................................................................................31

14.2

Eventos complementares............................................................................................31

14.3

Eventos independentes...............................................................................................31

14.4

Eventos mutuamente exclusivos.................................................................................32

14.5

Exerccios Resolvidos:................................................................................................32

14.6

Exerccios: ..................................................................................................................33

15

Correlao e Regresso.................................................................................................34

15.1

Correlao ..................................................................................................................34

15.1.1

Caractersticas de r..............................................................................................36

15.1.2

Exemplo resolvido:...............................................................................................36

15.2

Regresso ..................................................................................................................37

15.2.1
15.3
16

Exemplo resolvido:...............................................................................................37

Exerccios...................................................................................................................38
Nmeros-ndices ............................................................................................................40

16.1

Exemplo:.....................................................................................................................40

16.2

Exerccio resolvido:.....................................................................................................41

16.3

ndice Agregativo ........................................................................................................41

16.4

Exerccios: ..................................................................................................................42

17

Introduo aos testes de hipteses e significncia .........................................................43

17.1

Erros do Tipo I e II ......................................................................................................43

17.2

Nvel de significncia ..................................................................................................43

17.3

Tipos de testes ...........................................................................................................43

18

Literatura recomendada / Referncias bibliogrficas......................................................44


3

1 Apresentao
Esta apostila uma introduo a um dos mais importantes - e vastos - campos da matemtica
aplicada: a Estatstica.
O contedo est organizado sempre com introdues tericas, alguns exemplos resolvidos e
exerccios para treinamento.
Alguns tpicos bsicos de matemtica como funes, logaritmos e probabilidade so
essenciais para a compreenso da estatstica. Sempre que achar necessrio, feche esta
apostila e procure aprofundar a teoria em matemtica! Esse um esforo que compensa, pois
capacidade analtica sem dvida um dos diferenciais que as empresas procuram neste incio
de sculo XXI.
Sempre que possvel busque tambm na internet referncias atualizadas sobre os assuntos
aqui tratados.
Bom estudo, e boa sorte!

A Estatstica

Antes de comearmos a
estudando.

estudar Estatstica, importante que saibamos o que estamos

A estatstica, antes de mais nada, um ramo da matemtica aplicada. Seu objetivo fornecer
mtodos para coleta, organizao, resumo, apresentao e anlise dos dados, visando
obteno de concluses vlidas e, finalmente, tomada de decises.
Assim, a estatstica serve de instrumento de apoio a vrios outros campos do conhecimento; na
verdade, a todos os ramos do conhecimento em que dados experimentais so manipulados.
Podemos, apenas para citar alguns, falar da importncia da estatstica na Fsica, Qumica,
Medicina, Engenharia, Cincias Socias, e, claro, na Administrao de Empresas.

Populao e Amostra

Ao coletarmos dados sobre um grupo de objetos ou indivduos, como por exemplo a cor dos
olhos ou o peso de estudantes de ensino mdio ou at o nmero de peas defeituosas
produzidas em um dia, nem sempre poderemos observar todo o grupo, principalmente nos
casos em que tal grupo for muito grande ou at mesmo inacessvel.
Desse modo, em vez de examinarmos todo o grupo ou conjunto, chamado de populao,
levantaremos os dados apenas de uma parte desta populao, chamada amostra.
De maneira mais formal, populao (ou universo) um conjunto de elementos com pelo
menos uma caracterstica comum.
Os estudantes universitrios, por exemplo, constituem uma populao, pois no mnimo
apresentam uma caracterstia em comum: so aqueles que estudam em universidades. Essa
caracterstica em comum delimita de maneira inequvoca os elementos que pertencem
populao, e os que no pertencem.
No entanto, como j citei, muitas vezes no conveniente, e muitas vezes impossvel
levantar os dados referentes a todos os elementos da populao. Devemos portanto limitar
nossas observaes uma amostra. Formalizando a idia, amostra um subconjunto finito de
uma populao.
importante mencionar neste ponto que embora a amostra seja finita, a populao pode ser
tambm finita ou infinita.
Para relembrar: conjunto finito aquele que contm um nmero limitado de elementos e
conjunto infinito aquele que contm um nmero ilimitado de elementos.

Estatstica Descritiva e Indutiva

Os mtodos da estatstica que buscam somente descrever e analisar certo grupo de dados,
independentemente de serem dados extrados de uma amostra ou de toda a populao, so
chamados de mtodos de estatstica descritiva.
Por outro lado, se uma amostra representativa de uma populao, e tiramos concluses a
respeito desta populao com os dados extrados da amostra, temos uma aplicao da
estatstica indutiva. Raciocnio indutivo aquele que parte do conhecimento de uma parte
para tirar concluses sobre a realidade do todo. Assim, estatstica indutiva a parte da
estatstica que tira concluses sobre a populao partindo do conhecimento da amostra.
claro que o processo de induo no exato, e a estatstica indutiva est sujeita a erros. No
entando, os mtodos de induo (ou inferncia) estatstica so capazes de definir at que
ponto, e com que probabilidade, estamos errando.

Tipos de Variveis

Dentro de um estudo estatstico, precisamos definir quais caractersticas dos elementos


(populao ou amostra) nos interessa estudar.
Essa caracterstica pode ser, por exemplo, o peso ou a cor dos olhos de um certo nmero de
pessoas. Assim, peso e cor dos olhos so denominados variveis, cujos resultados
dependero dos elementos considerados. E fcil perceber que se tivermos n elementos (no
caso, n pessoas) em nosso estudo, teremos n valores para a varivel peso.
Por conveno, definimos varivel como o conjunto de resultados possveis para um
fenmeno.
Dependendo do objetivo de nosso estudo, a caracterstica (varivel) em foco poder ser:
a. Qualitativa quando for expressa por tipos ou atributos: sexo (masculino ou feminino),
cor dos olhos (azuis, castanhos, etc.), qualidade de uma pea produzida (perfeita ou
defeituosa).
b. Quantitativa quando for expressa em nmeros. importante notar que as variveis
quantitativas podem ser subdivididas em discretas e contnuas.
Varivel contnua aquela que pode assumir qualquer valor entre dois limites. Por
outro lado, uma varivel discreta s pode asumir valores pertencentes a um conjunto
enumervel.
Preste ateno nos exemplos:
b.1 Variveis quantitativas discretas: nmero de alunos em uma turma, pontos obtidos
em uma jogada de dados, nmero de peas produzidas em um dia de trabalho;
b.2 Variveis quantitativas contnuas: peso dos alunos em uma turma, dimetros de
peas produzidas em um dia.
Ao observarmos os exemplos, podemos perceber que, de maneira geral, os valores das
variveis discretas so obtidos por contagens, enquanto que os valores das variveis
contnuas so obtidos por medies.
6

Por ltimo, as variveis so designadas por letras latinas. Em geral: x, y ou z.

5.1

Exerccios:
1) Estabelea quais dos dados seguintes so discretos e quais so contnuos:
a)
b)
c)
d)
e)

Nmero de aes vendidas na bolsa de valores


Temperaturas registradas a cada meia hora em um posto de meteorologia
Meia-vida mdia das amostras de medicamentos
Dimetros de 1000 parafusos produzidos por uma fbrica
Quantidade de pessoas no carnaval de olinda

Respostas: Discretos, Contnuos, Contnuos, Contnuos, Discretos.


2) Classifique as variveis em qualitativas ou quantitativas (contnuas ou discretas):
a) Cor dos cabelos
b) Nmero de filhos
c) Comprimento de peas produzidas por certa mquina
Respostas: Qualitativa, Quantitativa discreta, Quantitativa contnua.

Amostragem

Voc neste ponto j sabe que a estatstica indutiva busca tirar concluses sobre a populao
baseado em resultados retirados das amostras. Porm o processo no to simples, porque
precisamos garantir que a amostras sejam representativas da populao, ou seja, a amostra
deve ter as mesmas caractersticas bsicas da populao em relao varivel em estudo.
Existem basicamente dois tipos de amostragem, a probabilstica e a no-probabilstica. A
amostragem probabilstica aquela em que todos os elementos da amostra tem probabilidade
conhecida, e diferente de zero, de pertencer amostra. Caso contrrio, a amostragem ser
no-probabilstica.
Exemplificando, a amostragem probabilstica mais simples justamente denominada
amostragem casual simples, e equivalente a um sorteio lotrico, em que todos os
elementos tm igual probabilidade de pertencer amostra.
Numeramos a populao de 1 a n e sorteamos por meio de qualquer dispositivo k nmeros
desta sequncia.
Podemos numerar alunos de 1 a 40 e colocar os nmeros dentro de uma caixa e retirar um a
um, 10 nmeros. A amostra aleatria simples ter, neste caso, 25% da populao.
Se o nmero de elementos da mostra for muito grande, o sorteio pode ser invivel. Neste caso
podemos utilizar uma tabela de nmeros aleatrios para realizar a amostragem. Procure na
internet uma tabela de nmeros aleatrios. Se voc tiver acesso planilhas Excel, descubra
como gerar nelas as tabelas de nmeros aleatrios.
Um outro tipo de amostragem probabilstica a amostragem sistemtica, em que os
elementos da populao j se acham ordenados e a retirada de elementos para composio da
7

amostra feita periodicamente. Em uma linha de produo, se retirarmos um item a cada 10


produzidos para controle de qualidade, estaremos utilizando a abordagem sistemtica.
Poderamos utilizar o mesmo mtodo para retirar uma amostra de uma populao de
determinada rua. Se a rua contm 500 prdios, e queremos que a amostra contenha 10% da
populao (50 prdios), podemos escolher aleatoriamente o 1 prdio e ir pulando de 10 em
10 prdios at chegar ao 50 elemento.
Se por acaso nossa populao contiver subpopulaes ou estratos, importante utilizar uma
amostragem estratificada, em que os elementos da amostra so proporcionais aos elementos
dos estratos da populao. Um bom exemplo uma turma com 60 alunos, contendo 40
meninos e 20 meninas. Temos uma proporo 2:1. importante que a amostra contenha esta
mesma proporo. Assim, se tivermos uma amostra com 15 elementos, 10 devero ser
meninos e 5 meninas. Mantendo a proporo 2:1.
Amostras no-probabilsticas so tambm empregadas em trabalhos de estatstica por
simplicidade ou inviabilidade de fazermos amostras probabilsticas. Os casos mais importantes
so:
a) A inacessibilidade de toda a populao (e neste caso seremos forados a colher a
amostra somente na parte da populao que est acessvel);
b) Amostragem a esmo, em que o selecionador procura ser aleatrio na amostragem, mas
no utiliza nenhum mtodo confivel de sorteio;
c) Amostragens intencionais, em que o amostrador delibaradamente escolhe alguns
elementos para pertencer amostra, julgando-os representativos;
d) Amostragens por voluntrios, no caso de por exemplo aplicaes experimentais de
novos medicamentos.

6.1

Exerccios:
1) Pesquise o peso dos seus colegas de classe (incluindo voc), com uma amostra que
corresponda a 30% da populao utilizando amostragem casual (ou aleatria) simples.
No deixe de procurar na internet uma tabela de nmeros aleatrios!
2) O diretor de uma escola, na qual esto matriculados 320 meninas e 280 meninos deseja
passar um questionrio socio-econmico para uma amostra correspondente a 10% da
clientela. Qual o nmero de elementos componentes da amostra?
Resposta: 64 meninas e 56 meninos.
3) Uma populao encontra-se dividida em 3 estratos, com tamanhos 40, 100 e 60.
Sabendo-se que 9 elementos foram retirados do 3 estrato em uma amostragem
estratificada, determine o nmero total de elementos da amostra.
Resposta: 30 elementos

Tcnicas de descrio grfica

Lembrando que um dos objetivos das estatstica a apresentao dos dados, importante que
saibamos trabalhar com tabelas e grficos.

7.1

Tabelas

Muitas vezes, para organizarmos melhor os dados, fazemos o uso de tabelas. De maneira
simplificada, uma tabela um quadro resumindo o nosso conjunto de observaes.
Toda tabela deve conter, resumidamente, como no exemplo a seguir: Ttulo, Cabealho,
Clulas e Fonte
Ttulo
Altura mdia dos estudantes do Ensino Mdio de
Japarabe
Altura (m)
Escola
Cabealho
A
B
C
D
E
F

1.65
1.71
1.63
1.67
1.7
1.69

Clulas

Fonte

Mdia Geral
1.675
Fonte: Censo Escolar do Municpio de Japarabe, 2006
Obs: Se a tabela apresenta distribuio dos dados em funo da poca, do local ou de alguma
espcie (ou categoria), ns a denominamos Srie Estatstica, podendo ser classificada em
Srie Histrica, Srie Geogrfica ou Srie Especfica.

7.2

Grficos

A vantagem da apresentao grfica produzir uma rpida impresso visual.


Para sermos realmente teis, nossas representaes grficas devem ser simples, claras e
devem expressar a verdade sobre o fenmeno estudado.
Os principais tipos de grficos so os diagramas, os cartogramas e os pictogramas.
7.2.1 Diagramas
Diagramas so grficos construdos, em geral, no plano cartesiano (x,y). O principal diagrama
o grfico em linha ou em curva, que voc com certeza j estudou em suas aulas de
matemtica.

Exemplo:
Utilizando nossa tabela de alturas mdia em funo das escolas, temos:

Outro tipo importante de representao o grfico em colunas ou barras, em que utilizamos


retngulos verticais (colunas) ou horizontais (barras) para visualizar as sries.
Exemplos:

Finalmente, devemos conhecer o grfico circular ou em setores, em que um crculo dividido


com reas proporcionais aos dados da srie.

10

Cada setor obtido por meio de regra de trs simples, com o total da srie valendo 360
Exemplo:

7.2.2 Cartogramas
So empregados sobre uma carta geogrfica, com os dados diretamente relacionados ao
recortes geogrficos ou polticos.
Podemos representar dados em pontos (em nmero ou tamanho proporcional aos valores) ou
cores.
Exemplo:

11

7.2.3 Pictogramas
So, de maneira resumida, uma representao grfica baseada em figuras.
Exemplo:

7.3

Exerccios
1) Procure exemplos de sries estatsticas em jornais e revistas e copie-os, classificando
as sries.
2) Procure em jornais e revistas especializados dois exemplos de cada um dos grficos
estudados.
3) Usando o grfico em barras, represente a tabela:

Prod. de Veculos de Autopropulso 1993


Tipo
Quantidade
Automveis
1.100.278
Comerciais Leves
224.387
Comerciais Pesados
66.771
Fonte: Anfavea

12

Distribuio de frequncia

Para descrevermos grficamente os dados coletados, nosso primeiro passo a determinao


das frequncias dos valores existentes da varivel.
Definimos frequncia simples (ou absoluta) como o nmero de vezes que um valor foi
observado, e podemos obter, a partir de dados brutos, uma tabela de distribuio de
frequncias.

8.1

Exemplo Resolvido:

Imagine que tenhamos feito uma coleta de dados relativos quantidade de irmos de 10
alunos, compondo uma amostra de uma turma da escola A, e ordenamos os dados de modo
crescente (a tabela de dados ordenados chama-se rol).
Em nosso exemplo, a frequncia ser o nmero de alunos relacionados a um determinado
valor da varivel, ou seja, um determinado nmero de irmos.
Tabela - Nmero de irmos de alunos do curso de
Estatstica
Nmero de irmos
Frequncia
0
1
2
3
5
Total
Fonte: Autor

1
4
6
3
1
15

Temos acima a construo de uma tabela de distribuio de freqncia pontual, equivalente


construo de uma tabela simples, em que listamos os diferentes valores observados da
varivel, com suas freqncias absolutas, denotadas por fi, onde o ndice i corresponde ao
nmero de linhas da tabela.
Olhando para a tabela, vemos que esta varivel foi resumida em 5 linhas. Assim, i = 1,...,5, e
temos 5 valores para as freqncias absolutas. A freqncia absoluta da segunda linha, f2 = 4,
por exemplo, indica que quatro alunos tm um irmo, enquanto apenas um afirmou ter cinco
irmos, ou seja, f5=1.
A soma de todas as freqncias absolutas deve ser igual ao nmero total de observaes da
varivel, neste caso, 15.
Temos, portanto, que:
Frequncias relativas (fri) so o resultado da razo entre as frequncias simples e a
frequncia total:

13

fri =

Logo, a frequncia relativa da quarta linha em nosso exemplo :


A frequncia relativa da quinta linha :

, e assim por diante.

Evidentemente temos que:


Frequncia acumulada (Fi) o total das frequncias de todos os valores inferiores ao limite
superior de uma dada classe:

Fk = f1 + f2 + f3 + ... fk
Temos portanto:
F1 = f1,
F2 = f1 + f2,
F3 = f1 + f2 + f3
E assim por diante.
Podemos desenhar uma nova tabela, mais completa, com as frequncias relativas e
acumuladas:
Tabela - Nmero de irmos de alunos do curso de Estatstica
Nmero
de
Frequncia
Frequncia
Frequncia
irmos
Relativa
Acumulada
0
1
0.067
1
1
4
0.267
5
2
6
0.400
11
3
3
0.200
14
4
1
0.067
15
Total
15
1
15
Fonte: Autor
Voc deve ter percebido que mencionei duas idias ainda no definidas: classe e limite de
classe.
Se estivermos lidando com variveis discretas e amostras com poucos elementos (como no
exemplo anterior), temos uma distribuio sem intervalos de classe.
Porm, se trabalhamos com variveis contnuas, ou at mesmo com variveis discretas, mas
com muitos elementos, trabalharemos com classes de frequncia, que so simplesmente
intervalos de variao.
As classes sero representadas por i = 1, 2, 3, ..., k, onde k o nmero total de classes.
14

Agora, precisamos de algumas outras definies:


Os limites de classe so os extremos de cada classe, e teremos um limite inferior (li) e um
limite superior (Li).
Alm disso tambm definimos a amplitude (hi), obtida pela simples subtrao dos limites
superior e inferior da classe: hi = Li - li
Amplitude total da distribuio (AT) a diferena entre o Limite superior mximo e o limite
inferior mnimo: AT = Lmax - lmin
Por ltimo, ponto mdio de uma classe a mdia aritmtica entre os limites superior e inferior
da classe:

Xi =
Obs: Na prtica, para a determinao do nmero de classes de uma distribuio, usamos a
seguinte equao (regra de Sturges):
i 1 + 3,3 . log n
Essa regra nos d a seguinte tabela:
N
35
6 11
12 22
23 46
47 90
91 181
182 362

I
3
4
5
6
7
8
9

Definido o nmero de classes, precisamos determinar a amplitude do inervalo de classe:

8.2

Exerccios:
1) Complete a distribuio abaixo, determinando as frequncias simples:
I
1
2
3
4
5

xi
2
3
4
5
6

fi

Fi
2
9
21
29
34
15

= 34
2) Os resultados do lanamento de um dado 20 vezes foram:
6 5 6 3 4 3 5 2 4 1
4 5 6 1 3 1 2 4 1 5
Forme uma distribuio de frequncia sem intervalos de classe.
3) Observe a distribuio de frequncia
Xi
Fi

3
2

4
5

5
12

6
10

7
8

8
3

Determine:
a) As frequncias relativas
b) As frequncias acumuladas
c) As frequncias relativas acumuladas
4) Complete os dados que faltam:
i
1
2
3
4
5
6
7
8

xi
0
1
2
3
4
5
6
7

fi
1

3
2

= 20

fri
0,05
0,15

0,25
0,15

=
100

Fi

13

18
19

16

Representao grfica de uma distribuio

Uma distribuio pode ser representada de diversas maneiras. As principais so o histograma


e o polgono de frequncia.
O Histograma traado em um plano cartesiano (x,y), formado basicamente por uma srie de
retngulos justapostos, em que os pontos mdios das bases dos retngulos so na verdade os
pontos mdios dos intervalos de classe e as larguras dos retngulos so as larguras dos
intervalos de classe

Polgono de frequncia um grfico em linha, com as frequncias das classes marcadas no


eixo y do plano cartesiano.

9.1

Exerccios
1) Construa o histograma relativo ao exerccio 4 do item anterior

17

2)

10 Medidas de posio
Estudando as distribuies de frequncia, percebemos que existem alguns elementos tpicos
que precisam ser ressaltados.
O primeiro destes elementos a posio de concentrao dos valores.
Imagine a seguinte pergunta: Os dados esto mais concentrados no incio, no meio ou no final
da distribuio?
Para que possamos respond-la, precisamos conhecer as mais importantes medidas de
posio, que so as medidas de tendncia central: a mdia, a mediana e a moda.

10.1 Medidas de tendncia central


As medidas de tendncia central so assim chamadas por indicarem um ponto em torno do
qual se concentram os dados. Este ponto tende a ser o centro da distribuio dos dados, ou o
centro de gravidade dos dados.
10.1.1 Mdia Aritmtica (x)
Antes de mais nada, importante que voc saibda que ao lidarmos com um conjunto de dados,
podemos calcular diversos tipo de mdias. Em nosso estudo focaremos a mdia mais
importante, a mdia aritmtica, mas no deixe de estudar posteriormente a mdia geomtrica,
a mdia harmnica e a mdia ponderada.
A mdia aritmtica (x) a soma de todos os valores observados da varivel dividida pelo
nmero total de observaes.

A mdia aritmtica a medida de tendncia central mais utilizada para representar a massa de
dados.
Propriedades e observaes sobre a mdia:
1. Depende de todos os dados coletados, sendo portanto afetada por valores extremos;
2. nica em um conjunto de dados e nem sempre tem existncia real, ou seja, nem sempre
igual a um determinado valor observado. muito importante perceber que a mdia no
necessariamente um dado da srie de valores observados.
3. Por depender de todos os valores observados, qualquer modificao nos dados far com
que a mdia fique alterada.
Isto quer dizer que somando-se, subtraindo-se, multiplicando-se ou dividindo-se uma constante
a cada valor observado, a mdia ficar acrescida, diminuda, multiplicada ou dividida deste
mesmo valor. Exemplificando: se somarmos o nmero 2 a todos os valores observados, a
mdia ser acrescida do valor 2. Se multiplicarmos todos os dados por 3, a mdia ser
automaticamente 3 vezes maior.

18

4. A soma dos desvios em relao mdia zero.

(xi x) = 0
A propriedade 4 de extrema importncia para a definio de varincia, uma medida de
disperso a ser definida posteriormente. Desvio em relao mdia a diferena entre cada
elemento de um conjunto de dados e a mdia aritmtica.

di = xi x
Obs: se precisarmos calcular a mdia de um conjunto de dados divididos em classes,
convencionamos que todos os valores includos no intervalo coincidem com o ponto mdio
deste intervalo, e utilizamos a seguinte equaao:

10.1.2 Moda (Mo)


Moda simplesmente o valor que mais se repete em uma sequncia de dados.
Considere a seguinte srie: 1, 3, 4, 4, 4, 6, 8, 32
Como o valor que aparece com maior frequncia o 4, ele o valor modal, ou simplesmente
a moda.
O uso da moda mais indicado quando se deseja obter, rapidamente, uma medida de
tendncia central. Um outro aspecto que favorece a utilizao da moda que seu valor no
afetado pelos valores extremos do conjunto de dados analisado.
Uma srie numrica pode ser:
Amodal: quando nenhum valor se repete;
Modal: quando um valor se repete;
Bimodal: quando dois valores se repetem;
Trimodal: quando trs valores se repetem;
Polimodal: quando mais do que trs valores se repetem.

10.1.3 Mediana (Md)


A mediana o valor que ocupa a posio central da srie de observaes de uma varivel,
dividindo o conjunto em duas partes iguais. Assim, 50% dos valores so maiores ou iguais ao
valor da mediana e 50% dos valores so menores ou iguais ao valor da mediana.
Formalizando, a mediana o valor tal que separa o conjunto de dados em dois subconjuntos
de mesmo nmero de elementos.
19

Se a quantidade de dados for mpar, a mediana simplesmente o valor central, e se a


quantidade de dados for par a mediana ser a mdia aritmtica dos dois valores centrais.
Sendo n o nmero de elementos da srie, o valor mediano ser:
- O termo

, se n for mpar;

- A mdia aritmtica dos termos

+ 1, se n for par.

Vamos comear com uma srie de 7 dados observados:


1, 5, 8, 9, 12, 17, 20
Como temos um nmero mpar de dados, a mediana o valor central, ou seja, o valor 9.
E se tivssemos 8 valores observados?
1, 5, 8, 9, 12, 17, 20, 22
Nesse caso a mediana seria a mdia aritmtica dos dois dados centrais. Como os dados
centrais so o 9 e o 12, a mediana seria

Obs: Empregamos a mediana sempre que h valores extremos que afetam muito a mdia.
Veja a srie de dados sobre o valor dos salrios dos colaboradores em um escritrio:
R$1.000,00, R$1.000,00, R$1.500,00, R$2.000,00, R$3.000,00
A mediana dos dados R$1.500,00 (valor central) e a mdia R$1.700,00
Imagine agora que um novo colaborador contratado, com salrio de R$10.000
Repare que a nova srie :
R$1.000,00, R$1.000,00, R$1.500,00, R$2.000,00, R$3.000,00, R$10.000,00
e o novo valor da mediana R$1.750,00 e da mdia R$3.083,33
Reparou com um valor extremo altera muito a mdia, mas sem alterar muito a mediana?
Nesses casos a mediana uma medida de tendncia central mais estvel.

10.2 Exerccios
1) Uma escola deseja verificar o aproveitamento de 6 de seus alunos da 5 srie. Calcule
a mdia, a mediana e a moda, e classifique a srie conforme a moda.
Notas: 7,0 3,5 2,5 6,5 9,0 3,5
Respostas: Mdia = 5,3, Mediana = 5,0, Moda = 3,5. Srie Modal.
2) Classifique as srie de acordo com a caracterstica modal, indicando os valores.
2.1) 12, 13, 13, 14, 15, 17, 17, 19
2.2) 56, 58, 60, 60, 60, 62, 65
20

2.3) 47, 45, 90, 90, 47, 90, 47, 45, 41, 45

10.3 Medidas Separatrizes


Existem outras medidas de posio (alm das medidas de tendncia central),
estudaremos mais duas delas: os quartis e os percentis.

e aqui

10.3.1 Quartis
J aprendemos que a mediana divide os dados coletados em dois grupos com o mesmo
nmero de elementos.
Os quartis dividem o conjunto de valores em, como o nome j diz, quatro subconjuntos de
mesmo nmero de elementos
Assim, temos trs quartis:
a. O primeiro quartil (Q1) o valor situado de modo tal que um quarto (25%) dos dados
so menores que ele, e o restante (75%) maior que ele.
b. O segundo quartil (Q2) evidentemente igual a mediana. Q2 = Md.
c. O terceiro quartil (Q3) o valor situado de modo tal que trs quartos (75%) dos dados
so menores que ele, e o restante (25%) maior que ele.
Resumo:
Estatstica

Notao

1o Quartil

Q1

2o Quartil

Q2 = Md

3o Quartil

Q3

Interpretao
25% dos dados so menores ou iguais ao do 1o
Quartil
50% dos dados so menores ou iguais ao do 2o
Quartil
75% dos dados so menores ou iguais ao do 3o
Quartil

Posio
p = 0,25 (n +
1)
p = 0,50 (n +
1)
p = 0,75 (n +
1)

10.3.2 Percentis
Percentis so os noventa e nove valores que dividem uma srie de dados em 100 partes (ou
subconjuntos) com o mesmo nmero de elementos.
Indicamos o 1 percentil como P1, o 2 como P2 e assim por diante.
importante notar que P25 = Q1, P50 = Md e P75 = Q3
Resumo:
Estatstica

Notao

Interpretao

Posio

5o Percentil

P5

5% dos dados so menores ou


iguais ao do 5o Percentil

p = 0,05 (n + 1)

50o Percentil

P50 = Q2 = Md

50% dos dados so menores ou


iguais ao do 50o Percentil

p = 0,50 (n + 1)

21

95o Percentil

P95

95% dos dados so menores ou


iguais ao do 95o Percentil

p = 0,95 (n + 1)

22

11 Medidas de Disperso
As medidas de disperso auxiliam as medidas de tendncia central a descrever nosso conjunto
de dados observados adequadamente. Indicam se os dados esto, ou no, prximos uns dos
outros.
Observe os trs conjuntos de dados:
X: 10, 10, 10
Y: 5, 10, 15
Z: 0, 10, 20
fcil perceber que se calcularmos a mdia dos trs conjuntos, encontraremos o mesmo valor:
10. Porm, igualmente fcil perceber que o conjunto X mais homogneo, enquanto o
conjunto Z o que tem maior diversificao.
Chamamos de disperso ou variabilidade a maior ou menor diversificao de valores em
torno de um valor de tendncia central. necessrio, portanto, ao menos uma medida de
tendncia central e uma medida de disperso para descrever um conjunto de dados.
De todas as medidas de disperso, estudaremos a amplitude total, a varincia, o desvio padro
e o coeficiente de variao

11.1 Amplitude Total


A amplitude total simplesmente a diferena entre o maior e o menor valor coletado. A
amplitude total uma medida de disperso que no leva em considerao os valores
intermedirios, no dando nenhuma informao de como os dados esto distribudos (ou
concentrados).

AT = xmx xmn
A amplitude total tem um clarssimo problema: s leva em considerao os valores extremos de
nosso conjunto de dados, sem contabilizar os valores intermedirios.
vlido utilizarmos a amplitude total para comparamos temperaturas ao longo de um dia (ou
ano) ou como controle rpido de qualidade em uma linha de produo.

11.2 Varincia
A varincia uma medida baseada nos desvios em torno da mdia aritmtica.
Formalizando a idia, na verdade a varincia a mdia aritmtica dos quadrados dos desvios
(ou a mdia aritmtica dos desvios ao quadrado). Representamos a varincia por s2, e temos:

ou

23

Obs: Se nosso interesse for a inferncia estatstica (tirar concluses sobre a populao
partindo de uma amostra) e no simplesmente a descrio dos dados, convm utilizarmos n-1
no lugar de n (no denominador).
Podemos portanto dizer que quanto maior a varincia, mais heterogneos so os dados, ou
seja, maior ser a variao entre os valores. Por outro lado, quanto menor a varincia, mais
homogneos so os dados, ou seja, menor ser a variao entre os valores.

11.3 Desvio Padro


Uma vez que a varincia obtida por meio dos quadrados dos desvios, a sua unidade de
medida o quadrado da unidade de medida dos dados. Assim, por motivos prticos, utilizamos
o desvio padro, que simplesmente a raiz quadrada da varincia.

Observaes:
1. Tanto o desvio padro quanto a varincia so medidas de disperso, o uso de uma ou
outra medida depender da finalidade do estudo
2. A utilizao da mdia aritmtica torna o clculo da varincia (e do desvio padro) pouco
prticos, pois com frequncia a mdia um nmero fracinrio. mais frequente
utilizarmos uma simplificao da frmula:

3. No caso de dados agrupados, teremos que levar em considerao as frequncias.


Assim, a equao ser:

4. No caso de dados agrupados com intervalos de classe, os valores de xi sero os

valores mdios (mdia aritmtica entre os limites inferior e superior) das classes.

11.3.1 Propriedades:
1) Se somarmos ou subtrairmos uma constante de todos os valores da srie, o desvio
padro no se altera.
2) Se multiplicarmos ou dividirmos uma constante por todos os valores da srie, o desvio
padro ser multiplicado ou divido por esta mesma constante.

24

11.3.2 Exemplo resolvido:


Observe como montar a tabela para uma determinada distribuio de frequncias e a utilizao
da equao para dados agrupados
i
1
2
3
4
5
6

Estaturas
(cm)
150 - 154
154 - 158
158 - 162
162 - 166
166 - 170
170 - 174

fi
4
9
11
8
5
3
= 40

xi
152
156
160
164
168
172

fixi
608
1404
1760
1312
840
516
=
6.440

fixi
92416
219024
281600
215168
141120
88752
=
1.038.080

s = 5,567

11.4 Coeficiente de variao (CV)


O coeficiente de variao resolve dois problemas do desvio padro:
1) O desvio padro tem a mesma unidade dos dados coletados. Assim, se quisermos
comparar dados com unidades diferentes, o desvio padro no uma boa medida
2) O desvio padro, como valor absoluto, no nos diz muita coisa, pois um desvio de 5
com mdia 500 um desvio pequeno, mas um desvio de 5 com mdia 10 um desvio
grande.
Ou seja, o valor absoluto do desvio padro, no caso, 5, no nos diz nada.
O coeficiente de variao calculado pela seguinte equao:

Sendo portanto uma grandeza admensional (sem unidades) e ponderada pelo seu valor mdio.

25

11.5 Exerccios
1) Complete o esquema abaixo e calcule o desvio padro para a seguinte sequncia de
valores:
8 10 11 15 16 18
I
1
2

n=

xi
8
10

xi2
64

Resp: s = 3,559
2) Comprove as propriedades do desvio padro somando 3 a cada nmero da srie e
depois multiplicando cada nmero por 2.
3) Calcule a amplitude total e o desvio padro da seguinte distribuio:
xi

fi

4) Para os dados de peso de 2 grupos de alunos, calcule a mdia e o desvio padro


65 57 89 65 50 72 81
Resp: Mdia =68,428kg, Desvio = 13,464kg
80 78 67 56 90 101 66
Resp: Mdia = 76,857kg, Desvio = 15,366kg

26

12 Noes de assimetria
A natureza bsica da assimetria simples.
Se em uma distribuio em forma de sino (distribuio normal) temos x = Md = Mo, a curva
considerada simtrica
Se Mo < Md < x, a curva assimtrica positiva.
Se x < Md < Mo, a curva assimtrica negativa.

Assim, calculando o valor da diferena (x Mo), para valores nulos teremos uma curva
simtrica, para valores negativos teremos uma assimetria negativa (ou esquerda) e para
valores positivos teremos uma assimetria positiva (ou direita).
Podemos tambm fazer uso do coeficiente de assimetria de Pearson, que tem a vantagem de
ser admensional:

Se 0,15 < |As| < 1, a assimetria considerada moderada. Se |As| > 1 a assimetria
considerada forte.

27

13 A distribuio Normal
De todas as distribuies tericas de varivel aleatria contnua, uma das mais importantes a
distribuio normal.

13.1 Propriedades:
1) A varivel X pode assumir qualquer valor real
2) Graficamente, a distribuio tem a forma de um sino, simtrico em torno da mdia. A
curva recebe o nome de Curva de Gauss o Curva Normal
3) A rea total sob a curva tem valor 1 e a probabilidade da varivel X assumir qualquer
valor real. Dada a simetria da vurva, a probabilidade vale 0,5 para cada lado da mdia
O clculo da rea (probabilidade) para cada ponto da curva exige matemtica avanada,
portanto usaremos um conceito simples para contornar esta restrio, o conceito de
distribuio normal reduzida
A distribuio normal reduzida uma distribuio normal com mdia 0 e desvio padro 1. As
probabilidades associadas (ou reas sob a curva) so encontradas em uma tabela, de modo
que no precisamos calcul-las. A frmula que usaremos :

13.2 Exemplo Resolvido:


Imagine um grupo de trabalhadores com mdia salarial R$400,00 e desvio padro R$50,00.
Qual a probabilidade de encontrarmos um trabalhador que tenha salrio entre R$390,00 e
R$450,00?
Passo-a-passo:
1) A distribuio original (X) tem mdia R$400,00 e desvio R$50,00
2) Podemos ento encontrar os valores de Z correspondentes a X = R$390,00 e X =
R$450,00
Z1 = (390 400)/50 = -0,2
Z2 = (450 400)/50 = 1,0
Assim, podemos dizer que a probabilidade do salrio (X) ficar entre R$390,00 e R$450,00 a
mesma de termos Z entre -0,2 e +1,0.
Observando a tabela de distribuio normal de Z (pea ajuda de seu profesor para ler a tabela!
Tabelas de probabilidade para Z (0,1) podem ser facilmente encontradas na internet), temos
28

0,0793 para 0,2 (no h diferena entre -0,2 e +0,2, uma vez que a curva simtrica) e
0,3413 para 1,0.

Como a distribuio Z tem mdia 0, temos 0 -0,2 esquerda do zero e o +1,0 direita do zero.

P (390 < X < 450) = P (-0,2 < Z < 0) + P (0 < Z < 1,0) = 0,0793 + 0,3413 = 0,4206.
Ou seja, temos que em mdia 42% dos trabalhadores ganham entre R$390,00 e R$450,00.
Obs: Para ler a tabela de distribuio normal Z, procure os dois primeiros algarismos na
primeira coluna e depois o ltimo algarismo na primeira linha. Para achar o 1,00 fcil. Basta
acharmos o 1,0 na primeira coluna e depois o 0,00 na primeira linha. Ficamos com 0,3413. Se
quisermos achar Z = 1,55, temos que achar o 1,5 na primeira coluna e depois o 0,05 na
primeira linha. Ficamos com 0,4395. Por ltimo, se quisermos achar Z = 3,38, procuraremos o
3,3 na primeira coluna e o 0,08 na primeira linha. Acharemos o valor 0,4996.

29

Você também pode gostar