Você está na página 1de 56

Introduo Estatstica

Conceitos bsicos
Estatstica Descritiva
a parte da estatstica que visa, apenas, a descrever, apresentar e
analisar os dados sem aquela preocupao de fazer generalizaes
ou tirar concluses para o conjunto de onde foram retirados tais
dados.
Estatstica Indutiva
a estatstica que partindo da anlise dos resultados de pequenos
conjuntos, denominados amostras, chega-se a concluses
extensivas a conjuntos maiores que contm os primeiros e que sero
denominados de populao ou universo.

Introduo Estatstica
Esquematicamente, temos:

Introduo Estatstica

Estatstica
um mtodo que cuida da observao, classificao formal e
anlise dos fenmenos coletivos.
um mtodo cientifico de obter, apurar, apresentar e
interpretar dados numricos, relativos variao de um ou
mais fenmenos.

Introduo Estatstica
Populao ou universo

Coleo
de
unidades
individuais, que podem ser
pessoas
ou
resultados
experimentais, com uma ou
mais caractersticas comuns,
que se pretendem estudar.

Introduo Estatstica
Nem sempre possvel estudar exaustivamente
todos os elementos da populao!
Porqu?
- Pode a populao ter dimenso infinita
Exemplo: Populao constituda pelas presses
atmosfricas, nos diferentes pontos de uma
cidade.
- Pode o estudo da populao levar

destruio

da populao
Exemplo: Populao dos fsforos de uma caixa.

- Pode o estudo da populao ser muito dispendioso

Exemplo: Sondagens exaustivas de todos os


eleitores, sobre determinado candidato.

Introduo Estatstica
Quando no possvel estudar, exaustivamente, todos os elementos da
populao, estudam-se s alguns elementos, a que damos o nome de
Amostra.
Amostra

Conjunto de dados ou observaes,


recolhidos
a
partir
de
um
subconjunto da populao, que se
estuda com o objetivo de tirar
concluses para a populao de onde
foi recolhida.

Introduo Estatstica

Amostra
A amostra uma parcela ou uma frao de uma populao.
A diferena bsica entre conceitos de AMOSTRA e POPULAO ,
ento, que a amostra representa uma parte do todo, enquanto a
Populao representa o todo. A amostra considerada parte
representativa do todo, ou seja, todas as caractersticas devem nela
estar contidas e, por isso, as concluses a respeito da Amostra
podem ser consideradas como pertencentes s da Populao.

Introduo Estatstica
Justificam-se os trabalhos com amostras no lugar de estudar toda a
populao pelos seguintes fatores (vantagens):
Custo: as despesas com operacionalizao estatstica da
populao so geralmente bem maiores que com a averiguao
amostral.
Velocidade: as pesquisas realizadas em amostras so mais
rpidas em virtude de conter bem menor nmero de unidades.
Praticabilidade: conforme o prprio conceito. s vezes, a
dimenso da populao torna as pesquisas impraticveis.
A grande desvantagem consiste em se trabalhar com pequenos
conjuntos o que nos conduzir a no se ter certeza absoluta da
validade das estimativas, anlise, concluses.

Introduo Estatstica

Experimento aleatrio
Os experimentos aleatrios so aqueles cujos resultados
no so sempre os mesmos, apesar de se repetirem vrias
vezes em condies semelhantes. O experimento aleatrio
um fenmeno que apresenta resultados imprevisveis. O
lanamento de moedas e dados, bem como sorteios,
extraes lotricas so fenmenos aleatrios.

Introduo
Das medidas, ou estatsticas que iremos definir, para caracterizar os dados,
destacam-se as

medidas de tendncia central


As que localizam o centro da amostra (mdia, moda e mediana)

medidas de disperso

Que indicam a variao entre os valores.

Medidas de tendncia central Mdia


A mdia, que se representa por
uma medida
de localizao do centro da amostra, e obtm-se
a partir da seguinte expresso:

onde x1, x2, ..., xn representam os elementos da


amostra e n a sua dimenso.

Medidas de tendncia central Mdia


Mdia Tpica
quando os valores da srie esto concentradas em torno da mdia.
X = 18 + 20 + 20 + 22 = 80 = 20
4
4
20 considerada mdia tpica, pela concentrao dos valores em torno da mdia.

Mdia Atpica
quando os valores da srie no esto concentrados em torno da mdia.
A mdia atpica representa mal a srie de valores.
Observe que no conjunto abaixo, o valor 100 discrepante, conduzindo a falsa
anlise do conjunto.
X = 2 + 4 + 5 + 6 + 100 = 117 = 23,4
5
5
O nmero 23,4 representa mal os valores da srie. uma mdia
atpica.

Medidas de tendncia central Mdia


Vantagens da Mdia Aritmtica
obtida atravs de clculos relativamente simples.
a mais conhecida de todas as mdias.
Pela facilidade com que determinada a de mais fcil compreenso.

Desvantagens da Mdia Aritmtica


Para a obteno da X necessrio ter todos os valores do grupo; basta no
ter um desses valores e a mdia no pode ser determinada.
excessivamente afetada por valores ou muito grandes ou muito pequenos.

Medidas de tendncia central Mediana


A mediana, m, definida como:
Ordenados os elementos da amostra, a mediana o valor
(pertencente ou no amostra) que a divide ao meio, isto , 50%
dos elementos da amostra so menores ou iguais mediana e os
outros 50% so maiores ou iguais mediana
Para a sua determinao utiliza-se a seguinte regra, depois de
ordenada a amostra de n elementos:
Se n mpar, a mediana o elemento mdio.
Se n par, a mediana a semi-soma dos dois elementos
mdios.

Medidas de tendncia central Mediana


Sejam os elementos da amostra ordenada com a seguinte notao:
X1, X2, ... , Xn
ento uma expresso para o clculo da mediana ser:

Como medida de tendncia central, a


mediana mais robusta do que a mdia,
pois no to sensvel aos dados !

Medidas de Disperso Introduo


Introduo
A mdia uma forma de resumir os dados de um grupo e est representada
pelo Ponto de equilbrio. Porm, muitas das vezes necessrio se conhecer
a variao obtida entre os valores.
Consideremos as sries abaixo com suas respectivas
mdias.
I) 20; 20; 20; 20; 20;

X = 20

II) 18; 19; 20; 21; 22;

X = 20

III) 5; 25; 15; 15; 40

X = 20

Nos dois primeiros casos, a mdia representa um ponto de equilbrio entre


os valores. Percebam que no existe uma significativa disperso entre os
valores.

Medidas de Disperso Introduo


J no terceiro caso, embora a mdia nos d uma idia da localizao dos
valores na srie, ela no suficiente para descrev-los completamente.
Ao comparar os valores da srie 1 e 2 com os valores da srie 3 vemos
que possuem a mesma mdia mas os valores da srie 3 se apresentam mais
espalhados que os das sries 1 e 2.
Desta forma conclu-se que para descrever uma srie de valores
necessrio um indicador de espalhamento ou disperso, alm da mdia.
Para medir o grau de disperso ou concentrao dos valores em torno da
mdia, utilizamos as medidas de disperso; a saber:

Amplitude

Varincia

Desvio padro

Coeficiente
de variao

Medidas de Disperso Amplitude


Amplitude de variao ( R ):
A amplitude definida como sendo o intervalo entre o maior e o
menor item do grupo:
R = (maior medida) - (menor medida).

R(I) = 20 - 20

R=0

R(I) = 22 - 18

R=4

R(I) = 40 - 5

R = 35

Medidas de Disperso Desvio mdio


Desvio mdio ( DM ):
a mdia dos desvios em relao mdia.
Exemplo: 12; 10; 9; 8; 10; 8; 6
A mdia dos valores = 9
Desvio de cada elemento em relao mdia:
12 - 9 = 3 ; 10 9 = 1; ...

x
DM

x x2 x xn x
N

Medidas de Disperso Desvio mdio

x
DM
n

i 1

x
N

Medidas de Disperso Varincia


Define-se a varincia, e representa-se por s2, como
sendo a medida que se obtm somando os
quadrados dos desvios das observaes da amostra,
relativamente sua mdia, e dividindo pelo nmero
de observaes da amostra menos um:

Medidas de Disperso Varincia


Pode ser obtida atravs da amostra ou da populao.

Varincia populacional

Varincia amostral

1 n

n i 1

x x

1 n

n 1 i1

x x
i

Medidas de Disperso Desvio Padro


Uma vez que a varincia envolve a soma de quadrados, a unidade em que se
exprime no a mesma que a dos dados. Assim, para obter uma medida da
variabilidade ou disperso com as mesmas unidades que os dados, tomamos a
raiz quadrada da varincia e obtemos o desvio padro:

Desvio padro amostral

Desvio padro populacional

x x
n

S xi n 1

xi n

i 1

x x
n

i 1

Medidas de Disperso Desvio Padro


56,2

57

57,4

57,7

58,5

58,9

59,5

59,5

59,5

60

60,3

60,5

60,5

60,5

60,8

60,8

60,8

60,9

61

61,2

61,5

61,6

61,8

62,5

62,9

63

63,8

64,7

65,4

66,3

Medidas de Disperso Coeficiente de Variao


Coeficiente de Variao (Cv)
Medida relativa de disperso utilizada para comparar grandezas diferentes.
Observe as duas distribuies a seguir e avalie qual das duas apresenta
maior disperso.
Processo

Mdia

Desvio
padro

20 000

50

200

50

Avaliando pelo desvio padro, conclumos que ambas apresentam a


mesma disperso.
Porm, percebemos claramente que a disperso do processo B muito
mais significativa que a do processo A.

Medidas de Disperso Coeficiente de Variao


Assim, no adequado comparar disperses de duas ou mais distribuies
pelo desvio padro, sendo necessria uma outra medida que leve em
considerao a magnitude da varivel.

Assim:

Cv = S(x) x 100
X

Exerccio:
Sejam os dados abaixo um conjunto de valores resultados de 40
medies independentes e consecutivas:

61,0 59,2 57,0 62,5 57,7 56,2 62,9 66,3


58,2 56,5 64,7 65,4 60,5 59,5 61,6 60,8
62,2 59,0 60,3 60,8 59,5 60,0 61,8 63,8
61,1 59,7 57,4 61,2 60,9 61,0 63,0 59,5
60,2 62,9 60,5 60,8 61,5 58,5 58,9 60,5
Calcule: a) mdia ; amplitude ; desvio padro amostral e
populacional ; somatria de x ; somatria quadrtica ; varincia
amostral e populacional.

Distribuio Retangular
Tambm conhecida como distribuio uniforme.
No lanamento de um dado de seis lados, a probabilidade
de se tirar um nmero de uma em seis

Distribuio Triangular
No lanamento de dois dados, a probabilidade de se tirar
um 7 maior que a probabilidade de se tirar um 2.

10

11

12

Histograma
8 classes

Histograma
16 classes

Histograma
Tendendo a
infinitas classes

Distribuio Normal

Pode-se afirmar que esta distribuio a mais importante dentre as


demais, tendo em vista a sua grande aplicabilidade.

O histograma constitudo de uma srie de retngulos.


medida que o nmero de dados aumenta, os intervalos de classe
podem ser reduzidos e essa sucesso de retngulos vai-se
aproximando de uma curva contnua.
necessrio que se lembre, esta curva contnua uma abstrao
matemtica, uma vez que para se chegar mesma necessrio um
nmero infinito e medies.

Distribuio Normal

A distribuio normal envolve apenas dois parmetros estatsticos, a mdia e o


desvio padro da populao.
O desvio padro o ponto em que h inverso da curvatura.
A rea total sob a curva f(x) igual unidade.
Em virtude da simetria, as reas esquerda da mdia so iguais s da direita.
A rea abaixo da curva normal equivale a 100 % ou 1, e significa que todos os valores
possveis se encontram representados pela curva.

Distribuio Normal
Z

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

-1,0

0,1587

0,1562

0,1539

0,1515

0,1492

0,1469

0,1446

0,1423

0,1401

0,1379

-0,9

0,1841

0,1814

0,1788

0,1762

0,1736

0,1711

0,1685

0,1660

0,1635

0,1611

-0,8

0,2119

0,2090

0,2061

0,2033

0,2005

0,1977

0,1949

0,1922

0,1894

0,1867

-0,7

0,2420

0,2389

0,2358

0,2327

0,2296

0,2266

0,2236

0,2206

0,2177

0,2148

-0,6

0,2743

0,2709

0,2676

0,2643

0,2611

0,2578

0,2546

0,2514

0,2483

0,2451

-0,5

0,3085

0,3050

0,3015

0,2981

0,2946

0,2912

0,2877

0,2843

0,2810

0,2776

-0,4

0,3446

0,3409

0,3372

0,3336

0,3300

0,3264

0,3228

0,3192

0,3156

0,3121

-0,3

0,3821

0,3783

0,3745

0,3707

0,3669

0,3632

0,3594

0,3557

0,3520

0,3483

-0,2

0,4207

0,4168

0,4129

0,4090

0,4052

0,4013

0,3974

0,3936

0,3897

0,3859

-0,1

0,4602

0,4562

0,4522

0,4483

0,4443

0,4404

0,4364

0,4325

0,4286

0,4247

0,0

0,5000

0,5040

0,5080

0,5120

0,5160

0,5199

0,5239

0,5279

0,5319

0,5359

0,1

0,5398

0,5438

0,5478

0,5517

0,5557

0,5596

0,5636

0,5675

0,5714

0,5753

0,2

0,5793

0,5832

0,5871

0,5910

0,5948

0,5987

0,6026

0,6064

0,6103

0,6141

0,3

0,6179

0,6217

0,6255

0,6293

0,6331

0,6368

0,6406

0,6443

0,6480

0,6517

0,4

0,6554

0,6591

0,6628

0,6664

0,6700

0,6736

0,6772

0,6808

0,6844

0,6879

0,5

0,6915

0,6950

0,6985

0,7019

0,7054

0,7088

0,7123

0,7157

0,7190

0,7224

0,6

0,7257

0,7291

0,7324

0,7357

0,7389

0,7422

0,7454

0,7486

0,7517

0,7549

0,7

0,7580

0,7611

0,7642

0,7673

0,7704

0,7734

0,7764

0,7794

0,7823

0,7852

0,8

0,7881

0,7910

0,7939

0,7967

0,7995

0,8023

0,8051

0,8078

0,8106

0,8133

0,9

0,8159

0,8186

0,8212

0,8238

0,8264

0,8289

0,8315

0,8340

0,8365

0,8389

1,0

0,8413

0,8438

0,8461

0,8485

0,8508

0,8531

0,8554

0,8577

0,8599

0,8621

Distribuio Normal

Algumas reas da curva normal


Intervalo

% da rea dentro do intervalo

0,67

50,00

1,0

68,26

1,96

95,00

2,0

95,46

3,0

99,73

4,0

99,99

Distribuio Normal
Z

0,1

0,0797

2,1

0,9643

4,1

0,99996

0,2

0,1585

2,2

0,9722

4,2

0,999973

0,3

0,2358

2,3

0,9786

4,3

0,999983

0,4

0,3108

2,4

0,9836

4,4

0,999989

0,5

0,3829

2,5

0,9876

4,5

0,999993

0,6

0,4515

2,6

0,9907

4,6

0,999996

0,7

0,5161

2,7

0,9931

4,7

0,999997

0,8

0,5763

2,8

0,9949

4,8

0,9999984

0,9

0,6319

2,9

0,9963

4,9

0,9999990

1,0

0,6827

3,0

0,9973

5,0

0,9999994

1,1

0,7287

3,1

0,99806

5,1

0,9999997

1,2

0,7699

3,2

0,99863

5,2

0,99999980

1,3

0,8064

3,3

0,99903

5,3

0,99999988

1,4

0,8385

3,4

0,99933

5,4

0,99999993

1,5

0,8664

3,5

0,99953

5,5

0,99999996

1,6

0,8904

3,6

0,99968

5,6

0,999999979

1,7

0,9109

3,7

0,99978

5,7

0,999999988

1,8

0,9281

3,8

0,99986

5,8

0,999999993

1,9

0,9426

3,9

0,99990

5,9

0,999999996

2,0

0,9545

4,0

0,99994

6,0

0,999999998

Distribuio t de student
Distribuio t de student
Quanto mais vamos diminuindo o nmero de medies
estamos nos afastando de uma distribuio normal com o
desvio da populao () e a mdia da populao ().
Isto a amostra vai perdendo ou deixando de representar
com fidelidade as caractersticas da populao.
E como geralmente trabalhamos com um pequeno nmero
de medies ( 3 a 10), utilizamos a distribuio t para
amostras pequenas (em geral < 30 elementos).

Distribuio t de student
Distribuio normal

x
i
z

Distribuio t

s/

O valor de t tabelado e determinado atravs do conhecimento da


tamanho da amostra (n) e do nvel de confiana que se deseja
determinar o intervalo em que esta a mdia da populao ().

Distribuio t de student
O nvel utilizado na metrologia de 95 % de confiana.
Para identificar o valor t na tabela necessrio conhecer o grau de
liberdade (v) associado a um nvel de confiana.
O grau de liberdade de um conjunto de n repeties igual n-1.
( graus de liberdade ) = n - 1

Uma derivao matemtica de graus de liberdade esta alem do


escopo deste curso, mas o conceito bsico pode ser estabelecido:
Graus de liberdade uma medida de segurana envolvida quando
um desvio padro amostral usado para estimar o desvio padro
verdadeiro de um universo.

Distribuio t de student
95%

2,5%

95%

2,5%

12,706

17

2,110

4,303

18

2,101

3,182

19

2,093

2,776

20

2,086

2,571

21

2,080

2,447

22

2,074

2,365

23

2,069

2,306

24

2,064

2,262

25

2,060

10

2,228

26

2,056

11

2,201

27

2,052

12

2,179

28

2,048

13

2,160

29

2,045

14

2,145

30

2,042

15

2,131

60

2,000

16

2,120

120

1,980

Compatibilizao de Resultados
Regras de arredondamento
Condio

Procedimento

Exemplo
7,73 7,7

Menor que 5

O ultimo algarismo a ser mantido


permanece o mesmo

Maior que 5

O ultimo algarismo a ser mantido 7,76 7,8


acrescido de uma unidade

Igual a 5

O ltimo algarismo a ser mantido


7,75 7,8
permanece o mesmo ou acrescido 7,85 7,8
de uma unidade, de forma que
permanea sempre par

Se o 5 que o ltimo
algarismo mantido O ultimo algarismo a ser mantido
est seguido de
acrescido de uma unidade
algum algarismo
diferente de zero

7,4501
7,5
7,452
7,5

Compatibilizao de Resultados
Exerccio:
Arredondar os nmeros abaixo para 3 casas decimais:
a)

12,04580

__________________

b)

12,04520

__________________

c)

12,04550

__________________

d)

12,04450

__________________

e)

12,045501

__________________

f)

12,04451

__________________

Compatibilizao de Resultados
Regras de Compatibilizao de Valores
O RM deve ser expresso preferencialmente com apenas um
algarismo significativo na IM. Neste caso as regras de
compatibilizao 1 e 2 devem ser usadas:
Regra 1 : Arredondar a IM para apenas um algarismo
significativo, isto , com apenas um algarismo diferente de
zero.
Regra 2 : Arredondar o RB para mant-lo compatvel com a
IM de forma que ambos tenham o mesmo nmero de dgitos
decimais aps a vrgula.

Compatibilizao de Resultados
Exemplos:

58,33333 0,11

58,3 0,1

385,42333 0,21253

385,4 0,2

37,8359 1
95,94 0,0378

38 1
95,94 0,04

Compatibilizao de Resultados
A IM pode ser representada com dois dgitos significativos,

Exemplos:
3,1385 0,15

3,14 0,15

385,46333 0,24374

385,46 0,24

319,213 11

319 11

6,325 0,414

6,32 0,41

0,03425 0,0034

0,0342 0,0034

Compatibilizao de Resultados
Observaes Complementares
No se deve esquecer de apresentar a
unidade do RM, observando a grafia correta
do smbolo que representa a unidade,
conforme o Sistema Internacional de
Unidades.
conveniente manter um nmero razovel
de dgitos significativos nos clculos
intermedirios e efetuar o arredondamento
apenas no final.

Compatibilizao de Resultados
Exerccio:
Reescreva corretamente os resultados abaixo:
1 algarismo 2 algarismos
significativo significativos
a)

75,14 0,150

b)

25,154 0,2

c)

15,7654 0,525

d)

100,0005 0,001

e)

30,584 1

f)

45 0,1

Algarismos significativos
o dgito que considerado confivel como resultado
de clculo ou medio.
consistente com a preciso da medio.
o necessrio na notao cientfica.
Qualquer dgito entre 1 e 9 e todo 0 que no anteceda o
primeiro dgito e no suceda o ltimo dgito no zero.
804; 45,9; 980,03; 1001
Status do zero ambguo no incio e no fim do nmero
0,001 e 1 000 (?)

Notao cientfica
Eliminar ambigidades associadas posio
do zero no incio e no fim do nmero.
Escrito com um nmero entre 1 e 10, com a
quantidade de algarismos significativos vlidos
e seguido pela potncia de 10 aplicvel.
20 000 = 2 x 104

1 algarismo significativo

20 000 = 2,00 x 104


0,002 = 2 x 10-3
0,002 = 2,00 x 10-3

3 algarismos significativos
1 algarismo significativo
3 algarismos significativos

Algarismo significativo e escala


Quanto maior nmero de divises entre dgitos,
maior a quantidade de algarismos significativos

Algarismo significativo e escala

10

10

Leitura: 5,4

Leitura: 5,36

Algarismo significativo e dgitos


Nmero de dgitos e preciso
3 dgitos
0 a 9,99
0 a 10,0
3 dgitos
0 a 10,00
0 a 19,99
0 a 20,0
4 dgitos
0 a 9,999
0 a 10,00

9 9 9

1 9 9 9
9 9 9 9

0 a 20,00

Algarismos significativos
Na determinao do dimetro de um fio de ao empregou-se um micrmetro, a
incerteza da medio foi de 0,001 mm e foram efetuadas as seguintes
medidas:
a) 0,153 mm

b) 0,152 mm

c) 0,154 mm

0,153 0,152 0,154 0152 0,155

Temos ento : D 0,1532 mm

d) 0,152 mm

e) 0,155 mm

x 0,1532 mm
IM = 0,001 mm

Como a incerteza atingiu a terceira casa decimal, isto , a nossa dvida atinge
a terceira casa decimal, tornou-se o seguinte resultado como vlido:
D = (0,153 0,001) mm

Algarismos significativos

Os algarismos 1 e 5 so chamados de
algarismos corretos pois no foram afetados pela
incerteza. O algarismo 3 foi afetado pela
incerteza, por esta razo chamado de algarismo
duvidoso.
Os algarismos corretos e o algarismo duvidoso so
chamados algarismos significativos de uma medida.
No se deve manter, numa medida, mais de um
algarismo duvidoso, os outros no tem sentido e
devem ser eliminados.

Algarismos significativos
A posio da virgula no altera o nmero de algarismos
significativo de uma medida. Assim o dimetro do fio de ao
pode ser escrito:
D = (0,0153 0,0001) cm
D = (0,000153 0,000001) m
D = (153 1) m
Em todos os casos acima, temos trs algarismos significativos,
pois zero esquerda no significativo. O zero s significativo
quando figura entre algarismos diferentes de zero ou direita
de outros algarismos. Por exemplo, na medida 2500 m, os dois
zeros so significativos. Em 205 g, o zero significativo.