Você está na página 1de 8

Universidade Nove de Julho Uninove

1 semestre de 2013 Curso: Engenharia Civil


Disciplina: Probabilidade e Estatstica Prof: Edson A. Cardoso
AULA 2
9. DADOS BRUTOS
Feita a coleta, os dados originais ainda no se encontram prontos para anlise, por no
estarem numericamente organizados. Por esta razo, costuma-se cham-los Dados Brutos.
Tomando-se, por exemplo, as alturas dos alunos em uma sala de aula e anotando-se os resultados
em uma lista na qual constem os nomes dos alunos em ordem alfabtica, ningum garantir que os
valores correspondentes s alturas observaro uma determinada ordem numrica, crescente ou
decrescente. Mais provavelmente, que os encontremos desorganizados. A lista de altura , por
exemplo, uma lista de dados brutos, que so aqueles valores a que se chegou pela simples coleta,
sem qualquer preocupao quanto a sua ordenao.
TABELA 2.1 Consumo mensal de energia eltrica, por 50 usurios particulares, em kW/h.
58 62 80 57 8 126 136 96 144 19
90 86 38 94 82 75 148 114 131 28
66 95 121 158 64 105 118 73 83 81
50 92 60 52 89 58 10 90 94 74
9 75 72 157 125 76 88 78 84 36
10. ROL
O rol uma lista em que os valores esto dispostos em uma determinada ordem, crescente
ou decrescente. Dispondo os dados de acordo com o consumo, obtm-se uma ordenao da Tabela
2.1.
Esta classificao dos dados proporciona algumas vantagens concretas com relao a sua
forma original. Em primeiro lugar, ela torna possvel visualizar, de forma bem ampla, as variaes de
consumo, uma vez que os valores extremos so percebidos de imediato. Em segundo lugar,
possvel observar-se uma tendncia de concentrao dos valores na faixa de 50-90 kW/h.
Apesar do Rol proporcionar ao analista mais informaes e com menos esforo de
concentrao que os dados brutos, ainda assim persiste o problema da anlise ter que se basear nas
50 observaes individuais. O problema se agravar quando o nmero de observaes for muito
grande.
TABELA 2.2 Consumo mensal de energia eltrica, por 50 usurios particulares, em kW/h.
3 58 75 89 118
2
8 58 76 90 121
10 60 78 90 125
19 62 80 92 126
28 64 81 94 131
36 66 82 94 136
38 72 83 95 144
11. TABELAS DE DISTRIBUIO DE FREQNCIAS TDF
Muitas vezes, o pesquisador coleta grande nmero de dados que, pela natureza do problema,
so iguais em muitas unidades.
A Tabela de Distribuio de Freqncias uma Srie Estatstica Especfica, onde os dados
encontram-se dispostos em classes e categorias juntamente com as freqncias correspondentes.
Desta forma, podemos dividir as distribuies de freqncias em dois tipos:
11.1. TIPO A: VARIVEL DISCRETA
Neste caso, a varivel assume valores inteiros.
Exemplos: nmero de nascimentos na cidade de so Paulo, nmero de alunos na classe, quantidade
de livros na biblioteca, peas defeituosas num lote recebido.
Exemplo:
Imagine que um chefe de seo coletou o nmero de faltas ao trabalho de seus 30 funcionrios,
durante o ms. Como deve apresentar esses dados em uma tabela?
Soluo:
Nmero de faltas ao trabalho de 30 funcionrios da seo, no ms de agosto.
Funcionrio
Nmero de
Faltas
Funcionrio
Nmero de
Faltas
Funcionrio
Nmero de
Faltas
1 0 11 1 21 0
2 1 12 0 22 2
3 0 13 2 23 1
4 1 14 1 24 0
5 0 15 0 25 1
6 1 16 0 26 4
7 0 17 1 27 0
8 0 18 0 28 0
9 0 19 0 29 1
10 0 20 0 30 0
As tabelas com nmeros repetidos so cansativas e no mostram como a varivel se distribui.
As tabelas com muitos nmeros iguais podem ser simplificadas. Basta fazer uma distribuio de
freqncias, que d a viso rpida do problema.
Os dados coletados podem ser, ento, dispostos em uma tabela que, de forma sinttica,
associa aos diferentes valores observados s respectivas freqncias (fi), entendida como o
nmero de vezes que um determinado valor foi observado.
Para distribuir a tabela de distribuio de freqncias:
3
1. Escreva os valores que podem ser assumidos pela varivel em ordem crescente.
2. Percorra a tabela contando o nmero de vezes que cada valor aparece.
3. Desenhe traos na frente de cada valor da varivel para representar o nmero de vezes que
cada valor se repete.
4. Conte o nmero de traos para obter a freqncia.
Soluo:
Escreva os valores que podem ser assumidos pela varivel em ordem crescente, isto :
0
1
2
3
4
Percorra a tabela contando o nmero de vezes que cada valor aparece. Desenhe traos na
frente de cada valor da varivel para representar o nmero de vezes que cada valor se repete; esses
dados so contados para dar a freqncia apresentada na tabela.
0 //// //// //// //// //
1 //// //// /
2 //
3
4 /
Distribuio de freqncias do nmero de faltas ao trabalho dos 30 funcionrios da seo, no ms de agosto.
Nmero Freqncia (fi) Fc Fd
0 18 18 30
1 9 27 12
2 2 29 3
3 0 29 1
4 1 30 1
Total 30 30 30
a) Freqncia Acumulada Crescente (Fc): a soma das freqncias do primeiro ao ltimo valor
(ordem crescente).
b) Freqncia Acumulada Decrescente (Fd): a soma das freqncias do ltimo ao primeiro valor
(ordem decrescente).
11.2. TIPO B: VARIVEL CONTNUA
Aqui a varivel assume valores em intervalos da reta real, no possvel enumerar todos os
valores. Geralmente esta varivel provm de medies.
Exemplos: pesos dos alunos de uma classe, lucro das empresas em determinado ramo, tempo de
durao de uma prova, nota de aproveitamento dos alunos.
4
s vezes, os dados tm preciso maior que o pesquisador pretende utilizar. Nestes casos,
razovel apresentar os dados por faixas (ou classes), de acordo com a preciso necessria. Por
exemplo, quando um pesquisador pergunta a idade, as pessoas informam a idade em anos
completos. Contudo, algumas pesquisas relatam apenas a distribuio das pessoas em algumas
faixas de idades.
Imagine que voc perguntou a idade e agora voc pretende distribuir os dados em faixas de
idades ou, mais tecnicamente, em classes. Voc quer, na verdade, fazer uma tabela de distribuio
de freqncias.
1. Estabelecer as classes;
2. Contar o nmero de pessoas que caem naquela faixa;
Os limites de classe recebem o nome tcnico de extremos. Em trabalhos acadmicos mais
usual a notao 5|10; 10| 15, que indica intervalos fechados esquerda, isto pertencem a
classe os valores iguais ao extremo inferior. Tambm significa intervalos abertos direita, isto , no
pertencem classe os valores iguais ao extremo superior. Os valores iguais a 10 esto includos na
segunda classe e no na primeira. Em alguns casos, a primeira classe pode incluir todos os
elementos menores que determinado valor. Exemplo, menos de 5 anos.
As tabelas de distribuio de freqncias tambm podem apresentar freqncias relativas e
total.
a) Freqncia Relativa (fr) de cada valor observado definida como o quociente de sua freqncia
e o nmero total de elementos observados, n
n
fi
fr
Para obter a freqncia relativa de determinado valor, divida a freqncia deste valor pela
soma das freqncias. Depois multiplique por 100, para ter o resultado em porcentagem.
b) Freqncia Relativa Acumulada Crescente (Frc): a soma das freqncias relativas, do
primeiro ao ltimo valor (ordem
crescente).

c) Freqncia Relativa Acumulada Decrescente (Frd): a soma das freqncias relativas, do
ltimo ao primeiro valor (ordem
decrescente).
Tabela 2.3: Alcolatras annimos segundo idade que tinham quando iniciaram o hbito de ingerir
bebidas alcolicas.
Classe Ponto mdio fi Fc Fd F Frc Frd
5| 10 7,5 2 2 100 2 2 100
10| 15 12,5 9 11 98 9 11 98
15| 20 17,5 34 45 89 34 45 89
5
20| 25 22,5 28 73 55 28 73 55
25| 30 27,5 12 85 27 12 85 27
30| 35 32,5 9 94 15 9 94 15
35| 40 37,5 2 96 6 2 96 6
40| 45 42,5 4 100 4 4 100 4
As tabelas de distribuio de freqncias devem ter de 5 a 20 classes.
Se o nmero de classes for pequeno, por exemplo 3, perde-se muita informao;
Se o nmero de classes for grande, por exemplo 30, tm-se pormenores desnecessrios.
No existe um nmero "certo" de classes em oposio a outros, que seriam "errados".
Para determinar o nmero de classes no caso de amostras relativamente pequenas, podem
ser usadas frmulas. Uma destas frmulas a seguinte:
n k
Outra frmula tambm utilizada para o clculo do nmero de intervalos de classes
Frmula de Sturges:
n log 3 , 3 1 k +
onde k o nmero de classes e n o nmero de dados. Ento, se voc tem uma tabela com 100
dados, pode organiz-los em uma tabela de distribuio de freqncias de com 10 n k classes
OBS: temos que trabalhar com nmeros de intervalos de classes inteiros, no existem 2,5
classes.
De qualquer forma, para organizar dados em uma tabela de distribuio de freqncias, o que
deve prevalecer o bom senso e no o resultado que voc obtm usando a frmula.
Deve-se obter a Amplitude total dos valores observados.
At = amplitude total = Maior valor do conjunto Menor valor do conjunto
A amplitude do intervalo de classe ( ou o tamanho do intervalo de classe) ser:
k
A
Intervalo
t
Classe de
Muitas vezes pode-se chegar a um valor no muito conveniente sob o aspecto de montagem
das classes. Neste caso, convm arredondar o nmero correspondente amplitude do intervalo de
classe mais adequado, que facilite os clculos (arredondamento arbitrrio)
6
Desta forma, obtm-se os intervalos de classe, partindo-se do menor valor dos dados e
somando-se o valor da amplitude do intervalo de classe. Em seguida, na outra linha, repete-se o
ltimo valor e soma-se novamente o intervalo de classe. Prossegue-se assim at que se formem os
nmeros de classes calculados.
Depois de construdas as classes, conte os valores que se situam em cada intervalo (que nos
dar a freqncia de cada classe).
EXERCCIOS
1. Complete os espaos em branco na distribuio de freqncias abaixo:
Classes f
i
f
r
f
r%
F
C
F
D
0 10 11 3
10 20 5
20 30 16
30 40 12
40 50 2
2. A tabela abaixo representa os salrios pagos a 100 funcionrios da empresa XXX.
N de salrios mnimos
xi
N de funcionrios fi
0 2
2 4
4 6
6 8
10
30
20
15
7
8 10
Total
5
80
Determinar, por meio da freqncia correspondente:
a) A porcentagem de funcionrios com salrio entre 6 e 8 salrios mnimos.
b) A porcentagem de funcionrios com salrio entre 6 e 10 salrios mnimos.
c) Quantos funcionrios ganham at 6 salrios mnimos, exclusive.
d) Quantos funcionrios ganham 2 salrios mnimos ou mais.
e) Quantos funcionrios ganham 6 salrios mnimos ou mais.
3. Os dados seguintes representam 30 observaes relativas ao ndice pluviomtrico em
determinados municpios do Estado:
Milmetros de Chuva
144 152 159 160 143 148
160 151 157 146 141 145
154 145 141 150 150 160
142 146 142 141 157 144
141 150 143 158 150 156
Determine:
a) o rol;
b) a distribuio de freqncias (com 5 classes, comeando em 141 e terminando em 161);
c) um histograma simples;
FRMULAS:
1. n = nmero de elementos da distribuio
2. k = nmero de linhas da tabela n k
3. AT = amplitude total AT = maior valor menor valor
4. i = intervalo de classe
k
AT
i
5. Mdia aritmtica:
n
x
x
i

8
6. Mdia ponderada (sem intervalo de classe):

n
i
i
i
i
i
w
F
f x
x
1
1
) . (
7. Mdia ponderada (com intervalo de classe):

n
i
i
i
i
i
w
F
f x
x
1
1
) . (
8. Mdia geomtrica:
n
n
g x x x x x .... . .
3 2 1

ou
1
]
1

+ + + +

n
x x x x
anti x
n
g
log ... log log log
log
3 2 1
9. Moda:
*
2 1
1 *
.h
D D
D
I Mo
+
+

Onde: l* = o limite inferior da classe modal
h* = a amplitude da classe modal
D1 = f* f anterior
D2 = f* f posterior
10. Mediana:
*
*
*
.
2
h
f
Fac
f
I Md
ant
i

,
_

11. Desvio em relao Mdia (d


i
):
x x d
i i

12. Desvio Mdio (D
M
):
n
f d
n
f x x
D
i i
i i
M

.
.
13. Desvio Padro:
1
) (
2

N
f x x
S
i i
ou
2
2

,
_



n
x
n
x
S
i i
ou
2
2
. .

,
_



n
fi x
n
fi x
S
i i

14. Coeficiente de Variao:
100 .
x
s
C
V

9