Escolar Documentos
Profissional Documentos
Cultura Documentos
Conteudo - Estatística Aplicada
Conteudo - Estatística Aplicada
8
Mdulo I - Unidade 2: Populao e Amostragem
POPULAO
Populao ou universo qualquer conjunto de informaes que
tenham, entre si, uma caracterstica comum.
As pessoas de uma comunidade pode ser estudadas sob diversos
ngulos. Por exemplo, podem ser classificadas quanto ao sexo (masculino e
feminino), quanto estatura (baixa, mdia, alta), quanto renda (pobres,
ricas), etc.
Sexo, estatura, renda so variveis, isto , so propriedades s quais
podemos associar conceitos ou nmeros e assim expressar, de certa
maneira, informaes sob a forma de medidas.
Por exemplo, observe a seguinte tabela 1:
Tabela 1: Nomes associados aos sexos.
Nome
Sexo
Paulo
Masculino
Silvana
Feminino
Jhon
Masculino
Helosa
Feminino
Sexo
Paulo
Silvana
Jhon
Helosa
entanto, para se
ter uma
boa
amostra,
esta
deve ser
10
Voltando ao exemplo da vila. Observe as tabelas 3 e 4:
Tabela 3: Quantidade de Pessoas da vila So Jos em relao idade em
anos.
Qtd. de
Idade (anos)
pessoas
30
10
40
18
40
26
40
32
50
40
60
52
70
65
70
Total
400
Idade (anos)
Qtd. de
pessoas
30
7,5
10
40
10,0
18
40
10,0
26
40
10,0
32
50
12,5
40
60
15,0
52
70
17,5
65
70
17,5
Total
400
100
11
A tabela 4 especifica que 50 pessoas da vila com idade de 32 anos
correspondem a 7,5% do total dos habitantes desta vila. Ento, para haver
representatividade, preciso garantir que, na amostra de 40 pessoas,
tambm haver 7,5% de pessoas idade igual a 32 anos, ou seja, 3 pessoas
com idade igual a 32 anos.
MTODOS DE AMOSTRAGEM
Sero abordados 3 tipos de amostragem, mas importante notar que estes
mtodos so vlidos somente se a amostra for puramente aleatria. Um bom
exemplo de uma amostra no aleatria a pesquisa para a eleio
presidencial estampada no Literary Digest de 1936. O Litery ouviu a opinio de
2 milhes de pessoas, o que uma cifra muito maior do que seria necessrio
para proporcionar um resultado preciso, se a amostra tivesse sido selecionada
aleatoriamente. A pesquisa predice uma fcil vitria para Alfred Landon,
quando, na realidade, Franklin D. Roosevelt venceu por uma ampla margem. O
problema que a amostra do Digest no foi aleatria. A revista enviou fichas a
pessoas cujos nomes foram tirados de listas telefnicas e outras fontes, mas as
pessoas que tinha telefone naquela poca no representavam adequadamente
a populao como um todo. Se uma amostra no extrada aleatoriamente,
no h maneira de prever o quanto se afastar da realidade.
conglomerados,
extraindo-se
uma
amostra
apenas
dos
12
da amostra vivam em conglomerados, possibilitando ao pesquisador entrevistar
apenas poucas pessoas.
AMOSTRAGEM ESTRATIFICADA
Outro
mtodo
de
amostragem
amostragem
AMOSTRAGEM DE CONVENINCIA
13
Tendo uma amostra representativa da populao inicial, os dados
obtidos podem dar origem a diversas relaes estatsticas, como por
exemplo, Mdia aritmtica, mediana, moda, varincia, desvio padro, etc.
que sero abordados no decorrer do curso.
14
Mdulo I Unidade 3: Coleta e Anlise de Dados
COLETA DE DADOS
O primeiro cuidado que se deve tomar ao se iniciar a fase de coleta de
dados quanto preparao das pessoas responsveis por ela.
importante a superviso para que no se coletem dados errados, ou
desnecessrios para a pesquisa realizada. Do mesmo modo, todos os dados
coletados devem estar sendo observados, pois, se necessrio, deve-se fazer a
reaplicao do instrumento.
J na pesquisa experimental, o essencial controlar as variveis
estranhas que possam estar interferindo, para que o ambiente se torne o mais
adequado possvel, manipular certas condies e observar os efeitos
produzidos. Contudo, para esse tipo de pesquisa, existe uma variedade de
recursos mecnicos, eltricos, eletrnicos que auxiliam nessa etapa da
pesquisa.
A coleta de dados pode ser feita por meio de: observaes, entrevistas
e histria de vida, pesquisa bibliogrfica, questionrios, observao
emprica, entre outros.
importante ressaltar que, existem diversos procedimentos utilizados
para este fim, no entanto, cabe ao pesquisador decidir qual o procedimento que
mais de adequada ao tipo de pesquisa realizada.
15
ANLISE DOS DADOS
Aps a coleta de dado, faz-se necessrio a anlise dos mesmos.
Entretanto, o planejamento anterior dessa anlise deve teve ter sido feita
antes mesmo da coleta dos dados. Este procedimento auxilia o pesquisador e
evita que sejam feitos trabalhos desnecessrios, alm do que, possibilita o
pesquisador prever os gastos necessrios para a realizao da pesquisa.
Para a pesquisa experimental, a anlise estatstica essencial e a
prtica mais adequada. No entanto, existem inmeros testes de significncia,
sendo necessrio que o pesquisador estude e ento escolha o teste que mais
se adequada pesquisa em questo.
importante observar que, os testes estatsticos constituem apenas
instrumentos que facilitam a interpretao dos resultados, sendo
necessrio uma fundamentao terica que permita ao pesquisador traar um
paralelo entre os resultados obtidos empiricamente e as teorias j existentes.
16
Mdulo I Unidade 4: Distribuio de Frequncia
Diagrama de colunas;
Diagrama de barras;
Histograma;
Polgono de freqncia
O ponto de partida desses quatro grficos sempre o mesmo: dois
17
REPRESENTAO TABULAR
Um outro tipo de representao que ajuda a compreender um
determinado fenmeno a representao tabular que compacta as
informaes utilizando intervalos de estudo que apresenta dados tabelados de
forma bem mais resumida.
Intervalos de classe: conjunto de observaes contidas entre dois
valores limites (limite inferior e limite superior).
Por exemplo
Dada a seqncia: 1, 2, 3, 4, 5, 6, 8. Temos:
Intervalo aberto: 1 8 = 2, 3, 4, 5, 6, 7 (no contm nem o valor
1,limite inferior, e nem o valor 8, limite superior);
Intervalo fechado: 1 8 = 1, 2, 3, 4, 5, 6, 7, 8 (contm tanto o valor
1,limite inferior, como o valor 8, limite superior);
Intervalo fechado esquerda: 1 8 = 1, 2, 3, 4, 5, 6, 7 (no contm o
valor 8, limite superior);
Intervalo fechado direita: 18 = 2, 3, 4, 5, 6, 7, 8 (no contm o valor
1,limite inferior,).
Os intervalos de classes devem ser mutuamente exclusivos (um
indivduo no pode ser classificado em dois intervalos ao mesmo tempo) e
exaustivos (nenhum indivduo pode ficar sem classificao).
Amplitude do intervalo (representado simbolicamente pela letra h): o
tamanho do intervalo de classe. A amplitude do intervalo e o nmero de
intervalos dependem basicamente do problema especfico.
E o ponto mdio do intervalo: calculado pela mdia entre os limites inferior
e superior.
Por exemplo
18
Preocupados com o acesso nos servios de sade e educao dos
moradores da cidade de Castanhal, localizada no Estado Par, seus
governantes fizeram um levantamento da renda mensal dos habitantes da
cidade que tem cerca de 150 mil habitantes, mas o estudo foi feito sobre uma
amostra de 340 pessoas. Tal estudo revelou que mais de 35% dos habitantes
(121 pessoas) da cidade de Castanhal vive com renda inferior a dois salrios
mnimos. Enquanto que uma minoria de 0,59% (2 pessoas) tem renda superior
a 8 salrios mnimos. O que evidencia a m distribuio de renda na cidade e,
conseqentemente, dificultada a o acesso a educao e a sade de qualidade.
Os dados obtidos foram:
Tabela 1: Renda mensal da populao da cidade de Castanhal.
Quantidade de
Renda mensal
Pessoas (agrupados
por classe)
De 0 a 1 salrio mnimo
53
15,59
De 1 a 2 salrios mnimos
121
35,59
De 2 a 3 salrios mnimos
67
19,71
De 3 a 4 salrios mnimos
15
4,42
De 4 a 5 salrios mnimos
30
8,82
De 5 a 6 salrios mnimos
19
5,59
De 6 a 7 salrios mnimos
20
5,88
De 7 a 8 salrios mnimos
13
3,82
De 8 a 9 salrios mnimos
0,58
Total
340
100
19
Tabela 2: Renda mensal da populao da cidade de Castanhal em intervalos
de classes.
X (salrios
mnimos)
ni
01
53
12
121
23
67
34
15
45
30
56
19
67
20
78
13
89
Total
340
FREQUNCIA ABSOLUTA
ni uma varivel que tambm pode ser chamada freqncia absoluta
(Fa) e o subscrito i representa a classe qual n se refere. Na tabela 2, por
exemplo, n1 = 53, n2 = 121,..., n9 = 2. Sendo que a soma de todos os nis deve
ser igual a amostra estudada, neste caso so 340 pessoas.
ni = 340 = Fa
Este exemplo tem uma amplitude (h) igual a 1, isto , igual a um salrio
mnimo, entretanto, h pode assumir qualquer tamanho depende apenas do
problema trabalhado. Veja o que ocorre com a tabela 2 se o intervalo for de
tamanho 2.
20
Tabela 3: Renda mensal da populao da cidade de Castanhal em intervalos
de classes com h = 2.
X (salrios mnimos)
ni
02
174
24
82
46
49
68
33
8 10
Total
340
Fa
2
21
1
2
3
4
5
6
7
3
5
8
8
3
2
1
Resposta
Para construo do diagrama de colunas desenhe o eixo cartesiano (x,
y). No eixo y represente a freqncia e no eixo x, as notas (ou classes de
notas). As colunas devem ficar separadas umas das outras. E para a
construo de um diagrama de barras faz-se o inverso: na vertical
representam-se as notas e na horizontal a Fa. Observe os grficos a e b:
a) Grfico de colunas
b) Grfico de barras
22
FREQUNCIA RELATIVA
Outro tipo de freqncia a freqncia relativa (fri): o valor das
razes entre as freqncias simples (fi) e a freqncia total (freqncia
absoluta, Fa).
fri = fi / Fa
Por exemplo
A freqncia relativa da terceira classe do exemplo anterior :
fri = 49/ 340 = 0,14
Evidentemente, a soma de todos fri s deve ser igual a 1 ou 100 %.
FREQUNCIA ACUMULADA
Tem-se ainda a freqncia acumulada (Fi): o total das freqncias de
todos os valores inferiores ao limite superior do intervalo de uma dada classe:
Fk = f1 + f2 + ... + fk ou Fk = fi (i = 1, 2, ..., k)
Por exemplo
Usando os dados da tabela 3, a freqncia acumulada das classes da
tabela 5, abaixo, :
Tabela 5: Freqncia acumulada (Fk) da renda mensal da populao da cidade
de Castanhal.
(Salrios mnimos)
ni = Fa
Fk
02
174
174
24
82
174 + 82 = 256
46
49
256 + 49 = 305
68
33
305 + = 338
8 10
338 + 2 = 340
Total
340
23
FREQUNCIA ACUMULADA RELATIVA
E por fim, tem-se a freqncia acumulada relativa (Fri): de uma classe
a freqncia acumulada da classe, dividida pela freqncia total da
distribuio:
Fri = Fi / Fa
Por exemplo
A freqncia acumulada relativa da quarta classe da tabela 4 :
Fri = 33/ 340 = 0,097
HISTOGRAMA
Um outro exemplo representando a distribuio de freqncia num
histograma. Em uma escola onde 500 alunos da classe A 2000 participam da
disciplina de Estatstica Bsica. Num teste de mltipla escolha contendo 100
questes que visava verificar a aprendizagem destes na referida disciplina,
obteve-se a seguinte freqncia de notas (correspondente quantidade de
acertos).
Tabela 6: Classe A-2000 com 500 alunos participantes da disciplina Estatstica
Bsica.
Intervalo de Classe
0 10
10 20
20 30
30 40
40 50
50 60
60 70
70 80
80 90
90 100
Total
Frequncia
5
15
20
45
100
130
100
60
15
10
500
24
Resposta
Para construo do histograma, desenhe o eixo cartesiano (x, y), onde
na abscissa sero representadas as classes, que neste caso tem uma
amplitude h igual a 10, e na ordenada, a freqncia dos dados. A rea de cada
retngulo do grfico representa a freqncia de cada nota.
POLGONO DE FREQNCIAS
Na construo de um polgono de freqncias primeiramente constri-se
um histograma; depois marcamos no telhado de cada coluna o ponto central
(ponto mdio) e unimos sequencialmente estes pontos. Devem existir dois
pontos na abscissa (eixo horizontal), um na lateral esquerda e outro na lateral
direita, ligado aos pontos das barras das extremidades.
Por exemplo
Represente em um polgono de freqncia os dados da tabela abaixo
referente ao tempo em minutos que uma amostra de 550 pessoas levou para
realizar uma prova de estatstica.
25
Tabela 7: Tempo em minutos gasto por 550 pessoas para realizar uma prova
de Estatstica.
Classes
(minutos)
Fa
24
70
46
160
68
210
8 10
80
10 12
20
Total
550
26
Mdulo 1 Unidade 5: Medidas de Tendncia Central
27
Tabela 1: Poduo mundial de caf no perodo de 1946-1989.
Produo (1.000 t)
Pases
produtores
1946
1955
1968
1989
Brasil
917
1.370
1.398
1.510
Colmbia
365
335
474
664
Indonsia
__
63
150
390
Mxico
57
88
180
312
__
85
258
265
Guatemala
70
66
108
220
Etipia
__
54
250
200
Uganda
26
63
170
188
El Salvador
62
75
138
97
Costa do
Marfim
Ma = 1398 + 474 + 150 + 180 + 258 + 108 + 250 + 170 + 138 / 9= 347,33. 1000
t = 347330 t
d)
Ma = 1510 + 664 + 390 + 312 + 265 + 220 + 200 + 188 + 97 / 9 = 427,33. 1000
t = 427330t.
28
Pelas mdias das produes mundiais de caf nos quatro anos estudos,
1989 foi o ano mais prspero.
MDIA PONDERADA
Ao calcularmos uma mdia, podemos cometer srio engano, se
ignorarmos o fato de que as grandezas em jogo no tm todas a mesma
importncia em relao ao fenmeno que est sendo estudado.
Consideremos, por exemplo, os seguintes dados sobre a percentagem de
casas de residncia ocupadas pelos proprietrios respectivos, nas vizinhanas
de trs cidades da Califrnia.
Tabela 2: Percentagem de casas de residncia ocupadas por proprietrios em
trs cidades do Estado do Par .
Porcentagem ocupada pelo proprietrio
Santarm
40,3
Salva-Terra
56,4
Castanhal
62,1
29
numericamente por um conjunto correspondente de nmeros w1, w2,...,wn,
dada por :
Maw = w.x/ w
Aqui, w.x a soma dos produtos de x pelo peso correspondente, e w
simplesmente a soma dos pesos. Note que quando os pesos so todos
iguais, a frmula da mdia ponderada se reduz a mdia aritmtica usual.
Por exemplo
Considerando que, nos bairros selecionados de Santarm, h 1135
unidades residenciais, 113 em Salva-Terra e 210 em Castanhal, utilize essa
cifras e as percentagens do texto acima para determinar a taxa de ocupao
pelos proprietrios nas trs cidades.
Resposta
Fazendo x1 = 40,3, x2 = 56,4, x3 = 62,1, w1 = 1135, w2 = 113, w3 =210 na
frmula de Maw, obtemos
Maw = (1135)(40,3) + (113)(56,4) + (210)(62,1) /(1135 + 113 + 210) =
44,7
Note que o valor obtido para Maw muito menor que Ma, 44,7
comparado com 52,9, e isto devido exclusivamente ao grande tamanho de
Santarm e sua baixa taxa de ocupao pelos proprietrios.
A MEDIANA (Md)
Para evitar a possibilidade de sermos enganados por valores muito
pequenos ou muito grandes, ocasionalmente descrevemos o meio ou o
centro de um conjunto de dados com outras medidas estatsticas que no a
mdia. Uma dessas medidas, a mediana de n valores, exige que os
ordenemos, e se defina como:
30
O valor do elemento do meio se n impar, ou a mdia dos dois
elementos do meio se n par.
Por exemplo
Em um ms recente, o Departamento de Caa e Pesca de um estado
reportou 53, 31, 67, 53 e 36 violaes em atividades de caa e pesca em cinco
regies diferentes. Ache a mediana do nmero de violaes para esses meses.
Resposta
A mediana no 67, o valor do meio, porque primeiro devemos ordenar
as cifras de acordo com o valor (da menor para o maior). Obtemos, ento: 31,
36, 53, 53 e 67; pode-se ver que a mediana 53.
Note neste exemplo que h dois 53s entre os dados, e que no nos
referimos especificamente a nenhum deles como a mediana a mediana um
nmero e no necessariamente uma medida ou observao.
POSIO MEDIANA
A mediana o valor do [(n + 1)/ 2]-simo elemento.
Quando n impar, [(n + 1)/ 2] um nmero inteiro e d a posio da mediana;
quando n par, [(n + 1)/ 2] est a meio caminho entre os dois inteiros e a
mediana a mdia dos valores dos elementos correspondentes.
Por exemplo
Determine a posio para (a) n = 15 e (b) n = 48.
Resposta
Com os dados ordenados (e contando a partir de qualquer extremidade)
a) [(n + 1)/ 2] = [(15 + 1)/ 2] = 8, e a mediana o valor do 8 elemento;
31
b) [(n + 1)/ 2] = [(48 + 1)/ 2] = 24,5, e assim a mediana a mdia dos
valores dos 24 e 25 elementos.
importante ter em mente que [(n + 1)/ 2] uma frmula da posio da
mediana, e no a mediana em si.
CLCULO
DA
MEDIANA
DE
UMA
DISTRIBUIO
COM
DADOS
AGRUPADOS
Quando queremos calcular a mediana de uma distribuio com dados
agrupados, precisamos juntar ao quadro de distribuio de freqncias a
coluna referente s freqncias acumuladas.
Por exemplo
A tabela 3 representa a distribuio das alturas de 200 jovens com
idades entre 15 e 20 anos.
Tabela 3: Distribuio das alturas de 200 jovens com idades entre 15 e 20
anos.
Altura em
Fa
Fa acum.
160 165
165 170
15
8 + 15 =23
170 175
10
23 + 10 = 33
175 180
40
33 + 40 = 73
180 185
90
73 + 90 = 163
185 190
20
163 + 20 = 183
190 195
15
183 + 15 = 198
195 200
198 + 2 = 200
cm
32
Resposta
Considerando a definio de mediana, podemos dizer que ela se
encontra na classe que contm o elemento 200/2 = 100; observando a coluna
de freqncias absolutas acumuladas, esse elemento se encontra na classe
correspondente a 180 185.
Esta classe chamada classe mediana.
Quando, alm de identificar a classe mediana, queremos determinar o
valor da mediana, devemos fazer uma interpolao:
163 73 = 90 ----------- 185 180 = 5
100 73 = 27 ----------- X
Isso nos eva a seguinte regra de trs simples e direta:
90 ---- 5
27 ---- X
X = (27 . 5)/ 90 = 135/ 90 = 1,5
O valor da mediana obtido da seguinte maneira:
Md = 180 + 1,5 = 181,5 cm
Desse resultado podemos dizer que 50 % dos jovens tm altura menor
que 181,5.
MODA
Outra medida por vezes utilizada para descrever o meio ou centro de
um conjunto de dados a moda, definida simplesmente como o valor que
ocorre com maior freqncia e mais de uma vez. Suas duas vantagens
principais so: no exige clculo, apenas uma contagem, e pode ser
determinada tambm para dados qualitativos ou nominais.
33
Por exemplo
Uma amostra de registro de uma inspetoria de veculos revela que 18
motoristas em certa faixa etria receberam 3, 2, 0, 0, 2, 3, 3, 1, 0, 1, 0, 3, 4, 0,
3, 2, 3 e 0 notificaes por infrao durante os trs ltimos anos. Determine a
moda.
Resposta
V-se que o nmero 4 ocorre uma vez, o nmero 1, duas vezes, o
nmero 2, trs vezes e os nmeros 0 e 3 ocorrem seis vezes cada um. H
ento duas modas, 0 e 3.
Tabela 4: Comparao entre Mdia, Mediana e moda.
Medida
Mdia
Definio
Centro da
distribuio de
freqncias.
Metade dos
Mediana valores so
maiores, metade
menores.
Moda
Valor mais
frequente
Vantagens
Desvantagens
1. no se presta a anlise
matemtica;
2. Pode no ter moda para
certos conjuntos de dados.
PERCENTIL
O percentil de ordem px100 (0<p<1), em um conjunto de dados de
tamanho n, o valor da varivel que ocupa a posio px(n+1) do conjunto de
dados ordenados. O percentil de ordem p (ou p-quantil) deixa px100% das
observaes abaixo dele na amostra ordenada.
34
Casos Particulares:
Percentil 50 = mediana, segundo quartil(md,Q2,q(0,5))
Percentil 25= primeiro quartil (Q1), q(0,25)
Percentil 75= terceiro quartil (Q3) , q(0,75)
Exemplo 1
Dada a sequncia 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6. E
sabendo que n = 11, encontre o Md, Q1 e Q3.
Resposta: Md=5,3 ; Q1=1,7 ; Q3=12,9
35
Mdulo I Unidade 6: Medidas de Disperso
As medidas de disperso so de grande importncia na interpretao de
dados. Resumidamente elas medem o quanto uma determinada varivel se
afasta de uma outra varivel. Tais medidas podem dizer em quanto um
determinado dado se afasta se afasta da idealidade, por exemplo. A seguir
sero abordadas de maneira abrangente o que vem a ser cada uma dessas
medidas.
DESVIO PADRO
Para definir desvio padro, sem dvida a medida de variao mais til e
mais largamente utilizada, notemos que a disperso de um conjunto de dados
pequena se os dados esto concentrados em torno da mdia, e grande
se os dados esto muito afastados da mdia. Poderia, assim, parecer
razovel medir a variao de um conjunto de dados em termos do desvio dos
valores respectivos a contar a mdia. Se um conjunto de nmeros x1, x2,..., xn,
constituindo uma amostra, tem mdia Ma, as diferenas x1 - Ma, x2 - Ma,..., xn
- Ma, so chamadas desvio a contar da mdia, o que sugere que podemos
tomar sua mdia como medida da variao da amostra. Infelizmente, no
podemos faz-lo. A menos que os xs sejam todos iguais, alguns desvios
serto positivos, outros sero negativos.
VARINCIA
O desvio mdio absoluto uma boa medida de disperso porque d a
distncia mdia de cada nmero em relao mdia. Todavia, para muitos
propsitos, mais conveniente elevar ao quadrado cada desvio e tomar a
mdia de todos esses quadrados. Essa grandeza chamada varincia. Esta
uma boa medida de disperso, mas tem uma desvantagem: difcil interpretar
o valor numrico da varincia.
36
Por exemplo
Uma varincia de 76,222 significa uma grande disperso ou uma
pequena disperso? Parte do problema se deve a questo das unidades: a
varincia medida em uma unidade que o quadrado da unidade de medida
x.
Por exemplo
Em seis domingos consecutivos, um motorista de caminho - reboque
recebeu 9, 7, 11, 10, 13 e 7 chamadas de servio. Calcule s.
Resposta
37
Calculando inicialmente a mdia, obtemos:
Ma = 9 + 7 + 11 + 10 + 13 + 7/ 6 = 9,5
e o clculo de (x - Ma)2 pode ser feito como na tabela 1:
Tabela 1: Distribuio das chamadas de servio recebidas por um motorista de
caminho reboque em seis domingos consecutivos.
x
X - Ma
(x - Ma)2
- 0,5
0,25
- 2,5
6,25
11
1,5
2,25
10
0,5
0,25
13
3,5
12,25
-2,5
6,25
Total
0,0
27,50
38
Por exemplo
Dada a seguinte sequncia 15,5,3,8,10,2,7,11,12, encontre d.
Resposta:
Q1 = (3 + 5)/2 = 4
d = Q3 - Q1 = 11,5 - 4 = 7,5
CV =
Por exemplo
S
100%
X
Mdia
Desvio
padro
CV
Altura
1,143 m
0,063 m
5,5 %
Peso
50 Kg
6 Kg
12 %
39
OUTRA FORMA DE ANALISAR A DISPERO
Nesta parte mostraremos outra forma de avaliar a forma de distribuio
de freqncia de uma varivel ou amostra.
Exemplo 1
A tabela seguinte registra as amostras A e B. Analisar as distribuies
de freqncias das amostras aplicando somente as medidas estatsticas
conhecidas.
A
100
120
120
120
120
120
120
140
140
140
140
160
160
160
B 88,6 108,5 108,6 128,5 128,6 128,5 128,6 148,6 148,5 148,6 148,6 148,6 148,6 168,6
Verifique tambm as medidas estatsticas registradas na tabela seguinte:
A
Ma
134,3
134,3
21,4
21,4
Md
130,0
138,6
Resposta
Verificamos pela segunda tabela que as amostras A e B tm medianas
diferentes, porm as mesmas medidas estatsticas Ma = 134,3 e s = 21,4.
Pelas medidas da mdia aritmtica (Ma) e do desvio padro (s),
aparentemente, se trata da mesma amostra; entretanto, essa igualdade no
sustentada pelas seguintes comparaes:
40
Mnimo
100
88,6
Q1
120
128,5
Md
130,0
138,6
Q3
140
148,6
Mximo
180
168,6
41
DADOS SUSPEITOS
So denominados dados suspeitos os valores extremos de uma amostra
completamente diferente da maioria; isto , valores mais do que extremos.
Como qualquer amostra pode conter dados suspeitos devemos estar
preparados para detect-los e analisar suas causas.
QUE
FAZER
SE
VALOR
SUSPEITO
FOI
CORRETAMENTE
AMOSTRADO E REGISTRADO?
42
Observao: Embora o IEQ ajude a retirar um valor da amostra por
consider-lo suspeito essa deciso deve ser acompanhada de um criterioso
julgamento.
Por exemplo
Dada a seguinte sequncia 15,5,3,8,10,2,7,11,12, verifique se h
possveis suspeitos.
Resposta
Temos da sequncia acima que Q1 = 4 e Q3 = 11,5.
E o IEQ igual:
IEQ = Q3 - Q1 = 11,5 4
IEQ = 7,5
Ento os intervalos so:
Q1 3xIEQ < X < Q1 1,5xIEQ
4 3x7,5 < X < 4 1,5x7,5
-18,5 < X < -7,25
43
Mdulo 1 Unidade 7: Boxplot
Boxplot
Ao utilizar apenas os valores extremos o intervalo no auxilia na
determinao da forma da distribuio de uma varivel ou amostra, informando
apenas sobre caudas da distribuio. Os trs resultados Q1, mediana, Q3
mostram a forma de distribuio de cinqenta por cento dos valores de uma
varivel ou amostra. Agrupando os cinco resultados da distribuio: mnimo,
Q1, mediana,Q3 e mximo conseguiremos obter mais informaes sobre a
forma da distribuio de freqncia de varivel.
O boxplot a forma grfica de se compor os cinco resultados mnimo,
Q1, mediana,Q3 e mximo e obter informaes diretas sobre a da distribuio
de freqncia da varivel. Resumidamente, representa os dados atravs de um
retngulo construdo com os quartis e fornece informao sobre valores
extremos. (veja o esquema embaixo):
Exemplo 1
44
1 passo
Calculando as medidas temos:
Mediana (Md ou Q2) = 5,6kg
1.quartil (Q1) = 3,3kg
3.quartil (Q3) = 6,25kg
2 passo
d=intervalo interquartil = Q3-Q1 =2,95kg
Logo as linhas auxiliares correspondem aos pontos:
Q1-1,5d = -1,25kg
Q3+1,5d = 10,675kg
3 passo
Construo do grfico.
45
Mdulo I Unidade 8: Anlise de Correlao - Regresso Linear Simples
ANLISE DE CORRELEO
Para entendermos melhor a anlise de regresso usaremos o seguinte
exemplo.
Por exemplo
O fenmeno da bioacumulao em peixes verificado quando a
concentrao do metal a ser analisado cresce proporcionalmente com a massa
do peixe. Anlises realizadas pelo Laboratrio de Qumica Analtica e
Ambiental da UFPA forneceram dados da concentrao de Al (Alumnio) em
peixes da espcie Cichla spp. (Tucunar), mostradas na tabela abaixo e a
massa de peixes grandes aps a biometria.
Admitamos que as respostas obtidas tenham sido:
Amostras de Tucunar
10
12
15
50
[Al] (mg/Kg): Yi
10
30
45
50
75
210
1 passo
Calcule X (varivel independente, que permite prever) e Y (varivel
dependente, que a resposta ou o predito) da seguinte maneira:
XM = Xi / n
XM = 50 anos / 5 = 10 g de Tucunar
YM = Yi / n
46
YM = 210 anos / 5 = 42 mg/Kg de Alumnio
Xi representa a massa de cada amostra de Tucunar.
Por exemplo: O sujeito C Xi=3 = X3 = 10 g
Massa (g)
Al (mg/Kg)
XiYi
Xi2
Yi2
10
50
25
100
30
240
64
900
10
45
450
100
2025
12
50
600
144
2500
15
75
1125
225
5625
50
210
2465
558
11150
3 passo
Clculo de rxy feito atravs da frmula:
rxy =
n X i Yi ( X i )( Yi )
[n X
2
i
][
( X i ) 2 n Yi 2 ( Yi ) 2
47
rxy =
rxy =
5( 2465) (50)(210)
12325 10500
=
(2790 2500)(55750 44100)
rxy = 0,99
4 passo
Interpretao do rxy.
0,6 r 1
0,3 r 0,6
48
TIPOS DE DIAGRAMAS
No h correlao
rxy = 0
Outros exemplos
Exemplo 1
Xi
0
1
2
3
4
Yi
0
2
4
6
8
1 passo
Calcular XiYi , Xi , Yi , Xi2 , Yi2 .
Xi
0
1
2
3
4
10
Yi
0
2
4
6
8
20
Xi2
0
1
4
9
16
30
Yi2
0
4
16
36
64
120
XiYi
0
2
8
18
32
60
49
2 passo
Calcular rxy
n X iYi ( X i )( Yi )
rxy =
rxy =
[n X i2 ( X i )2 ][. n Yi2 ( Yi )2 ]
5(60) (10)(20)
5(30) (10)2 5(120) (20)2
r xy = 1
3 passo
Interpretao do resultado.
Foi encontrado um rxy igual a 1, isto , a correlao entre os dados
perfeita.
Exemplo 2
Xi
4
3
5
5
4
3
2
3
2
4
Yi
5
3
5
4
4
6
5
6
5
2
1 passo
Calcular XiYi , Xi , Yi , Xi2 , Yi2 .
Xi
4
3
5
Yi
5
3
5
Xi2
4
4
9
Yi2
25
25
9
XiYi
10
10
9
50
5
4
3
2
3
2
4
35
4
4
6
5
6
5
2
45
9
9
16
16
16
25
25
133
36
36
25
16
4
25
16
217
18
18
20
16
8
25
20
154
2 passo
Calcular rxy
rxy =
rxy =
n X i Yi ( X i ) ( Yi )
[n X i2 ( X i ) 2 ][. n Yi2 ( Yi ) 2 ]
10(154) (35)(45)
[10(1330 (35) [12( 217) (45)
2
rxy 0,28
Interpretao
do
resultado:
Foi
encontrado
um
rxy de,
51
Mas, como os 5 sujeitos foram sorteados, os valores assim obtidos
poderiam, por puro acaso, estar simulando uma disposio retilnea, quando,
na verdade, essa configurao sequer existisse. O diagrama de disperso
seguinte mostra isso:
sendo, = 5%
t0 =
rxy n 2
1 (rxy ) 2
Onde:
to = t observado(calculado);
rxy = coeficiente de correlao linear (Pearson) obtido;
(n-2) = nmero de graus de liberdade.
52
1 passo
Para o exemplo da quantidade de Alumnio bioacumulado no Tucunar to :
t0 =
rxy n 2
1 (rxy ) 2
0,99 5 2
1 (0,99)
= 12,1382
2 passo
O valor de to deve ser comparado com o valor de t tabelado, chamado t
crtico (tc). E dessa comparao resultam as seguintes concluses
(mutuamente excludentes). Mas para isso devemos encontra o nmero de
graus de liberdade (GLIB).Observe o extrato da tabela de tc abaixo:
Graus de
liberdade (GLIB)
5%
1%
3,182
5,847
2,776
4,604
3,355
10
3,169
20
2,845
3 passo
Temos, ento: (to = 12,1382) > (tc = 3,182)
Possibilidades para anlise da significncia da amostra:
I- Se to > tc Rejeita a Ho ( e aceita Ha)
II- Se tc > to No rejeita a Ho (mas rejeita Ha)
53
Pelas possibilidades de anlise de significncia, Ho rejeitada, isto ,
com 95% de certeza, podemos concluir que a correlao na populao no
zero.
1 passo
Temos to para este exemplo igual a:
to =
=
rxy n 2
1 (rxy )
t0 =
0,28 10 2
1 (0,28)
0,28 8
0,825
1 0,0784
2 passo
Para o exemplo 2, n = 10, portanto o GLIB :
GLIB = n 2 = 10 2 = 8 graus de liberdade
Ento, o tc , para o nosso exemplo com 8 graus de liberdade, igual a
2,306.
3 passo
Lembrando que: Ho: xy = 0 No existe correlao linear;
Ha: xy 0 Existe correlao linear. ( = 5%)
54
COEFICIENTE DE DETERMINAO (CD) OU EXPLICAO (R2)
R2 =100(rxy )2
Ento, se rxy = 0,548
R 2 = 100 (0,548) 2
R 2 = 30.03
Isto significa que numa proporo de aproximadamente 30,03% das
variaes em Y podem ser explicadas pelas variaes em X.
RECOMENDAES IMPORTANTES
xi y i
r xy =
n SxS y
55
equao de regresso. Resumidamente, a regresso linear simples a
expresso matemtica que expressa as varveis que se correlacionam.
Na verdade, correlao e regresso so conceitos logicamente inseparveis.
Uma no pode existir sem a outra. Ento, neste caso, fala-se em regresso
linear simples:
^
S
rxy = x = K1 X i = K1Yi + ( X K1 Y )
S
y
_
_
^
Sy
rxy = = K 2 Yi = K 2 X i + (Y K 2 X )
Sx
Onde:
Sx = desvio padro de X
Sy = desvio padro de Y
^ = indica que se trata de uma valor terico prximo da
realidade.
56
Para entender melhor como utilizar essas equaes retornemos ao
exemplo onde X = massa (g) de Tucunar e Y = massa (mg/Kg)de Al
bioacumulados, e mostrar como se faz para interpolar aos pontos amostrais
uma reta.
1 passo
Sabendo que:
Sx = 3,4
XM = 10 g
Sy = 21,6
YM = 42 mg/Kg
rxy = 0,99
Calcule K1 e substitua os valores de K1, XM, YM na equao normal de
regresso dos X sobre os Y para encontra a equao de X chapu.
Sx
K1 = rxy =
S
y
3,4
= 0,99
0,16
21
,
6
X i = 0,16Y i+3,28
2 passo
Calcule K2 e substitua os valores de K2, XM, YM na equao normal de
regresso dos Y sobre os X para encontra a equao de Y chapu.
Sy
21,6
K 2 = rxy = 0,99
6,29
S
3
,
4
x
^
Y i = 6,29 X i 20,9
57
3 passo
Vamos supor agora que tivssemos perdido a notao do valor de X2
(recorra tabela no incio desta unidade). Como recuper-lo a partir de seu
parceiro Y2 = 30?
Resposta: Basta substitui o valor 30 (Y2) em Yi na frmula de X
chapu que encontramos no 1 passo. Se voc realizar os clculos encontrar
um valor de X chapu aproximadamente igual a 8,08. Observe que o valor
no 10. Isso acontece porque X chapu produz apenas uma estimativa
razovel que leva em conta o conjunto de dados da tabela.
4 passo
Sabemos que por 2 pontos passa uma e uma s reta. Ento, se
quisermos saber qual a reta de X que apresenta o melhor ajuste a todos os
pontos, basta calcular dois valores extremos, por exemplo: X chapu para Y1
= 10 e X chapu para Y5 = 75.
Fazendo os clculos temos que X chapu = 4,88 e Y chapu = 15,28. Tais
valores nos levam ao seguinte diagrama:
5 passo
O mesmo raciocnio vale para a equao de Y chapu.
OBSERVAO: As figuras ilustradas na unidade 7 foram adaptadas de: COSTA, S. F. Introduo Ilustrada
Estatstica. 3 Ed. So Paulo: Ed. HARBRA LTDA, 1998. p.
58
Mdulo I Unidade 9: Anlise Hierrquica de Agrupamentos
59
AGRUPAMENTO
1. CONEXO SIMPLES:
2. CONEXO COMPLETA
Exemplo 1
Em 2007, um grupo de qumicos da UFPA resolveu analisar as
concentraes, em ppb (partes por bilho), de 4 elementos (Cl, Ca, Mg e Na)
presentes em guas salobras de dois diferentes bairros da cidade. Para cada
bairro, coletou-se 4 amostras de gua em diferentes pontos. Considere a tabela
abaixo e verifique, atravs da anlise de agrupamento, se possvel distinguir
as localidades com base nos valores de concentraes dos elementos.
60
N
amostra
Amostras
Cl
Ca
Mg
Na
2067,1
2074,9
315,9
311,7
73,7
73,9
1857,7
1754,7
2134,7
2163,8
292,7
295,6
70,3
70,1
1504,7
1499,9
1 passo
Calcule as distncias da seguinte forma:
d12 = (2074,9 - 2067,1)2 + (311,7 315,9)2 + (73,9 73,7)2 + (1754,7 + 1857,7)2 =
103,38
d13 = (2134,7 2067.1)2 + (292,7 315,9)2 + (70,3 73,7)2 + (1504,7 + 1857,7)2 =
360,18
d14 = (2163,8 2067.1)2 + (295,6 315,9)2 + (70,1 73,7)2 + (1499,9+ 1857,7)2 =
371,21
d23 = (2134,7 2074,9)2 + (292,7 311,7)2 + (70,3 73,9)2 + (1504,7 + 1754,7)2 =
257,78
d24 = (2163,8 2074,9)2 + (295,6 311,7)2 + (70,1 73,9)2 + (1499,9 + 1754,7)2 =
270,37
d34 = (2163,8 2134,7)2 + (295,6 292,7)2 + (70,1 70,3)2 + (1499,9 + 1504,7)2 =
29,64
Se voc realizar os clculos ver que os valores de d11, d22, d33, d44 so
iguais zero.
2 passo
Organize os resultados das distncias encontradas em forma de uma matriz
de forma que d12 estar na primeira linha e segunda coluna, d24 estar na segunda
linha e quarta coluna, d44 (igual a zero) estar na quanta linha e quarta coluna e
assim sucessivamente. Ento temos:
61
257,78 270,37
29,64
3 passo
Com um grupo j formado (grupo 3,4 = 29,64) que a menor distncia
da matriz, atravs de clculos verifica-se a existncia de outros grupos que
podero ainda ser encontrados ou ainda se a pontos similares ao 1 j
formado.
Ento:
d1
3,4 = 0,5.d13 + 0,5.d14 0,5 d13 - d14
d1
3,4 = 0,5.360,18 + 0,5.371,21 - 0,5 360,18 371,21= 360,18
d2
3,4 = 0,5.d23 + 0,5.d24 0,5 d23 d24
d2
3,4 = 0,5.257,78 + 0,5.270,37 0,5 257,78 270,37= 257,78
Agora com os novos valores de distncias, vamos construir uma
segunda matriz distncia:
1
2
3,4
103,38 360,18
0
3,4
257,78
0
4 passo:
Com outro grupo j formado (1 e 2), busca-se encontrar pontos similares
ou distintos.
62
Calcula-se a distncia entre os grupos formados e os que ainda podero
ser encontrados. E com isso efetua-se o clculo da distncia, usando agora os
pontos (3 e 4 com 1 e 2 j formados). Pela frmula de conexo simples temos:
d1,2
3,4 = 0,5.d13,4 + 0,5.d23,4 0,5 d13,4 d23,4
d1,2
3,4 = 0,5.360,18 + 0,5.257,78 0,5360,18 257,78= 257,78
As distncias d1,2
1,2; d3,4
3,4 so iguais a zero. Desta forma temos a
matriz:
1,2
1,2
3,4
257,78
3,4
5 passo:
Realizado os clculos das distncias para formao de grupos e a
similaridade entre esses grupos formados possvel um grfico para melhor
visualizar as informaes. Fazendo uso do programa MINITAB, utilizaram-se
grficos em Dendrograma.
Para
construo
do
dendograma
necessrio
similaridade.
S1,2 = 60%
S3,4 = 88%
S(1,2),(3,4) = 0%
Utilizando o valor da distncia mxima padronizada temos que:
dmx = d(1,2),(3,4) = 257.78
A dmx no padronizada seria igual a 360,18.
clculo
da
63
6 passo
Anlise do dendograma obtido com os dados de distncia.
Dendrograma 1 - distncia
Nazar
Terra Firme
Nazar
Terra Firme
64
Concluses: possvel distinguir os bairros Terra Firme e Nazar com base
nas concentraes de Cl, Ca, Mg e Na. As duas localidades esto
notavelmente separadas dendogramas. As amostras 1 e 2 formam um grupo e
as amostras 3 e 4 tambm se agrupam, e, posteriormente esses dois grupos
so agrupados.
65
EXERCCIOS DE APLICAO
CINZAS %
88,68
2,16
88,57
1,74
88,70
1,76
87,18
1,91
88,49
1,50
89,14
2,13
Fw-Maturos
48,4
45,0
70,0
56,7
40,4
65,6
53,6
127,7
60,0
74,4
63,5
63,0
64,2
153,4
72,7
44,2
62,6
74,9
59,8
105,4
66
3- Na tabela abaixo apresentado os valores referentes as diferenas de
calos e regenerao de plantas entre cinco tipos de trigo de fontes de
embries maduros e imaturos. Compare usando medidas estatsticas
(mdias, mediana, desvio padro e coeficiente de variao) os valores
apresentados dos embries maduros e imaturos.
Embries
Imaturos
Maduros
38,1
51,5
34,3
50,7
52,5
82,0
30,0
58,9
60,3
56,7
Amostras
pH
Acidez
Umidade
HMF
Abelhas
livre
1
3,57
69,95
10,63
16,7
Com ferro
3,84
18,52
18,14
10,36
Com ferro
3,84
19,52
16,26
10,75
Com ferro
4,20
23,00
20,00
8,10
Com ferro
3,54
33,47
22,80
21,93
Sem ferro
4,20
15,22
22,47
19,63
Sem ferro
3,85
52,56
27,37
18,27
Sem ferro
3,40
15,90
28,00
0,00
Sem ferro
SOUZA (2008)
67
(Tucunar), capturados na represa de Tucuru, no projeto desenvolvido
pelo laboratrio de Qumica Analtica e Ambiental da UFPA em parceria
com a ELETRONORTE, so encontrados na tabela abaixo:
Pb
Zn
Cd
Tamanho do peixe
0,05
20,43
1,41
Mdio
0,09
20,19
1,31
Mdio
0,19
21,77
0,74
Mdio
0,05
23,36
0,83
Mdio
0,00
15,88
0,62
Grande
0,54
17,94
0,94
Grande
0,01
13,35
0,33
Grande
0,06
22,21
0,70
Grande
Sementes
Comp. (cm)
Larg. (cm)
Espes. (cm)
2,9
2,2
1,1
2,4
1,9
1,2
2,7
2,2
1,1
2,6
2,0
0,9
2,1
1,8
1,1
2,2
1,6
1,5
68
Exerccio de Regresso Linear
Amostra
Ca (mg/l)
Absorvncia
0,6
0,043
0,7
0,079
1,00
0,133
1,6
0,142
0,78
0,081
Amostra
Ca (mg/ml)
Magnsio (mg/ml)
0,048
0,13
0,018
0,08
0,11
0,09
0,21
0,19
0,13
0,21
69
tipos de tratamento: mtodos fsicos (R1) e de secagem ao calor do fogo (R2).
Calcule:
a) O coeficiente de correlao (r).
b) A significncia de r (teste t0).
c) Verificar se o modelo ajustvel (R2).
N experimental
R1
R2
4,7
4,9
4,5
4,6
5,8
6,1
2,8
2,6
146,61
62,79
191,88
64,81
111,84
87,74
177,81
74,08
303,43
74,71
309,31
49,64
70
espectrofotometria de UV_vsivel. Ajuste um modelo linear a estes dados.
Calcule os valores de R2 e to. Sendo que o valor de tc=3,182.
cido tnico
(mg/mL)
Absorvncia
0,50
0,063
0,75
0,074
0,80
0,085
0,90
0,099
1,25
0,109
1,30
0,112
[Al](mg/Kg)
2500
23,69
3500
75,38
2750
19,14
2000
13,81
71
Exerccio de Cluster
1)
FARNHAM
ET
AL,
(2000)
obtiveram
dados
hidrogeoqumicos
Li
Ti
Cr
Mn
Ni
Ge
9,3
1,11
1,30
2,42
1,15
1,12
1,32
10,3
1,27
1,96
2,67
1,09
1,18
1,26
10,4
1,24
1,07
5,67
1,09
1,18
1,27
16,6
1,07
1,67
2,80
1,34
2,20
1,55
17,9
1,04
1,16
2,37
1,49
2,39
2,36
2)
Amostra
Variedade
Variedade
Variedade
Variedade
Variedade
10
17
29
12
14
12
35
20
15
37
14
26
11
19
34
72
compostos, Acetaldeido e compostos Fenlicos. Com bases na tabela abaixo
compare as concentraes desses compostos atravs de Boxplots.
Barris de Carvalho
Concentrao
Tempo (meses)
Compostos Fenlicos
Acetaldeido
5,63
7,63
31,01
7,97
12
35,90
8,41
18
38,18
8,86
24
44,01
8,92
Barris de Vidro
Concentrao
Tempo (meses)
Compostos Fenlicos
Acetaldeido
5,63
7,63
3,70
8,00
12
3,09
8,13
18
3,30
8,12
24
3,45
8,14
73
Mdulo I - Apndice 1: Grficos e Tabelas
GRFICOS E TABELAS
TABELAS
Passos para Construo de Tabelas
ordene-as
segundo
os
valores,
crescente
ou
decrescentemente;
7. Tente trocar de orientao (linhas por colunas) para melhorar a
apresentao. mais fcil fazer comparaes ao longo das linhas do
que das colunas;
74
8. Altere a disposio e o espaamento das linhas e colunas para facilitar a
leitura. Inclua um maior espaamento a cada grupo de linhas e/ou
colunas em tabelas muito extensas.
9. No analise a tabela descrevendo-a, mas sim comentando as principais
tendncias sugeridas pelos dados.
Por exemplo:
Tabela 1: Concentrao Ferro (g/mL) presente em amostras do Rio
Tocantins em mL.
[Fe] (g/mL)
Amostras (mL)
30
25,00
10
40
33,33
18
50
41,67
Total
120
100
1.
2.
75
3.
4.
5.
76
GRFICOS
77
adequado quando as variveis forem qualitativas ou quantitativas
discretas.
50
100
150
200
Amostras
78
descreve-se o valor observado para a varivel e no a freqncia. A varivel
deve ser quantitativa.
Qtd. de Cloro (%) em amostras de gua do Rio
Tocantins
70
60
Amostra 1
50
Amostra 2
40
Amostra 3
30
20
10
0
1
Local de coleta
79
1.
80
parmetros
Unidades dos parmetros
13
81
2.
3.
82
Para as interpretaes do grfico verifique quais parmetros esto de
acordo com o observado pelos dados pr estabelecidos, neste exemplo:
CONAMA. E atribua interpretaes as possveis variaes existentes entre os
dados coletados e os padronizados. Lembre-se ainda que os dados
representados em um grfico podem ter cunho comparativo, como foi
construdo acima, verificar o crescimento ou decaimento de uma determinada
varivel em relao a outra, sendo que esta variao pode ser linear,
exponencial, logaritmo, etc.
83
RESPOSTAS DOS EXERXCIOS DE APLICAO
Estatstica Descritiva
1.
Umidade
Mdia= 88,46
Desvio Padro= 0,67
CV= 0,75
Q1(25%)=88,49
Q2(50%)= 88,63
Q3(75%)=88,70
d = Q3-Q1 = 0,21
Mx: Q3+1,5d= 89,015
Mn: Q1- 1,5d = 88,18
Cinzas
Mdia= 1,87
Desvio Padro= 0,25
CV= 13,87
Q1(25%)=1,74
Q2(50%)=1,84
Q3(75%)=2,13
d = Q3-Q1 = 0,39
Mx: Q3+1,5d=2,72
Mn: Q1- 1,5d = 1,16
2.
Fw Imaturos
Fw Maturos
Mdia= 57,02
Desvio Padro=9,97
CV= 17,48
Q1(25%)=48,4
Q2(50%)=59,90
Q3(75%)=63,5
d = Q3-Q1 = 15,1
Mx: Q3+1,5d= 86,15
Mn: Q1- 1,5d = 25,73
Mdia= 83,53
Desvio Padro=34,42
CV= 41,20
Q1(25%)=63
Q2(50%)=72,2
Q3(75%)=105,4
d = Q3-Q1 =42,4
Mx: Q3+1,5d=169
Mn: Q1- 1,5d = -0,6
3.
Imaturos
Mdia= 43,04
Desvio Padro=12,83
CV= 29,80
Q1(25%)=34,3
Q2(50%)=38,1
Q3(75%)=52,5
d = Q3-Q1 = 18,2
Mximo= 79,8
Mnimo = 7,1
Maduros
Mdia= 59,96
Desvio Padro=12,79
CV= 21,34
Q1(25%)=51,5
Q2(50%)=56,70
Q3(75%)=58,9
d = Q3-Q1 =7,4
Mximo=70
Mnimo= 40,4
84
4.
Para abelhas com ferro
X
Md
X
Md
pH
3,57
3,84
3,84
4,20
3,86
3,84
Acidez livre
18,52
19,52
23,00
69,95
32,75
21,26
Umidade
10,63
16,26
18,14
20,00
16,26
17,20
HMF
8,10
10,36
10,75
16,47
11,42
10,56
Umidade
22,47
22,80
27,37
28,00
25,16
25,09
HMF
0,00
18,27
19,63
21,93
14,96
18,95
Parmetros
Q1(25%)
Q2(50%)
Q3(75%)
d = Q3-Q1
Mn: Q1- 1,5d
Mx:Q3+1,5d
pH
3,71
3,84
4,02
0,31
3,25
4,49
Acidez
19,02
21,26
46,48
27,46
-22,17
87,67
Umidade
13,45
17,20
19,07
5,62
5,02
27,50
HMF
9,14
10,56
13,61
4,38
2,66
20,18
Umidade
22,64
25,09
27,69
5,05
15,07
35,26
HMF
9,13
18,95
20,78
11,65
-8,35
38,26
pH
3,47
3,70
4,03
0,56
2,63
4,87
Acidez
9,35
15,31
33,98
24,63
-27,60
70,93
85
5.
Para peixes mdios
Pb
0,05
0,05
0,09
0,19
Zn
20,19
20,43
21,77
23,36
Cd
0,54
0,83
1,31
1,41
Zn
13,35
15,88
17,94
22,21
Cd
0,33
0,62
0,70
0,94
Q1(25%)=0,05
Q2(50%)=0,07
Q3(75%)=0,14
d = Q3-Q1 = 0,09
Mx: Q3+1,5d= 0,28
Mn: Q1- 1,5d = -0,085
Q1(25%)=0,005
Q2(50%)=0,035
Q3(75%)=0,3
d = Q3-Q1 = 0,295
Mx: Q3+1,5d=0,74
Mn: Q1- 1,5d = -0,44
86
6.
Comprimento
Largura
Espessura
Mdia
2,48
1,95
1,15
D. P.
0,31
0,23
0,19
CV
12,5
11,8
16,52
Mnimo
2,1
1,6
0,9
Q1
2,2
1,9
1,1
Q2
2,5
1,95
1,1
Q3
2,7
2,2
1,2
Mximo
2,9
2,2
1,5
0,5
0,3
0,1
Regresso Linear
1. rxy = 0,866 ; to = 2,999648 ; CD = R2 = 74,9956%
Equao da reta : Yi = 0,08947Xi + 0,01186.
2. rxy = 0,717 ; to = 1,781564 ; CD = R2 = 51,4089%
Equao da reta : Yi = 0,5579Xi + 0,08242.
3. rxy = 1 ; to = 0 ; CD = R2 = 100%
Equao da reta : Yi = 1,171Xi - 0,6626.
4. rxy = - 0,551 ; to = - 1,32054 ; CD = R2 = 30,3601%
Equao da reta : Yi = - 0,08714Xi + 86,98.
5. rxy = 0,907 ; to = 4,307452 ; CD = R2 = 82,2649%
Equao da reta : Yi = 0,06151Xi - 0,03395.
6. rxy = 0,962; to = 4,982517 ; CD = R2 = 92,5444%
Equao da reta : Yi = 0,04139Xi 78,24.
87
Exerccio Cluster
1.
d1,23 = 3,13
d1,2 4 = 6,40
d1,2 5 = 7,83
d 4,5 ,3 = 8,36
Distncia Mxima
88
2.
a) Clculo das distncias
d 1,2= 4,98
d 1,3=13,60
d 1,4= 5,19
d 1,5= 9,11
d 2,3= 8,30
d 2,4= 12,44
d 2,5=11,87
d 3,4=17,08
d 3,5= 16,12
d 4,5= 12,24
b) Clculo da Conexo Simples
d2,31 = 13,60
d 2,34 = 17,08
d 2,35 = 16,10
d 4,1 ,5 = 9,11
Distncia Mxima
89
BIBLIOGRAFIA