Você está na página 1de 24

ESTATÍSTICA

CAPÍTULO 1
REVISÃO(somatório e arredondamento)
VARIÁVEIS
POPULAÇÃO E AMOSTRAS
DISTRIBUIÇÃO DE FREQÜÊNCIAS
GRÁFICOS

RODRIGO NAPOLI
TELMA PICHETH

2010
REVISÃO DE MATEMÁTICA

ARREDONDAMENTO ESTATÍSTICO

Sendo a estatística uma ferramenta utilizada em análise e tomada de decisões, é


importante que se tomem os devidos cuidados com seus cálculos.
A precisão é um dos cuidados, por isso deve-se usar o arredondamento estatístico pois
ele permite as menores perdas (negativas ou positivas) ou o equilíbrio entre elas.

Três situações são possíveis:

1º) Quando o nº a ser arredondado for seguido de um número menor que 5,


o nº mantém-se igual.
Ex: 8,62 = 8,6
4,31 = 4,3

2º) Quando o nº a ser arredondado for seguido de um número maior que 5,


o nº é acrescido de uma unidade.
Ex: 3,79 = 3,8
6,69 = 6,7

3º) Quando o nº a ser arredondado for seguido de um número igual a 5, e nada mais,
o nº deverá ser par.
Se já é par, se mantém. Se for ímpar é acrescido de uma unidade
Ex: 4,65 = 4,6
4,75 = 4,8

4º) Quando o nº a ser arredondado for seguido de um número igual a 5, e este for seguido de
um ou mais números, o nº é acrescido de uma unidade.
Ex: 12,657 = 12,7
0,88501 = 0,89

1
SOMATÓRIOS

n
∑ xi = x1 + x2 + ... + xn
i =1

onde:

∑= Somatório (some as parcelas que estão à minha frente)


x = valor da variável
i = índice
xn = enésimo termo

obs.: Em estatística sempre que se usa somatório utilizam-se todo os valores da variável
(série), portanto o uso do índice é dispensável.

∑ x = x1 + x2 + ... + xn

∑ (x±y) = (x1±y1) + (x2±y2) + ... + (xn±yn) = (x1+x2+...+xn) ± (y1+y2+...+yn) = ∑(x) ± ∑(y)

∑ (xy) = (x1y1) + (x2y2) + ... + (xnyn)

∑(x)∑(y) = (x1+ x2+ ... +xn).(y1+y2+...+yn)

∑ ax = (ax1) + (ax2) + ... + (axn) = a (x1 + x2 + ... + xn) = a(∑ x)

∑ (x)2 = (x1) 2 + (x2) 2 + ... + (xn) 2

(∑ x)2 = (x1 + x2 + ... + xn) 2

2
ESTATÍSTICA
ESTATÍSTICA é o conjunto de métodos e processos quantitativos que serve para
estudar e medir fenômenos coletivos (Dugé de Bernonville).
A ESTATÍSTICA é coleta, apresentação, análise e interpretação de dados numéricos
(Jairo Simon da Fonseca).
Pode-se estudar a estatística com dois objetivos:
Reunir, sumariar, sistematizar dados numéricos de modo a torná-los rapidamente
compreensíveis; é a chamada ESTATÍSTICA DESCRITIVA, constituem-se de métodos
destinados a resumir o melhor possível uma massa de informações numéricas.
Com os dados sistematizados fazer análises e tirar conclusões, que é a INFERÊNCIA
ESTATÍSTICA, ou seja, apresenta os instrumentos que permitem extrapolar os resultados.
Por “extrapolação” entende-se: considerar que a informação obtida junto de um número
restrito de pessoas é a expressão de todas, e que permite, de fato, generalizar as conclusões
tiradas.

UTILIDADE DA ESTATÍSTICA
Sempre que estivermos trabalhando com medidas ou contagens precisaremos da
estatística descritiva.
A biologia, como toda ciência experimental, faz uso freqüente das técnicas estatísticas.
A genética, Ecologia, Nutrição humana, animal e vegetal, etc., apóiam-se essencialmente na
Estatística.
Para se testar novos métodos terapêuticos, ou de diagnóstico ou estabelecer a
superioridade de certa dieta, ou saber a probabilidade de certo fenômeno ocorrer será
sempre a Estatística que ajudará a resolver estas questões com a utilização de um
planejamento experimental adequado e aplicação da inferência estatística.

FASES DO TRABALHO ESTATÍSTICO


a) planejamento - uma vez definido o problema que se deseja resolver, deve-se
reduzi-lo a uma hipótese testável;
b) instrumento - construção do instrumento adequado;
c) coleta de dados
d) tabulação
e) análise dos dados
f) teste das hipóteses
g) interpretação e conclusão

3
VARIÁVEIS
Variável é a característica de interesse que é medida em cada elemento da amostra ou
população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis
podem ter valores numéricos ou não numéricos.
Variáveis podem ser classificadas da seguinte forma:
1.VARIÁVEIS QUANTITATIVAS: são as características que podem ser medidas em uma
escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido.
Podem ser contínuas ou discretas.
- Variáveis discretas: características mensuráveis que podem assumir apenas um número
finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são
o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número
de cigarros fumados por dia.
- Variáveis contínuas, características mensuráveis que assumem valores em uma
escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente
devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua),
tempo (relógio), pressão arterial, idade.
2.VARIÁVEIS QUALITATIVAS (ou categóricas): são as características que não possuem valores
quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma
classificação dos indivíduos.
Podem ser nominais ou ordinais.
- Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo,
cor dos olhos, fumante/não fumante, separar o lixo ou não, doente/sadio.
- Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos:
escolaridade (1o, 2o, 3o graus), mês de observação (janeiro, fevereiro,..., dezembro), estágio
da doença (inicial, intermediário, terminal).

As distinções são menos rígidas do que a descrição acima insinua. Uma variável
originalmente quantitativa pode ser coletada de forma qualitativa.
Por exemplo, a variável idade, medida em anos completos, é quantitativa (contínua); mas, se
for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, etc...) ou categorizada em criança
jovem, adulto e idoso, é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe,
uma variável quantitativa (contínua) se trabalhamos com o valor obtido na balança, mas
qualitativa (ordinal) se o classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-
pesado, etc.).
Outro ponto importante é que nem sempre uma variável representada por números é
quantitativa. O número do telefone de uma pessoa, o número da casa, o número de sua
identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 se
masculino e 2 se feminino, por exemplo. Isto não significa que a variável sexo passou a ser
quantitativa!

Mais sobre variáveis


http://www.forp.usp.br/restauradora/gmc/gmc_livro/gmc_livro_cap02.html

4
AMOSTRAGEM

POPULAÇÃO – qualquer conjunto de informações, que tenham entre si pelo menos


uma característica em comum.

AMOSTRA – parte da população que deve ser representativa, ou seja, conter


proporcionalmente tudo que a população contém, qualitativa e quantitativamente. Para que
se possa, de resultados obtidos na amostra, INFERIR para a população é necessário que a
amostra seja ALEATÓRIA, isto é, que todos os elementos da população tenham a mesma
chance de serem escolhidos.

Com uma amostra aleatória evitamos ser tendenciosos e inserir um viés na pesquisa.

TIPOS DE POPULAÇÃO:

• Finita: Consiste de um número finito ou fixo de elementos, medidas, observações.


Alunos do Camões, pessoas do Brasil, doentes em leitos hospitalares, etc

• Infinita: Pelo menos hipoteticamente, um número infinito de elementos. Nascimentos


em uma cidade, todas as pessoas que tem ou podem ter determinada doença

• Finita-infinita: No finito de elementos, porém inacessíveis. Portadores de HIV, etc.


também chamada de população hipotética

TIPOS DE ESTUDO:

• Censo: Estudo através do exame de todos os elementos da população.

• Amostragem: Estudo por meio do exame de uma amostra.

RAZÕES PARA O USO DE AMOSTRA:

- de ordem prática: populações muito grandes, inviabilidade econômica e de tempo.

- população hipotética: quando a população for composta de todos os pacientes que sofrem
(ou que virão a sofrer) determinada doença e recebam ou venham receber determinado
tratamento. Os doentes que forem estudados serão considerados uma amostra.

-melhor resultado, pois com um número menor de observações o estudo poderá ser mais
detalhado, mais aprofundado.

OBS – contudo o processo amostral traz a probabilidade de ERRO AMOSTRAL, cujo controle
será realizado através de métodos estatísticos adequados.

TIPOS DE AMOSTRAS MAIS USADAS

- Casual simples
- Casual sistemática
- Estratificada proporcional

5
AMOSTRA CASUAL SIMPLES

Casual é o mesmo que aleatório, portanto temos que garantir a todos os elementos da
população a mesma chance de ser escolhido, para tal deve haver um sorteio desde que seja
honesto.

Tomemos a tabela 2 (População de diâmetros a altura do peito de árvores em uma


floresta em regeneração) como população em estudo e que dela se precise tirar uma amostra
de tamanho 4 (n=4).

Uma das formas de se efetuar o sorteio é o uso da tabela 1 (TABELA DE NÚMEROS


CASUAIS ou aleatórios, ou randômicos). Esta é uma tabela gerada por computador onde os
nºs que aparecem, expressam um sorteio. Este sistema pode ser usado sempre que pudermos
ter uma listagem da população.

PROCEDIMENTO:
Sorteia-se ao acaso, os nºs a serem usado da tabela, utilizando-se um método definido à
priori, observa-se os nºs que se seguem anotando todos aqueles que servem aos nºs da
listagem da população. Os 4 primeiros números nessas condições são os números de ordem
da listagem que farão parte da amostra. Por exemplo, desejamos uma amostra com 4
elementos (n=4) da população de árvores da tabela 2 (N=240). Podemos definir a priori que o
método a ser utilizado será considerar da tabela 1 (números aleatórios) a partir da quarta
coluna, sendo lidos de cima para baixo desconsiderando os primeiros dígitos que não
servem. Desta forma teremos como sorteados os seguintes números:

57 – 155 – 178 - 69

A partir destes números temos as medidas dos diâmetros destas árvores (tabela 2) sendo
desta forma:
no árvore DAP (mm)
57 135
155 121
178 117
69 131

AMOSTRA CASUAL SISTEMÁTICA

Neste tipo de amostragem efetua-se o sorteio do 1º nº e daí por diante os próximos


elementos a entrarem para a amostra seguirão intervalos (h) constantes entre eles.

Suponha-se uma amostra de tamanho 6 (n=6) da população em estudo com 240


elementos (N=240). Dividindo-se os 240 elementos da população pelos 6 elementos, que
preciso para a amostra, obtenho o intervalo entre cada observação.

N = 240 n=6
h=N/n
= 240 / 6
= 40

6
Usando a tabela de nos casuais, determino o 1º elemento da amostra. Suponha-se ter
sido o nº 87. Somando-se a ele 40 (que representa o intervalo) temos 127 que será o 2º nº de
ordem da amostra.

Sucessivamente seguindo o mesmo processo teremos:


1º nº => 87
2º nº => 87 + 40 = 127
3º nº => 127 + 40 = 167
4º nº => 167 + 40 = 207
5º nº => 207 + 40 = 247 (como este nº supera N que vai até 240 retoma-se o início sorteado da
numeração e subtrai-se o h), portanto:
5º nº => 87 - 40 = 47
6º nº => 47 - 40 = 07

Com estes números de ordem procura-se seus respectivos valores na tabela 2.

087 => 131 mm 207 => 94 mm

127 => 126 mm 047 => 141 mm

167 => 117 mm 007 => 151 mm

AMOSTRA ESTRATIFICADA

Quando a população pode ser classificada, categorizada e estas categorias contribuem


para uma análise melhor da variável em estudo então é necessário fazer uma amostra
estratificada ou proporcional a estas categorias (sejam elas: sexo, nacionalidade, porte de uma
empresa (grande, médio, pequeno), classe social, religião).

Suponha-se que as árvores que fazem parte da tabela 2 estão assim classificados:

Classe A(árvores que estão no platô) _____> 120 elementos (001 a 120)

Classe B(árvores que estão na encosta) _____> 72 elementos (121 a 192)

Classe C(árvores que estão na planície) _____> 48 elementos (193 a 240)

Se quiséssemos uma amostra que representasse 10% da população ela teria que
possuir 24 elementos pois:

N= 240 n= 240 x 10 / 100 n= 24

Para obter-se uma amostra estratificada tem-se que retirar 10% de cada estrato da
população.

Classe A = 10% de 120 = 12 12


Classe B = 10% de 72 = 7,2 arredondando temos: 7 +
Classe C = 10% de 48 = 4,8 5
n= 24

7
Desta forma fica determinado quantos elementos de cada extrato devem ser retirados
da população. Então, usando a amostra casual simples ou sistemática, sorteiam-se os
elementos que farão parte da amostra.

Seleção de Amostras quando não se dispõe de Lista

Em muitas situações de amostragem é possível obter uma lista da população. Por


exemplo, para escolher uma amostra dos 2.000 calouros seria fácil obter tal lista. A lista
telefônica é muito usada para propósitos de amostragem. Usando-a, no entanto, devemos ter
em mente que iremos obter uma amostra casual das pessoas que vivem na área. Essas duas
populações diferem em muitos aspectos especialmente em status sócio-econômico.

Se não podemos ter uma lista da população, uma amostra casual pode tornar-se
extremamente difícil ou mesmo impossível de se obter. Basta pensar em como obter uma
amostra casual de casas de uma cidade ou de pacientes de uma determinada doença.
Não existe uma solução única, mas sempre se tenta introduzir alguma forma de
casualidade no procedimento. No caso de casas pode-se sortear pontos num mapa e tomar as
casas mais próximas daquele ponto. Isto só será um bom procedimento se as casas estiverem
uniformemente distribuídas no mapa.
Muitas vezes parece impossível alcançar a casualidade desejada, mas sempre há um
recurso. Um pesquisador que, para um estudo, não tenha possibilidade de sortear seus
entrevistados, poderá, para evitar qualquer viés no sorteio, considerar como sua amostra os
10 primeiras pessoas que passarem por determinado local onde o estudo está sendo
desenvolvido.

8
TABELA 1 - NÚMEROS CASUAIS

93107 94578 19715 67305 32299 40762 05757


51668 31650 41248 82291 69117 88226 34955
25981 63368 52903 14057 91788 09699 05220
82551 56291 58108 53563 82566 90065 88784
04977 86735 36841 83155 95223 84988 71414
79548 22703 59438 05178 73018 38097 34173
91852 61363 80525 34377 46083 58908 57901
14928 06836 44250 59532 56891 38621 46782
04049 10329 24939 32472 94414 66921 06318
66938 43267 75840 00599 41429 66894 41460
49381 89190 14137 16069 25755 64905 32926
43664 39225 90483 53885 84156 05380 51553
29676 67565 48075 43614 44910 88041 19160
55181 07671 57519 15350 08548 72432 41096
08680 96475 96805 84978 05917 80180 41839
68552 70566 39212 90732 29517 23226 43304
43281 25102 41704 59691 35303 36358 46118
31463 26275 46463 12031 05516 65116 13302
79279 57887 47879 93360 91749 54871 79200
97175 95538 53662 83728 17467 83916 31791
49758 43087 79255 60386 17154 28827 94470
22733 05043 63213 76933 64133 62152 73350
40545 40675 15258 86650 95758 92102 35672
68107 35191 94966 78744 38852 28176 41304
49088 08621 26693 19658 36883 04421 59234
86397 42755 33975 04648 22051 28600 93963
70700 18675 86113 90373 44313 88221 47352
72767 92550 78667 09372 85431 71534 85765
70606 25414 80535 20287 18978 29995 70949
38663 34820 15098 40032 06114 85798 19075
18239 36309 68511 45166 32681 91672 30585
44537 66886 51465 34540 54318 92469 38285
85046 76081 76106 38280 89299 32135 41510
96714 23897 26182 30653 65930 01115 85798
41219 91741 42648 41808 14687 61557 03647
23413 12002 55181 69248 12166 65352 70347
89366 57729 47009 80836 59586 59925 75693
02872 55506 01354 32136 78756 64713 19284
81720 54098 35822 09441 20066 93275 43728
23959 53127 93053 36216 20831 42280 60032

9
TABELA 2 – DAP (diâmetro na altura do peito) DE ARVORES DE UMA FLORESTA EM REGENERAÇÃO
DAP DAP DAP DAP DAP DAP
Nº (mm) Nº (mm) Nº (mm) Nº (mm) Nº (mm) Nº (mm)
A1 170 41 135 81 133 B121 114 161 122 201 92
2 186 42 135 82 133 122 114 162 125 202 94
3 169 43 135 83 147 123 114 163 125 203 94
4 161 44 135 84 133 124 114 164 125 204 94
5 161 45 149 85 133 125 114 165 123 205 90
6 167 46 134 86 133 126 126 166 123 206 109
7 151 47 141 87 132 127 126 167 117 207 94
8 161 48 133 88 132 128 127 168 119 208 104
9 167 49 149 89 131 129 117 169 119 209 103
10 147 50 147 90 132 130 131 170 119 210 108
11 156 51 169 91 132 131 131 171 114 211 108
12 147 52 131 92 131 132 130 172 114 212 108
13 141 53 147 93 131 133 126 173 125 213 98
14 169 54 156 94 139 134 127 174 124 214 108
15 154 55 136 95 139 135 122 175 119 215 109
16 137 56 135 96 139 136 122 176 118 216 109
17 151 57 135 97 132 137 122 177 119 217 108
18 154 58 135 98 165 138 130 178 117 218 112
19 154 59 135 99 141 139 130 179 115 219 112
20 146 60 150 100 140 140 129 180 125 220 112
21 145 61 150 101 140 141 127 181 125 221 103
22 141 62 150 102 140 142 114 182 125 222 103
23 136 63 138 103 132 143 114 183 125 223 100
24 150 64 137 104 132 144 114 184 125 224 98
25 150 65 137 105 132 145 114 185 124 225 94
26 136 66 137 106 132 146 114 186 123 226 109
27 186 67 137 107 132 147 114 187 123 227 109
28 147 68 137 108 132 148 114 188 120 228 106
29 150 69 131 109 132 149 117 189 120 229 104
30 150 70 131 110 131 150 117 190 120 230 104
31 186 71 131 111 132 151 117 191 126 231 104
32 146 72 131 112 132 152 122 192 140 232 98
33 154 73 156 113 138 153 121 C 193 94 233 98
34 147 74 135 114 140 154 121 194 94 234 110
35 169 75 134 115 140 155 121 195 113 235 112
36 150 76 134 116 139 156 120 196 113 236 112
37 136 77 141 117 131 157 114 197 106 237 110
38 136 78 141 118 131 158 119 198 106 238 113
39 135 79 133 119 147 159 127 199 106 239 112
40 135 80 133 120 131 160 126 200 106 240 112

10
DISTRIBUIÇÃO DE FREQÜÊNCIAS
Quando estamos trabalhando com um grande nº de dados, a estatística descritiva nos
oferece um recurso técnico para que possamos sistematizá-los, a fim de que teremos algumas
informações sobre estes dados. Uma destas técnicas é a Distribuição de Freqüências que
permite agrupar dados observando a freqüência que ocorre dentro de intervalos de medidas
(quando se tratar de variável contínua) ou a freqüência dentro de cada categoria (quando a
variável for discreta).

QUADROS DE DISTRIBUIÇÃO DE FREQÜÊNCIAS


Peso de freqüências Número de freqüências
porcos do (f) crias (f)
mato (kg)
45 ⏐—— 50 3 0 6
50 ⏐—— 55 8 1 15
55 ⏐—— 60 10 2 18
60 ⏐—— 65 5 3 9
∑ N = 26 ∑ n = 48

PROCEDIMENTOS PARA A CONSTRUÇÃO DA DISTRIBUIÇÃO DE FREQÜÊNCIAS


COM INTERVALOS DE CLASSE (variáveis contínuas):

Definindo número e intervalo de classes:


Inicialmente fazia-se a ordenação das observações de acordo com seu valor numérico
crescente, este procedimento gera o ROL da amostra (seqüência de valores ordenados
crescentemente). Com o advento dos computadores este procedimento é executado
automaticamente, desta forma nossas observações já serão apresentadas em um ROL.

A partir deste ponto é necessário determinar o número de classes e o intervalo destas classes.
Existe uma fórmula que calcula o número de classes apropriado para o tamanho da
população apresentada (Fórmula de Sturges: K = 1+3,32 log N) entretanto esta fórmula
apenas dá uma sugestão desta quantidade, para que não sejam nem muitas classes e nem
poucas. A definição final é subjetiva sendo do pesquisador a palavra final desta quantidade.

11
Exemplo – Idades de 50 alunos (já no ROL):

15 - 24 - 25 - 27 - 28 - 28 - 30 - 30 - 31 - 32
32 - 33 - 33 - 34 - 34 - 34 - 34 - 35 - 35 - 35
36 - 36 - 37 - 37 - 37 - 38 - 38 - 38 - 38 - 39
39 - 39 - 40 - 40 - 40 - 40 - 41 - 41 - 43 - 43
44 - 45 - 48 - 48 - 48 - 49 - 50 - 51 - 51 - 60

Foi definido que esta distribuição usará como intervalo de classe 8 anos. Desta forma inicia-
se a 1ª classe com o valor mais baixo da distribuição – Vmin (neste caso o no 15). A partir daí
soma-se a este número o valor do intervalo, sendo assim:

15 + 8 = 23 => 1ª classe 15 |—— 23


23 + 8 = 31 => 2ª classe 23 |—— 31
31 + 8 = 39 => 3ª classe 31 |—— 39
39 + 8 = 47 => 4ª classe 39 |—— 47
47 + 8 = 55 => 5ª classe 47 |—— 55
55 + 8 = 63 => 6ª classe 55 |—— 63

Cada classe possui limites superiores e inferiores, sendo que, para variáveis contínuas
agrupadas em classes, o limite superior de uma classe é igual ao limite inferior da classe
seguinte. Sendo assim no exemplo acima percebemos que o limite superior (Ls) da primeira
classe vale 23 anos, assim como o limite inferior (Li) da segunda classe também vale 23 anos.
O ponto médio (Pm) de uma classe é calculado através da fórmula: Pm = [(Li + Ls) /2] ,
sendo assim para a primeira classe o ponto médio será:
Pm1 = (Li1 + Ls1) / 2
Pm1 = (15 + 23) / 2
Pm1 = 38 / 2
Pm1 = 19 anos

Cálculos das freqüências:


FREQÜÊNCIA ABSOLUTA (f)
A freqüência absoluta é dada pela simples contagem da quantidade de elementos (valores)
em cada uma das classes apresentadas. Esta contagem é feita com base nos dados brutos e é
facilitada se já estiverem em um ROL.
15 ⎪— 23 => f = 1
23 ⎪— 31 => f = 7 15 - 24 - 25 - 27 - 28 - 28 - 30 - 30 - 31 - 32
31 |— 39 => f = 21 32 - 33 - 33 - 34 - 34 - 34 - 34 - 35 - 35 - 35
39 |— 47 => f = 13 36 - 36 - 37 - 37 - 37 - 38 - 38 - 38 - 38 - 39
39 - 39 - 40 - 40 - 40 - 40 - 41 - 41 - 43 - 43
47 |— 55 => f = 7
44 - 45 - 48 - 48 - 48 - 49 - 50 - 51 - 51 - 60
55 |— 63 => f = 1

12
FREQÜÊNCIA PERCENTUAL (f%)
É o percentual que cada freqüência absoluta representa em função do total de observações.
São úteis na comparação de 2 ou mais conjuntos de dados e nos permite uma maior
compreensão dos dados. (f% = f / n * 100)
15 ⎪—— 23 => f=1 / 50 * 100 => f% = 2%
23 ⎪—— 31 => f=7 /50 * 100 => f% = 14%
31 |—— 39 => f = 21 /50 * 100 => f% = 42%
39 |—— 47 => f = 13 /50 * 100 => f% = 26%
47 |—— 55 => f = 7 /50 * 100 => f% = 14%
55 ⎪—— 63 => f=1 /50 * 100 => f% = 2%

FREQÜÊNCIA ACUMULADA (fa)


Esta freqüência é calculada somando-se à freqüência absoluta da classe as freqüências
absolutas das classes anteriores:
15 ⎪—— 23 => f=1 +0 => fa = 1
23 ⎪—— 31 => f=7 +1 => fa = 8
31 |—— 39 => f = 21 +8 => fa = 29
39 |—— 47 => f = 13 +29 => fa = 42
47 |—— 55 => f = 7 +42 => fa = 49
55 ⎪—— 63 => f=1 +49 => fa = 50

FREQÜÊNCIA ACUMULADA PERCENTUAL (fa%)


É o percentual que cada freqüência acumulada representa em função do total de observações.

CONSTRUÇÃO DO QUADRO DE FREQÜÊNCIAS

Idades (anos) Freqüência Freqüência Freqüência Freqüência Acumulada


Absoluta Percentual Acumulada Percentual
(f) (f%) (fa) (fa%)
15⎪—— 23 1 2 1 2
23⎪—— 31 7 14 8 16
31⎪—— 39 21 42 29 58
39⎪—— 47 13 26 42 84
47⎪—— 55 7 14 49 98
55⎪—— 63 1 2 50 100
∑ 50 100 – –

NOMENCLATURA
Linf – limite inferior de classe – (são os números que iniciam cada classe)
Lsup – limite superior de classe – (são os números que encerram cada classe)
PM – ponto médio da classe – (Linf + Lsup) / 2

13
APRESENTAÇÃO DE DADOS EM GRÁFICOS
Muitas vezes os dados (ou resultados) podem ser melhor representados através de um
gráfico. Apesar de apresentar uma precisão menor da informação, esta é passada de uma
forma rápida, mostrando visualmente as características gerais de todo o conjunto de
informações.
Como norma geral todo gráfico deve apresentar necessariamente título e escala. A
escala deve sempre crescer da esquerda para a direita e de baixo para cima. E sempre que
necessário uma legenda explicativa deve ser apresentada (de preferência ao lado direito do
gráfico).
Os tipos de gráficos mais usados:
Para variáveis qualitativas ou quantitativas discretas (não agrupadas):
- Gráfico de barras
- Gráfico de setores (pizza)
Para variáveis quantitativas agrupadas:
- Histograma
- Polígono de freqüências
- Gráfico de setores (pizza)
GRÁFICO DE BARRAS: Usado para representar a freqüência de dados qualitativos ou
quantitativos discretos (não agrupados). Cada categoria possui uma barra e o tamanho desta
e dada pela sua freqüência. Os gráficos de barra geralmente são apresentados na
vertical(também chamados de colunas), isto é, no eixo das abscissas (horizontal) apresentam-
se as categorias e no eixo das ordenadas (vertical) as freqüências, entretanto, se houver
muitas categorias este gráfico pode ser invertido, sendo assim apresentado na horizontal.
Nos gráficos de barras é possível ainda apresentar de forma comparativa as freqüências de
diferentes subcategorias
Exemplos:

14
GRÁFICO DE SETORES (PIZZA): Este tipo de gráfico é usado para representar freqüências
percentuais ou relativas de variáveis qualitativas ou quantitativas. Eventualmente podemos
apresentar associados a este gráfico os valores absolutos, mas o gráfico trás a informação
relativa entre as diferentes categorias da variável. Sua construção vai ser dada levando-se em
conta que a circunferência total representa 100% (o todo), e cada setor terá seu tamanho
proporcional à freqüência percentual da categoria.

Exemplos:

HISTOGRAMA: É o tipo de gráfico usado para representar distribuições de freqüências


(absoluta, relativa ou percentual) para variáveis quantitativas agrupadas em classes
contínuas.
Para sua construção devemos marcar no eixo das abscissas (horizontal) do gráfico as
classes da distribuição e no eixo das ordenadas (vertical) as freqüências. O gráfico é
construído com barras (retângulos) com a largura das classes e com a altura de sua respectiva
freqüência. Note que o histograma é muito similar ao gráfico de barras, entretanto aqui entre
as barras das diferentes classes não há espaço algum, onde uma acaba a outra começa
(lembre-se que o limite superior de uma classe é igual ao limite inferior da classe seguinte).

Exemplo: Abaixo é apresentado o quadro com as freqüências absolutas e seu respectivo


histograma.

Idades (anos) f
45 |-- 53 3
53 |-- 61 11
61 |-- 69 12
69 |-- 77 9
77 |-- 85 4
85 |-- 93 1
Σ 40

15
POLÍGONO DE FREQUÊNCIAS: Esta é uma outra forma de representar as distribuições de
freqüências.
Sua construção é dada de forma similar ao histograma, mas agora usaremos o ponto
médio de cada classe para representar toda a classe. Em vez de usarmos barras usamos uma
linha para ligar os pontos médios da distribuição, sendo que é necessário marcar outras duas
classes (nas duas extremidades) com valores de freqüência igual a zero.

Exemplo: Usando-se os mesmos dados acima, podemos montar um polígono em cima do


histograma, marcando os pontos médios de cada classe e acrescentando as duas novas
classes nulas. Sendo que o gráfico final não deve conter as barras do histograma:

Exercício: Apresente os dados abaixo através de 2 gráficos. Os tipos de gráficos usados


deverão ser determinados com base no tipo de variável e informação relevante

Pesos (kg) f f%
45 ⏐—— 50 26 13%
50 ⏐—— 55 50 25 %
55 ⏐—— 60 100 50 %
60 ⏐—— 65 24 12 %
∑ 200 100 %

16
NOME: _________________________________________________________________

EXERCÍCIO 1- arredondamento
Arredondar para obter números com duas casas decimais

a) 10,348 =
e) 2,625 =
b) 4,112 =
f) 1,066 =
c) 5,875 =
g) 7,4255 =
d) 0,052 =

EXERCÍCIO 2 - somatório
Considerando-se:
X:{2; 2; 4; 8} Y: {5; 7; 8; 2}
calcule:

a) ∑ x =

b) ∑ y =

c) ∑ (x)2 =
∑ 4y

d) ∑ (2x + 3y) =

EXERCÍCIO 3 - variáveis
Cite 1 exemplo de variável discreta: _________________________________________________
Cite 1 exemplo de variável contínua: _________________________________________________
Cite 1 exemplo de variável nominal __________________________________________________
Cite 1 exemplo de variável ordinal ___________________________________________________

EXERCÍCIO 4 - amostragem

1 - Montar uma amostra casual simples com 6 elementos da tabela 2. Para tal considerar
como método definido a priori: a partir da 1ª coluna da tabela de nos casuais (tabela 1).

17
2 - Montar uma amostra casual sistemática de tamanho 8 (n=8) da tabela 2. Para tal
considerar como método definido a priori: a partir da 3ª coluna da tabela de nos casuais
(tabela 1).

3 – Calcular o tamanho das amostras em que se quer tirar 5% da população estratificada da


tabela 2.

4 - Construir uma amostra estratificada simples da população da tabela 2. Esta amostra deve
ser constituída por 5% da população, e o método usado será a partir da 5ª coluna (se acabar
esta coluna olhar a coluna da direita, e assim por diante).

2
EXERCÍCIO 5 - distribuição de frequências
1. Os resultados da análise da idade de tartarugas marinhas em uma amostra de 40
indivíduos estão descritos abaixo:

45 49 50 53 53 53 54 57 58 58
59 60 60 60 62 63 63 64 64 65
65 66 67 67 68 68 69 70 71 72
72 73 74 75 76 80 81 81 83 93

Determinar:
a) As distribuições de freqüências com intervalo de 8 anos.

3
2. Com os dados de anos decorridos da fragmentação em remanescentes de florestas fazer
uma distribuição de freqüências:

46 47 50 51 52 53 56 56 56 57
58 60 61 61 63 63 64 65 68 68
68 68 69 70 71 71 72 72 72 73
74 75 75 75 75 76 76 77 77 78
79 80 80 80 81 82 85 86 90 95
Sugestão: intervalo =10
Determinar:
a) Freqüência Absoluta;
b) Distribuição de freqüência acumulada;
c) Distribuição de freqüência percentual;
d) Distribuição de freqüência percentual acumulada;

4
3. As notas de 32 estudantes de uma turma estão descritas no quadro abaixo:

0 2 3,5 4,5 5 5,5 6 7


0 2 4 4,5 5 5,5 6,5 7
1 2,5 4 4,5 5 6 6,5 8
1,5 3,5 4 5 5 6 7 8,5

Construir a distribuição de freqüências (intervalo de classe de 1,5) e responder:


a) A maior e a menor nota ___________________
b) A amplitude total_________________________
c) Qual a porcentagem dos alunos que tiraram nota menor do que 3,0 _______________
d) Qual o ponto médio da 3ª classe ______________________
e) Qual a porcentagem dos alunos que tiraram nota entre 4,5 e 6 _______________
f) Qual o limite superior da 2ª classe ____________________
g) Qual o limite inferior da 4ª classe_________________________

5
4. Construa um quadro de distribuição de freqüências, com intervalo de 0,70 mg. Kg-1 da
seguinte amostra:
Teores totais de Cobalto em amostras de solo de diferentes áreas de duas toposseqüências da microbacia
de Caetés, Paty do Alferes, RJ. Média de três repetições (retirado de RAMALHO et al., Contaminhação
da microbacia de caetés com metais pesados pelo uso de agroquímicos. Pesq. Agropec. Brás. 35(7):
1289-1303, jul 2000.)

Medidas em mg.Kg-1
2,78 2,79 2,83 2,9 3,34 3,67
4,16 4,17 4,18 4,18 4,23 4,48
4,62 4,71 4,75 4,75 4,81 4,86
5,37 5,4 6,42 6,86 6,89 6,93

5. Sabendo que as idades de um grupo de tartarugas se distribuem de forma acumulada,


complete o quadro abaixo:

Freqüência Freqüência Freqüência Freqüência Acumulada


IDADE absoluta Percentual Acumulada Percentual
(anos) (f) (f%) (fa) (fa%)
0 |— 5
34
5 |— 10
57
10 |— 15
103
15 |— 25
203
25 |— 50
242
50 |— 100
250


-

6
6.Complete o quadro e responda:
peso de aves (g) f fa f%
200 |--- 250 2 __ __
250 |--- 300 __ 7 10
300 |--- 350 8 15 16
350 |--- 400 20 __ __
400 |--- 450 __ 45 20
450 |--- 500 5 50 10
___ ___

a) quantos elementos entraram nesta amostra:__________


b) qual o intervalo de classe:________________________
c) quantas aves pesam até 350g:____________________
d) quantas classes tem esta distribuição:________________
e) qual o percentual de aves que pesam entre 400 e 450g :_____________
f) limite superior da 2º classe : ___________________
g) qual a variável em estudo:_____________________
h) ela é discreta ou contínua : _____________________
i) qual é a unidade de medida da variável: _______________
j) limite inferior da 4ª classe :____________________
k) qual o percentual de aves que pesam entre 300 e 450g:_____________
l) qual a classe que tem maior freqüência : _____________________
m) o ponto médio da 3ª classe é: _________
n) qual o valor de n: ______________
o) o termo “n” significa: _________________________________________________________
p) nome das freqüências na ordem em que aparecem:_______________________________
____________________________________________________________________________

Você também pode gostar