Você está na página 1de 9

UNIP – Tatupé – Estatística - 2007 1

Prof. Ecila Alves de Oliveira

Estatística – 2º/3º Semestre


Gestão em Comércio Exterior e Sistemas de Informção

Introdução – Conceitos Básicos

A Estatística é a parte da Matemática que trata dos métodos científicos para coleta, organização,
resumo, apresentação e análise de dados.

Divide-se em duas:

Estatística Descritiva : que apenas descreve e analisa um conjunto de dados, sem tirar conclusões;

Estatística Indutiva ou Inferência : que trata das inferências e conclusões, isto é, a partir de dados são
tiradas conclusões.

Variáveis Contínuas : são os valores “quebrados”, medição de altura.

Variáveis Discretas : são os valores inteiros, os números dos dados.

Séries Estatísticas

 Uma série estatística define-se como toda e qualquer coleção de dados estatísticos referidos a uma
mesma ordem de classificação: em geral quantitativa.
 Em termos gerais, a palavra série é usada normalmente para designar um conjunto de dados
dispostos de acordo com um caráter variável.
 As tabelas e gráficos servem para apresentar séries estatísticas. As três variações possíveis em séries
estatísticas são:
 A Época (fator temporal ou cronológico) – a que se refere o fenômeno analisado;
 O Local (fator espacial ou geográfico) – onde o fenômeno acontece;
 O Fenômeno (espécie do fato ou fator especificativo) – que é descrito.

 Séries Homógradas: aquelas em que a variável descrita apresenta variação discreta ou descontínua.
São séries homógradas a série temporal, a série geográfica, a série específica e as séries mistas.

 Séries Heterógradas: aquelas nas quais o fenômeno ou o fato apresenta gradações ou subdivisões.
Embora fixo, o fenômeno varia em intensidade. A Distribuição de freqüências é uma série heterógrada.

Qualquer estudo científico enfrenta o dilema de estudo da população ou da amostra.

Obviamente tería-se uma precisão muito superior se fosse analisado o grupo inteiro, a população, do
que uma pequena parcela representativa, denominada amostra. Observa-se que é impraticável na grande
maioria dos casos, estudar-se a população em virtude de distâncias, custo, tempo, logística, entre outros
motivos.

A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se a amostra é confiável
e proporciona inferir sobre a população, chamamos de inferência estatística. Para que a inferência seja válida,
é necessária uma boa amostragem, livre de erros, tais como falta de determinação correta da população,
falta de aleatoriedade e erro no dimensionamento da amostra.

Quando não é possível estudar, exaustivamente, todos os elementos da população, estudam-se só


alguns elementos, a que damos o nome de Amostra.

Gráficos permitem a representação de uma relação entre variáveis e facilitam a compreensão de


dados, desde que apresentados de forma clara e objetiva.
 De Linha
 De Barras
 Pictóricos
 De Setores
UNIP – Tatupé – Estatística - 2007 2
Prof. Ecila Alves de Oliveira

Dados Brutos : São aqueles valores a que se chegou pela simples coleta, sem qualquer preocupação
quanto à sua ordenação. Como se pode ser observado, as cifras estão dispostas de forma desordenada. Em
razão disso, pouca informação se consegue obter inspecionando os dados anotados. Mesmo uma informação
tão simples como a de saber os consumos máximo e mínimo requer um certo exame dos dados da tabela.

Distribuição de Freqüências

Dados Brutos e ROL

Observe a tabela a seguir que apresenta as notas de quarenta alunos de uma classe de ensino médio.

1 8 4 9 6,5 6 9 10 2 3
8,5 4 9 6 5 5,5 6,5 9 8 7
4,5 6 6,5 7,5 5 6 5,5 8 9 8
6 7 8 9 10 3 2,5 1,5 4 7

Colocando-se esses dados em ordem crescente, obtemos uma nova tabela, denominada ROL.

1 1,5 2 2,5 3 3 4 4 4 4,5


5 5 5,5 5,5 6 6 6 6 6 6,5
6,5 6,5 7 7 7 7,5 8 8 8 8
8 8,5 9 9 9 9 9 9 10 10

Podemos agora estabelecer a AMPLITUDADE, que é a diferença entre o maior e o menor valor. No
caso, temos 10 – 1 = 9 como amplitude.

O número de vezes que determinado valor se repete é denominado FREQÜÊNCIA desse valor.
Podemos então montar uma nova tabela em que a cada valor associamos a sua freqüência:

Notas 1 1,5 2 2,5 3 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 10


Freqüênci 1 1 1 1 2 3 1 2 2 5 3 3 1 5 1 6 2
a

A tabela continua ainda muito extensa. Vamos agrupar as notas de 0 a 2 (0 | 2; fechado em 0 e


aberto em 2, que não é do intervalo), de 2 a 4 ( 2 | 4), de 4 a 6 ( 4 | 6), de 6 a 8 ( 6 | 8) e de 8 a 10 (8 |
10). Assim temos:

Notas
0| 2 2| 4 4| 6 6| 8 8 | 10
Freqüênci 2 4 8 12 14
a

Chamamos esta tabela de DISTRIBUIÇÃO DE FREQÜÊNCIA COM INTERVALOS DE CLASSE.

Nessa distribuição, temos cinco intervalos de classe (0 | 2, 2 | 4, 4 | 6, 6 | 8, 8 | 10) com amplitude


2 (2 – 0 = 4 – 2 = ... = 10 – 8).

Os extremos de cada classe são chamados de LIMITES, que podem ser INFERIORES (li) e
SUPERIORES (Li). Assim: 0, 2, 4, 6 e 8 são limites inferiores e 2, 4, 6, 8 e 10 são limites superiores.

O PONTO MÉDIO de cada intervalo de classe é obtido pela média aritmética dos limites inferior e
superior da classe. São pontos médios os valores 1, 3, 5, 7 e 9.

Temos que considerar a FREQÜÊNCIA RELATIVA ou PERCENTUAL (Fr), em que se associa à freqüência
de cada classe o percentual que ela representa em relação à freqüência total.
UNIP – Tatupé – Estatística - 2007 3
Prof. Ecila Alves de Oliveira

Já a FREQÜÊNCIA ACUMULADA (Fi) de cada classe é dada pela soma das freqüências de todas as
classes, desde a primeira até a classe considerada.

Exemplo

Tabela 1: Produção diária de um produto

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 174 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

Tabela 2: Ordenação Crescente

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 174

Tabela 3: Distribuição de Freqüência

Quantida
de Freqüência
(i)
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
172 1
174 1
Total 40
UNIP – Tatupé – Estatística - 2007 4
Prof. Ecila Alves de Oliveira

Elementos de uma distribuição de freqüência

a-) Amplitude ð é a diferença entre o maior valor e o menor valor encontrado na distribuição.

At = Vmáx - Vmin

At = 174 – 150 ð At = 24

b-) Classes ð é cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de
valores observados da variável.

c-) Número de Classes ð


√n n é o número total de elementos
K=

K= √ 40 ð K = 6,32 ð K@6

d-) Amplitudade das Classes ð h = At


K

h = 24 / 6 ð h = 4

mi = li + Li
e-) Ponto Médio de uma Classe ð 2

Ponto médio ou valor médio de uma classe é o ponto eqüidistante dos limites de classe.

Para obter o ponto médio de uma classe, ou aplica-se a fórmula acima, ou basta acrescentar ao
seu limite inferior a metade da amplitude do intervalo de classe.

Tipos de freqüência

a) Freqüência simples absoluta (fi) ð é o número de repetições de um valor individual ou de


uma classe de valores da variável.

b) Freqüência simples relativa (fri) ð representa a proporção de observações de um valor


individual ou de uma classe, em relação ao número total
de observações.

c) Freqüência Acumulada (Fi) ð é o total das freqüências de todos os valores inferiores ao


Limite Superior de uma dada classe.
UNIP – Tatupé – Estatística - 2007 5
Prof. Ecila Alves de Oliveira

Tabela 4: Distribuição de Freqüência em Intervalos de Classe

fi fri Fri
Fi
freqüência mi freqüência Freqüência
Qte. Freqüência
simples ponto médio simples Acumulada
Acumulada
absoluta relativa relativa
150├ 154 4 152 0,100 4 0,100
154├ 158 9 154 0,225 13 0,325
158├ 162 11 160 0,275 24 0,600
162├ 166 8 164 0,200 32 0,800
166├ 170 5 168 0,125 37 0,925
170├ 174 3 172 0,075 40 1,000
Total 40 1,000

Medidas de posição:

Dentre as medidas de distribuição, a média aritmética (x), a mediana (Md) e a moda (Mo) têm
especial importância. São medidas de tendência central, visto que ocupam posições centrais numa
distribuição.

a) MÉDIA ARITMÉTICA ð

A Média Aritmética é o quociente da divisão da soma dos valores pelo número de elementos. Sendo x 1,
x2, x3, ... , xn os elementos, temos:
x

x 1 + x 2 + x3 +.. .+ x n ∑ xi
i=1

X= n = n

A média aritmética para dados não agrupados é a média aritmética simples dos elementos. Vejamos
um exemplo: para os elementos 1, 2, 3, 5,7, 8 e 9, temos:

1+2+3+ 4+ 5+6+7+ 8+9 45


X= 9 = 9 = 5

A média Aritmética para uma distribuição de freqüências apresenta duas situação:

1-) Sem intervalo de classe.

Se os elementos x1, x2, x3, ... , xn apresentam, respectivamente, freqüências f1, f2, f3, ... , fn, então:

n
∑ f i xi
i=1
f 1 . x1 + f 2 . x 2 + f 3 . x 3 + .. .+f n . x n n

f 1 + f 2 + f 3 +. . .+f n ∑ fi
X= = i =1
Ou seja, trata-se da Média Ponderada.
UNIP – Tatupé – Estatística - 2007 6
Prof. Ecila Alves de Oliveira

Exemplo:

Notas Freqüência (fi)


3 3
4 5
5 6
6 7
7 6

n
∑ f i xi
i=1
n
3 x 3+4 x 5+5 x 6+6 x 7+7 x 6 143
∑ fi 3+4+5+6+7+6 27
X= i =1 = = = 5,296

2-) Com intervalo de classe.

Neste caso, consideramos todos os valores de um determinado intervalo como coincidentes com o
ponto médio do intervalo. Assim:

n
∑ f i mi
i=1
n
∑fi
X= i=1

Exemplo:

Notas Freqüência (fi) mi ) fi . mi


Ponto Médio (
0 2 3 1 3
2 4 5 3 15
4 6 18 4 90
6 8 14 7 98
8 10 10 9 90
 fi = 50  fi .mi=296

n
∑ f i mi
i=1
n
296
∑fi 50
X= i=1 = = 5,92

b) MEDIANA (Md) ð é definida como o número que se encontra no centro de uma série de números,
estando estes dispostos segundo uma ordem. É o valor situado de tal forma que
separa o conjunto de em dois subconjuntos de mesmo número de valores.

A Mediana para uma distribuição de freqüências apresenta duas situação:

1-) Sem intervalo de classe.

Basta considerar a freqüência acumulada e localizar o elemento intermediário.


UNIP – Tatupé – Estatística - 2007 7
Prof. Ecila Alves de Oliveira

Exemplo

Salário fi Fi
s
1500 12 12
2000 10 22
2500 8 30
3000 4 34
3500 1 35
f i
= 35

∑ fi 35
Como ∑ fi
= 35, temos: 2 = = 17,5 2
Assim, a mediana é um valor ent5re o 17º e o 18º elemento. Esses valores ocorrem para o salário de
2.000. Portanto, Md = 2.000

2-) Com intervalo de classe.

∑ fi
Devemos inicialmente localizar a classe mediana, ou seja, a que contém o elemento 2 . Em
seguida, calculamos seu valor usando a fórmula:

Σ fi - Fant .h
2
Md = linf +
fi

Em que:

linf Limite inferior da classe mediana


Fant Soma das freqüências das classes anteriores à classe mediana
h Amplitude da classe mediana
fi Freqüência da classe mediana

c) MODA (Mo) ð é o valor que ocorre com maior freqüência em uma série de valores. No caso de
dados não agrupados, basta procurar pelo valor que mais se repete. Caso os dados
estejam agrupados, basta ir à classe com maior freqüência e a MODA poderá ser
calculada pela fórmula:

A Mo de um cojunto de elementos é o elemento que ocorre com maior freqüência. Assim, um conjunto
de elementos pode ter uma moda, mais de uma ou nenhuma.

A moda do conjunto de números 2, 3, 4, 4, 5, 6, 6, 6, 7 e 8 é Mo = 6, que ocorre com freqüência 3.

No conjunto 2, 3, 3, 4, 5, 5, 6, 7, 7 e 8, temos os números 3, 5 e 7 com freqüência 2. Temos,


portanto, três modas:3, 5 e 7.

O conjunto de números 2, 3, 4, 6, 8 e 9 não tem nenhum elemento com maior freqüência que os
demais. Portanto não tem moda.
UNIP – Tatupé – Estatística - 2007 8
Prof. Ecila Alves de Oliveira

A classe modal é a classe que apresenta maior freqüência. Consideramos como moda de uma
distribuição de freqüência o valor compreendido entre os limites da classe modal. Tal valor é dado por:

Mo = l* + L*

APLICANDO NO EXEMPLO:

Qte. fi xi fri Fi Fri xif i


150├ 154 4 152 0,100 4 0,100 608
154├ 158 9 156 0,225 13 0,325 1404
158├ 162 11 160 0,275 24 0,600 1760
162├ 166 8 164 0,200 32 0,800 1312
166├ 170 5 168 0,125 37 0,925 840
170├ 174 3 172 0,075 40 1,000 516
Total 40 1,000 6440

MÉDIA

ü MÉDIA = 6440 ð x = 161 unidades


40

MODA (Mo)

ü Como a classe com maior freqüência é a terceira (158 ├ 162):

MODA = 158 + 162 ð Mo = 160 unidades


2

MEDIANA (Md)

Determinação da Classe Mediana ð 40 / 2 = 20

O que nos dá como Classe Mediana a Terceira Classe (158 ├ 162):

Md = 158 + (20 – 13) 4 ð Md = 158 + 28 ð Md = 160,5 unidades


11 11

Medidas de dispersão

a) AMPLITUDE TOTAL ð é a diferença entre o maior e o menor valor da seqüência.

At = Vmáx - Vmin

b) VARIÂNCIA E DESVIO PADRÃO

São valores que nos mostram o quanto os dados se comportam ao redor da média. Quanto maior o
valor, significa que mais os dados estão afastados da média. Quanto menor, mais perto da média estão os
valores.
A VARIÂNCIA é um número calculado a partir dos quadrados dos desvios, ela é um número em
unidade quadrada em relação à variável em questão. Por esta razão, neste primeiro momento, ela não será
UNIP – Tatupé – Estatística - 2007 9
Prof. Ecila Alves de Oliveira

utilizada.

O DESVIO PADRÃO ele determina a dispersão dos valores em torno da média.

É a raiz quadrada da Variância, ou seja, elimina-se o inconveniente de se ter uma variável em unidade
quadrada, o que torna sua interpretação mais tranqüila.

s= Σ fix2i - Σ f ixi 2

Σ fi Σ fi

Aplicando ao Exemplo:

Qte. fi xi fri Fi Fri fixi fix2i


150├ 154 4 152 0,100 4 0,100 608 92.416
154├ 158 9 156 0,225 13 0,325 1.404 219.024
158├ 162 11 160 0,275 24 0,600 1.760 281.600
162├ 166 8 164 0,200 32 0,800 1.312 215.168
166├ 170 5 168 0,125 37 0,925 840 141.120
170├ 174 3 172 0,075 40 1,000 516 88.752
Total 40 1,000 6.440 1.038.080

2
s= 1.038.080 - 6.440
40 40

s= Ö 25.952 – 25.921 ð s = Ö 31 ð s = 5,57 unidades

c) COEFICIENTE DE VARIAÇÃO:

Como o Desvio Padrão é proporcional a grandeza do histórico, para sabermos se o mesmo é um valor
alto ou um valor baixo, devermos compara-lo com a média, na forma de porcentagem.

CV = s 100
x

Portanto:

CV = 5,57 x 100 ð CV = 3,5%


161

Você também pode gostar