Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Introdução à Estatística
As estatísticas aparecem nos jornais, nos noticiários de TV, nos relatórios das
empresas, nos relatórios dos serviços de saúde etc. Entendê-las, é uma necessidade
para um indivíduo que vive em sociedade. As estatísticas facilitam a compreensão
dos fatos através de dados referentes a amostras numerosas, como podemos ver nos
seguintes exemplos:
1) Verificar se um programa de TV tem ou não audiência;
2) Conferir se um determinado tratamento surte o efeito desejado e mesmo avaliar
os efeitos colaterais;
3) Analisar o desempenho dos alunos de uma escola no fim do ano letivo.
Os exemplos são numerosos e voltaremos a eles no transcorrer das aulas.
Definição
Estatística é uma ciência através da qual se obtém informações de dados
numéricos.
Ela trata do conjunto de métodos utilizados para a obtenção desses dados, sua
organização em tabelas e gráficos e a análise e interpretação desses dados.
A análise e a interpretação dos dados estatísticos tornam possível o diagnóstico
de, por exemplo, uma empresa, o conhecimento de seus problemas e a formulação
de soluções para tais problemas.
Tabelas:
Uma tabela deve apresentar a seguinte estrutura:
- cabeçalho
2
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
- corpo
- rodapé
O cabeçalho deve conter o suficiente para que sejam respondidas as questões:
- O que está representado?
- Onde ocorreu?
- Quando ocorreu?
O corpo da tabela é representado por colunas e subcolunas dentro dos quais serão
registrados os dados numéricos e informações.
O rodapé é reservado para observações pertinentes à tabela, bem como para o
registro e identificação da fonte dos dados.
Exemplo:
PRODUÇÃO DA COMPANHIA ALFA – junho/2015
PRODUTOS QUANTIDADE (%)
A 32,4
B 21,6
C 43,2
D 10,8
Fonte: Departamento de Marketing da Companhia
Distribuição de frequências:
1. Conceitos fundamentais:
População: é um conjunto de indivíduos ou objetos que apresentam pelo menos uma
característica em comum.
Exemplo:
Uma concessionária de automóveis tem cadastrados 3500 clientes e fez uma
pesquisa sobre a preferência de compra em relação à cor (branco, vermelho ou
azul); preço; número de portas e estado de conservação (novo ou usado).
Foram consultados 210 clientes. Diante essas informações, responda:
a) Qual é a população estatística e qual é a amostra dessa pesquisa?
2. Representação da Amostra:
Quando se estuda uma variável, o maior interesse do pesquisador é conhecer
a distribuição dessa variável através das possíveis realizações (valores) da mesma.
Vamos ver uma maneira de dispor os dados através de tabelas:
A partir desses dados, podemos elaborar uma tabela onde na primeira coluna
aparecerão os valores da variável estatística (xi) que, nesse caso, são as notas; na
segunda coluna aparecerá o número de vezes que cada valor se repete, essa coluna
é chamada frequência absoluta que representaremos por Fi.
Assim, N = nº de elementos da população = F(1) + F(2) + F(3) + ... + F(10) = 20. Que
pode também ser escrito por:
10
N = Fi = 20
i =1
F
i=0
i
total
• 100% - 55% = 45% dos alunos obtiveram nota igual ou superior a 7,0
Exemplo:
Suponhamos termos feito uma coleta de dados relativos às idades de 30
pessoas, que compõem uma amostra dos alunos de uma faculdade “A”:
24 23 22 28 35 21 23 33 34 34 21 25 36 26 22
30 32 25 26 33 34 21 31 25 26 25 35 33 31 31
33 3
34 3
35 2
36 1
Total 30
Como esta tabela fica com muitas linhas, podemos resumi-la numa tabela com
intervalos de classes:
Número de classes (k): Não há uma fórmula exata para o cálculo do número de
classes. As mais usadas são:
1ª) K = 5 para n 25 ou K n para n 25
2ª)Fórmula de Sturges: K 1 + 3,22 . log n
No exemplo dado:
Pontos médios das classes (Xi): é a média aritmética entre o limite superior e o
limite inferior da classe.
Exemplo: 33 |---- 36
Xi =
Total
10
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Exercícios propostos:
2. A tabela a seguir contém informações sobre estado civil, grau de instrução, número
de filhos, salário, idade (medida em anos e meses) e procedência de 36
funcionários da seção de orçamentos de uma companhia.
Nº Estado Grau de Nº de Salário Idade Região de
Civil Instrução filhos (em reais) Anos Meses procedência
1 solteiro E.Fundam. - 400 26 03 Interior
2 casado E.Fundam. 1 456 32 10 Capital
3 casado E.Fundam. 2 525 36 05 Capital
4 solteiro E. Médio - 573 20 10 Outro
5 solteiro E.Fundam. - 626 40 07 Outro
6 casado E.Fundam. 0 666 28 00 Interior
7 solteiro E.Fundam. - 686 41 00 Interior
8 solteiro E.Fundam. - 739 43 04 Capital
9 casado E. Médio 1 759 34 10 Capital
10 solteiro E. Médio - 744 23 06 Outro
11 casado E. Médio 2 812 33 06 Interior
12 solteiro E.Fundam. - 846 27 11 Capital
13 solteiro E. Médio - 874 37 05 Outro
14 casado E.Fundam. 3 895 44 02 Outro
15 casado E. Médio 0 913 30 05 Interior
16 solteiro E. Médio - 935 38 08 Outro
11
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Determine:
a) Qual é a população estatística? Qual é a amostra?
b) Classificar as variáveis (qualitativa; quantitativa discreta ou quantitativa contínua).
c) Construir as tabelas de distribuição de frequências das variáveis:
1. estado civil
2. grau de instrução
3. número de filhos
4. região de procedência
12
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
3. A pesquisa abaixo foi feita com 20 alunos de uma escola. As variáveis estudadas
foram: idade (em anos), peso (em quilogramas) e altura (em centímetros):
14 a; 49.0 kg; 173 cm 14 a; 49.0 kg; 174 cm
14 a; 46.5 kg; 166 cm 14 a; 46.5 kg; 165 cm
16 a; 53.0 kg; 178 cm 15 a; 48.0 kg; 163 cm
15 a; 50.0 kg; 175 cm 14 a; 48.5 kg; 169 cm
14 a; 51.0 kg; 168 cm 16 a; 50.0 kg; 170 cm
15 a; 49.0 kg; 170 cm 14 a; 52.0 kg; 175 cm
14 a; 44.0 kg; 162 cm 14 a; 46.0 kg; 172 cm
15 a; 51.0 kg; 176 cm 15 a; 47.0 kg; 169 cm
14 a; 48.3 kg; 168 cm 14 a; 51.0 kg; 173 cm
16 a; 52.0 kg; 179 cm 14 a; 49.0 kg; 166 cm
Representações gráficas
1. Gráfico de colunas
Nesse tipo de gráfico, usamos retângulos com bases de mesma medida e
alturas com comprimentos proporcionais às frequências de cada dado.
Os retângulos são representados em um sistema de coordenadas cartesianas
onde os valores distintos da variável são colocados no eixo horizontal e as frequências
são colocadas no eixo vertical.
Observe que não colocamos o zero do eixo horizontal na origem do sistema cartesiano
por uma questão de clareza da representação gráfica.
2. Gráfico de linhas
Os gráficos lineares são utilizados com a finalidade de oferecer uma impressão
visual nítida de variações numéricas, sob a forma de “subidas e descidas” de uma
linha.
15
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
3. Gráfico de setores
O gráfico de setores é um círculo dividido em partes (setores). É utilizado
principalmente quando se pretende comparar cada valor com o total.
Tal gráfico deve ser construído de modo que a área de cada setor seja
proporcional à respectiva frequência, ou seja, o ângulo de cada setor deve ser
proporcional à frequência que representa, uma vez que a área do setor é diretamente
proporcional ao ângulo que o define.
Lembrando que uma circunferência completa tem 360º, podemos calcular por
meio de uma regra de três simples o ângulo central de cada setor:
total ----- 360º
parte ----- xº
Exercícios propostos:
b)
Nº de acidentes por dia na Rodovia X
em janeiro de 2015
Nº de acidentes por dia Nº de dias
0 10
1 7
2 4
3 5
4 3
5 2
Fonte: Dersa
18
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Estaturas (cm) Fi
150 |---- 155 3
155 |---- 160 9
160 |---- 165 17
165 |---- 170 31
170 |---- 175 36
175 |---- 180 40
180 |---- 185 20
10 15 25 21 6 23 15 21 26 32 9 14 19 20 32 18 16 26 24 20
7 18 17 28 35 22 19 39 18 21 15 18 22 20 25 28 30 16 12 20
Vimos a sintetização dos dados sob a forma de tabelas e gráficos. Dessa forma
podemos localizar a maior concentração de valores de uma dada distribuição.
Contudo, muitas vezes, queremos resumir ainda mais esses dados,
apresentando um ou alguns valores que sejam “representativos” da série toda.
Usualmente, empregam-se as seguintes medidas de posição central: média, moda e
mediana, em torno dos quais tendem a concentrarem-se os dados.
Estudaremos agora os diferentes tipos de médias:
1. Média aritmética x : ()
1º caso: dados não agrupados
A média aritmética dos valores x1, x2, x3, ... , xn é o quociente entre a soma
desses valores e o seu número total n.
x=
x 1 + x 2 + ... + x n
ou simplesmente x =
x i
(onde n é o nº de elementos do
n n
conjunto)
x=
F1x 1 + F2 x 2 + ... + Fn x n
ou simplesmente x =
x F i i
n n
20
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Total
x=
x F i i
n
Exemplo:
Classe Fi xi xiFi
2 |---- 5 1
5 |---- 8 10
8 |---- 11 8
11 |---- 14 1
Total
Mg = n x1 1 x 2 2 x 3 3 ... x n
F F F Fn
Mg = n x1 x 2 x 3 ... x n
Exemplos:
1. Determinar a média geométrica dos valores: 3, 6, 12, 24, 48.
n n
Mh = =
F1 F2 F3 Fn F
+ +
x1 x 2 x 3
+ ... +
xn
xi
i
n n
Mh = =
1 1 1 1 1
+ +
x1 x 2 x 3
+ ... +
xn
x
i
Exemplos:
1. Determinar a média harmônica dos valores: 2, 5, 8.
Exercícios propostos:
1. Calcule a média aritmética para as tabelas abaixo:
a)
xi Fi
2 1
3 4
4 3
5 2
Total
(Resposta: 3,6)
b)
xi Fi
17 3
18 18
19 17
20 8
21 4
Total
(Resposta: 18,84)
(Resposta: 570)
24
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
(Resposta: 9,80)
(Resposta: 9,72)
Exercícios complementares:
1) Calcule a média aritmética das séries abaixo:
a) 1, 2, 8, 10, 12, 16, 21, 30 (Resposta: 12,5)
b) 5, 6, 6, 10, 11, 11, 20 (Resposta: 9,86)
c) 3, 4, 7, 8, 9, 23, 12, 15 (Resposta: 10,12)
(Resposta: 335)
Moda (Mo):
Dada uma coleção de números, a moda é o valor que ocorre com maior
frequência.
Assim, no exemplo acima, o salário mais frequente é o salário mínimo que é
recebido por 100 empregados, isto é, 1 salário mínimo.
Observações:
1.) Existem casos em que a moda não existe – os valores não se repetem ou
todos os valores tem a mesma frequência (distribuição amodal).
2.) Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição dos
valores pode ser bimodal, trimodal etc.
Exemplo: 3, 5, 8, 10, 12 e 13
Exemplo: 2, 2, 5, 5, 8, 9
27
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Exemplo:
xi Fi
0 2
2 4
3 5
4 3
6 1
Mediana (~
x) :
~
x
Exemplos:
1.) Dada a amostra: 5, 13, 10, 2, 18, 15, 6, 16 e 9
Exemplos:
1.) Dada a distribuição:
xi Fi
12 1
14 2
15 1
16 2
17 1
20 2
Total 9
30
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
n
1º Passo: Calcula-se .
2
2º Passo: Identifica-se a classe mediana pela Fac.
3º Passo: Aplica-se a fórmula.
li =
f =
h=
FMd =
Interpretação: 50% dos valores da série são valores menores ou iguais à mediana e
50% dos valores da série são valores maiores ou iguais à mediana.
Exercícios propostos:
1. Calcule a moda das distribuições abaixo:
a)
xi Fi
2 1
3 7
4 2
5 2
Total
(Resposta: 3)
32
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
b)
Xi Fi
17 3
18 18
19 17
20 8
21 4
Total
(Resposta: 18)
b)
xi Fi
17 3
18 18
19 4
20 3
21 2
Total
(Resposta: 18)
Exercícios complementares:
1) Calcule a moda para as séries abaixo:
a) 2, 2, 3, 4, 5, 5, 5, 7 (Resposta: 5)
b) 3, 4, 4, 5, 9, 12, 12 (Resposta: 4 e 12)
c) 5, 7, 9, 11, 13 (Resposta: não existe)
(Resposta: 1,18)
5) A distribuição de frequências nos fornece, por faixa etária, a frequência com que
ocorre determinada doença, para um grupo de 100 pessoas estudadas, com idades
entre 16 e 48 anos. Calcule a média, a moda e a mediana.
Idade Fi
16 |---- 20 9
20 |---- 24 18
24 |---- 28 26
28 |---- 32 14
32 |---- 36 10
36 |---- 40 9
40 |---- 44 8
44 |---- 48 6
Total
Medidas separatrizes
1. Quartis (Qi):
Dividem um conjunto de dados em quatro partes iguais:
Q1 Q2 Q3
I---------------I--------------I---------------I---------------I
0% 25% 50% 75% 100%
Resumindo, temos:
in
− f
+ .h
4
Q i = l Qi
FQi
classes Fi Fac
7 |----- 17 6
17 |----- 27 15
27 |----- 37 20
37 |----- 47 10
47 |----- 57 5
Total 56
2. Decis (Di):
Dividem um conjunto de dados em dez partes iguais:
D1 D2 D3 D4 D5 D6 D7 D8 D9
I---------I---------I---------I---------I---------I---------I---------I---------I---------I---------I
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
in
1° Passo: Calcula-se , em que i = 1, 2, 3, ... , 9.
10
2° Passo: Identifica-se a classe Di pela Fac
3° Passo: Aplica-se a fórmula:
in
− f
D i = l Di + .h
10
FDi
3. Percentis (Pi):
Dividem um conjunto de dados em cem partes iguais:
in
1° Passo: Calcula-se , em que i = 1, 2, 3, ... , 98, 99.
100
2° Passo: Identifica-se a classe Pi pela Fac
39
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Exercícios propostos:
1. A tabela abaixo refere-se ao tempo de serviço de 50 funcionários de uma
determinada empresa:
Tempo de serviço (anos) Fi
1 |----- 5 10
5 |----- 9 12
9 |-----13 15
13 |----- 17 5
17 |-----21 8
nº de acidentes nº de dias
0 |---- 2 20
2 |---- 4 15
4 |---- 6 12
6 |---- 8 10
8 |---- 10 8
Calcule:
a) Q1 (Resposta: 1,625)
b) P92 (Resposta: 8,7)
c) D7 (Resposta: 5,75)
Medidas de dispersão
“Se uma pessoa comeu dois sanduiches e outra não comeu nenhum, em média
cada uma comeu um sanduiche.”
Essa frase, que tem relação com a Estatística, não agradaria muito aquele que
ficou com fome. Ao fazer a média, há sempre informação que se perde. A média,
apesar de ser uma medida muito utilizada em Estatística, é muitas vezes insuficiente
para caracterizar aceitavelmente uma distribuição. A moda e a mediana também são
medidas que nem sempre são suficientes para caracterizar um conjunto de dados.
Em alguns casos, temos que recorrer a outros parâmetros que são chamados
medidas de dispersão.
As medidas de dispersão são medidas estatísticas utilizadas para avaliar o grau
de variabilidade ou dispersão dos valores em torno da média. Servem para medir a
representatividade da média.
2. Variância (Var):
É a média aritmética dos quadrados dos desvios. Logo:
Var =
di Fi 2
Resumindo: a distribuição possui média 4,17. Isto é, seus valores estão em torno de
4,17 e seu grau de concentração é de 1,72, medido pelo desvio médio e de 1,86,
medido pelo desvio padrão.
44
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Outro exemplo: Numa empresa, o salário médio dos homens é de R$4000,00, com
desvio padrão de R$1500,00 e, o das mulheres, é em média de R$3000,00, com
desvio padrão de R$1200,00. Então:
1500 1200
CVH = 100 = 37,5% e CVM = 100 = 40%
4000 3000
Exercícios propostos:
b)
salários nº de vendedores
70 |---- 120 8
120 |---- 170 28
170 |---- 220 54
220 |---- 270 32
270 |---- 320 12
320 |---- 370 6
total
(Resposta: 45,20)
19 17
20 8
21 4
Total
(Respostas: 1,05; 1,02 e 5,41%)
b)
Xi Fi
0 30
1 5
2 3
3 1
4 1
Total
(Respostas: 0,84; 0,92 e 204,44%)
Medidas de assimetria
1. Distribuição simétrica
Nesse tipo de distribuição temos igualdade dos valores da média, mediana e
moda.
xi
x=~
x = Mo
xi
49
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
xi
Se AS = 0, a distribuição é simétrica
Se AS > 0, a distribuição é assimétrica positiva ou à direita
Se AS < 0, a distribuição é assimétrica negativa ou à esquerda
x=
x F i i
=
n
1
Mo = li + h =
1 + 2
S 2
=
di Fi 2
S= S2 =
Logo, temos:
x − Mo
AS = =
S
51
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
Exercícios Complementares
Determine:
a) média
b) moda
c) mediana
d) desvio médio
e) variância
f) desvio padrão
g) coeficiente de variação
h) coeficiente de assimetria
Determine:
a) média
b) moda
c) mediana
d) 30º percentil
e) desvio médio
f) variância
g) desvio padrão
h) coeficiente de variação
i) coeficiente de assimetria
b)
classes Fi
1 |---- 3 3
3 |---- 5 5
5 |--- 7 8
7 |---- 9 6
9 |---- 11 4
11 |---- 13 3
Total
53
Estatística
Profª Maira Mendias Lauro
__________________________________________________________________________
c)
Idade nº de
pessoas
10 |---- 14 15
14 |---- 18 28
18 |---- 22 40
22 |---- 26 30
26 |---- 30 20
Total
d)
classes Fi
30 |---- 40 10
40 |---- 50 20
50 |---- 60 35
60 |---- 70 25
70 |---- 80 10
Total
e)
classes Fi
45 |---- 55 15
55 |---- 65 30
65 |---- 75 35
75 |---- 85 15
85 |---- 95 5
Total