Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
Marabá - Pará
2022
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
1.1. INTRODUÇÃO
A palavra estatística provém do latim status (estado) e é comumente
associada a censos, pesquisas de opinião pública, aos vários índices
governamentais, aos gráficos e medidas publicadas diariamente na imprensa. Na
realidade, como veremos adiante, a estatística engloba muitos outros aspectos.
Em alguma fase de seu trabalho, o pesquisador ou profissional se vê às
voltas com o problema de analisar e entender um conjunto de dados. Muitas vezes
ele necessitará resumir os dados para que sejam informativos, ou para compará-los
com outros resultados, ou ainda para julgar sua adequação a alguma teoria. A
estatística é fundamental na análise de dados provenientes de quaisquer processos
onde exista incerteza.
2
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
3
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
4
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
a relação (ou “listagem”, fila, a disposição dos prédios etc...) esteja “misturada” no
que se refere à característica em estudo.
Suponha por exemplo que o total populacional seja dado por N = nk, onde n é
1
amostra, obtido por n0 . Sendo que E é o erro amostral máximo tolerável.
E2
A Figura 1 mostra que para um erro amostral fixo (E), a medida que o
percentuais da população.
Figura 1: Representação gráfica do tamanho da população (N) em função do tamanho da
amostra (n), fixando o erro amostral (E).
5
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
n0
tal que se possa admitir, com alta confiança, que os erros amostrais não
ultrapassem 4% ( E = 0,04). Calcule para:
a) N = 35 alunos; b) N = 200 alunos; c) N = 200.000 alunos.
Observe que para manter o mesmo erro amostral, no item a) foi necessária
uma amostra abrangendo quase 100% da população; enquanto que no item b) a
amostra abrange 76%; e no item c) abrange apenas 0,3% da população. É, portanto,
errônea a ideia de que para uma amostra ser representativa deva abranger uma
percentagem fixa da população.
6
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
7
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
então k = 10.000 / 250 = 40. Seleciona-se um número de 1 a 40, digamos 20. Então,
as unidades amostrais serão: 20o, 60o, 100o, 140o, ..., 9980o (20+249×40).
1.5. VARIÁVEL
A estatística ocupa-se fundamentalmente das propriedades das populações
cujas características são passíveis de representação. A característica que interessa
analisar é chamada de variável.
Variável: é convencionalmente o conjunto de resultados possíveis de um fenômeno,
conjunto este chamado domínio da variável.
As variáveis podem ser divididas em dois tipos: qualitativas e quantitativas.
8
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
1.6.2. Regra II - Se o último algarismo a permanecer for maior ou igual a “5” será
acrescido de uma unidade o algarismo a permanecer.
1
IBGE. Centro de Documentação e Disseminação de Informação. Normas de apresentação
tabular/Fundação Instituto Brasileiro de Geografia e Estatística, Centro de Documentação e
Disseminação de Informações. 3ª Ed. Rio de Janeiro, 1993. 62 p.
9
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
99,8 100,0%
2a. PLANEJAMENTO: Como levantar informações? Que dados devem ser obtidos?
Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de
atividades? Os custos envolvidos? etc.
10
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Obs.: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz
o grande risco de erros de transcrição.
4a. APURAÇÃO E CRÍTICA DOS DADOS: Resumo dos dados a partir de sua
contagem e agrupamento. É a condensação e tabulação de dados.
11
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Tipos de questionários:
Com questões fechadas: tem a vantagem de permitir respostas padronizadas
que permitem comparação com outras avaliações. Também permite maior
economia de recursos (por facilitar o tratamento e análise da informação e por
exigir menor tempo). A desvantagem é que permite facilitar a resposta (por esta já
ser oferecida) para um informante que não saberia ou que encontraria maior
dificuldade em responder a uma determinada questão.
Com questões fechadas e abertas: algumas questões abertas podem ser
incluídas no questionário, quando não se sabem todas as respostas que se podem
obter dos informantes.
Dificuldades apontadas:
Formular as perguntas com objetividade e clareza para atingir o objetivo;
Escolher as questões mais relevantes, limitando o número, em relação ao perfil do
entrevistado e ao tema;
Elaborar as questões de forma a não constranger o entrevistado;
Elaborar as questões sem “duplo sentido”;
Fechar as questões;
Elencar todas as alternativas de respostas possíveis (abrangentes, mas em
número reduzido);
Elaborar perguntas que não induzam a resposta;
Trabalhar com intervalos de classe (categorização);
Formular ou selecionar as perguntas atendendo ao foco (objetivo) da pesquisa;
Fazer a categorização das respostas nas perguntas abertas;
Uso de termos que parecem de fácil entendimento para o entrevistador, mas não o
são para o entrevistado;
13
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
14
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Observação: Nenhuma casa deve ficar sem preenchimento. Todas devem ter o
registro de algum número ou sinal:
- (hífen): quando o valor numérico é nulo;
... (reticências): quando não se dispõe de dado;
? (ponto de interrogação): quando há dúvida sobre a exatidão do valor;
0; 0,0; ou 0,00 (zero), quando o valor numérico é pequeno para ser expresso
pela unidade utilizada. Este deve conter o mesmo número de casas decimais
padronizado pela tabela;
x (letra x): quando o dado for omitido a fim de evitar individualização da
informação.
15
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
16
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Marca Quantidade
FIAT 18.000
GM 12.000
Chevrolet 10.000
Total 40.000
Fonte: Dados fictícios, Março/2011.
17
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Tabela 6: Tempo de Estudo (em dias) de 160 alunos da Escola W, no ano de 2010.
Tempo de Estudo Número de Fi fri Fri Xi
(em dias) Alunos (fi)
1ª classe 10 |─ 20 38
2ª classe 20 |─ 30 45
3ª classe 30 |─ 40 30
4ª classe 40 |─ 50 22
5ª classe 50 |─ 60 10
6ª classe 60 |─ 70 15
160
Fonte: Dados Hipotéticos, JAN/2011.
- Se n ≥ 25, utiliza-se: K n.
Outra maneira de obter:
Fórmula de Sturges: k = 1 + 3,22log(49) 7 classes
Observação: Sempre arredondar o valor de K (é um número inteiro) seguindo as
regras de arredondamento.
4º Passo: calcular o intervalo de Classe ou Amplitude do Intervalo de Classe ( h),
T
que é o comprimento da classe. (geralmente este valor é fornecido): h .
K
5º Passo: Construção das Classes
18
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
(li ls )
valores da variável dentro da classe. X i .
2
b) Tipos de Frequências
b.1) Frequência Absoluta Acumulada de Classe (Fi): é a acumulação sucessiva,
a partir da primeira classe até uma classe qualquer, das frequências simples ou
absoluta das classes.
F1 f1
F2 f1 f 2
...
FK f1 f 2 ... f K
b.2) Frequência Relativa de Classe (fri): é a relação existente entre a frequência
absoluta ou simples de classe e o número de observações da variável.
fi
fri K
fi
i 1
Obs.: 1º) fr 1 e
i 2º) n f i .
19
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
primeira classe até uma classe qualquer das frequências relativas das classes.
Fr1 fr1
Fr2 fr1 fr2
...
Frk fr1 fr2 ... frk
b.4) Percentual
i) Percentual Simples: é o percentual de cada intervalo e é calculada em função da
frequência simples;
ii) Percentual Acumulado: é o percentual de cada intervalo e é calculada em função
da frequência acumulado.
20
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
21
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
600
Quantidade de Alunos
500
432
387
400
298
300 Aprovados
247
223
175 Reprovados
200
108
100
0
2007 2008 2009 2010
Ano
Observação: Este tipo de gráfico pode ser feito em mais dimensões, quando isto
ocorre este gráfico denomina-se Estereograma.
22
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
23
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Figura 8: Quantidade de Desistência de Aluno por Turno, nos meses de Agosto a Dezembro de
2010.
24
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
2008
2009
2010
2011
Figura 11: Percentual de Domicílios no Brasil com Automóveis de Uso Particular - 2011.
25
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
45
40
Frequencia Simples
35
30
25
20
15
10
0
10 20 30 40 50 60 70
Tempo de Internações (dias)
Figura 13: Histograma dos salários pagos aos funcionários do Estado do Pará, no ano de 2000.
0,3
0,25
Relativa
0,2
Frequência
0,15
Frequência
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10 11 12 13
Salário emSalário
unidades monetárias
4.5.2. Polígono de Frequência: Unindo-se por linhas retas os pontos médios das
bases superiores dos retângulos do histograma, obtemos o polígono de frequência.
O polígono de frequência pode referir-se às frequências absolutas ou as relativas,
conforme a escala no eixo vertical. O polígono de frequência pode ser montado
sozinho (sem o histograma).
26
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
41 43 47 51 55 59
61
Figura 15: Polígono de frequência das idades de alunos da Escola Onésima – Santarém – 2010.
50
45
40
35
Frequências
30
25
20
15
10
5
0
2,5 6,5 10,5 14,5 18,5 22,5 26,5 30,5
Ponto Médio
27
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
n
Xi
X1 X 2 ... X n i 1
X .
n n
Exemplo: Sabendo-se que o atendimento diário em uma empresa de arquitetura,
durante uma semana foi de 10, 14, 13, 15, 16, 18 e 12 pessoas, temos para
atendimento médio diário na semana de:
10 14 13 15 16 18 12
X 14 pessoas.
7
f X f 2 X 2 ... f k X k ( f i Xi) k
X 1 1
f 1 f 2 ... f k
i 1
k
em que f i
n
f
i 1
i
i 1
28
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
k
X i fi
Logo X i 1
k
78/34 = 2,3 2
fi
i 1
f i Xi
2440
Aplicando a fórmula acima temos: X i 1
k
61 . Logo: X 61 cm
40
f
i 1
i
5.2. MEDIANA: M d
que divide a série em duas partes com números iguais de elementos. A mediana é
preferível à média quando se está interessado em conhecer exatamente o centro da
distribuição dos dados, ou ainda, quando os valores extremos podem afetar
sensivelmente a média. O cálculo da mediana é feito sob duas condições:
29
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
b) Se a série dada tiver número par de termos: O valor mediano será a média
aritmética dos valores centrais do rol, ou seja, os termos que ocupam a posição n/2
e n/2+1
Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}
1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}
2º - calcular a posição: n = 10 logo a mediana será a média aritmética do termo que
ocupa a posição n/2 = 10/2 =5, ou seja, o 5º termo e do termo que ocupa a posição
n/2+1 = 10/2+1 = 6, ou seja, o 6º termo.
No rol: 5º termo = 2 e 6º termo = 3
A mediana será a média aritmética do 5º e 6º termos da série, ou seja = (2+3) / 2 ou
seja, M d = 2,5.
30
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Quando o somatório das frequências for ímpar o valor mediano será o termo que
Quando o somatório das frequências for par o valor mediano será a média aritmética
dos valores centrais da distribuição, ou seja, os termos que ocupam a posição
f i
e
f i
1
2 2
Exemplo: Calcule a Mediana da distribuição de frequências abaixo:
Variável ( X i ) Frequência ( f i ) Frequência acumulada ( FAc (i ) )
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 -
2º) Calculamos
f i
para localizar a classe mediana;
2
3º) Marcamos a classe correspondente à frequência acumulada imediatamente
superior à
f i
. Tal classe será a classe mediana;
2
k
i f i FAc( ant )
1
4º) Calculamos a Mediana pela fórmula: M d li h
f i
onde: li = Limite inferior da classe da mediana;
31
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
h = Intervalo de classe.
Exemplo
Md 58
20 13. 4 60,54
11
Obs: Esta mediana é estimada, pois não temos os 40 valores da distribuição.
5.3. MODA: M o
A moda ( M o ) é o valor que ocorre com maior frequência ou o valor que mais
se repete. Quando a série de dados é tal que as frequências são maiores nos
extremos, ou quando se quer destacar um valor de alta frequência ou quando se
pretende obter uma medida rápida e aproximada da tendência central, a moda pode
então, ser considerada para a interpretação dos dados. Com relação à moda, uma
série de dados pode ser classificada em amodal (não possui moda), unimodal
(possui apenas uma moda), bimodal (possui duas modas) ou multimodal (possui
mais de duas modas).
Ex: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.
Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.
Ex: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal.
M o (li ls ) / 2
onde li = limite inferior da classe modal e l s = limite superior da classe modal.
33
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
f Mo = Frequência modal;
h = Intervalo de classe.
5.4.1. QUARTIS - Qq
Denominamos quartis os valores de uma série que a dividem em quatro
partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a série em
quatro partes iguais.
34
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
35
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
k
i
1
fi
q FAc( ant) , para q = 1, 2, 3
Qq li Qq 4 h
fi Qq
h = Intervalo de classe.
O quartil 2 = M d , logo:
5.4.2. DECIS - Dd
A definição dos decis obedece ao mesmo princípio dos quartis, com a
modificação da porcentagem de valores que ficam aquém e além do decil que se
pretende calcular. A fórmula básica será: k×fi /10 onde k é o número de ordem do
decil a ser calculado. Indicam-se os decis: D1, D2, ... , D9. Deste modo precisa-se de
9 decis para se dividir uma série em 10 partes iguais.
36
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
37
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Quando os dados não estão agrupados a amplitude total é a diferença entre o maior
e o menor valor observado: AT X Máx X Mín .
Exemplo:
Xi fi
0 2
1 6 AT = 4 - 0 = 4
3 5
4 3
AT LMáx LMín
Exemplo:
Classes fi
4 |─ 6 6
6 |─ 8 2 AT = 10 – 4 = 6
8 |─10 3
Observações:
38
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
1) O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de
calcular e de interpretar. Além do mais, não é afetado pelos valores extremos,
grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os
dados figurem valores extremos que não se consideram representativos.
2) O desvio quartil deverá ser usado preferencialmente quando a medida de
tendência central for a mediana.
3) Trata-se de uma medida insensível à distribuição dos itens menores que Q 1, entre
Q1 e Q3 e maiores que Q3.
i) Para dados brutos: É a média aritmética dos valores absolutos dos desvios
tomados em relação a uma das seguintes medidas de tendência central: média ou
mediana.
n
( xi x )
a) para a Média = DM i 1
n
n
( xi Md )
b) para a Mediana = DM i 1
n
c) As barras verticais indicam que são tomados os valores absolutos, prescindindo
do sinal dos desvios.
39
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Exemplo: Calcular o desvio padrão da população representada por {-4, -3, -2, 3, 5}.
Como X = - 0,2, então:
-4 - 3,8 14,44
-3 - 2,8 7,84
-2 - 1,8 3,24
3 3,2 10,24
5 5,2 27,04
= 62,8
(Xi X )
2
62,8
S 12,56 3,54
n 5
Obs: Quando nosso interesse não se restringe à descrição dos dados, mas partindo
da amostra, visamos tirar inferências válidas para a respectiva população, convém
efetuar uma modificação, que consiste em usar o divisor n - 1 em lugar de n. A
40
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
2ª: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
constante (diferente de zero), o desvio padrão fica multiplicado ( ou dividido) por
essa constante.
Quando os dados estão agrupados (temos a presença de Frequência s) a fórmula
do desvio padrão será:
S
(X i X )2 fi (X i X )2 fi
S
fi ou
f i 1 quando se trata de uma amostra.
( X i fi ) 2 ( X i fi ) 2
X i fi X i fi
2 2
(63)2
165
S 30 1,09 1,044
30
Se os dados forem uma amostra, o resultado será:
41
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
(63)2
165
S 30 1,128 1,062
30 1
Obs.: Nas tabelas de distribuições de frequências com intervalos de classe a fórmula
a ser utilizada é a mesma do exemplo anterior.
Pontos .
2├ 4 8 3 24 9 72
4├ 6 7 5 35 25 175
6├ 8 13 7 91 49 637
8├ 10 2 9 18 81 162
Total () 30 168 1046
( Xi fi ) 2 (168) 2
Xi fi
2
1046
S n 30 3,507 1,873
fi 30
( Xi fi ) 2 (168) 2
Xi fi
2
1046
S n 30 3,628 1,905
fi 1 30 1
2
6.1.5. VARIÂNCIA - S
É o desvio padrão elevado ao quadrado. A variância é uma medida que tem
pouca utilidade como estatística descritiva, porém é extremamente importante na
inferência estatística e em combinações de amostras.
42
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Karl Pearson
43
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
44
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
x i x yi y
r i 1
ou
n n
x x y y
2 2
i i
i 1 i 1
n n n
n xi yi xi yi
r i 1 i 1 i 1
n 2 n 2
n 2 n 2
n x x n y y
i 1 i i 1 i i 1 i
i 1
i
n
S xy x i x yi y
ou r , onde S xy
i 1
, S x e S y são os desvios padrão
SxS y n 1
n
x y i i nx y
de X e Y, respectivamente. Assim r i 1
.
(n 1) S x S y
45
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Portanto
46
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
10
T em po
Exercícios:
1) Construa o diagrama de dispersão, calcule o coeficiente de correlação de
Pearson e interprete:
47
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
38 393
39 425
37 406
36 370
36 365
22 320
10 269
48
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Y = a + bX
49
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
n xi yi xi yi
a e b , tem-se: b a Y bX ,
n xi2 xi
de 2 e
Solução:
Figura 20: Diagrama de dispersão.
140
130
Custos (Y)
120
110
100
10 11 12 13 14 15
Quantidade (X)
X Y XY X2 Y2
10 100 1000 100 10000
11 112 1232 121 12544
12 119 1428 144 14161
13 130 1690 169 16900
14 139 1946 196 19321
15 142 2130 225 20164
75 742 9426 955 93090
50
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
Para ajustar uma reta de regressão linear aos dados deve-se encontrar os
coeficientes de regressão a e b, também chamados de parâmetros. E os mesmos
são estimados a partir de:
X x i
75
12,5 Y y i
742
123,67
n 6 n 6
a Y b X 123,67 (8,63 12,5) 15,795 15,80 .
Portanto a reta ajustada é dada por Yˆ 15,8 8,63 X . i i
Exercícios:
1) Para as medidas de quantidade de chuva (X) que ocorreu em vários anos e a
respectiva safra de trigo (Y), encontre os itens:
a) Construa o diagrama de dispersão.
b) Calcule o coeficiente de correlação linear.
c) Encontre a reta de regressão linear ajustada.
d) Qual é a safra de trigo para uma precipitação pluviométrica de 500 mm?
51
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
182,9 2,4991
287,0 4,5454
472,4 7,0184
223,5 3,6224
261,6 3,8749
403,9 6,2086
332,7 4,7370
52
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
29 8
60 17
44 12
41 10
48 15
33 9
40 13
Tabulação de dados
53
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
EXERCÍCIOS
1. Considerando os dados do Quadro 1 referentes a Empresa GloboAnalisys, que
realizou um levantamento sobre alguns aspectos socioeconômicos dos seus
funcionários, em Dezembro de 2011. Pede-se:
a) Classificar as variáveis
b) Organizar as variáveis em tabelas
c) Construir gráficos para representar cada tabela
d) Fazer a análise de dados de cada tabela
54
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
55
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
10. Utilizar uma série específica para representar o pessoal docente em exercício
em 2011, divididos segundo a natureza: Pública (Pará: 70.992; Amapá: 45.119) e
Particular (Pará: 66.447; Amapá: 49.664), de acordo com o Ministério da Educação,
em Dezembro de 2011.
11. Idealizar uma série geográfica para representar o seguinte fato: população da
região Norte do Brasil em 2010, sabendo-se que em Rondônia, Acre, Amazonas,
Roraima, Pará, Amapá e Tocantins, tem-se, respectivamente: 1.560.501 - 732.793
- 3.480.937 - 451.227 - 7.588.078 - 668.689 - 1.383.453 habitantes, segundo
dados da Fundação IBGE.
a. Classifique a variável.
56
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
16. A tabela abaixo representa a distribuição dos salários (em R$) de 100 pessoas:
200 150 120 300 500 120 100 200 350 100
250 350 125 140 140 150 200 350 500 600
120 200 140 150 250 100 120 150 200 600
500 150 250 350 450 430 425 600 120 150
350 600 120 150 135 170 450 100 200 100
100 250 220 230 350 600 500 150 100 250
120 100 120 120 240 350 120 100 200 142
250 350 120 100 100 550 450 400 300 200
100 350 150 180 190 200 300 500 100 150
120 100 200 150 140 120 500 600 100 150
57
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
a. Classifique a variável.
b. Construir uma distribuição de frequências com classes para os dados.
c. Determinar as frequências relativas percentuais.
d. Determinar as frequências absolutas acumuladas.
e. Determinar as frequências relativas acumuladas.
f. Construir o histograma e o polígono de frequências.
g. Calcular a média aritmética, a moda e a mediana.
h. Calcular os quartis, decil 4, percentil 30 e 80.
i. Calcular a variância, o desvio-padrão e o coeficiente de variação.
j. Analisar os resultados.
58
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PARFOR MATEMÁTICA - DISCIPLINA: ESTATÍSTICA
59
MODELO DE QUESTIONÁRIO FECHADO
É um questionário que não dar ao entrevistado a oportunidade de responder com suas próprias
opiniões, porque as respostas às perguntas do questionário foram fornecidas pelo pesquisador.
A seguir, exemplo de um questionário fechado.
1. Qual é a sua idade? _____ anos completos. Altura: ____ metros. Peso: ______
quilogramas. 2. Sexo: ( ) Masculino ( ) Feminino
6. Qual é a carga horária semanal aproximada de sua atividade remunerada? _____ horas
9. Em sua opinião, qual é a principal contribuição do curso na sua vida? (Marcar apenas uma
alternativa.)
a. ( ) A obtenção de diploma de nível superior;
b. ( ) A aquisição de cultura geral;
c. ( ) A aquisição de formação profissional;
d. ( ) A aquisição de formação teórica;
e. ( ) Melhores perspectivas de ganhos financeiros.
f. ( ) Outra. Qual? __________________________________________
MODELO DE QUESTIONÁRIO ABERTO
É um questionário que libera seus respondentes para poder responder e não determina a escolha
da resposta. A seguir, é apresentado um exemplo de questionário aberto.