Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
TÓPICO
1
INTRODUÇÃO: CONCEITOS E MÉTODOS
A palavra estatística provém do latim status, que significa estado. A primitiva utilização
da estatística envolvia compilações de dados e gráficos que descreviam vários aspectos de
um estado ou país. Em 1662, John Graunt publicou informes estatísticos sobre nascimentos
e mortes. No Brasil, em 1872, houve o primeiro censo geral da população brasileira feito pelo
Visconde do Rio Branco e em 1936 é criado no Brasil o Instituto Brasileiro de Geografia e
Estatística (IBGE).
2. CONCEITO DE ESTATÍSTICA
Estatística é uma parte da matemática aplicada que fornece métodos para coleta,
organização, análise e interpretação de dados e para a utilização dos mesmos na tomada
de decisões (CRESPO, 2000).
Estatística é um conceito e processos quantitativos que serve para estudar e medir os
fenômenos coletivos (SILVA, 1999).
Uma empresa que está se preparando para lançar um novo produto precisa conhecer
as preferências dos consumidores no mercado de interesse, para isso, pode fazer uma
pesquisa de mercado entrevistando um número de residências escolhidas aleatoriamente e
usar os resultados para estimar as preferências de toda a população.
A Estatística pode ser dividida em duas: Estatística Descritiva e Estatística Indutiva
ou Inferencial.
➢ Estatística Descritiva: é aquela que apenas descreve e analisa um conjunto de dados,
sem tirar conclusões.
➢ Estatística Indutiva ou Inferencial: trata das inferências e conclusões, isto é, a partir
da análise de dados são tiradas conclusões.
Método – é uma palavra que provém do termo grego methodos (“caminho” ou “via”) e
que se refere ao meio utilizado para chegar a um fim. O seu significado original aponta para
o caminho que conduz a lugares, é o conjunto de etapas ordenadas e dispostas a serem
vencidas para alcançar um determinado fim.
Ciência – significa o conjunto de conhecimentos específicos em relação a uma área do
saber.
Metodologia científica – significa a disciplina que ensina as normas técnicas para a
pesquisa científica.
➢ Crítica dos Dados: obtidos os dados, eles devem ser cuidadosamente criticados, à
procura de possíveis falhas e imperfeições, a fim de não incorrer em erros grosseiros ou de
Exercícios:
TÓPICO
2
AMOSTRAGEM
Estes exemplos dizem que uma variável pode ser: QUALITATIVA ou QUANTITATIVA.
➢ Qualitativa – quando seus valores são expressos por atributos: sexo (masculino –
feminino), cor dos olhos (azul, verde, castanho, preto) etc. Pode ser classificada em: nominal
ou ordinal.
✔ Nominal: dados que consistem apenas em nomes, rótulos ou categorias, não
podem estar em ordem. Exemplo: estado civil, cor da pele, etc.
✔ Ordinal: dados que podem ser dispostos em ordem, mas as diferenças entre
os valores dos dados não podem ser determinadas. Exemplo: nível de
escolaridade, colocação de um time de futebol na tabela, etc.
4 AMOSTRAGEM
Consiste em uma técnica especial para recolher amostras, que garante, tanto quanto
possível, o acaso na escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido,
o que garante à amostra o caráter de representatividade, e isto é muito importante, pois
nossas conclusões relativas à população estarão baseadas nos resultados obtidos nas
amostras dessa população.
Exemplo: Se são todos consumidores que vivem numa área de influência, se são todos os
clientes da sorveteria ou se só as crianças.
1º passo: passar a unidade de amostragem para as casas, permite retirar algumas unidades.
2º passo: saber se há crianças que compram uma vez por mês, outras uma vez por semana,
outras uma vez por dia.
Tabela 1: (Retirada de: STEVENSON, William J. Estatística aplicada à administração, São Paulo: Harbra, 1981)
Uma empresa tem 500 clientes cadastrados e se precisa obter uma amostra aleatória de
2% dos cadastros. Como se faz para usar a tabela de números aleatórios para extrair essa
amostra? Depois de numerar os cadastros pode-se escolher, por exemplo, percorrer a última
coluna da tabela de cima para baixo lendo os três primeiros algarismos de cada linha.
Os números obtidos dessa forma são: 380, 272, 750, 488, 224, 764, 309,192, 838, 466,
652, 344, 913, 412, 891, 286, 164, 097, 699, 607, 861, 592, 617, 337, 270, 944, 338, 599,
401.
Desprezando os números que são maiores do que 500 (e eventuais repetições) devem-
se tomar para a amostra os cadastros de números: 380, 272, 488, 224, 309, 192, 466, 344,
412 e 286.
Para calcular o valor percentual equivalente a estas 30 pessoas, faz-se o seguinte cálculo:
Exemplo: Determinar uma amostra de 200 pessoas de uma lista contendo 1000 integrantes.
Primeira etapa
Determinar um intervalo de tamanho
Exemplo: k = 1000 = 5
200
Neste caso o intervalo entre os nomes é 5
Deve-se selecionar os nomes de 5 em 5 da lista até chegar aos 200 nomes
Segunda etapa
Determinar o ponto de partida selecionando aleatoriamente um número entre 1 e 5.
Se o ponto de partida, por exemplo é a pessoa de número 3 da lista
A próxima pessoa escolhida é a quinta a partir da pessoa número 3, ou seja, a pessoa
com o número oito. E assim por diante.
Terceira etapa
Fazer a seleção de cinco em cinco a partir da pessoa número 3
3, 8, 13, 18, 23, 28, 33, 38, ...
Até chegar a 200 nomes.
TÓPICO
3
SÉRIES ESTATÍSTICAS
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem
assumir, para que se tenha uma visão global da variação dessa ou dessas variáveis. E isto
ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que
fornecerão rápidas e seguras informações a respeito das variáveis em estudo, permitindo
determinações administrativas e pedagógicas mais coerentes e científicas.
Tabela: tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-
se de alguns elementos indispensáveis. São eles: Título, Corpo, Cabeçalho, Coluna
Indicadora e Fonte.
a) Título – Conjunto de informações, as mais completas possíveis, localizadas no topo da
tabela, o título deverá responder as seguintes perguntas: o que? (Fato), onde? (Lugar) e
quando? (Tempo).
b) Corpo – Conjunto de linhas e colunas que contém informações sobre a variável em
estudo;
c) Cabeçalho – Parte superior da tabela que especifica o conteúdo das colunas;
d) Coluna Indicadora - Parte da tabela que especifica o conteúdo das linhas;
e) Linhas – Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que
se inscrevem nos seus cruzamentos com as colunas;
f) Casa ou Célula – Espaço destinado a um só número.
De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células deve-se
colocar:
➢ Um traço horizontal (_) quando o valor é zero;
➢ Três pontos (...) quando não temos dados;
➢ Um ponto de interrogação (?) quando se tem dúvida quanto à exatidão de
determinado valor;
➢ Zero (0) quando o valor é muito pequeno para ser expresso na unidade utilizada.
g) Fonte – Indicação do órgão ou entidade responsável pelo fornecimento dos dados. Deve-
se mencionar sempre a origem dos dados que estão sendo apresentados quando a tabela
for montada pelo pesquisador, a fonte será “o pesquisador”, e quando a tabela for criada
com dados sem fonte alguma, esta será hipotética. A fonte é colocada no rodapé.
➢ ELEMENTOS COMPLEMENTARES:
Como o próprio nome sugere, elementos complementares são aqueles que
complementam a tabela, mas nem sempre são obrigatórios. Exemplos de elementos
complementares são as Notas e Chamadas:
Exemplo 1:
Título
Coluna
indicadora
PRODUÇÃO DE CAFÉ NO
BRASIL – 1996 a 2000
ANOS PRODUÇÃO (1000t) Cabeçalho
1996 2536
1997 2666
Corpo
1998 2122
1999 3750
Rodapé 2000 2007
Total 13081
Tabela 5: Produção de Café no Brasil – 1996 a 2000
Fonte: Dados Hipotéticos
Exemplo:
MUNICÍPIOS Nº DE ALUNOS
Florianópolis 10.200
Blumenau 0
Joinville 6.400
Tubarão …
Chapecó 640
Lages 2.800
Itajaí* 850
São José 1.850
Palhoça -
Tabela 6: Matrícula Ensino EAD – SC – 2010
Fonte: Dados Hipotéticos
Nota: Foram considerados só ps maiores municípios
*Chamada: Não inclui os alunos de 2010
Exemplo:
ANOS QUANTIDADES (t)
1995 3.570.115
1996 4.504.201
1997 5.448.835
1998 4.373.226
1999 4.024.813
Total 21.921.190
Exemplo:
REGIÃO QUANTIDADE (1000 dúzias)
Norte 66.092
Nordeste 356.810
Sudeste 937.463
Sul 485.098
Centro-Oeste 118.468
Total 1.963.931
Exemplo:
ESPÉCIE QUANTIDADE (1000) Cabeças
Bovinos 139.599
Equinos 5.855
Suínos 32.121
Ovinos 20.085
Caprinos 11.313
Coelhos 909
Total 209.882
Tabela 9: Rebanhos Brasileiros – 2000
Fonte: Dados Hipotéticos
Exemplo:
REGIÃO 1997 1998 1999
Norte 373.312 403.712 457.741
Nordeste 1.440.531 1.567.006 1.700.467
Sudeste 8.435.308 8.892.409 8.673.660
Sul 2.106.145 2.192.762 2.283.581
Centro-Oeste 803.013 849.401 944.075
Total 13.158.309 13.905.290 14.059.524
Tabela 10: Telefones instalados 1997 – 1999
Fonte: Dados Hipotéticos
Classifique as séries.
➔ Diagramas: são gráficos geométricos de, no máximo, duas dimensões; para sua
construção, em geral, fazemos uso do sistema cartesiano.
➔ Dentre os principais diagramas, destacamos: Gráfico em linha ou em curva; Gráfico
em coluna ou em barras; Gráfico em colunas ou em barras múltiplas; Gráfico em setores.
Gráfico em linha ou em curva: Os dados, geralmente de uma série (tabela), são colocados
num sistema cartesiano ortogonal. Graficamente, temos pontos ligados por segmentos de
reta.
30
25
Unidades vendidas
20
15
10
0
0 1 2 3 4 5 6 7
Mês
Exemplo:
DESEMPENHO (%)
CANDIDATOS
MÊS
A B C
Janeiro 12 30 40
Fevereiro 16 25 36
Março 20 20 40
Abril 24 18 32
Maio 30 20 35
Tabela 12: Desempenho dos candidatos 1º semestre – 2001
Fonte: Dados Fictício
45
40
35
30
25
20
15
10
5
0
Janeiro Fevereiro Março Abril Maio
Exemplo:
a) Gráfico em Colunas
200
Quantidades
150
100
50
0
Mau contato Motor queimado Pintura Amassado
Defeitos
b) Gráfico em Barras
ESTADOS QUANTIDADES
Santa Catarina 13.973
Minas Gerais 13.389
Rio Grande do Sul 6.892
Goiás 6.130
São Paulo 4.179
Fonte: Dados Hipotéticos
São Paulo
Goiás
Estados
Minas Gerais
Santa Catarina
Exemplo:
Exemplo:
REBANHOS BRASILEIROS – 1988
Bovinos
140 Suínos
Ovinos
203
Caprinos
Total
32
11 20
EXECUTIVOS E
FAZENDEIROS E EMPRESÁRIOS
PROFISSIONAIS OPERÁRIOS (%)
PARTIDOS (%)
LIBERAIS (%)
1940 1960 1980
PMDB 37 62 1
DEM 39 60 0,3
PP 50 50 0
PDT 19 76 4
PT 0 80 19
Fonte: Dados Hipotéticos
Exemplo:
É um dos processos gráficos que melhor fala ao público, pela sua forma ao
mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras que
constituem as barras.
Azul:
Preto:
Branco:
Verde:
Vermelho:
Amarelo:
= 2 Bermudas
Exercícios:
TÓPICO
4
DISTRIBUIÇÃO DE FREQUÊNCIA
Tabela Primitiva
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
Rol
150 151 152 153 154 155 155 155 155 156
156 156 157 158 158 160 160 160 160 160
161 161 161 161 162 162 163 163 164 164
164 165 166 167 168 168 169 170 172 173
a) Classe: são intervalos de variação da variável e é simbolizada por (i) e o número total
de classes simbolizada por (k).
Exemplo: Na tabela anterior k=5 e 160 l- 165 é 3ª classe, onde i=3.
b) Limites de Classe: são os extremos de cada classe. O menor número é o limite inferior
de classe (li) e o maior número, limite superior de classe (Ls).
Exemplo: Na tabela anterior 160 l- 165 - i3=160 e L3=165.
O símbolo (l-) representa um intervalo fechado à esquerda e aberto à direita. O dado 165
do Rol não pertence a classe 3 sim a classe 4 representada por 165 l- 170.
g) Ponto Médio da Classe: É o ponto que divide o intervalo de classe em duas partes
iguais, simbolizado por (xi).
𝑙𝑖 +𝑙𝑠
Fórmula: 𝑥𝑖 = 2
1234566778233456678823445
6678923455667892345567789
Rol:
1222223333334444445555555
6666666667777777888888999
Resolução:
NOTAS 1 2 3 4 5 6 7 8 9 Total
FREQUÊNCIA (fi) 1 5 6 6 7 9 7 6 3 50
Tabela 15: Notas obtidas por 50 Alunos de uma classe
Fonte: Dados Hipotéticos
b) Para construir uma distribuição de frequência com intervalo de classe, primeiro deve-
se calcular o número de classes (k) que terá a Distribuição de Frequência. Ela poderá ser
elaborada a partir da regra de Sturges ou não.
Neste exemplo utiliza-se o logaritmo de 50 (n = 50 notas) que corresponde a 1,7.
146 150 150 150 153 153 155 157 158 158
158 158 159 159 162 162 162 162 162 163
163 164 164 164 166 166 168 70 170 170
171 172 173 175 175 176 177 178 178 178
179 179 180 181 181 185 188 192 195 196
TÓPICO
5
MEDIDAS DE POSIÇÃO E DISPERSÃO
Identificar os números mais alto e mais baixo no conjunto. Neste caso, o número mais
baixo no conjunto é 12 e o número mais alto é 43. Subtrair 12 de 43 (43 - 12) para obter 31,
a amplitude do conjunto.
É a medida mais popular de tendência central. A média aritmética de (n) números é a sua
soma dividida por (n).
➔ DADOS NÃO-AGRUPADOS:
Exemplo: Sabendo-se a produção leiteira da vaca A, durante uma semana, foi de 10, 14,
13, 15, 16 18 e 12 litros, para produção média da semana:
10 + 14 + 13 + 15 + 16 + 18 + 12 98
𝑥̅ = = = 14 𝑙𝑖𝑡𝑟𝑜𝑠
7 7
Neste caso, como as frequências são números indicadores de cada valor da variável,
elas funcionam como fatores de ponderação, o que leva a calcular a média aritmética
ponderada, dada pela fórmula:
∑𝒙𝒊𝒇𝒊
𝐱̅ =
∑𝒇𝒊
Nº DE FILHOS fi xi.fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Total 34 78
Temos então:
∑𝑋𝑖𝑓𝑖 78
x̅ = = = 2,29 = 2 𝑚𝑒𝑛𝑖𝑛𝑜𝑠
∑𝑓𝑖 34
∑𝑋𝑖𝑓𝑖
x̅ =
∑𝑓𝑖
∑𝑋𝑖𝑓𝑖 6440
x̅ = = = 161
∑𝑓𝑖 40
Exercícios:
1. As idades dos jogadores de um time de basquetebol são 18, 23, 19, 20 e 21 anos. Qual
a média de idade desses jogadores?
2. Entre sessenta números, vinte são iguais a 5, dez iguais a 6, quinze são iguais a 8, dez
são iguais a 12 e cinco iguais a 1. Determine a média aritmética desses números.
MODA (MO): É o valor que ocorre com a maior frequência em uma série de valores. Ás
vezes, num conjunto de dados pode-se ter ou não a moda. Não tendo moda, será amodal.
Quando houver mais de uma moda, será multimodal ou bimodal para duas modas e trimodal
para três modas.
➔ DADOS NÃO-AGRUPADOS
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar
o valor da variável de maior frequência.
A classe que apresenta a maior frequência é denominada classe modal. Pela definição,
pode-se afirmar que a moda, neste caso, é o valor dominante que está compreendido entre
os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto médio da
classe modal.
Dá-se a esse valor a denominação de moda bruta.
𝑙+𝐿
Tem-se, então: 𝑀𝑜 = 2
l = limite inferior da classe modal.
L = limite superior da classe modal.
i 1 2 3 4 5 6 Total
ESTATURAS 150 l- 154 154 l- 158 158 l- 162 162 l- 166 166 l- 170 170 l- 174
fi 4 9 11 8 5 3 40
4
𝑀𝑜 = 5 + 8 ⋅ 2 𝑀𝑜 = 5 + 0,5 ⋅ 2 𝑀𝑜 = 5 + 1 𝑀𝑜 = 6
MEDIANA (MD):
➔ DADOS NÃO-AGRUPADOS
Em seguida, toma-se aquele valor central que apresenta o mesmo número de elementos
à direita e à esquerda. No exemplo, esse valor é o 10, já que, nessa série, há quatro
elementos acima dele e quatro abaixo.
Se, porém, a série dada tiver um número par de termos, a mediana será, por definição,
qualquer dos números compreendidos entre dois valores centrais da série. Convencionou-
se utilizar o ponto médio.
10 + 12 22
𝑀𝑑 = = = 11
2 2
Nº DE MENINOS 0 1 2 3 4 Total
Fi 2 6 10 12 4 34
Fa 2 8 18 30 34
Fonte: Dados Hipotéticos
∑𝑓𝑖 34
= = 17
2 2
A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2
da variável, sendo este o valor mediano. 𝑀𝑑 = 2 𝑚𝑒𝑛𝑖𝑛𝑜𝑠
∑𝑓𝑖
2
∑𝑓𝑖
2
li= limite inferior da classe mediana.
Fa (anterior) = frequência acumulada da classe anterior à da mediana.
fi= frequência da classe mediana.
hi= amplitude da classe mediana.
∑𝑓𝑖
− 𝐹𝑎(𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟)
𝑀𝑑 = 𝑙𝑖 + { 2 } ⋅ ℎ𝑖
𝑓𝑖
L CLASSES Fi xi Fa
1 1 l- 3 2 2 2
2 3 l- 5 4 4 6
3 5 l- 7 8 6 14
4 7 l- 9 4 8 18
5 9 l- 11 2 10 20
Total 20
Fonte: Dados Hipotéticos
∑𝑓𝑖 20
= = 10
2 2
A classe da mediana é i3.
∑𝑓𝑖 2𝑜
−𝐹𝑎(𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟) −6 (10−6)
2
𝑀𝑑 = 𝑙𝑖 + { } ⋅ ℎ𝑖 𝑀𝑑 = 5 + { 2 8 ⋅ 2} 𝑀𝑑 + 5{ ⋅ 2}
𝑓𝑖 8
𝑀𝑑 = 5 + () ⋅ 2 𝑀𝑑 = 5 + 0,5 ⋅ 2 𝑀𝑑 = 5 + 1 𝑀𝑑 = 6 𝑝𝑜𝑛𝑡𝑜𝑠
Nota:
1 e 3 – Utilizar dados dos alunos (idade ou estatura).
2, 4 e 5 – Utilizar a tabela abaixo para realizar os exercícios
Distribuição de frequência das áreas de 400 lotes de um loteamento.
ÁREAS (m²)_ 300 I– 400 I– 500 I– 600 I– 700 I– 800 I– 900 I– 1000 I– 1100 I– 1200
Nº DE LOTES 14 46 58 76 68 62 48 22 6