Escolar Documentos
Profissional Documentos
Cultura Documentos
UNOCHAPECÓ
DISCIPLINA: ESTATÍSTICA
Prof.:Fernando Tosini
Chapecó - SC
Sumário
1 Conceitos Básicos 1
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 A incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.7 Bioestatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.8.3 Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.8.5 Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.8.11 Censo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.8.12 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.8.13 Atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
i
1.9 Natureza da Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.9.1 Variável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4.2 Rol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
ESTATÍSTICA Prof. Fernando Tosini
4 Medidas Descritivas 54
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2.2 Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2.3 Dominantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.4.1 Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.4.2 Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
iii
Capı́tulo 1
Conceitos Básicos
Resumo: O objetivo deste capı́tulo é apresentar importantes conceitos de estatı́stica e trabalhar a intuição do
aluno, para que, este raciocine em cima de problemas que são tipicamente solucionados com o uso de técnicas
estatı́sticas.
1.1 Introdução
Para iniciar toda a discussão, primeiramente é necessário conhecer melhor o conceito de estatı́stica.
Hoje em dia, é comum, a mı́dia divulgar estatı́sticas. Diariamente, são divulgadas informações, tais
como:
O primeiro cuidado que devemos tomar é distinguir as estatı́sticas (valores numéricos que resu-
mem informações) da Estatı́stica que ganhou status de ciência. Esta distinção, será feita da seguinte
forma, a Estatı́stica como ciência terá sempre a primeira letra maiúscula, enquanto a estatı́stica que
transmite uma informação numérica, será mencionada com a primeira letra minúscula.
Como a definição de Estatı́stica não é única, a primeira definição de Estatı́stica, segundo o di-
1
ESTATÍSTICA Prof. Fernando Tosini
Parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre
uma população ou sobre uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou
Nesta definição, a Estatı́stica é definida como parte da matemática. Entretanto, a Estatı́stica já se
desenvolveu o bastante para ocupar um campo no cenário cientı́fico como ciência que possui métodos
e técnicas próprias.
Enquanto, o famoso matemático John Tukey, que muito contribuiu para a Estatı́stica, a caracterizou
como:
“É uma ciência e não apenas um ramo da matemática, embora ferramentas da matemática sejam essenciais”.
Em uma pesquisa rápida, é possı́vel encontrar várias definições para Estatı́stica, das quais citaremos
algumas:
“Ciência que coleta, classifica e avalia numericamente fatos que servirão de base para inferência”.
“Ciência da Incerteza”.
Estatı́stica é a ciência que tem por objetivo planejar, coletar, tabular, analisar e interpretar informações e
delas extrair conclusões que permitam a tomada de decisões certas mediante incertezas.
Estatı́stica é um campo dedicado à coleta, ao processamento e à análise de dados, com objetivo de reduzir as
incertezas sobre o que está em avaliação e apresentar os resultados com a menor margem de erro possı́vel.
conceito de incerteza está vinculado à aplicação dos métodos e técnicas de análise estatı́stica.
1.1.1 A incerteza
A incerteza permea várias áreas do conhecimento: fı́sica, ciências sociais, comportamento humano,
economia e ciências naturais. O tratamento quantitativo adequado a incerteza é obtido por meio do
2
ESTATÍSTICA Prof. Fernando Tosini
Em torno deste fenômeno há uma série de incertezas, por exemplo: a quantidade de pessoas na
etc.
Mesmo que um indivı́duo procure informações prévias sobre todos estes elementos, sob os quais
paira a incerteza, ainda assim não será possı́vel predizer o desfecho. Podemos, por exemplo, analisar
as condições do tempo, obter informações sobre o tráfego, ligar para a agência bancária e, ainda assim,
As aplicações da estatı́stica se desenvolveram de tal forma que, hoje, praticamente todo o campo
qualidade;
• Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas estatı́sticas
• Visando reduzir as taxas de casos fatais, os legisladores têm melhor justificativas para leis, como
etc.
De acordo com o campo de aplicação, a estatı́stica recebe uma terminologia especializada dentro
3
ESTATÍSTICA Prof. Fernando Tosini
Não é de hoje que ocorrem abusos com a estatı́stica. Assim é que , há cerca de um século, o estadista
Benjamin Disraeli disse: “Há três tipos de mentiras: as mentiras, as mentiras sérias e as estatı́sticas”.
Já se disse também que “os números não mentem, mas os mentirosos forjam os números” (Figures
don’t lie; liars figure) e que “se torturarmos os dados por bastante tempo, eles acabam por admitir
qualquer coisa”. O historiador Andrew Lang disse que algumas pessoas usam a estatı́stica “como
um bêbado utiliza um poste de iluminação, para servir de apoio e não para iluminar”. Todas essa
afirmações se referem aos abusos da estatı́stica quando os dados são apresentados de forma enganosa.
Eis alguns exemplos das diversas maneiras como os dados podem ser distorcidos.
e Teoria das Probabilidades, Técnicas e Métodos Estatı́sticos, Computação, Métodos de Análise Estatı́stica e
Disciplinas Prolissionalizantes.
A exploração das diversas bases de dados estatı́sticos, hoje existentes, requer um profissio-
nal capaz de extrair relevantes informações através do uso de modernas técnicas de amostragem,
4
ESTATÍSTICA Prof. Fernando Tosini
A formação do estatı́stico desenvolve aptidões que lhe permitam solucionar problemas atuando
É preciso, pois:
desde a elaboração da pesquisa até o cálculo de determinada medida. Pode ser definda, como
um conjunto de dados, afim de que possamos, tirar conclusões a respeito das caracterı́sticas de
interesse.
frequência servem para agrupar informações de modo que estas possam ser analisadas.
ii) Gráficos: O objetivo da representação gráfica é dirigir a atenção do analista para alguns
sequencial.
iii) Medidas numéricas: Por meio de medidas ou resumos numéricos, podemos levantar
importantes informações, sobre o conjunto de dados, tais como: medidas de posição (média,
5
ESTATÍSTICA Prof. Fernando Tosini
função desses dados, até chegar à conclusões cientı́ficas. O alicerce das técnicas de estatı́stica
i) Técnicas de Amostragem: Estuda métodos para levantar amostras que sejam representa-
Conveniência.
Estas estimativas podem ser pontuais (representadas por um único valor) ou intervalares.
acerca de uma quantidade não conhecida e utilizar, também, dados incompletos para criar
uma regra de escolha. Os testes que se destacam são: Teste t-student, Anova e Qui-
quadrado.
Na sequência, será apresentada duas situações reais, que usam a técnicas de resolução da Estatı́stica
inferencial.
Exemplo 1.1 Um instituto de pesquisa deseja estimar a proporção de eleitores do partido de situação no primeiro
turno das eleições presidenciais. Ao coletar uma amostra de 1200 eleitores, a proporção foi estimada em 54%.
No Exemplo 1.1, a quantidade a ser estimada é a proporção de eleitores que votarão no partido
de situação nas eleições presidenciais. Somente a realização das eleições revelará esta quantidade.
Entretanto, estimá-la, com base em uma amostra, auxilia a tomada de decisões tais como a alteração
6
ESTATÍSTICA Prof. Fernando Tosini
Exemplo 1.2 Em uma fábrica de parafusos, a peça é considerada dentro da especificação caso seu comprimento
esteja no intervalo entre 4,8 cm e 5,2 cm. Os técnicos de controle de qualidade selecionam diariamente 100
parafusos fabricados e calculam o comprimento médio. Conhecendo a variabilidade nos tamanhos dos parafusos
fabricados, caso o comprimento médio esteja abaixo de 4,8 cm ou acima de 5,2 cm, o processo será interrompido.
esteja dentro de um intervalo. Caso isto não ocorra, o processo de produção sofre uma interrupção.
Neste caso, a estatı́stica inferencial é utilizada para criar uma regra de decisão com base em observações
Desde a antigüidade o homem fez descobertas que o levaram a desenvolver muitos dos conhe-
cimentos que hoje temos. Naquela época, não se aplicavam métodos, as descobertas eram feitas por
acaso ou necessidades práticas. Atualmente, quase todo o acréscimo de conhecimento se dá por
aplicações de métodos de observação e estudo. Mesmo que muito desse conhecimento tenha sido
adquirido por acaso, o seu desenvolvimento se deu com base em métodos muito bem estudados e
método, onde o pesquisador mantém as variáveis do estudo constantes, menos uma, sendo esta
modificada para se observar qual o resultado que ela apresenta no estudo. Por exemplo, para
fazer café, você usa 1/2 litro de água, 3 colheres de café, um coador, 4 colheres de açúcar. Se você
repetir esta receita diversas vezes é em provavél que todas as vezes você tenha o mesmo tipo de
resultado. Todavia, se for alterado algum dos fatores, como aumentar quantidade de água por
exemplo o café ficará mais aguado, se aumentar o açúcar, ficará mais doce e assim por diante.
• O Estatı́stico: Esse método é o mais usado pela estatı́stica, nele é impossı́vel manter as causas
ou fatores constantes, neste caso, deve-se admitir todos os valores dessas variáveis e analisá-los,
procurando determinar qual é a influência que cada fator apresenta no resultado final. Por
exemplo, uma empresa teve uma queda nas vendas no mês de julho. Os estudos indicam que
este mês foi férias escolares, aumentou o fluxo de turistas na região, porém foi mais frio, nosso
7
ESTATÍSTICA Prof. Fernando Tosini
concorrente baixou o preço dele, nosso produto perdeu em qualidade. Qual desses fatores
1.7 Bioestatı́stica
mias, habitação, educação etc. Esse ambiente denomina-se de Ambiente Macro, porque se refere
ii) O segundo ambiente refere-se à elaboração de experiências e pesquisa cientı́fica, tais como testes
Ambiente Micro, porque tem a ver com o pesquisa laboratorial e cientı́fica, relacionada as disciplinas
Fenômeno Estatı́stico é qualquer evento ou acontecimento que se pretenda analisar, cujo estudo
• Fenômenos de massa ou coletivos: São aqueles que não podem ser definidos por uma simples
• Fenômenos individuais: São aqueles que compõe os fenômenos de massa. Exemplo: Cada
nascimento em Chapecó.
para o particular.
8
ESTATÍSTICA Prof. Fernando Tosini
População é o conjunto de elementos (valores, pessoas, medidas etc) que tem pelo menos uma
contar. Geralmente está associada a processos. Exemplos: Uma colônia de bactérias; O número
1.8.3 Amostra
Note:
Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma
irá depender do tamanho da amostra. Se a freqüência relativa entre amostra e população for menor
do que 5% ela é considerada infinita, se a freqüência relativa for maior do 5% ela é considerada
finita.
Dado estatı́stico é qualquer caracterı́stica que possa ser observada ou medida de alguma maneira.
Esses dados são chamados de matérias-primas da estatı́stica, sobre a qual serão aplicados os métodos
1.8.5 Parâmetros
Parâmetro é uma medida numérica que descreve uma caracterı́stica de uma população. Por
9
ESTATÍSTICA Prof. Fernando Tosini
Dados primários são dados coletados pelo próprio pesquisador e sua equipe.
Dados secundários são dados que não foram obtidos pelo pesquisador e sua equipe e sim por
institutos de pesquisa como IBGE (Instituto Brasileiro de Geografia e Estatı́stica), DATASUS (Banco
São estatı́sticas coletadas, tratadas e divulgadas por órgãos do governo (IBGE- Instituto Brasi-
Por exemplo: FGV - Fundação Getúlio Vargas, DIEESE - Departamento Intersindical de Estatı́stica e
10
ESTATÍSTICA Prof. Fernando Tosini
1.8.11 Censo
O censo ou recenseamento demográfico é um estudo estatı́stico (ou uma coleção de dados) refe-
rente a todos os elementos de uma populacão, que possibilita o recolhimento de várias informações,
tais como o número de homens, mulheres, crianças e idosos, onde e como vivem as pessoas. Esse
1.8.12 Amostragem
população, no qual deve seguir um método criterioso e adequado determinado pelo tipos de amos-
tragem.
1.8.13 Atributos
1.9.1 Variável
podendo ter resultados numéricos ou não. Seus valores variam de indivı́duo a indivı́duo. Por
exemplo, a idade, a cor, o sexo, o tipo sanguı́neo, o nı́vel de hemoglobina no sangue, etc.
• Variável Quantitativa: São aquelas que são numericamente mensuráveis. Por exemplo, a idade,
a altura, o peso.
– Variável Quantitativa Contı́nua: São aquelas que assumem valores dentro de um conjunto
11
ESTATÍSTICA Prof. Fernando Tosini
– Variável Quantitativa Discreta: São aquelas que assumem valores dentro de um tempo finito
Exemplos: o número de filhos de uma pessoa, o número de cigarros fumados por dia.
• Variável Qualitativa: São aquelas que se baseiam em qualidades ou atributos e não podem ser
mensuráveis numericamente.
– Variável Qualitativa Ordinal: São aquelas que podem ser colocadas em ordem.
nal), mês de observação (janeiro, fevereiro,..., dezembro), o peso (pouco pesados, pesados,
muito pesados).
– Variável Qualitativa Nominal: São aquelas que não podem ser ordenadas.
Exemplos: a cor dos olhos, o local de nascimento, o sexo, fumante/não fumante, do-
ente/sadio.
Esquematizando:
Contı́nua
Quantitativa
Discreta
Variável
Ordinal
Qualitativa
Nominal
Exemplos:
12
ESTATÍSTICA Prof. Fernando Tosini
• A variável idade, medida em anos completos, é quantitativa contı́nua; mas, se for informada
• O peso dos lutadores de boxe, uma variável quantitativa contı́nua, se trabalhamos com o
valor obtido na balança, mas torna-se qualitativa ordinal se o classificarmos nas categorias
2. Outro ponto importante é que nem sempre uma variável representada por números é quantita-
tiva.
Exemplos:
fêmea, isto não significa que a variável sexo passou a ser quantitativa.
e o tipo de urticária pertencem ao grupo das variáveis qualitativas nominais, e por fim o tempo de
13
ESTATÍSTICA Prof. Fernando Tosini
É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou
Amostragem.
como levantar informações sobre o assunto de estudo. (Elaboração do questionário, tipo de levanta-
mento (censo ou amostra), cronograma de execução, exame das informações disponı́veis, orçamento,
etc).
3◦ Coleta dos Dados: É uma fase operacional. Trata da coleta e registro sistemático de dados, com
direta é classificada de acordo com a forma em que os dados formaram coletados; em:
mentos, etc.
iii) Coleta ocasional: Realizada para atender uma situação ou uma emergência. Exemplos,
• Coleta Indireta : É feita por deduções a partir dos elementos conseguidos pela coleta direta,
por analogia, por avaliação, indı́cios ou proporcionalização, ou seja, feita através de outras
14
ESTATÍSTICA Prof. Fernando Tosini
Os dados podem ser obtidos pela própria pessoa(primários) ou se baseia no registro de tercei-
ros(secundários).
4◦ Crı́tica dos Dados: Objetiva identificar possı́veis falhas, no levantamento dos dados, a fim de
5◦ Apuração dos Dados ou Sumarização: Significa fazer a contagem e agrupamento dos dados
organização. Há duas formas de apresentação: A apresentação tabular, ou seja, é uma apresentação
numérica dos dados em linhas e colunas distribuı́das de modo ordenado, segundo regras práticas
fixadas pelo Conselho Nacional de Estatı́stica. A apresentação gráfica dos dados numéricos, constitui
7◦ Análise e Interpretação dos Dados: A última fase do trabalho estatı́stico é a mais importante e
delicada. A análise das informações é feita por meio de comparações percentuais, gráficos ou ainda
Exemplo 1.4
Esta questão tem por objetivo conhecer o perfil dos acadêmicos do Curso de Ciência da Computação.
a) Sim b) Não
15
ESTATÍSTICA Prof. Fernando Tosini
6.1) b
6.2) b
6.3) a
Fonte: Autor
16
ESTATÍSTICA Prof. Fernando Tosini
11. Dê o significado das siglas IBGE, DATASUS e IBOPE? Qual a função de cada um?
15. Explique a diferença entre variável quantativa contı́nua de variável quantativa discreta?
16. Explique a diferença entre variável qualitativa ordinal de variável qualitativa nominal?
(b) Censo.
17
ESTATÍSTICA Prof. Fernando Tosini
(a) Universo
(b) Parte
(c) Pedaço
(e) Amostra
20. A parte da estatı́stica que se preocupa somente com a descrição de determinadas caracterı́sticas
(b) Uma medida numérica que descreve uma caracterı́stica de uma população
(d) Um conjunto de dados que não são coletados pelo pesquisador e sua equipe
(e) É uma medida numérica que descreve várias caracterı́stica de uma popu- lação
18
ESTATÍSTICA Prof. Fernando Tosini
19
ESTATÍSTICA Prof. Fernando Tosini
numéricos.
(b) ( ) Sempre que estivermos trabalhando com números, deveremos utilizar a Inferência
Estatı́stica.
20
Capı́tulo 2
Séries Estatı́sticas
Resumo: O objetivo deste capı́tulo é apresentar as normas para construção de uma tabela, os critérios de
Nacional de Estatı́stica. As normas de apresentação são editadas pelo Intituto Brasileira de Geografia
e Estatı́stica (IBGE).
Tabela é uma forma resumida de apresentar um conjunto de dados. Geralmente, uma tabela
corpo
Rodapé:
21
ESTATÍSTICA Prof. Fernando Tosini
• Coluna Indicadora: coluna que contém as discriminações correspondentes aos valores dis-
• Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna.
• Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de
Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação geral e chamada -
Notação Convencional
A substituição de uma informação da tabela, poderá ser feita pelos sinais abaixo:
ii) ... Quando não temos os dados; iv) 0 Quando o valor for muito pequeno.
22
ESTATÍSTICA Prof. Fernando Tosini
2◦ ) Se o primeiro algarismo, após aquele que queremos arredondar for de 6 a 9, acrescenta-se uma
3◦ ) Se o primeiro algarismo, após aquele que queremos arredondar for 5, seguido apenas de ze-
ros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ı́mpar,
desprezando os seguintes.
Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, aumen-
4◦ ) Quando, arredondarmos uma série de parcelas, e a soma ficar alterada, devemos fazer um novo
arredondamento (por falta ou por excesso), na maior parcela do conjunto, de modo que a soma
fique inalterada.
23
ESTATÍSTICA Prof. Fernando Tosini
Uma série estatı́stica, define-se, como toda e qualquer coleção de dados estatı́sticos referidos a
uma mesma ordem de classificação quantitativa. Em um sentido mais restrito, diz-se que uma série
Para diferenciar uma série estatı́stica de outra, temos que levar em consideração três fatores:
Também pode ser chamada série histórica, evolutiva ou marcha. É a série cujos dados estão
dispostos em correspondência com o tempo, ou seja, varia o tempo e permanece constante o fato e o
local.
Anos Produção
2013 2110
2014 2341
2015 2525
2016 2608
2017 2734
Total 12318
Fonte: Anuário Estatı́stico - 2018
24
ESTATÍSTICA Prof. Fernando Tosini
Também pode ser chamada série espaciais ou de localização. É a série cujos dados estão
dispostos em correspondência com o local, ou seja, varia o local e permanece constante a época e o
fato.
Região População
Norte 17.936.201
Nordeste 57.254.159
Sudeste 86.949.714
Sul 29.644.948
Centro-Oeste 15.875.907
Total 207.660.929
Fonte: IBGE
Também pode ser chamada série categórica. É a série cujos dados estão dispostos em corres-
pondência com a espécie ou qualidade, ou seja, varia o fato e permanece constante a época e o
local.
Localização População
Urbana 160.879.708
Rural 29.852.986
Total 190.732.694
Fonte: IBGE
A combinação entre duas ou mais séries constituem novas séries denominadas compostas e
apresentadas em tabelas de dupla entrada. O nome da série mista surge de acordo com a combinação
25
ESTATÍSTICA Prof. Fernando Tosini
Regiões
Anos N NE SE S CO
2013 16 983 484 55 794 707 84 465 570 28 795 762 14 993 191
2014 17 231 027 56 186 190 85 115 623 29 016 114 15 219 608
2015 17 472 636 56 560 081 85 745 520 29 230 180 15 442 232
2016 17 707 783 56 915 936 86 356 952 29 439 773 15 660 988
2017 17 936 201 57 254 159 86 949 714 29 644 948 15 875 907
Fonte: IBGE
Exemplo 2.2 Faça o arredondamento na segunda casa decimal, segundo os critérios do Instituto Nacional de
Pesos e Medidas.
a) Série 1.
Anos Toneladas
1991 29.543
1992 30.712
1993 40.663
Fonte: IBGE
b) Série 2.
Regiões Quantidade
Norte 211.209
Nordeste 631.040
Sudeste 1.119.708
Sul 418.785
Centro-Oeste 185.823
Fonte: IBGE
26
ESTATÍSTICA Prof. Fernando Tosini
(a) Tanto a nota quanto a chamada são usadas para esclarecimento geral sobre um quadro e
uma tabela.
(b) Tanto a nota quanto a chamada são usadas para esclarecer detalhes em relação à casa, linhas
(c) A nota é usada para esclarecer detalhes em relação a casas, linhas ou colunas enquanto a
(d) A nota é usada para esclarecimento geral sobre um quadro ou tabela enquanto a chamada
(c) Do IBGE;
3. De acordo com as normas para representação tabular de dados, quando o valor de um dado é
4. De acordo com as normas para representação tabular de dados, quando o valor de um dado é
27
ESTATÍSTICA Prof. Fernando Tosini
5. De acordo com as normas para representação tabular de dados, quando o valor de um dado é
muito pequeno, para ser expresso com o número de casa decimais utilizadas ou com a unidade
6. De acordo com as normas para representação tabular de dados, quando há dúvida, na exatidão
28
ESTATÍSTICA Prof. Fernando Tosini
29
ESTATÍSTICA Prof. Fernando Tosini
30
ESTATÍSTICA Prof. Fernando Tosini
(a) Série 1.
(b) Série 2.
31
Capı́tulo 3
Resumo: O objetivo deste capı́tulo é apresentar as formas de como, compactar ou resumir, amostras de dados
3.1 Introdução
informativos (Zero Hora, Correio do Povo, etc.), relatórios técnicos, monografias, dissertações, teses e
revistas cientı́ficas. São tabelas que apresentam de forma concisa o número de ocorrências (absoluta
Exemplo 3.1 Consideremos uma amostra de dados que representa a massa em kg de 20 acadêmicos.
50 65 70 80 50 72 72 80 65 72
70 70 50 72 65 65 72 70 70 70
Exemplo 3.2 Consideremos uma amostra de dados que representa a altura em cm de 20 acadêmicos.
160 160 162 163 163 165 167 168 170 170
171 172 174 174 175 177 178 178 178 180
32
ESTATÍSTICA Prof. Fernando Tosini
É o tipo de série estatı́stica na qual permanece constante o fato, o local e a época. Os dados
A representação gráfica desse tipo de distribuição, é feita em gráfico de linha, ou barras verticais,
Exemplos:
Anos Produção
1976 9702
1977 9332
1978 9304
1979 9608
1980 10562
Σ 485908
Fonte: Conjuntura Econômica (fevereiro 1983)
33
ESTATÍSTICA Prof. Fernando Tosini
iii) Gráfico de barras verticais de distribuição de frequência em classes unitárias: Este gráfico é
Caracterı́sticas:
Observações: As larguras das barras que deverão ser todas iguais podendo ser adotado
qualquer dimensão, desde que seja conveniente e desde que não se superponham. O
número no topo de cada barra pode ou não omitido, se forem conservados, a escala vertical
iv) As regras usadas para o gráfico de barras veticais são iguais as usadas para o gráfico de
barras horizontais.
34
ESTATÍSTICA Prof. Fernando Tosini
para variáveis nominais e ordinais. É um gráfico usado para dar ênfase à comparação das
três simples, onde as freqüências de cada classe correspondem ao ângulo que se deseja
Caracterı́sticas:
um intervalo, ou seja, as classes são não-unitárias. O intervalo de classe mais usado, é do tipo
ou ogivas.
Exemplos:
35
ESTATÍSTICA Prof. Fernando Tosini
utilizado para variáveis contı́nuas. As classes sempre estão representadas no eixo horizontal
Fonte: Autor
Caracterı́sticas:
horizontal são representadas os pontos médios das classes intervalares e no vertical a frequência.
Fonte: Autor
36
ESTATÍSTICA Prof. Fernando Tosini
iv) Ogivas de uma distribuição de frequência em classes não-unitárias: No eixo horizontal são
Fonte: Autor
Resumindo:
Gráfico de linha
Gráfico de barras verticais
Classe Pontual
Gráfico de barras horizontais
Gráfico de setores
Distribuição de frequência:
Histograma
Classe Intervalar
Polı́gono de frequência
Ogivas
37
ESTATÍSTICA Prof. Fernando Tosini
Na sequência é apresentado outras formas de representação gráfica de uma série de dados. Essas
representações são bastante usadas pelo IBGE, para compactar e representar algumas série de dados.
São gráficos usados para representar uma série mista(local + época). A representação é feita por
Exemplo:
Tabela 3.3: População Urbana do Brasil por Região de 1940 a 1980 (×1000)
Regiões
Anos N NE SE S CO
1940 406 3 381 7 232 1 591 271
1950 581 4 745 10 721 2 313 424
1960 958 7 517 17 461 4 361 1 007
1970 1 624 11 753 28 965 7 303 2 437
1980 3 037 11 567 42 810 11 878 5 115
Fonte: IBGE
38
ESTATÍSTICA Prof. Fernando Tosini
Pictogramas são gráficos semelhantes aos gráficos de barras, onde se utilizam sı́mbolos ou
imagens apelativos em substituição das barras. Esse tipo de gráfico tem por objetivo chamar atenção
do publico em geral, e, seu uso geralmente está associado à sinalização pública, instruções, orientações
e qualquer outro meio para transmitir informações. É muito comum, encontrar o uso de pictogramas
em diversos contextos cotidianos, como placas em shoppings, aeroportos, guias, manuais, mapas,
infográficos, etc.
Exemplos:
39
ESTATÍSTICA Prof. Fernando Tosini
Fonte:IBGE
Cartograma é a representação sobre uma carta geográfica, ou seja, é um mapa que mostra
informação quantitativa, com um certo grau de precisão geográfica das unidades espaciais mapea-
40
ESTATÍSTICA Prof. Fernando Tosini
Figura 3.13: Matriz de Pequenos Múltiplos com os mapas univariados representando casos totais, por
quilômetro quadrado e por 100 mil habitantes, para as ocorrências de Dengue, Chikungunya e Zika
no Brasil em 2016
Fonte: IBGE
41
ESTATÍSTICA Prof. Fernando Tosini
Figura 3.14: Mapa coroplético e de sı́mbolos proporcionais e com as ocorrências de Dengue, Chikun-
gunya e Zika no Brasil em 2016 e Mapa de hachuras bivariado sobre mapa coroplético representando
os casos de Dengue, Chikungunya e Zika por 100 mil habitantes no Brasil, em 2016.
Fonte: IBGE
É o tipo de gráfico em forma de uma polı́gono, ideal para representar séries temporais cı́clicas,
2) Constrói-se uma semi-reta (de preferência horizontal) partindo do ponto 0 (pólo) e com uma
4) Traça -se semi-retas a partir do ponto 0 (pólo) passando pelos pontos de divisão;
42
ESTATÍSTICA Prof. Fernando Tosini
5) Marca-se os valores correspondentes da variável, iniciando pela semi-reta horizontal (eixo polar);
Fonte: Autor
43
ESTATÍSTICA Prof. Fernando Tosini
Para organizar dos dados em tabelas de frequência, é necessário conhecer alguns elementos
3.4.2 Rol
Exemplo 3.3 Para uma amostragem de nota bimestral da disciplina de estatı́stica, foram escolhidos aleatóriamente
sete acedêmicos com as seguintes notas: 6, 6, 5, 3, 8, 7, 8. Apresente essa amostra de dados em rol?
Em rol, temos:
(3, 5, 6 , 6, 7, 8, 8) ou (8, 8, 7, 6, 6, 5, 3)
A amplitude de uma amostra de dados numéricos, é dada pela diferença, entre o maior e o menor
Exemplo 3.4 Considere a altura em metros de 12 jogadores de futebol: 1.59, 1.60, 1.65, 1.72, 1.58, 1.50, 1.43,
Observe que a maior medida da amostra é 1.72 m e a menor é 1.43 m. Assim, a amplitudade dessa
amostra é:
44
ESTATÍSTICA Prof. Fernando Tosini
Classe é cada subintervalo (linha) na qual dividimos o fenômeno, ou seja, é qualquer intervalo real
Uma classe é formada por dois valores extremos, o limite inferior(Li) e o limite superior(Ls), e
Li ⊢ − Ls ou Li − ⊣ Ls ou Li ⊢⊣ Ls
Ou
A diferença entre os valores extremos de cada classe é denominada amplitude da classe (Ac ), e
definida por:
Ac = Ls − Li (3.1)
freqüências intervalar.
As classes que possuem a mesma amplitude são denominadas classes homogêneas, caso contrário,
O ponto médio da classe (Xi ) é dado pela média aritmética simples do limite inferior com o limite
Obs: Quando substituirmos os intervalos de classes pelos pontos médios xi , temos uma distribuição
de frequência pontual, conforme mostra o item ii) do polı́gono de frequência a cima graficado.
Notas Gerais:
classe e a constituição das classes, é um problema para o qual não existe uma regra cem por eficiente.
45
ESTATÍSTICA Prof. Fernando Tosini
I) Quando o problema não especı́fica o número de classe, podemos adotar a fórmula de Sturges para
C = 1 + 3, 33 · log(n) (3.4)
informações.
Além da Regra de Sturges, existem outras fórmulas empı́ricas para resolver o problema para
√
determinação do número de classes [C], há quem prefere usar C n . Entretanto, a verdade é que
essas fórmulas não nos levam a uma decisão final, esta vai depender na realidade de um julgamento
pessoal, que deverá estar ligado a natureza dos dados, procurando, sempre que possı́vel, evitar classes
II) Se a e b são, respectivamente, o menor e o maior elemento da amostra, então, o extremo inferior
da primeira classe deve ser menor ou igual a a e o extremo superior da última classe deve ser maior
ou igual a b;
III) O extremo inferior de cada classe, apartir da segunda, deve ser igual ao extremo superior da
IV) Dependendo da notação utilizada na representação de cada classe os extremos destas pode ou
• Frequência relativa (Fri ): é a divisão de cada frequência pelo total de frequências. Neste caso,
46
ESTATÍSTICA Prof. Fernando Tosini
os valores da frequência relativa, devem ser devidamente arredondados afim de que totalize 1.
fi
Fri =
X
n
fi
i=1
classe com a freqüência percentual das classes anteriores, ou a freqüência percentual acumulada
da classe anterior.
X
n
Fpan = f pi = 100
i=1
vamos considerar duas situações para a distribuição de frequência, uma para classe unitária e outra
Nesse tipo de apresentação os valores observados não aparecerão individualmente, e sim agrupa-
dos em classes. Quando a variável objeto do estudo for contı́nua, será sempre conveniente agrupar
os valores observados em classes. Se, por outro lado, a variável for discreta e o número de valores
representativos dessa variável for muito grande, recomenda-se o agrupamento dos dados em classes,
evitando com isso grande extensão da tabela, aparecimento de diversos valores com frequência nula
Exemplo 3.5
A tabela abaixo mostra a distribuição de freqüência dos dados resultantes das emissões de um determinado gás
em um laboratório.
47
ESTATÍSTICA Prof. Fernando Tosini
Determine:
(i) A porcentagem de emissões que se mantiveram nos valores aceitáveis, maior igual 69 menor que 100
(µg/L).
Exemplo 3.6
153 154 155 156 158 160 160 161 161 161 162 162 163 163 164
164 165 166 167 167 172 173 173 174 174 175 175 176 177 178
179 179 180 182 183 184 185 186 186 187 188 188 189 189 190
191 192 192 192 192 193 194 194 195 197 197 199 200 201 205
(b) Separar essa amostra, em classes de mesma amplitude, e construir a tabela de distribuição de frequência.
48
ESTATÍSTICA Prof. Fernando Tosini
Exemplo 3.7
4 4 5 7 8 7 6 6 8 4 5 5 5 6 6 7 8 7 7 7
7 6 6 6 6 4 4 8 8 5 5 7 7 7 6 6 6 7 8 4
7 5 5 5 5 4 6 8 6 5 5 7 7 7 6 6 6 7 8 6
7 5 5 5 5 4 6 8 6 5 6 7 7 7 6 6 6 8 8 6
49
ESTATÍSTICA Prof. Fernando Tosini
(a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão
dispostos horizontalmente.
(b) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão
dispostos verticalmente.
(c) Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos
(d) Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos
3. Uma representação gráfica, comumente encontrada em jornais e revistas que inclui figuras de
Bebida Consumo
Vodka 100
Suco de Frutas 200
Água Mineral 400
Refrigerante 700
Cerveja 1600
50
ESTATÍSTICA Prof. Fernando Tosini
(c) A D. Rosa quer encerrar um dia por semana. Qual dia ela deve escolher? Porquê?
(d) Se um café custar R$ 3,50 qunato recebe a Dona Rosa pela venda de cafés durante um mês?
51
ESTATÍSTICA Prof. Fernando Tosini
Determine:
(b) Qual é o percentual de residências com consumo igual ou superior a 200 kwh, mas inferior
a 300 Kwh.
(c) Qual é o percentual de residências com consumo igual ou superior a 400 Kwh.
7. As rendas mensais em reais dos 25 ingressantes, num certo curso de pós-graduação em enge-
2, 90; 2, 90; 2, 95; 2, 95; 3, 10; 3, 10; 3, 15; 3, 20; 3, 20; 3, 25; 3, 30; 3, 40; 3, 45;
3, 45; 3, 50; 3, 65; 3, 65; 3, 80; 3, 90; 3, 90; 4, 00; 5, 00; 5, 20; 5, 50; 6, 40
(b) Separar essa amostra, em classes de mesma amplitude, e construir a tabela de distribuição
de frequência.
8. Uma pesquisa foi realizada na cidade de Chapecó, com o intúito de saber, qual tipo de carro
que o cidadão, utiliza diariamente, para deslocar-se ao trabalho. Dentre ônibus, carro e moto, o
2, 3, 2, 1, 2, 1, 2, 1, 2, 3, 1, 1, 1, 2, 2,
52
ESTATÍSTICA Prof. Fernando Tosini
3, 1, 1, 1, 1, 2, 1, 1, 2, 2, 1, 2, 1, 2, 3
(c) Admitindo que essa amostra represente bem o comportamento do cidadão chapecoense,
você acha que a porcentagem dos usuários que utilizam mais de um tipo de transporte é
grande?
6, 1 6, 2 6, 7 6, 5 6, 9 6, 3 7, 4 7, 6 7, 7 7, 6
7, 3 7, 7 7, 6 7, 4 7, 2 7, 2 7, 3 7, 6 7, 5 7, 4
7, 5 7, 7 8, 2 8, 3 8, 1 8, 1 8, 1 7, 9 7, 8 7, 4
7, 5 7, 6 7, 5 7, 6 7, 4 7, 3 7, 4 7, 5 7, 5 7, 4
10, 12, 18, 12, 15, 14, 10, 12, 11, 19, 13, 14, 10, 11, 15, 16, 22, 14, 12, 13
11. Os conteúdos de vinte caixas de leite longa-vida, apresentaram os seguintes volumes, em litro:
0, 98 1, 00 1, 01 0, 98 0, 99 0, 99 1, 01 1, 01 1, 00 0, 99
1, 00 1, 02 0, 98 0, 99 1, 00 0, 99 1, 00 1, 01 0, 98 0, 99
53
Capı́tulo 4
Medidas Descritivas
Resumo: O objetivo deste capı́tulo, é apresentar as duas principais medidas descritivas, sua diferenciação e as
4.1 Introdução
As medidas descritivas, são medidas numéricas que tem objetivo, descrever um conjunto de dados
São medidas que nos mostram o posicionamento dos elementos de uma amostra de números,
quando esta é dispota em rol. Dentro de uma amostra, essas medidas possuem carater representativo,
Média Aritmética
• Representativas: Médias:
Média Geométrica
Média Harmônica
54
ESTATÍSTICA Prof. Fernando Tosini
Mediana
Moda Bruta
Quartis
Moda de Czuber
• Separatrizes:
• Dominantes: Moda:
Moda de King
Decis
Centis ou Percentis Moda de Pearson
São medidas descritivas que tem por finalidade representar um conjunto de dados.
a) Média Aritmética
Onde:
população).
Embora, o cálculo de ambas seja feito da mesma forma, geralmente, os valores dessas médias são
próximos.
i) A soma algébrica dos desvios de um conjunto X = {x1 ; x2 ; ...; xn } com n números em relação
X
n
(xi − x̄) = 0
i=1
Demonstração:
X
n
xi
X
n X
n X
n X
n X
n
i=1
X
n X
n
(xi − x̄) = xi − x̄ = xi − n · x̄ = xi − n · = xi − xi = 0
n
i=1 i=1 i=1 i=1 i=1 i=1 i=1
55
ESTATÍSTICA Prof. Fernando Tosini
ii) A média de um conjunto de números X = {x1 ; x2 ; ...; xn } é também igual à média de cada
um destes números menos uma constante k, somada depois a essa mesma constante k, ou
seja:
X
n X
n
xi (xi − k)
i=1 i=1
x̄ = = +k
n n
Demonstração:
X
n X
n X
n X
n X
n X
n
xi (xi − k + k) (xi − k) k (xi − k) (xi − k)
i=1 i=1 i=1 i=1 i=1 n·k i=1
= = + = + = +k
n n n n n n n
iii) A soma dos quadrados dos desvios de um conjunto X = {x1 ; x2 ; ...; xn } com n números em
X
n
(xi − x̄)2 = minimo
i=1
a) A média aritmética das idades dos acadêmicos que cursam a disciplina de Estatı́stica.
Exemplo 4.2 A altura média de 22 estudantes de uma classe é 170 cm. Em um determinado dia faltaram
dois estudantes, um de altura 190 cm e outro de 170 cm. Determine a altura média dos estudantes
A média aritmética ponderada de um conjunto de dados x1 ; x2 ; ...; xn , aos quais são atri-
X
n
xi · pi
x1 · p1 + x2 · p2 + ... + xn · pn i=1
x̄ = = (4.2)
p1 + p2 + ... + pn X
n
pi
i=1
56
ESTATÍSTICA Prof. Fernando Tosini
Observação: Esta fórmula pode ser usada, para calcular a média a aritmética de dados agrupa-
Exemplo 4.3 Um acadêmico realizou seis provas de estatı́stica valendo 10 pontos e tirou 5; 8; 4; 6; 9 e 8.
Porém as provas tinham pesos 2; 1; 2; 3; 1 e 1. Calcule a média das notas desse acadêmico?
Exemplo 4.4 Uma industria produz diariamente três produtos, com respectivos lucros percentuais apre-
sentado na tabela.
X Vendas Lucro
Pregos 2500,00 30%
Parafusos 1500,00 50%
Rebites 750,00 40%
De modo geral, para dados agrupados em classe intervalares, a média aritmética é definida
por:
X
m
xi · fi
x1 · f1 + x2 · f2 + ... + xm · fm i=1
x̄ = = (4.3)
f1 + f2 + ... + fm Xm
fi
i=1
Onde:
Exemplo 4.5 A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de
acadêmicos.
57
ESTATÍSTICA Prof. Fernando Tosini
Exemplo 4.6 O histograma mostra a distribuição das idades de uma amostra de estudantes.
b) Média Geométrica
A aplicação da média geométrica deve ser feita, quando os valores do conjunto de dados
n 1
Y n √
G = xi = n x1 · x2 · ... · xn (4.4)
i=1
n v
X t n X
n
Y q
fi f fi f1 f2 f
G= xi i = x1 · x2 · ... · xnn (4.5)
i=1 i=1
i=1
Onde:
Observações:
58
ESTATÍSTICA Prof. Fernando Tosini
antibiótico.
Exemplo 4.7 Digamos que uma categoria de operários tenha um aumento salarial de 20% após um mês,
12% após dois meses e 7% após três meses. Qual o percentual médio mensal de aumento desta categoria?
Exemplo 4.8 Prove que a fórmula da média geomética pode ser apresentada na forma:
X
n
√
n
logb xi
G= (b) i=1
c) Média Harmônica
H, e definida por:
n −1
X 1 n
H = n · =
(4.6)
xi 1 1 1
i=1 + + ... +
x1 x2 xn
– Para dados tabelados:
n −1
X
n X fi
H= fi · = f1 + f2 + ... + fn
(4.7)
xi f1 f2 fn
i=1 i=1 + + ... +
x1 x2 xn
Onde:
fi é a freqüência da classe i;
Observação: A média harmônica nunca é maior do que a média geométrica ou do que a média
aritmética, é geralmente é utilizada para calcular a média de problemas, que envolvem dados
59
ESTATÍSTICA Prof. Fernando Tosini
Exemplo 4.9 Um ônibus viaja de A para B a 30 km/h, e volta no mesmo caminho B para A a uma
Exemplo 4.10 Use o exemplo anterior, e comprove a propriedade das médias: H ≤ G ≤ x̄.
Emprego da média
Resumindo:
60
ESTATÍSTICA Prof. Fernando Tosini
4.2.2 Separatrizes
São medidas de posição que divide o conjunto de dados em partes proporcionais, quando os
mesmos são ordenados (colocados em rol). De acordo com a divisão elas são classificadas em:
i(n + 1)
Posição = S
(4.8)
i=1
1≤i≤9
◦ Se for mediana:
◦ Se for decis:
S=2
S = 10
1≤i≤3
◦ Se for quartis:
1 ≤ i ≤ 99
S=4 ◦ Se for percentis:
S = 100
3; 5; 8; 9; 10; 10; 7; 3; 12
61
ESTATÍSTICA Prof. Fernando Tosini
Exemplo 4.12 A tabela apresenta o número de salários que os funcionários de uma industria recebem
mesalmente.
i·n
Posição = S (4.9)
Posição − Faant · Ac
Si = lSi + (4.10)
fSi
Onde:
Si = Md, para i = 1.
Si = Qi , para 1 ≤ i ≤ 3.
Si = Di , para 1 ≤ i ≤ 9.
Si = Pi , para 1 ≤ i ≤ 99.
Exemplo 4.13 A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 160
acadêmicos da Universidade.
62
ESTATÍSTICA Prof. Fernando Tosini
Emprego da mediana
ii) Há valores extremos que afetam de uma maneira acentuada a média;
Resumindo:
63
ESTATÍSTICA Prof. Fernando Tosini
4.2.3 Dominantes
São medidas descritivas que tem por finalidade, mostrar o elemente dominante em um conjunto
de dados.
Moda
A moda (Mo) é o valor mais frequente em um conjunto de dados. A moda pode não existir,
e, mesmo que exista, pode não ser única. De acordo com o número de moda que o conjunto de
a) 1; 1; 3; 3; 5; 7; 7; 7; 11; 13 c) 3; 5; 5; 5; 6; 6; 7; 7; 7; 11; 12
b) 3; 5; 8; 11; 13; 18 d) 5; 5; 6; 6; 7; 7; 8
Exemplo 4.15 A tabela apresenta o número de salários que os funcionários de uma industria recebem
mesalmente.
Dertemine a moda.
64
ESTATÍSTICA Prof. Fernando Tosini
modais são:
A moda bruta é simplesmente, o ponto médio xi da classe de maior freqüência (classe modal).
Mob = xi (4.11)
O processo para determinar a moda usado por Czuber leva em consideração as freqüências
Onde:
O processo proposto por King considera a influência existente das classes anterior e posterior
sobre a classe modal. A inconveniência deste processo é justamente não levar em consideração
a freqüência máxima.
!
fpos
Mok = lMo + · Ac (4.13)
fpos + fant
O processo usado por Pearson pressupõe que a distribuição seja aproximadamente simétrica,
Mop = 3 · Md − 2 · x̄ (4.14)
65
ESTATÍSTICA Prof. Fernando Tosini
Exemplo 4.16 A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 160
acadêmicos da Universidade.
Emprego da moda
ii) Quando a medida de posição deve ser o valor mais tı́pico da distribuição.
Resumindo:
66
ESTATÍSTICA Prof. Fernando Tosini
⋆ A média é a mais utilizada, principalmente quando não há valores aberrantes, sendo a medida
⋆ A mediana deve ser usada, sempre que possı́vel, como medida representativa de distribuições
fortemente assimétricas, pois o seu valor não é afetado por valores extremos;
⋆ A moda é usada quando há interesse em saber o ponto de concentração do conjunto ou o tipo de
distribuição que se está analisando, sendo que o seu valor, em se tratando de dados agrupados,
distribuição extremos
Mediana Divide a distribuição Menos sensı́vel a valo- Difı́cil de calcular, quando te-
dos
Moda Valor mais frequentes Valor tı́pico Não é utilisado em analises
matemática
Exemplo 4.17 Considere as notas das provas de estatı́stica realizada por 50 acadêmicos.
22 46 9 40 57 22 22 13 50 42
35 2 15 41 34 52 32 75 69 44
26 42 60 56 30 3 17 79 45 37
12 62 50 35 41 59 11 66 39 1
43 33 70 50 47 20 36 40 37 29
(d) O que se pode concluir, quando se compara os valoes obtidos no item a) e c).
67
ESTATÍSTICA Prof. Fernando Tosini
São medidas, que visam descrever os dados no sentido de informar o grau de dispersão ou
afastamento dos valores observados em torno de um valor central representativo chamado média.
Com essas medidas é possı́vel, informar se um conjunto de dados é homogêneo (pouca variabilidade)
Desvio extremo ou amplitude de variação
Desvio médio
Absoluta
Desvio padrão
Medidas de dispersão:
Variância ou desvio quadrático
Variância Relativa
Relativa
Coeficiente de variação de Pearson
exemplo prático.
Supondo que uma empresa, esteja realizando uma entrevista e análise curricular, para contratar
um funcionário. Ao final da entrevista, foram classificados apenas dois candidatos, para uma única
vaga. Então, para a escolha final, foi realizado 4 tarefas para cada um, onde, as mesmas tiveram como
Tarefas 1 2 3 4
Candidato 1 (tempo) 45 55 52 48
Candidato 2 (tempo) 30 70 40 60
Fonte: Autor
Análise gráfica
68
ESTATÍSTICA Prof. Fernando Tosini
Como se pode notar nos gráficos, os candidatos possuem a mesma média, porém, a dispersão
dos dados em torno da média do candidato 1, é menor do que o do candidato 2. Isso quer dizer, que,
durante a execução das tarefas, o canditato 1 obteve, tempos mais próximos da média, isto significa
Observação:
◦ Conjunto de dados são melhor analisado, quando se utiliza medida de tendência central e medida
de dispersão, pois, é comum encontrar-se séries que, apesar de apresentarem a mesma média, são
◦ Só as medidas de tendência central, geralmente, são insuficientes para descrever ou analizar
O desvio médio absoluto de uma amostra de dados, com n números, x1 ; x2 ; ...; xn , é representada
69
ESTATÍSTICA Prof. Fernando Tosini
X
n
|xi − x̄|
i=1
Dma = (4.16)
n
X
n
fi · |xi − x̄|
i=1
Dma = X
n (4.17)
fi
i=1
Onde:
fi é a freqüência da classe i;
Desvio Padrão
v
u
u
u
u
u X
n
t
(xi − x̄)2
i=1
σ= (4.18)
n
v
u
u
u
u
u X
n
t
(xi − x̄)2
i=1
s= (4.19)
n−1
v
u
u
u
u
u Xn
u
u
u
u
u fi · (xi − x̄)2
u
u
u
u i=1
σ= t (4.20)
X n
fi
i=1
70
ESTATÍSTICA Prof. Fernando Tosini
v
u
u
u
u
u Xn
u
u
u
u
u fi · (xi − x̄)2
u
u
u
s= u
t i=1
Xn (4.21)
fi − 1
i=1
Onde:
fi é a freqüência da classe i;
X
n
(xi − x̄)2
i=1
σ2 = (4.22)
n
X
n
(xi − x̄)2
i=1
s2 = (4.23)
n−1
X
n
fi · (xi − x̄)2
i=1
σ2 = X
n (4.24)
fi
i=1
X
n
fi · (xi − x̄)2
i=1
s2 = X
n (4.25)
fi − 1
i=1
Onde:
fi é a freqüência da classe i;
71
ESTATÍSTICA Prof. Fernando Tosini
Observação:
interpretação.
ii) Somando-se ou subtraindo-se uma constante k, a cada valor observado (elementos amostrais),
iii) Multiplicando-se ou dividindo-se por uma constante k, cada valor observado, a variância ficará
São medidas de dispersão que não dependem da unidade de medida. Essas medidas são obtidas,
a partir da variância, da média e o desvio padrão. Em geral, são medidas expressa em porcentagem,
e tem por função determinar o grau de concentração dos dados em torno da média. Geralmente é utilizada
para fazer a comparação entre dois conjuntos de dados em termos percentuais, esta comparação
Variância Relativa
É obtida pela divisão entre a variância e o quadrado da média, e é representada por Vr , e definida
por:
72
ESTATÍSTICA Prof. Fernando Tosini
É obtida pela divisão entre o desvio padrão e a média, e é representada por Cv , e definida por:
σ
Cv = · 100 (4.29)
µ
Observação:
◦ Se Cv < 15%, temos, pequena dispersão, em caso, 15 ≤ Cv ≤ 30%, temos, média dispersão, e
Exemplo 4.18 Ás vésperas de um jogo decisivo, o técnico de uma equipe de basquetebol, deve optar pela
escalação de um dos jogadores, A ou B. As tabelas mostram o desempenho de cada jogador nos últimos cinco
Jogador A Jogador B
Jogo Número de Pontos Jogo Número de Pontos
1 20 1 30
2 22 2 14
3 18 3 20
4 20 4 12
5 20 5 24
(a) Calcular a média e desvio médio absoluto de cada um nesses cinco jogos;
(c) Você, sendo técnico desse time, se tivesse que escalar um desses jogadores, num jogo onde a simples vitória
73
ESTATÍSTICA Prof. Fernando Tosini
Exemplo 4.19 A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 160
acadêmicos da Universidade.
3) Insira o próximo número e aperte M+, siga fazendo isso para cada dado a ser inserido;
4) Após registrar todos os dados na memória de sua calculadora, aperte Shift e o número 2 (S-VAR);
amostral;
7) Se necessário, retorne ao passo 4, escolha outra opção e aperte novamente o botão de igual (=)
74
ESTATÍSTICA Prof. Fernando Tosini
Resumindo:
75
ESTATÍSTICA Prof. Fernando Tosini
1. Considere as grandezas:
3 7 8 22 10 17 12 6 13 15 19
17 18 21 4 8 11 13 14 18 25
2. A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 90 pessoas.
Altura (cm) fi
63 15
75 25
84 30
91 20
Σ 90
Fonte: Autor
3. A tabela mostra a distribuição de frequência das estaturas, em cm, de uma amostra de 110
crianças.
Altura (cm) fi
61 |− 65 12
65 |− 69 23
69 |− 73 34
73 |− 77 26
77 |− 81 15
Σ 110
Fonte: Autor
(b) Dertemine a Md, Q1 , Q3 , D7 e P40 . (c) Dertemine a Mob , Moc , Mok e Mop .
76
ESTATÍSTICA Prof. Fernando Tosini
4. A tabela a seguir, mostra a distribuição salarial de seis funcionários, em três diferentes empresas.
5. O gráfico abaixo, mosta a distribuição de frequência das notas, obtidas pelos acadêmicos do
77
ESTATÍSTICA Prof. Fernando Tosini
Exame 1 2 3 4 5 6 7
Laboratório A 0,6 0,4 0,5 0,8 0,2 0,8 -
Laboratório B 0,7 0,8 0,6 0,9 0,5 1,1 0,3
Laboratório C 0,6 0,7 2,0 0,5 0,8 0,9 0,9
(g) Os problemas verificados com a média, no caso dos dados do Laboratório C, continuam no
(i) Qual seria a MTC mais representativa do conjunto de dados dos três Laboratórios?
78
ESTATÍSTICA Prof. Fernando Tosini
8. Os dados agrupados na tabela abaixo referem-se ao número total de óbitos provocados por
epilepsia (CID-BR 225), durante o ano de 1983, no Estado de Minas Gerais, de acordo com a
faixa etária.
153 154 155 156 158 160 160 161 161 161 162 162 163 163 164
164 165 166 167 167 172 173 173 174 174 175 175 176 177 178
179 179 180 182 183 184 185 186 186 187 188 188 189 189 190
191 192 192 192 192 193 194 194 195 197 197 199 200 201 205
79
ESTATÍSTICA Prof. Fernando Tosini
(b) Calcular o desvio médio absoluto, o desvio padrão, a variância e o coeficiente de variação
de Pearson.
10. A tabela (10) apresenta os dados obtidos com uma experiência 25 indivı́duos, em relação a
Concentração Inibitória (CI) de determinado antibiótico para um certo tipo de bactéria. Deter-
1 1
0.5 2
0.25 6
0.125 4
0.0625 3
0.03125 9
11. Sendo a e b números não negativos. Prove que a média geométrica de a e b é menor ou igual à
média aritmética.
12. Sendo a e b números positivos. Prove que a média harmõnica de a e b é menor ou igual à média
geométrica.
80
Capı́tulo 5
Comportamento em curva de um
Histograma
Resumo: Este capı́tulo tem por objetivo, apresentar a forma de fazer o polimento, cálcular as medidas de
5.1 Introdução
81
ESTATÍSTICA Prof. Fernando Tosini
polida em forma contı́nua da distribuição dos dados. Essa curva, apresenta uma forma suave, com
caracterı́sticas de assimetria e curtose, que são medidas essenciais para proporcionar uma descrição
A obtenção da curva polida nos da uma ideia de como surge a Curva Normal de Gauss na
distribuição de probabilidade.
Para realizar o polimento e saber a forma de uma distribuição, é necessário saber construir e
A interpretação de histogramas é feita com uma simples observação de sua forma. Dessa forma,
a) A figura (5.2) apresenta um histograma com simetria. A média dos dados está no centro do
desenho. As frequências mais altas também estão no centro da figura. Em processos industriais,
b) A figura (5.3) apresenta um histograma com assimetria positiva. A média dos dados está
localizada à esquerda do centro da figura e a cauda à direita é alongada. Esta ocorre quando o
limite inferior é controlado ou quando não podem ocorrer valores abaixo de determinado limite.
82
ESTATÍSTICA Prof. Fernando Tosini
c) A figura (5.4) apresenta um histograma com assimetria negativa. A média dos dados está
localizada à direita do centro da figura e a cauda à esquerda é alongada. Esta forma ocorre
quando o limite superior é controlado ou quando não podem ocorrer valores acima de certo
limite.
d) A figura (5.5) mostra um histograma em plateau, isto é, com exceção das primeiras e das últimas
classes, todas as outras têm freqüências quase iguais. Essa forma ocorre quando se misturam
e) A figura (5.6) mostra um histograma com dois picos, ou duas modas. As freqüências são baixas
no centro da figura, mas existem dois picos fora do centro. Esta forma ocorre quando duas
distribuições com médias bem diferentes se misturam. Podem estar misturados, por exemplo,
83
ESTATÍSTICA Prof. Fernando Tosini
f) A figura (5.7) mostra o histograma à esquerda mostra pouca dispersão, mas o histograma à
Em geral, os dados coletados pertencem a uma amostra extraı́da de uma população. Essas amostras,
geralmente, são cada vez mais amplas, com amplitude das classes cada vez menor, o que nos permite
concluir, que o contorno do polı́gono de freqüências tende a se transformar numa curva de freqüência,
Pode-se dizer, então, que, enquanto que o polı́gono de freqüência nos dá a imagem real do
Assim, após o traçado de um polı́gono de freqüência, é desejável, muitas vezes, que se faça um
polimento, de modo a mostrar o que seria tal polı́gono com um número maior de dados.
Esse procedimento é claro, não nos dará certeza absoluta que a curva polida seja tal qual a curva
resultante de um grande número de dados. Porém, pode-se afirmar que ela assemelha-se mais a curva
84
ESTATÍSTICA Prof. Fernando Tosini
Exemplo 5.1
Fonte: Autor
85
ESTATÍSTICA Prof. Fernando Tosini
Observação:
Note que, a curva do exemplo a cima, tem forma de sino. Esse tipo de curva se diferencia pela
É uma curva que se caracteriza por apresentar o valor máximo no ponto central e os pontos
medidas reais são mais ou menos assimétricas, em relação à freqüência máxima. Assim, as curvas
correspondentes a tais distribuições apresentam a cauda de um lado da ordenada máxima mais longa
◦ Se a cauda mais longa fica a direita, a curva é chamada assimétrica positiva ou enviesada à
direita;
◦ Se a cauda mais longa fica a esquerda, a curva é chamada assimétrica negativa ou enviesada à
esquerda.
Figura 5.10: Curva Assimétrica Positiva Figura 5.11: Curva Assimétrica Negativa
86
ESTATÍSTICA Prof. Fernando Tosini
5.4.1 Assimetria
Uma distribuição de valores sempre poderá ser representada por uma curva (gráfico). Essa
curva, conforme a distribuição, pode apresentar várias formas. Se considerarmos o valor da moda
da distribuição como ponto de referência, vemos que esse ponto sempre corresponde ao valor de
ordenada máxima, dando-nos o ponto mais alto da curva representativa da distribuição considerada,
do Q2 .
sendo que a média sempre estará do mesmo lado em que a cauda é mais longa.
Observe que:
87
ESTATÍSTICA Prof. Fernando Tosini
x̄ − Mo
As = (5.2)
s
• Quando não tivermos condições de calcular o desvio padrão, podemos usar o Coeficiente de
Bowley:
Q3 + Q1 − 2 · Md
As = (5.3)
Q3 − Q1
88
ESTATÍSTICA Prof. Fernando Tosini
Observação:
Teoricamente, o coeficiente de assimetria de pode variar entre -3 e +3. Na prática, porém, raramente
5.4.2 Curtose
examinarmos mais uma das medidas de uso comum em Estatı́stica, que completa as caracterı́sticas
que nos mostra até que ponto a curva representativa de uma distribuição é a mais aguda ou a mais
• Curva Leptocúrtica: É uma curva mais alta do que a normal. Apresenta o topo relativamente
• Curva Platicúrtica: É uma curva mais baixa do que a normal. Apresenta o topo achatado,
89
ESTATÍSTICA Prof. Fernando Tosini
Graficamente:
Na prática só é possı́vel medir o grau de achatamento em distribuições simétricas, ou muito próximas
as simétricas. Esse grau de achatamento pode ser obtido por meio do Coeficiente Percentı́lico de Curtose,
Q3 − Q1
k= (5.4)
2(P90 − P10 )
Exemplo 5.2 A tabela apresenta a distribuição de frequência das estaturas, em cm, de uma amostra de 160
acadêmicos.
90
ESTATÍSTICA Prof. Fernando Tosini
(c) Determine o coeficiente percentı́lico de curtose e sua classificação quanto o grau de achatamento;
91
ESTATÍSTICA Prof. Fernando Tosini
1. Construa uma tabela de dispersão o suficiente para determinar as medidas de posição (média
(a) Os dados a seguir, referem-se, as notas de uma prova final de Estatı́stica, aplicado a 48
alunos.
4, 0 4, 2 4, 3 4, 4 4, 5 4, 5 4, 6 5, 0 5, 1 5, 2 5, 3 5, 5 5, 7 5, 8 6, 0 6, 1
6, 3 6, 4 6, 5 6, 7 6, 8 6, 9 7, 0 7, 2 7, 5 7, 6 7, 7 7, 9 8, 0 8, 3 8, 5 8, 6
8, 8 8, 9 9, 0 9, 1 9, 2 9, 3 9, 3 9, 4 9, 4 9, 5 9, 5 9, 6 9, 7 9, 8 9, 9 10, 0
(b) Os dados a seguir, referem-se, aos salários anuais pagos em dólares a 60 funcionários da
Empresa X.
50, 00 52, 50 53, 50 54, 00 54, 20 55, 50 56, 30 56, 50 57, 00 58, 10 58, 50 59, 00
60, 30 61, 50 62, 00 62, 90 63, 50 64, 00 64, 30 65, 00 66, 00 66, 25 67, 50 68, 00
68, 70 69, 50 70, 00 72, 00 75, 00 76, 50 77, 00 78, 00 80, 00 81, 50 82, 50 83, 50
85, 00 87, 30 88, 00 89, 10 90, 00 91, 35 92, 10 93, 20 94, 00 95, 25 96, 00 97, 00
98, 00 99, 80 100, 10 100, 20 101, 00 102, 00 103, 40 104, 30 105, 00 107, 00 108, 00 109, 10
acadêmicos.
92
ESTATÍSTICA Prof. Fernando Tosini
(b) Determine o coeficiente percentı́lico de curtose e sua classificação quanto o grau de acha-
tamento;
3. Considere as distruições:
Tabela 5.4: Distrib I Tabela 5.5: Distrib II Tabela 5.6: Distrib III
Mo = 12, 0 kg Mo = 16, 0 kg Mo = 8, 00 kg
s = 4.42 kg s = 4, 20 kg s = 4, 20 kg
Faça o seu histograma e a curva polida; - Calcule a sua média, mediana, moda, desvio padrão e
93