Livro Texto - ESTATÍSTICA

Estatística
Autor: Prof. Alan Rodrigo Navia

Colaboradores: Profa. Silmara Maria Machado
Prof. Nonato Assis de Miranda
Profa. Ana Carolina Bueno Borges
Professor conteudista: Alan Rodrigo Navia
Alan Rodrigo Navia é natural de São Paulo e morador de Taboão da Serra. É graduado em Materiais, Processos e
Componentes Eletrônicos pela Fatec-SP. Possui mestrado em Engenharia Eletrônica pela Poli-USP, na área de Circuitos
Integrados.
Exerceu as seguintes funções no mercado de trabalho: pesquisador em Engenharia na Swiss Group, analista
estatístico na Amcham, especialista em sistemas pleno no Carrefour e atualmente é coordenador de sistemas no
Grupo Renac.
Academicamente, lecionou na Fundação Santo André no curso de Engenharia, foi auxiliar docente do curso de
Engenharia Eletrônica na Poli-USP e leciona há quase dez anos na Unip. Principais disciplinas de atuação: Estatística,
Banco de Dados, Programação de Computadores e Matemática, para diversos cursos de graduação. Este material foi
escrito com base nos vários anos de docência em Estatística, para cursos que não são da área de Exatas.
Dados Internacionais de Catalogação na Publicação (CIP)
F325e Navia, Alan Rodrigo
Estatística / Alan Rodrigo Navia. – São Paulo: Editora Sol, 2013.

80 p., il.
Notas: este volume está publicado nos Cadernos de

Estudos e Pesquisas da UNIP, Série Didática, ano XVII, n. 2-045/13,
ISSN 1517-9230
1. Estatística. 2. Pedagogia. 3. Serviço Social. I. Título.
CDU 519.2
U501.05 – 19
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Prof. Dr. João Carlos Di Genio
Reitor
Prof. Fábio Romeu de Carvalho

Vice-Reitor de Planejamento, Administração e Finanças
Profa. Melânia Dalla Torre

Vice-Reitora de Unidades Universitárias
Prof. Dr. Yugo Okida

Vice-Reitor de Pós-Graduação e Pesquisa
Profa. Dra. Marília Ancona-Lopez

Vice-Reitora de Graduação
Unip Interativa – EaD
Profa. Elisabete Brihy

Prof. Marcelo Souza
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli
Material Didático – EaD
Comissão editorial:
Dra. Angélica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Kátia Mosorov Alonso (UFMT)
Dra. Valéria de Carvalho (UNIP)
Apoio:
Profa. Cláudia Regina Baptista – EaD
Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos
Projeto gráfico:
Prof. Alexandre Ponzetto
Revisão:
Juliana Maria Mendes
Amanda Casale
Sumário
Estatística
APRESENTAÇÃO.......................................................................................................................................................7
INTRODUÇÃO............................................................................................................................................................7
Unidade I
1 CONCEITOS FUNDAMENTAIS..........................................................................................................................9
1.1 Conceitos iniciais......................................................................................................................................9
1.2 Dados.......................................................................................................................................................... 10
1.3 População x amostra.............................................................................................................................11
1.4 Amostragem ............................................................................................................................................11
2 DISTRIBUIÇÃO DE FREQUÊNCIAS.............................................................................................................. 14
2.1 Conceitos básicos.................................................................................................................................. 14
2.2 Elementos de uma distribuição de frequência.......................................................................... 18
2.2.1 Classe (i)....................................................................................................................................................... 18
2.2.2 Limites de classe (li e Li)........................................................................................................................ 18
2.2.3 Amplitude de classe (hi)........................................................................................................................ 18
2.2.4 Amplitude amostral (AA)...................................................................................................................... 18
2.2.5 Ponto médio de classe (xi).................................................................................................................... 19
2.3 Tipos de frequências............................................................................................................................. 19
2.3.1 Frequência absoluta ou simples (fi).................................................................................................. 19
2.3.2 Frequência relativa (fri)......................................................................................................................... 19
2.3.3 Frequência acumulada (Fi)................................................................................................................... 20
2.4 Construção de distribuições de frequências.............................................................................. 21
2.4.1 Distribuição sem intervalo................................................................................................................... 21
2.4.2 Distribuição com intervalo................................................................................................................... 21
2.5 Representações gráficas..................................................................................................................... 24
2.5.1 Histograma (gráfico de colunas) ...................................................................................................... 24
2.5.2 Polígono de frequências (gráfico cartesiano) ............................................................................. 24
3 MEDIDAS DE TENDÊNCIA CENTRAL.......................................................................................................... 25
3.1 Média (x)................................................................................................................................................... 25
3.1.1 Dados não agrupados............................................................................................................................ 25
3.1.2 Distribuição de frequências sem intervalo.................................................................................... 26
3.1.3 Distribuição de frequências com intervalo................................................................................... 26
3.2 Moda (Mo)................................................................................................................................................ 28
3.3 Mediana (Md).......................................................................................................................................... 30
4 MEDIDAS DE DISPERSÃO.............................................................................................................................. 34
4.1 Introdução................................................................................................................................................ 34
4.2 Variância (s2)............................................................................................................................................ 35
4.3 Desvio-padrão (s).................................................................................................................................. 38
4.4 Coeficiente de variação (CV)............................................................................................................. 40
Unidade II
5 CONCEITOS BÁSICOS DE PROBABILIDADE............................................................................................. 46
5.1 Conceitos fundamentais.................................................................................................................... 46
5.2 Eventos complementares .................................................................................................................. 50
5.3 Eventos independentes....................................................................................................................... 51
5.4 Eventos mutuamente exclusivos.................................................................................................... 52
5.4.1 Exercício resolvido................................................................................................................................... 54
6 DISTRIBUIÇÃO NORMAL DE PROBABILIDADES.................................................................................... 56
6.1 Conceitos fundamentais.................................................................................................................... 56
6.1.1 Exercícios resolvidos............................................................................................................................... 61
7 CORRELAÇÃO LINEAR..................................................................................................................................... 66
7.1 Conceitos e diagrama de dispersão............................................................................................... 66
8 COEFICIENTE DE PEARSON........................................................................................................................... 68
APRESENTAÇÃO
Este livro-texto contempla os temas fundamentais para um curso de Introdução à Estatística, que na
maioria das instituições de ensino superior ou técnico tem duração semestral.
A grande quantidade de exercícios de fixação e a preocupação em explicar os métodos de cálculo,

passo a passo, sem excesso de texto, são os pontos marcantes deste material, que tem como objetivo
ensinar os conceitos básicos de Estatística para um público que não lida diariamente e/ou tem pouca
desenvoltura com a Matemática.
O pré-requisito para acompanhar esta obra é somente a Matemática do primeiro grau, atualmente
chamado de Ensino Fundamental, o que atende principalmente aos cursos que não são de Exatas, pois
nestes a Matemática é exercitada a todo o momento, nas mais diversas disciplinas, tais como Física,
Cálculo, Programação de Computadores etc.
Espero que esta obra ajude o leitor a compreender os conceitos básicos de Estatística de maneira
mais leve, porém bastante consistente.
INTRODUÇÃO
Este livro-texto aborda os assuntos fundamentais da Estatística, desde o estudo de uma variável até
a introdução ao estudo do comportamento mútuo de duas variáveis.
A Unidade I cobre os conceitos introdutórios, porém importantíssimos para o entendimento do

restante do material, a organização de dados em tabelas de frequência, a obtenção de medidas de
tendência e posição e a determinação de medidas de dispersão e variabilidade. Esses tópicos fazem parte
da Estatística Descritiva (responsável por organizar e descrever os dados coletados).
A Unidade II cobre os conceitos de probabilidade simples (que também são abordados na disciplina
Matemática), distribuição normal de probabilidades e a determinação da correlação entre duas variáveis,
por meio do diagrama de dispersão e do coeficiente de Pearson.
Cada unidade pode ser ministrada em um bimestre, se o curso introdutório de Estatística for de duas
horas-aula semanais. Vale lembrar que o material tem como leitor-alvo o aluno de graduação dos cursos
da área de Humanas e Ciências Sociais Aplicadas.
Espero que este livro auxilie o aluno com pouca desenvoltura em Matemática a entender e aplicar
os conceitos básicos de Estatística, além de servir como guia para qualquer aluno relembrar Estatística
rapidamente.
7
ESTATÍSTICA
Unidade I
1 CONCEITOS FUNDAMENTAIS
1.1 Conceitos iniciais
A palavra estatística tem origem do vocábulo latino status, que significa estado, e foi utilizada para
o levantamento de dados por parte do Estado, visando à tomada de decisões.
Atualmente a Estatística é parte da Matemática Aplicada que se dedica ao estudo e à interpretação

de fenômenos coletivos e deles extrai conclusões.
A Estatística fornece métodos para:
• coleta de dados, feita normalmente por meio de um questionário ou da observação direta do

fenômeno estudado;
• organização e descrição dos dados;
• análise e interpretação dos dados visando à tomada de decisões.
A Estatística pode ser aplicada às mais diversas áreas do conhecimento, tais como Economia, Física,
Medicina, Psicologia, Engenharia, Pedagogia e Serviço Social, para tabular e interpretar os resultados de
um experimento, e, mais recentemente, para a geração e a interpretação de indicadores.
Esses indicadores são largamente utilizados na gestão dos mais diversos segmentos do conhecimento.
Para um aluno de qualquer curso superior, a Estatística é muito importante para:
• organizar e analisar os dados de um experimento científico/observação de um fenômeno em

qualquer área do conhecimento;
• servir de embasamento para entender, analisar e até criar indicadores relevantes em seu trabalho
(entendendo que, muitas vezes, o egresso de um curso superior pode assumir um cargo de gerência
no seu segmento de formação).
Podemos citar como exemplos de indicadores: o índice de desenvolvimento humano (IDH) de

uma determinada localidade, a taxa de evasão de clientes de uma empresa de telefonia e os vários
indicadores de aprendizado utilizados na educação.
9
Unidade I
A Estatística pode ser classificada em:
• descritiva: responsável pela coleta, organização e descrição dos dados;

• indutiva: responsável pela análise e interpretação dos dados.
1.2 Dados
Dados são informações obtidas a partir de medições, resultados de pesquisas, contagens e

levantamentos em geral.
Alguns exemplos de dados são: o número de alunos de uma classe, o número de eleitores que
votaram em um determinado candidato em uma eleição, o número de leitos ocupados em um hospital
e as notas dos candidatos de um determinado concurso público.
Em Estatística, os dados podem ser classificados como:
• Qualitativos: são dados compostos de qualquer informação não numérica. Exemplos: estado
civil (solteiro, casado); cor dos olhos (pretos, castanhos, verdes); time do coração (Corinthians,
Palmeiras, São Paulo, Santos); religião praticada (católica, protestante, budista); tipo sanguíneo
(A, B, O) etc.
• Quantitativos: são dados compostos de informações numéricas e podem ser subdivididos em:
— Discretos: são compostos somente por números inteiros e enumeráveis (na maioria das vezes,
são oriundos de uma contagem). Exemplos: número de filhos, população de um município, número de
escolas particulares em um determinado local, número de visitas em um determinado site na internet
etc.
— Contínuos: são compostos por números inteiros ou fracionários (na maioria das vezes, são
obtidos por meio de uma medição). Exemplos: altura, peso, preço de um determinado produto, área de
um terreno, renda mensal de uma família, o tempo gasto em uma viagem nacional, a distância entre
dois bairros etc.
Dados Qualitativos
Quantitativos Discretos
Contínuos
Figura 1 – Classificação dos dados em Estatística
10
ESTATÍSTICA
Observação
A classificação da variável depende do contexto. Por exemplo: para fins
cadastrais, a variável idade poderia ser quantitativa discreta; na Pediatria,
porém, é contínua, pois a parte fracionária também é considerada.
1.3 População x amostra
População é o conjunto de entes portadores de, no mínimo, uma característica comum; também
chamada de universo estatístico. Um exemplo são os estudantes de uma instituição de ensino, pois
a característica comum é o fato de estudarem na mesma instituição. Os eleitores de um estado da
federação também são um exemplo.
Na maioria das vezes, podemos concluir que é inviável ter acesso a toda a população para a coleta
de dados (por limitações monetárias, de tempo etc.). Logo, normalmente é feita a coleta em uma parte,
que deve ser muito representativa dessa população. Tal parcela é denominada amostra.
Amostra corresponde ao subconjunto finito e representativo de uma população. Para obtermos

uma boa amostra, utilizamos a técnica da amostragem.
1.4 Amostragem
Há diversos tipos de amostragem.
Na amostragem simples (ou aleatória), todos os itens da população têm igual chance de pertencer
à amostra (normalmente feita por sorteio).
Sorteio
Amostra
População
Figura 2 – Amostragem simples
Já na amostragem sistemática, os itens encontram-se ordenados e enumerados, e a coleta dos

elementos da amostra é feita periodicamente.
8 7 6 5 4 3 2 1 7 4 1
População Amostra
Figura 3 – Amostragem sistemática
11
Unidade I
Observação: período de três (elementos coletados, iniciando do primeiro e em seguida coletando de

três em três).
Na amostragem estratificada, a população encontra-se dividida em vários estratos, e as amostras

são coletadas aleatoriamente de cada estrato.
Amostra
População
Figura 4 – Amostragem estratificada
Saiba mais
Após a leitura e a compreensão deste material, você pode aprofundar

os estudos em amostragem (para compreender assuntos como tamanho e
nível de confiança de amostra), lendo o livro a seguir:
BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas,

2007.
Exemplos de Aplicação
1. Cite pelo menos dez aplicações da Estatística (pesquise em jornais e sites da internet).
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
2. Defina os termos amostra e população.

______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
12
ESTATÍSTICA
3. O que são dados qualitativos?

______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
4. O que são dados quantitativos discretos e quantitativos contínuos?

______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
5. Dê pelo menos oito exemplos para cada tipo de dado:
a) Qualitativo
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
b) Quantitativo discreto
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
c) Quantitativo contínuo
__________________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
6. Pesquise um exemplo prático para cada tipo de amostragem.

______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
________________________________________________________________________________
13
Unidade I
2 DISTRIBUIÇÃO DE FREQUÊNCIAS
2.1 Conceitos básicos
Para compreender todos os conceitos, será utilizada uma amostra como exemplo. A amostra é de
quarenta alunos de uma escola qualquer, e a variável a ser estudada é a estatura deles em centímetros.
Segue a tabela dos valores de estaturas (em cm) coletados:
Tabela 1 – Tabela primitiva das estaturas dos alunos
166 161 162 165 164

162 168 156 160 164
155 163 155 169 170
154 156 153 156 158
160 150 160 167 160
161 163 173 155 168
152 160 155 151 164
161 172 157 158 161
Essa tabela com os dados coletados (dados brutos), sem nenhuma organização, é chamada de tabela
primitiva.
Analisando os dados na tabela primitiva, para determinar a maior e a menor estatura, será necessário
examinar item a item, o que tende a ser ineficiente, principalmente se o tamanho da amostra for grande.
Logo, se os dados da tabela forem organizados em ordem crescente ou decrescente, será obtida uma
nova tabela chamada de rol.
Tabela 2 – Rol das estaturas dos alunos
150 155 160 162 166

151 156 160 162 167
152 156 160 163 168
153 156 160 163 168
154 157 161 164 169
155 158 161 164 170
155 158 161 164 172
155 160 161 165 173
Examinando o rol, fica fácil determinar a maior e a menor estatura (173 e 150 cm, respectivamente),
o que permite concluir que a faixa de estaturas é de 150 a 173 cm. Outros questionamentos, como: “Qual
é a estatura com o maior número de alunos?” (160 cm) e “Qual(is) é(são) a(s) estatura(s) inexistente(s) no
14
ESTATÍSTICA
intervalo de 150 a 173 cm?” (159 e 171 cm), podem ser respondidos, porém com uma observação mais
cuidadosa do rol.
Para responder ao questionamento anterior com mais agilidade, o rol será alocado em uma
tabela, em que cada estatura terá um número correspondente de ocorrências (vindo da contagem
do rol).
Tabela 3 – Tabela de ocorrências das estaturas dos alunos
Estatura (cm) Número de ocorrências

150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
159 0
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
171 0
172 1
173 1
Esta tabela de ocorrências para todos os valores das estaturas é chamada de distribuição
de frequências. Nesse caso, como foram exibidos todos os valores de estatura, esta distribuição é
classificada como sem intervalo.
15
Unidade I
Tabela 4 – Distribuição de frequências sem intervalo para as estaturas dos alunos
Estatura (cm) Fi
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
159 -
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
171 -
172 1
173 1
∑fi 40
Onde:
fi = frequência (número de ocorrências para cada valor de estatura)

∑fi = n
∑fi = soma das frequências
n = número de elementos da amostra (n = 40)
A amostra das estaturas tem a faixa de estaturas de 23 cm (basta subtrair a maior da menor estatura),
que resulta numa tabela com muitas linhas. Se a faixa de estaturas fosse maior, a tabela teria ainda mais
linhas, o que prejudicaria a análise rápida dos dados.
Para gerar uma tabela mais enxuta e de fácil análise, é possível agrupar as estaturas em intervalos. No
exemplo, as estaturas serão agrupadas de quatro em quatro, gerando intervalos de 4 cm (no momento,
16
ESTATÍSTICA
não há a necessidade de preocupar-se com a razão de o agrupamento ser de quatro em quatro, pois
adiante será explicado o critério de cálculo utilizado). Essa tabela é chamada de distribuição de
frequências com intervalo.
Tabela 5 – Distribuição de frequências com intervalo para as estaturas dos alunos
Estaturas (cm) fi
150├ 154 4
154├ 158 9
158├ 162 11
162├ 166 8
166├ 170 5
170├ 174 3
∑fi 40
Onde:
é o operador de intervalo.
Inclui o valor Não inclui o valor (utiliza-se o anterior)
Figura 5
Exemplo:
O quinto intervalo da tabela anterior que mostra 166├ 170 é para as estaturas de 166 a 169 cm
(note que o valor 170 cm é considerado no sexto). Os valores do rol que atendem a esse intervalo são:
166, 167, 168, 168 e 169. Estes cinco valores resultam na frequência igual a 5 para o quinto intervalo.
A etapa da contagem dos valores do rol para a tabela de frequências deve ser feita com o máximo de
cuidado, pois um erro na contagem ocasiona análises equivocadas e valores errados de todas as medidas
estatísticas feitas a partir dessa tabela.
Saiba mais
O modelo de distribuição estudado é o mais utilizado pelos autores,
porém existem outros modelos, com outros tipos de intervalo além do ├.
Matematicamente um intervalo pode ser representado de diversas maneiras,
como (┤,├,├┤ e ─).
Para mais informações sobre esse assunto, leia:
MORETTIN, L. G. Estatística básica. São Paulo: Makron Books, 1999.
17
Unidade I
2.2 Elementos de uma distribuição de frequência
Todos os conceitos a seguir serão explicados com base na distribuição de frequências já explicada
anteriormente (Tabela 5).
2.2.1 Classe (i)
É cada intervalo, ou cada linha para uma tabela de frequências. O total de classes de uma tabela de
frequências é denominado k.
Exemplo: i = 3 (terceira classe: 158├ 162)

k=6
2.2.2 Limites de classe (li e Li)
São os extremos de cada classe.
Onde li é o limite inferior (extremo a esquerda) e Li é o limite superior (extremo a direita) da classe.
O índice i apenas indica qual é a classe abordada.
Exemplo: l2 = limite inferior da segunda classe = 154

L5 = limite superior da quinta classe = 170
2.2.3 Amplitude de classe (hi)
É a medida do intervalo de classe.
hi = Li - li
Exemplo: h3 = amplitude da terceira classe
h3 = L3 -l3 = 162 - 158 = 4cm
Observação
Uma distribuição com intervalos sempre terá a mesma amplitude para
todas as classes. Note que para todos os intervalos o h é 4.
2.2.4 Amplitude amostral (AA)
É a diferença entre o valor máximo e o valor mínimo da amostra. É obtido por meio do rol (nesse
caso, a Tabela 2).
AA = Xmax - xmin
18
ESTATÍSTICA
Exemplo: Amplitude amostral para as estaturas dos alunos
AA = 173 - 150 = 23cm
2.2.5 Ponto médio de classe (xi)
É o ponto que divide a classe em duas partes iguais. Será muito utilizado a partir deste ponto.
li  Li
xi 
2
Exemplo: Ponto médio da segunda classe.

154  158
x2   156 cm
2
2.3 Tipos de frequências
2.3.1 Frequência absoluta ou simples (fi)
É o número de ocorrências para cada uma das classes, obtida por meio da contagem no rol.
Exemplo: f3 = 11
2.3.2 Frequência relativa (fri)
É a razão (divisão) da frequência simples com a soma das frequências da classe. Fornece a participação
percentual de cada classe em relação à amostra.
i
ri 
 i
Lembrete
∑fi = n (a soma das frequências é igual ao número de elementos do rol).
∑fri = 1 (a soma das frequências relativas deve ser sempre igual a 1,

que indica 100%).
19
Unidade I
Exemplo:
2 9
r2    0, 225
 i 40
Isso significa que 22,5% das estaturas estão na segunda classe, pois 0,225 x 100 = 22,5%.
2.3.3 Frequência acumulada (Fi)
É a soma das frequências até a classe indicada.
Exemplo:
F2 = frequência acumulada da segunda classe = soma das frequências simples até a segunda classe.
F2 = 4 + 9 = 13
Finalmente temos a distribuição com as frequências e os pontos médios calculados.
Tabela 6 – Distribuição de frequências com intervalo para as estaturas dos alunos, com as
frequências calculadas
I Estaturas (cm) fi xi fri Fi

1 150├ 154 4 152 0,100 4
2 154├ 158 9 156 0,225 13
3 158├ 162 11 160 0,275 24
4 162├ 166 8 164 0,200 32
5 166├ 170 5 168 0,125 37
6 170├ 174 3 172 0,075 40
∑ 40 1,000
• Para a coluna fi, contar cuidadosamente os elementos do rol, lembrando-se da notação de

intervalo e considerando as repetições.
• Para facilitar a determinação da coluna xi, basta calcular o ponto médio, a primeira classe (152) e
somar a amplitude de classe (4), intervalo por intervalo.
• Não é obrigatório, mas é altamente recomendável utilizar duas ou três casas após a vírgula para
os valores de fri, visando sempre a um percentual preciso por classe.
• Note que o último valor de Fi é sempre a soma das frequências (∑fi).
20
ESTATÍSTICA
2.4 Construção de distribuições de frequências
2.4.1 Distribuição sem intervalo
Dado o rol de uma pesquisa referente ao número de carros por residência em um determinado bairro
de SP (n = 20).
Tabela 7 – Rol do número de carros por residência
0 1 1 2 3
0 1 1 2 3
1 1 1 2 4
1 1 2 2 4
Análise: este rol apresenta poucas possibilidades de valores para a variável, mais precisamente de 0
a 4 carros, e isso permite concluir que a distribuição sem intervalos é a mais indicada.
Logo, para construir a distribuição de frequências sem intervalos, não existe nenhum cálculo. A
partir do rol, basta colocar em cada classe um dos valores da variável e contar o número de ocorrências
para cada classe.
Tabela 8 – Distribuição de frequências sem intervalo para o rol do número de carros por residência
Nº de carros Fi
0 2
1 9
2 5
3 2
4 2
∑ 20
2.4.2 Distribuição com intervalo
Com base no rol das estaturas dos alunos (n = 40), já mostrado e repetido a seguir para fins didáticos.
Tabela 9 – Repetição do rol das estaturas dos alunos
150 155 160 162 166

151 156 160 162 167
152 156 160 163 168
153 156 160 163 168
154 157 161 164 169
155 158 161 164 170
155 158 161 164 172
155 160 161 165 173
21
Unidade I
Análise: este rol apresenta muitas possibilidades de valores para a variável, mais precisamente de
150 a 173 cm (o que resultaria em uma distribuição sem intervalo com muitas linhas), e isso permite
concluir que a distribuição com intervalos é a mais indicada.
Logo, para construir a distribuição de frequências com intervalos, é necessário determinar:
• o número de classes da distribuição (k)
k= n
Onde o valor de K deve ser sempre arredondado para inteiro.
Para o rol anterior:
=K = 40 6, 32 , arredondando temos 6;
logo k = 6 (a distribuição deverá ter 6 classes).
• a amplitude de classe (h)

AA
h=
k
Em que o valor de h sempre será arredondado para cima.
Para o rol do exemplo:
173  150 23
h   3, 83 , arredondando para cima temos 4;
6 6
logo h = 4 (cada uma das classes terá amplitude de 4cm).
De posse das duas informações necessárias para montar uma tabela com intervalo (k = 6 e h = 4),
realizamos o seguinte procedimento:
Passo 1: colocar o menor valor do rol no limite inferior da primeira classe.
Passo 2: somar o valor de h calculado e colocar no limite superior da primeira classe. Colocar o sinal
de intervalo entre os limites.
Tabela 10 – Início da construção de uma distribuição sem intervalo
I Estaturas (cm)
1 150├ 154
22
ESTATÍSTICA
Passo 3: repetir o limite superior da classe em foco na classe abaixo.
Tabela 11 – Andamento da construção de uma distribuição sem intervalo
I Estaturas (cm)
1 150├ 154
2 154
Passo 4: somar o valor de h (h = 4) calculado e colocar no limite superior desta classe. Colocar o
sinal de intervalo entre os limites.
Tabela 12 – Andamento da construção de uma distribuição sem intervalo
I Estaturas (cm)
1 150├ 154
2 154├ 158
Passo 5: repetir os passos 3 e 4 até completar o total de intervalos k calculado (k = 6).
Passo 6: determinar as frequências simples (pela contagem no rol) para todas as classes da
distribuição. Finalmente, somar as frequências, lembrando que ∑fi deve ser igual a n.
Tabela 13 – Distribuição sem intervalo finalizada
I Estaturas (cm) fi
1 150├ 154 4
2 154├ 158 9
3 158├ 162 11
k=6 4 162├ 166 8
5 166├ 170 5
6 170├ 174 3
∑ 40
h=4
Observação
Esse é um dos critérios existentes para se construir uma distribuição de

frequências com intervalo de classe. Existe também o critério de Sturges,
que também é bem conhecido. A principal diferença está no cálculo de k,
pois nesse caso k é dado por:
K =1+3,3 log n
23
Unidade I
2.5 Representações gráficas
Para a distribuição com intervalo, podemos representar os dados utilizando dois tipos de gráfico: o
histograma e o polígono de frequências.
2.5.1 Histograma (gráfico de colunas)
• Composição:
— no eixo x (horizontal): os limites das classes da variável em estudo;
— no eixo y (vertical): as frequências para cada uma das classes;
— a altura da barra será proporcional à frequência de cada uma das classes.
12
0
150 154 158 162 166 170 174 estaturas (cm)
Figura 6 – Histograma para uma distribuição com intervalo (Tabela 13)
2.5.2 Polígono de frequências (gráfico cartesiano)
• Composição:
— no eixo x (horizontal): os pontos médios das classes da variável em estudo;
— no eixo y (vertical): as frequências para cada uma das classes;
— ligar os pontos (no cruzamento das coordenadas dos eixos x e y); para fechar o polígono, deve-
se:
- subtrair a amplitude de classe (no exemplo, h = 4) do ponto médio da primeira classe (l1)
para fechar o polígono pela esquerda (no eixo x);
- somar a amplitude de classe (h = 4) no ponto médio da última classe da distribuição para

fechar o polígono pela direita.
24
ESTATÍSTICA
12
0
150 154 158 162 166 170 174 Estaturas (cm)
Figura 7 – Polígono de frequências para uma distribuição com intervalo (Tabela 13)
3 MEDIDAS DE TENDÊNCIA CENTRAL
Para analisar um conjunto de dados, muitas vezes é necessário obter um único valor que represente
toda a amostra em estudo. Esse valor é usualmente obtido pelas medidas de tendência central.
As medidas de tendência central abordadas serão:
• a média (x);
• a moda (Mo);
• a mediana (Md).
O cálculo de cada uma das medidas de tendência central será explicado em três abordagens:
• dados não agrupados (não alocados em tabelas de frequência);

• distribuição de frequência sem intervalo;
• distribuição de frequência com intervalo.
3.1 Média (x)
A média de um conjunto de dados é a soma dos dados dividida pelo número de elementos do
conjunto.
3.1.1 Dados não agrupados

 xi
x
n
Onde: ∑xi é a soma dos valores do conjunto de dados.

n é o número de elementos do conjunto de dados.
25
Unidade I
Exemplo: as notas de um aluno em uma determinada disciplina durante o ano foram: 3,5; 5,0; 6,5
e 9,0. A nota média do aluno na disciplina pode ser calculada por:
3, 5  5, 0  6, 5  9, 0 24
x   6, 0
4 4
3.1.2 Distribuição de frequências sem intervalo
 xi.fi
x
n
Onde: xi.fi é a multiplicação dos valores das classes com as respectivas frequências, classe por classe.
n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma
das frequências.
Exemplo: dada a distribuição sem intervalo da Tabela 8, determine o número médio de veículos por
residência em um determinado bairro.
Para armazenar os valores de xi.fi, uma coluna é criada. Em seguida, os valores da coluna são somados,
gerando ∑xi.fi.
Tabela 14 – Cálculo da média para uma distribuição sem intervalo
Nº de carros fi xi.fi
0 2 0x2=0
1 9 1x9=9
2 5 2 x 5 = 10
3 2 3x2=6
4 2 4x2=8
∑ 20 ∑xi.fi = 33
33
=
x = 165
,
20
Logo, no bairro citado há em média 1,65 carros por residência (para efeito de interpretação,
aproximadamente 2 carros por residência).
3.1.3 Distribuição de frequências com intervalo
 xi.fi
x
n
Onde: xi.fi é a multiplicação dos pontos médios das classes com as respectivas frequências, classe
por classe.
26
ESTATÍSTICA
Lembrando que:
li  Li
xi 
2
n é o número de elementos do conjunto de dados que, nesse caso, é determinado pela soma
das frequências.
Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura média dos alunos
que compõem a amostra.
O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi, que para uma
distribuição com intervalo é o ponto médio da classe.
Tabela 15 – Cálculo da média para uma distribuição com intervalo
I Estaturas (cm) fi xi xi.fi

1 150├ 154 4 (150 + 154)/2 = 152 152 x 4 = 608
2 154├ 158 9 (154 + 158)/2 = 156 156 x 9 = 1404
3 158├ 162 11 (158 + 162)/2 = 160 160 x 11 =1760
4 162├ 166 8 (162 + 166)/2 = 164 164 x 8 = 1312
5 166├ 170 5 (166 + 170)/2 = 168 168 x 5 = 840
6 170├ 174 3 (170 + 174)/2 = 172 172 x 3 = 516
∑ 40 ∑xi.fi = 6440
6440
=x = 161 cm
40
Logo, a estatura média para a amostra de alunos é de 161 cm.
Observação
Uma análise muito simples é comparar os dados com a média. No

exemplo anterior, temos estaturas acima e abaixo da média. Logo, a média
pode ser um interessante indicador de classificação.
Exemplos de Aplicação
Compare as vendas mensais com uma média histórica, para indicar o desempenho de cada vendedor.
27
Unidade I
Observação
Além da média que estudamos, muito utilizada como indicador de

tendência, existem outros tipos, como: a média ponderada, que também
indica tendência, mas considera os valores da variável com pesos diferentes,
e a média móvel em um determinado número de valores (tipicamente de 3
a 12), largamente utilizada no cálculo de previsão.
3.2 Moda (Mo)
A moda é o valor que ocorre com maior frequência em um conjunto de dados. Serve para indicar as
regiões das máximas frequências.
Dados os conjuntos a seguir, a moda será determinada analisando-se as maiores frequências.
Exemplo 1: conjunto 1
20 30 40 80 10 10 20 30 20
O valor 20 se repete mais vezes que os outros (possui maior frequência).
Mo = 20
10
20 30 30 30 40 50 50 50 60
Os valores 30 e 50 se repetem mais vezes que os outros valores do conjunto; logo, existem duas
modas (30 e 50).
Mo = 30 e Mo = 50 (conjunto bimodal)
100 110 124 145 101 200 500
Nenhum valor se repete mais vezes que os outros valores do conjunto; logo, não existe valor modal
(conjunto amodal).
28
ESTATÍSTICA
Para determinar a moda em uma distribuição sem intervalo, basta identificar a classe com maior
frequência simples (classe modal). A moda será o valor da variável da classe modal.
Exemplo: dada a distribuição sem intervalo da Tabela 8, determine o valor modal dos veículos por
Tabela 16 – Obtenção da moda para uma distribuição sem intervalo
Nº de carros fi
0 2
1 9
2 5
3 2
4 2
∑ 20
Maior fi na segunda classe (classe modal)
O valor da variável para a classe modal é igual a 1; logo, Mo = 1.
Para determinar a moda em uma distribuição com intervalo, inicialmente é necessária a classe modal
(da mesma forma que na distribuição sem intervalo).
Nesse caso, a moda será obtida aplicando-se a fórmula a seguir na classe modal:
d1
Mo  l *   h*
d1  d2
Onde: l* é o limite inferior da classe modal

h* é a amplitude da classe modal
d1 = f* - fant
d2 = f* - fpost
f* é a frequência simples da classe modal
fant é a frequência simples anterior (acima) à classe modal.
fpost é a frequência simples posterior (acima) à classe modal.
Existem vários modelos para cálculo da moda. O modelo aqui apresentado é o mais utilizado e
chama-se Moda de Czuber.
29
Unidade I
Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura modal dos alunos
Tabela 17 – Obtenção da moda para uma distribuição com intervalo
I Estaturas (cm) fi
1 150├ 154 4
2 154├ 158 9
3 158├ 162 11
4 162├ 166 8
5 166├ 170 5
6 170├ 174 3
∑ 40
Maior fi na terceira classe (classe modal)
l* = 158
h* = 4
d1 = 11 - 9 = 2
d2 = 11 - 8 = 3
Logo:
2
Mo  158  4
23
8
Mo  158   158  1, 6
5
Mo  159, 6 cm
Observação
Assim como nos dados não agrupados, uma distribuição pode ser
bimodal, desde que existam duas maiores frequências. Nesse caso basta
calcular as modas para as duas classes modais. Isso vale para mais de duas
modas em uma distribuição, ainda que essa ocorrência não seja tão comum.
3.3 Mediana (Md)
A mediana é o valor que caracteriza o centro de uma distribuição de frequências. Divide um conjunto
ordenado de dados em duas partes iguais de 50% (daí o fato de a mediana ser considerada também uma
medida de posição).
30
ESTATÍSTICA
Dados os conjuntos a seguir, antes de determinar a mediana, é necessário ordenar os dados da amostra.
Exemplo 1: conjunto ordenado 1
20 30 50 80 190 210 300
Esta é uma amostra ímpar, pois possui 7 elementos (n = 7).
Para amostras ímpares, a mediana é o elemento central da série de dados.
20 30 50 80 190 210 300
Logo, Md = 80.
Exemplo 2: conjunto ordenado 2
100 230 300 500 600 800
Esta é uma amostra par, pois possui 6 elementos (n = 6)
Para amostras pares, existem dois elementos centrais na série de dados, então a mediana é a média
de ambos.
100 230 300 500 600 800

Logo, Md = (300+500) / 2
Md = 800 / 2
Md = 400
Para determinar a mediana em uma distribuição sem intervalo é necessário:
Passo 1: determinar as frequências acumuladas (Fi) de todas as classes da distribuição.
Passo 2: identificar a classe mediana. Para isso, é necessário calcular uma referência.
 i
2
Passo 3: comparar o valor da referência com cada uma das frequências acumuladas. Se houver um
Fi igual à referência, a classe deste Fi será a classe mediana. Caso contrário, deverá ser escolhido o Fi
superior mais próximo da referência para obter a classe mediana.
31
Unidade I
Passo 4: a mediana é o valor da variável da classe encontrada (classe mediana).
Exemplo: dada a distribuição sem intervalo da Tabela 18, determine o valor da mediana.
 i 20
  10 (referência)
2 2
Tabela 18 – Obtenção da mediana para uma distribuição sem intervalo
Nº de carros fi Fi
0 2 2
1 9 11
2 5 16
3 2 18
4 2 20
∑ 20
Valor de Fi (11) superior mais próximo da referência

(10). Esta é a classe mediana (segunda classe).
O valor da variável para a classe mediana é igual a 1; logo, Md =1
Para determinar a mediana em uma distribuição com intervalo, inicialmente é necessária a classe
mediana (da mesma forma que na distribuição sem intervalo, isto é, seguindo os passos 1, 2 e 3).
Nesse caso, a mediana será obtida aplicando-se a fórmula a seguir na classe mediana:
  i 
 2  Fant 
Md  l *   h *
*
Onde: l* é o limite inferior da classe mediana

∑fi/2 é a referência, já calculada anteriormente para a escolha da classe mediana.
Fant é a frequência acumulada anterior (acima) à classe mediana.
f* é a frequência simples da classe mediana.
h* é a amplitude da classe mediana.
Exemplo: dada a distribuição com intervalo da Tabela 13, determine a estatura mediana dos alunos
 i 40
  20 (referência)
2 2
32
ESTATÍSTICA
Tabela 19 – Obtenção da mediana para uma distribuição com intervalo
I Estaturas (cm) fi Fi
1 150├ 154 4 4
2 154├ 158 9 13
3 158├ 162 11 24
4 162├ 166 8 32
5 166├ 170 5 37
6 170├ 174 3 40
∑ 40
Valor de Fi (24) superior mais próximo da

referência (20). Esta é a classe mediana
(terceira classe).
l* = 158
∑fi/2 = 20
Fant = 17 = 13 + 4
f* = 11
h* = 4
Logo:
Md  158 
20  17  4
11
3
Md  158  4
11
12
Md  158 
11
Md  158  1, 09
Md  159, 09 cm
Concluindo: a estatura que divide os 50% mais altos dos 50% mais baixos é de 159,09 cm.
Observação
Além da mediana, uma medida tanto de tendência quanto de
posição, existem outras também importantes, como o quartil, o decil e
o percentil. O método de obtenção é muito parecido com o da mediana,
que tem o dois como referência nos cálculos. O quartil, o decil e o
percentil, por sua vez, dividem uma série em quatro, dez ou cem partes
iguais.
33
Unidade I
4 MEDIDAS DE DISPERSÃO
4.1 Introdução
As medidas de dispersão têm como finalidade indicar o quanto os dados apresentam-se dispersos
em torno de uma região central, isto é, mostram o grau de variação em uma amostra.
As medidas de dispersão abordadas serão:
• a variância (s2);
• o desvio-padrão (s);
• o coeficiente de variação (CV).
Observação
Além das medidas de dispersão estudadas, existem modelos mais

simplificados, como a amplitude e o desvio médio, que têm sua importância,
porém não são tão utilizados como o desvio-padrão.
O cálculo de cada uma das medidas será explicado utilizando-se as três abordagens citadas
anteriormente.
Porém, antes de serem apresentadas as fórmulas e os métodos para o cálculo, é interessante

acompanhar, por meio de um exemplo, o significado e a importância do cálculo da dispersão.
Exemplo: existem três grupos de pessoas (cada um com oito elementos). A variável em estudo é a
idade dessas pessoas.
Grupo 1:
20 20 20 20 20 20 20 20
Grupo 2:
18 18 19 20 20 21 22 22
Grupo 3:
2 5 10 13 20 25 35 50
Desejamos tirar algumas conclusões sobre os três grupos analisando a principal medida de tendência,
a média.
34
ESTATÍSTICA
20  20  20  20  20  20  20  20 160
x do grupo 1    20
8 8
18  18  19  20  20  21  22  22 160
x do grupo 2    20
8 8
2  5  10  13  20  25  35  50 160
x do grupo 3    20
8 8
Os valores das médias para os três grupos foram iguais, mas percebemos que os grupos são totalmente
distintos quanto às idades.
• No grupo 1, todos os valores coincidem com a média, pois não existem diferenças em relação a
esta, logo não existe dispersão. É um grupo formado somente por pessoas de 20 anos de idade.
• No grupo 2, os valores não coincidem exatamente com a média, mas também não se afastam
muito desta, logo existe uma pequena dispersão. É um grupo formado por pessoas com idades
próximas de 20 anos.
• No grupo 3, a maioria dos valores está bem afastada de média, logo existe uma considerável
dispersão. É um grupo formado pelas mais diversas idades.
Conclusão: apenas utilizando a média, os três grupos apresentavam um perfil de idades igual. No
entanto, considerando também a dispersão das idades (afastamento dos valores em relação à média),
podemos indicar as diferenças existentes entre os três grupos.
4.2 Variância (s2)
É a média dos quadrados das diferenças dos valores em relação a sua média.
2 ( xi  x )2
s 
n
Onde: xi são os valores da variável
x é a média do conjunto de valores
n é o número de elementos do conjunto de valores
Exemplo: as notas que um aluno tirou em um determinada disciplina durante o ano foram:3,5; 5,0;
6,5; e 9,0. A variância das notas do aluno na disciplina pode ser calculada por:
• Obtenção da média.
3, 5  5, 0  6, 5  9, 0 24
x   6, 0
4 4
35
Unidade I
• Obtenção da variância utilizando uma tabela para organizar os cálculos.
Tabela 20 – Tabela para auxiliar na obtenção da variância de dados não agrupados
xi xi - x (xi - x)2
3,5 3,5 - 6 = -2,5 (-2,5)2 = 6,25
5,0 5 - 6 = -1 (-1)2 = 1
6,5 6,5 – 6 = 0,5 (0,5)2 = 0,25
9,0 9-6=3 (3)2 = 9
24 ∑(xi - x)2 = 16,5
16, 5
s2
= = 4,13
4
Lembrete
O número elevado ao quadrado é o produto do número por ele mesmo.

Para os cálculos deste livro, uma calculadora com operações básicas (+, -, x
e /) e raiz quadrada é mais que suficiente.
( xi  x )2  i
s2 
n
Onde: xi são os valores da variável para cada classe
x é a média dos valores da distribuição
fi é a frequência simples de cada classe
Exemplo: dada a distribuição sem intervalo da Tabela 8, determine a variância de veículos por
• Obtenção da média (já vista no item 3.1.2).

33
=
x = 165
, carros
20
36
ESTATÍSTICA
Tabela 21 – Cálculo da variância para uma distribuição sem intervalo
Nº de carros (xi) fi xi.fi xi - x (xi - x)2 (xi - x)2.fi

0 2 0x2=0 0 - 1,65 = -1,65 (-1,65)2 = 2,72 2,72 x 2 = 5,44
1 9 1x9=9 1 - 1,65 =- 0,65 (-0,65)2 = 0,42 0,42 x 9 = 3,78
2 5 2 x 5 = 10 2 - 1,65 = 0,35 (0,35) = 0,12
2
0,12 x 5 = 0,60
3 2 3x2=6 3 - 1,65 = 1.35 (1,35) = 1,82
2
1,82 x 2 = 3,64
4 2 4x2=8 4 - 1,65 = 2,35 (2,35) = 5,52
2
5,52 x 2 = 11,04
∑ 20 ∑xi.fi = 33 ∑(xi - x)2.fi = 24,5
Logo:
24, 5
s2
= = 1, 23 carros2
20
Observação
Um dos problemas do uso direto da variância é que a unidade e o valor

estarão elevados ao quadrado.
Considere:
( xi  x )2  i
s2 
n
Onde:
xi é o ponto médio para cada classe
Lembrando que:
li  Li
xi 
2
Onde: x é a média dos valores da distribuição

Exemplo: dada a distribuição com intervalo da Tabela 13, determine a variância das estaturas dos
alunos que compõem a amostra.
37
Unidade I
O procedimento é similar ao da distribuição sem intervalo, apenas com o detalhe de xi, que para uma
distribuição com intervalo é o ponto médio da classe.
Tabela 22a-b – Cálculo da variância para uma distribuição com intervalo
a)
I Estaturas (cm) fi Xi xi.fi

1 150├ 154 4 (150 + 154)/2 = 152 152 x 4 = 608
2 154├ 158 9 (154 + 158)/2 = 156 156 x 9 = 1404
3 158├ 162 11 (158 + 162)/2 = 160 160 x 11 =1760
4 162├ 166 8 (162 + 166)/2 = 164 164 x 8 = 1312
5 166├ 170 5 (166 + 170)/2 = 168 168 x 5 = 840
6 170├ 174 3 (170 + 174)/2 = 172 172 x 3 = 516
∑ 40 ∑xi.fi = 6440
6440
=x = 161 cm
40
b)
xi - x (xi - x)2 (xi - x)2.fi

152 - 161 = -9 (-9)2 = 81 81 x 4 = 324
156 - 161 = -5 (-5) = 25
2
25 x 9 = 225
160 -161 = -1 (-1)2 = 1 1 x 11 = 11
164 -161 = 3 (3)2 = 9 9 x 8 = 72
168 -161 = 7 (7)2 = 49 49 x 5 = 245
172 - 161 = 11 (11)2 = 121 121 x 3 = 363
∑(xi - x)2.fi = 1240
Logo:
1240
s2
= = 31 cm2
40
4.3 Desvio-padrão (s)
É a raiz quadrada da variância. É a medida de dispersão mais utilizada, por ter a mesma unidade que
a média, possibilitando uma melhor avaliação da dispersão da amostra.
38
ESTATÍSTICA
Considere:
( xi  x )2
s
n
Onde: xi são os valores da variável

x é a média do conjunto de valores
Utilizando o mesmo exemplo do item 4.2.1:

16, 5
s2
= = 4,13
4
Logo:
=s =
4,13 2, 03
Considere:
( xi  x )2  i
s2 
n
Onde: xi são os valores da variável para cada classe

24, 5
s2
= = 1, 23 carros2
20
Logo:
=s =
123
, 111
, carros
39
Unidade I
Considere:
( xi  x )2  i
s
n
Onde: xi é o ponto médio para cada classe
li  Li
Lembrando que: xi 
2

1240
s2
= = 31 cm2
40
Logo:
=s =
31 5, 57 cm
4.4 Coeficiente de variação (CV)
É o quociente entre o desvio-padrão e a média. É a medida de dispersão relativa, que indica a

variabilidade percentual da amostra em relação à média.
O coeficiente de variação é útil para comparação de variabilidade de dois conjuntos de dados com
unidades de medidas diferentes. Por exemplo, quando precisamos comparar altura e peso, idade e
número de filhos. Quanto menor este valor, mais homogêneo será o conjunto de dados.
s
CV  100
x
A unidade do coeficiente de variação é uma porcentagem (%).
A fórmula e o método de cálculo são exatamente os mesmos para as três abordagens apresentadas.
Vale ressaltar que quanto maior o CV, maior será a variabilidade dos dados do conjunto, em relação
a sua média.
40
ESTATÍSTICA
Exemplo: calcular o coeficiente de variação do exemplo abordado no item 4.3.3 (estaturas dos
alunos).
Como:
x = 161 cm
s = 5,57 cm
Logo:
5, 57 557
CV  100   3, 46%
161 161
As estaturas têm uma variabilidade de 3,46% em relação à média.
É importante dizer que o coeficiente de variação é usado para comparar dois conjuntos de dados
com unidades diferentes. Exemplo: “Útil para comparação de variabilidade de dois conjuntos de dados
com unidades de medida diferentes. Quanto menor esse valor, mais homogêneo será o conjunto de
dados”.
Resumo
Nesta Unidade abordamos inicialmente os principais conceitos teóricos

para o estudo dos métodos estatísticos.
Foi apresentada a definição de Estatística bem como a sua divisão em

Estatística Descritiva e Indutiva. Neste livro-texto abordaremos a maior
parte da Estatística Descritiva e o início da Indutiva. Conceitos como os
tipos de dados, que podem ser quantitativos (subdivididos em discretos
e contínuos) e qualitativos, foram abordados com uma quantidade
significativa de exemplos para a perfeita compreensão.
Vimos ainda as definições de população e amostra, e foi feita uma

breve explicação introdutória de amostragem, em que foram exibidos seus
principais tipos (aleatória, sistemática e estratificada).
Estudamos as formas de se armazenar dados quantitativos, que

anteriormente estavam sob a forma de uma tabela primitiva ou um rol, em
distribuições de frequências.
Aprendemos que existem dois tipos de distribuições de frequências: sem

intervalo de classe e com intervalo de classe. Abordamos as diferenças e os
métodos para a construção de uma tabela de frequências, com ou sem intervalo.
41
Unidade I
Ressaltamos que erros, tanto na montagem da tabela quanto na contagem dos

valores do rol, resultam em análise e medidas/indicadores errados.
Na sequência, apresentamos os principais tipos de frequências

existentes (simples, relativa e acumulada) e as suas respectivas finalidades.
Mostramos também a montagem de gráficos (histograma e polígono de
frequências) para distribuições de frequências com intervalo (por serem as
mais utilizadas na prática).
Além disso, estudamos as três principais medidas de tendência

central: a média, a moda e a mediana. As medidas foram analisadas
sob três abordagens distintas (dados não agrupados, distribuição de
frequência sem intervalo e distribuição de frequência com intervalo),
pois os métodos de obtenção das medidas apresentam significativas
diferenças para cada abordagem.
Vimos que a média de dados não agrupados é a média aritmética,

muito utilizada academicamente para verificar o aproveitamento do aluno
em uma disciplina. Aprendemos ainda que para a obtenção da média para
distribuição de frequência, devemos levar em conta tanto a frequência
quanto o valor da variável.
Abordamos a moda, que indica a(s) maior(es) frequências em

uma série de dados. Foram apresentadas as três abordagens para a
obtenção. A mediana, posição que indica o centro de uma série de
dados (divide a série em duas partes de 50%) também foi apresentada
das três maneiras.
No que se refere às medidas de dispersão, estudamos três das principais,

novamente nas três abordagens (dados não agrupados, distribuição sem
intervalo e distribuição com intervalo).
Aprendemos que a variância, definida pela média dos quadrados das

diferenças dos valores em relação a sua média, é importante, porém não
muito utilizada, pelo fato de a unidade da grandeza envolvida no cálculo
estar elevada ao quadrado. Vimos, entretanto, que o desvio‑padrão,
cuja definição é a raiz quadrada da variância, é muitíssimo utilizado
em várias áreas do conhecimento, para quantificar a dispersão de uma
série de dados.
Para termos uma noção percentual da dispersão em relação à média,

foi apresentado o coeficiente de variação, que é uma medida de dispersão
derivada do desvio-padrão e da média dos dados analisados.
42
ESTATÍSTICA
Exercícios
Questão 1. Foi realizada uma pesquisa sobre a faixa etária das crianças participantes de um
acampamento. O gráfico a seguir mostra os resultados:
8
7
6
5
Freq
4
3
2
1
0
5 7 9 11 13 15
Idade
Figura 8
Com base no gráfico, julgue as afirmações a seguir:
I. O conjunto de dados possui 6 classes e a amplitude de cada classe é 2.
II. O limite inferior da primeira classe é 5 e o limite superior é 7.
III. Os valores 5, 7, 9, 11, 13 e 15 são os pontos médios de cada classe.
IV. A moda é 11.
V. O polígono de frequência é construído a partir do limite inferior de cada classe.
São corretas apenas as afirmativas:
A) I, II, IV.
B) I, II, V.
C) II, III, V.
D) I e III.
E) III e IV.
Resposta correta: alternativa D.
43
Unidade I
Análise das afirmativas
I – Afirmativa correta.
Justificativa: no histograma, cada coluna corresponde ao número de classes da tabela de frequências.

No gráfico anterior há seis colunas que correspondem às seis classes da tabela de frequências.
II – Afirmativa incorreta.
Justificativa: o limite inferior da primeira classe é o extremo inferior 4, sendo esse o valor em que
começa a coluna correspondente à primeira classe. O limite superior da primeira classe é o extremo
superior 6, sendo esse o valor em que termina a coluna correspondente da primeira classe.
III – Afirmativa correta.
Justificativa: os pontos médios de cada classe são os pontos que dividem as classes em duas partes
iguais, e os valores dos pontos médios do histograma anterior são 5, 7, 9, 11, 13 e 15.
IV – Afirmativa incorreta.
Justificativa: a moda é uma medida de tendência central que indica o valor que ocorre com maior
frequência no conjunto de dados. No histograma podemos visualizar que há duas modas: 11 e 13. Este
conjunto de dados é chamado de bimodal.
V – Afirmativa incorreta.
Justificativa: o polígono de frequências deve ser construído ligando-se os pontos de cruzamentos do

eixo x (os pontos médios de cada classe) com o eixo y (a frequência em cada uma das classes).
Questão 2. (Oficial de Fazenda-SEFAZ 2011) Com base no resultado final do concurso para o cargo
de Especialista em Políticas Públicas e Gestão Governamental da SEPLAG, prova realizada pelo CEPERJ
em 01.08.2010, as frequências para o número de acertos obtidos nas cinco questões de Estatística pelos
1.535 candidatos que realizaram a prova estão mostradas no quadro a seguir:
Quadro 1
Nenhum acerto → 393 candidatos

1 acerto → 627 candidatos
2 acertos → 417 candidatos
TOTAL 1.535 candidatos
44
ESTATÍSTICA
O gráfico a seguir mostra a frequência relativa dos acertos.

Estatística - Prova para EPPGG
45,0%
40,8%
40,0%
35,0%
30,0% 25,6% 27,2%
25,0%
20,0%
15,0%
10,0%
5,3%
5,0%
0,8% 0,3%
0,0%
1 2 3 4 5 6
Número de acertos
Figura 9
Com base na tabela e no gráfico, julgue as afirmativas a seguir:
I. A moda e a mediana da distribuição são iguais.
II. A amplitude interquartílica é igual a 2.
III. A média da distribuição é igual a 2.
IV. A probabilidade de um candidato, escolhido ao acaso entre os 1.535, ter acertado no máximo
duas questões é igual a 66,4%.
São corretas apenas as afirmativas:
A) I e II.
B) I e III.
C) I, III e IV.
D) II, III e IV.
E) II e IV.
Resolução desta questão na plataforma.
45
Unidade II
Unidade II
5 CONCEITOS BÁSICOS DE PROBABILIDADE
5.1 Conceitos fundamentais
Em um experimento aleatório, isto é, sujeito às leis do acaso, podemos conceituar:
Espaço Amostral (S) é o conjunto de todos os resultados possíveis, enquanto n(S) é o número de
elementos do espaço amostral.
Exemplos:
a) No lançamento de uma moeda, temos S = {cara,coroa}.
n(S) = 2
b) No lançamento de um dado, temos S = {1, 2, 3, 4, 5, 6}.
n(S) = 6
c) Ao retirar uma carta de um baralho convencional, temos S = {A, 2, 3,.., K}.
n(S) = 52
Evento (E): é qualquer subconjunto de um espaço amostral. Está relacionado com o experimento
aleatório em questão. n(E) é o número de resultados possíveis do evento.
Exemplos:
a) No lançamento de uma moeda, o evento é sair coroa na face superior. Logo, E = {coroa}.
n(E) = 1
b) No lançamento de um dado, o evento é sair um número par na face superior. Logo, E = {2,4,6}.
n(E) = 3
c) Ao retirar uma carta de um baralho convencional, o evento é sair a carta Ás de Espadas (A ♠).
Logo, E ={ A ♠}.
n(E) = 1
46
ESTATÍSTICA
Probabilidade (P): é a razão (divisão) entre o número de elementos (ou resultados) favoráveis a um
determinado evento (E) e o número total de elementos (ou resultados) do espaço amostral (S).
n(E)
P=
n(S)
Exemplos:
1. Considere o lançamento de um dado. Calcule a probabilidade de:
• sair o número 3:
S = {1, 2, 3, 4, 5, 6}
n(S) = 6
E = {3}
n(E) = 1
1
P=
6
• sair um número par:
S = {1, 2, 3, 4, 5, 6}
n(S) = 6
E = {2, 4, 6}
n(E) = 3
3 1
P= =
6 2
• sair um múltiplo de 3:
S = {1, 2, 3, 4, 5, 6}
n(S) = 6
E = {3, 6}
n(E) = 2
2 1
P= =
6 3
• sair um número menor ou igual a 4:
S = {1, 2, 3, 4, 5, 6}
47
Unidade II
n(S) = 6
E = {1, 2, 3, 4}
n(E) = 4
4 2
P= =
6 3
• sair um número maior que 6:
S = {1, 2, 3, 4, 5, 6}
n(S) = 6
E = {Ø} = vazio
n(E) = 0
0
P= = 0 (Evento impossível)
6
• sair um número menor ou igual a 6:
S = {1, 2, 3, 4, 5, 6}
n(S) = 6
E = {1, 2, 3, 4, 5, 6}
n(E) = 6
6
P= = 1 = 100% (Evento certo)
6
2. Considere um baralho comum de 52 cartas. Calcule a probabilidade de, ao retirar uma carta
aleatoriamente, sair uma carta do naipe copas (♥).
n(S) = 52
Observação: Em um baralho convencional, são treze cartas para cada naipe.
n(E) = 13
13 1
=
P =
52 4
3. Considere o lançamento dois dados simultaneamente. Calcule a probabilidade de:
• sair um par de pontos iguais:
Observação: Se para um dado n(S) = 6
48
ESTATÍSTICA
Para 2 dados n(s) = 62 = 36
Para 3 dados n(s) = 63 = 216
n(S) = 36
E = {1,1 2,2 3,3 4,4 5,5 6,6}
n(E) = 6
6 1
=
P =
36 6
• sair a soma 8:
n(S) = 36
E = {2,6 6,2 4,4 3,5 5,3}
n(E) = 5
5
P=
36
• sair a soma 12:
n(S) = 36
E = {6,6}
n(E) = 1
1
P=
36
4. Uma urna possui 6 bolas azuis, 10 bolas vermelhas e 4 bolas amarelas. Tirando-se uma bola,
calcule a probabilidade de:
• sair bola azul:
n(S) = 6 + 10 + 4 = 20 (total de bolas da urna)

n(E) = 6
6 3
=
P =
20 10
• sair bola vermelha:

n(E) = 10
49
Unidade II
10 1
=
P =
20 2
• sair bola amarela:

n(E) = 4
4 1
=
P =
20 5
Observação
O cálculo de probabilidade pode ficar tanto na forma fracionária quanto

na decimal. Na fracionária, mantemos a fração simplificada, e na decimal
dividimos a fração. Assim, após a divisão, se o quociente for multiplicado
por 100, teremos a probabilidade percentual de o evento ocorrer.
5.2 Eventos complementares
Se P é a probabilidade de um evento ocorrer (sucesso), Q é a probabilidade de que o mesmo evento

não ocorra (insucesso). Para obter Q, que é complementar de P, temos:
P + Q = 1 (100%)
Logo:
Q=1-P
Exemplo: se a probabilidade de um evento ocorrer é de 1/5, a probabilidade de o mesmo evento não

ocorrer é calculada por:
1
Q  1
5
Para resolver a expressão, pode-se utilizar o cálculo do MMC ou proceder da maneira a seguir (mais
simples) para o resultado Q.
• Manter o denominador da probabilidade (P = 1/5). No caso, o valor 5.
Q=
5
50
ESTATÍSTICA
• No numerador, colocar o número que falta para que o numerador e o denominador tenham os
mesmos valores. No caso, o numerador é igual a 1. É preciso adicionar mais 4 unidades para que
o numerador fique igual a 5.
Logo:
4
Q=
5
Esse exercício também pode ser resolvido sob a forma de porcentagem (que também é muito simples,
porém requer o uso de calculadora), conforme já lembrado:
1
P  0, 20
5
Q  1  0, 20  0, 80
Q  0, 80x100  80%
5.3 Eventos independentes
Dois eventos são independentes quando a realização de um deles não afeta a probabilidade de
realização do outro, e vice-versa.
A probabilidade de os eventos se realizarem simultaneamente é dada por:
P = P1 x P2
Onde P1 e P2 são os eventos independentes (também chamados de eventos produto).
Exemplos:
a) Lançando dois dados, qual é a probabilidade de obtermos 1 no primeiro dado e um número par no
segundo dado?
1
P1 
6
3
P2 
6
1 3 3 1
P   
6 6 36 12
51
Unidade II
b) Temos duas caixas com bolinhas nas seguintes quantidades:
Caixa A: 10 bolinhas azuis, 15 bolinhas brancas e 30 bolinhas vermelhas.

Totalizando 55 bolinhas.
Caixa B: 20 bolinhas azuis, 18 bolinhas brancas e 22 bolinhas vermelhas. Totalizando 60 bolinhas.
Retiramos uma bolinha de cada caixa. Qual é a probabilidade de ambas as bolinhas retiradas serem azuis?
Caixa A: probabilidade de uma bolinha retirada ser azul:

10
P1 =
55
Caixa B: probabilidade de uma bolinha retirada ser azul:

20
P2 =
60
Logo, a probabilidade de ambas serem azuis é:
10 20 200
P    0, 0606  6, 06%
55 60 3300
5.4 Eventos mutuamente exclusivos
Dois eventos são mutuamente exclusivos quando a realização de um interfere na realização do

outro. Por exemplo, no lançamento de uma moeda, o evento tirar cara e o tirar coroa são mutuamente
exclusivos, pois, se um deles for realizado, o outro não será.
A probabilidade de que um ou outro evento se realize é dada por:
P = P1 + P2
Onde: P1 e P2 são os eventos mutuamente exclusivos (também chamados de eventos soma).
Exemplos:
a) Lançando um dado, qual é a probabilidade de tirar 3 ou 5 na face superior?
1
P1 
6
1
P2 
6
1 1 2 1
P   
6 6 6 3
52
ESTATÍSTICA
b) Numa caixa existem dez bolinhas idênticas, numeradas de 1 a 10. Qual a probabilidade de, ao se
retirar uma bolinha, ela ser múltiplo de 2 ou de 5?
Espaço amostral:
S = {1,2,3,4,5,6,7,8,9,10} -> n(S) = 10
Evento A – múltiplos de 2:
A = {2, 4, 6, 8, 10} -> n(A) = 5
Evento B – múltiplos de 5:
B= {5,10} -> n(B) = 2
Elemento comum (intersecção) entre A e B: = {10}
Observação
O elemento comum entre A e B deve ser contado apenas uma vez.

Como está sendo contado duas vezes (nos dois eventos), subtrairemos
um dos resultados possíveis do evento B, para evitar a contagem
duplicada.
5
PA =
10
2
PB =
10
Subtraindo a contagem duplicada de P2, tem-se:
1
PB =
10
Logo:
5 1 6
PB     0, 60  60%
10 10 10
53
Unidade II
Saiba mais
Neste tópico, foi mostrado apenas o básico do assunto Probabilidade,

que é estudado tanto em disciplinas de Estatística quanto de Matemática.
Esse assunto pode ser aprofundado, caso haja necessidade. Além de
Probabilidade, vale o estudo do tópico Análise Combinatória, principalmente
para quem quiser fazer concursos públicos (muito frequente nessas
avaliações).
Para saber mais, leia:
RAMOS, A. W. Estatística. São Paulo: Escola Politécnica da USP, 2005.
5.4.1 Exercício resolvido
O exercício a ser resolvido envolve a maior parte dos conceitos apresentados no Tópico 5. É um tipo
de exercício muito utilizado em concursos públicos e provas de admissão. Favor analisar o enunciado e
a resolução pacientemente.
Uma caixa contém 20 canetas iguais, das quais 7 são defeituosas, e outra caixa contém 12, das quais
4 são defeituosas. Uma caneta é retirada aleatoriamente de cada caixa. As probabilidades de que ambas
não sejam defeituosas e de que uma seja perfeita e a outra não são de:
A) 88,33% e 45,00%.
B) 43,33% e 45,00%.
C) 43,33% e 55,00%.
D) 23,33% e 45,00%.
E) 23,33% e 55,00%.
Resolução:
Caixa A
20 canetas 7 defeituosas 13 perfeitas
Caixa B
12 canetas 4 defeituosas 8 perfeitas

54
ESTATÍSTICA
• Probabilidade de ambas não serem defeituosas
A probabilidade de uma ser perfeita e a outra não é dada pela situação a seguir:
A caneta da caixa A ser perfeita.
A caneta da caixa B ser perfeita.
Expressão: PcxaPerf e PcxbPerf
P ambas não defeituosas
Pcxa = 13/20
Pcxb = 8/12
P ambas não defeituosas
13/20 x 8/12 = 104/240 = 0,4333 = 43,33%
• Probabilidade de uma ser perfeita e a outra não
A probabilidade de uma ser perfeita e a outra não é dada pela situação a seguir:
A caneta da caixa A ser perfeita e a da B não ser.
ou
A caneta da caixa A não ser perfeita e a da B ser.
Expressão: PcxaPerf e PcxbDef ou PcxaDef e PcxbPerf
PcxaPerf = 13/20
PcxbDef = 4/12
PcxaPerf e PcxbDef = 13/20 x 4/12 = 52/240
PcxaDef = 7/20
PcxbPerf = 8/12
55
Unidade II
PcxaDef e PcxbPerf = 7/20 x 8/12 = 56/240
P uma perfeita e outra não = PcxaPerf e PcxbDef ou PcxaDef e PcxbPerf
52/240 + 56/240 = 108/240 = 0,4500 = 45,00%
A alternativa correta é a B (43,33% e 45,00%).
6 DISTRIBUIÇÃO NORMAL DE PROBABILIDADES
6.1 Conceitos fundamentais
Dentre as várias distribuições de probabilidade existentes, neste tópico, será estudada a distribuição
normal, pois apresenta grande aplicação em pesquisas científicas e tecnológicas (a maior parte das
variáveis contínuas de interesse prático segue essa distribuição.) Além disso, a distribuição normal é base
para boa parte dos tópicos da Estatística Avançada.
A distribuição normal é uma distribuição de variáveis aleatórias contínuas.
x
Figura 10 – Distribuição normal de probabilidades
Algumas características da distribuição normal:
• A curva tem a forma de sino.
• A curva é simétrica em relação à média.
• A área abaixo da curva é igual a 1 (100%). Portanto, é composta de duas partes de 50%: a parte
com valores abaixo da média e a parte com valores acima da média.
• Para desenhar a curva normal (também chamada de curva de Gauss), dois parâmetros são
necessários: média e desvio-padrão.
56
ESTATÍSTICA
Lembrete
Os cálculos da média e do desvio-padrão (das três abordagens

possíveis: para dados não agrupados e para tabelas de frequência sem
e com intervalo) já foram detalhadamente mostrados nos tópicos 3 e
4, respectivamente.
Para utilizar a tabela normal (a seguir), necessitamos de uma simples expressão para calcular
o escore z. O escore z é um valor intermediário para busca na tabela normal visando obter a
probabilidade desejada. Note que para obter o escore z basta possuir os valores da média e
desvio-padrão.
xx
z
s
Tabela 72 – Tabela normal de probabilidades
Z 0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
57
Unidade II
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Para trabalhar com a tabela normal a partir de um valor de z calculado, devemos seguir os
exemplos:
Exemplo 1:
z = 1,27
Para buscar na tabela normal, z será separado em dois valores:
• O primeiro inteiro e a primeira casa decimal = 1,2 (valor 1)
• A segunda casa decimal = 7 (valor 2)
• O valor 1 será buscado nos valores de linha da tabela e o valor 2 será buscado nos valores de
coluna da tabela normal. O cruzamento de linha e coluna fornece a probabilidade desejada para
o valor de z.
58
ESTATÍSTICA
Tabela 73 – Esboço da tabela normal de probabilidades

z 0 1 2 3 4 5 6 7 8 9
0,0
0,1
0,2
0,3
...
1,2 0,3980
...
Logo, P = 0,3980 = 39,80%
Exemplo 2:
z = -0,64
Como a curva normal tem simetria em relação à média, basta considerar o valor de z sem o sinal
negativo e obter P conforme o Exemplo 1.
Valor 1 = 0,6
Valor 2 = 4
P = 0,2389 = 23,89%
Exemplo 3:
z=3
Como a tabela normal trabalha com valores de z com duas casas decimais, basta adaptar o valor de
z para as duas casas.
Valor 1 = 3,0
Valor 2 = 0
P = 0,4987 = 49,87%
Observação
Para valores de z com mais de duas casas decimais, bastar arredondar

para duas casas decimais e utilizar a tabela.
59
Unidade II
Exercício introdutório
Os comprimentos das peças produzidas por certa máquina apresentaram as seguintes medidas
estatísticas:
Média = 2,00 cm
Desvio-padrão = 0,04 cm
Qual é a probabilidade de uma peça retirada aleatoriamente do lote analisado ter comprimento
entre 2,00 cm e 2,05 cm?
Passo 1: determinar a região de interesse da curva (de acordo com o enunciado). Recomenda-se
fortemente desenhar a curva normal com os dados do exercício.
2 2,05
Figura 11 – Curva normal com os dados do exercício introdutório
Passo 2: como a região de interesse é composta pelo valor 2,05 e pela média (no eixo horizontal),
calcule o valor do escore z usando a expressão a seguir e os dados do enunciado.
xx
z
s
2, 05  2 0, 05
z   1, 25
0, 04 0, 04
Passo 3: com o valor de z, obter a probabilidade utilizando a tabela normal.
z = 1,25
Buscando na tabela normal (na linha 1,2 e coluna 5)
P = 0,3944 = 39,44%
A probabilidade de uma peça retirada aleatoriamente do lote analisado ter comprimento entre 2,00
cm e 2,05 cm é de 39,44%.
60
ESTATÍSTICA
Observação
Este tópico é base para todo o estudo de Estatística Aplicada ou
avançada. Compreender a curva normal e o cálculo de probabilidades com
essa curva permite entender os vários modelos de amostragem e geração
de estimativas para uma população a partir de dados de uma amostra, bem
como os conceitos de controle estatístico de processo.
6.1.1 Exercícios resolvidos
1. A duração de certo componente eletrônico tem média de 850 dias e desvio-padrão de 40 dias.
Sabendo que a duração é normalmente distribuída, calcule a probabilidade de esse componente durar:
a) Entre 850 e 1000 dias

b) Entre 800 e 950 dias
c) Mais que 750 dias
d) Menos que 700 dias
e) Mais que 850 dias
Média = 850
Desvio-padrão = 40
a)
850 900 950 1000
Figura 12 – Curva normal com os dados do exercício 1a
Análise: a área de interesse sob a curva está entre a média e 1000 dias. Logo, é possível obter
diretamente a probabilidade.
1000  850 150

z   3, 75
40 40
61
Unidade II
Buscando na tabela normal (linha 3,7 e coluna 5):
P = 0,4999 = 49,99%
b)
800 850 900 950
Figura 13 – Curva normal com os dados do exercício 1b
Análise: a área de interesse sob a curva está entre 800 e 950 dias. Como a fórmula de z funcionará
apenas se um dos valores do intervalo for a média, o cálculo será feito em duas partes (a primeira de
800 até a média – chamada de z1 – e a segunda da média até 950 – chamada de z2). Após obter as
probabilidades, bastar somar os seus valores.
800  850 50
z1    1, 25
40 40
Buscando na tabela normal, sem considerar o sinal negativo (linha 1,2 e coluna 5):
P1 = 0,3944 = 39,44%
950  850 100

z2    2, 5
40 40
Buscando na tabela normal (linha 2,5 e coluna 0):
P2 = 0,4938 = 49,38%
A probabilidade será obtida somando-se P1 e P2:
P = 39,44%+49,38% = 88,82%
62
ESTATÍSTICA
c)
750 800 850 900 950 1000 1050 1100 1150 1200
Figura 14 – Curva normal com os dados do exercício 1c
Análise: a área de interesse sob a curva está para valores superiores a 750 dias. Como a fórmula de z
funcionará apenas se um dos valores do intervalo for a média, será calculada a parte de 750 até a média.
A parte superior à média tem probabilidade de 50% (pela definição da curva normal) e não necessita de
cálculo. Em seguida, basta somar as probabilidades.
750  850 100

z   2, 5
40 40
Buscando na tabela normal, sem considerar o sinal negativo (na linha 2,5 e coluna 0):
P = 0,4938 = 49,38%
O resultado será obtido somando a probabilidade encontrada com os 50% da parte superior da curva
(acima da média):
P = 49,38%+50% = 99,38%
d)
500 550 600 650 700
Figura 15 – Curva normal com os dados do exercício 1d
63
Unidade II
Análise: a área de interesse sob a curva está para valores inferiores a 700 dias. Como a fórmula de z
funcionará apenas se um dos valores do intervalo for a média, será calculada a parte de 700 até a média.
Porém, a parte de interesse é exatamente o restante da curva (cauda esquerda). Logo, para obtê-la, basta
subtrair 50% da probabilidade calculada.
700  850 150

z   3, 75
40 40
Buscando na tabela normal, sem considerar o sinal negativo (linha 3,7 e coluna 5):
P = 0,4999 = 49,99%
Subtraindo 50% para obter a cauda da curva, tem-se:
P = 50% - 49,99% = 0,01%
e)
850 900 950 1000 1050 1100 1150 1200
Figura 16 – Curva normal com os dados do exercício 1e
Análise: a área de interesse sob a curva está para valores superiores à média. Pela definição da curva
normal, a probabilidade é de 50% para valores acima da média e 50% para valores abaixo da média.
Logo, não há a necessidade de cálculo.
P = 50%
2. Do total de 970 estudantes que prestaram um exame de admissão, apenas 3% foram aprovados.
A nota média foi 5,5, e o desvio-padrão, 1,8. Sabendo que as notas seguem a distribuição normal, qual
foi a nota de corte?
Lembrete
A nota de corte é a nota que separa os aprovados dos reprovados em
alguma avaliação.
64
ESTATÍSTICA
Análise:
Aprovados: 3%
Reprovados: 97% (50% com notas abaixo da média e 47% com notas acima da média).
Média = 5,5
Desvio-padrão = 1,8
47% = 0,4700
3% (aprovados)
5,5 x (nota de corte)
Figura 17 – Curva normal com os dados do exercício 2
Na Figura 18 foi indicada a região dos aprovados (3%). Como esta é a cauda da curva, será utilizada a
região que vai da média até o início dos aprovados (47%), isto é, notas acima da média, porém menores
que a nota de corte indicada na figura pela letra x.
47% = 0,4700
Buscando esse valor na parte central da tabela normal, foi encontrado o mais próximo, dado por:
0,4699 = 46,99%
Esse valor está alocado na linha 1,8 e na coluna 8 da tabela normal, logo:
z = 1,88
Substituindo os valores na fórmula do escore z, encontraremos o valor de x, que é a nota de corte

desejada.
xx
z
s
x  5, 5
, 
188
18
,
65
Unidade II
Manipulando algebricamente a expressão:
1,88 . 1,8 = x - 5,5
3,384 = x - 5,5
-x = -5,5 - 3,384
-x = -8,884
x = 8,884
A nota de corte para esse exame foi de aproximadamente 8,9. Portanto, os candidatos cuja nota
ultrapassou os 8,9 fazem parte dos 3% aprovados.
7 CORRELAÇÃO LINEAR
7.1 Conceitos e diagrama de dispersão
Em Estatística, a correlação é um parâmetro que indica o grau de correspondência entre duas

variáveis (neste estudo, simbolizadas por x e y).
• Exemplos:
— salário de um trabalhador X escolaridade do trabalhador;

— quantidade de livros que uma pessoa já leu X escolaridade;
— horas de estudo X nota na prova;
— temperatura de um forno X tempo de cozimento no forno;
— velocidade do carro X tempo para chegar ao destino.
A correlação pode ser:
• Positiva: dada pela relação direta entre as variáveis (se a variável x aumentar, a variável y também
aumentará, e vice-versa). Exemplos:
— salário de um trabalhador X escolaridade do trabalhador;

— quantidade de livros que uma pessoa já leu X escolaridade;
— horas de estudo X nota na prova.
• Negativa: dada pela relação inversa entre as variáveis (se a variável x aumentar, a variável y
tenderá a diminuir, e vice-versa). Exemplos:
66
ESTATÍSTICA
— temperatura de um forno X tempo de cozimento no forno;

— velocidade do carro X tempo para chegar ao destino.
De posse dos valores das variáveis x e y, podemos verificar a correlação entre elas utilizando um
gráfico de dispersão.
Exemplo 1: Número de anos que a pessoa estudou (xi) e número de livros que a pessoa já leu (yi).
Tabela 74 – Tabela de duas variáveis (número de anos de estudo X número de livros que a
pessoa já leu) para obtenção do diagrama de dispersão
Xi 3 5 7 9 10 14 16
Yi 1 2 3 5 7 10 13
Construindo um gráfico cartesiano que associa as variáveis x e y, temos o diagrama de dispersão.

Diagrama de Dispersão
14
12
10
8
yi
6
4
2
0
0 2 4 6 8 10 12 14 16 18
xi
Figura 18 – Diagrama de dispersão para o Exemplo 1
Lembrete
Gráfico cartesiano é aquele em que cada ponto é obtido por meio de

um valor x e do seu correspondente y (par ordenado). Em softwares de
Matemática/Estatística, é chamado de gráfico de dispersão.
O perfil do gráfico é linear, pois se assemelha a uma reta ascendente, mesmo que quase perfeitamente.
Este é um indicativo de que existe correlação entre as variáveis. Se a reta cruzasse perfeitamente todos
os pontos, teríamos uma correlação linear perfeita.
Como a reta é ascendente, a correlação é positiva entre as variáveis, isto é, um aumento de x resultará
em um aumento de y, e vice-versa.
67
Unidade II
Exemplo 2: preço do produto (xi) e demanda (procura) desse produto (yi) na prateleira de um
supermercado qualquer.
Tabela 75 – Tabela de duas variáveis (preço X demanda de um produto)

para obtenção do diagrama de dispersão
Xi 2,00 2,20 2,40 2,60 2,80 3,00

Yi 40 35 20 13 8 3
Diagrama de Dispersão
45
40
35
30
25
yi
20
15
10
5
0
1,8 2 2,2 2,4 2,6 2,8 3 3,2
xi
Figura 19 – Diagrama de dispersão para o Exemplo 2
O perfil do gráfico é linear, pois se assemelha a uma reta descendente, mesmo que quase perfeitamente.
Logo, existe correlação entre as variáveis.
Como a reta é descendente, a correlação é negativa entre as variáveis, isto é, um aumento de x

resultará em uma diminuição de y, e vice-versa.
8 COEFICIENTE DE PEARSON
Podemos verificar o quanto duas variáveis estão relacionadas entre si por meio do cálculo de um
parâmetro. Esse parâmetro indica:
• se a correlação é positiva ou negativa, por meio do seu sinal (relação direta ou inversa entre as
variáveis);
• a “força” da correlação, por meio de seu valor (módulo).
Esse parâmetro é o coeficiente de correlação de Pearson (conhecido como coeficiente linear),

indicado por r e calculado por:
n  xi  yi  xi  yi

r
(n  xi2  ( xi)2 )  (n  yi2  ( yi)2 )
68
ESTATÍSTICA
Os possíveis valores de r variam de -1 a 1. A classificação mais detalhada do coeficiente é mostrada

a seguir:
• r = -1,00: correlação negativa perfeita.

• r = -0,75: correlação negativa forte.
• r = -0,50: correlação negativa média.
• r = -0,25: correlação negativa fraca.
• r = 0,00: correlação linear inexistente.
• r = +0,25: correlação positiva fraca.
• r = +0,50: correlação positiva média.
• r = +0,75: correlação positiva forte.
• r = +1,00: correlação positiva perfeita.
Para entender o coeficiente de Pearson, serão calculados os coeficientes de correlação linear para os
dois exemplos abordados nos diagramas de dispersão.
Exemplo 1: número de anos que a pessoa estudou (xi) e número de livros que a pessoa já leu (yi).
pessoa já leu) para obtenção do coeficiente de Pearson
Xi Yi
3 1
5 2
7 3
9 5
10 7
14 10
16 13
Uma maneira simples de calcular r é criar as colunas xi.yi, xi2 e yi2, e em seguida somar todas as
colunas (∑).
69
Unidade II
pessoa já leu) para obtenção do coeficiente de Pearson, com os cálculos efetuados
Xi Yi Xi · Yi Xi2 Yi2
3 1 3 9 1
5 2 10 25 4
7 3 21 49 9
9 5 45 81 25
10 7 70 100 49
14 10 140 196 100
16 13 208 256 169
64 41 497 716 357
Com a tabela devidamente preenchida, o cálculo de r pela fórmula pode ser efetuado.
n  xi  yi  xi  yi

r
(n  xi2  ( xi)2 )  (n  yi2  ( yi)2 )
Onde:
n=7
∑xi.yi = 497
∑xi = 64
∑yi = 41
∑xi2 = 716
∑ yi2 = 357
7.497  64.41
r
(7.716  (64 )2 )  (7.357  (41)2 )
3479  2694
r
(5012  4096)  (2499  1681)
855
r
(916)  (818)
855 855
r 
749288 865.61
r = 0,988 (correlação positiva muito forte)
Exemplo 2: Preço do produto (xi) e demanda (procura) desse produto (yi) na prateleira de um
supermercado qualquer.
70
ESTATÍSTICA
Tabela 78 – Tabela de duas variáveis (preço X demanda de um produto)

para obtenção do coeficiente de Pearson
Xi Yi
2 40
2,2 35
2,4 20
2,6 13
2,8 8
3 3
Gerando as colunas e calculando os somatórios, temos:
Tabela 79 – Tabela de duas variáveis (preço X demanda de um produto) para obtenção do

coeficiente de Pearson, com os cálculos efetuados
Xi Yi Xi.Yi Xi² Yi²

2 40 80 4 1600
2,2 35 77 4,84 1225
2,4 20 48 5,76 400
2,6 13 33,8 6,76 169
2,8 8 22,4 7,84 64
3 3 9 9 9
15 119 270,2 38,2 3467
n  xi  yi  xi  yi

r
(n  xi2  ( xi)2 )  (n  yi2  ( yi)2 )
Onde:
n=6
∑xi.yi = 270,2
∑xi = 15
∑yi = 119
∑xi2 = 38,2
∑ yi2 = 3467
6.270, 2  15.119
r
(6.38, 2  (15)2 )  (6.3467  (119)2 )
1621, 2  1785
r
(229, 2  225)  (20802  14161)
163, 8
r 71
(4, 2)  (6641)
6.270, 2  15.119
r
(6.38, 2  (15)2 )  (6.3467  (119)2 )
Unidade II
1621, 2  1785
r
(229, 2  225)  (20802  14161)
163, 8
r
(4, 2)  (6641)
163, 8 163, 8
r 
27892, 2 167, 01
r = 0,981 (correlação negativa muito forte)
Saiba mais
Após o cálculo do coeficiente de correlação entre duas variáveis, pode-
se estabelecer um modelo que explica o seu comportamento mútuo. Esse
modelo é obtido pelo estudo de Regressão Linear.
Para conhecer melhor esse assunto, leia:
Resumo
Nesta Unidade abordamos introdutoriamente o conceito de
probabilidade. Vale lembrar que existem disciplinas somente voltadas para
esse assunto.
Inicialmente foram definidos os termos espaço amostral e evento,

para podermos então conceituar probabilidade como o quociente entre o
número de resultados favoráveis a um determinado evento e o total de
resultados de um evento.
Em seguida, o assunto estudado foi eventos complementares, o qual

pode ser definido pela probabilidade de um evento não ocorrer (lembrando
que se somarmos a probabilidade de um evento ocorrer com a de não
ocorrer, teremos 100% como resultado).
Estudamos também o cálculo para eventos independentes (em que um

não interfere na realização do outro, obtido pelo produto das probabilidades
dos eventos isolados) e os eventos mutuamente exclusivos (em que um
anula a realização do outro, obtido pela soma das probabilidades dos
eventos isolados).
Abordamos introdutoriamente a utilização da distribuição normal

de probabilidades. Esta é definida como uma distribuição de variáveis
aleatórias contínuas, representada pela curva de Gauss.
72
ESTATÍSTICA
Vimos que é possível trabalhar com a curva de Gauss com duas medidas
já estudadas neste material, a média e o desvio-padrão do conjunto de
dados em estudo.
Foram resolvidos dois tipos de exercício utilizando a curva normal

(ou de Gauss): o primeiro consistia na determinação do pedaço de
interesse da curva e posterior consulta na tabela normal, para obtenção
da probabilidade; o segundo, na identificação de um porcentual na curva,
novamente consultando a tabela, para identificar qualquer ponto dar curva
no eixo horizontal (além da média, que já é o centro da curva).
Além disso, foi apresentado um estudo sobre o comportamento mútuo

de duas variáveis qualitativas, definido com correlação. Para abordar
a correlação entre duas variáveis, foram estudados dois métodos: a
construção de um diagrama de dispersão (gráfico cartesiano) e o cálculo de
um coeficiente de correlação, chamado de coeficiente de Pearson. Ambos
indicavam a força da correlação e se esta era direta (se o valor da primeira
variável aumenta, o da segunda também aumenta e vice-versa) ou inversa
(se o valor da primeira variável aumenta, o da segunda diminui e vice versa).
Destacamos que o coeficiente de Pearson só pode ter valores de -1 até 1,
para correlações negativas (inversas) ou positivas (diretas).
Exercícios
Questão 1. (Enade 2008, Matemática) Há 10 postos de gasolina em uma cidade. Desses 10,
exatamente dois vendem gasolina adulterada. Foram sorteados aleatoriamente dois desses 10 postos
para serem fiscalizados. Qual é a probabilidade de que os dois postos infratores sejam sorteados?
A) 1/45.
B) 1/20.
C) 1/10.
D) 1/5.
E) 1/2.
Resposta correta: alternativa A.
Análise das afirmativas
Justificativa: pode-se resolver esta questão de duas formas diferentes.

73
Unidade II
Solução 1: Utilizando a definição de probabilidade de ocorrência de um evento A, tem-se que:

n( A )
P( A )  ;A  S
n(S)
onde n(A) é o número de elementos do evento A e n(S) representa o número de elementos do espaço
amostral S.
O espaço amostral, definido como o conjunto dos resultados do experimento aleatório, tem 45 elementos
que podem ser obtidos por meio da combinação dos dez postos (n = 10), tomados dois a dois (x = 2), isto é,
n: 10 :
  45 .
x : (n  x ): 2 : 8 :
Sendo o evento A o subconjunto de S formado pelos dois postos infratores, ou seja, n(A) = 1, tem-se,
1
então, que P( A ) = . Assim, a alternativa correta é A.
45
Solução 2: Supondo que os dois postos foram sorteados sucessivamente e sem reposição, pode-se
utilizar o chamado Teorema do Produto, P(A ∩ B) = P (A) × P(B/A).
Sejam A o primeiro sorteado e B o segundo sorteado; se eles forem os dois postos que adulteram a
2
gasolina entre os dez da cidade, tem-se, então, que a probabilidade de sortear o posto A é P( A ) = ,
10
isto é, há duas chances em dez de se sortear um posto infrator na primeira tentativa. Sabendo-se que
o posto A já foi sorteado, a chance de retirar, na segunda tentativa, o posto B, que também adultera a
1
gasolina, fica P(B / A ) = .
9
2 1 2 1
Então, tem-se P(A ∩ B) = P (A) ∙ P(B/A) =   
10 9 90 45
Questão 2. Observe as curvas de distribuição normal da figura abaixo e assinale a alternativa incorreta:
0,9 a
0,8
µ = 0, σ2 = 0,2 a
0,7 b
µ = 0, σ2 = 1,0
0,6 d µ = 0, σ2 = 5,0 c
µ = 0, σ2 = 0,5 d
0,5
b
0,4
0,3
c
0,2
0,1
0
-5 -4 -3 -2 -1 0 1 2 3 4 5
Figura 20
74
ESTATÍSTICA
A) As curvas de distribuição normal referentes às figuras a, b e c são de distribuição normal

padronizada.
B) A curva a tem desvio-padrão no valor aproximado de 0,45.
C) As dispersões das distribuições a, b e c mudaram porque as variâncias mudaram.
D) A probabilidade de escolher um valor superior a 1,27 na curva b é de 0,102.
E) A probabilidade de escolher um valor entre 0 e -2,43 na curva b é de 0,4925.
Resolução desta questão na plataforma.
75
FIGURAS E ILUSTRAÇÕES
Figura 2
RAMOS, A. W. Estatística. São Paulo: Escola Politécnica da USP, 2005. p. 39.
Figura 3
Figura 4
Figura 5
CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2004. p. 69.
Figura 6
CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2004. p. 70.
Figura 7
BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. p. 68.
REFERÊNCIAS
AKANIME, C. T. Estatística descritiva. São Paulo: Érica, 1998.
BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007.
CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2004.
MARIANO, M. V. Estatística descritiva. São Paulo: Unip, 2010.
______. Estatística indutiva. São Paulo: Unip, 2010.
MOORE, D. S. Introdução à prática da Estatística. Rio de Janeiro: LTC, 2002.
RAMOS, A. W. Estatística. São Paulo: Escola Politécnica da USP, 2005.
76
77
78
79
80
Informações:
www.sepi.unip.br ou 0800 010 9000

Livro Texto - ESTATÍSTICA

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Livro Texto - ESTATÍSTICA

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística

Autor: Prof. Alan Rodrigo Navia

Dados Internacionais de Catalogação na Publicação (CIP)

F325e Navia, Alan Rodrigo

Estatística / Alan Rodrigo Navia. – São Paulo: Editora Sol, 2013.

Notas: este volume está publicado nos Cadernos de

1. Estatística. 2. Pedagogia. 3. Serviço Social. I. Título.

Prof. Fábio Romeu de Carvalho

Profa. Melânia Dalla Torre

Prof. Dr. Yugo Okida

Profa. Dra. Marília Ancona-Lopez

Unip Interativa – EaD

Profa. Elisabete Brihy

Material Didático – EaD

A grande quantidade de exercícios de fixação e a preocupação em explicar os métodos de cálculo,

A Unidade I cobre os conceitos introdutórios, porém importantíssimos para o entendimento do

1.1 Conceitos iniciais

Atualmente a Estatística é parte da Matemática Aplicada que se dedica ao estudo e à interpretação

A Estatística fornece métodos para:

• coleta de dados, feita normalmente por meio de um questionário ou da observação direta do

Para um aluno de qualquer curso superior, a Estatística é muito importante para:

• organizar e analisar os dados de um experimento científico/observação de um fenômeno em

Podemos citar como exemplos de indicadores: o índice de desenvolvimento humano (IDH) de

A Estatística pode ser classificada em:

• descritiva: responsável pela coleta, organização e descrição dos dados;

Dados são informações obtidas a partir de medições, resultados de pesquisas, contagens e

Em Estatística, os dados podem ser classificados como:

Figura 1 – Classificação dos dados em Estatística

1.3 População x amostra

Amostra corresponde ao subconjunto finito e representativo de uma população. Para obtermos

Há diversos tipos de amostragem.

Já na amostragem sistemática, os itens encontram-se ordenados e enumerados, e a coleta dos

Observação: período de três (elementos coletados, iniciando do primeiro e em seguida coletando de

Na amostragem estratificada, a população encontra-se dividida em vários estratos, e as amostras

Figura 4 – Amostragem estratificada

Após a leitura e a compreensão deste material, você pode aprofundar

BRUNI, A. L. Estatística aplicada à gestão empresarial. São Paulo: Atlas,

2. Defina os termos amostra e população.

3. O que são dados qualitativos?

4. O que são dados quantitativos discretos e quantitativos contínuos?

5. Dê pelo menos oito exemplos para cada tipo de dado:

6. Pesquise um exemplo prático para cada tipo de amostragem.

2.1 Conceitos básicos

Segue a tabela dos valores de estaturas (em cm) coletados:

Tabela 1 – Tabela primitiva das estaturas dos alunos

166 161 162 165 164

Tabela 2 – Rol das estaturas dos alunos

150 155 160 162 166

Tabela 3 – Tabela de ocorrências das estaturas dos alunos

Estatura (cm) Número de ocorrências

Tabela 4 – Distribuição de frequências sem intervalo para as estaturas dos alunos

fi = frequência (número de ocorrências para cada valor de estatura)

Tabela 5 – Distribuição de frequências com intervalo para as estaturas dos alunos

Inclui o valor Não inclui o valor (utiliza-se o anterior)

2.2 Elementos de uma distribuição de frequência

2.2.1 Classe (i)

Exemplo: i = 3 (terceira classe: 158├ 162)

2.2.2 Limites de classe (li e Li)

São os extremos de cada classe.

Exemplo: l2 = limite inferior da segunda classe = 154

2.2.3 Amplitude de classe (hi)

É a medida do intervalo de classe.

Exemplo: h3 = amplitude da terceira classe

h3 = L3 -l3 = 162 - 158 = 4cm