Estatística PDF

MÓDULO DE:
ESTATÍSTICA
AUTORIA:
FREDERICO GOMES CARVALHAES
Copyright © 2008, ESAB – Escola Superior Aberta do Brasil
1
Módulo de: Estatística
Autoria: Frederico Gomes Carvalhaes
Primeira edição: 2009
CITAÇÃO DE MARCAS NOTÓRIAS
Várias marcas registradas são citadas no conteúdo deste módulo. Mais do que simplesmente listar esses nomes
e informar quem possui seus direitos de exploração ou ainda imprimir logotipos, o autor declara estar utilizando
tais nomes apenas para fins editoriais acadêmicos.
Declara ainda, que sua utilização tem como objetivo, exclusivamente na aplicação didática, beneficiando e
divulgando a marca do detentor, sem a intenção de infringir as regras básicas de autenticidade de sua utilização
e direitos autorais.
E por fim, declara estar utilizando parte de alguns circuitos eletrônicos, os quais foram analisados em pesquisas
de laboratório e de literaturas já editadas, que se encontram expostas ao comércio livre editorial.
Todos os direitos desta edição reservados à

ESAB – ESCOLA SUPERIOR ABERTA DO BRASIL LTDA
http://www.esab.edu.br
Av. Santa Leopoldina, nº 840/07
Bairro Itaparica – Vila Velha, ES
CEP: 29102-040
2
A presentação
Prezado aluno, seja bem-vindo !
Neste módulo você é convidado a aprofundar seus estudos na área da Estatística. Buscou-
se apresentar os principais conceitos e ferramentas estatísticas dentro de uma forma
acessível, objetiva e prática. Foram evitadas demonstrações para não tornar o conteúdo
desgastante e extenso, mas para os interessados em informações mais detalhadas uma
vasta bibliografia é sugerida ao final de nosso módulo. Este material é complementado por
baterias de exercícios disponíveis na plataforma, nas quais se procurou trabalhar com
situações práticas, aplicando a Estatística em casos reais para o perfeito entendimento de
sua importância. Mantenha em dia seus estudos e não deixe acumular dúvidas. Sempre que
preciso, entre em contato comigo. Estarei à disposição para auxiliá-lo na conclusão de mais
esta etapa acadêmica. Sucessos e bons estudos !
O bjetivo
 Apresentar os principais conceitos e ferramentas relacionadas à Estatística;
 Desenvolver o raciocínio lógico por meio da aplicação dos conhecimentos adquiridos

aos exercícios propostos;
 Aplicar os conhecimentos estatísticos em situações práticas, relacionadas aos

conceitos teóricos adquiridos;
 Utilizar a Estatística como ferramenta de tomada de decisão por meio de técnicas de

análise de dados, interpretações e inferências.
3
E menta
Histórico, conceitos, profissão e aplicações; Métodos Estatísticos; Variáveis Estatísticas;

População e Amostra; Amostragem; Séries e Gráficos Estatísticos; Distribuição de
Frequência; Medidas de Posição e Variabilidade; Assimetria e Curtose; Probabilidades;
Distribuições de Probabilidade; Correlação e Regressão Linear.
S obre o Autor
Frederico Gomes Carvalhaes é mineiro, natural de Belo Horizonte, residente em Vitória,

Espírito Santo. É graduado em Engenharia Elétrica e Matemática, pós-graduado em Gestão
de Negócios e Tecnologia da Informação e Mestre em Ciências Contábeis (Área
Administração Estratégica / Finanças). É aluno de Doutorado na COPPE/UFRJ, no Programa
de Planejamento Energético (Área Modelos Matemáticos aplicados à Energia). Possui vasta
experiência no Setor Elétrico, tendo trabalhado em empresas como CEMIG, ESCELSA e
ECOCEL. É consultor em energia, atuando na gestão da energia elétrica para grandes
indústrias, buscando otimizar seu uso e reduzir custos para as empresas. É tutor de
Educação à Distância, Professor Universitário e Coordenador de Curso de Pós-Graduação,
responsável por ministrar disciplinas como Matemática Aplicada, Matemática Financeira,
Estatística, Cálculo Atuarial, Métodos Quantitativos e Gestão de Energia Elétrica. Também
atua desenvolvendo projetos educacionais e ministrando palestras e cursos relacionados às
Ciências Exatas e Energia.
4
S UMÁRIO
UNIDADE 1 ........................................................................................................... 8
Histórico da Estatística ....................................................................................... 8
UNIDADE 2 ......................................................................................................... 11
Métodos Estatísticos ........................................................................................ 11
UNIDADE 3 ......................................................................................................... 14
Fases do Método Estatístico ............................................................................ 14
UNIDADE 4 ......................................................................................................... 17
Variáveis Estatísticas ....................................................................................... 17
UNIDADE 5 ......................................................................................................... 20
Amostragem ..................................................................................................... 20
UNIDADE 6 ......................................................................................................... 25
Principais técnicas da Amostragem ................................................................. 25
UNIDADE 7 ......................................................................................................... 29
Séries Estatísticas ............................................................................................ 29
UNIDADE 8 ......................................................................................................... 32
Gráficos Estatísticos ........................................................................................ 32
UNIDADE 9 ......................................................................................................... 39
Distribuição de Frequência .............................................................................. 39
UNIDADE 10 ....................................................................................................... 43
Elementos de uma Distribuição de Frequência ............................................... 43
UNIDADE 11 ....................................................................................................... 47
Cálculo do número de classes (k) e intervalo de classes (hi) ......................... 47
UNIDADE 12 ....................................................................................................... 49
Medidas de Posição ......................................................................................... 49
UNIDADE 13 ....................................................................................................... 55
5
Medidas Separatrizes ...................................................................................... 55
UNIDADE 14 ....................................................................................................... 57
UNIDADE 15 ....................................................................................................... 60
UNIDADE 16 ....................................................................................................... 61
Medidas de Dispersão ou Variabilidade .......................................................... 61
UNIDADE 17 ....................................................................................................... 64
Medidas de Dispersão ou Variabilidade .......................................................... 64
UNIDADE 18 ....................................................................................................... 66
O coeficiente de variação (CV) ........................................................................ 66
UNIDADE 19 ....................................................................................................... 67
Escore padronizado (zi) ................................................................................... 67
UNIDADE 20 ....................................................................................................... 69
Medidas de Assimetria ..................................................................................... 69
UNIDADE 21 ....................................................................................................... 74
Medidas de Curtose ......................................................................................... 74
UNIDADE 22 ....................................................................................................... 78
Noções de Probabilidades ............................................................................... 78
UNIDADE 23 ....................................................................................................... 81
Probabilidade ................................................................................................... 81
UNIDADE 24 ....................................................................................................... 84
Exercícios resolvidos envolvendo o cálculo de Probabilidades ...................... 84
UNIDADE 25 ....................................................................................................... 93
Distribuições de Probabilidade ........................................................................ 93
UNIDADE 26 ....................................................................................................... 98
Distribuição Binomial ........................................................................................ 98
UNIDADE 27 ..................................................................................................... 100
6
Distribuição Normal ........................................................................................ 100
UNIDADE 28 ..................................................................................................... 106
Correlação ...................................................................................................... 106
UNIDADE 29 ..................................................................................................... 109
Correlação Linear ........................................................................................... 109
UNIDADE 30 ..................................................................................................... 114
Regressão Linear ........................................................................................... 114
GLOSSÁRIO ..................................................................................................... 119
BIBLIOGRAFIA ................................................................................................ 120
7
U NIDADE 1
Objetivo: Apresentar e discutir o Histórico da Estatística e sua origem
Histórico da Estatística
Embora a palavra “Estatística” ainda não existisse, há indícios de que desde 3000 A.C. já se
faziam censos na Babilônia, China e Egito.
Desde a Antiguidade, vários povos já registravam o número de habitantes, de nascimentos,

de óbitos, faziam estimativas das riquezas individuais e sociais, distribuíam equitativamente
terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que,
hoje, chamaríamos de “estatísticas”.
A palavra “censo” deriva do latim “censere”, que significa taxar.
A palavra “estatística” deriva do latim “status”, que significa estado.
Assim, a Estatística servia como ferramenta administrativa nas mãos do Estado. Na Idade
Média colhiam-se informações, geralmente com a finalidade tributária ou bélica.
Já a partir do século XVI começaram a surgir os primeiros controles sistemáticos de fatos

sociais, como nascimentos, batizados, casamentos e funerais, dando origem às primeiras
tábuas e tabelas e aos primeiros números relativos.
Foi no século XVIII que os estudos de tais fatos foram adquirindo forma verdadeiramente
científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de
Estatística, determinando o seu objetivo e suas relações com as ciências.
No início do século XIX, os estudos estatísticos ganharam a contribuição de grandes

matemáticos. Nos trabalhos de dois deles, o francês Simon Laplace e o alemão Carl
8
Friedrich Gauss (1777-1855), surge a ideia de “Distribuição Normal de Frequência”. Essa
ideia levou a uma teoria muito útil para fazer previsões.
A teoria da distribuição normal foi usada pelo astrônomo e matemático belga Adolphe
Quételet (1796-1874), no estudo estatístico de diversas características das populações
humanas: altura, peso, natalidade, mortalidade, renda mensal, etc.
Ronald Aylmer Fisher (1890-1962), geneticista e estatístico britânico, concentrou seus

estudos na genética das populações, campo em que obteve importantes resultados, sendo
considerado um dos grandes criadores do neodarwinismo. Na Estatística trabalhou com
ajustes de curvas de frequências, com coeficientes de correlação, os chamados coeficientes
de Fisher, na análise de variância e nas técnicas de estimação de um parâmetro.
Influenciado pelos trabalhos de Karl Pearson, outro importante geneticista e estatístico

britânico, Fisher utilizou os resultados que obteve na Estatística como ferramentas para
aplicação nos seus estudos de genética, sendo hoje considerado um dos maiores nomes na
Teoria de Estatística e na Estatística aplicada à Biologia.
Assim, as tabelas tornaram-se mais completas, surgiram às representações gráficas e o

cálculo das probabilidades, quando a Estatística deixou de ser simples catalogação de dados
numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo
(população), partindo da observação de partes desse todo (amostras).
Atualmente o público leigo (leitor de jornais e revistas) se posiciona em dois extremos

divergentes e igualmente errôneos quanto à validade das conclusões estatísticas: ou crê em
sua infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os
objetivos, o campo e o rigor do método estatístico; ignoram a Estatística, seja teórica ou
prática, ou a conhecem muito superficialmente.
A Estatística em diversas áreas vem avançando muito rapidamente e, com seus processos e
técnicas, tem contribuído para a organização dos negócios e para a evolução do mundo
moderno.
9
A profissão do Estatístico
O Estatístico promove o levantamento de pesquisas estatísticas em suas aplicações técnicas

e científicas, investigando, elaborando e testando métodos matemáticos e sistema de
amostragem, bem como coletando, analisando e interpretando os dados relacionados com
os fenômenos estatísticos, e ainda estudando e renovando a metodologia estatística a fim de
estabelecer a sua evolução e desenvolvimento.
As especializações da profissão vinculam-se aos campos profissionais que exigem ou

permitem o exercício do estatístico. Elas resultam da prática profissional e decorrem quase
sempre da demanda decorrente no mercado de trabalho. São elas:
 Demografia
 Bioestatística
 Estatístico Matemático
 Estatístico de Estatística Aplicada
Principais cargos procurados:
 Estatístico
 Estatístico Matemático
 Estatístico de Estatística Aplicada
10
U NIDADE 2
Objetivo: Apresentar e discutir os principais Métodos Estatísticos existentes.
Métodos Estatísticos
O método científico
Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por
necessidades práticas, sem aplicação de um método.
Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo.

Embora muito desse conhecimento possa ter sido observado inicialmente por acaso, a
verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais
conhecimentos.
Podemos então dizer que:
Método é um conjunto de meios dispostos convenientemente para se chegar a um fim

que se deseja.
Dos métodos científicos, destacaremos o método experimental e o estatístico.
O método experimental
O método experimental consiste em manter constantes todas as causas (fatores), menos

uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso
existam.
É o método preferido no estudo da Física, da Química etc.
11
O Método Estatístico
Muitas vezes temos necessidade de descobrir fatos em um campo em que o método

experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o
fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa
que, naquele momento, nos interessa.
Como exemplo, podemos citar a determinação das causas que definem o preço de uma
mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade
da mercadoria e verificar se tal fato iria influenciar seu preço.
Porém, seria necessário que não houvesse alteração nos outros fatores.
Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos
consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos
preços das outras necessidades, etc. Mas isso tudo é impossível.
Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso,
denominado método estatístico.
O método estatístico, diante da impossibilidade de manter as causas constantes,

admite todas essas causas presentes variando-as, registrando essas variações e
procurando determinar, no resultado final, que influências cabem a cada uma delas.
A Estatística
Exprimindo por meio de números as observações que se fazem de elementos com, pelo
menos, uma característica comum (por exemplo: os alunos do sexo masculino de uma
comunidade), obtemos os chamados dados referentes a esses elementos.
12
Podemos dizer, então, que:
A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta,
organização, descrição, análise e interpretação de dados, para a utilização dos
mesmos na tomada de decisões.
A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva,

enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou
Inferencial.
Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da

organização e descrição dos dados (estatística do Ministério da Educação, estatística dos
acidentes de tráfego, etc.), desconhecendo que o aspecto essencial da Estatística é o de
proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados
obtidos inicialmente.
Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de

uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições
de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamento
objetivo de ação.
13
U NIDADE 3
Objetivo: Apresentar e discutir as Fases do Método Estatístico.
Fases do Método Estatístico
São verificadas no método estatístico as seguintes fases:
1. Coleta de dados
Após cuidadoso planejamento e a devida determinação das características mensuráveis do

fenômeno que se quer pesquisar, damos início à coleta dos dados numéricos necessários à
sua descrição.
A coleta pode ser direta ou indireta.
A coleta é direta quando feita sobre elementos informativos de registro obrigatório

(nascimentos, casamentos e óbitos, importação e exportação de mercadorias, etc) ou, ainda,
quando os dados são coletados pelo próprio pesquisador através de inquéritos e
questionários, como é o caso das notas de verificação e de exames, do censo demográfico,
etc.
A coleta direta dos dados pode ser classificada relativamente ao fator tempo em:
 Contínua (registro) → Quando feita continuamente, tal como a de nascimentos e

óbitos, frequência de alunos às aulas, etc.
 Periódica → Quando feita em intervalos constantes de tempo, como os censos (de 10

em 10 anos), avaliações mensais dos alunos, etc.
 Ocasional → Quando feita extemporaneamente, a fim de atender a uma conjuntura ou

a uma emergência, como no caso de epidemias, acidentes naturais, etc.
14
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do
conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo,
podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos
por uma coleta direta.
2. Crítica dos dados
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas
e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam
influenciar sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou
má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os
elementos originais dos dados da coleta.
3. Apuração dos dados
É a operacionalização algébrica e o processamento dos dados obtidos e a disposição

mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.
4. Apresentação dos dados
Independentemente da finalidade da pesquisa, os dados devem ser apresentados sob forma

adequada através de tabelas ou gráficos, tornando mais fácil a análise daquilo que está
sendo objeto de tratamento estatístico para posterior obtenção de medidas típicas.
15
5. Análise dos resultados
O objetivo da Estatística é tirar conclusões sobre o todo (população), a partir de informações

fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores
(Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da
Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos
desses resultados conclusões e previsões.
16
U NIDADE 4
Objetivo: Apresentar e discutir as Variáveis Estatísticas, População e Amostra.
Variáveis Estatísticas
Variável é o conjunto de resultados possíveis de um fenômeno.
Pode ser classificada em:
Qualitativa => quando seus valores são expressos por atributos. Exemplo:
 Sexo (masculino ou feminino)
 Cor da pele (branca, preta, amarela, vermelha, parda, etc.)
Quantitativa => quando seus valores são expressos em números. Exemplo:
 Salário
 Idade
Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites
recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes
a um conjunto enumerável recebe o nome de variável discreta ou descontínua.
17
Exemplos:
 Variável contínua =>Peso dos alunos de uma sala de aula
 Variável discreta => Nº de alunos de uma sala de aula
Outros exemplos:
 Cor dos olhos variável qualitativa
 Índice de liquidez nas indústrias brasileiras variável quantitativa contínua
 Produção de café no Brasil variável quantitativa contínua
 Número de defeitos em aparelhos de TV variável quantitativa discreta
 Comprimento dos pregos de uma caixa variável quantitativa contínua
 O ponto obtido em cada jogada de um dado variável quantitativa discreta
População e Amostra
Ao conjunto finito ou infinito de elementos que possuem PELO MENOS UMA característica
comum denominamos população estatística ou universo estatístico.
Assim, os jogadores de futebol, por exemplo, constituem uma população, pois apresentam
pelo menos uma característica comum: são aqueles que jogam futebol.
Entretanto, na maioria das vezes, por impossibilidade ou inviabilidade econômica ou

temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma
parte da população. A essa parte proveniente da população em estudo denominamos
amostra.
18
Assim, amostra é qualquer conjunto finito e não vazio de uma população, ou seja, uma
subcoleção.
Verificamos, então, que a Estatística Indutiva tem por objetivo tirar conclusões sobre as
populações, baseada em resultados verificados nas amostras retiradas destas populações.
Entretanto, para que as inferências estejam corretas, é necessário garantir que a amostra
seja representativa da população, isto é, a amostra deve possuir as mesmas características
básicas da população, no que diz respeito ao fenômeno que será pesquisado. Dessa forma,
é necessário que a amostra a ser usada seja obtida por processos adequados.
19
U NIDADE 5
Objetivo: Apresentar e discutir Amostragem e as principais técnicas existentes.
Amostragem
É a técnica utilizada para recolher amostras, que garante, tanto quanto possível, o acaso na
escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o
que garante à amostra o caráter de representatividade. Isto é muito importante pois as
conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras
dessa população.
Principais técnicas da Amostragem
1. Amostra casual ou aleatória simples
Este tipo de amostragem é equivalente a um sorteio de loterias.
É realizada numerando-se a população de 1 a n e sorteando-se por meio de um dispositivo

aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos
pertencentes à amostra.
Exemplo:
Obter uma amostra representativa de 10% da população para a pesquisa de salários dos 90
funcionários de uma empresa.
20
Procedimentos:
1. Numera-se os funcionários da empresa de 01 a 90;
2. Escreve-se os números, de 01 a 90, em pedaços iguais de um mesmo papel,

colocando-os dentro de uma caixa. Agita-se sempre a caixa para misturar bem os
pedaços de papel e retira-se, um a um, nove números que formarão a amostra, neste
caso, 10% da população.
Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito
trabalhoso. A fim de facilitá-lo, foi elaborada uma tabela - TABELA DE NÚMEROS
ALEATÓRIOS, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso
nas linhas e colunas.
21
Para obtermos os elementos da amostra usando a tabela, escolhemos ao acaso um
algarismo qualquer da mesma, a partir do qual iremos considerar números de dois, três ou
TABELA DE NÚMEROS ALEATÓRIOS

6 3 1 2 4 4 4 2 7 0 9 2 6 1 0 6 6 3 9 4 4 3 5 0 1 8 8 7 8 2 4 9 4 6 0 1 8 7 4 3 3 5 6 2 6 2 0 4 3 1 9 3 6 0
1 1 1 9 7 1 3 8 9 8 7 5 6 6 8 3 2 3 8 4 1 0 2 3 4 6 4 3 4 1 9 9 8 4 0 1 2 4 5 8 1 5 7 7 1 4 2 5 6 8 1 8 3 5
8 4 1 9 1 8 5 3 8 2 4 0 7 9 7 6 2 9 0 4 9 5 4 9 9 8 5 7 8 1 0 5 8 1 0 4 7 0 8 7 6 6 9 6 7 5 5 0 1 5 9 6 3 9
3 5 9 9 6 9 1 8 9 9 4 2 2 0 8 7 9 1 6 3 1 1 6 1 4 2 3 6 5 1 6 5 9 9 2 9 8 5 7 2 2 3 5 3 9 3 0 4 4 8 9 9 2 2
0 9 2 2 5 4 0 0 3 2 1 5 1 6 4 8 0 3 9 4 4 9 7 8 9 5 3 6 7 0 0 0 4 0 9 6 5 5 1 8 7 2 0 3 6 1 8 6 9 9 2 1 2 9
6 2 1 8 5 4 6 6 0 6 6 8 9 5 6 6 0 9 1 4 9 7 6 1 0 4 2 1 3 5 3 4 6 8 5 5 5 8 7 4 8 5 9 6 2 3 4 5 9 4 8 2 9 2
9 1 1 2 4 4 4 1 6 6 1 5 9 1 5 9 2 9 4 0 3 1 8 1 7 7 8 3 4 3 7 8 2 8 7 4 0 1 0 5 8 7 4 1 0 2 1 2 2 7 2 3 2 4
2 0 6 5 2 2 3 8 7 2 1 6 9 4 8 4 1 0 5 0 8 5 1 0 8 4 7 5 0 4 0 5 4 3 8 5 7 7 0 1 1 5 5 4 6 4 2 5 0 1 3 2 4 3
5 9 0 2 4 8 4 2 0 3 2 8 2 4 0 3 0 7 9 3 6 8 7 2 5 9 6 2 4 4 0 5 6 6 2 4 3 2 8 5 7 9 8 0 7 0 1 4 3 4 3 4 9 2
1 8 1 1 7 3 4 7 4 4 2 2 8 6 2 7 1 6 1 9 9 9 3 8 9 8 7 8 8 9 1 6 7 1 9 0 1 3 5 5 0 0 0 0 6 9 3 6 2 2 8 2 4 7
8 4 1 5 0 9 6 0 5 0 9 5 6 7 1 5 3 4 2 2 6 8 4 2 9 7 5 8 7 6 6 5 6 4 8 9 6 4 0 7 7 1 3 0 7 3 4 0 3 2 1 5 9 4
5 8 7 1 3 4 5 8 2 2 2 7 2 9 6 5 0 0 2 2 9 3 7 8 3 3 4 8 7 3 7 1 7 8 1 5 7 0 0 4 8 8 6 1 8 1 8 1 8 3 7 2 6 7
7 8 2 4 7 9 9 7 5 3 1 0 1 4 8 1 9 9 6 5 8 2 6 8 4 6 0 5 8 6 5 5 9 0 7 9 5 3 2 0 2 7 7 1 1 2 4 0 6 8 7 7 3 2
8 7 0 4 6 8 8 2 8 6 5 3 5 2 6 9 6 9 3 6 2 9 2 5 5 0 5 8 7 3 8 0 1 3 0 7 2 7 6 6 4 1 6 8 1 1 4 8 3 4 2 6 3 0
8 8 2 4 9 8 2 5 4 1 8 3 2 7 1 9 2 6 6 2 6 3 6 4 4 9 0 4 6 9 5 9 2 0 2 3 7 9 1 2 1 1 9 1 8 3 2 5 0 8 3 8 0 3
1 9 8 6 2 0 0 2 6 9 0 8 1 2 6 7 4 8 5 1 7 8 8 9 8 6 1 3 1 2 4 4 0 2 0 6 3 4 1 7 6 7 8 8 8 9 3 6 6 0 9 8 0 7
8 0 0 7 8 4 5 9 2 1 7 0 5 6 3 0 0 2 9 7 2 3 4 6 8 6 8 8 1 8 1 0 7 1 5 5 6 6 1 2 3 0 3 8 6 2 1 8 8 8 2 6 9 8
5 5 9 8 5 3 5 5 5 0 6 3 6 0 1 4 1 3 2 6 9 3 4 3 0 7 3 2 6 7 6 0 4 3 7 0 5 4 7 0 7 6 2 7 8 1 5 4 3 4 2 3 4 1
0 3 7 1 1 4 2 4 1 3 2 7 8 3 6 4 2 4 6 2 5 6 2 3 4 0 2 9 6 0 6 8 4 9 1 0 3 9 5 9 5 1 3 5 7 3 5 6 1 2 7 5 0 2
1 9 2 5 1 7 7 2 9 7 4 1 8 0 9 9 4 7 0 9 3 4 3 7 1 3 8 3 8 4 7 3 7 9 4 6 9 6 5 6 1 7 9 7 2 1 9 7 7 4 3 9 3 3
9 5 6 3 7 3 3 3 1 7 4 9 5 8 4 8 6 4 2 8 6 3 4 7 6 4 2 4 5 6 9 0 8 7 5 8 1 9 7 5 5 7 7 7 9 0 8 9 4 2 0 3 9 5
3 6 0 6 0 7 2 6 1 5 2 0 3 9 1 2 8 4 6 7 4 3 8 0 2 1 1 9 9 6 1 3 3 2 5 1 9 4 9 1 0 6 1 1 7 9 2 7 1 6 4 8 3 6
7 7 0 6 5 5 8 6 0 3 6 4 7 9 0 3 1 0 1 3 8 8 3 2 2 1 1 9 2 6 3 5 5 2 9 5 0 1 0 2 5 3 7 0 3 4 0 9 5 4 2 3 2 4
9 7 9 5 1 5 2 9 6 7 7 7 0 6 3 7 7 2 3 0 0 5 1 7 5 8 0 9 8 1 6 4 6 2 6 9 8 1 7 8 3 0 3 4 6 2 9 0 9 3 5 7 6 4
2 3 5 0 4 0 0 0 1 2 8 1 7 3 5 7 0 9 8 3 8 2 6 0 9 7 4 6 3 2 2 1 0 2 5 5 4 7 4 8 2 1 1 3 7 5 2 4 1 4 1 4 2 0
2 6 3 7 2 3 0 3 1 2 5 6 7 0 7 6 0 7 7 8 1 1 5 7 4 4 9 1 2 7 7 8 0 9 7 3 8 7 6 6 6 6 4 1 0 2 6 9 1 4 2 5 4 3
5 2 2 1 2 6 5 0 5 0 4 3 2 2 9 0 5 2 4 2 8 0 0 4 9 1 9 9 9 7 9 6 4 7 8 2 7 6 5 3 4 6 7 8 4 9 1 7 6 6 0 6 0 5
0 9 6 6 2 1 7 9 5 9 9 9 6 6 2 1 6 8 5 3 9 4 0 0 0 5 0 8 9 0 9 2 5 3 1 3 6 2 5 8 4 7 9 0 2 4 4 5 3 4 3 8 4 3
4 9 7 9 9 4 7 9 0 7 8 5 9 8 9 7 9 8 5 5 2 4 6 5 7 6 3 3 1 9 0 8 6 2 3 2 7 2 4 5 4 1 5 0 9 7 2 2 3 5 6 8 8 6
5 1 1 5 9 6 0 5 9 0 4 2 4 9 9 0 5 4 4 2 0 6 0 0 1 1 8 6 9 9 0 9 0 5 2 7 5 1 8 0 1 5 0 7 9 5 9 0 6 2 6 5 6 3
6 7 5 5 9 8 1 2 3 1 6 8 2 1 6 2 1 5 0 5 9 8 5 3 3 6 6 5 3 6 5 2 9 0 4 1 8 3 9 3 1 0 6 1 8 7 5 6 5 1 3 4 0 5
5 5 0 0 9 8 2 6 7 4 1 2 8 7 4 4 4 0 2 9 4 3 3 4 7 8 9 5 9 6 4 8 4 1 2 8 6 8 3 9 3 1 4 3 8 5 2 6 3 3 3 5 8 4
4 2 0 6 2 4 8 0 5 8 4 5 5 0 4 0 0 5 3 3 0 2 2 4 8 1 5 7 2 3 4 6 4 6 4 0 7 8 3 7 9 5 0 4 7 4 2 4 8 0 6 9 2 5
8 2 5 6 9 4 7 8 0 5 6 1 6 0 7 3 0 5 9 3 9 1 3 7 4 3 9 7 5 8 5 9 6 0 3 3 2 0 8 1 8 7 2 9 1 6 5 9 3 4 3 5 9 9
9 3 1 1 8 8 0 2 0 9 8 6 5 6 3 8 9 1 3 4 9 1 8 7 5 2 9 4 5 9 9 5 4 3 5 3 0 2 4 0 3 6 5 8 8 0 1 7 5 7 5 7 1 2
0 4 6 6 1 2 3 4 4 6 0 2 9 8 6 3 5 1 1 3 7 2 5 2 7 1 5 9 5 3 4 2 8 6 1 9 7 3 0 8 9 1 8 7 4 9 6 2 5 2 9 2 4 2
1 9 0 2 7 7 5 9 2 3 4 0 8 1 0 6 4 7 0 7 5 8 7 8 8 1 6 4 8 0 9 6 0 8 5 1 4 4 6 6 4 3 0 3 1 0 9 6 0 0 5 6 3 9
5 9 0 5 6 4 6 9 9 4 2 5 8 8 5 1 8 7 6 8 5 3 5 3 1 3 0 2 1 6 8 8 1 5 3 0 2 1 7 4 8 3 1 2 8 0 6 2 7 3 9 2 5 2
9 6 5 7 6 9 3 2 5 6 1 8 1 6 6 5 0 3 7 9 0 8 4 0 5 8 9 3 7 8 7 2 4 9 3 7 7 3 6 6 8 4 6 1 5 0 7 4 3 8 0 3 2 4
7 6 7 3 0 6 3 9 9 8 7 9 6 6 3 9 8 4 5 3 7 5 8 0 1 0 2 1 6 6 5 4 9 5 5 2 8 8 7 1 0 4 6 3 7 5 7 7 4 4 2 7 8 2
6 3 7 5 0 1 6 5 9 9 9 1 8 4 2 4 8 3 2 6 8 2 2 8 1 6 1 3 8 3 5 8 5 9 0 9 6 3 3 4 0 0 8 7 6 7 7 4 2 4 8 8 6 8
0 5 1 3 2 6 4 2 8 7 5 6 5 9 5 8 1 0 3 7 9 4 9 3 8 0 7 1 3 3 8 8 2 2 1 5 0 6 6 6 9 7 8 3 8 6 5 4 7 4 0 1 4 1
0 5 6 2 0 3 8 3 7 4 9 5 7 2 3 5 0 5 0 2 5 8 2 4 1 4 6 1 0 1 0 5 3 7 5 7 3 7 8 7 5 1 0 4 6 5 9 2 4 1 7 7 6 5
5 4 9 8 8 6 3 0 7 4 1 7 0 2 9 6 3 9 4 6 4 3 5 2 0 8 8 5 3 4 9 5 5 3 9 3 6 4 8 9 2 2 0 8 1 8 8 4 7 4 6 5 9 2
1 8 8 0 5 9 4 3 5 7 1 0 9 6 7 9 8 5 1 1 9 6 1 3 2 1 9 0 9 0 0 6 9 2 9 2 1 6 4 4 7 0 3 9 1 9 0 6 7 1 0 6 5 9
4 6 4 1 6 3 4 7 7 4 6 0 6 1 7 5 7 4 2 3 3 6 3 7 1 5 2 0 9 0 7 2 3 1 9 6 8 6 5 1 5 5 3 4 9 5 4 6 0 5 8 0 2 1
6 2 2 3 8 4 6 3 0 6 7 7 7 1 9 5 1 6 0 3 7 9 5 1 0 4 4 6 2 0 8 2 7 0 6 4 7 0 2 2 4 6 4 0 3 3 6 5 3 2 2 9 9 2
6 2 6 8 2 3 7 5 7 9 3 0 5 3 2 2 2 3 7 0 2 5 2 9 8 5 5 4 6 3 9 5 1 3 9 2 2 8 9 0 8 3 9 7 5 1 5 6 2 9 4 2 2 1
4 2 0 4 7 9 3 4 5 0 1 9 9 7 6 8 4 6 5 0 1 1 3 0 7 5 8 5 7 1 7 3 4 1 4 6 8 9 7 9 2 8 7 0 3 1 1 4 4 2 0 3 5 7
5 1 3 2 3 5 3 9 9 8 4 4 4 3 7 5 8 9 2 6 2 0 6 3 9 7 0 8 3 5 0 3 8 7 2 3 2 1 2 9 1 0 5 9 7 5 5 0 5 2 8 9 7 7
6 6 5 3 3 6 0 3 0 4 3 2 1 4 8 2 8 1 5 1 6 9 5 2 6 6 4 1 6 6 7 4 3 2 5 3 7 2 2 4 5 9 4 1 1 8 6 9 8 4 4 6 3 8
6 8 8 0 8 7 3 6 8 6 7 4 0 2 8 6 0 8 3 3 4 4 9 5 6 9 1 0 4 2 0 5 3 2 2 7 9 2 1 8 7 2 0 8 4 3 5 0 5 5 7 4 1 7
6 4 6 7 5 9 2 4 4 5 4 5 0 7 4 1 9 8 2 4 5 8 1 6 8 9 6 9 9 5 4 0 0 6 3 5 1 6 9 3 0 1 5 5 1 1 2 4 8 7 6 5 9 8
22
mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os
elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),
verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou
descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita
antes de iniciado o processo.
O primeiro passo é definir o critério da leitura da tabela. Assim, consideremos, por exemplo,
a 6ª linha, tomando os números de dois algarismos (tantos algarismos quantos formam o
maior número da população), da esquerda para direita e de cima para baixo, e assim
sucessivamente. Obtivemos então:
62 18 54 66 06 68 95 66 09 14 97 61
Evidentemente, os numerais 95 e 97 serão desprezados, pois não constam da população,

como também será abandonado um numeral que já tenha aparecido, no caso o 66. Tem-se,
então:
62 18 54 66 06 68 95 66 09 14 97 61
Ou, reescrevendo:
62 18 54 66 06 68 09 14 61
Organizando os dados em uma ordem crescente, temos:
06 09 14 18 54 61 62 66 68
Estas foram as pessoas escolhidas para o critério adotado. Com base na listagem dos
funcionários, deve- se buscar posteriormente as informações salariais de cada um. Anota-se,
23
assim, os salários das pessoas correspondentes aos números sorteados, obtendo-se uma
amostra de 10% dos salários dos 90 funcionários da empresa.
Observe que não houve direcionamento na escolha (aleatoriedade) e todos os 90

funcionários tiveram a mesma chance de serem escolhidos, garantindo assim, a
representatividade da amostra.
24
U NIDADE 6
Objetivo: Apresentar e discutir as principais técnicas de Amostragem.
Principais técnicas da Amostragem
2. Amostragem proporcional estratificada
Muitas vezes a população se divide em subpopulações - estratos.
Como é provável que a variável em estudo apresente, de estrato em estrato, um

comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo,
convém que o sorteio dos elementos da amostra leve em consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem proporcional

estratificada, que, além de considerar a existência dos estratos, obtém os elementos da
amostra proporcional ao número de elementos dos mesmos.
Exemplo:
Supondo que no exemplo anterior, dos 90 funcionários, 54 sejam do sexo masculino e 36

sejam do sexo feminino, vamos obter a amostra proporcional estratificada de 10% da
população. São, portanto, dois estratos: sexo masculino e sexo feminino.
25
Logo, teremos:
Sexo População 10% Amostra

10  54
Masculino 54  5,4 5
100
10  36
Feminino 36  3,6 4
100
10  90
TOTAL 90  9,0 9
100
Numera-se os funcionários da empresa de 01 a 90, sendo que de 01 v a 54 corresponderão

ao sexo masculino e de 55 a 90 ao sexo feminino. Como critério, estabeleceremos na
Tabela de Números Aleatórios a 3ª e 4ª colunas, de cima para baixo e da esquerda para a
direita, e assim sucessivamente.
Obtivemos então:
12 19 19 99 22 18 12 65 02 11 15 71 24 04
24 86 07 98 71 25 63
Da mesma forma, deveremos desprezar todos os numerais que não constam da população,
bem como aqueles que já tiverem sido selecionados. Também devemos parar a seleção para
um estrato quando já tiver sido preenchida sua quantidade de elementos necessários. Dessa
forma:
12 19 19 99 22 18 12 65 02 11 15 71 24 04
24 86 07 98 71 25 63
26
Ou, separando por estratos:
12 19 22 18 02 => Para o sexo masculino
65 71 86 63 => Para o sexo feminino
Organizando os dados em uma ordem crescente, teremos:
02 12 18 19 22 => Para o sexo masculino
63 65 71 86 => Para o sexo feminino
Estas foram as pessoas escolhidas para o critério adotado em cada estrato. Com base na
listagem dos funcionários, deve-se buscar posteriormente as informações salariais de cada
um. Anota-se, assim, os salários das pessoas correspondentes aos números sorteados em
cada estrato, obtendo-se uma amostra proporcional estratificada de 10% dos salários dos 90
funcionários da empresa, separados por sexo. Também pode ser verificada a aleatoriedade
na determinação da amostra, o que garante sua representatividade.
3. Amostragem Sistemática
É uma seleção feita por algum critério preestabelecido, como, por exemplo, intervalos de
tempo para coleta, peças de uma linha de montagem, etc.
Quando os elementos da população já se acham ordenados, não há necessidade de

construir o sistema de referência.
27
Exemplos:
Prontuários médicos de um hospital
Prédios de uma rua
Linhas de produção
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.
Assim, no caso de uma linha de produção, podemos, por exemplo, a cada dez itens
produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso,
estaríamos fixando o tamanho da amostra em 10% da população.
Exemplo:
Suponha-se uma avenida contendo 900 prédios, dos quais desejamos obter uma amostra
formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento: como
900
 18
50 , escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o
primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente
considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado
direito da rua, o 4º prédio, o 22º, o 40º, etc. , até voltarmos ao início da avenida, pelo lado
esquerdo.
28
U NIDADE 7
Objetivo: Apresentar e discutir as principais Séries Estatísticas.
Séries Estatísticas
Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de

dados estatísticos em função da época, do local ou da espécie.
Numa série estatística, observamos a existência de três elementos ou fatores: o tempo, o

espaço e a espécie. Conforme varie um dos elementos da série, podemos classificá-la em
Histórica, Geográfica, Específica ou Mista.
1. Séries Temporais, Históricas, Cronológicas ou Marchas
São aquelas onde os dados são observados conforme época de ocorrência. Descrevem os
valores da variável em determinado local, discriminados segundo intervalo de tempo variável.
Exemplo:
Vendas da Companhia "Vale Tudo"

2001 - 2008
Ano Vendas (RS)
2001 22.600,00
2002 39.870,00
2003 51.240,00
2004 63.850,00
2005 90.730,00
2006 100.540,00
2007 123.190,00
2008 139.820,00
29
2. Séries Geográficas, Espaciais, Territoriais ou de Localização
São aquelas onde os dados são observados conforme a localidade de ocorrência.

Descrevem os valores da variável em determinado instante, discriminados segundo regiões.
Exemplo:
Vacinação contra doença "X"

Brasil - 2006
Região Quantidade
Norte 542.863
Nordeste 947.321
Sudeste 1.589.647
Sul 754.294
Centro-Oeste 349.612
3. Séries Específicas ou Categóricas
São aquelas onde os dados são observados em determinado tempo e local, discriminados
conforme especificações ou categorias.
Exemplo:
Produção média de cada operário por setor

País "Z" - 2007
Setor Industrial Quantidade produzida (ton)
Aço 789
Papel 247
Açúcar 6.587
Café 5.421
Chocolate 23.144
Trigo 1.239
Soja 1.024
Carne 456
Granito 872
30
4. Séries Mistas ou Conjugadas
São aquelas onde os dados provenientes de duas ou mais séries são colocados em uma
única série.
Exemplo:
Aparelhos celulares em serviço no país "ÔMEGA"

2005 - 2007
Região 2005 2006 2007
Norte 11.300.493 12.989.073 15.463.182
Nordeste 20.800.020 23.908.069 28.461.987
Sudeste 38.413.867 44.153.870 52.564.131
Sul 26.074.207 29.970.352 35.678.991
Centro-Oeste 17.808.678 20.469.745 24.368.744
31
U NIDADE 8
Objetivo: Apresentar e discutir os principais tipos de Gráficos Estatísticos.
Gráficos Estatísticos
É um conjunto de figuras geométricas representativas dos fenômenos. O gráfico estatístico é

uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir uma
impressão mais rápida e viva do fenômeno em estudo.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais

para ser realmente útil:
 Simplicidade => o gráfico não deve conter detalhes de importância secundária, assim
como de traços desnecessários que possam levar o leitor a uma análise demorada ou
errônea.
 Clareza => o gráfico deve possibilitar uma correta interpretação dos valores
representativos do fenômeno em estudo.
 Veracidade => o gráfico deve expressar a verdade sobre o fenômeno em estudo.
DIAGRAMAS são representações gráficas de séries estatísticas por intermédio de linhas e

superfícies. Dentre os principais diagramas, destacam-se:
32
1. Gráfico em linha ou em curva
É a representação gráfica de uma série estatística por meio de uma linha poligonal e constitui
uma aplicação do processo de representação das funções num sistema de coordenadas
cartesianas. É a melhor representação para uma série temporal, onde se deve observar a
ordem cronológica das informações. É usada para mostrar a variação entre os valores de
uma série.
Exemplo:
Vendas (R$) da Companhia "Sucesso S/A"
200.000
190.000
180.000
170.000
160.000
150.000
140.000
130.000
120.000
110.000
100.000
2001 2002 2003 2004 2005 2006 2007 2008
33
2. Gráfico em colunas ou em barras
É a representação gráfica de uma série estatística por meio de retângulos, dispostos

verticalmente (em colunas) ou horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos
respectivos dados.
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais

aos respectivos dados.
Dessa forma, asseguramos a proporcionalidade entre as áreas dos retângulos e os dados

estatísticos.
Exemplos:
a. Gráfico em Colunas
Produção de Soja do País "Omega"
200.000
180.000
160.000
Mil Toneladas
140.000
120.000
100.000
80.000
60.000
40.000
20.000
0
1990 1991 1992 1993 1994 1995 1996 1997
34
b. Gráfico em Barras
Exportações Brasileiras - Ano XX

São Paulo
Minas Gerais
Rio de Janeiro
Bahia
Ceará
Espírito Santo
Paraná
Pernambuco
Santa Catarina
Goiás
0 500 1.000 1.500 2.000 2.500

US$ milhões
Observações:
1. Sempre que as informações escritas das legendas forem extensas, devemos dar
preferência ao gráfico em barras (séries geográficas ou específicas). Porém, mesmo
assim for escolhido o gráfico em colunas, as informações das legendas devem ser
dispostas de baixo para cima, jamais o contrário.
2. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se

for geográfica ou categórica.
35
3. Para uma melhor apresentação e visualização de informações, a distância entre as
colunas (ou barras) não deverá ser menor que a metade nem maior que dois terços da
largura (ou da altura) dos retângulos.
3. Gráfico em colunas ou em barras múltiplas
É geralmente empregado quando queremos representar, simultaneamente, dois ou mais

fenômenos estudados com o propósito de comparação.
Exemplo:
Balança Comercial do País "Ômega"

Exportações Importações
40.000
US$ milhões
30.000
20.000
10.000
0
2000 2001 2002 2003 2004
36
4. Gráfico em setores ou circular (pizza)
É a representação gráfica de uma série estatística por meio de superfícies setoriais. É usado
para comparar os valores de uma série com a soma total.
O gráfico é construído com base em um círculo dividido em partes, onde cada ângulo central
é proporcional à frequência de cada variável.
Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total
da série corresponde à 360º.
Exemplo:
Vacinação contra doença "X"

Brasil - 2006
Região Quantidade
Norte 542.863
Nordeste 947.321
Sudeste 1.589.647
Sul 754.294
Centro-Oeste 349.612
TOTAL 4.183.737
37
Vacinação contra doença "X" - Brasil - 2006
8% 13%
18% Norte
Nordeste
Sudeste
23%
Sul
Centro-Oeste
38%
Observações:
1. Para uma melhor apresentação e interpretação dos dados, o gráfico em setores só

deve ser empregado quando há, no máximo, sete dados.
2. Se a série já apresenta os dados percentuais, obtemos os respectivos valores em

graus multiplicando o valor do percentual por 3,6.
38
U NIDADE 9
Objetivo: Apresentar e discutir os conceitos relacionados à Distribuição de Frequência.
Distribuição de Frequência
Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 alunos, que
compõem uma amostra dos alunos de uma Faculdade brasileira, resultando a seguinte
tabela de valores, dados em centímetros (cm):
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
A esse tipo de tabela, cujos elementos não foram numericamente organizados,

denominamos tabela primitiva.
Partindo dos dados acima, é difícil averiguar em torno de que valor tende a se concentrar as
estaturas, qual a menor e qual é a maior estatura ou, ainda, quantos alunos se acham abaixo
ou acima de uma dada estatura.
Dessa forma, conhecidos os valores de uma variável, é difícil formarmos uma ideia exata do
comportamento do grupo como um todo, a partir dos dados não ordenados.
A maneira mais simples de se organizar os dados é através de certa ordenação (crescente

ou decrescente). A tabela obtida após a ordenação dos dados recebe o nome de rol.
39
Assim, obtemos o seguinte rol para os dados apresentados:
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
Agora podemos obter com relativa facilidade qual é a menor estatura (150 cm) e qual é a
maior (173 cm). Podemos também determinar qual foi a amplitude de variação (173 - 150 =
23 cm) e, ainda, a ordem que um valor em particular da variável ocupa no conjunto.
Observamos também que há uma concentração das estaturas em algum valor entre 160 cm
e 165 cm e, mais ainda, existem poucos valores abaixo de 155 cm e acima de 170 cm.
Com base nas informações anteriores, podemos organizar o que chamamos de “Quadro de
Distribuição de Frequências”.
Definindo arbitrariamente, por exemplo, 6 classes, com intervalos de 4 cm, teremos:
ESTATURAS DE 40 ALUNOS
i Estaturas (cm) Freqüências (fi)

1 150 ⌐ 154 4
2 154 ⌐ 158 9
3 158 ⌐ 162 11
4 162 ⌐ 166 8
5 166 ⌐ 170 5
6 170 ⌐ 174 3
Σ fi = 40
O símbolo “ ⌐ “ é um intervalo fechado à esquerda e aberto à direita. Por exemplo, na classe

2, em 154 ⌐ 158 , teremos todas as frequências de 154 (inclusive) até 158 (exclusive).
40
Assim, ao invés de dizermos que a estatura de 1 aluno é 154 cm; de 4 alunos é de 155 cm;
de 3 alunos é de 156 cm; e de 1 aluno é de 157 cm, diremos que 9 alunos têm estaturas
entre 154, inclusive, e 158 cm, exclusive. Estaremos desse modo, agrupando os valores da
variável em intervalos, chamados em Estatística de classes.
Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas

perdemos em pormenores. Nos dados originais (chamados de dados desagrupados),
podemos verificar que 4 alunos têm 161 cm de altura e que não existe nenhum aluno com
171 cm de altura. Entretanto, no quadro acima (dados agrupados) não podemos ver se
algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurança, que 11 alunos
têm a estatura compreendida entre 158 e 162 cm.
O que se pretende com a construção deste quadro é realçar o que há de essencial nos
dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição.
Recorde que a Estatística tem por finalidade específica analisar o conjunto de valores,
desinteressando-se por casos isolados.
A partir do quadro anterior, podemos elaborar um quadro mais completo, pelo qual será
possível extrair um maior volume de informações sobre a variável em estudo. Este quadro é
conhecido na Estatística como “Quadro de Distribuição de Frequências”, conforme abaixo:
QUADRO DE DISTRIBUIÇÃO DE FREQUÊNCIAS
i Classes (cm) xi fi fri (%) Fi Fri (%)

1 150 ⌐ 154 152 4 10,00 4 10,00
2 154 ⌐ 158 156 9 22,50 13 32,50
3 158 ⌐ 162 160 11 27,50 24 60,00
4 162 ⌐ 166 164 8 20,00 32 80,00
5 166 ⌐ 170 168 5 12,50 37 92,50
6 170 ⌐ 174 172 3 7,50 40 100,00
TOTAL 40 100
41
Com este quadro, podemos observar, por exemplo, que existem 27,5% dos alunos com
estaturas entre 158 e 162 cm. Verificamos também que existem 80% dos alunos com
estaturas até 166 cm e que existem 33 alunos com estaturas entre 154 e 170 cm. Cada um
dos “elementos” deste quadro será detalhado a seguir.
Relação Estatística x Profissão
Como vimos, a Estatística possui grande importância para nossa formação. Dessa forma,
relacione a Estatística com sua profissão, destacando os principais pontos onde sua
aplicação é (ou poderia ser) relevante.
42
U NIDADE 10
Objetivo: Apresentar e discutir os principais Elementos de uma Distribuição de Frequência.
Elementos de uma Distribuição de Frequência
1. Classes (i)
Classes de frequência ou simplesmente classes são intervalos de variação da variável.
São representadas simbolicamente por i, sendo i = 1, 2, 3, ... , k, onde k é o número total de

classes da distribuição.
2. Limites de Classe
Denominamos limites de classe os extremos de cada classe.
O menor número é o limite inferior da classe (  i ) e o maior número, o limite superior da

classe (Li).
3. Amplitude de um intervalo de classe (hi)
Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do

intervalo que define a classe.
É obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi.
Assim:
hi = Li - i
43
4. Amplitude total da distribuição (AT)
É a diferença entre o limite superior da última classe (limite superior máximo) e o limite
inferior da primeira classe (limite inferior mínimo):

AT = Lmáx - mín
5. Amplitude Amostral (AA)
É a diferença entre o valor máximo e o valor mínimo da amostra.
AA = xmáx - xmín
6. Ponto médio de uma classe (xi)
Como o próprio nome indica, é o ponto que divide o intervalo de classe em duas partes
iguais. Para obtermos o ponto médio de uma determinada classe, calculamos a soma dos
limites da classe e dividimos por 2, ou seja:
 i  Li
xi 
2
O ponto médio de uma classe é o valor que a representa.
7. Frequência simples ou absoluta (fi)
Frequência simples ou frequência absoluta ou, simplesmente, frequência de uma classe ou

de um valor individual é o número de observações correspondentes a essa classe ou a esse
valor.
44
Obviamente, a soma de todas as frequências é igual ao número total de observações n.
k
 fi  n
i 1
8. Frequência relativa (fri)
É o valor da razão entre a frequência simples e a frequência total.
fi f
fri   i
 fi n
9. Frequência acumulada (Fi)
É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma
dada classe.
Fi = f1 + f2 + f3 + ... + fk
10. Frequência acumulada relativa (Fri)
Frequência acumulada relativa de uma classe é a frequência acumulada da classe, dividida

pela frequência total da distribuição.
Fi F
Fri   i
 fi n
45
Antes de dar continuidade aos seus estudos é fundamental que você acesse sua
SALA DE AULA e faça a Atividade 1 no “link” ATIVIDADES.
46
U NIDADE 11
Objetivo: Apresentar e calcular o Número de Classes e Intervalo de Classes de uma
Distribuição.
Cálculo do número de classes (k) e intervalo de classes (hi)
É a primeira preocupação na construção de uma distribuição de frequências. No exemplo

anterior, foi o valor de k foi arbitrariamente usado como sendo 6 e hi como 4 cm. Entretanto,
vamos agora aprender a calcular estes valores, o que não necessariamente será o mesmo
valor arbitrado anteriormente.
Para determinação do nº de classes de uma distribuição podemos utilizar a Regra de

Sturges, que nos dá o nº de classes em função do número de valores da variável:
log n
k 1
log 2
Em que k é o número de classes e n é o número total de dados.
Quando o resultado não for exato, iremos sempre arredondá-lo para mais,
independentemente do valor decimal encontrado.
Uma vez encontrado o número de classes da distribuição, devemos determinar a amplitude

do intervalo de classes (hi). Obtemos o valor de hi dividindo o valor da amplitude amostral
(AA) pelo valor de k.
47
Assim, temos:
AA
hi 
k
Também iremos manter o critério de arredondamento para mais para facilitar nossos
cálculos, na medida do possível.
Para o exemplo das estaturas dos alunos, temos:
n = 40 alunos
log 40 1,602059991
k  1   1  5,321928093  7
log 2 0,301029996
Observe que foi feito um arredondamento matemático para mais, independente do valor
decimal encontrado.
Para o cálculo de hi, temos:
AA = 173 - 150 = 23 cm
AA 23
hi    3,285714286  4
k 7
Observe que também foi feito um arredondamento matemático para mais, independente do
valor decimal encontrado.
Assim, teríamos para o exemplo anterior os valores calculados de k = 7 classes e hi = 4 cm.

Conforme foi dito, inicialmente não existia a preocupação em se calcular k, que havia sido
arbitrariamente definido como 6.
Sempre que for solicitada a aplicação da Fórmula de Sturges, deverão ser considerados k e
hi calculados.
48
U NIDADE 12
Objetivo: Apresentar e discutir as principais Medidas de Posição.
Medidas de Posição
O estudo que fizemos sobre as distribuições de frequências, até agora, permite-nos

descrever, de modo geral, os grupos dos valores que uma variável pode assumir. Dessa
forma, podemos localizar a maior concentração de valores de uma dada distribuição, isto é,
se ela se localiza no início, no meio ou no final, ou ainda, se há uma distribuição por igual.
Porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou

em confronto com outras, necessitamos introduzir conceitos que se expressem através de
números, que nos permitam traduzir essas tendências.
As medidas de posição são dados que nos orientam quanto à posição da distribuição em
relação ao eixo horizontal (eixo das abscissas).
Dentre as medidas de posição mais importantes estão as medidas de tendência central, que
recebem tal nome pelo fato dos dados observados tenderem, em geral, a ser agrupar em
torno dos valores centrais.
Destacamos:
 Média Aritmética;
 Mediana;
 Moda.
49
As outras medidas de posição são as separatrizes, que englobam:
 A própria mediana;
 Os quartis;
 Os decis;
 Os percentis.
1. Média Aritmética ( x )
É o quociente da divisão da soma dos valores da variável pela quantidade de variáveis.
Para dados não agrupados, temos:
 xi
x
n
Para dados agrupados, temos:
 x i fi
x
 fi
Sendo:
 x => média aritmética
 xi => cada valor da variável, de ordem i
 n => número de valores
 fi => frequência simples, de ordem i
50
A média é utilizada quando desejamos obter a medida de posição que possui maior
estabilidade
2. Moda (Mo)
É o valor que ocorre com maior frequência em uma série de valores.
Por exemplo, o salário modal de uma empresa é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados desta empresa.
Nos dados não agrupados, podemos encontrar séries que não possuam valor modal (série
amodal). Em contra-partida, podem haver dois ou mais valores de concentração de uma
variável. Nestes casos, a série é chamada de bimodal, trimodal, tetramodal, etc .
Para dados agrupados, a moda é o ponto médio da classe modal, ou seja, da classe de
maior frequência.
A moda é utilizada quando:
 Desejamos obter uma medida rápida e aproximada de posição;
 A medida de posição deve ser o valor mais típico da distribuição.
3. A mediana ( Md )
É definida como o número que se encontra no centro de uma série de números, estando
estes dispostos segundo uma ordem.
É o valor situado de tal forma no conjunto de dados que o separa em dois subconjuntos de
mesmo número de elementos.
51
Para dados não agrupados, se a série tiver número ímpar de elementos, a mediana é,
obviamente, o valor central da série, disposta em uma determinada sequência.
Se a série tiver um número par de elementos, a mediana será, por definição, qualquer dos
números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o
ponto médio dos valores centrais.
3.1 Mediana para dados agrupados
O problema consiste em determinar o ponto do intervalo em que está compreendida a

mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha à mediana - classe
mediana. Tal classe será, evidentemente, àquela correspondente à frequência acumulada
 fi
imediatamente superior a 2 .
Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os

valores se distribuam uniformemente em todo o intervalo de classe.
Interpolação => Inserção de uma determinada quantidade de valores entre dois números
dados.
52
Veja o exemplo:
ESTATURAS DE 40 ALUNOS DE UMA FACULDADE
i Classes (cm) xi fi fri (%) Fi Fri (%)

1 150 ⌐ 154 152 4 10,00 4 10,00
2 154 ⌐ 158 156 9 22,50 13 32,50
3 158 ⌐ 162 160 11 27,50 24 60,00  Classe mediana
4 162 ⌐ 166 164 8 20,00 32 80,00
5 166 ⌐ 170 168 5 12,50 37 92,50
6 170 ⌐ 174 172 3 7,50 40 100,00
TOTAL 40 100
Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos
determinar o valor que ocupa o 20 lugar, a partir do início da série, vemos que este deve
estar localizado na terceira classe (i = 3), supondo que as frequências destas classes
estejam uniformemente distribuídas.
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a

partir do limite inferior, a distância:
4 4 28
 20  13    7   2,54
11 11 11
A mediana será dada por: Md = 158 + 2,54 = 160,54 cm
Na prática, executamos os seguintes passos:
53
1. Determinamos as frequências acumuladas;
 fi
2. Calculamos 2 ;
3. Marcamos a classe correspondente à frequência acumulada imediatamente superior à

 fi
2 (classe mediana) e, em seguida, empregamos a fórmula:
  fi  *
 2  F( ant )  h
*
Md     
f*
Na qual:
 * é o limite inferior da classe mediana;
 F(ant) é a frequência acumulada da classe anterior à classe mediana;
 f* é a frequência simples da classe mediana;
 h* é a amplitude do intervalo da classe mediana.
Empregamos a mediana quando:
1. Desejamos obter o ponto que divide a distribuição em partes iguais;
2. Há valores extremos que afetam a média de uma maneira acentuada;
3. A variável em estudo é salário.
54
U NIDADE 13
Objetivo: Apresentar e discutir as Medidas Separatrizes – Quartis.
Medidas Separatrizes
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No
entanto, ela apresenta outra característica, tão importante quanto à primeira: ela separa a
série em dois grupos que apresentam o mesmo número de valores.
Assim, além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à mediana
relativamente à sua segunda característica, já que se baseiam em sua posição na série.
Essas medidas - os quartis, os decis e os percentis - são, juntamente com a mediana,

conhecidas pelo nome genérico de medidas separatrizes.
1. Os quartis
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há,
portanto, três quartis:
O primeiro quartil (Q1)
Valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e
as três quartas partes restantes (75%) são maiores.
55
O segundo quartil (Q2)
Evidentemente, coincide com a mediana (Q2 = Md ).
O terceiro quartil (Q3)
Valor situado de tal modo na série que as três quartas partes (75%) dos dados são menores
que ele e uma quarta parte (25%) é maior.
Quando os dados estão agrupados, para determinar os quartis usamos a mesma técnica do
 fi
cálculo da mediana, bastando substituir, na fórmula da mediana, 2 por:
k  fi
4
sendo k o número de ordem do quartil.
Assim, temos:
 k  fi  *
 4  F( ant )   h
*
Qk   
f*
56
U NIDADE 14
Objetivo: Apresentar e discutir as Medidas Separatrizes – Decis.
2. Os decis
Denominamos decis os valores de uma série que a dividem em dez partes iguais. Há,
portanto, dez decis:
O primeiro decil (D1)
Valor situado de tal modo na série que 10% dos dados é menor que ele e 90% restantes são
maiores.
O segundo decil (D2)
maiores.
O terceiro decil (D3)
maiores.
57
O quarto decil (D4)
maiores.
O quinto decil (D5)
maiores. Evidentemente, coincide com a mediana (D5 = Q2 = Md ).
O sexto decil (D6)
maiores.
O sétimo decil (D7)
maiores.
O oitavo decil (D8)
maiores.
58
O nono decil (D9)
maiores.
O décimo decil (D10)
maiores (ou seja, nenhum é maior).
 fi
O cálculo de um decil segue a mesma técnica do cálculo da mediana, porém a fórmula 2
será substituída por:
k  fi
10
Sendo k o número de ordem do decil.
Assim, temos:
 k  fi 
  F(ant )   h*
10
Dk  *   
f*
59
U NIDADE 15
Objetivo: Apresentar e discutir as Medidas Separatrizes – Percentis.
3. Os percentis
Denominamos percentis os noventa e nove valores que separam uma série em 100 partes
iguais.
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém a fórmula

 fi
2 será substituída por:
k  fi
100
sendo k o número de ordem do percentil.
Assim, temos:
 k  fi 
  F(ant )   h*
100
Pk  *   
f*
60
U NIDADE 16
Objetivo: Apresentar e discutir as Medidas de Dispersão ou Variabilidade.
Medidas de Dispersão ou Variabilidade
Vimos anteriormente que um conjunto de valores pode ser sintetizado por meio de
procedimentos matemáticos em poucos valores representativos: média aritmética, mediana
e moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento
do conjunto.
No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já

convenientemente simplificados, é necessário ter-se uma ideia retrospectiva de como se
apresentavam estes mesmos dados nas tabelas.
Vemos, então, que a média - ainda que considerada como um nº que tem a faculdade de
representar uma série de valores - não pode, por si mesma, destacar o grau de
homogeneidade ou heterogeneidade que existem entre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:
X : 70, 70, 70, 70, 70.
Y : 68, 69, 70, 71, 72.
Z : 5, 15, 50, 120, 160.
61
Calculando a média aritmética de cada um desses conjuntos, obtemos:
 x i 350
x   70
n 5 ;
 y i 350
y   70
n 5 ;
 z i 350
z   70
n 5 ;
Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70.
Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que
todos os valores são iguais à média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação
entre cada um de seus valores e a média representativa.
Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de

uma variável em torno de um valor de tendência central tomado como ponto de comparação,
podemos dizer que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto
Y apresenta uma dispersão ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística
recorre às medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente

de variação.
62
Amplitude Total
Para dados não agrupados
É a diferença entre o maior e o menor valor observado.
AT = x(máx) – x(mín)
Para dados agrupados
É a diferença entre o limite superior da última classe e o limite inferior da primeira classe.
AT = L(superior) –  (inferior)
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da

série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a
idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou
variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um

dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a
compreensão popular é mais importante que a exatidão e a estabilidade.
63
U NIDADE 17
Objetivo: Apresentar e discutir as Medidas de Dispersão ou Variabilidade – Variância e
Desvio Padrão.
Medidas de Dispersão ou Variabilidade
Variância e Desvio Padrão
Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos,
que são, na sua maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em
consideração a totalidade dos valores da variável em estudo, o que faz delas índices de
variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados.
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a

média aritmética dos quadrados dos desvios. Assim, representando a variância por s2,
temos:
2 2
2  x i  x   x i  x 
s  
 fi n
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um nº em unidade
quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um
inconveniente.
64
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas,
denominada desvio padrão, definida como a raiz quadrada da variância e representada por s:
s  s2
Assim, teremos que:
2
 x i  x 
s
Desvio padrão: n (Para população)
Quando nosso interesse não se restringe à descrição dos dados, mas, partindo da amostra,
visamos tirar inferências válidas para a respectiva população, convém efetuar uma
modificação, que consiste em utilizarmos o divisor n - 1 no lugar de n.
Assim, teremos:
2
 x i  x 
s
Desvio padrão: n 1 (Para amostra)
Desvio padrão para dados agrupados
Analogamente ao caso da média, o desvio padrão de um conjunto de dados agrupados é

dado por:
Desvio padrão na amostra:
s
 2

 x i .fi  n.x
2
n 1
65
U NIDADE 18
Objetivo: Apresentar e discutir o Coeficiente de Variação.
O coeficiente de variação (CV)
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas
unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 300;
no entanto, se a média for igual a 30, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade de medida dos dados
limita o seu emprego quando desejamos comparar duas ou mais séries de valores,
relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou

variabilidade dos dados em termos relativos a seu valor médio. Toma-se então uma medida
relativa da variabilidade, comparando o desvio padrão com a média. Esta medida é o
coeficiente de variação (CV).
s
CV   100
x
Já vimos que o desvio padrão tem a mesma unidade de medida que os dados, de modo que
o coeficiente de variação é adimensional.
A grande utilidade do coeficiente de variação é permitir a comparação das variabilidades de

diferentes conjuntos de dados.
66
U NIDADE 19
Objetivo: Apresentar e discutir o Escore Padronizado.
Escore padronizado (zi)
No contexto de um único conjunto de dados, o desvio padrão pode ser interpretado

intuitivamente como unidade natural de dispersão de dados. Esta interpretação é utilizada na
construção de “escores padronizados”, de larga aplicação em medidas educacionais.
Por exemplo, em uma escala de 0 a 10, a nota 6 em uma prova em que a nota máxima foi
6 é muito mais do que a mesma nota 6 em uma prova em que a nota máxima foi 9. Uma
forma de captar essa diferença é considerar a nota do aluno como a sua posição relativa no
grupo, medida por:
xi  x
zi 
s
, onde zi é o que se chama “escore padronizado”
Dessa forma, estamos comparando a nota do aluno com a média do grupo, ou seja, estamos
considerando o afastamento da nota em relação à média, tomando esta como origem. Ao
dividirmos aquela diferença pelo desvio padrão s, estamos tomando o desvio padrão como
unidade ou padrão de medida. Daí o nome desvio padrão.
67
Aplicação das Ferramentas no dia a dia
De acordo com o que você aprendeu, como poderíamos aplicar as ferramentas e métodos
estatísticos em seu dia a dia ? Quais rotinas ou processos poderiam ser melhorados? Como?
68
U NIDADE 20
Objetivo: Apresentar, discutir e calcular as Medidas de Assimetria.
Medidas de Assimetria
Você já ouviu falar dessas medidas ? Sabe como calculá-las? Vamos estão estudá-las nesta
unidade.
Chamamos de assimetria o grau de desvio ou afastamento da simetria de uma distribuição

(média e moda).
As medidas podem ser simétricas ou assimétricas. Elas são simétricas quando os valores da
Média e Moda se coincidem. Quando a média é menor que a moda, a medida é assimétrica
à esquerda ou negativa. Quando a média é maior que a moda, a medida é assimétrica à
direita ou positiva. Naturalmente, quanto mais próxima de zero for a medida de assimetria,
mais simétrica será a distribuição.
Os conceitos de assimetria de uma curva de frequência estão ilustrados nos gráficos abaixo:
69
Baseando-se nas relações entre a Média e a Moda, podemos determinar o tipo de
assimetria.
Se tivermos:
 x – Mo = 0 => assimetria nula ou distribuição simétrica
 x – Mo < 0 => assimetria negativa ou à esquerda
 x – Mo > 0 => assimetria positiva ou à direita
onde:
x = Média
Mo = Moda
70
Exemplos:
1. Suponhamos os seguintes valores: x = 18 e Mo = 18.
Temos nesse caso uma distribuição simétrica, pois x – Mo = 18 – 18 = 0
2. Suponhamos os seguintes valores: x = 14,3 e Mo = 17.
Temos nesse caso uma distribuição assimétrica negativa, pois x – Mo = 14,3 – 17 = –

2,7
3. Suponhamos os seguintes valores: x = 15,1 e Mo = 12.
Temos nesse caso uma distribuição assimétrica positiva, pois x – Mo = 15,1 – 12 =

3,1
Coeficiente de Assimetria de Pearson
Nessa medida de coeficiente, podemos verificar se a assimetria é moderada, fraca ou forte,

por meio da fórmula:
3  x  Md
As 
s , em que:
As = Coeficiente de Assimetria de Pearson
x = Média
Md = Mediana
s = Desvio-padrão
71
Após calcular os valores da média, mediana e desvio-padrão, basta aplicar na fórmula
anterior para se obter o Coeficiente de Assimetria de Pearson.
A assimetria é considerada moderada se o módulo do resultado encontrado estiver entre

0,15 e 1, ou seja, se 0,15 < |As| < 1. Se 0 < |As| ≤ 0,15 , temos uma assimetria fraca e,
caso |As| ≥ 1, então a assimetria é considerada forte.
Assim, temos:
As = 0 ⇒ temos uma simetria
0 < |As| ≤ 0,15 ⇒ temos uma assimetria fraca
0,15 < |As| < 1 ⇒ temos uma assimetria moderada
|As| ≥ 1 ⇒ temos uma assimetria forte
Exemplos:
1. Considere os valores: x = 10, Md = 10 e s = 4,8. Calcule o coeficiente de assimetria.
3  x  Md
As 
s
3  10  10  3  0
As   0
4,8 4,8
Como As = 0, temos neste caso uma simetria.
72
2. Considere os valores: x = 14,5 , Md = 15,2 e s = 4,2. Calcule o coeficiente de
assimetria.
3  x  Md
As 
s
3  14,5  15,2 3   0,7   2,1

As     0,5
4,2 4,2 4,2
Como As = – 0,5 e 0,15 < |As| < 1, temos neste caso uma assimetria negativa moderada.
3. Considere os valores: x = 11,6 , Md = 10,62 e s = 2,1. Calcule o coeficiente de

assimetria.
3  x  Md
As 
s
3  11,6  10,62 3  0,98 2,94

As     1,4
2,1 2,1 2,1
Como As = 1,4 e |As| ≥ 1, temos neste caso uma assimetria positiva forte.
Antes de dar continuidade aos seus estudos é fundamental que você acesse sua
SALA DE AULA e faça a Atividade 2 no “link” ATIVIDADES.
73
U NIDADE 21
Objetivo: Apresentar, discutir e calcular as Medidas de Curtose.
Medidas de Curtose
Você já ouviu falar dessas medidas ? Sabe como calculá-las ? Vamos estão estudá-las nesta
unidade.
Chamamos de Curtose o grau de achatamento de uma distribuição em relação a uma

distribuição padrão, denominada Curva Normal, que é uma curva correspondente a uma
distribuição teórica de probabilidade.
Curva Normal ou Curva de Gauss
Quando a distribuição apresentar uma curva de frequência mais aberta que a normal (ou
mais achatada em sua parte superior), ela receberá o nome de Platicúrtica.
Se a distribuição em estudo apresentar uma curva de frequência mais fechada que a normal
(ou mais aguda em sua parte superior), ela receberá o nome de Leptocúrtica.
A curva normal, que é a nossa base referencial, recebe o nome de Mesocúrtica.
74
Os tipos de curvas de frequência em termos de curtose estão mostrados abaixo:
Coeficiente de Curtose
Uma fórmula para medir a curtose é mediante o cálculo do Coeficiente Percentílico de

Curtose, conforme abaixo:
Q 3  Q1
C
2  P90  P10 
onde:
C = Coeficiente Percentílico de Curtose ou Coeficiente de Curtose
Q1 = 1º Quartil da Distribuição
Q3 = 3º Quartil da Distribuição
P10 = 10º Percentil da Distribuição
P90 = 90º Percentil da Distribuição
75
Para o caso especial da Curva Normal, temos que C = 0,263.
Assim:
Se C = 0,263 => Curva Mesocúrtica
Se C < 0,263 => Curva Leptocúrtica
Se C > 0,263 => Curva Platicúrtica
Exemplos:
1. Sabendo que uma distribuição apresenta as seguintes medidas:
Q1 = 21,84 cm ; Q3 = 45,32 cm
P10 = 18,69 cm ; P90 = 53,24 cm
Calcule o coeficiente de curtose e classifique a distribuição em relação à curva normal.
Solução:
Q 3  Q1
C
2  P90  P10 
45,32  21,84 23,48 23,48

C    0,3398
2  53,24  18,69  2  34,55 69,10
Como 0,3398 > 0,263 , temos uma distribuição Platicúrtica em relação à normal.
76
2. Uma distribuição salarial de uma empresa apresentou os seguintes valores:
Q1 = R$ 925,36 ; Q3 = R$ 2.043,75
P10 = R$ 658,31 ; P90 = R$ 2.983,87
Calcule o coeficiente de curtose e classifique a distribuição em relação à curva normal.
Solução:
Q 3  Q1
C
2  P90  P10 
2.043,75  925,36 1.118,39 1.118,39

C    0,2405
2  2.983,87  658,31 2  2.325,56 4.651,12
Como 0,2405 < 0,263 , temos uma distribuição Leptocúrtica em relação à normal.
77
U NIDADE 22
Objetivo: Apresentar e discutir os principais elementos relacionados às Probabilidades.
Noções de Probabilidades
É conveniente dispormos de uma medida que exprima a incerteza presente em afirmações

tais como: “É possível que chova amanhã”, ou “Não há chance de vitória”, em termos de uma
escala numérica que varie do impossível ao certo. Esta medida é a probabilidade.
O conceito de probabilidade é fundamental para o estudo de situações onde os resultados

são variáveis, mesmo quando mantidas inalteradas as condições de sua realização.
Experimento Aleatório
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “é

provável que o meu time ganhe a partida de hoje” pode resultar:
 que, apesar do favoritismo, ele perca;
 que, como pensamos, ele ganhe;
 que empate.
Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados
fenômenos aleatórios ou experimentos aleatórios.
Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob
condições semelhantes, apresentam resultados imprevisíveis.
78
É o processo de coleta de dados relativos a um fenômeno que acusa variabilidade em seus
resultados.
Espaço Amostral
É o conjunto de todos os resultados possíveis de um experimento. Vamos representá-lo por

S. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer
coroa. Logo, temos:
S = {CARA , COROA}
Já ao lançarmos um dado, há seis resultados possíveis. Assim, temos:
S = {1, 2, 3, 4, 5, 6}
Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto

universo, representado por S.
Do mesmo modo, como em dois lançamentos sucessivos de uma moeda podemos obter
cara nos dois lançamentos, ou cara no primeiro e coroa no segundo, ou coroa no primeiro e
cara no segundo, ou coroa nos dois lançamentos, o espaço amostral é:
S = {(Ca, Ca) , (Ca, Co) , (Co, Ca) , (Co, Co)}
Cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto

amostral. Assim:
2  S  2 é um ponto amostral de S
79
Eventos
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento

aleatório, representado por E.
Assim, qualquer que seja E, se E  S (E está contido em S), então E é um evento de S.
Se E = S, E é chamado evento certo.
Se E  S e E é um conjunto unitário, E é chamado evento elementar.
Se E = , E é chamado evento impossível.
Exemplo:
No lançamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
 A = {2, 4, 6}  S; logo, A é um evento de S.
 B = {1, 2, 3, 4, 5, 6}  S; logo, B é um evento certo de S (B = S).
 C = {4}  S; logo, C é um evento elementar de S.
 D =   S; logo, D é um evento impossível de S.
Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser
definidos pelas sentenças:
 “Obter um número par na face superior.”
 “Obter um número menor ou igual a 6 na face superior.”
 “Obter o número 4 na face superior.”
 “Obter um número maior que 6 na face superior.”
80
U NIDADE 23
Objetivo: Apresentar e calcular as Probabilidades.
Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os
elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto
equiprovável.
Chamamos de probabilidade de um evento A (A  S) o número real P(A), tal que:
n( A )
P(A) 
n (S)
Onde:
 n(A) é o número de elementos de A ou número de vezes que A ocorreu;
 n(S) é o número de elementos de S ou número total de repetições do experimento;
Assim, pelos exemplos anteriores podemos concluir que, sendo n(S) = n:
 A probabilidade do evento certo é igual a 1 =>
P(S) = 1
81
 A probabilidade do evento impossível é igual a zero =>
P() = 0
 A probabilidade de um evento E qualquer (E  S) é um número real P(E), tal que:
0  P(E)  1
 A probabilidade de um evento elementar E qualquer é, lembrando que n(E) = 1:
1
P(E) 
n
n(A
Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra
(sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento
existe sempre a relação:
p  q 1  q 1 p
Eventos Independentes
Dizemos que dois eventos são independentes quando a realização ou a não realização de
um dos eventos não afeta a probabilidade da realização do outro e vice-versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do
resultado obtido no outro.
82
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de

realização do segundo evento, a probabilidade de que tais eventos se realizem
simultaneamente é dada por:
p  p1  p 2
Eventos Mutuamente Exclusivos
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um
exclui a realização do(s) outro(s).
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são
mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é

igual à soma das probabilidades de que cada um deles se realize:
p  p1  p 2
83
U NIDADE 24
Objetivo: Exercícios resolvidos envolvendo o cálculo de Probabilidades.
Exercícios Resolvidos Envolvendo o Cálculo de Probabilidades
1. Qual a probabilidade de sair o valete de espadas quando retiramos uma carta de um

baralho de 52 cartas ?
Solução:
Evento A = {sair valete de espadas em um baralho de 52 cartas}
P(A) = Probabilidade de ocorrer o Evento A
n(A) = Quantidade de valetes de espadas existentes no baralho de 52 cartas
n(S) = Quantidade de elementos do Espaço Amostral S, ou seja, número de cartas do
baralho.
Logo, temos:
n( A ) 1
P( A )    0,0192308  1,92%
n(S) 52
Resposta: A probabilidade de sair o valete de espadas quando retiramos uma carta de

um baralho de 52 cartas é de aproximadamente 1,92%.
2. Qual a probabilidade de sair uma dama quando retiramos uma carta de um baralho de 52
cartas ?
Solução:
Evento A = {sair dama em um baralho de 52 cartas}
n(A) = Quantidade de damas existentes no baralho de 52 cartas
84
n(S) = Quantidade de elementos do Espaço Amostral S, ou seja, número de cartas do
baralho.
Logo, temos:
n( A ) 4
P( A )    0,0769231  7,69%
n(S) 52
Resposta: A probabilidade de sair uma dama quando retiramos uma carta de um

baralho de 52 cartas é de aproximadamente 7,69%.
3. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 7.
Solução:
O evento “obter soma igual a 7” é formado pelos elementos (1, 6) , (6, 1) , (2, 5) , (5, 2) ,
(3, 4) , (4, 3). Como o número de elementos do Espaço Amostral S é 36 (pois existem ao
todo 6 x 6 = 36 possíveis combinações no lançamento de dois dados), temos que:
n( A ) 6
P( A ) = = ≈ 16,67%
n(S) 36
4. Em um lote de 18 peças, 5 são defeituosas. Sendo retirada uma peça, calcule:
a) A probabilidade de essa peça ser defeituosa;

b) A probabilidade de essa peça não ser defeituosa;
Solução:
a) Evento A = {sair peça defeituosa}
85
n(A) = Quantidade de peças defeituosas existentes no lote.
n(S) = Quantidade de total de peças do lote.
Logo, temos:
n( A ) 5
P( A ) = = = 0,277777778 ≈ 27,78 %
n(S) 18
b) Evento B = {sair peça não defeituosa}

P(B) = Probabilidade de ocorrer o Evento B
n(B) = Quantidade de peças não defeituosas existentes no lote.
n(S) = Quantidade de total de peças do lote.
Logo, temos:
n(B) 13
P(B) = = = 0,722222222 ≈ 72,22 %
n(S ) 18
Como os eventos A e B são eventos complementares, também poderíamos fazer

neste problema:
P(A) + P(B) = 1
P(B) = 1 – P(A) = 1 – 0,277777778 = 0,722222222 ≈ 72,22%
Resposta: A probabilidade de se retirar uma peça defeituosa é de aproximadamente

27,78% e de se retirar uma não defeituosa é de aproximadamente 72,28%.
5. Uma urna A contém: 5 bolas brancas, 3 pretas, 3 verdes; uma urna B contém: 4 bolas
brancas, 2 pretas, 2 verdes; uma urna C contém: 3 bolas brancas, 2 pretas, 4 verdes.
Uma bola é retirada de cada urna. Qual a probabilidade de as três bolas retiradas da
primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde ?
Solução:
p1 = { sair bola branca na primeira urna }

p2 = { sair bola preta na segunda urna }
86
p3 = { sair bola verde na terceira urna }
Como são três acontecimentos simultâneos e independentes (uma urna não afeta
outra), temos que:
pTotal = p1 x p2 x p3
5 2 4 40 5
p Total = × × = = ≈ 5,05%
11 8 9 792 99
6. De dois baralhos retiram-se, simultaneamente, uma carta do primeiro baralho e uma

carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser uma dama e a
do segundo ser o 6 de copas ?
Solução:
p1 = { sair dama }
p2 = { sair 6 de copas }
Como são dois acontecimentos simultâneos e independentes (um baralho não afeta
outro), temos que:
pTotal = p1 x p2
4 1 4 1
p Total = × = = ≈ 0,15%
52 52 2704 676
7. De um baralho retiram-se, ao acaso, duas cartas sem reposição. Qual a probabilidade

de a primeira carta ser o rei de espada e a segunda ser o valete de ouros ?
Solução:
p1 = { sair rei de espada }

p2 = { sair valete de ouros }
87
Como são dois acontecimentos simultâneos e independentes (um baralho não afeta
outro), temos que:
pTotal = p1 x p2
1 1 1
p Total = × = ≈ 0,04%
52 51 2652
Observe que, após a retirada da primeira carta, restam 51 cartas no baralho, uma
vez que a carta retirada não foi reposta, conforme solicita o enunciado da questão.
8. No lançamento de um dado, qual a probabilidade de se obter um número não inferior a

4?
Solução:
A probabilidade de se obter um número não inferior a 4 é a probabilidade de se obter

4 ou 5 ou 6. Como são eventos mutuamente exclusivos, temos que:
p1 = { sair 4 } ; p2 = { sair 5 } ; p3 = { sair 6 }
pTotal = p1 + p2 + p3
1 1 1 3
p Total = + + = = 50,00%
6 6 6 6
9. Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho ?
Solução:
Sair uma figura significa sair rei ou sair dama ou sair valete.
4 1
p1 = { sair rei } = =
52 13
88
4 1
p2 = { sair dama } = =
52 13
4 1
p3 = { sair valete } = =
52 13
Como os três eventos são mutuamente exclusivos (ou sai rei, ou sai dama ou sai
valete – uma opção exclui a outra), temos que:
pTotal = p1 + p2 + p3
1 1 1 3
p Total = + + = ≈ 23,08%
13 13 13 13
Também poderíamos resolver este problema da seguinte forma:
Como em um baralho temos 12 figuras (4 reis, 4 damas e 4 valetes), teríamos que:
12 3
p Total = = ≈ 23,08%
52 13
10. Qual a probabilidade de sair uma carta de paus ou de copas quando retiramos uma carta
de um baralho ?
Solução:
13 1
p1 = { sair paus } = =
52 4
13 1
p2 = { sair copas } = =
52 4
Como os dois eventos são mutuamente exclusivos (ou sai paus ou sai copas – uma
opção exclui a outra), temos que:
89
pTotal = p1 + p2
1 1 2 1
p Total = + = = = 50,00%
4 4 4 2
11. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 9 ou
maior que 9.
Solução:
A probabilidade de temos soma 9 ou maior que 9 significa dizer que a soma deverá ser
9, 10, 11 ou 12. Dessa forma, temos que calcular a probabilidade de cada uma dessas
possibilidades. Assim, temos:
 Soma igual a 9: Este evento é formado pelos elementos (3, 6) , (6, 3) , (4, 5) , (5, 4).
 Soma igual a 10: Este evento é formado pelos elementos (4, 6) , (6, 4) , (5, 5).
 Soma igual a 11: Este evento é formado pelos elementos (5, 6) , (6, 5).
 Soma igual a 12: Este evento é formado pelo único elemento (6, 6).
Lembrando que o número de elementos do Espaço Amostral S é 36 (pois existem ao todo

6 x 6 = 36 possíveis combinações no lançamento de dois dados), temos que:
4
p1 = { sair soma 9 } =
36
3
p2 = { sair soma 10 } =
36
2
p3 = { sair soma 11 } =
36
1
p4 = { sair soma 12 } =
36
90
Como estes quatro eventos são mutuamente exclusivos (ou sai soma 9, ou soma 10,
ou soma 11 ou soma 12 – uma opção exclui a outra), temos que:
pTotal = p1 + p2 + p3 + p4
4 3 2 1 10 5
p Total = + + + = = ≈ 27,78 %
36 36 36 36 36 18
12. São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de tirarmos um 4 e um 7, não
necessariamente nesta ordem ?
Solução:
4 1
p1 = { sair quatro } = =
52 13
4 1
p2 = { sair sete } = =
52 13
Vamos calcular a probabilidade de termos um quatro no primeiro baralho e um sete no

segundo baralho. Como são dois acontecimentos simultâneos e independentes (um
baralho não afeta outro), temos que:
1 1 1
p3 = p1 x p2 → p3 = × =
13 13 169
A probabilidade de tirarmos um sete no primeiro baralho e um quatro no segundo

baralho é a mesma, ou seja:
1 1 1
p4 = p1 x p2 → p4 = × =
13 13 169
Como estes dois eventos são mutuamente exclusivos (ou sai a sequência 4 – 7 , ou
sai a sequência 7 – 4 , pois uma opção exclui a outra), temos que:
91
pTotal = p3 + p4
1 1 2
p Total = + = ≈ 1,18 %
169 169 169
92
U NIDADE 25
Objetivo: Apresentar e discutir as principais Distribuições de Probabilidades.
Distribuições de Probabilidade
Serão apresentados dois modelos teóricos de Distribuição de Probabilidade, aos quais um

experimento aleatório estudado possa ser adaptado, o que permitirá a solução de grande
número de problemas práticos.
1. Variável Aleatória
Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído um número.
Fica, então, definida uma função chamada VARIÁVEL ALEATÓRIA, indicada por uma letra
maiúscula, sendo seus valores indicados por letras minúsculas.
Assim, se o espaço amostral relativo ao “lançamento simultâneo de duas moedas” é S =

{(Ca,Ca) , (Ca,Co) , (Co,Ca) , (Co,Co)} e se X representa “o número de caras” que
aparecem, a cada ponto amostral podemos associar um número para X, de acordo com a
tabela abaixo:
Ponto Amostral X
(Ca,Ca) 2
(Ca,Co) 1
(Co,Ca) 1
(Co,Co) 0
93
2. Distribuição de Probabilidade
Consideremos a distribuição de frequências relativa ao número de acidentes diários em um

estacionamento:
Número de Acidentes Frequências
0 22
1 5
2 2
3 1
TOTAL   30
Em um dia qualquer, a probabilidade de:
22
p  0,73
 Não ocorrer acidente é: 30
5
p  0,17
 Ocorrer um acidente é: 30
2
p  0,07
 Ocorrerem dois acidentes é: 30
1
p  0,03
 Ocorrem três acidentes é: 30
94
Podemos escrever:
Número de Acidentes Probabilidades
0 0,73
1 0,17
2 0,07
3 0,03
1
Esta tabela é denominada DISTRIBUIÇÃO DE PROBABILIDADE.
Seja X uma variável aleatória que pode assumir os valores x1, x2, x3, ... , xn. A cada valor xi
correspondem pontos do espaço amostral. Associamos, então, a cada valor xi a
probabilidade pi de ocorrência de tais pontos no espaço amostral.
Assim, temos:
 pi  1
Os valores x1, x2, x3, ... , xn e seus respectivos correspondentes p1, p2, p3, ... , pn definem
uma distribuição de probabilidade.
95
Logo, para o caso do lançamento de duas moedas, teremos:
Ponto Amostral X P(X)
1 1 1
(Ca,Ca) 2 x 
2 2 4
1 1 1
(Ca,Co) 1 x 
2 2 4
1 1 1
(Co,Ca) 1 x 
2 2 4
1 1 1
(Co,Co) 0 x 
2 2 4
Assim, poderemos escrever:
Número de Caras (X) P(X)
1
2
4
2
1
4
1
0
4
1
Ao definir a distribuição de probabilidade, estabelecemos uma correspondência unívoca

entre os valores da variável aleatória X e os valores da variável P. Esta correspondência
96
define uma função; os valores xi ( i = 1, 2, 3, ... , n) formam o domínio da função e os valores
pi ( i = 1, 2, 3, ... , n) formam o seu conjunto imagem.
Esta função, assim definida, é denominada função de probabilidade e é representada por:
f(x) = P (X = xi)
A função P (X = xi) determina a distribuição de probabilidade da variável aleatória X.
Assim, ao lançarmos um dado, a variável aleatória X, definida por “pontos de um dado”, pode
tomar os valores 1, 2, 3, 4, 5 e 6.
Como a cada um destes valores está associada uma e uma só probabilidade de realização e
 P(x i )  1 ·, fica definida uma função de probabilidade, da qual resulta a seguinte

distribuição de probabilidade:
X P(X)
1
1
6
1
2
6
1
3
6
1
4
6
1
5
6
1
6
6
1
97
U NIDADE 26
Objetivo: Apresentar e discutir a Distribuição Binomial.
Distribuição Binomial
Consideraremos experimentos que satisfaçam as seguintes condições:
 O experimento deve ser repetido, nas mesmas condições, um número finito de vezes
(n);
 As provas repetidas devem ser independentes, isto é, o resultado de uma NÃO deve
afetar os resultados das sucessivas;
 Em cada prova deve aparecer um dos dois possíveis resultados: SUCESSO e

INSUCESSO;
 No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (q =

1 - p) do insucesso manter-se-ão constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n

tentativas.
Por exemplo, o experimento “obtenção de caras em cinco lançamentos sucessivos e

independentes de uma moeda” satisfaz essas condições.
Sabemos que, quando da realização de um experimento qualquer em uma única tentativa, se

a probabilidade de realização de um evento (sucesso) é p , a probabilidade de não realização
desse mesmo evento (insucesso) é 1 - p = q .
98
Ao realizarmos a mesma prova n vezes sucessivas e independentes, a probabilidade de que
um evento se realize k vezes nas provas é dada pela função:
n
f ( X)  P( X  k )   pk qn  k
k 
Onde:
 P(X = k) é a probabilidade de que o evento se realize k vezes em n provas;
 p é a probabilidade de que o evento se realize em uma só prova - SUCESSO;
 q é a probabilidade de que o evento não se realize no decurso da prova -

INSUCESSO;
n n!
 
k
   é o coeficiente binomial de n sobre k, igual a k!( n  k )! .
Essa função, denominada lei binomial, define a distribuição binomial.
n
 
O termo BINOMIAL possui origem no fato de que  k  pk . qn-k é o termo geral do
desenvolvimento do BINÔMIO DE NEWTON.
99
U NIDADE 27
Objetivo: Apresentar e discutir a Distribuição Normal.
Distribuição Normal
Curva Normal
Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a
DISTRIBUIÇÃO NORMAL.
Muitas variáveis analisadas em pesquisas socioeconômicas correspondem à distribuição

normal ou dela se aproximam.
O aspecto gráfico de uma distribuição normal é o da figura abaixo:
Curva Normal ou Curva de Gauss
100
Para uma perfeita compreensão da distribuição normal, analisaremos a figura e
observaremos as seguintes propriedades:
1. A variável aleatória X pode assumir todo e qualquer valor real;
2. A representação gráfica da distribuição normal é uma curva em forma de sino,

simétrica em torno da média ( x ), que recebe o nome de curva normal ou de Gauss;
3. A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade de a variável aleatória X assumir qualquer valor real;
4. A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se

indefinidamente do eixo das abscissas sem, contudo, alcançá-lo;
5. Como a curva é simétrica em torno de x , a probabilidade de ocorrer valor maior do

que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é,
ambas as probabilidades são iguais a 0,5 (ou 50%).
Escrevemos:
P( X > x ) = P( X < x ) = 0,5
Quando temos uma variável aleatória com distribuição normal, nosso principal interesse é
obter a probabilidade de essa variável aleatória assumir um valor em um determinado
intervalo.
Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa
máquina. Vamos supor que essa variável tenha distribuição normal com os seguintes dados:
Média : x = 2 cm
Desvio padrão : s = 0,04 cm
101
Vamos determinar a probabilidade de um parafuso ter diâmetro com valor entre 2 e 2,05 cm.
Essa probabilidade é indicada por: P(2 < X < 2,05) , correspondente à área hachurada na
figura abaixo:
xi  x
z
s
Se X é uma variável aleatória com distribuição normal de média x e desvio padrão s, então a
variável z tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e
desvio padrão 1, onde z é o escore padronizado, calculado da seguinte forma:
As probabilidades associadas à distribuição normal padronizada são encontradas em

tabelas, não havendo necessidade de serem calculadas.
xi  x
z
s
Observe a curva e tabela a seguir:
Área subentendida pela Curva Normal reduzida de 0 a Z:
102
103
A probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z é:
P(0 < Z < z)
Temos, então, que se X é uma variável aleatória com distribuição normal de média x e
desvio padrão s, podemos escrever:
xi  x
z
P ( x < X < x ) = P ( 0 < Z < z ), com s .
Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, devemos calcular o valor
de z que corresponde a x = 2,05 (x = 2  z = 0, pois x = 2). Temos, então:
x i  x 2,05  2 0,05
z    1,25
s 0,04 0,04
Onde:
P(2 < X < 2,05) = P(0 < X < 1,25)
Olhando na tabela o valor de z = 1,25, temos:
Na primeira coluna encontramos o valor de 1,2. Em seguida, encontramos, na primeira linha,

o valor 5, que corresponde ao último algarismo do número 1,25. Na interseção da linha e
coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever:
P(0 < Z < 1,25) = 0,3944
104
Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro
entre a média x = 2 e o valor x = 2,05 é 0,3944.
Escrevemos, então:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%
105
U NIDADE 28
Objetivo: Apresentar e discutir os conceitos principais relacionados à Correlação.
Correlação
Nosso estudo anterior se preocupava em descrever a distribuição de valores de uma única

variável. Entretanto, quando consideramos observações de duas ou mais variáveis, surge um
novo problema: as relações que podem existir entre as variáveis estudadas.
Quando consideramos variáveis como peso e altura de um grupo de pessoas, uso do cigarro
e a incidência de câncer, vocabulário e compreensão da leitura, dominância e submissão,
procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e
qual o grau dessa relação. Para isso, é necessário o conhecimento de novas medidas.
Sendo esta relação de natureza quantitativa, o instrumento adequado para descobrir e medir
essa relação denomina-se CORRELAÇÃO.
Uma vez caracterizada esta relação, procuraremos descrevê-la através de uma função
matemática. A REGRESSÃO é o instrumento adequado para determinar os parâmetros
dessa função.
Relação Funcional x Relação Estatística
Já sabemos que o perímetro e o lado de um quadrado estão relacionados. A relação que os

liga é perfeitamente definida e pode ser expressa por meio de uma sentença matemática:
  4
106
Onde  é o perímetro e  é o lado do quadrado.
Ao atribuirmos um valor qualquer a  , é possível determinar exatamente o valor de .
Consideremos, agora, a relação que existe entre o peso e a estatura de um grupo de

pessoas. É evidente que essa relação não é do mesmo tipo da anterior; ela é bem menos
precisa. Pode acontecer que a estaturas diferentes correspondam pesos iguais ou que a
estaturas iguais correspondam pesos diferentes. Porém, em média, quanto maior a estatura,
maior o peso.
As relações do tipo perímetro-lado são conhecidas como relações funcionais e as do tipo

peso-estatura, como relações estatísticas.
Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe
correlação entre elas.
Diagrama de Dispersão
Consideremos uma amostra aleatória formada por 10 dos 98 alunos de uma determinada
Faculdade A e pelas notas por eles obtidas nas disciplinas de Matemática e Estatística.
Vejamos os valores obtidos:
Nº do NOTAS
aluno Matemática (xi) Estatística (yi)
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
107
Representando os pares ordenados (xi , yi) em um sistema coordenado cartesiano ortogonal,
obtemos uma nuvem de pontos que denominamos Diagrama de Dispersão. Este diagrama
nos fornece uma ideia grosseira, porém útil, da correlação existente entre as variáveis:
108
U NIDADE 29
Objetivo: Apresentar e discutir Correlação Linear, calculando o Coeficiente de Correlação.
Correlação Linear
Os pontos obtidos anteriormente, vistos em conjunto, formam uma elipse em diagonal.
Podemos imaginar que, quanto mais fina for à elipse, mais ela se aproximará de uma reta.
Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, por
isso, denominada correlação linear.
É possível verificar que a cada correlação está associada como “imagem” uma relação
funcional. Por este motivo, as relações funcionais são chamadas relações perfeitas.
109
Como a correlação em estudo tem como “imagem” uma reta ascendente, ela é chamada
correlação linear positiva.
Assim, uma correlação é:
 Linear Positiva se os pontos do diagrama têm como “imagem” uma reta ascendente.
 Linear Negativa se os pontos têm como “imagem” uma reta descendente.
 Não Linear se os pontos têm como “imagem” uma curva.
Se os pontos apresentam-se dispersos, não oferecendo uma “imagem” definida, concluímos

que não há relação alguma entre as variáveis em estudo.
Temos então que:
110
Coeficiente de Correlação Linear
O instrumento empregado para medir a correlação linear é o coeficiente de correlação. Esse

coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o
sentido dessa correlação (positivo ou negativo).
Faremos o uso do Coeficiente de Correlação de Pearson ( r ) , que é dado por:
n   x i  y i    x i    y i 
r
n   x 2
i
2

  x i   n   y i2   y i 
2

Onde n é o número de observações.
Os valores limites de r são -1 e +1.
 Se r = +1 , há uma correlação perfeita e positiva entre as variáveis;
 Se r = -1 , há uma correlação perfeita e negativa entre as variáveis;
 Se r = 0 , ou não há correlação entre as variáveis, ou a relação que porventura possa

existir não é linear;
Para que uma relação possa ser descrita por meio do Coeficiente de Correlação de Pearson
é imprescindível que ela se aproxime de uma função linear. Uma maneira prática de
verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se a elipse
apresenta saliências ou reentrâncias muito acentuadas, provavelmente trata-se de
correlação curvilínea.
Para podermos tirar conclusões significativas sobre o comportamento simultâneo das

variáveis analisadas, é necessário que:
0,6 ≤ | r | ≤ 1
111
 Se 0,3 ≤ | r | < 0,6 , há uma correlação relativamente fraca entre as variáveis.
 Se 0 < | r | < 0,3 , a correlação é muito fraca e praticamente nada podemos concluir
sobre a relação entre as variáveis em estudo.
Vejamos o exemplo anterior:
Nº do NOTAS
aluno Matemática (xi) Estatística (yi)
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Para o cálculo do coeficiente de coeficiente de correlação linear r, devemos calcular colunas

2 2
auxiliares xi.yi , x i e y i . Posteriormente devemos calcular o somatório de cada coluna.
Assim, teremos:
Matemática (xi) Estatística (yi) xi . yi x2i y2i

5,0 6,0 30,0 25,0 36,0
8,0 9,0 72,0 64,0 81,0
7,0 8,0 56,0 49,0 64,0
10,0 10,0 100,0 100,0 100,0
6,0 5,0 30,0 36,0 25,0
7,0 7,0 49,0 49,0 49,0
9,0 8,0 72,0 81,0 64,0
3,0 4,0 12,0 9,0 16,0
8,0 6,0 48,0 64,0 36,0
2,0 2,0 4,0 4,0 4,0
Σ 65 65 473 481 475
112
Calculando r , temos:
n   x i  y i    x i    y i 
r
n   x 2
i
2

  x i   n   y i2   y i 
2

10  473  65.65 4730  4225 505

r  
10  481  65 2   10  475  65 2  585.525 307125
   
505
r  0,911242136  0,911
307125
O resultado indica uma correlação linear positiva forte, ou seja, aponta uma relação
altamente significativa entre as duas variáveis.
Correlação e Regressão Linear
Em qual(is) processo(s) de seu dia a dia (ou de seu conhecimento) poderíamos implementar
os conceitos relacionados à Correlação e Regressão Linear ? Quais vantagens você imagina
que seriam obtidas ?
113
U NIDADE 30
Objetivo: Apresentar, discutir e calcular Regressão Linear e Equação da Reta.
Regressão Linear
Ajustamento da Reta
Sempre que desejamos estudar determinada variável em função de outra, fazemos uma
análise de regressão.
Ela tem por objetivo descrever, através de um modelo matemático, a relação entre duas
variáveis, partindo de n observações das mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável
dependente e a outra recebe o nome de variável independente.
Assim, supondo X a variável independente e Y a variável dependente, vamos determinar o

ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função
definida por:
Y = a.X + b
Onde a e b são os parâmetros da equação e:
n   x i  y i    x i    y i 
a b  y ax
n   x i2   x i 2
114
Em que:
 n é o número de observações;
  xi 
x  
 x é a média dos valores de xi =>  n 
  yi 
y  
 y é a média dos valores de yi =>  n 
Veja o exemplo:
xi 5 8 7 10 6 7 9 3 8 2
yi 6 9 8 10 5 7 8 4 6 2
Diagrama de Dispersão
10,0
8,0
Notas de Estatística (yi)
6,0
4,0
2,0
0,0
0,0 2,0 4,0 6,0 8,0 10,0
Notas de Mate mática (xi)
115
Baseado nos dados do problema, vamos determinar a equação de reta de Regressão Linear
calculando os parâmetros a e b:
10  473  65.65 4730  4225 505

a 2
   0,8632
10.481  65 4810  4225 585
b  6,5  0,8632 .6,5  0,8889
Logo, temos que a equação estimada da reta é:
Ŷ = 0,8632.X + 0,8889
onde Ŷ é o Y estimado para a equação de Regressão Linear.
Observe o gráfico abaixo que mostra a reta ajustada ao diagrama de notas do exemplo:
10,0
Notas de Estatística (yi)
8,0
Ŷ = 0,8632.X + 0,8889
6,0
4,0
2,0
0,0
-2,0 0,0 2,0 4,0 6,0 8,0 10,0
Notas de Matemática (xi)
116
Interpolação e Extrapolação
Observando os dados do exercício anterior, podemos facilmente verificar que não temos a
nota 4,0 entre as notas de Matemática.
Entretanto, obtida a equação estimada da reta, podemos estimar a nota correspondente em

Estatística, fazendo X = 4,0 na equação estimada Ŷ.
Eis uma das grandes aplicações da Regressão Linear !!
Assim, temos que:
Ŷ = 0,8632 X + 0,8889
Ŷ = 0,8632 . 4,0 + 0,8889
Ŷ = 4,34
Isso significa dizer que, com base nas notas apresentadas do grupo, por meio da equação da
reta de Regressão Linear, podemos estimar a nota de Estatística. Uma pessoa que por
ventura tirasse 4,0 em Matemática, dentro daquele grupo, essa nota estimada seria 4,34.
Como a nota 4,0 pertence ao intervalo de notas de Matemática do grupo (que vai de 2,0 a
10,0), dizemos que foi feita uma Interpolação.
E qual seria a nota estimada de Estatística de uma pessoa que tirasse 1,0 em Matemática?
De forma análoga, podemos também fazer uma estimativa para a nota de Estatística,
fazendo X = 1,0 na equação estimada Ŷ.
Assim, temos que:
Ŷ = 0,8632 X + 0,8889
Ŷ = 0,8632 . 1,0 + 0,8889
Ŷ = 1,75
117
Isso significa dizer que, com base nas notas apresentadas do grupo, estimamos a nota de
Estatística como 1,75 para uma pessoa que por ventura tirasse 1,0 em Matemática, dentro
daquele grupo.
Como a nota 1,0 não pertence ao intervalo de notas de Matemática do grupo (que vai de 2,0
a 10,0), dizemos que foi feita uma Extrapolação.
Antes iniciar a Avaliação On-line, é fundamental que você acesse sua SALA DE
AULA e faça a Atividade 3 no “link” ATIVIDADES.
118
G LOSSÁRIO
Caso haja dúvidas sobre algum termo ou sigla utilizada, consulte o link Glossário em sua
sala de aula, no site da ESAB.
119
B IBLIOGRAFIA
BUSSAB, Wilton O, MORETTIN, Pedro A. Estatística Básica. 5a ed. São Paulo: Saraiva,
2003.
BUSSAB, Wilton O, MORETTIN, Pedro A. Métodos quantitativos: Estatística Básica.

Editora Atual, 1987.
CRESPO, Antônio Arnot. Estatística Fácil. São Paulo: Saraiva, 2002..
HOFFMAN, Rodolfo. Estatística para Economistas. São Paulo: Livraria Pioneira Editora,
1980.
LEVIN, J. Estatística Aplicada a Ciências Humanas. São Paulo: Harbra, 1987.
LEVINE, David M., STEPHAN, David, KREHBIEL, Timothy C., BERENSON, Mark L.
Estatística - Teoria e Aplicações usando o Microsoft Excel em Português. Rio de
Janeiro: LTC, 2005.
MEYER, Paul L. Probabilidade: aplicações à Estatística. Tradução do Prof. Ruy C. B.

Lourenço Filho. Rio de Janeiro: LTC, 1978.
NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades: resumos

teóricos, exercícios resolvidos, exercícios propostos. São Paulo: Edgard Blucher, 1974.
NETO, Pedro Luiz de Oliveira Costa. Estatística. São Paulo: Edgard Blucher, 1977.
SOARES, José Francisco, FARIAS, Alfredo Alves de, CESAR, Cibele Comini. Introdução à
Estatística. Rio de Janeiro: Guanabara Koogan S.A, 1991.
STEVENSON, William J. Estatística Aplicada à Administração. São Paulo: Harbra, 1986.
WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatística. Rio de

Janeiro: LTC, 1985.
120

Estatística PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Você também pode gostar

Estatística PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística PDF

Enviado por

Direitos autorais:

Formatos disponíveis

MÓDULO DE:

FREDERICO GOMES CARVALHAES

Copyright © 2008, ESAB – Escola Superior Aberta do Brasil

Primeira edição: 2009

CITAÇÃO DE MARCAS NOTÓRIAS

Todos os direitos desta edição reservados à

Prezado aluno, seja bem-vindo !

 Apresentar os principais conceitos e ferramentas relacionadas à Estatística;

 Desenvolver o raciocínio lógico por meio da aplicação dos conhecimentos adquiridos

 Aplicar os conhecimentos estatísticos em situações práticas, relacionadas aos

 Utilizar a Estatística como ferramenta de tomada de decisão por meio de técnicas de

Histórico, conceitos, profissão e aplicações; Métodos Estatísticos; Variáveis Estatísticas;

Frederico Gomes Carvalhaes é mineiro, natural de Belo Horizonte, residente em Vitória,

BIBLIOGRAFIA ................................................................................................ 120

Desde a Antiguidade, vários povos já registravam o número de habitantes, de nascimentos,

A palavra “censo” deriva do latim “censere”, que significa taxar.

A palavra “estatística” deriva do latim “status”, que significa estado.

Já a partir do século XVI começaram a surgir os primeiros controles sistemáticos de fatos

No início do século XIX, os estudos estatísticos ganharam a contribuição de grandes

Ronald Aylmer Fisher (1890-1962), geneticista e estatístico britânico, concentrou seus

Influenciado pelos trabalhos de Karl Pearson, outro importante geneticista e estatístico

Assim, as tabelas tornaram-se mais completas, surgiram às representações gráficas e o

Atualmente o público leigo (leitor de jornais e revistas) se posiciona em dois extremos

O Estatístico promove o levantamento de pesquisas estatísticas em suas aplicações técnicas

As especializações da profissão vinculam-se aos campos profissionais que exigem ou

 Estatístico de Estatística Aplicada

Principais cargos procurados:

 Estatístico de Estatística Aplicada

Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo.

Podemos então dizer que:

Método é um conjunto de meios dispostos convenientemente para se chegar a um fim

Dos métodos científicos, destacaremos o método experimental e o estatístico.

O método experimental consiste em manter constantes todas as causas (fatores), menos

É o método preferido no estudo da Física, da Química etc.

Muitas vezes temos necessidade de descobrir fatos em um campo em que o método

O método estatístico, diante da impossibilidade de manter as causas constantes,

A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva,

Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da

Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de

Fases do Método Estatístico

São verificadas no método estatístico as seguintes fases:

Após cuidadoso planejamento e a devida determinação das características mensuráveis do

A coleta pode ser direta ou indireta.

A coleta é direta quando feita sobre elementos informativos de registro obrigatório

 Contínua (registro) → Quando feita continuamente, tal como a de nascimentos e

 Periódica → Quando feita em intervalos constantes de tempo, como os censos (de 10

 Ocasional → Quando feita extemporaneamente, a fim de atender a uma conjuntura ou

2. Crítica dos dados

3. Apuração dos dados

É a operacionalização algébrica e o processamento dos dados obtidos e a disposição

4. Apresentação dos dados

Independentemente da finalidade da pesquisa, os dados devem ser apresentados sob forma

O objetivo da Estatística é tirar conclusões sobre o todo (população), a partir de informações

Variável é o conjunto de resultados possíveis de um fenômeno.

Pode ser classificada em:

 Sexo (masculino ou feminino)

 Cor da pele (branca, preta, amarela, vermelha, parda, etc.)

Quantitativa => quando seus valores são expressos em números. Exemplo: