Notas de Aula Estatística

Notas de Aula de Estatística
Professor Kleison Freitas
2020.1
Informações Sobre a Disciplina
- Apresentação: Cursando a disciplina de Estatística, o acadêmico poderá utilizar a ferramenta estatística

na tomada de decisões que tangem às funções empresariais ou acadêmicas, através de uma postura crítica e
reflexiva.
- Objetivos
1. Compreender o uso da estatística na prática acadêmica ou empresarial;
2. Desenvolver cálculos básicos da estatística e interpretá-los;
3. Utilizar a objetividade e a probabilidade como uma base nas tomadas de decisões;
4. Entender o uso e a importância da inferência e da previsão estatística em pesquisas de mercado, de opinião
e em consultorias empresariais.
- Metodologias e Recursos: Utilizar as técnicas estatísticas através de aulas expositivas, práticas em

laboratório de informática com uso do Microsoft Excel e possibilitando o discente na resolução de problemas
em sua área de atuação e formação.
- Sistema de Avaliação: Verificar no Portal da disciplina
- Sistema de frequência: O aluno deve ter no mínimo 75% de frequência. Se o aluno tiver acima de 15
faltas estará reprovado por falta, visto que cada aula são três faltas ou três presenças, respectivamente. O
aluno deverá administrar as suas faltas.
Bibliografia Recomendada
 TRIOLA, M. F. Introdução à Estatística. 11ª Edição. Rio de Janeiro. Livros Técnicos e Científicos, 2014.
 MORETIN, L. G. Estatística básica: Probabilidade e Inferência. Volume único. São Paulo: Pearson,
2010.
 LAPONNI, J.C. Estatística Usando o Excel. 4ª Edição. Editora Campus, 2005.
Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 2

Informações Sobre o Professor Kleison Freitas
Graduação
Curso: Estatística - Instituição: Universidade Federal do Ceará - Ano de Conclusão: 2004
Pós-Graduação
Curso: Mestrado em Logística e Pesquisa Operacional
Instituição: Universidade Federal do Ceará - Ano de Conclusão: 2009
Curso: MBA em Administração e Marketing
Instituição: Centro Universitário Internacional Uninter – Paraná – SC - Ano de Conclusão: 2017
Curso: Especialização em Gastronomia
Instituição: Unifanor – Ano de Conclusão: 2018
Experiência no Magistério
1. Professor da Universidade Federal do Ceará (UFC).
Setor de estudo: Probabilidade e Estatística.
Departamento de Estatística e Matemática Aplicada (DEMA) do Centro de Ciências.
Cursos em que já ministrou/ministra aulas: Biblioteconomia, Ciências Atuariais, Ciências Biológicas, Ciências
Contábeis, Computação, Engenharia de Alimentos, Engenharia Elétrica, Engenharia Mecânica, Engenharia
Metalúrgica, Engenharia de Pesca, Geografia, Química, Matemática e Publicidade e Propaganda.
De Abril de 2006 a 2017
2. Professor do Centro Universitário UNIFANOR/Wyden.

Cursos de graduação em que ministrou/ministra aulas: Administração, Ciências Contábeis, Construção de
Edifícios, Engenharia Ambiental, Engenharia Civil, Engenharia Elétrica, Engenharia de Produção,
Engenharia Química, Gestão Comercial, Logística, Marketing, Nutrição, Processos Gerenciais, Psicologia,
Recursos Humanos e Sistema de Informação.
Disciplinas: Estatística, Bioestatística e Pesquisa Operacional. Desde Agosto de 2007.
4 vezes Academic Stars pelo grupo Wyden.
Experiência como Estatístico

1. Diretor de Marketing e de Projetos na Gauss – Empresa Júnior de Estatística (UFC).
Período: 2000 a 2004.
2. Consultorias Empresariais: Empresas Públicas, Privadas e Clientes físicos.
Período: Desde 1999.

Calculadoras Sugeridas e Obrigatórias
Modelo Casio fx 82 MS ou HP – Modelo: 12C
Modelo Casio fx 82 ES

Nota de Aula 1 – Introdução Geral à Estatística
1. ESTATÍSTICA: É uma ciência que utiliza teorias probabilísticas para explicar a frequência da ocorrência
de eventos, tendo como objetivo maior obter, organizar e analisar dados, a fim de estimar a previsão de
fenômenos, conforme o caso estudado.
De forma prática e didática, a estatística se resume na:
Tratamento dos Apresentação dos

Coleta de Dados  
Dados Resultados
A estatística é uma ciência importante, útil e com um escopo abrangente de aplicação em negócios,
administração política física e ciências sociais, dentre outras áreas, quase ilimitado.
Na prática empresarial e industrial, a Estatística é uma ferramenta-chave e segura para entender
sistemas variáveis, controlar processos, sumarizar dados e tomar decisões baseados nos mesmos.
1.1. Aplicações: Algumas ciências utilizam à estatística como uma ferramenta própria, possuindo-a com suas
terminologias próprias, como sendo:
 Estatística Aplicada à Tecnologia da Informação: É um ramo da estatística que trabalha com a mineração
dos dados cadastrados em um banco de dados, a fim de encontrar anomalias ou tendências em séries
qualitativas ou quantitativas;
 Bioestatística: É o planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa
na área biológica, médica e áreas da saúde em geral;
 Estatística Econômica ou Econometria: É um ramo da estatística direcionado para a análise de fenômenos
econômicos;
 Estatística aplicada à Engenharia: É um ramo da estatística que estuda as suas aplicações no controle de
processos de produtos e serviços, no planejamento de novas estratégias de produção, nas vendas, no controle
de qualidade, em ensaios destrutivos e não destrutivos, com o objetivo de verificar a porcentagem de peças
não conforme as especificações ou a probabilidade de vida de equipamentos ou peças, dentre outras;
 Estatística Física: É o ramo da física que através da estatística analisa sistemas físicos de alta complexidade,
com elevado número de entidades constituintes, como os átomos, as moléculas, os íons, entre outros;
 Estatística Social: É o ramo da estatística que avalia fatores relativos à realidade social, econômica e
ambiental de um país e seu uso para a formulação e a avaliação de políticas públicas;

 Estatística aplicada à Contabilidade: A estatística é utilizada na área da contabilidade para comparar o sexo
de carteira de clientes, para comparar cargos de funcionários da empresa, onde se compara o custo gasto
colocando os mais importantes acima da pirâmide para comparação entre cargos similares, variação e
montagem na estrutura de cargos e salários, contagem de estoque, de imobilizado, perdas, juros, dentre
outros;
 Estatística Populacional: É o ramo da estatística relacionado à população e à demografia (área da ciência
geográfica que estuda a dinâmica populacional humana, ou seja, as taxas de natalidade, mortalidade,
imigração, emigração, densidade populacional, IDH, dentre outros);
 Estatística Comercial;
 Estatística Psicológica;
 Dentre outras áreas.
1.2. Origem:
A palavra estatística originou-se da expressão latina statisticum, que significa “Estado”, que depois de
vários significados, surgiu em alemão a palavra statistik que significa “análise de dados sobre o Estado”. O
Estado teve fundamental importância na origem da Estatística como ciência, pois originalmente, as
estatísticas eram colhidas para as finalidades relacionadas com o Estado, como os recenseamentos, por
exemplo. Como disciplina, só no século XIX é que se estruturou, mas já era conhecida desde a antiguidade,
há mais de 4 mil anos.
Nas decisões do dia-a-dia, o indivíduo há de forma direta ou indireta que se basear em dados
observados para isso. Por exemplo, ao decidir pelo seguro de um carro de uma determinada seguradora,
geralmente, esta procura verificar se este seguro satisfaz as suas necessidades, ou seja, se o seu preço é
compatível com o seu orçamento, além de outras características.
Posteriormente, compara se dados deste seguro com o de outras seguradoras e, através de uma
análise processada internamente em sua mente, toma-se a decisão de adquiri-lo ou não.
Essa analogia não difere na realização das pesquisas científicas, que tem por objetivo responder as
indagações ou comprovar as hipóteses elaboradas pelo pesquisador. E para isso, é preciso, inicialmente,
coletar dados que possam fornecer informações relevantes para responder esses questionamentos, mas para
que os resultados da pesquisa sejam confiáveis, tanto a coleta de dados quanto à sua análise deve ser feita de
forma criteriosa e objetiva. Para isso, o planejamento eficaz da realização de uma pesquisa científica é
necessário. Mas para isso é necessário entender o que realmente é uma pesquisa.

1.3. Variáveis: São as características associadas ao objeto de estudo investigado ou do experimento realizado.
Podendo ser:
 Qualitativas ou Categorizadas: São variáveis que exprimem qualidade do elemento investigado.

Podendo ser:
 Nominal: Quando o dado se apresenta sob o aspecto qualitativo e não importa a ordem de disposição
delas, ou seja, não há uma hierarquia embutida.
Exemplos: Tipo de espécie de uma planta, Tipo de adubo utilizado, Área da Biologia pretendida, Gênero
de pacientes de um hospital, dentre outros.
 Ordinal: Quando há uma hierarquia embutida, ou seja, um grau de relevância de um indivíduo para
outro mediante suas características.
Exemplos: Classe social, Grau de instrução, Desempenho (ótimo, bom, regular, ruim e péssimo), Cargo
dos funcionários na empresa, Grau de dor (forte, moderada ou leve), dentre outros.
 Quantitativas ou Numéricas: São atributos resultantes de uma contagem ou mensuração. Podendo ser:
 Discreta: São todas as variáveis numéricas cujos valores se obtém a partir de procedimento de
contagem originado de um conjunto amostral finito ou enumerável. As variáveis discretas assumem
valores inteiros. Exemplos: Número de peixes encontrados em um rio, Número de pacientes vacinados
contra uma doença, dentre outros.
 Contínua: São variáveis numéricas cujos valores são obtidos por procedimento de mensuração (ou
não enumerável), de sorte que ao menos teoricamente, os resultados das medidas são capazes de
variações insensíveis ou contínuas. As variáveis contínuas podem assumir qualquer valor num intervalo
contínuo e são quantificadas em uma escala infinita de valores, por isso, diz-se que as variáveis contínuas
são muito informativas. Exemplos: Peso, Altura, Temperatura, Espessura, Velocidade, Idade, Renda (em
Reais), dentre outros.

Nota de Aula 2 – Inferência Estatística - Amostragem
1. INTRODUÇÃO:
O profissional, na grande maioria das vezes, trabalha com limitações de tempo, escassez financeira,
de recursos humanos, de produtos, de materiais, dentre outros, impedindo-o de analisar afundo o processo
como um todo, mas de um lado não se faz necessário estudá-lo por inteiro, pois a Estatística defende que
apenas o estudo de uma parcela deste pode atender de forma eficaz às necessidades desejadas.
Desta forma, quando se deseja estudar uma população (ou universo) específica, o pesquisador tem
duas formas possíveis de fazê-lo, ou de forma censitária, o que exige a observação de todos os elementos que
formam essa população, ou analisar apenas uma parcela que represente este universo, ou seja, uma amostra.
A finalidade da amostragem é permitir fazer suposições, predições, generalizações (ou inferências)

acerca de características de uma população com base na análise de apenas alguns de seus elementos. Essa
técnica é amplamente utilizada em diversas situações do dia-a-dia das empresas e de vários pesquisadores, de
várias áreas profissionais, pois proporciona economia de recursos, de tempo, rapidez nos resultados e maior
controle. No caso das indústrias, a verificação da qualidade de seus produtos, é um exemplo disto, pois é
impossível analisar todos os produtos fabricados, pois muitos deles após a análise não podem ser mais
comercializados, desta forma, isto implica em prejuízo para a empresa, portanto recorrer a um estudo de
amostragem é o indicado. Outro exemplo, é analisar a opinião de moradores de um determinado bairro de
um município em que analisar todos além de alto custo, é demorado e inacessível a todos.
Desta forma, conhecer e entender os procedimentos básicos aplicáveis à realização de estudos
estatísticos por inferência e por consequência utilizando uma amostra significativa, é uma condição si ne qua
non para qualquer profissional de qualquer área, que queira ter uma segurança e consistência nas tomadas de
decisões. Assim, para se inteirar do assunto, alguns conceitos iniciais são necessários:

2. CONCEITOS INICIAIS:
2.1. Inferência Estatística: É o processo de generalização do universo a partir de resultados particulares, ou
seja, consiste em obter e generalizar conclusões para o todo com base no particular, isso quer dizer que a
partir de amostras tiram-se conclusões para a população.
2.2. População (N): É o conjunto de todos os elementos que possuem em comum determinadas
características de interesse para uma pesquisa. Por exemplo: Pessoas, Maquinários, Soluções Químicas,
Produtos, dentre outros.
Quanto ao tamanho, a população pode ser classificada como finita ou infinita. Desta forma, as
finitas são as que possuem um tamanho limitado de elementos, em que é possível identificar do primeiro até
o último componente populacional, analogamente, as infinitas são aquelas cujo número de elementos é
ilimitado, ou seja, impossível de identificar o último indivíduo. Assim, a população, nesse caso é tão grande
que é dificultoso a sua análise com precisão.
Portanto, a escolha em analisar toda a população (censo) é uma decisão arbitrária do pesquisador.
Desta forma, os pesquisadores que optarem em utilizar o censo terão que verificar a seguinte medida
estatística conhecida como parâmetro.
2.3. Parâmetro: É a medida usada para descrever uma característica numérica da população em estudo e para
isso é necessária uma análise integral desta. Assim, como na prática este procedimento se torna inviável, seu
valor é quase sempre desconhecido, na maioria das vezes. Um exemplo prático de parâmetro é a Idade média
de todos os alunos de uma sala de aula, ou seja, a média () e a variância (2), são exemplos de parâmetros.
Muitos pesquisadores defendem que o censo proporciona uma precisão incontestável nos resultados
estatísticos, pois todo o universo é analisado. No entanto, essa precisão pode ser contestada por diversos
fatores, dentre eles, as mudanças comportamentais dos componentes da população, nos casos em que a
pesquisa demanda período longo, ou por erros de coleta de dados, como informações inverídicas, dentre
outras. Então, para abster-se desses fatores que o censo pode causar de forma implícita e, muitas das vezes,
explícita, a utilização da amostragem é uma solução, pois a mesma permite que o pesquisador, ao contrário do
censo, cometa alguns “equívocos” previsíveis e aceitáveis ao estudo, mas para que esses “equívocos” sejam
toleráveis, faz-se necessário que o pesquisador entenda estatisticamente o que é amostragem.
2.4. Amostra (n): É uma parcela significativa de uma população, ou seja, uma parte da população que a
representa estatisticamente.
Os pesquisadores que optarem em utilizar o processo de amostragem terão que utilizar as seguintes
medidas estatísticas conhecidas como estimativa e margem de erro.

2.5. Estimativa: É o valor numérico do estimador obtido com base nos resultados amostrais. Um exemplo
prático de estimativa é a Idade média de uma parte significativa dos alunos de uma sala de aula, ou seja, a
média amostral ( x ), a variância amostral (S²), são exemplos de estimadores.
2.6. Margem de Erro (e): Um estudo em que se optou na utilização da amostragem como método de coleta
de dados, sempre apresentará uma “falha” embutida nas suas análises, visto que não se analisou todo o
universo. Essa “falha” é conhecida como margem de erro (ou erro amostral), e tem uma relação forte e
inversamente proporcional com o tamanho da amostra e dos resultados que foram obtidos com a pesquisa,
ou seja, quanto maior for a quantidade de elementos pesquisados, menor a quantidade de erros cometidos, ou
seja, menor a margem de erro, mas em contrapartida, maior o custo financeiro da mesma. E vice-versa
quando o tamanho amostral for menor.
Um exemplo prático de margem de erro é visto nas pesquisas eleitorais em que através de uma
amostragem de eleitores um determinado candidato aparece com um percentual de tantos por centos de
aceitação ao pleito, levando-se em consideração a margem de erro tolerável de tantos pontos percentuais para
mais ou para menos, ou seja, ele estará entre x% e y% dentro da margem de erro, isso quer dizer que, se fosse
analisada toda a população de eleitores, existem uma possibilidade de que no dia da eleição o resultado
percentual do candidato fique entre x% e y%.
A margem de erro é definida, na grande maioria das vezes, antes da coleta de dados, para evitar
assim retrabalho aos pesquisadores do estudo, pois caso a margem de erro fique muito alta (acima de 5% para
mais ou para menos), o retrabalho é inevitável ocasionando um custo a mais a quem encomendou a pesquisa,
e isso ocorre, na prática, por falta de planejamento amostral adequado ao estudo almejado.
Assim, para planejar um estudo estatístico com uso de amostragem faz-se necessário conhecer dois
processos básicos de amostragens, as amostras não probabilísticas e as probabilísticas.

3. TÉCNICAS DE AMOSTRAGEM:
3.1. Amostras não probabilísticas:
Uma amostra é não probabilística (ou não casual ou não aleatória), quando a probabilidade de seleção
de cada unidade amostral da população é desconhecida. Nesse caso, não se podem supor os resultados
obtidos para o universo da população, visto que a amostra, por ser não probabilística é não significativa.
Desta forma, devem ser evitadas, porque além de não conhecer a margem de erro e a confiabilidade,
introduzem tendenciosidade (ou viés ou vício) na seleção das unidades e estimação das mesmas, ou seja,
distorcendo os dados do estudo para uma determinada direção.
As amostras não probabilísticas mais comuns são:
a) Amostras por Conveniência: As amostras por conveniência ocorrem quando as unidades a serem
analisadas estão mais acessíveis ao pesquisador de acordo com as conveniências sociais, econômicas, de
tempo, dentre outras. É um tipo de amostragem que é vantajosa por ser rápida, de baixo custo e de fácil
acessibilidade, mas não há nada que a credite estatisticamente.
b) Amostras por Cotas: São amostras em que se leva em conta a porcentagem de alguma(s) característica(s)
da população de origem.
c) Amostras por Julgamento ou Intencional: É uma forma de amostragem por conveniência na qual os
elementos populacionais são selecionados com base no julgamento arbitrário do pesquisador, ou seja, o
pesquisador identifica os elementos que corroborarão com o objetivo do seu estudo sem o risco de fugir
deste objetivo pré-definido, ou seja, não há uma escolha aleatória dos elementos pesquisados e sim o
contrário.
d) Amostras de Voluntários: Quando a pesquisa inclui alguns procedimentos perigosos, difíceis ou

dolorosos, desta forma a amostragem de sujeitos voluntários é a mais indicada, pois somente voluntários
estarão dispostos a participar.
O problema deste tipo de amostragem é que ao ser colocado um anúncio em uma rede social, por
exemplo, para recrutar voluntários, só responderão pessoas muito especiais, como por exemplo, pessoas
aventureiras, ou as pessoas mais corajosas ou as mais motivadas. E muita das vezes, este tipo de pessoa, nem
faz parte do público-alvo do estudo.

3.2. Amostras Probabilísticas:
Uma amostra é probabilística (ou ao acaso ou aleatória) quando cada unidade amostral tem uma
probabilidade conhecida e diferente de zero de ser escolhida frente a população de origem, garantindo, se for
realizada de forma correta, a isenção de vícios.
As técnicas de amostragem probabilística consistem em Amostra Aleatória Simples, Amostra
Aleatória Estratificada, Amostra sistemática e Amostra por Conglomerado:
a) Amostra Aleatória Simples (AAS): Selecionado por um processo ao qual a probabilidade de escolha de
todos os elementos é a mesma para todos, ou seja, a população de origem é consideração homogênea, pois os
seus elementos têm características parecidas entre si.
a1) Fórmula para determinação do tamanho da amostra com AAS:
N .n0
n
N  n0
Fonte: Barbetta (2001)
Onde:
N = Tamanho da população
n = Tamanho da amostra
1
Se a confiança do estudo for de 95%, de acordo a tabela da Normal Padrão: n 0  ,
e²
Onde e = margem de erro.
2,06
Se a confiança for 96%: n 0 
e²
2,17
e²
2,33
e²
2,575
e²
3
Se a confiança for 99,9%: n 0 
e²

OBS 1: O n0 representa a primeira aproximação do tamanho da amostra (n) caso não se conheça o N.
OBS 2: Caso conheça o N seja muito grande (tender para o infinito), não é necessário considerar o seu
tamanho exato. Neste caso, o cálculo da primeira aproximação (n0) já é suficiente para o cálculo.
Exercício 1 – Estudo sobre abertura de um empreendimento: Um empreendedor foi ao SEBRAE

(Serviço Brasileiro de Apoio às Micro e Pequenas Empresas) buscar informações sobre os procedimentos
para abertura de uma nova loja de matérias de construção em um determinado bairro de Fortaleza, Ceará. O
consultor de marketing informou que o primeiro passo seria fazer uma pesquisa de mercado para verificar se o
negócio teria sucesso ou não na região desejada. Assim, o empreendedor conseguiu identificar que no bairro
há 2.356 residências. Assim, quantas residências deverão ser pesquisadas para responder aos questionamentos
do empreendedor a fim de que o mesmo tome a decisão de montar ou não o seu empreendimento após a
análise estatística, se for considerado:
a) Uma margem de erro de 4%, com uma confiança de 95%?
b) Se diminuirmos a margem de erro para 2%, qual será o tamanho da amostra (n), mantendo a mesma
confiança de 95%?
c) E se pesquisássemos 2000 residências, qual seria a margem de erro, com a confiança de 95%?
Baseado nos itens anteriores:
d) Se para o empreendedor o que importa é o resultado estatístico da pesquisa, qual das alternativas (“a”,
“b” e “c”) você aconselharia ela a utilizar? Por quê?
e) Se para o empreendedor o que importa é o quanto ela vai pagar pela pesquisa, ou seja, o custo da mesma,
qual das alternativas (“a”, “b” e “c”) você aconselharia ela a utilizar? Por quê?
f) Se para o empreendedor o que importa é o resultado estatístico da pesquisa e ao mesmo tempo com
menor custo, qual das alternativas (“a”, “b” e “c”) você aconselharia ela a utilizar? Por quê?

b) Amostra Aleatória Estratificada (AAE): Muitas vezes a população se divide em subpopulações (ou
estratos), sendo razoável supor que em cada estrato a variável de interesse analisada apresenta um
comportamento substancialmente diverso, ou seja, a população é considerada heterogênea, mas homogêneo
dentro de cada estrato.
Assim, deve-se adotar um tipo de amostragem que represente bem as diferentes características
dentro de cada um dos grupos, podendo ser, por exemplo, proporcional ao tamanho de cada um deles.
Exercício 2 – Um investidor deseja verificar se em um determinado bairro de Fortaleza vale a pena ou não a
construção e implantação de um restaurante mediante uma aceitação expressiva do público-alvo analisado.
Caso o nível de aceitação a este tipo de empreendimento seja acima de 70% o investidor estudará a
possibilidade de instalação da empresa. Assim, o investidor conseguiu levantar junto com a prefeitura a
quantidade de domicílios no bairro e verificou que é de 2.550. Estes domicílios cadastrados são os que pagam
anualmente o IPTU, onde 1.500 deles são residenciais e 1.050 são comerciais. Assim, com confiança de
96%, quantos deles serão pesquisados, por categoria, utilizando uma amostra aleatória estratificada, se a
margem de erro for de 3%?
c) Amostra Sistemática (AS): Esse tipo de amostragem é uma variação da amostragem aleatória simples,
mas que exige que um sistema aleatoriamente seja definido.
Segue abaixo outros tipos de exemplos de amostras sistemáticas:
Exemplo1: Um engenheiro de controle da qualidade seleciona cada centésima fonte de computador que passa
em uma esteira transportadora.
Exemplo2: Um professor retira da população para compor a amostra os alunos aleatoriamente escolhidos que
possuem o algarismo “0” como último número da sua matrícula.
d) Amostra por Conglomerado: Primeiramente, na amostra por conglomerado, a população-alvo é dividida

em estratos mutuamente exclusivos e coletivamente exaustivos. Após isso, reduz-se, arbitrariamente, a
quantidade de estratos a serem analisados. Após isso, sorteiam-se quais grupos serão pesquisados e por fim,
define-se qual o tipo de amostra probabilística deverá ser utilizada (AAS, AAE ou AS). Podendo também, se
assim o pesquisador desejar, utilizar o censo nos grupos selecionados para coleta de dados. Com isso, a
amostragem por conglomerado tem duas grandes vantagens: a viabilidade e o baixo custo, ou seja, a que traz
o menor custo-benefício, se comparado às outras técnicas probabilísticas disponíveis.

Nota de Aula 3 – Medidas Descritivas para dados não
agrupados
1. INTRODUÇÃO:
Para a maioria das pessoas, estatística significa descrever números da forma mais entendível possível,
como por exemplo, as taxas mensais de desemprego no Brasil após a alta do dólar no mercado atual, o índice
de falências empresariais ocorridas no Brasil de 2010 para cá, a proporção de mulheres que assumem cargos
de CEO no mercado brasileiro nos últimos dois anos, a proporção de eleitores que votarão em um
determinado candidato nas próximas eleições, o nível de satisfação de clientes de uma determinada loja de
conveniência de um determinado Shopping Center, dentre outros.
Todos esses exemplos representam descrições estatísticas de um conjunto de dados coletados sobre
algum fenômeno e para isso não é preciso usar a inferência estatística ainda, pois o objetivo aqui é apenas
descrever estatisticamente essas informações.
A descrição estatística dos dados verifica a localização central e a variabilidade desses dados através
de médias, medianas, modas, variâncias, desvios-padrão e coeficientes de variação. Ainda, há métodos
ilustrativos que possibilitam uma melhor interpretação deles, como os gráficos, dos quais pode-se citar os
histogramas, os diagramas de ramo-e-folhas, os diagramas de pontos, os gráficos de caixa (box-blot), dentre
outros.
A descrição dos dados se dá em duas formas, tanto para dados agrupados em classes como para
dados não agrupados. Esta nota de aula verificará apenas os dados não agrupados, e está divido em medidas
de tendência central e medidas de dispersão.
2. MEDIDAS DE TENDÊNCIA CENTRAL

As chamadas medidas de tendência central têm por objetivo verificar o centro da distribuição dos
dados, ou seja, verificar através de medidas específicas o centro do conjunto de dados. As medidas de
tendência central mais utilizada são a média aritmética, a moda e a mediana. As usadas com menos
frequências são as médias geométricas, harmônicas, quadráticas, cúbicas e biquadráticas.
As outras medidas de posição usadas com menos intensidade são as separatrizes, que englobam: a
própria mediana através dos decis, dos quartis e dos percentis.
Para início desta nota de aula, a primeira medida de tendência central a ser analisada é a média
aritmética simples, como segue:

2.1. Média Aritmética Simples: É definida como sendo o quociente da soma de todos os valores de um
conjunto de dados pelo total de valores deste conjunto.
Média amostral Média populacional

n N
 xi x i
X  i 1
 i 1
, Onde
n N
xi = Valores da variável
n = Número de valores da amostra
N = Número de valores da população
OBS1: A média por ser influenciada por todos os valores do conjunto de dados é considerada como uma
medida sensível, ao contrário das outras medidas de tendência central existentes.
Propriedades:
a) A média de um grupo de dados sempre será única, independente da sua localização;
b) O resultado de multiplicar a média pela quantidade “n” de valores da variável x é igual a soma dos “n”
valores da variável;
 x  X  0
n
c) A soma algébrica dos desvios tomados em relação à média é sempre nula: i
i 1
d) Somando-se ou subtraindo-se uma constante “c” (valor invariável) a todos os valores de uma variável, a
média do conjunto ficará aumentada ou diminuída dessa constante, respectivamente, de forma análoga, se
multiplicar ou dividir, a média ficará multiplicada ou dividida, respectivamente.
n n n
 xi 
 xi  c   xi .c    c 
X i 1
e X  i 1
e X i 1
n n n
Falando ainda de média, há a média aparada, que não é tão utilizada na prática estatística pois a
mesma tende a manipular o resultado final desta medida de tendência central, mas vale a pena conhecer o que
é este tipo de medida como segue no próximo tópico.
2.1.1. Média Aparada: Uma média aparada é calculada aparando-se certa porcentagem dos maiores ou
menores valores do conjunto de dados. Por exemplo, para calcular a média aparada de 10%, deve-se eliminar
10% dos valores maiores e 10% dos valores menores, e então calcular a média dos valores que sobraram.
Podendo-se usar de forma arbitrária a porcentagem a ser retirada da amostra para um novo cálculo. Ao
contrário da média aritmética, a média aparada é uma medida resistente, pois não sofre influência dos valores
extremos.

A segunda medida de tendência central a analisar é a moda, como segue no próximo tópico.
2.2. Moda (Mo): Na linguagem coloquial, moda é algo que está em evidência, ou seja, algo que se vê
bastante. Na Estatística, como o próprio nome sugere, a Moda é aquele elemento que mais vezes aparece no
conjunto de dados. Não é muito sensato dizer que a moda é uma medida de tendência central, pois nem
sempre ela representa o centro do conjunto de dados, visto que ela identifica o(s) valor(es) que ocorre(m)
com maior frequência, podendo ser único, se existir, como pode também não existir. Nesse caso, é mais
correto chamá-la de medida de posição.
Quando dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda.
Das diferentes medidas de tendência central, a moda é a única medida que pode ser usada com
dados em nível nominal de mensuração, conforme o exemplo 1:
Exemplo 1: Um estudo sobre tempos de reação de pessoas em um teste foi composto por 30 canhotos, 50
destros e 20 ambidestros. Embora não possamos tomar a média numérica dessas características, podemos
afirmar que a moda é destro, que é a característica com maior frequência.
Quando no conjunto há apenas um valor que se repete além dos demais de forma máxima, chama-
se este conjunto de unimodal, bem como se tiver dois valores que se repete além dos demais, de forma
máxima e na mesma quantidade é bimodal, assim acima de 2 modas é multimodal. Se o conjunto de dados
não tiver nenhum valor que se repete além dos demais de forma máxima, o conjunto de dados é amodal.
OBS2: Se o conjunto de dados tiver os valores: 1, 1, 2, 2, 3, 3, o conjunto é multimodal, pois todos os valores
se repetem 2 vezes, ou seja, a frequência é a mesma para todos. Agora se for: 1, 2, 3, 4, é amodal, pois não há
repetição de valores.
E se for: 10, 10, 10, 10 é unimodal, pois o valor 10 é o que ocorre com maior frequencia.
A terceira medida de tendência central a ser analisada é a mediana. Muitos confundem a mediana
com a média, mas são medidas completamente diferente, tanto na sua forma de encontrar quanto na sua
interpretação, como segue no próximo tópico.

2.3. Mediana (Md):
A mediana é uma medida de tendência central que ocupa a posição central dos dados observados,
quando estes estão ordenados em ordem crescente ou decrescente (rol), tendo uma mudança na sua
realização se a quantidade de dados é par ou ímpar.
Sendo assim, se o conjunto de dados (n) é constituído por um número ímpar de dados, a mediana é
o valor que fica no centro dos dados ordenados que pode ser encontrado através da seguinte notação:

 n 1
 
 2 
Pelo exemplo 2, como segue, é possível verificar como é a realização da mediana para uma
quantidade ímpar de valores.
Exemplo 2: Nota de um aluno de uma avaliação parcial de Estatística: 8 7 3 4 8

Solução:
Ordenar os dados: 3 4 7 8 8
Mediana (Md) =
Interpretação:
Agora, se o conjunto de dados (n) é constituído por um número par de dados, a mediana é a média
aritmética dos dois valores que ficam na posição central dos dados ordenados que pode ser encontrado
através da seguinte notação:
 
n n 
     1
2 2 
2
Pelo exemplo 3, como segue, é possível verificar como é a realização da mediana para uma
quantidade par de valores.
Exemplo 3: Nota de um aluno de uma avaliação parcial de Estatística: 8 7 3 4 8 9

Solução:
Ordenar os dados: 3 4 7 8 8 9
Mediana (Md) =
Interpretação:
A mediana tem como vantagem a não afetação por valores extremos, ao contrário da média
aritmética, por isso a mediana é uma medida mais “robusta” (forte) que a média, pois na média qualquer
alteração nos dados, modifica-se o valor da média, e a mediana nem sempre isso acontece.
Depois de verificado as três medidas de tendência central que são utilizadas com maior frequência,
dentre as três, a média aritmética é a medida mais usada na tomada de decisão, pois a mesma é encontrada
com uso de todos os valores do conjunto de dados, ao passo que a mediana e a moda não utiliza todos eles, e

sim alguns ou nenhum dos valores (amodal), apresentado resultados “distorcidos” da realidade dos dados
apresentados.
Quando se descreve os dados, além das medidas de tendência central, é necessário analisar a
variabilidade dos dados, pois através destas pode-se tirar algumas conclusões mais consistentes na tomada de
decisão. Assim, o próximo item mostrar as medidas de variabilidades mais utilizadas no campo estatístico.
3. MEDIDAS DE DISPERSÃO:
Ao se fazer a descrição dos dados, além de verificar o centro da distribuição deles através das
medidas de tendência central é prescindível verificar também se os dados se comportam de forma
homogênea ou heterogênea, e isso será possível através das medidas de dispersão.
Essa verificação é importante, pois através delas podem-se tomar decisões mais consistentes e
eficazes. Um exemplo disso eram que os bancos, há uns anos atrás, costumavam exigir que os clientes
formassem filas separados para os diversos guinches, mas atualmente passaram adotar a fila única. O motivo
dessa modificação foi que o tempo médio de espera era o mesmo para ambos os formatos de filas, não
afetando a eficiência dos caixas, mas a adoção de fila única ocorreu ao fato de os clientes preferirem tempos
de espera com menor variação. Assim, é que milhares de bancos efetuaram essa modificação que resultou em
uma variação menor (e clientes mais satisfeitos), mesmo que a média de tempo de atendimento não tenha
sido afetada.
Com isso, pode-se concluir que as medidas de dispersão avaliam a variabilidade dos dados com
relação à sua média. As medidas de dispersão mais usadas são a amplitude total, variância, desvio padrão e
coeficiente de variação.
3.1. Variância (S²):

A variância é uma medida de dispersão que mensura a variabilidade dos dados, através da soma do
quadrado dos desvios pela quantidade de valores da variável menos um (n-1) no caso amostral, e por N se for
populacional.
Pela propriedade “b” da média aritmética, verifica-se que a soma dos desvios será sempre zero,
fazendo com que o pesquisador suponha que não há desvio (ou variabilidade) no conjunto de dados
analisado, mas se todos os valores não forem iguais, haverá variabilidade sim, mas mesmo assim sempre
somando os desvios o resultado será zero. Nesse caso, para que esse problema seja contornando, eleva-se os
desvios ao quadrado, ocasionando a não anulação dos mesmos.
Com isso, a notação matemática da variância é:

Variância amostral Variância populacional
 x  X
n n
 x  
2 2
i i
S2  i 1
2  i 1
, onde
n 1 N
xi = Valores da variável xi = Valores da variável

X = Média aritmética simples µ = Média populacional
n = Número de valores da amostra N = Número de valores da população
Propriedades:
a) A variância de uma constante “c” é igual a zero;
b) Ao somar ou subtrair uma mesma constante “c” a todos os valores do conjunto de dados, a variância não
ficará alterada;
c) Se multiplicar ou dividir cada valor do conjunto de dados por uma mesma constante “c”, a variância ficará
multiplicada ou dividida, respectivamente, pela constante ao quadrado (c²).
Mas, mesmo elevando os desvios ao quadrado, surge o seguinte questionamento: E se ao invés de
elevar cada desvio ao quadrado e depois somar, não seria melhor utilizar o módulo, em que os desvios
n
resultam em valores absolutos e depois utilizar a soma deles? Ou seja, assim: x
i 1
i  X ? E após isso, dividir
tudo pela quantidade de valores (n), obtendo aí o desvio médio dado pela seguinte notação
n
x i X
DM  i 1
?
n
A resposta para essa pergunta é não, pois o módulo fará com que os desvios negativos fiquem
positivos, apresentando uma realidade distorcida dos dados.
Ao elevar ao quadrado, todos os desvios são elevados ao quadrado e não somente alguns, portanto,
o melhor a ser utilizado é a variância porque ela dá certeza absoluta que as amostras são diferentes. Já o
módulo não dá essa informação de variabilidade, ao contrário, ele nos dá evidências de que as amostras são
iguais. Por exemplo: Suponha que uma turma fez uma prova e a média desta foi 7,0, e um aluno tirou 8,0, ou
seja, a dispersão foi de 1 ponto para mais (8 - 7 = 1 ponto). Se outro aluno tirar 6,0, a dispersão é 1 ponto
para menos (6 – 7 = -1 ponto). Se usar o módulo, a dispersão ao invés de ser -1 e 1, será 1 e 1, mostrando
que não há dispersão das notas dos dois alunos, ou seja, ao invés de um aluno ter tirado a nota 6 e o outro a
nota 8, ambos tiraram a nota 8, pois o desvio com o uso do módulo foi 1 ponto para mais.
Mas mesmo a variância sendo considerada a ideal para tomar decisões sobre a variabilidade dos
dados, a mesma apresenta um grande problema com unidade de medida dos dados que a compõem, pois
estes serão elevados ao quadrado, dificultando assim a sua interpretação, pois se a unidade de medida for em
metro, será metro quadrado, se for em centímetro, ficará centímetro ao quadrado e assim por diante.

Para contornar esse problema e verificar os dados com a unidade de medida original, aconselha-se
tirar a raiz quadrada da variância. Nesse caso, chega-se a outra medida de dispersão, o chamado desvio
padrão, mas antes de analisar esta medida de dispersão, faz-se necessário se atentar para as seguintes
observações:
OBS3: Para um melhor entendimento da divisão por “n-1” na fórmula da variância e não por “n” apenas, é
que a variância trabalha encima de “n-1” valores, pois se subtende que pelo menos um valor é a própria média
(não havendo dispersão de um valor, nesse caso). Portanto, a variabilidade será entre “n-1” valores e não “n”.
Por exemplo, sejam os seguintes valores: 1, 2 e 3, a média é “2”, ou seja, um valor é a própria média, mas dois
valores não, ou seja, 2 = n-1 = 3-1 = 2. Mas isso não tem 100% de certeza não, pois tem casos em que a
média não é igual ao conjunto de valores.
OBS4: Observe que no cálculo da variância amostral (S²), deve-se dividir a soma dos quadrados dos desvios
por “n-1”e não por “n” apenas. Isso se dá, pois através de estudos que serão vistos em Estimação de
Parâmetros, a variância amostral (S²) tende a estimar de forma distorcida a variância populacional (²) se for
dividido apenas por “n”, então para que S² seja um estimador não viciado ou não tendencioso de ² deve-se
dividir por “n-1”.
Há uma demonstração que prova que E(S²) = ², mostrando que a esperança da variância amostral é igual a
variância populacional, ou seja, a variância amostral com divisão da sua fórmula por “n-1” representa de
forma eficaz e inferencial a variância populacional, sem ter analisado a população em si.
OBS5: Quando o tamanho da amostral é suficientemente grande (é usual considerar um valor de n superior a
30) não há praticamente diferença entre S² e ², assim pode-se dividir por “n-1” ou por “n”, respectivamente
que o resultado será aproximadamente o mesmo, pois, para comprovação S²/² será aproximadamente 1,
não fazendo diferença nenhuma nos cálculos. Agora, se n for menor que 30, essa divisão será bem menor que
1 mostrando que não é a mesma coisa, devendo assim não deixar de dividir por n-1 se for o amostral e por n
se for o populacional.
Após as observações anteriores, faz-se necessário verificar a medida de dispersão realmente utilizada
na tomada de decisão, o desvio padrão.

3.2. Desvio Padrão (S):
O desvio padrão é uma medida de variabilidade dos valores com relação à média deles, mas ao
contrário da variância, esta medida utiliza-se à mesma unidade de medida dos dados originais, por isso esta é
utilizada com maior frequência que a variância (S²). A notação matemática do desvio padrão, que é a raiz
quadrada da variância é como segue:
n
 (x i  X )2
S i 1
n -1
A última medida de dispersão a ser analisada é o coeficiente de variação, como segue no próximo
tópico.
3.3. Coeficiente de Variação de Pearson (CV):

O coeficiente de variação é uma medida de dispersão relativa que avalia o quanto o desvio padrão
representa com relação à média aritmética de um conjunto de dados. Assim, quanto menor for o CV, mais
homogêneo será o conjunto de dados, ou seja, com menor variabilidade entre eles, caso contrário haverá uma
grande variabilidade. Assim, a notação do coeficiente de variação é a seguinte:
S 
CV     100
X 
Mas para afirmar se os dados são ou não passíveis de grandes ou pequenas variabilidades, adota-se
o ponto de corte percentual como segue:
Se CV < 50% (Há baixa dispersão entre os dados, ou seja, eles são homogêneos)
Se CV  50% (Há alta dispersão entre os dados, ou seja, eles são heterogêneos)

Anexo 1 – Manual da Calculadora Científica e HP 12C para
Estatística Descritiva
Modelo: Casio fx 82MS
1. Média e Desvio Padrão:

Colocar no modo estatístico: Clicar em Mode  2 (Sd)
Digitar os seguintes números 1, 2 e 3 assim:
1 M+
2 M+
3 M+
Encontrar o valor da média:

Clicar em Shift  2 (S-VAR)  1 = (Sairá o valor da média igual a 2)
Encontrar o valor do desvio padrão:
Clicar em Shift  2 (S-VAR)  3 = (Sairá o valor do desvio padrão igual a 1)
Modelo: Casio fx 82ES

Mode AC
2: Stat Shift
1 (Stat)
1: 1-Var 4: Var
Digitar valor 2: Média
4: Desvio Padrão
=
Modelo: HP 12C
Limpar a memória: f  Clx
Adicionar valores (1, 2, 3) na memória da calculadora assim: 1 + 2 + 3 +
Calcular a média: g  0
Calcular o desvio padrão: g   (ponto)

Anexo 2 – Estatística Descritiva com uso do Microsoft Excel
1º Passo: Abrir o Excel
 Ao abrir o Excel: Digitar o banco de dados abaixo referente ao Salário Mínimo dos funcionários de uma
determinada Empresa.
Funcionário
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Nº.
Salário (S.M*) 6 7 11 4 13 8 7 15 9 11 10 16 5 13 8 19 8 12
Funcionário
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
Nº.
Salário (S.M*) 14 16 5 17 9 11 9 10 6 15 7 12 23 7 17 9 14 19
2º Passo: Estatística Descritiva de todas as variáveis quantitativas: Salário

Acionar a Ferramenta “Análise de Dados”:
Clicar em Opções do Excel  Suplementos  Em gerenciar, clicar em Ir  Clicar em Ferramentas de
Análise  OK: A função ficará acionada na função Dados.
Dados  Análise de Dados  Estatística descritiva:
Em Intervalo de entrada: Selecionar todas as células da variável quantitativa em estudo, inclusive o título da
variável (Pode selecionar tudo de uma vez só)  Selecionar Rótulos (OBS: Como selecionou o título, é
necessário clicar em rótulo);
Em Opções de Saída: Clicar em “Nova Planilha” e “Resumo estatístico”.
O resultado está na tabela abaixo com as suas respectivas interpretações abaixo:
Saída do Excel:
Salário (S.M) Interpretação da variável salário:
Média 11,12 Média: A média salarial dos 36 funcionários é de 11,12 s.m.
Erro padrão 0,76 Mediana: 50% dos funcionários ganham abaixo de 10,16 s.m e
Mediana 10,165 50% acima.
Modo 7,0 e 9,0 Moda: Os salários que mais ocorreu entre os funcionários foi 7
e 9 s.m.
Desvio padrão 4,58 Assimetria: Como o Coeficiente de Assimetria é > 0, então os
Variância da amostra 21,04 dados são assimétricos à direita, ou seja, como a média sempre
Curtose -0,014 está no final da curva por ser influenciada por dados extremos,
Assimetria 0,65 então a média > mediana > moda, ou seja, o ponto mais alto
Intervalo 19,3 está no começo da curva e o ponto mais baixo (média) no final
Mínimo 4 da curva.
Máximo 23,3 Curtose: O Grau de achatamento, por ser apresentar o
coeficiente de curtose < 0, então os dados têm o formato de
Soma 400,4 uma curva platicúrtica, ou seja, com os dados bem espalhados.
Contagem 36
Desvio Padrão: (11,12  4,6), ou seja, a maioria dos funcionários ganham entre 6,52 s.m e 15,72 s.m.
Intervalo: É a amplitude total, ou seja, a diferença entre o meio e o menor salário é de 19,3 s.m.
Mínimo e Máximo: O menor salário entre os 36 funcionários é 4 s.m e o maior é 23,3 s.m.
Soma: A empresa gasta 400,4 s.m no pagamento de seus 36 funcionários, ou seja, 400,4 s.m é a folha de pagamentos da
empresa.

Nota de Aula 4 – Separatrizes e Box-Plot
1. INTRODUÇÃO:
Tanto a média como o desvio padrão podem não ser medidas adequadas para representar um
conjunto de dados, pois são afetados, de forma exagerada por valores extremos, ou seja, são medidas
sensíveis. Então analisar outras medidas de posição, com as separatrizes, se faz necessário, assim segue as
medidas:
1.1. Quartis: Dividem os valores ordenados (em ordem crescente ou decrescente) da variável em quatro
partes iguais através de três quartis (Q1, Q2 e Q3), ou seja, (25% abaixo, 50% abaixo e acima, 25% acima).
Exercício 1: Seja o seguinte conjunto de dados que representa a idade de determinado grupo de pessoas,
calcule os quartis:
2 5 6 9 10 13 15
calcule e interprete os quartis:
1 1 2 3 5 5 6 7 9 9
calcule e interprete os quartis:
1 1 2 3 5 5 6 7 9 9 10 13
1.2. Decil: Divide o conjunto de dados em 10 partes iguais:

D1 = 10%, D2 = 20%, ..., D10 = 100%
Decil 1 = Representa os 10% menores e os 90% maiores
1.3. Percentil: Divide a série em 100 partes iguais:

P1 = 1%, P2 = 2%, ..., P100 = 100%
Percentil 90 = Representa os 90% abaixo e 10% acima
Assim:
Md = Q2 = D5 = P50
Q1 = P25
Q3 = P75

2. BOX-PLOT
Em 1977, John Tukey publicou uma proposta que posteriormente foi reconhecida como sendo um
eficiente método para mostrar cinco números que sumarizam qualquer conjunto de dados. O gráfico
proposto é chamado de Box-Plot (também conhecido como Box and whisker plot).
O Box-Plot é um tipo de representação gráfica conveniente para revelar tendências centrais,
dispersão, distribuição dos dados e a presença de outliers (dados discrepantes). A construção de um Box-plot
exige o “resumo dos cinco números”, ou seja, o menor valor do conjunto de dados, o primeiro quartil, o
segundo quartil, o terceiro quartil e o maior valor do conjunto de dados.
2.1. Interpretação do Box-Plot: O gráfico de Box-plot interpreta-se da seguinte forma:

• A caixa (Box) propriamente contém a metade 50% dos dados (Q2 = Mediana). O limite superior da caixa
indica o percentil de 75% dos dados (Q3) e o limite inferior da caixa indica o percentil de 25% (Q1). A
distância entre esses dois quantis (Q3 – Q1) é conhecida como intervalo interquartílico (Tamanho da caixa).
• A linha no meio da caixa indica o valor de mediana (Q2) dos dados.
• Se a linha mediana dentro da caixa não é equidistante (ter a mesma distância) dos extremos, diz então que os
dados são assimétricos (à direita ou à esquerda).
• Os extremos do gráfico indicam o valor mínimo e máximo, a menos que valores outliers estejam presentes.
• Os pontos fora do gráfico são então outliers ou suspeitos de serem outliers.
2.2. Vantagens do Box-plot:

• Mostra graficamente a posição central dos dados (mediana) e a tendência;
• Mostra a forma de simetria ou assimetria (à direita ou à esquerda) dos dados;
• Ao contrário de muitas outras formas de mostrar os dados, o Box-plot mostra os outliers.
• Utilizando o Box-plot para cada variável categórica de lado a lado no mesmo gráfico, pode-se facilmente
comparar os dados.
2.3. Desvantagem do Box-Plot:

Em alguns casos a quantidade de outliers pelo intervalo definido pelo desvio padrão e pelo Box-Plot se
diferem, pois pelo intervalo definido pelo desvio padrão os dados não são modificados em momento algum,
já com o Box-Plot o cálculo do limite inferior junto com o intervalo interquartílico não mostra bem a realidade
dos dados, mas este tipo de gráfico é bastante utilizado para verificar o formato da curva dos dados. Assim,
para contornar esta situção a idéia é utilizar os Box-Plot para verificar o formato da curva e o intervalo
definido pelo desvio padrão para encontrar os dados discrepantes. Neste caso, o uso do Box-Plot deve ser em
último caso para evitar interpretações erradas. Segue um exemplo prático para ilustrar isso:

Através desse gráfico, podemos comparar as distribuições de idade entre cada profissão, quanto a
posição e dispersão. Temos por exemplo, que advogados têm a menor média de idade de escolha da
profissão. Médicos têm a maior idade, seguidos pelos dentistas. Temos, entretanto, que a variação de idade
para os dentistas é muito maior do que para os médicos e advogados. Provavelmente detecta-se uma
diferença significativa entre as médias de idade de advogados e médicos, e advogados e dentistas, mas devido
a grande variação de idades para dentistas, talvez não se detecte diferença entre médicos e dentistas. Temos
também a ocorrência de uma observação discrepante (outlier) para idade de dentistas: enquanto 50% dos
dentistas estão entre aproximadamente 29 e 34 anos, houve um dentista com idade próxima de 20.
Além disso, enquanto a distribuição de idade para advogados parece razoavelmente simétrica em
torno da mediana, para médicos e dentistas parece haver uma concentração maior (moda) para idades
maiores, indicando provavelmente uma distribuição assimétrica à direita (Md > Média). Se a assimetria fosse
do lado esquerdo, a distribuição dos dados seria assimétrica à esquerda (Média < Md). Caso há dúvidas na
assimetria dos dados, a sugestão é encontrar o coeficiente de assimetria (CA), com a seguinte notação:
3 x  Moda
CA  , assim, se:
S
CA = 0, então os dados são simétricos
CA < 0, os dados são assimétricos à esquerda ou negativamente
CA > 0, os dados são assimétricos à direita ou positivamente

Portanto, sugere-se o uso do “resumo dos cinco números” de um conjunto de dados para a
construção do Box-Plot:
1 – Valor mínimo (V1): Menor valor do conjunto de dados.
2 – Primeiro Quartil (Q1): É um valor que deixa um quarto dos valores abaixo e três quartos acima dele (25%
abaixo e 75% acima);
3 – Segundo Quartil ou Mediana (Q2 ou Md): É um valor que divide na metade o conjunto de dados (50%
4 – Terceiro Quartil (Q3): É um valor que deixa três quartos dos dados abaixo e um quarto acima dele (75%
5 – Valor máximo (Vn): Maior extremo do conjunto de dados.
Segue abaixo um modelo de um Box-Plot:
Sendo:
IIQ = Intervalo Interquartílico = Tamanho da caixa
LI = Limite Inferior = Q1 - IIQ
LS = Limite Superior = Q3 + IIQ
* Outliers = Dados discrepantes

Nota de Aula 5 – Correlação e Regressão Linear
1. INTRODUÇÃO:
Diversas decisões tomadas no dia-a-dia das empresas envolvem informações do tipo: volume de
vendas previsto para subsidiar a área de produção, demanda estimada de produtos que indique se e quais
equipamentos devem ser comprados, ou qual o lucro projetado para justificar determinados investimentos
(CORRAR, 2009).
Ainda de acordo o autor, dado um ambiente organizacional em contínua transformação, o que se
procura é reduzir incertezas. Desta forma, os gestores demandam informações que os auxiliem a escolher,
hoje, as que parecem ser as melhores alternativas sobre eventos que ocorrerão no futuro. Assim, permitir a
antecipação de cenários futuros é a proposta dos modelos quantitativos de previsão, pois estes envolvem
dados históricos e podem ser de dois tipos: por séries causais ou séries temporais.
Corrar (2009) defende que os modelos causais estudam os fatores que tem influência sobre a
variável a ser estimada, e a análise de regressão é um exemplo desse tipo de modelo. Já os modelos de séries
temporais, por sua vez, envolvem projeções baseadas, exclusivamente, nas observações do passado da
variável que se deseja estudar, ou seja, ao longo do tempo. Assuntos esses que serão tratados nesta nota de
aula. Para isso faz-se necessário estudar inicialmente a correlação linear de Pearson e na sequência a regressão
linear simples.
2. CORRELAÇÃO LINEAR:
O estudo de correlação mostra uma forma de medir quanto e de que maneira se relacionam duas
variáveis quantitativas por meio do qual se pode analisar a relação existente das variáveis em estudo, ou seja,
qual alteração deve esperar em uma das variáveis, como consequência de alterações sofridas pela outra
variável, ou seja, uma relação de causa de efeito.
Para entendimento dessa relação entre duas variáveis, segue alguns exemplos práticos: o frio está
para o setor farmacêutico, assim como o dia das mães está para o comércio, pois as vendas de medicamentos
não controlados, como analgésicos, antigripais e vitaminas, disparam. Outro exemplo é o faturamento das
empresas de energia elétrica é diretamente influenciada pela temperatura, especialmente no verão, onde a
demanda por energia aumenta, pelo uso de ar condicionado e ventiladores, fazendo com que as empresas
produtoras de energia aumentem seus lucros. De forma similar, para o consumo de água, desta forma em
Fortaleza, por exemplo, nos meses que ocorre o verão (dezembro até meados de março), o consumo de água
nas residências aumenta de forma significativa.
A priori essa relação pode ser verificada com auxílio de um gráfico de dispersão bidimensional, que
será definido como eixo x, a variável causa e y, a variável efeito, como segue:

2.1. Interpretação subjetiva do gráfico de dispersão:
y y y
x x x
Correlação Positiva Forte correlação Correlação Positiva
entre x e y Positiva entre x e y perfeita entre x e y
Assim, a importância de tal determinação decorre do fato de que a presença de uma correlação pode
conduzir-nos a um método para estimar a variável y (efeito) utilizando a variável x (causa).

2.2. Outliers:
Os conhecidos como outliers, são os pontos discrepantes, ou as observações extremas que não são
condizentes com o restante da massa de dados, conforme o Gráfico abaixo. As causas mais prováveis da
ocorrência de outliers pode ser o registro incorreto dos dados, algum defeito no instrumento de medição
utilizado, dentre outros. Caso isso ocorra, o outlier deve ser, se possível, corrigido, em extremo caso eliminado.
Desta forma, deve-se dar a devida atenção à causa de tais anomalias, pois esses dados discrepantes
podem ser úteis para descobrir a causa dessa ocorrência.
y
Outlier
Como as conclusões tiradas de gráficos de dispersão tendem a ser subjetivas, necessita-se de

métodos mais precisos e objetivos. Então se utiliza o coeficiente de correlação linear de Pearson para detectar
padrões lineares.
2.3. Coeficiente de Correlação de Pearson1 ( Rxy ):
O Coeficiente de Correlação de Pearson mede o grau de associação entre as duas variáveis analisadas,
podendo ser fraca ou forte. Para isso, a notação matemática que permite verificar essa associação é a que
segue:
 X  Y 
 XY  n
R xy 

 X 2 
 X  2
 
   Y 
2
 Y 
2

 n   n 

Assim, o valor de Rxy deve pertencer ao intervalo -1  Rxy  1, e a sua interpretação é a seguinte:
0,00  Rxy  0,69 = Correlação fraca +

Diretamente proporcional:  x  y
0,70  Rxy  1,00 = Correlação forte +
-0,69  Rxy  0,00 = Correlação fraca - Inversamente proporcional:  x  y
-0,70  Rxy  -1,00 = Correlação forte -
1
Karl Pearson foi um grande contribuidor para o desenvolvimento da estatística como uma disciplina científica. Foi o fundador
do Departamento de Estatística Aplicada na University College London em 1911, sendo o primeiro departamento universitário
dedicado à estatística em todo o mundo.

Contudo, em geral, uma correlação forte não é sinônima de uma relação causa-efeito entre as
amostras ou variáveis. Há situações em que um coeficiente de correlação próximo de um ou de um menos
um não significa que a maioria dos pares de valores esteja contida em uma reta (será visto em regressão
linear). Desta forma, o simples conhecimento do coeficiente de correlação não é suficiente devido a
anomalias na dispersão dos dados, por isso é recomendada a construção do gráfico de dispersão das amostras
para melhor compreender o resultado, pois em alguns casos, a relação de causa e efeito pode ser provocada
por um ou mais fatores ocultos, uma variável não considerada na análise.
Por exemplo, suponha que o número de vendas diárias de um jornal e a produção diária de ovos
tenha uma forte correlação positiva. Não se pode afirmar que o aumento do número de jornais vendidos
resulte no aumento da produção de ovos. Para compreender a forte correlação positiva, devem-se procurar
fatores ocultos, por exemplo, o aumento de riqueza da população que resulta em aumento de demanda dos
dois produtos ao mesmo tempo, jornais e ovos.
Conhecer a relação significativa entre as variáveis é de extrema importância para que assim o
investigador possa realizar suas previsões com mais segurança, assim, faz-se necessário conhecer o que é
regressão linear.
3. REGRESSÃO LINEAR SIMPLES:

Como visto anteriormente, o coeficiente de correlação (Rxy) apenas não mede com segurança a
relação causa-efeito entre duas variáveis, apesar de essa relação poder estar presente. Por exemplo, uma
correlação fortemente positiva entre as variáveis x e y não autoriza afirmar que variações da variável X
provocam variações na Y, ou vice-versa. Entretanto, em uma regressão linear, a relação causa e efeito deve
ser definida no início da análise de forma sensata pelo pesquisador ou analista.
Em muitas pesquisas estatísticas, o objetivo principal é estabelecer relações que possibilitem predizer
uma ou mais variáveis em termos de outras. Assim, é que se fazem estudos para predizer os seguintes
exemplos:
 Temperatura de uma cidade com relação ao consumo de medicamento para gripe;
 Perda de peso de uma pessoa em decorrência do número de semanas que se submete a uma dieta de 800
calorias-dia;
 Despesa de uma família com médico e com remédio em função de sua renda;
 Consumo per capita de certos alimentos em função do seu valor nutritivo e do gasto com propaganda na
TV;
 Taxa de juros em função da inflação;
 Salário em função da escolaridade do trabalhador.

Assim, no estudo de regressão linear simples, utilizam-se duas amostras (ou duas variáveis) e se
objetiva em analisar a reta que melhor explica a relação entre essas duas variáveis, tendo previamente definido
a variável independente (ou resposta ou causa) e a variável dependente (ou preditora ou efeito).
A origem do termo “regressão” remonta a Francis Galton (1822 a 1911), que por volta de 1855,
investigava relações entre características antropométricas de sucessivas gerações. Uma de suas constatações
era de que “cada peculiaridade de um homem é transmitida aos seus descendentes, mas, em média, numa
intensidade menor”. Por exemplo: embora pais com baixa estatura tendem a ter filhos também com baixa
estatura, estes têm altura média do que a altura média de seus pais. O mesmo ocorre, mas em direção
contrária, com pais com estatura alta. A esse fenômeno de a altura dos pais mover-se em direção à altura
média de todos os homens ele chamou de regressão.
O termo regressão remete ao passado, ou seja, para se fazer previsões estatísticas é necessário
conhecer o passado (ou histórico) das variáveis de causa e efeito da empresa. Caso a empresa não possua
estes dados e quiser fazer previsões, a saída é buscar dados do seu concorrente.
3.1. Equação da reta:

Uma vez que o comportamento entre as variáveis tende para uma relação linear, o próximo passo
consiste em buscar determinar a respectiva equação de regressão linear simples.
Toda reta pode ser representada pela seguinte expressão matemática y = a + bx, onde x e y são as
variáveis e a e b, seus respectivos coeficientes. Sendo:
a = Coeficiente linear ou ponto que intercepta o eixo vertical y, ou seja, valor de y para x = 0
b = Coeficiente angular ou Declividade da reta, ou seja, a variação de y por unidade de variação de x.
O gráfico da equação y = a + bx é uma linha reta. Na prática, os valores de a e b costumam ser
estimados. Para obter os valores dos coeficientes a e b, recorre-se ao Cálculo Diferencial. Sendo:
 y  x ²    x  xy   x  y 
a  xy 
n  x ²    x ² b n
 x ²
x²  n
3.2. Coeficiente de determinação (R²):
Indica a proporção da variação total da variável dependente que é explicada pela variação da variável
independente, ou seja, mede a confiabilidade da previsão a ser realizada. Assim, quanto maior for o R²,
melhor será o poder de explicação da reta de regressão.
A diferença do coeficiente de correlação (Rxy) para o coeficiente de determinação (R²), é que o
primeiro mede a força da relação linear entre as variáveis, enquanto que o R² mede a explicação da reta de
regressão.

Dessa maneira, para apreciar o ajuste de uma reta, é melhor utilizar o coeficiente de determinação
que mede o sucesso da regressão em explicar y, ou seja, o R² verifica quantos por centos de y pode ser
explicado por x, o restante (%) são os sem explicação.
4. SÉRIES TEMPORAIS:
Segundo Corrar (2009), uma série temporal é um conjunto de observações sequenciais de
determinada variável, expressas numericamente, obtidas em períodos regulares de tempo. Assim, a análise de
séries temporais baseia-se na premissa segundo a qual os fatores que influenciaram o comportamento dos
dados no passado continuam influenciando seus movimentos futuros.
Desta forma, os dados coletados de uma série temporal podem sofrer a influência de diversos
fatores, como: alterações macroeconômicas, mudanças no padrão tecnológico vigente, variações nas
condições de natureza, ou mesmo podem ser afetados por fenômenos imprevisíveis, e por consequência
disso, os dados podem sofrer alguma tendência (sazonalidade, por exemplo), que consiste em mudanças nos
dados, fazendo-os serem no formato linear (diretamente ou inversamente proporcional), ou no formato de
uma curva, como por exemplo, a exponencial, polinomial, potencial, dentre outras (Quadro 1).
Tipo de Função Equação Original Equação Linearizada Variável X Variável Y
Linear y = a + b.x y = a + b.x x y
bx
Exponencial y = a.e ln y = ln a + b.x x ln y
b
Potência y = a.x ln y = ln a + b.ln x ln x ln y
Logarítmica y = a + b.ln x y = a + b.ln x ln x y
Quadro 1: Principais transformações lineares
Fonte: Adaptado de Corrar (2009)

Anexo 3 – Manual da Calculadora Científica e HP 12C para
Correlação e Regressão Linear
Modelo: Casio fx 82MS
1. Calcular Coeficiente de Correlação (Rxy):
Colocar no modo que aceita valores de x e y: Clicar em Mode  3 (Reg)  1 (Lin)
Digitar os seguintes pares ordenados (valores de x e) na calculadora:
X = Causa Y = Efeito
2,5 57
4,5 78
4 72
2 58
6 89
3 63
4 75
5 84
3 75
1 48
Digitar:
2,5  (tecla do lado do M+)  57  M+
4,5   (tecla do lado do M+)  78  M+
...
1   (tecla do lado do M+)  48  M+
Encontrar o valor do Coeficiente de Correlação (Rxy): Clicar em Shift  2 (S-VAR)  clicar na seta localizada em
Replay duas vezes para a direita  Clicar no número 3 =  Aparecerá 0,9575 (Valor do Coeficiente de Correlação =
95,75%).
2. Calcular “a” e “b” da Regressão Linear:

Não desligar a calculadora. Com os dados já digitados ir em:
Clicar em Shift  2 (S-VAR)  clicar na seta localizada em Replay duas vezes para a direita  Clicar no número 1 = 
Aparecerá 40,675 (Valor do “a”).
Clicar em Shift  2 (S-VAR)  clicar na seta localizada em Replay duas vezes para a direita  Clicar no número 2 = 
Aparecerá 8,35 (Valor do “b”).

Modelo: Casio fx 82ES
Limpar a memória: Clicar em Shift  9  3 =
1. Calcular Coeficiente de Correlação (Rxy):

Colocar no modo que aceita valores de x e y:
Clicar em Mode  1 (Stat)  2 (Ax+b)
Digitar:
1,1 =   12
1,2 =   12,5
...
1,9 =   7
Encontrar o valor do Coeficiente de Correlação (Rxy): Clicar em Shift  1  7
3=
2. Calcular “a” e “b” da Regressão Linear:

Shift  1  7
1=
Shift  1  7
2=
HP – Modelo: 12C
Passos para o procedimento completo:
1º) Digitar os pares ordenados na calculadora: y  Enter  x  +
2º) Achar o valor de “a”: 0  g  2
3º) Armazenar o valor de “a”: Clicar em STO  0
4º) Achar o coeficiente de Correlação: Clicar em x  y
5º) Achar o valor de a + b: Clicar em 1  g  2, depois
Valor de b: Clicar em RCL (Recuperar o valor de b)  0  -

Anexo 4 – Correlação e Regressão Linear com uso do Microsoft
Excel
CORRELAÇÃO:
1º Passo:
 Digitar o banco de dados em coluna;
 Identificar quais são as variáveis quantitativas e qual delas será x (causa) e y (Efeito);
2º Passo: Construção do gráfico de dispersão entre x e y:

 Selecionar as variáveis Propaganda (x) e Vendas (y)  Inserir gráfico  escolher gráfico de dispersão xy
(ou Ponto)  Avançar  Clicar em “OK”.
Propaganda (R$ milhões) Vendas (R$ milhões)
Propaganda (R$ milhões) 1
Vendas (R$ milhões) 0,8593 1
Formatação do gráfico:
 Apagar a legenda
 Título: Clique com botão direto do mouse dentro do gráfico: Opções do gráfico  Em Título: digitar
“Relação entre Propaganda (R$ milhões) versus Vendas (R$ milhões) de uma determinada empresa x”.
 Formatar os eixos “x” e “y”, sendo Propaganda (R$ milhões) e Vendas (R$ milhões), respectivamente;
 Letra Times New Roman, tamanho 11;
 Verificar se os dados do gráfico seguem uma tendência linear. Se sim, calcula-se a correlação linear entre
as variáveis x e y;
2º Passo: Fazer estudo de correlação linear entre x e y:

Procedimento 1: Com a ferramenta FUNÇÃO:
 Posicione o cursor em um local abaixo do banco de dados para visualizar o resultado;
 Clicar em Inserir função  Em selecionar uma categoria, escolha “Estatística”  Selecione uma função:
CORREL  OK  Em matriz 1: selecione todos os dados da variável x, em matriz 2: selecione todos os
dados da variável y, inclusive com o título. Caso esqueça de selecionar o título, o programa calcula a
correlação mesmo assim.
 Com isso sairá o resultado da correlação entre x e y = 0,8594 = 85,94%

Procedimento 2: Com a FERRAMENTA ANÁLISE DE DADOS:
 Clicar em Inserir
Ferramentas  Análise de dados  Clicar na função Correlação  OK  Em intervalo de entrada,
selecionar tudo que compõe o banco de dados, inclusive o título  Clicar também em “Rótulos na primeira
linha”, pois caso não clique, o programa não conseguirá ler o banco de dados, pois você está informando a
ele que a primeira linha do banco de dados são as variáveis  Agrupados por coluna  Clicar em Nova
saída  OK. O resultado será:
PARA A REGRESSÃO LINEAR SIMPLES:
Procedimento 1: Através da ferramenta FUNÇÃO:

Para encontrar o valor de “a” (o intercepto), que é representado pela fórmula:
 y  x²    x  xy

a
n x ²    x ²
CUIDADO para definir qual variável é x (independente) e qual é y (dependente), pois contrário o resultado
de a e b será errado.
 Clique em Inserir função  INTERCEPÇÃO  Selecione os dados da variável y, inclusive o título, e os
dados da variável y. Resultará: a = 117,07
Para encontrar o valor de “b” (o coeficiente angular, ou seja, a inclinação da reta), que é representado pela
 x y 
fórmula:
 xy  n
b
 x ²
 x²  n
 Clique em Inserir função  INCLINAÇÃO  Selecione os dados da variável y, inclusive o título, e os
dados da variável y. Resultará: b = 9,74
Portanto a equação de previsão será: y = a + bx, ou seja, y = 117,07 + 9,74x, que representa:
Vendas = 117,07 + 9,74. Propaganda

Procedimento 2: Através da ferramenta ANÁLISE DE DADOS:
 Clique em Ferramentas  Análise de dados  Regressão  OK  Selecione separadamente a variável
y (vendas) e a variável x (propaganda), inclusive os títulos  Clique em rótulos  Nova planilha. O que
iremos utilizar segue abaixo:
Estatística de regressão
R múltiplo 0,8593
R-Quadrado 0,7385
R-quadrado ajustado 0,7058
Erro padrão 65,173
Observações 10
Onde o Coeficiente de determinação (R²) é igual a 0,7385, ou seja, 73,85% dos dados estão sendo explicados
pela equação y = 117,07 + 9,74x, e 0,2614 = 26,14% não estão sendo explicados pela reta encontrada.
Coeficientes
Interseção 117,07
Propaganda (R$ milhões) 9,73
O quadro acima mostra os coeficientes a e b da reta de regressão.
Procedimento 3: Através do GRÁFICO DE DISPERSÃO:

 Clique em algum dos pontos do gráfico com o botão direito: Clicar em Adicionar linha de tendência 
Clicar em Linear  Ir em Opções: Clicar em exibir equação do gráfico e exibir valor de R² no gráfico, e
sairá a equação y = 117,07 + 9,73x e R² = 0,7385. Assim:
Relação entre Propaganda (R$ milhões) versus Vendas

(R$ milhões) de uma determinada empresa X
600
500
Vendas (R$ milhões)
400
300
200
y = 9,7381x + 117,07
100
R2 = 0,7385
0
0 10 20 30 40 50
Propaganda (R$ milhões)

Fazendo previsões matemáticas com uso da equação de regressão linear:
Para investimento em propaganda no valor de 20 milhões, 40 milhões e 50 milhões de reais, assim:
Assim, a projeção para cada um dos investimentos será de:

Nota de Aula 6 – Probabilidade
1. INTRODUÇÃO:
O passo decisivo para a fundamentação teórica da inferência estatística associa-se ao
desenvolvimento do cálculo das probabilidades.
Até recentemente, era comum creditar a decisão de qualquer evento aos deuses ou alguma outra
causa sobrenatural. Simplesmente não havia espaço para uma abordagem que atribuísse ao acaso, e tão
somente a ele, essas ocorrências. Entretanto, a Humanidade precisou de centenas de anos para se acostumar
com um mundo onde alguns eventos não tinham causa, ou eram determinados por causas tão remotas que
somente podiam ser razoavelmente representados por modelos não casuais. Tendo isso em vista, fica mais
fácil perceber porque a abordagem matemática do acaso, do azar e do risco só se iniciou há pouco mais de
500 anos.
Dessa forma, a teoria das probabilidades nasceu das tentativas de quantificação dos riscos dos
seguros e da avaliação das chances de se ganhar em jogos de azar.
Assim, essa quantificação dos riscos ocorreu há mais de 5 mil anos entre os comerciantes marítimos
mesopotâmicos e fenícios, aplicados à perda de carga de navios, ou por naufrágio ou por roubo. Assim, a
prática foi continuada pelos gregos e romanos e acabou chegando ao mundo cristão medieval através dos
comerciantes marítimos italianos que se baseavam em estimavas empíricas das probabilidades de acidentes
para estipularem as taxas e prêmios correspondentes.
Logo após o término da Idade Média, o crescimento dos centros urbanos levou à popularização de
um novo tipo de seguro: o seguro de vida. Assim, com este tipo de seguro surgiram os primeiros estudos
matemáticos sobre o assunto, fazendo com que houvesse um enorme aumento nos negócios de seguros
marítimos (associados aos preciosos carregamentos trazidos das Américas e das Índias), mas os seguradores
continuaram a usar as milenares técnicas empíricas.
Posteriormente a isso, o primeiro trabalho prático na área dos seguros de
vida é devido a Halley em 1693 (Degrees of Mortality of Mankind).
Nesse trabalho, Halley mostrou como calcular o valor da anuidade do
seguro em termos da expectativa de vida da pessoa e da probabilidade de
que ela sobreviva por um ou mais anos, mas com Daniel Bernoulli
(1730), a matemática dos seguros atingiu um estado bastante maduro,
pois com ele retoma-se um clássico problema de, a partir de um número
dado de recém-nascidos, calcular o número esperado de sobreviventes
após n anos.

Além disso, ele também dá os primeiros passos em direção a novos tipos de seguros calculando, por
exemplo, a mortalidade causada pela varíola em pessoas de idade dada.
Concomitantemente, os jogos de azar, jogos nos quais a possibilidade de ganhar ou perder não dependem da
habilidade do jogador, mas sim exclusivamente do azar do apostador, são, provavelmente, tão velhos quanto
à humanidade.
Sendo assim, a origem da probabilidade se deu aos jogos de azar, através de questões postas pelo
matemático francês Pascal (1623-1662) com o célebre cavaleiro Méré, um famoso jogador profissional que
escreveu uma carta a Pascal, propondo-lhe resolver alguns problemas matemáticos que tinha encontrado em
suas lidas com jogos de azar.
Sendo assim, hoje há muitas aplicações que envolvem jogos de azar como as loterias, os cassinos de
jogos, as corridas de cavalos e os esportes organizados (futebol, voleibol, handebol), dentre outros, que
utilizam a teoria das probabilidades diariamente nas duas deliberações.
Independente de qual seja a aplicação em particular, a utilização das probabilidades indica que existe
um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de um evento futuro. Assim é que, em
muitos casos, pode ser impossível afirmar por antecipação o que ocorrerá, mas é possível dizer o que pode
ocorrer. Por exemplo, se jogarmos uma moeda para o ar, de modo geral não podemos afirmar se vai dar cara
ou coroa. Além disso, mediante determinada combinação de julgamento, experiência e dados históricos, em
geral, é possível dizer quão provável é a ocorrência de determinado evento futuro.
Assim, as probabilidades são úteis porque auxiliam a desenvolver estratégias e faz com que o
método da inferência estatística se baseie na teoria da probabilidade para formular conclusões sobre toda uma
população (N) baseada em uma amostra (n). Dessa forma é que alguns motoristas parecem demonstrar uma
tendência para correr a grande velocidade se acham que há pouco risco de serem apanhados ou de correr
acidentes fatais. Os investidores sentem-se mais inclinados a aplicar seu dinheiro se as chances de lucro são
boas, e você certamente carregará capa ou guarda-chuva se houver grande probabilidade de chover.
Analogamente, uma empresa pode sentir-se inclinada a negociar seriamente com um sindicato quando há
forte ameaça de greve, ou mais inclinada a investir em novo equipamento se há boa chance de recuperar o
dinheiro, ou ainda de contratar um novo funcionário que pareça promissor, dentre outros.
Ao longo dos anos, os cálculos probabilísticos vieram se aperfeiçoando, passando da simples análise
de fatos concretos à abstração destes. Um caso de utilização da teoria da probabilidade é o envolver a maior
loteria do Brasil, a Mega-Sena, onde são apostados de seis a quinze números, entre os 60 disponíveis no
volante (01 a 60, inclusive respectivamente).
Neste jogo, os apostadores podem apostar de no mínimo seis números e no máximo quinze do total
de 60. Marcando 4, 5 ou 6 pontos (quadra, quina ou sena, respectivamente) receberão prêmios.

O preço das apostas dependendo de quantos grupos possíveis de seis números existem dentro dos
números escolhidos, variam de R$ 4,50 para seis números (somente 1 jogo possível) a R$ 8.758,75 para 15
números (5005 jogos possíveis). A possibilidade de acertar a Mega-Sena ao fazer uma aposta mínima é de 1
em 50.063.860 (aproximadamente 50 milhões).
O cálculo é feito da seguinte forma:
n = Total de número a escolher (n = 60)
X = Ganhar na Mega-Sena, ou seja, quantidade de números a acertar dentre os 60 números (x = 6
números), então:
Como a ordem de escolha dos números não importa, então usa-se a seguinte fórmula de
combinação:
 n   60  60! 60!
        50.063.860 , então:
 x   6  6! ( 60  6 )! 6!54!
1
P(ganhar na mega-sena) =  0,00000002  0,000002% , ou seja, as chances de ganhar o
50.063.860
jogo com uma única cartela é de 1 para 50 milhões. Para todos os efeitos práticos, essa probabilidade é zero,
o que significa que o apostador tem quase nenhuma chance de ganhar na loteria com uma única cartela, mas
mesmo assim, sempre há algum ganhador na loteria. Essa contradição aparente pode ser explicada com a
seguinte analogia:
“Suponha que há uma fila de micro-ônibus de Fortaleza até o Porto Alegre (RS). Suponha que pela
distância entre as duas cidades e pelo comprimento de um micro-ônibus normal, haverá, de forma hipotética,
aproximadamente 23 milhões de micro-ônibus na fila. Diretores da loteria selecionariam, ao acaso, um dos
micro-ônibus e colocariam um cheque de 30 milhões de reais em seu porta-luvas. Por um custo de dois reais
o apostador pode viajar pelo país e selecionar um (e somente um) micro-ônibus e verificar o porta-luvas”.
Em sua opinião, você acha que o apostador vai encontrar os 30 milhões no micro-ônibus que
escolheu?
Você deve estar quase certo que não. Agora, permita que qualquer pessoa entre na lotérica e por
dois reais adquira uma cartela e suponha que 50 milhões de pessoas façam isso uma única vez. Com um
número tão grande de participantes é muito provável que alguém vá achar o micro-ônibus com os 30
milhões, mas é quase certo que não será você.
Este exemplo ilustra um axioma da Estatística chamando de a lei dos grandes números (proposta
por Bernoulli), que estabelece que a frequência relativa (proporção entre o número de elementos do espaço
amostral e o espaço amostral) do número de vezes em que um resultado ocorre quando um experimento é
repetido muitas vezes (um grande número de vezes) se aproxima do valor teórico da probabilidade de

resultado. Em outras palavras, quando se repete um experimento um número suficientemente grande de
vezes é possível, substituir a expressão “frequência relativa” por “Probabilidade” com erro desprezível.
Bernoulli afirmou: “Para muitas experiências, tendo cada uma um resultado aleatório, a frequência
relativa de cada um desses resultados tende a estabilizar, convergindo para um certo número que constitui a
probabilidade desse resultado”.
É claro que se o número de repetições da experiência aleatória for bastante elevado, e a mesma for
repetida em sequências de n vezes, a frequência do acontecimento do evento E é diferente de sequência para
sequência, mas toma valores próximos de um valor dado. Esse valor é o limite para o qual tende a frequência
do acontecimento E, e é também o valor esperado (teórico) da probabilidade desse acontecimento quando o
número n de provas que se realizaram tende para infinito. Assim:
lim lim n( E )
P( E )  P( E ) 
n  n   n(  )
No entanto, para este processo poder ter precisão, é necessário realizar muitas vezes a experiência
aleatória. Isto ocorrendo, para qualquer tipo de distribuição de probabilidade (Normal, Uniforme, Triangular,
Exponencial) a lei dos grandes números funciona também.
Na prática empresarial, a utilização lei dos grandes números ocorre devida uma razão bem científica
para escolha do ser humano médio como foco na formulação desta lei na gestão de pessoas, podendo
formulá-la mais ou menos assim: “O comportamento de muitas pessoas é mais previsível do que o
comportamento de um grupo pequeno ou que o comportamento de uma pessoa isolada”. Essa afirmação nos
ajuda a entender vários acontecimentos aparentemente misteriosos da vida em sociedade, e muita mais na
vida na empresa. Por exemplo, ninguém controla a quantidade de comida que deve chegar a uma cidade
como Fortaleza, ou quais tipos de comida devem ser encomendados, mas é certo eu encontrar o que quero,
quando quero, do jeito que quero. A habilidade que o sistema tem de antecipar minhas necessidades e desejos
sem que eu tenha falado deles a ninguém, é explicada pela lei dos grandes números. Eu, um cara “médio”,
não vou sair procurando nada muito fora da média. Chamam esse talento para computar o que os “médios”
querem, de talento de marketing, e para isso utilizam a teoria da probabilidade.
Ainda para uma maior explicação da lei dos grandes números, se não soubermos a probabilidade de
ocorrer algum evento natural (por exemplo, a chance de chover), ou se não conhecemos a fração de alguma
população que satisfaz uma condição (tal como quantas partes defeituosas foram produzidas numa linha de
montagem) podemos descobrir esta probabilidade ou esta porcentagem através de numerosas observações e
experimentos suficientes.
Um outro exemplo para a lei dos grandes números é você pode achar estranho que uma pessoa
ganhe duas vezes ou mais na Mega-Sena. O New York Times contou a história de uma mulher de Nova Jersey
(EUA) que ganhou duas vezes a lotaria americana, dizendo que as probabilidades eram de “1 em 17 trilhões”.

Contudo, os estatísticos Stephen Samuels e George McCabe da Universidade de Purdue calcularam a
probabilidade de alguém ganhar a loteria duas vezes num período de 4 meses como de 1 para 30.
Por quê essa chance e essa probabilidade de ganho aumenta?
Porque os jogadores não compram um único bilhete para cada uma das duas loterias, compram
vários bilhetes múltiplos por semana. Justificando nesse caso a lei dos grandes números com a quantidade
grande de jogadas por jogadores.
Em outras palavras, quer ganhar na Mega-Sena, aposte nela e com muitas cartelas, mas muitas
mesmo.
Um outro exemplo para a lei dos grandes números é, se fizermos uma pesquisa sobre a população
de um Estado brasileiro e observamos apenas alguns cidadãos (amostra), os resultados podem conter grande
erro, porém se analisarmos várias pessoas em várias cidades diferentes dentro deste Estado (selecionados ao
acaso), os resultados das amostras estarão muito próximos dos verdadeiros valores da população e quanto
maior a amostra (maior número de pessoas entrevistadas) maior será esta aproximação.
Diante de tudo isto, os jogos, considerados legais, no Brasil é estimulado, pois de acordo o site da
Caixa Econômica Federal (Janeiro, 2012), quem joga na Mega-Sena tem milhões de motivos para apostar e
milhões de brasileiros para ajudar. 51% do valor arrecadado com as apostas é repassada ao Governo Federal,
que pode, então, realizar investimentos nas áreas da saúde, educação, segurança, cultura e do esporte,
beneficiando toda a população, por exemplo, 18,1% é destinado à Seguridade Social, 7,76% ao FIES-Crédito
educativo e 3,14% ao Fundo Penitenciário Nacional.
Desde então, as loterias em geral se tornaram imensamente populares por duas razões. Primeiro, elas
atraem o apostador com a oportunidade de ganhar milhões de reais com um investimento de dois reais,
segundo, quando o apostador perde, pelo menos acredita que seu dinheiro está indo para uma boa causa.
A Mega-Sena não é simplesmente uma “vantagem” para o povo concedida pelo governo, pois como
a grande maioria dos apostadores são pertencentes à classe baixa, os mesmos gastam na loteria
aproximadamente o mesmo que pessoas de classe média, mas por terem menos dinheiro, o maior percentual
de seus ganhos dos que apostam na sorte se destinam a esse fim. Isso faz desta uma forma de atividade
“regressiva”, ou seja, empobrece mais quem já é tido como pobre.
“Sempre acerto 11 pontos e ganho 2 reais na LOTOFACIL, só uma vez

que acertei 13 pontos e ganhei 10 reais. No total ja ganhei 32 reais, mas aí
descontei 12 reais das apostas, sobrou 20 reais, só que aí fui descontar os
outros jogos que eu não acertei e vi que fiquei 17 reais mais pobre...”
(depoimento anônimo de um jogador)

2. CONCEITOS INICIAIS:
 Experimentos aleatórios: São aqueles ensaios que não são previsíveis, mesmo que repetido em idênticas
condições, geram resultados diferentes, pois ocorrem ao acaso. Exemplo: Nascimento de duas crianças;
 Espaço amostral (): É o conjunto de todos os resultados possíveis de um experimento aleatório, ou

seja, é o conjunto universo do experimento.
Exemplo: Seja o experimento “Nascimento de duas crianças”.
Os resultados possíveis são?
 Evento (E): É o subconjunto do espaço amostral que contém os resultados que nos interessam.
Exemplo: Lançam-se uma moeda e um dado honestos. Enumere o seguinte evento: E1= Sair cara e face par
 Evento certo: É o evento que ocorre com certeza (É o próprio espaço amostral). Ex: Sair face menor que
7 no lançamento de um dado.
 Evento impossível: É o evento que nunca ocorre (), ou seja, não há possibilidade de ocorrência deste
evento. Exemplo: Obter soma maior que 12 no lançamento de dois dados.
 Operações com eventos aleatórios:
a) União: Sejam os eventos A e B, a união do evento A ao evento B é entendido por A  B. Representa a
ocorrência de pelo menos um dos eventos, A ou B.
b) Interseção: O evento interseção é formado pelos pontos amostrais que pertencem simultaneamente aos
eventos A e B, sendo representado por A  B.
Exemplo: Seja o experimento: “Lançamento um dado de 6 faces honesto”. Então,  = {1, 2, 3, 4, 5, 6},
sejam os eventos:
E1 
E1: Ocorrer face par
E2: Ocorrer número menor que 3
a) Então, E1  E2 =
E2
b) Então, E1  E2 =
 Eventos mutuamente exclusivos ou disjuntos: São eventos que não ocorrem simultaneamente, ou seja,
A  B = , pois a ocorrência de um deles anula a ocorrência do outro.
Exemplo: Seja o experimento “Lançar um dado honesto”. Então,  = {1, 2, 3, 4, 5, 6}, sejam os eventos:
E1: Ocorrer face par
E2: Ocorrer face ímpar
Então, E1  E2 =

 Eventos complementares ( E ) : O complemento de um evento “E”, denotado por E ou E c , consiste em
todos os resultados em que o evento “E” não ocorre, ou seja, é o acontecimento complementar de E.
Eventos complementares são eventos mutuamente exclusivos, mas a recíproca não é verdadeira, ou seja, nem
todo evento mutuamente exclusivo é complementar, por exemplo, no jogo de futebol, se o time ganhar é por
que o outro perdeu, mas se empatar, nenhum ganhou ou nenhum perdeu.
E  E =  (mutuamente exclusivo)
E E = E + E =   E = - E
Dizemos que E e E são complementares se sua união é o próprio espaço amostral e sua interseção é vazia.
Exemplo: Cara ou coroa na jogada de uma moeda; Exemplo: Feridos e não feridos num acidente.
2.1. Definição de Probabilidade: É a possibilidade de que certo evento venha ocorrer, ou seja, é uma
medida da incerteza associada aos resultados do experimento aleatório. De acordo a Lei de Laplace: Seja 
um espaço amostral equiprovável (quando todos têm a mesma probabilidade de ocorrer) de um experimento
aleatório, e E, um evento desse espaço amostral finito, definido por:
Número de elementos de E n( E )
P (E )  , assim: P( E ) 
Número de elementos do  n ()
Em outras palavras, probabilidade é uma fração entre o número de resultados favoráveis (aqueles que
satisfazem a necessidade do problema a ser calculado) com o número de resultados possíveis.
 Propriedades/Axiomas:
a) A probabilidade de um evento certo é igual a 1, isto é, P() = 1
b) O  P(E)  1: A probabilidade de um evento ocorrer é sempre maior ou igual a zero e menor ou igual a 1.
c) P( A )  1  P( A)  P( A)  P( A )  1 = P(), ou seja, a soma de eventos mutuamente exclusivos sempre
será igual a 1.
d) P() = 0, mas a reciproca não é verdadeira, pois o fato de P(A) = 0 não implica que seja impossível.
Exercício 1: É sexta-feira a noite e um estudante universitário está em uma festa e lembra que na próxima
segunda-feira haverá uma prova de cálculo em que ele está totalmente “por fora” da matéria. E o pior é que,
se ele não conseguir uma boa nota, estará reprovado. Mas ele lembra que o professor falou que a prova teria
3 questões de múltipla escolha, e basta ele acertar duas dessas questões para ser aprovado. Se o estudante
optar em continuar na festa e decidir que vai fazer a prova na base do “chute”. Portanto:
a) Relacione os diferentes resultados possíveis que ele poderá obter:
b) Qual é a probabilidade de responder corretamente todas as três questões e ser aprovado?
c) Qual é a probabilidade chutar corretamente pelo menos 2 questões e conseguir sua aprovação?
d) A estratégia de “chutar” na prova é uma estratégia inteligente adotada pelo aluno?

3. TEOREMA DA SOMA: Seja E um espaço amostral finito e não vazio. O principal objetivo da regra da
adição é encontrar a probabilidade de ocorrência do evento A, ou do evento B, ou de ambos, ou pelo menos
um deles. Assim:
P (A  B) = P (A) + P (B) – P (A  B) Ou P( A  B )  P( A  B )  P( A  B )  P( A  B )
Representando pelo diagrama de Venn:
P (A e B) = P (A  B)
Se os eventos forem mutuamente exclusivos, ou seja, não ocorrem simultaneamente, isto é,
A  B = , então P (A  B) = 0, assim: P (A  B) = P (A) + P (B)
Quando as probabilidades de eventos mutuamente exclusivos somam 1, diz-se que os eventos são
coletivamente exaustivos, nesse caso não existem outros resultados possíveis.
 Leis de Morgan ou Leis das Dualidades: Seja E um espaço amostral finito e não vazio. O principal
objetivo da regra é verificar a:
P ( A  B ) = Probabilidade de não ocorrer A e B, ou seja, não ocorre a interseção.
P( A  B ) = Probabilidade de não ocorrer “A” e não ocorrer “B”, ou seja, não ocorre cada um
separadamente, assim: P ( A  B ) =1- P(A  B)
P( A  B )  1  P( A  B )  P( A  B ) : A probabilidade de não ocorrer a interseção.

Sejam A, B e C três eventos. Então:
P (A  B  C) = P (A) + P (B) + P (C) – P (A  B) – P (A  C) – P (B  C) + P (A  B  C)
Exercício 2: Considere um experimento aleatório e os eventos A e B associados, tais que
1 1 1
P (A) = , P (B) = e P (A  B) = . Então temos:
2 3 4
a) P(A  B)
b) P ( A  B )
c) P ( A  B )
d) P( A  B )

Exercício 3: Em uma determinada Unidade de Pronto Atendimento (UPA) de Fortaleza, dos pacientes
atendidos no último final de semana passado, 50% estavam com chikungunya, 20% com dengue e 5% com
chikungunya e dengue. Diante dessas prevalências, o diretor da UPA solicitou ao Engenheiro de Computação
que calculasse a probabilidade de no próximo final de semana, dada às mesmas circunstâncias climáticas do
fim de semana passado, a probabilidade de nesta UPA ocorrer:
a) Nenhum paciente com chikungunya e dengue.
b) Nenhum paciente com chikungunya e nenhum com dengue nesse determinado hospital.
c) Pelo menos um paciente com chikungunya ou dengue.
4. TEOREMA DA MULTIPLICAÇÃO: A regra da multiplicação calcula a probabilidade de o evento A

ocorrer e a ocorrência do evento B, ou seja, P(A e B).
P (A e B) = P (A). P (B), se A e B são independentes
P (A e B) = P (A). P (B/A), se A e B são dependentes
 Eventos independentes: Dois eventos A e B são independentes se a ocorrência de um deles não afeta a
probabilidade de ocorrência do outro, caso contrário, são dependentes. Então:
P (A  B) = P (A). P (B), se A e B são independentes
P (A  B) = P (A). P (B/A), se A e B são dependentes
A regra da multiplicação é extremamente importante em virtude de suas inúmeras aplicações.
Exercício 4: Um aquarista coleciona peixes ornamentais e deseja com estes realizar um estudo com o
objetivo de descrever características comportamentais com relação ao gênero destes peixes, pois estudos
afirmam que os machos são mais agressivos que as fêmeas. O estudo será feito da seguinte forma: captura-se
o peixe, coloca-o em outro aquário durante 3 dias sob determinadas situações manipuladas por ele e filma-se
o comportamento de cada peixe frente às situações ocorridas. Com este estudo o pesquisador poderá traçar
estratégias de forma de cultivo destas espécies, de acordo as características comportamentais identificadas.
Desta forma, no aquário em que ele os cultiva há 5 peixes machos de cor branca e 8 peixes fêmeas de cor
azul. Dois peixes serão retirados do aquário, aleatoriamente e sem reposição. Portanto determine a
probabilidade de ser branco (ou macho) e outro azul (ou fêmea), em qualquer ordem.

5. PROBABILIDADE CONDICIONAL:
Se A e B são eventos associados a um espaço amostral , com P(B)  0, então a probabilidade de
ocorrência do evento A condicionada à ocorrência do evento B, é denotada por P (A/B) e definida pela
relação:
P( A  B )
P( A / B )  , onde P (B) > 0
P( B )
n( A  B )
n(  ) P ( A ).P ( B )
Nesse caso, P ( A / B )  . Se A e B forem independentes: P ( A / B )   P( A ) ,
n( B ) P( B )
n(  )
analogamente P(B/A) = P(B), ou seja, a regra da probabilidade condicional não se aplica.
Exercício 5: Suponha que nesta sala de aula há um total 15 alunos regularmente matriculados. O professor
gostaria de identificar qual a área da estatística é mais interessante para o aluno se aprofundar de acordo a sua
área de formação. Assim, um aluno será sorteado ao acaso entre todos os alunos que constam na lista de
presença do professor. Se o número sorteado for par, qual a probabilidade de que seja o aluno de número 6?

Nota de Aula 7 – Distribuição Normal de Probabilidade
1. INTRODUÇÃO:
Quando uma variável aleatória assume somente valores inteiros, suas informações são originadas de
uma variável aleatória discreta, pois estas são obtidas por contagem. Agora, em alguns casos, os resultados de
uma variável aleatória podem não estar limitados somente a números inteiros, mas podendo ser não inteiros
também. Suponha, por exemplo, que uma variável X represente a altura (cm) de um indivíduo, neste caso,
raramente um indivíduo tem exatamente 1,77cm ou 1,78cm de altura, pois teoricamente, esta variável pode
assumir um número infinito de valores intermediários, como 1,7704cm ou 1,7832 cm, por isso trata-se de uma
variável aleatória contínua, variável este que é obtida por mensuração e por este motivo seus possíveis valores
tendem para o infinito, visto não serem inteiros.
A distribuição contínua mais comum e mais utilizada no

âmbito estatístico é a distribuição de probabilidade chamada
normal, que também é conhecida como curva em forma de sino
ou curva de Gauss, como será vista mais adiante.
Esta distribuição tem uma história bastante longa, e está
ligada à história da descoberta das probabilidades, que surgiram
no século XVII para resolver, inicialmente, questões de apostas
de jogo de azar.
O responsável direto pela curva normal foi o matemático
francês Abraham de Moivre (1667-1754), exilado na Inglaterra, que
a definiu em 1730, dando sequência aos trabalhos de Jacob Bernoulli
(com o teorema dos grandes números) e de seu sobrinho Nicolaus
Bernoulli, ambos matemáticos suíços.
Johann Carl Friedrich Gauss (1777-1855)
A descoberta teve logo grande sucesso e grandes estudiosos da época foram ligados à curva normal,
tais como Laplace que em 1783 a utilizou para descrever a distribuição de erros, e Gauss que em 1809 a
empregou para analisar dados astronômicos.
Assim, como Gauss foi a primeira pessoa a reafirmar o papel fundamental proposta por Moivre a
curva da normal é chamada hoje de curva de Gauss.
Antes de explanar com mais detalhes a curva de Gauss, faz-se necessário analisar a lei dos grandes
números proposta por Bernoulli. Esse teorema diz o seguinte: numa situação de eventos casuais, onde as
alternativas são independentes, obter coroa em lances de uma moeda de cara ou coroa, tem a probabilidade

matemática exata de 50% (porque somente dois eventos possíveis: cara ou coroa), mas na prática esta
probabilidade de 50% é apenas aproximada. E essa aproximação é tanto mais exata quanto maior forem às
tentativas que você fizer de lançar moeda, chegando a quase atingir os exatos 50% se você lançar a moeda
infinitas vezes. Isto é, quanto mais lances você fizer, menor será o desvio (erro) em relação à média de 50%
que o resultado irá produzir. Isso quer dizer que os desvios serão menores na medida em que sobe o número
de lances. Desvios grandes são raros e desvios pequenos frequentes, quanto menores os desvios mais
frequentes eles serão, de sorte que, aumentando as tentativas (os lances), aumenta-se o número de desvios
pequenos, sobrepujando cada vez mais os desvios grandes, de tal sorte que, no limite, haverá quase somente
desvios pequenos, sendo o desvio zero o menor deles e, por consequência, o mais frequente.
O matemático francês Moivre assumiu essa idéia de Bernoulli e disse: erros grandes são mais raros que
erros pequenos. Assim, quanto menores os erros, mais frequentes eles serão e quanto maiores, menos
frequentes. Dessa forma, os erros se distribuem equitativamente em torno de um ponto modal, a média,
formando uma curva simétrica com pico na média e caindo rapidamente para as caudas à esquerda (erros que
subestimam a média) e à direita (erros que superestimam a média). Além disso, essa curva simétrica permitiu a
Moivre calcular uma medida de dispersão das observações em torno da média, medida esta que hoje em dia é
conhecida como o desvio padrão. Moivre, ainda chamou esta curva de normal, por que a média dela representa
a norma, isto é, as coisas todas deviam ser como a média, de sorte que tudo que se desvia dessa média é
considerado erro, portanto a equivalência, neste caso, entre desvio e erro.
Um outro matemático do século XIX, de origem belga, Quetelet, fez uma “orgia de medições” sobre
eventos do homem, tais como natalidade, mortalidade, alcoolismo, insanidade, medidas antropométricas,
dentre outros, resultando no Tratado sobre o homem e o desenvolvimento de suas faculdades (1835),
afirmando que tudo no homem e no mundo se distribui segundo a curva normal. Embora essa afirmação de
Quetelet tenha tido reações contrárias, ela evocou pesquisas sem fim sobre esta história da distribuição normal
dos eventos, chegando hoje em dia a ser mantida a idéia de que, praticamente, todos os eventos se distribuem
assim. Daí a hegemonia da curva normal nas análises estatísticas em pesquisas científicas.
Aliás, assumir a distribuição normal em pesquisa está baseado em dois fundamentos:
1 – Quando a distribuição da própria população for normal, ou
2 – Quando a distribuição da população não for normal, mas se tiver o número grande de casos (teorema de
Bernoulli através da lei dos grandes números ou o teorema central do limite).
Esta história do limite central é extremamente complicada, mas os matemáticos chegaram a provar
este teorema. Assim, qualquer que seja a distribuição dos seus dados, se você tiver um número grande de
observações, você pode usar com tranquilidade a curva normal como uma aproximação adequada para a
análise dos seus dados. Uma curiosidade: um N de tamanho 30 já é considerado um grande número se a

distribuição da população for próxima do normal. Um N bem maior será necessário se a distribuição da
população não for normal.
Hoje em dia, a curva da normal é um ganho fundamental na prática estatística, pois a normalidade
dos dados ocorre naturalmente em muitas áreas científicas, como na física, biologia e nas áreas sociais, e
também uma distribuição fundamental para a inferência estatística. Por exemplo, a sua aplicação na análise de
dados na área da biomedicina é grande, pois muitas variáveis numéricas contínuas comprovaram que têm
distribuição normal ou aproximadamente normal. Um outro exemplo que pode ser citado é a altura, o peso, o
índice de massa corporal (IMC) dos indivíduos, dentre outras. Alguns dos principais métodos empregados na
análise estatística, como a Análise de Variância, a Análise de Regressão, dentre outros exigem, como
pressuposto que os dados sigam uma distribuição normal para sua realização.
Esta nota de aula mostrará o uso prático da distribuição normal de probabilidade e a sua importância
tanto na academia quanto no mercado empresarial.
2. DISTRIBUIÇÃO NORMAL:
Mas por que esta distribuição tem esse nome? Existe uma explicação plausível para isto, será visto
mais adiante.
A distribuição normal é uma distribuição de probabilidade usada para variáveis aleatórias contínuas
(obtidas por mensuração), com a seguinte notação X ~ N (; ²) e sua função densidade de probabilidade é
dada por:
1  x 
2
1   
f ( x)  e 2  
, para - < x <  (ou x  ), onde:
 2
X = Variável aleatória contínua analisada

x = Valor qualquer da variável aleatória X
 = Média populacional
 = Desvio padrão populacional
 = 3,1416...
e = 2,7182...

3. CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL:
a) A variável “X” pode assumir qualquer valor real (- a +);
b) O gráfico da distribuição normal tem uma curva simétrica (a média  moda  mediana) e unimodal na
forma de um sino e é apresentado um ponto de inflexão à esquerda (x =  - 1) e outro à direita (x =  +
1), ou seja, ou seja, o que define a área sob a curva são os desvios padrão ( ), assim fixando o valor da
média, o “achatamento” da curva está diretamente ligado ao valor de .
O gráfico que mostra os indícios de que os dados de uma distribuição são aproximadamente normal
é o histograma ou o diagrama de ramo e folhas.
A distribuição normal é uma das distribuições fundamentais da moderna teoria estatística. A
vantagem da distribuição normal reside na facilidade de defini-la com apenas dois parâmetros, a média  e o
desvio padrão  da distribuição, por exemplo, suponha a seguinte a curva da normal f(x) para  = 40 e  =
10, o gráfico construído será:
Substituindo os parâmetros
0,0450  = 40 e  = 10 na função densidade

0,0400 de probabilidade, será encontrado os
0,0350 seguintes valores:
Frequência relativa
0,0300
x f(x)
0,0250
20 0,0007
0,0200
30 0,0146
0,0150
40 0,0399
0,0100
50 0,0146
0,0050
60 0,0007
0,0000 Segue o gráfico 1 com a plotagem dos
0 10 20 30 40 50 60 70 80
Parâmetros da variável aleatória seguintes valores.
Gráfico 1: Distribuição Normal com média  e desvio padrão 

Uma das características importantes da normal é que a partir desses parâmetros será possível
calcular, por exemplo, a porcentagem de valores que deverão estar acima ou abaixo de um determinado valor
da v.a., ou entre esses dois valores definidos.
Analisando a fórmula de f(x), observe que para cada par de parâmetros  e , há uma curva
diferente de f(x) ou que, para qualquer outro par de parâmetros  e , a curva f(x) será diferente.
c) Os valores de f(x) nunca tocam o eixo “x” da curva da Normal, mas f(x)  0, se x  ;
d) A área sob a curva é 1.
Como se trata de distribuição de probabilidade contínua, a área que fica entre a curva e o eixo “x”
representa a probabilidade. A probabilidade de ocorrer um evento entre os pontos “a” e “b” é calculada pela
integral definida (visto na disciplina de cálculo) da função entre os pontos “a” e “b”, representada por:
1  x 
2
b   
1
P ( a, b )   e 2  
, graficamente:
a  2
a b
Observa-se que o cálculo direto de probabilidade envolvendo a distribuição normal exige recursos de
cálculo avançado e, mesmo assim, dada a forma da função densidade de probabilidade (f.d.p), não é um
processo muito elementar. Por isso ela foi tabelada, permitindo assim obter diretamente o valor da
probabilidade desejada.
Verifica-se que, no entanto, a f.d.p da normal depende de dois parâmetros, a  e ², o que acarreta um
grande trabalho para tabelar as probabilidades, considerando-se as várias combinações de  e ².
Esse problema pode ser resolvido por meio de uma mudança de variável, obtendo-se, assim, a
distribuição normal padronizada ou reduzida.

4. A CURVA NORMAL E A CURVA PADRONIZADA (Z):
Os pesquisadores quando falam da curvam normal, tipicamente entendem a curva normal
padronizada (ou igualitária a normal original), a qual é definida pela simetria e pela curtose. Mas a curva
normal original é definida exclusivamente pela simetria, isto é, que as áreas sob a curva são idênticas em
ambos os lados da média: a curva normal é unimodal (tem apenas um pico) e simétrica. Assim, todas as
curvas da figura abaixo são normais, porque têm um pico somente e são simétricas, embora os desvios sejam
diferentes, provocando diferentes níveis de curtose.
1  x 
2
1   
 
Na fórmula f ( x )  e 2 , observa-se que a parte mais importante é o expoente
 2
1 X 
2
   , e nele se vê que quem comanda as ações são os dados empíricos de X e os parâmetros de

2  
sua distribuição (µ e ). Agora, tanto os X quanto os parâmetros de uma distribuição variam de pesquisa para
pesquisa e, assim, as curvas normais que resultam são diferentes. Portanto, ao invés de trabalhar com os
valores brutos de X, vamos padronizar estes valores e transformá-los em valores de Z, ou seja, agora a
distribuição normal terá o seguinte formato:
Z2
X  1 
Z , com isso f ( Z )  e 2
 2
A vantagem desta curva normal padronizada é que em alguns parâmetros já estão automaticamente
definidos para qualquer escala de medida que você utilizar, quais seja, a média é zero (  = 0) e desvio padrão
um ( = 1), onde suas probabilidades já foram calculadas e são apresentadas em uma tabela (ver anexo desta
nota de aula) de fácil utilização. Essa tabela nada mais é que uma tabela de conversão do número de desvios
padrão entre x e  em um algoritmo.
Em que X é uma variável aleatória normal da média  e variância ² (são constantes), assim:
X ~ N(; ²)  Z ~ N(0; 1²), seu gráfico será:

A curva normal padronizada é definida pela simetria e pela curtose, sendo chamada de mesocúrtica.
A curtose da distribuição normal se refere á altura do pico da curva, o qual acontece na média da
distribuição: se o pico é muito elevado, a curva é chamada de leptocúrtica, se o pico é achatado a curva é
chamada de platicúrtica, se for mediano, a curva é chamada de mesocúrtica, sendo esta última, a característica
da normal padronizada, como mostra a figura abaixo:
Trabalhar com a curva normal padronizada facilita muito a vida da gente, pois com ela a média
sempre será zero e o desvio padrão será um. Quando não for padronizada, então teremos que calcular o valor
da média e o valor do desvio padrão da distribuição e trabalhar com os dois parâmetros.

5. USO DA TABELA NORMAL PADRÃO (Z):
A tabela oferece a área entre 0 e Z0 ou P(0  Z  Z0), conforme visto no gráfico abaixo:
Onde Z0 representa o número de desvios padrão distante da média, ou seja, as informações contidas
nessa tabela não são sempre idênticas nos diferentes autores de livros de estatística, mas duas informações
sempre estão presentes e essas duas são as mais importantes, a saber, o Z e a proporção de casos que caem na
faixa que vai da média zero até este valor de Z. Assim, se você conhece o Z, você pode descobrir qual a
proporção de casos que corresponde a ele ou, se você conhece a proporção de casos, você pode descobrir
qual o Z que lhe corresponde.
OBS: Embora a curva normal vá até o infinito (positivo e negativo), você vê que quase a totalidade dos casos
cai entre -3 e 3 desvios padrão (ou Z), de fato, 99,74% dos casos, por isso, a tabela (em anexo) varia -3,99 a
3,99, acima ou abaixo disso é 0,499.
6. REGRA EMPÍRICA (OU REGRA 68-95-99):

Outra regra que auxilia a interpretação de um desvio padrão é a regra empírica, aplicável somente a
conjunto de dados com distribuição aproximadamente em forma de sino, pois mostra como a média e o
desvio padrão estão relacionados com a proporção dos dados que se enquadram em determinados limites. A
regra é a seguinte:
 Cerca de 68% dos valores estão a menos ou a mais de 1 desvio padrão a contar da média, o que justifica o
nome da distribuição de probabilidade “normal”, pois 68% representa a maioria, e a maioria é o que
representa “ser normal” ou que está “dentro do padrão”. Nesse caso, 68% dos elementos (a maioria)
apresentam determinada característica;
Se quiser melhorar esse nível proporcional de elementos que possuem determinada característica, de 68%
para 95%, ou seja, basta-se pegar 2 desvios padrão para mais e para menos a contar da média, assim:
 Cerca de 95% dos valores estão a menos ou a mais de 2 desvios padrão a contar da média;
Se quiser ainda aumento esse nível proporcional de 95% para 99,7%, então deve-se pegar 3 desvios padrão
para mais e para menos a contar da média, assim:

 Cerca de 99,74% dos valores estão a menos ou a mais de 3 desvios padrão a contar da média. Nesse último
caso, a análise é de quase toda a população possuir determinada característica.
Com isso, se os dados são aproximadamente normais, as porcentagens serão aproximadamente
iguais a 68%, 95% e 100%, respectivamente.
Ver figura da regra empírica.
Portanto, quase nunca é preciso prolongar muito as caudas de uma distribuição normal, porque a
área sob a curva é de mais ou menos 4 ou 5 desvios-padrão a contar da média é desprezível para quase todos
os fins práticos.
Exercício 1 - Exercício para aprender utilizar a Tabela na Normal Padrão: Encontre a probabilidade
de:
a) P(Z  1,34)
b) P(Z  1)
c) P(-2,55  Z  1,2)
d) P(1  Z  3,09)
e) P( - 3  X   + 3)

Anexo 5 – Tabela da Distribuição Normal

1ª LISTA DE EXERCÍCIOS DE ESTATÍSTICA PARA AP 1
Variáveis:
1) Suponha que o gestor hospitalar solicitou que o gerente de Tecnologia da Informação analisasse os
indicadores referente aos 60 pacientes atendidos na emergência durante o último domingo do mês passado.
Os dados estão organizados no seguinte banco de dados abaixo:
Tipo de Número de Classificação da
Paciente Gênero Peso (kg)
Tratamento convulsões doença
1 Masculino 89,79 A 1 Leve
2 Feminino 64,20 A 3 Severa
3 Masculino 91,00 B 2 Moderada
... ... ... ... ... ...
58 Masculino 71,00 B 0 Severa
59 Masculino 78,80 A 2 Leve
60 Feminino 71,00 B 3 Moderada
Fonte: Dados hipotéticos
De acordo com o banco de dados acima classifique o tipo de variável para as variáveis seguintes. Marque a
alternativa correta:
a) Gênero:
(a) Qualitativa Nominal (b) Qualitativa Ordinal (c) Quantitativa Discreta (d) Quantitativa Contínua
b) Peso:
c) Tipo de Tratamento:
d) Número de Convulsões:
e) Classificação da doença:

2) O atual Governo Federal está exigindo uma quantidade maior de informação antes de aceitar um candidato
e decidir se concede ou não uma bolsa do Prouni para uma faculdade privada de Fortaleza. Assim, classifique
cada uma das informações dos futuros alunos à instituição. Marque a alternativa correta:
a) Quantidade de prêmios escolares obtidos:
b) Qual a sua faixa de Renda familiar mensal (OBS: Identificar a classe social de acordo com a legenda
abaixo)? Legenda com relação a faixa de renda familiar do pesquisado e sua classe social
( ) Até R$ 1.874,00 segundo o IBGE:

Até R$ 1.874,00 – Classe E
( ) De R$ 1.874,01 a R$ 3.748,00
De R$ 1.874,01 a R$ 3.748,00 – Classe D
( ) De R$ 3.748,01 a R$ 9.370,00 De R$ 3.748,01 a R$ 9.370,00 – Classe C
( ) De R$ 9.370,01 a R$ 18.740,00 De R$ 9.370,01 a R$ 18.740,00 – Classe B
( ) Mais de R$ 18.740,00 Mais de 18.740,00 – Classe A
c) Salário (em reais) dos pais:

d) Qual o seu Estado civil?

Planejamento Amostral:
3) (Amostra Aleatória Simples) Estudo sobre elaboração de estratégia de marketing: A “Guerra das Colas”
é o termo popular utilizado para a intensa competição entre Coca-Cola e Pepsi mostrada em suas campanhas
de marketing. As campanhas geralmente têm estrelas do cinema, televisão, youtubers e influenciadores digitais,
que surgem reforçando as suas preferências com base em testes de sabor. Assim, como parte de uma
campanha de marketing, a Pepsi submeteu de uma população de 625 consumidores de refrigerante sabor cola
uma amostragem de 300 a um teste cego (isto é, o consumidor degusta o refrigerante e informa qual dos dois
ele prefere sem visualizar a marcar que está degustando). Cada consumidor é questionado quanto à sua
preferência em relação à marca A ou B. Diante disso, calcule a margem de erro do teste cego, se a
confiança for de 99%?
Gabarito: 6,7%

4) (Amostra Aleatória Estratificada) Estudo sobre o nível de serviço logístico: Uma das áreas que a
logística exige é a de criação de software para planejar e administrar rotas, sistemas de armazenagem e o tempo
de entrega de produtos. Assim, uma empresa de logística localizada em Fortaleza que transporta cargas de
equipamentos eletrônicos em seus caminhões-baú que são monitorados por um rastreador até o último
cliente ser atendido deseja fazer uma pesquisa de satisfação com estes clientes (lojas de eletrônicos),
localizados em três capitais brasileiras, sendo elas: São Paulo, Recife e Rio de Janeiro, conforme visto no
Quadro abaixo. O objetivo da pesquisa é verificar, na opinião deles, se a logística de entrega dos produtos
está sendo realizada de forma eficiente.
Destino Número de lojas (N)
São Paulo 851
Recife 400
Rio de Janeiro 511
Total 1.762
Como não é possível analisar todos as lojas nas três capitais, será feito um estudo por amostragem. Portanto,
através de uma Amostra Aleatória Estratificada Proporcional, quantas lojas serão pesquisadas, por destino de
entrega, com uma margem de erro de 2,5% para mais ou para menos e uma Confiança de 98%?
Medidas Descritivas Para Dados Não Agrupados:

5) Estudo meteorológico na construção civil: Uma equipe de especialistas do centro meteorológico de
uma cidade europeia mediu a temperatura ambiental, sempre no mesmo horário, durante 11 dias intercalados,
a partir do primeiro dia útil do mês. Esse tipo de procedimento é frequente para os engenheiros civis que
analisam as tendências climáticas nas construções de futuras barragens. Segue os dados:
2°C 3°C -5°C 6°C -7°C -2°C 0°C 8°C -3°C 5°C 10°C
Assim, determine e interprete:
a) A média da temperatura da cidade.
b) A moda da temperatura da cidade.
c) A mediana da temperatura da cidade.
d) O Desvio Padrão da temperatura da cidade.
e) Através do coeficiente de variação (CV), verifique se as temperaturas são homogêneas ou heterogêneas.
Gabarito: a) 1,54°C; c) 2°C; d) 5,46°C; e) 354,54%;

6) Estudo sobre a logística de distribuição: Suponha que o departamento de logística de uma empresa que
vende produtos online registrou o tempo (em minutos) de entrega de produtos realizados por duas empresas
transportadoras para as compras realizadas no final do mês de novembro de 2018 com previsão de entrega no
início de janeiro de 2019, ou seja, 35 dias em média após a compra ser finalizada:
Clientes
Tempo (minutos)
1 2 3 4 5 6 7 8 9 10
Transportadora 1 46 45 57 55 42 59 60 48 39 59
Transportadora 2 32 34 32 33 37 35 37 30 34 30
a) Calcule o tempo médio de entrega de cada transportadora
b) Calcule o desvio padrão do tempo de entrega de cada transportadora
c) Calcule o coeficiente de variação do tempo de entrega de cada transportadora
d) Faça um gráfico de linha em que no eixo x tenha os clientes e no eixo y o tempo de entrega e verifique
qual das duas transportadoras tem o tempo de entrega mais concentrado, e verifique com qual transportadora
a empresa deve continuar com o contrato de distribuição de seus produtos.
7) Estudo para tomada de decisão de atendimento ao cliente: Uma rede de supermercados de Fortaleza
queria saber se o tempo de espera para atendimento de clientes de dois tipos de filas (Única e Múltipla) era o
mesmo ou não, pois caso o tempo do tipo de fila fosse diferente, iriam adotar a partir do mês seguinte o tipo
de fila que apresentasse o menor tempo de atendimento. Na fila única os clientes entram e são atendidos por 3
caixas, enquanto que na fila múltipla os clientes entram em qualquer uma das três filas que conduzem até os
caixas. Foram observados 10 clientes aleatoriamente escolhidos durante 1 hora de um determinado dia e
anotou-se o tempo que cada um levou para ser atendido, como segue abaixo:
Fila única 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7
Fila múltipla 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10,0
a) Calcule o tempo médio de cada fila

b) Calcule o desvio padrão de cada fila
c) Calcule o coeficiente de variação do tempo de entrega de cada transportadora
d) E decida o que o supermercado deve fazer, visando a satisfação do seu cliente: adotar a fila única ou
múltipla.

Separatrizes e Box-Plot
8) Estudo sobre controle de qualidade na construção civil e de produção: Uma olaria produz tijolos que
é um material cerâmico utilizado na construção civil de acordo com a norma de resistência estabelecido pelo
departamento de controle de qualidade do seu respectivo cliente. Assim, um determinado cliente estabeleceu
como critério que 50% entre o Quartil 1 e Quartil 3 dos tijolos devem suportar, no mínimo, uma força de
compressão entre 6,5 e 8,5kg/cm2 (ou seja, o tijolo consegue suportar um corpo de peso entre 6,5 e 8,5 kg, por
exemplo) para que o lote produzido seja aprovado e utilizado nas suas futuras construções. Num ensaio de
uma amostra de 26 tijolos escolhidos aleatoriamente de um lote produzido pela olaria e realizado pelo
engenheiro de controle de qualidade do cliente foram registrados os seguintes dados com relação a sua
resistência à compressão em kg/cm2:
2,8 3,3 4,5 5,0 5,3 6,0 6,0 7,0 7,0 7,3
7,3 7,5 7,8 7,8 8,3 8,5 8,8 9,0 9,0 9,0
9,0 9,3 9,6 9,8 10,0 10,0
Nestas condições, através do gráfico Box-Plot, o departamento de Controle Estatístico de Qualidade do
cliente, de acordo o critério estabelecido aprovará ou reprovará o lote de tijolos para utilização?
9) Dentre as afirmativas abaixo, marque a INCORRETA:

(a) O Q2 é igual à mediana que é igual ao Percentil 25
(b) Os Decis dividem a distribuição em dez partes iguais
(c) As Separatrizes são estimativas que não analisam a dispersão dos dados
(d) O P60 indica que 40% dos valores são maiores que ele e 60% abaixo
(e) O Q3 é igual ao Percentil 75.
10) Em relação ao gráfico Box-Plot, conforme a figura abaixo, pode-se afirmar que:
(a) A linha que passa no interior da caixa é a média.

(b) O comprimento da caixa no gráfico retrata o intervalo interquartílico (IIQ).
(c) Entre o primeiro e o segundo quartis há 50% dos dados da amostra.
(d) Se houver valores discrepantes (outliers), estes estarão localizadas dentro da caixa.
(e) No limite superior da “caixa” há 50% dos dados da amostral.

2ª LISTA DE EXERCÍCIOS DE ESTATÍSTICA PARA AP 2
Correlação e Regressão Linear

1) Estudo sobre marketing digital: O Instagram é a rede social que mais cresce no mundo, pois além de
tudo é uma ótima estratégia de marketing digital na divulgação de uma marca e também no engajamento com
potenciais clientes. A rede só permite que o usuário utilize até 30 hashtags (#) por postagens, para captação de
possíveis clientes. Assim, suponha que um determinado usuário fez postagem de divulgação do seu negócio
de consultoria empresarial no seu perfil comercial durante 10 dias seguidos e utilizou para cada dia uma
quantidade diferente de hashtags, conforme vista no Quadro abaixo:
Quantidade de Vendas fechadas
hashtags (R$)
30 430
18 335
25 520
26 490
27 470
10 210
8 195
17 270
15 400
25 480
Assim, através dos dados:

a) Faça o gráfico de dispersão e tire as conclusões preliminares
b) Calcule o Coeficiente de Correlação de Pearson
c) Através do Método de Regressão Linear, encontre a equação de previsão.
d) Faça uma previsão de vendas se a quantidade de hashtags no próximo post que ele fizer for de:
d1) 30 hashtags (o limite máximo)
d2) 25 hashtags
d3) 20 hashtags
e) Essas previsões tem uma confiança de quantos porcentos?

2) Estudo sobre a produção industrial: Uma determinada produtora de cimentos localizada no município
do Pecém, interior do Ceará, levantou os seguintes dados referente a venda de saco de cimentos de 50kg
durante os primeiros 7 dias úteis de um determinado mês.
Dia 1 2 3 4 5 6 7
Quantidade de cimentos vendidos (sacos) 180 188 190 198 200 208 213
a) Fazer o diagrama de dispersão;

b) Calcular o Coeficiente de Correlação de Pearson (Rxy);
c) Calcular a reta de regressão estimada (y = a + bx);
d) Se a quantidade vendida seguir a mesma tendência dos 7 dias analisados, faça uma previsão da produção
de sacos de cimentos para o 8º, 9º e 10º dia;
e) Se a meta da indústria analisada é de vender 270 sacos de cimentos por dia, em que dia eles conseguirão
isso?
f) Encontre o Coeficiente de Determinação (R²) e interprete.
Probabilidade
3) Em um canteiro de obras há 375 quadrantes de 1 metro quadrado, que foi definido por um engenheiro
civil, numerados consecutivamente de 1 a 375 para realizar um estudo do solo por amostragem. Escolhe-se
por sorteio um quadrante desse canteiro para estudo de suas características, a probabilidade de se obter um
quadrante numerado com um número múltiplo de 15 é?
Gabarito: 6,67%
4) Suponha que o professor falou o seguinte na última aula de Estatística: “Alunos, estudem todo o assunto
que foi visto durante todo o semestre que se encontra nas Notas de Aulas de Estatística, pois na próxima aula
farei um sorteio de um aluno e abrirei aleatoriamente a nota de aula. Assim, na página em que eu abrir o aluno
sorteado deverá fazer no quadro para toda a turma um exercício que estiver na página sorteada, sendo que se
a página tiver mais de um exercício, será feito o primeiro exercício que há nela”. Suponha ainda que a nota de
aula é composta por 240 páginas, e o aluno verificou que os assuntos que ele mais domina estão entre as
páginas 80 e 120, excluindo estas duas. Diante disso qual é a probabilidade de quando o professor abrir a nota
de aula ele abra entre estas páginas, e ele resolva com tranquilidade e receba a pontuação que será
proporcionada pela atividade?
5) Dentre os números formados por três algarismos, qual é a probabilidade de encontrarmos um número
maior que 930? Gabarito: 7,67%

6) Um estádio de futebol será reformado para receber um grande jogo clássico durante o mês de dezembro
de 2019. O estádio é composto por 25.000 lugares numerados de 1 a 25.000. Qual a probabilidade de escolher
um lugar numerado com um número múltiplo de 14 para começar a pintura por eles?
Gabarito: 7,14%
7) Escolhe-se ao acaso dois números naturais (*) distintos de 1 a 100. Qual a probabilidade de que o
produto dos números escolhidos seja ímpar?
Gabarito: 24,75%
8) Numa urna há 6 bolas azuis numeradas de 1 a 6 e cinco bolas vermelhas numeradas de 1 a 5. Extraindo ao
acaso uma bola, qual a probabilidade de sair uma bola azul ou com número ímpar?
Gabarito: 81,8%
9) Em uma locadora de carro, de cada 100 veículos 30 são de 4 portas e 20 têm motor a gasolina. Se de cada
100 veículos, 5 são a gasolina e têm 4 portas, qual a probabilidade de carros na locadora que não são a
gasolina e nem tem 4 portas?
Gabarito: 55%
Distribuição Normal de Probabilidade:

10) Estudo de investimento financeiro: O saldo diário de caixa de uma determinada indústria química
segue uma distribuição normal com média R$ 80.000 e desvio padrão R$ 40.000. Suponha que o químico
responsável por um dos mais importantes setores desta indústria sugeriu ao gerente financeiro que comprem
um conjunto de maquinário novo para que a formulação de um determinado composto químico seja mais
eficaz do que se produz atualmente. Desta forma, o gerente financeiro deseja tomar a decisão de
investimento com seu banco e precisa com urgência saber qual a probabilidade do saldo do caixa de hoje às
18 horas fechar entre R$ 30.000 e R$ 120.000, pois de acordo o Diretor Geral da empresa se o caixa de hoje
fechar com valores dentro desse intervalo, o gerente financeiro pode arriscar a fazer o investimento de
maquinário, mas isso só pode ser realizado se a probabilidade for alta (de acordo o Diretor Geral é acima de
70%). Portanto verifique para o gerente financeiro se ele pode ou não fazer o investimento.
11) Estudo para engenharia de tráfego: O tráfego aéreo (número de aterrissagens e decolagens) no
Aeroporto Internacional de Fortaleza durante a “hora de pico” é uma variável aleatória normal com média de
80 aviões por hora e desvio padrão de 10 aviões por hora. Se a capacidade atual de tráfego aéreo no aeroporto
é de 90 aviões por hora, qual é a probabilidade de ocorrer congestionamento do tráfego aéreo?
Gabarito: 15,87%

12) Estudo para avaliar a inteligência humana: O Quociente de Inteligência (QI) é uma medida
padronizada obtida por meio de testes desenvolvidos para avaliar as capacidades cognitivas (inteligência) de
um sujeito. De acordo o matemático Lewis Madison Terman (1916), esta variável é considerada normal se o
indivíduo analisado apresentar em média 100 unidades de QI e desvio padrão de 15 unidades. Suponha que
uma universidade americana irá selecionar estudantes desta faculdade para conceder a estes uma bolsa de
estudos com tudo pago, para estudar no seu campus em San Francisco, na Califórnia, por um ano, mas só
admite pessoas com inteligência acima da média (entre 110 – 120). Portanto, calcule a probabilidade de
alunos escolhidos aleatoriamente nesta faculdade ganhar esta oportunidade.
Gabarito: 15,97%
13) Estudo para descobrir possíveis fraudes: Uma aplicação clássica da distribuição normal é inspirada em
uma carta de uma esposa americana ao seu marido também americano, em que ela alegava ter dado à luz 308
dias após uma rápida visita de seu marido que estava servindo na Marinha no Havaí. Segundo informações
médicas, os prazos da gravidez têm distribuição normal com média de 268 dias e desvio padrão de 15 dias.
Assim, com base nessa informação determine a probabilidade de uma gravidez durar 308 dias ou mais. O que
o resultado sugere?

Notas de Aula Estatística

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Notas de Aula Estatística

Enviado por

Direitos autorais:

Formatos disponíveis

Notas de Aula de Estatística

Professor Kleison Freitas

- Apresentação: Cursando a disciplina de Estatística, o acadêmico poderá utilizar a ferramenta estatística

- Metodologias e Recursos: Utilizar as técnicas estatísticas através de aulas expositivas, práticas em

- Sistema de Avaliação: Verificar no Portal da disciplina

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 2

2. Professor do Centro Universitário UNIFANOR/Wyden.

Experiência como Estatístico

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 3

Modelo Casio fx 82 MS ou HP – Modelo: 12C

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 4

Tratamento dos Apresentação dos

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 5

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 6

 Qualitativas ou Categorizadas: São variáveis que exprimem qualidade do elemento investigado.

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 7

A finalidade da amostragem é permitir fazer suposições, predições, generalizações (ou inferências)

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 8

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 9

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 10

d) Amostras de Voluntários: Quando a pesquisa inclui alguns procedimentos perigosos, difíceis ou

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 11

Onde e = margem de erro.

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 12

Exercício 1 – Estudo sobre abertura de um empreendimento: Um empreendedor foi ao SEBRAE

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 13

d) Amostra por Conglomerado: Primeiramente, na amostra por conglomerado, a população-alvo é dividida

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 14

2. MEDIDAS DE TENDÊNCIA CENTRAL

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 15

Média amostral Média populacional

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 16

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 17

Exemplo 2: Nota de um aluno de uma avaliação parcial de Estatística: 8 7 3 4 8

Exemplo 3: Nota de um aluno de uma avaliação parcial de Estatística: 8 7 3 4 8 9

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 18

3.1. Variância (S²):

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 19

xi = Valores da variável xi = Valores da variável

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 20

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 21

3.3. Coeficiente de Variação de Pearson (CV):

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 22

1. Média e Desvio Padrão:

Encontrar o valor da média:

Modelo: Casio fx 82ES

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 23

2º Passo: Estatística Descritiva de todas as variáveis quantitativas: Salário

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 24

1.2. Decil: Divide o conjunto de dados em 10 partes iguais:

1.3. Percentil: Divide a série em 100 partes iguais:

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 25

2.1. Interpretação do Box-Plot: O gráfico de Box-plot interpreta-se da seguinte forma:

2.2. Vantagens do Box-plot:

2.3. Desvantagem do Box-Plot:

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 26

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 27

Segue abaixo um modelo de um Box-Plot:

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 28

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 29

Notas de Aula Estatística Professor Ms. Kleison Freitas – kleison.freitas@unifanor.edu.br Página 30

Como as conclusões tiradas de gráficos de dispersão tendem a ser subjetivas, necessita-se de

2.3. Coeficiente de Correlação de Pearson1 ( Rxy ):

0,00  Rxy  0,69 = Correlação fraca +