Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística Básica
1ª Edição
Brasília/DF - 2019
Autores
Sirlei Alves Chaves
Produção
Equipe Técnica de Avaliação, Revisão Linguística e
Editoração
Sumário
Organização do Livro Didático....................................................................................................................................... 4
Introdução.............................................................................................................................................................................. 6
Capítulo 1
Conceitos fundamentais.............................................................................................................................................. 7
Capítulo 2
Distribuição de frequências.....................................................................................................................................16
Capítulo 3
Medidas estatísticas...................................................................................................................................................27
Capítulo 4
Probabilidade................................................................................................................................................................ 36
Capítulo 5
Distribuição de probabilidade de variáveis aleatórias discretas................................................................52
Capítulo 6
Distribuição de probabilidade de variáveis aleatórias contínuas.............................................................. 59
Organização do Livro Didático
Para facilitar seu estudo, os conteúdos são organizados em capítulos, de forma didática, objetiva e
coerente. Eles serão abordados por meio de textos básicos, com questões para reflexão, entre outros
recursos editoriais que visam tornar sua leitura mais agradável. Ao final, serão indicadas, também,
fontes de consulta para aprofundar seus estudos com leituras e pesquisas complementares.
A seguir, apresentamos uma breve descrição dos ícones utilizados na organização do Livro Didático.
Atenção
Cuidado
Importante para diferenciar ideias e/ou conceitos, assim como ressaltar para o
aluno noções que usualmente são objeto de dúvida ou entendimento equivocado.
Importante
Observe a Lei
Conjunto de normas que dispõem sobre determinada matéria, ou seja, ela é origem,
a fonte primária sobre um determinado assunto.
Para refletir
Questões inseridas no decorrer do estudo a fim de que o aluno faça uma pausa
e reflita sobre o conteúdo estudado ou temas que o ajudem em seu raciocínio.
É importante que ele verifique seus conhecimentos, suas experiências e seus
sentimentos. As reflexões são o ponto de partida para a construção de suas
conclusões.
4
Organização do Livro Didático
Provocação
Textos que buscam instigar o aluno a refletir sobre determinado assunto antes
mesmo de iniciar sua leitura ou após algum trecho pertinente para o autor
conteudista.
Saiba mais
Sintetizando
Posicionamento do autor
Importante para diferenciar ideias e/ou conceitos, assim como ressaltar para o
aluno noções que usualmente são objeto de dúvida ou entendimento equivocado.
5
Introdução
Este livro didático destina-se aos alunos do curso de graduação a distância da Faculdade Unyleya e
apresenta uma introdução conceitual do campo da estatística e algumas aplicações. As aplicações
correspondem a problemas contextualizados que exigem a análise de certos dados apresentados
e a escolha de um método conveniente para tratá-los estatisticamente. Sendo assim, ao longo
de cada capítulo, serão discutidas, desenvolvidas e ampliadas algumas técnicas estatísticas, a
fim de, posteriormente, serem aplicadas em situações-problema. Vale ressaltar que as questões
apresentadas irão, constantemente, exigir que o estudante se posicione criticamente em relação a
elas, isto é, a partir de resultados estatísticos, o estudante deverá fornecer critérios para a tomada
de decisão na solução de problemas.
Apesar do forte caráter das aplicações, é importante lembrar que, em todos os momentos, o
rigor característico da linguagem matemática está presente, uma vez que um dos objetivos deste
livro é articular teoria e prática. Vale observar, ainda, que não existe preocupação de esgotar
por completo os conceitos abordados, embora estejam incluídas referências bibliográficas para
aqueles que assim desejarem.
Objetivos
6
CONCEITOS FUNDAMENTAIS
CAPÍTULO
1
Introdução do capítulo
Objetivos
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
Durante muito tempo a estatística foi vista apenas como gráficos e tabelas. Atualmente, no mundo
globalizado em que vivemos, a informação é de fundamental importância nas mais variadas
atividades profissionais como economia, agronomia, administração, biologia etc.
7
CAPÍTULO 1 • Conceitos fundamentais
Importante
A principal ferramenta para transformar uma massa de números (dados) em informações é exatamente a estatística.
As técnicas estatísticas são utilizadas para organizar, apresentar, analisar e interpretar dados. Embora a análise e a
interpretação de dados escape à noção de estatística, estas seriam, na verdade, o seu principal uso.
Como a estatística é uma ciência relativamente nova, muitos ainda não se deram conta da sua
importância para a vida moderna. Com os recentes avanços computacionais, a estatística tem
sido cada vez mais utilizada, pois muitas de suas técnicas envolvem cálculos cansativos que
hoje podem ser facilmente resolvidos por pacotes estatísticos (programas de computadores
específicos para estatística) disponíveis no mercado.
A estatística como ciência é uma área da matemática que, com base na teoria das probabilidades,
estuda métodos para a modelagem de fenômenos. A estatística básica usa os aleatórios, aqueles
fenômenos que produzem dados de observação, tais como temperatura média diária em uma
determinada região ou o índice de inflação mensal de certo país.
Como os fenômenos aleatórios permeiam as mais variadas áreas do conhecimento, esses métodos
usam a estatística como ferramenta na solução de problemas nessas áreas. Por isso, observa-se
que são raros os cursos de graduação que não incluem em sua grade curricular pelo menos uma
disciplina da área de estatística.
A estatística está dividida em duas grandes áreas: a sstatística descritiva e a inferência estatística.
A estatística descritiva é de extrema importância principalmente em pesquisa de levantamento de
dados, pois, diante de uma grande massa de dados (observações), coletados de um determinado
fenômeno (por exemplo, o preço de um produto em todos os supermercados da cidade),
precisa-se de procedimentos estatísticos para organizá-los de forma que este fenômeno possa
ser interpretado de maneira bastante clara.
Os métodos de inferência estatística são utilizados principalmente para tomar decisões diante
de incertezas que são inerentes aos fenômenos aleatórios. Embora já se disponha de métodos
estatísticos bem sofisticados, muitos problemas do nosso dia a dia podem ser resolvidos com a
estatística descritiva.
A estatística descritiva deve ser aplicada na coleta, organização e descrição dos dados, enquanto
que a inferência estatística auxilia na análise e interpretação dos dados.
8
Conceitos fundamentais • CAPÍTULO 1
Importante
É possível distinguir duas concepções para a palavra ‘estatística’: no plural (estatísticas), indica qualquer coleção de
dados numéricos, reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer. No singular
(estatística), indica a atividade humana especializada ou um corpo de técnicas, ou ainda uma metodologia desenvolvida
para coleta, classificação, apresentação, análise e interpretação de dados quantitativos e utilização desses dados para a
tomada de decisões.
A Éstatística é uma parte da matemática que fornece métodos para a coleta, organização, descrição, análise e
interpretação de dados, viabilizando a utilização deles na tomada de decisões
População e amostra
Como exemplo, suponha que queremos estudar o perfil sócio-econômico dos estudantes
universitários da cidade de Manaus. Então, o fenômeno em estudo é o perfil sócio-econômico
dos universitários da cidade de Manaus e a população é formada por todos os estudantes
universitários da cidade de Manaus, ou seja, estudantes matriculados nas universidades e
faculdades localizadas na cidade de Manaus.
Amostra é uma parte da população, selecionada de maneira criteriosa, para efetivamente fornecer
os dados para o estudo.
População
Amostra
Fonte: https://www.shutterstock.com/g/Bakhtiar+Zein?searchterm=Popula%C3%A7%C3%A3o%20e%20amostra.
Uma amostra representativa de uma população pode ser obtida escolhendo-se aleatoriamente
os elementos que irão compor a amostra e isso nos permite fazer inferências sobre a população.
9
CAPÍTULO 1 • Conceitos fundamentais
No exemplo acima, a amostra é formada por parte dos estudantes universitários da cidade de
Manaus.
Atenção
Duas observações:
A primeira é que devemos usar procedimentos estatísticos para determinar o tamanho da amostra, ou seja, quantos
elementos devem ser selecionados para fazer parte da amostra.
A segunda é utilizar o método de amostragem (amostragem aleatória simples, amostragem estratificada, amostragem
por conglomerado etc...) mais adequado para os objetivos do levantamento.
Em geral a realização de um censo demanda muito tempo e alto custo, daí o Brasil fazer o censo
a cada dez anos. O censo se torna viável quando a população é pequena e é fácil o acesso aos
seus elementos.
Atenção
Se o nosso interesse está voltado para certa variável de determinado grupo de elementos, ela pode ser classificada
em:
Qualitativa, isto é, quando resulta de uma classificação por tipos ou atributos. Sendo assim, pode ser:
Quantitativa, isto é, quando os seus valores indicam quantidades. Dessa forma, a variável pode ser:
» discreta - quando seus possíveis valores formam um conjunto enumerável, finito ou infinito, como, por exemplo,
número de peças defeituosas, número de filhos ou número de carros;
» contínua - quando assume qualquer valor dentro de um intervalo de variação, como, por exemplo, peso, altura,
tempo ou renda.
10
Conceitos fundamentais • CAPÍTULO 1
Por outro lado, uma variável quantitativa representa uma quantidade e seus valores são numéricos.
Podem ser subdivididas em quantitativa discreta, quando seus valores são pontos sobre a reta,
geralmente resultado de uma contagem, ou quantitativa contínua, quando seus valores estão
em um intervalo da reta, geralmente resultado de uma medida.
Fonte: https://marketinganalitico.com.br/marketing-e-estatistica-variaveis/
Exemplos:
Variáveis quantitativas discretas - número de filhos por família (0, 1, 2, ...); pontos na Carteira
Nacional de Habilitação (0, 7, ..., 20).
11
CAPÍTULO 1 • Conceitos fundamentais
Tipos de dados
Todos os dados (e, por conseguinte, as variáveis que medimos) podem ser classificados
como um dos dois tipos gerais: quantitativo ou qualitativo.
Exemplo 1: a temperatura (em graus Celsius) em que cada unidade em uma amostra de
25 peças plásticas resistentes ao calor começa a derreter; a atual taxa de desemprego
de cada um dos estados brasileiros da região Sudeste; o salário dos administradores
empregados em multinacionais; o número de mulheres executivas empregadas em cada
uma das amostras de 75 empresas de manufatura.
Quanto aos dados qualitativos, são mensurações que não podem ser medidas em uma
escala numérica natural. Eles só podem ser classificados em grupo de categorias, ou seja,
podem apenas ser classificados em categorias.
Coleta de dados
Atenção
Na realização de estudos dessa natureza é quase impossível observar todos os elementos da população em estudo,
principalmente devido ao tempo e custo operacional. Portanto, tendo que trabalhar com uma amostra, deve-se
escolher a estatística básica usando uma amostra que seja representativa da população, ou seja, uma cópia o mais fiel
possível da população. Assim, escolhendo-se criteriosamente as unidades amostrais, teremos segurança para usar a
inferência estatística e generalizar os resultados obtidos na amostra para a população.
Fontes de dados
Os dados a serem coletados podem estar previamente armazenados em algum lugar ou podem
ser gerados pelo próprio pesquisador. As fontes de dados podem ser secundárias e primárias.
12
Conceitos fundamentais • CAPÍTULO 1
Fontes secundárias: são bancos de dados ou arquivos previamente existentes, onde estão
armazenadas as informações que serão utilizadas no levantamento, ou seja, os dados já existem e o
pesquisador irá lançar mão deles para desenvolver seu estudo. As fichas de cadastro de estudantes
ou de clientes de uma loja de departamentos são exemplos de fonte de dados secundária.
Fontes primárias: dizemos que a fonte é primária quando o próprio pesquisador gera a
informação. As fontes primárias mais utilizadas são a observação direta do fenômeno, que é
um método clássico na pesquisa científica, e o questionário que é o instrumento de pesquisa
do levantamento de dados.
Atenção
13
CAPÍTULO 1 • Conceitos fundamentais
Para refletir
O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística para avaliar
criticamente dados e inferências. É fundamental para o processo que exista variação na população e no processamento
de dados.
Gestores de sucesso confiam muito no uso do pensamento estatístico para ajudá-los a tomar
decisões. O fluxograma da figura 3, mostra o papel da estatística na tomada de decisão.
Cada problema de tomada de decisão inicia-se no mundo real. Esse problema é, então, formulado
em termos gerenciais e estruturado como uma questão gerencial. Os próximos passos (seguindo
o fluxograma no sentido anti-horário) identificam os papéis que a estatística pode representar
nesse processo. Os problemas gerenciais são traduzidos para problemas estatísticos, os dados
da amostra são coletados e analisados, e a questão estatística é respondida. O próximo passo
14
Conceitos fundamentais • CAPÍTULO 1
é usar a resposta para resolver o problema gerencial. A resposta para o problema gerencial
pode sugerir uma reformulação do problema original, uma nova questão ou levar à solução do
problema gerencial.
Sintetizando
» O conceito de estatística.
» Os quatro elementos dos problemas estatísticos descritivos: identificar a população ou amostra, identificar as variáveis,
coletar dados e descrever os dados.
» A caracterização dos tipos de dados: quantitativos (de natureza numérica) e qualitativos (de natureza categórica).
15
DISTRIBUIÇÃO DE FREQUÊNCIAS
CAPÍTULO
2
Introdução do Capítulo
Caro discente, agora que você já aprendeu como coletar os dados, no capítulo 2 estudará algumas
técnicas estatísticas para organizar esses dados em tabelas. Você verá que para cada tipo de
variável, qualitativa ou quantitativa, existe uma tabela adequada para apresentar os dados.
Objetivos
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
Variáveis qualitativas
Uma vez coletados os dados, precisamos ter familiaridade com eles e, portanto, é necessário
organizá-los de maneira que essa massa de dados se transforme em informações a respeito do
fenômeno que está sendo estudado.
Ou seja, nosso objetivo neste capítulo é organizar e apresentar os dados em tabelas, de modo a
facilitar o seu manuseio e entendimento do fenômeno.
Classificação simples
Para organizar as observações (dados) de uma variável qualitativa, construímos uma tabela a
partir do conjunto de valores observados. Em uma coluna registramos as categorias da variável
16
Distribuição de frequências • CAPÍTULO 2
e em outra coluna a frequência de cada categoria. Por exemplo, suponha que 50 candidatos
ao vestibular de 2019, tenham respondido a um questionário com a pergunta, qual o grau de
instrução do seu pai? As respostas codificadas são:
3 3 2 2 3 1 3 4 4 2 2 1 4 2 3 2 3 3 3 3 3 2 2 3 1
3 3 3 3 1 1 2 3 2 3 3 2 3 2 3 2 2 2 3 3 3 3 3 3 3
Título - o título explica o que contém a tabela. Compõe-se da referência (tipo de elemento e
número), da descrição do conteúdo e da data de referência.
Corpo - o corpo é formado pelas linhas e colunas de dados da tabela. É a parte da tabela que
contém os dados e informações.
Cabeçalho - o cabeçalho da tabela é a primeira linha. É a parte superior da tabela que especifica
o conteúdo das colunas. Pode ser constituído de um ou vários níveis.
Coluna indicadora - a coluna indicadora é primeira coluna, especifica o conteúdo das linhas.
Classificação dupla
As informações contidas na tabela 1 podem ser mais detalhadas. Por exemplo, a informação
sobre o grau de instrução dos pais, pode ser informada por sexo ou pelo curso que o
candidato escolheu. Ou seja, podemos construir uma tabela com duas entradas ou dupla
classificação.
17
CAPÍTULO 2 • Distribuição de frequências
Utilizando o exemplo anterior, suponha que no conjunto dos 50 candidatos acima, 30 são do
sexo masculino e 20 do sexo feminino, além disso, 10 candidatos escolheram a área de ciências
exatas, 25 escolheram ciências humanas e 15 escolheram ciências biológicas. Esses dados agora
podem ser apresentados como nas tabelas a seguir:
Frequência
Grau de Instrução Total
Masculino Feminino
Nenhum 3 2 5
Fundamental 5 10 15
Médio 14 13 27
Superior 2 1 3
Total 24 26 50
Note que a coluna da direita contém o total das frequências relativas à variável grau de instrução.
Tais frequências são distribuídas no corpo da tabela conforme as categorias da outra variável de
classificação. Na tabela 2 a variável sexo e na tabela 3 a variável área escolhida. Vejamos:
Tabela 3. Grau de instrução do pai do candidato pela área escolhida, Vestibular 2019.
Frequência
Grau de Instrução Total
Biológicas Exatas Humanas
Nenhum 1 1 3 5
Fundamental 3 4 8 15
Médio 5 8 14 27
Superior 2 0 1 3
Total 11 13 26 50
Variáveis quantitativas
No caso de variável quantitativa discreta, quando existem poucos valores diferentes da variável,
construímos uma tabela semelhante à tabela 1, apenas colocando na coluna indicadora os
diferentes valores da variável. Por exemplo, se fosse perguntado aos candidatos, qual o número
de filhos na sua família, poderíamos ter o resultado apresentado na tabela 4.
18
Distribuição de frequências • CAPÍTULO 2
Quando existe um grande número de valores diferentes para a variável discreta, ou se a variável
quantitativa é contínua, construímos uma tabela de distribuição em classes de frequências.
Dados brutos
Os dados, na forma como são coletados, são chamados de dados brutos. Depois de ordenados,
em ordem crescente ou decrescente, são chamados de rol. Por exemplo, suponha que coletamos
a idade de cinquenta estudantes do curso de administração, cujos valores são apresentados a
seguir:
Dados Brutos
19 22 19 21 25 26 24 23 28 19
17 20 18 23 29 18 18 20 20 22
26 18 20 27 24 19 20 19 24 17
20 19 17 28 22 19 25 20 22 20
18 18 27 23 19 25 19 24 23 20
Dessa forma (dados brutos), temos dificuldade, por exemplo, de verificar qual a maior idade
no grupo ou qual a idade do estudante mais jovem. Essas questões são facilmente respondidas
quando dispomos os dados, por exemplo, em ordem crescente como segue:
Rol
17 17 17 18 18 18 18 18 18 19
19 19 19 19 19 19 19 19 20 20
20 20 20 20 20 20 20 21 22 22
19
CAPÍTULO 2 • Distribuição de frequências
22 22 23 23 23 23 24 24 24 24
25 25 25 26 26 27 27 28 28 29
Agora é simples verificar que o estudante mais jovem no grupo tem 17 anos, assim como o mais
velho tem 29 anos.
Esses dados podem ser organizados numa tabela de distribuição em classes de frequências.
Importante
Com os dados do exemplo anterior, vamos construir uma tabela de distribuição em classes de
frequências para a variável idade dos estudantes. Inicialmente observamos que a menor idade é
17 anos e a maior idade é 29 anos, portanto, estes dados têm uma amplitude de 13 anos, vejamos:
Amplitude total = At = maior valor – menor valor = 29 – 17 = 13.
Escolhendo k = 6 classes (e é uma escolha), cada classe deve ter o comprimento aproximado de
At 13
h
= = ≅ 2,16 .
k 6
Para facilitar os cálculos e respeitar a segunda regra, podemos usar h = 2 e como limite inferior
da primeira classe o valor 16. Logo as seis classes de idade são: 16 a 18, 18 a 20, 20 a 22, 22 a 24,
24 a 26 e 26 a 28. Como o maior valor é 29, devemos aumentar mais uma classe para respeitar a
segunda regra, a última classe será 28 a 30.
Tabela 5. Distribuição em classes de frequências para a variável idade.
15
18 20
20 22 10
8
22 24
24 26 7
26 28 4
3
28 30
Total 50
20
Distribuição de frequências • CAPÍTULO 2
As classes são fechadas à esquerda e abertas à direita, isto significa que a idade 18 anos pertence
à segunda classe e não à primeira. Por fim, contamos a frequência de cada classe.
Observe que na classe de 16 a 18, encontra-se três vezes a idade 17 anos. Portanto, a primeira
classe tem frequência igual a 3. Para a segunda classe verificamos que aparecem seis vezes a
idade de 18 anos e nove vezes a idade 19 anos, logo, a segunda classe tem frequência igual a 15.
E assim por diante, até a última classe que tem frequência 3, pois os valores correspondentes à
classe 28 a 30 são as idades 28, 28 e 29 anos.
Atenção
18 20 19 15 18 0,30 0,36
20 22 21 10 28 0,20 0,56
22 24 23 8 36 0,16 0,72
24 26 25 7 43 0,14 0,86
26 28 27 4 47 0,08 0,94
28 30 29 3 50 0,06 1,00
Total 50
Saiba mais
21
CAPÍTULO 2 • Distribuição de frequências
Ponto médio da classe (Xi): É o valor que representa todas as observações da classe. É calculado
como sendo a média dos limites da classe. Sendo assim, para a quarta classe temos:
22 + 24
=X4 = 23
2
F4 = 8
Frequência acumulada (Fi): É a soma das frequências absolutas até a i-ésima classe. Para a quarta
classe, temos:
F4 = F1 + F2 + F3 + F4 = 3 + 15 + 10 + 8 = 36
f4 8
fr=
4 = = 0,16
n 50
F4 36
Fr=
4 = = 0, 72
n 50
Fr4 = Fr1 + Fr2 + Fr3 + Fr4 = 0,06 + 0,30 + 0,20 + 0,16 = 0,72
Apresentação gráfica
Um gráfico deve levar a uma rápida compreensão do fenômeno apresentado e possibilitar uma
correta interpretação dos seus valores. Ele auxilia bastante a apresentação de dados estatísticos
facilitando a sua compreensão.
22
Distribuição de frequências • CAPÍTULO 2
Importante
Um gráfico deve apresentar título e escala. O título deve ser colocado acima do gráfico e descrito como figura. As
escalas devem crescer da esquerda para a direita e de baixo para cima. As legendas explicativas, quando houver
necessidade, devem ser colocadas, de preferência, à direita do gráfico.
Gráfico de pontos
23
CAPÍTULO 2 • Distribuição de frequências
Gráfico de setores
O gráfico de setores é utilizado em geral para variáveis qualitativas. Ele é construído dividindo-
se o círculo em setores, cada um correspondendo, de forma proporcional, à frequência simples
24
Distribuição de frequências • CAPÍTULO 2
ou relativa de uma das categorias da variável. O grau de instrução do pai do candidato está
representado no gráfico de setores, que também pode ser chamado de pictórico, da figura abaixo:
Histogramas
Os histogramas podem ser usados para mostrar tanto a frequência absoluta quanto a frequência
relativa das medidas em cada intervalo de classes. No histograma, os valores numéricos da variável
quantitativa estão divididos em intervalos de classe de mesma largura. Esses intervalos formam
a escala do eixo horizontal. A frequência absoluta ou relativa das observações em cada intervalo
de classe é determinada por uma barra vertical posicionada sobre cada intervalo de classe, cuja
altura corresponde à frequência absoluta ou relativa do intervalo de classe em questão.
Importante
O primeiro é a porção da área total abaixo do histograma que fica sobre um intervalo particular do eixo horizontal,
que é igual à frequência relativa de medidas no intervalo.
O segundo é que se pode imaginar a aparência do histograma da frequência relativa para um conjunto de dados
muito grande (uma população).
25
CAPÍTULO 2 • Distribuição de frequências
Enquanto os histogramas proporcionam uma melhor descrição visual dos grupos de dados
(particularmente grupos muito grandes), eles não permitem identificar medidas individuais. Mas
cada uma das medidas originais é visível de alguma forma em um gráfico de pontos e claramente
visíveis em um gráfico de ramo e folhas.
Sintetizando
1. Como descrever dados qualitativos, isto é, identificar classes de categorias, determinar as frequências absolutas e
relativas das classes e representar tais frequências em gráficos de barras e gráficos de pizza.
2. Como descrever dados quantitativos, ou seja, identificar classes de categorias, determinar as frequências absoluta e
relativa das classes e representar tais frequências em gráficos de pontos, de ramos e folhas e em histogramas.
26
CAPÍTULO
MEDIDAS ESTATÍSTICAS 3
Introdução do capítulo
Este capítulo apresenta conceitos e métodos para obter medidas de tendência central e medidas
de variabilidade, bem como critérios para interpretar o significado dessas medidas.
Objetivos
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
Nesta seção, o objetivo é apresentar medidas numéricas descritivas da amostra a fim de fazer
inferências sobre medições correspondentes da população. Existem muitos métodos numéricos
para descrever conjuntos de dados quantitativos. A maior parte deles mede uma de duas
características:
Média aritmética
27
CAPÍTULO 3 • Medidas estatísticas
aritmética, afinal, para ser aprovado numa disciplina você precisa obter média maior
ou igual a cinco. Notação: x.
Ou seja:
∑
n
x
i =1 i
X=
n
Atenção
n
O símbolo ∑ =1
i=1
xi
significa o somatório dos números xi, com i variando de 1 a n.
Exemplo: digamos que o professor Sirlei tenha realizado cinco testes e você tenha tirado as
seguintes notas: 10, 2, 9, 6 e 8, respectivamente.
10 + 2 + 9 + 6 + 8
=X = 7
5
Como calcular a média de dados agrupados
Quando agrupamos os dados, calculamos a média ponderada onde cada valor x¬ tem peso igual
a sua frequência fi¬, ou seja,
1 k f1 X 1 + f 2 X 2 +… f k X k
=X = ∑ fi X i
n i =1 n = ∑ i =1 fi
k
0 . 5 +1 . 26 + 2 . 9 +3 . 5 +4 . 3 + 5 . 2 81
X
= = = 1, 6
50 50
Observe que a média pode não ser um dos valores encontrados na amostra, como também
não temos 1,6 filhos. Este valor, que chamamos de média, representa o centro da distribuição
do número de filhos por família, é como o centro de massa de um corpo na física, é o ponto de
equilíbrio.
17 . 3 +19 . 15 + 21 . 10 + 23 . 8 + 25 . 7 + 27 . 4 + 29 . 3 1100
X
= = = 22
50 50
Sendo assim, conclui-se que os estudantes do curso de administração apresentam uma média
de 22 anos de idade.
28
Medidas estatísticas • CAPÍTULO 3
Mediana (Md)
A mediana é o valor que ocupa a posição central de uma série de n observações ordenadas.
A mediana divide um conjunto de dados no meio, deixando 50% dos dados abaixo dela e 50%
dos dados acima. O cálculo da mediana depende do número n de observações.
Importante
Se n é ímpar, a mediana é o valor que ocupa a posição central dos dados ordenados. Ou seja, é aquele valor que ocupa
n +1
a posição 2 . Vejamos: no caso das notas de estatística, os valores ordenados são 2, 6, 8, 9, 10. Neste caso, n = 5, a
posição central é a 3ª observação cujo valor é 8, logo, 8.
Se n é par, a mediana será a média dos termos centrais dos dados ordenados. Ou seja, a mediana será a média entre os
n n +1
valores que ocupam as posições e . Sendo assim, voltando ao caso das notas de estatística e considerando seis
2 2
notas, se as notas ordenadas são 2, 5, 6, 8, 9, 10, então a mediana será a média entre o 3º e o 5º termos, cujos valores são 6
e 8, respectivamente.
Portanto a mediana é dada por Md = 6 + 8 = 7
2
Se os dados estão agrupados, o procedimento de cálculo da mediana não se altera. Logo, basta
conferir que os valores já estão ordenados e a posição da mediana é encontrada pela frequência
acumulada.
Neste caso, sendo n = 50 um número par, a mediana será a média entre os valores que ocupam
n n
as posições 2 o
+ 1
o
e , isto é, o 25º e 26º elementos. Observe pela frequência acumulada que,
2
do 1º ao 5º elemento, todos são iguais a zero, do 6º ao 31º, todos são iguais a 1 e portanto, o 25º
1+1
e 26º elementos são iguais a 1 e assim a mediana será dada por Md
= = 1 . Assim, a mediana
2
é 1 filho por família.
29
CAPÍTULO 3 • Medidas estatísticas
Importante
Quando os dados estão distribuídos em classes de frequências, como na tabela 8, o procedimento muda totalmente.
n
Primeiro calculamos a posição da mediana, Pos ( Md ) = . Em seguida, pela frequência acumulada, determinamos a
2
classe mediana, que é a classe que contém a mediana. E por fim calculamos a mediana como segue:
Md= li +
( Pos ( Md ) − Fi − i ) x h , onde,
fi
li: é o limite inferior da classe mediana;
Fi - 1 é a frequência acumulada da classe anterior à classe mediana;
fi é a frequência simples da classe mediana;
h é o intervalo de classe.
Número de filhos Xi fi Fi
16 18 17 3 3
18 20 19 15 18
20 22 21 10 28
22 24 23 8 36
24 26 25 7 43
27 4 47
26 28
28 30 29 3 50
Total 50
Como exemplo, vamos calcular a mediana para a variável idade com os dados da tabela 8. Neste
caso, Pos ( Md=) 50
= 25 . Pela coluna de frequência acumulada, verificamos que o 25º elemento está
2
na classe 20 a 22 anos, ou seja, a terceira classe é a classe mediana. Portanto a mediana é dada por:
Md =
li +
( Pos ( Md ) − Fi − i ) x h =
20 +
( 25 − 18) x 2 =
21, 4
fi 10
Portanto, para este conjunto de idades de estudantes do curso de administração, a idade mediana
é 21,4 anos.
Moda Mo
A moda é o valor que ocorre com maior frequência em um conjunto de dados. Por exemplo,
considere que dez alunos realizaram um teste de estatística obtendo as seguintes notas: 5, 4, 4, 6,
3, 6, 3, 1, 7 e 2. Neste caso, a nota que aparece mais vezes é a nota 3, portanto, para esse conjunto
de notas a moda é 4. Mo = 4
Observação:
30
Medidas estatísticas • CAPÍTULO 3
Mo = 6 e Mo = 10
A moda para dados agrupados como na tabela 7 é simplesmente o valor de maior frequência
simples. Neste caso, a moda vale Mo = 1, pois o valor 1 tem a maior frequência simples que é
igual a 26.
Quando os dados estão agrupados em classes de frequências, a moda pode ser calculada pelo
seguinte método: primeiro determinamos a classe modal, aquela que apresenta a maior frequência
∆1
simples; depois, empregamos a fórmula, Mo= li + x h , onde:
∆1 + ∆ 2
Por exemplo, para calcular a moda para os dados da tabela 8, observamos inicialmente que a
classe modal é a segunda classe, cujas idades vão de 18 a 20 anos.
∆1 12
Mo =li + x h =18 + x 2 =18 + 1, 4 =19, 4
∆1 + ∆ 2 12 + 5
Para descrição adequada de um fenômeno, não basta saber o valor em torno do qual os dados
estão variando, é necessário saber o grau de variabilidade dos dados. Isto é conhecido por meio
das medidas de dispersão. As medidas de variabilidade ou medidas de dispersão que vamos
calcular são: amplitude, variância, desvio padrão e coeficiente de variação.
31
CAPÍTULO 3 • Medidas estatísticas
Amplitude
Vale lembrar que a amplitude é de fácil cálculo e compreensão, mas é uma medida não muito
apropriada de variação de dados quando os conjuntos de dados são muito grandes. Isso porque
dois conjuntos de dados podem ter a mesma amplitude, mas serem diferentes no que diz respeito
à variação dos dados.
A variância, assim como o desvio padrão, são medidas que complementam a informação das
medidas de posição. Para calcular essas medidas de variabilidade, consideramos os desvios de
cada observação em relação à média aritmética, ou seja, Xi – X. Em seguida calculamos a média
dos quadrados dos desvios.
Assim, para um conjunto de valores X1, X2, X3, ..., Xn, a variância, denotada por S2, é calculada
como segue:
∑ (X −X)
n 2
i
S2 = i =1
n −1
Como a variância é uma medida quadrática, sua unidade de medida é o quadrado da unidade de
medida dos dados. Portanto, devemos trabalhar com a raiz quadrada positiva da variância, que
está na mesma unidade de medida dos dados. Esta medida é o desvio padrão, que é denotado
por S, dado por:
∑ (X −X)
n 2
2 i
=S S
= i =1
n −1
Exemplo: voltamos ao exemplo do professor de estatística que realizou cinco testes nos quais
você tirou as seguintes notas: 10, 2, 9, 6 e 8, respectivamente. Neste caso a sua média foi:
1 n 10 + 2 + 9 + 6 + 8
=X = ∑
n i =1
Xi
5
= 7
32
Medidas estatísticas • CAPÍTULO 3
( X − X ) (10 − 7 ) + ( 2 − 7 ) + ( 9 − 7 ) + ( 6 − 7 ) + (8 − 7 )
2
∑
n 2 2 2 2 2
2 i
=S = i =1
n −1 5 −1
3 + ( −5 ) + 2 + ( −1) + 1 9 + 25 + 4 + 1 + 1 40
2 2 2 2 2
= = = = 10
4 4 4
S
= S2
= 10 ≅ 3, 2
Quando os dados estão agrupados, cada valor Xi¬ tem sua frequência correspondente. Neste
caso a variância e o desvio padrão são dados, respectivamente, por:
∑ (X −X) ∑ (X −X)
n 2 n 2
2 i 2 i
= i 1= i 1
S= → S= S=
n −1 n −1
Por exemplo, para os dados da tabela 9, vamos determinar a variância e o desvio padrão do
número de filhos por família. Já vimos que para estes dados a média foi X = 1,7.
Usando as informações da última coluna da tabela 9 para calcular a variância e desvio padrão
temos:
fi ( X i − X )
2
∑
n
2 74,10
S= i =1
= ≅ 1,51 → S= S 2= 1,51 ≅ 1, 2
n −1 49
Quando os dados estão agrupados em classes de frequências, cada valor Xi¬ será o ponto médio
da classe. Para os dados da tabela 10, já calculamos a média de idade X = 22 anos.
33
CAPÍTULO 3 • Medidas estatísticas
fi ( X i − X )
2
∑
n
538
S 2= i =1
= ≅ 10,98anos 2 → S= S 2= 10,98 ≅ 3,31 anos
n −1 49
Coeficiente de variação
O desvio padrão, quando analisado individualmente, tem limitações. Por exemplo, um desvio
padrão S = 2, pode ser considerado pequeno, ou insignificante para uma série de valores cuja
média é X = 200, mas se a média for X = 20, esse desvio padrão já é bastante significativo.
Por isso, muitas vezes é conveniente usar uma medida de dispersão relativa para expressar a
variabilidade de um conjunto de dados.
Nesses casos, usamos o coeficiente de variação (CV) comparando o desvio padrão com a média,
ou seja, calculamos CV = S .
X
Como o desvio padrão e a média são expressos na mesma unidade de medida dos dados, o
coeficiente de variação é uma medida de dispersão relativa adimensional e, portanto, o resultado
S
desta divisão deve ser multiplicado por 100 e expresso em porcentagem, isto é, CV = .100 .
X
Exemplo: suponha que para os cinquenta estudantes do curso de administração, foram também
determinadas as alturas de cada um. A média e o desvio padrão das alturas de homens e mulheres
estão na tabela 11.
34
Medidas estatísticas • CAPÍTULO 3
Homens: S 8
= CV = .100 = .100 0, 0437= .100 4,37%
X 133
S 8
Mulheres:
= CV = .100 = .100 0, 0437
= .100 4,37%
X 133
No exemplo acima, para esses conjuntos de dados de altura de estudantes, as mulheres apresentam
menor dispersão relativa. Concluímos, portanto, que, embora as mulheres sejam mais baixas
que os homens, as alturas das mulheres são mais homogêneas.
Sintetizando
35
CAPÍTULO
PROBABILIDADE 4
Introdução do capítulo
Este capítulo apresenta métodos e conceitos combinatórios, que consistem no estudo de situações
em que a contagem se reduz, a saber, a quantas maneiras determinado grupo de objetos pode
ser escolhido, sem e com repetições em relação à ordem em que são selecionados. Tais situações
envolvem o desenvolvimento de competências como o planejamento de estratégias na resolução
de problemas, a divisão de problemas em casos, a análise envolvendo números pequenos
levando à generalização, e a crítica dos resultados obtidos. Essas técnicas, muitas vezes, serão
aplicadas em outros tipos de situações-problema, cujo objetivo é investigar qual é a chance de
um evento ocorrer, isto é, obter um número que indica a frequência relativa de ocorrência de
um evento. Obter as chances de determinado evento ocorrer permite, racionalmente, tomar
decisões prevendo eventos futuros.
Objetivos
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
36
Probabilidade • CAPÍTULO 4
Probabilidades
Os fenômenos estudados pela estatística são aqueles cujo resultado, mesmo em condições
normais de experimentação, varia de uma observação para outra, dificultando dessa maneira a
previsão de um resultado.
Para refletir
A probabilidade teve sua origem por volta do século XVII, devido à curiosidade de um cavaleiro, o Chevalier de Méré,
que era muito apaixonado por jogos e, um dia, discutiu com um matemático chamado Blaise Pascal (1654) sobre as
possibilidades de ganhar em jogos com cartas, despertando no matemático um imenso interesse pelo assunto. Então,
Pascal escreveu uma carta para um amigo, também matemático, chamado Pierre de Fermat expondo o problema do
Chavalier de Méré. Para Fermat, o assunto era algo novo e desconhecido. Após a carta do amigo, ele começou a estudar
formas de descrever matematicamente as leis do acaso com maior precisão. Os amigos continuaram se comunicando
por meio de cartas, compartilhando cada nova descoberta. Fermat não tinha um real comprometimento em aprimorar
probabilidade, ele respondia às cartas de Pascal, e resolvia os problemas que o amigo enviava, o que era apenas uma
curiosidade relacionada com jogatinas e apostas. A prova disso pode ser vista em um problema proposto a ele por
Pascal.
O problema dizia o seguinte: “uma pessoa quer tirar seis no dado em oito jogadas, suponhamos que ela tenha feito três
tentativas e falhado, quanto de dinheiro ela poderia apostar em seu sucesso, ou seja, tirar um seis, na quarta jogada?”
1
O problema foi resolvido por Fermat da seguinte forma: a chance de se tirar um seis em um dado é de portanto o
1 6
apostador apostaria do dinheiro disponível para as apostas. Se ele falhar e tiver que jogar o dado uma segunda vez,
6 1
sua chance de tirar um seis ainda é de 6 , e o apostador deve apostar 1 do dinheiro que lhe sobrou da primeira aposta,
1 6
isso daria 6 do total do dinheiro, e assim por diante.
125
Respondendo à questão inicial, a quarta aposta seria de 1296 do dinheiro total.
37
CAPÍTULO 4 • Probabilidade
Importante
» lançamento de um dado;
» não se conhece em particular o valor do experimento a priori, porém, pode-se descrever todos os possíveis resultados –
as possibilidades;
» quando o experimento for repetido um grande número de vezes, surgirá uma regularidade.
Para melhor entendimento desta unidade, é interessante relembrar alguns conceitos básicos no
estudo das probabilidades tais como:
Espaço amostral
38
Probabilidade • CAPÍTULO 4
S = { (c, r), (c, c), (r, c), (r, r)} (é composto de oito eventos)
Importante
O complemento de um evento é constituído de todos os resultados no espaço amostral que não façam parte do evento.
Os eventos são mutuamente excludentes, quando não têm elemento em comum, ou se não podem ocorrer
simultaneamente.
Exemplo: na extração de uma só carta, os eventos “a carta é de copas” e a “carta é de ouros” são
mutuamente excludentes, porque uma carta não pode ser ao mesmo tempo de copas e de ouros.
Já os eventos “a carta é de copas” e “a carta é uma figura” não são mutuamente excludentes,
porque algumas cartas de copas são também figuras.
Muitas vezes, é útil representar graficamente um espaço amostral, porque isso torna mais fácil
visualizar os elementos.
39
CAPÍTULO 4 • Probabilidade
Os eventos A e B não são mutuamente excludentes, pois têm alguns elementos em comum.
40
Probabilidade • CAPÍTULO 4
=s {e1 , e2 , e3 ,…en }
I) Reunião – A ∪ B – O evento reunião é formado pelos pontos amostrais que pertencem a pelo
menos um dos eventos.
A ∪ B = {e1 ∈ S |, e1 ∈ Aou e1 ∈ B}
II) Interseção – A ∩ B – O evento interseção é formado pelos pontos amostrais que pertencem
simultaneamente aos eventos A e B.
A ∩ B = {e1 ∈ S |, e1 ∈ Aou e1 ∈ B}
41
CAPÍTULO 4 • Probabilidade
Portanto, probabilidade de A:
P(Ω) = 1;
P(∅) = 0;
Se A ∩ B = ∅ então P ( A =
B ) P=
( A) P ( A) + P ( B ) .
Exemplo 1:
Uma urna contém dez bolas numeradas de 1 a 10. Retira-se, ao acaso, uma bola dessa
urna. Qual a probabilidade de se obter uma bola cujo número inscrito é múltiplo de 3?
Solução:
Evento: A = {3, 6, 9}
42
Probabilidade • CAPÍTULO 4
#A 3
( A) P=
Logo: P= ( A) =
# Ω 10
Exemplo 2:
Solução: podemos construir uma árvore de possibilidades, em que as três colunas representem
os possíveis resultados dos três lançamentos. Isto é:
Logo, #Ω = 8.
Daí: #A = 3
43
CAPÍTULO 4 • Probabilidade
Portanto:
#A 3
P ( A )= = = 37,5%
#Ω 8
Daí: #B = 7
Portanto:
#B 7
P ( B=
) = = 87,5%
#Ω 8
Espaços de probabilidade
2. P(∅) = 0, P(Ω) = 1;
P( A ) = 1 – P(A).
Exemplo 3:
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei?
Solução:
44
Probabilidade • CAPÍTULO 4
Considere:
A: saída de um rei
Então:
4 13
P ( A)
= = e P ( B)
52 52
Portanto:
4 13 1 16
P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) = + − = ≅ 0,3769%
52 82 52 82
Probabilidade condicional
Por exemplo, a probabilidade de que uma pessoa venha a contrair HIV dado que ele/ela
é um usuário de drogas injetáveis é uma probabilidade condicional.
Um terceiro exemplo, é uma frase que ocorrerá repetidamente neste material: ‘’Se a
hipótese nula for verdadeira, a probabilidade de se obter um resultado como este é ...’’.
Aqui a palavra se substitui à expressão ‘dado que’, mas o sentido é o mesmo.
A
Com dois eventos, A e B, a probabilidade condicional de A dado B é denotada por P
Lixo . B
, por exemplo, P HIV
ou P
Usuário de drogas
Mensagem
Exemplo: frequentemente assumimos, com alguma justificativa, que a paternidade leva a
responsabilidade. Pessoas que passam anos atuando de maneira descuidadosa e irracional
de alguma forma parecem se tornar pessoas diferentes uma vez que elas se tornam pais,
mudando muitos dos seus antigos padrões habituais. Suponha que uma estação de
45
CAPÍTULO 4 • Probabilidade
rádio tenha amostrado 100 pessoas, 20 das quais tinham filhos. Eles observaram que 30
dessas pessoas usavam cinto de segurança, e que 15 daquelas pessoas tinham filhos. Os
resultaddos são mostrados na tabela abaixo:
Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral. Seja B um evento
desse espaço. Então:
n
B
P ( B ) = ∑P ( Ai ) . P
Exercício resolvido i −1 Ai
Uma urna contém três bolas brancas e duas amarelas. Uma segunda urna contém quatro bolas
brancas e duas amarelas. Escolhe-se, ao acaso, uma urna e dela retira-se, também ao acaso, uma
bola. Qual a probabilidade de que seja branca?
Probabilidade da urna escolhida ser a primeira (três bolas brancas e duas amarelas):
1
P=
2
Probabilidade de uma bola dessa urna ser branca:
46
Probabilidade • CAPÍTULO 4
Teorema Bayes
Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral W. Seja B ⊂ W. Sejam
conhecidas e , i = 1, 2, ..., n. Então:
P ( Ai ) . P ( B∣Ai )
=P ( Ai∣B ) = , j 1, 2, ..., n
∑ i =1 i( ) ( )
n
P A . P B∣Ai
Atenção
O Teorema de Bayes é também conhecido como Teorema da Probabilidade a Posteriori. Ele relaciona uma das parcelas
da probabilidade total com a própria probabilidade total.
Exercício resolvido
A urna A contém três bolas vermelhas e duas azuis, e a urna B contém duas bolas vermelhas e
oito azuis. Joga-se uma moeda honesta. Se a moeda der cara, extrai-se uma bola da urna A; se
der coroa, extrai-se uma bola da urna B. Uma bola vermelha é extraída. Qual a probabilidade de
ter saído cara no lançamento?
47
CAPÍTULO 4 • Probabilidade
P ( X ∩ Ai )
P ( Ai / X ) =
P( X )
P ( X ∩ Ai ) P ( X | Ai ) P ( Ai )
P ( Ai B )
= =
P( X ) P ( X | A1 ) P ( A1 ) + P ( X | A2 ) P ( A2 ) +…+ P ( X | An ) P ( An )
P ( X ∩ Ai )
=
∑ P ( X∣A1 ) P ( A1 )
n
i =1
Sendo assim:
3 1 3 3
x
3 20 60 3
) 3 15 22 1= 3 10 2 = 610
P ( Ca / V = = x = = = 0, 75 ou 75%
+ 2 10 8 80 4
x + x +
5 2 10 2 10 20 20
Probabilidade binomial
Considere um experimento com apenas dois resultados possíveis, chamados de sucesso e fracasso.
Vejamos:
» No lançamento de uma moeda não viciada, tome sucesso = cara e fracasso = coroa.
Considere o experimento aleatório: jogue um dado e observe o número mostrado na face de cima.
Nesse caso, o conjunto formado por todos os resultados possíveis do experimento é dado
por: Ω = {1, 2, 3, 4, 5, 6} (Espaço amostral).
48
Probabilidade • CAPÍTULO 4
Probabilidade de A= A= A 3 1
= =
Ω 6 2 1 3
No exemplo acima, segue que os valores de p são, respectivamente, 2 e 6 .
A partir de cada experimento apresentado no exemplo 4.9, pode-se estar interessado em repeti-
los um número fixo n de vezes. Supondo que a probabilidade p de sucesso se mantém constante
ao longo das provas e que as provas sejam independentes, surge a seguinte questão:
Teorema binomial
n k
p (1 − p )
n−k
k
Exercício resolvido
Joga-se uma moeda não viciada dez vezes. Qual a probabilidade de se obter exatamente cinco
caras?
Solução:
49
CAPÍTULO 4 • Probabilidade
No capítulo 2, vimos como calcular a média, a variância e o desvio padrão de uma amostra.
Agora,vejamos como isso pode ser feito com o auxílio do Excel.
Considere o seguinte conjunto de dados da figura abaixo contidos em uma planilha do Excel:
Para obter a média salarial dos funcionários, escolha a última célula pertencente à coluna Salário
mensal (R$) e, no menu principal, escolha o ícone fórmulas, isto é:
50
Probabilidade • CAPÍTULO 4
Agora basta escolher a função desejada, isto é, no caso da média, escolha MÉDIA. Assim, a média
salarial aparecerá calculada na célula selecionada. Analogamente, obtêm-se outros tipos de
médias, a mediana, a moda, a variância e o desvio padrão.
Sintetizando
» Como resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou o princípio multiplicativo.
» Como reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço amostral nessas
situações-problema.
» Como utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento.
51
CAPÍTULO
DISTRIBUIÇÃO DE PROBABILIDADE
DE VARIÁVEIS ALEATÓRIAS
DISCRETAS 5
Introdução do capítulo
Objetivos
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
Preliminares
A seguir, será apresentado o conceito de variável aleatória a fim de associá-lo aos resultados de
um experimento aleatório. Esse conceito estará relacionado a um número real que, juntamente
com a definição de função, permitirá calcular a probabilidade de ocorrência de vários eventos
correspondentes a esse experimento de forma mais simples e fácil.
Definição: uma variável aleatória é aquela que assume valores associados com resultados
aleatórios de um experimento, em que um (e apenas um) valor numérico é marcado para cada
ponto da amostra.
Chama-se variável aleatória discreta toda variável aleatória que pode assumir um número de
valores.
52
Distribuição de probabilidade de variáveis aleatórias discretas • CAPÍTULO 5
Exemplo de variáveis aleatórias discretas: o número de vendas feitas por um vendedor em uma
semana de trabalho: x = 0, 1, 2, 3, ...
Uma descrição completa de uma variável aleatória discreta requer as seguintes especificações:
Vale lembrar que são necessários dois requisitos para uma distribuição de probabilidades de
uma variável aleatória discreta X:
P ( x) ≥ 0∀ x
Σ P ( x) =
1
A média de uma variável aleatória discreta é o principal parâmetro de posição e indica informações
sobre o centro de sua distribuição de probabilidades.
Chama-se média ou valor esperado de uma variável aleatória discreta e representa-se, por ou
E(x), a seguinte soma:
= ( x)
µ E= ∑x p ( x )
i
i
53
CAPÍTULO 5 • Distribuição de probabilidade de variáveis aleatórias discretas
Importante
Esperado é um termo matemático e não deve ser interpretado como usualmente é aplicado. O valor esperado é a média
da distribuição de probabilidades ou uma medida de tendência central.
Exercício resolvido
João é funcionário de uma empresa de seguros e vendeu uma apólice de seguros de um ano por
US$10.000 com um prêmio anual de US$290. observando tabelas atuariais, verifica-se que a
probabilidade de morte durante o próximo ano para uma pessoa da idade, sexo, nível de saúde
do seu cliente é de 0,001. Qual o ganho esperado (quantidade de dinheiro feito pela empresa)
para uma apólice desse tipo?
Solução
Se o cliente vive, então o ganho é de R$ 290. Se o cliente morre, então o ganho é negativo, isto é,
igual a R$ (290 – 1.000) = - R$710.
µ E (=
= x) ∑xip (=
i
xi ) 290 . 0,999 + ( −710 ) . 0, 001
= US $ 280
Portanto, conclui-se que o valor esperado é dado da seguinte forma: se a empresa vender um
número grande de apólices de um ano de R$10.000 para clientes que possuem as características
descritas anteriormente, ela ganha um valor líquido (em média) de R$ 280 por venda no próximo
ano.
No caso das variáveis aleatórias discretas, pode-se também encontrar medidas de variabilidade.
54
Distribuição de probabilidade de variáveis aleatórias discretas • CAPÍTULO 5
VAR ( X )
= ∑x p ( x ) − µ
I
2
i I
2
O desvio padrão de uma variável aleatória discreta é igual à raiz quadrada da variância, isto é:
DP ( X ) = VAR ( X )
Problema resolvido
Um jogo consiste em lançar uma moeda. Se cair cara, ganham-se R$10,00 e, se cair coroa, perdem-
se R$5,00. Qual o lucro médio do jogo e qual a sua variância?
Solução
Coroa R$ 5,00
Portanto:
1 1
µ E ( x=
= ) ∑xip ( x=)
i
i
2
.10 + . ( −5=
2
) R$ 2,50
1 1
(X )
VAR= ∑x p ( x ) −=
I
2
i I µ 2
2 2
2,52 R$ 56, 25
100 . + 25 . − =
Problema resolvido.
55
CAPÍTULO 5 • Distribuição de probabilidade de variáveis aleatórias discretas
Soma = 02 : (1,1)
Soma = 06 : (1, 5); (2, 4); (3, 3); (4, 2); (5, 1)
Soma = 07 : (1, 6); (2, 5), (3, 4); (4, 3); (5, 2); (6, 1)
Soma = 08 : (2, 6); (3, 5); (4, 4); (5, 3); (6, 2)
Soma = 12 : (6, 6)
Temos que:
= ( x)
µ E= ∑x p=
(x )
i
i i
1 2 3 4 5 6 5 4 3 2 1 252
2. + 3. + 4. + 5. + 6. + 7. + 8. + 9. + 10. + 11. + 12. = = 7
36 36 36 36 36 36 36 36 36 36 36 36
Temos que:
VAR
= (X ) ∑x p ( x =
I
)−µ
2
i i
2
1 2 3 4 5 6 5 4
∑x p ( x ) = 2 . 36 + 3 . 36 + 4 . 36 + 5 . 36 + 6 . 36 + 7 . 36 + 8 . 36 + 9 . 36
I
2
i i
2 2 2 2 2 2 2 2
3 2 1 1974
+ 102. + 112. + 122. =
36 36 36 36
1974 2 1974
VAR =(X ) − 7 → VAR ( X ) = − 49 → VAR ( X ) =
5,833..
36 36
Logo; DP
= (X ) VAR
= (X ) 5,833 2, 415
=
56
Distribuição de probabilidade de variáveis aleatórias discretas • CAPÍTULO 5
Distribuição binomial
Exercício resolvido:
Em uma linha de produção, 10% das peças são defeituosas, e as peças são acondicionadas em
caixas com cinco unidades. Seja X a variável aleatória igual ao número de peças defeituosas
encontradas em uma caixa.
c. Qual o valor esperado do desconto na venda de um lote de 1.000 caixas, sabendo-se que
uma caixa com mais de uma peça defeituosa tem um desconto no preço de R$10,00?
Solução:
Temos que:
N=5
p = p(sucesso) = 0,10
5
a. P ( X =
3) =
. 0,10 . (1 − 0,10 ) =
3 2
0, 0081
3
57
CAPÍTULO 5 • Distribuição de probabilidade de variáveis aleatórias discretas
b. P ( X ≥ 2 ) =−
1 P( X < 2)
5 5
P ( X < 2 ) . 0,100. (1 − 0,10 ) + . 0,101. (=
1 − 0,10 ) 0,91854
5 4
=
0 1
Sendo assim, P ( X ≥ 2 ) =−
1 0,91854 =0, 08146
P ( X ≥ 2) + 0P ( X
= < 2 ) 10 . 0,8146 + 0 . 0,91854
= 0,8146
E(Y) = np = 10
Logo, em um lote de 1.000 caixas, o desconto esperado no preço será de 1 000(0,8146) = R$ 814,60.
Sintetizando
58
CAPÍTULO
DISTRIBUIÇÃO DE PROBABILIDADE
DE VARIÁVEIS ALEATÓRIAS
CONTÍNUAS 6
Introdução do capítulo
Objetivos
Considere o experimento que consiste em selecionar, ao acaso, uma peça da produção de uma
máquina e determinar o valor do comprimento da peça em milímetros. Nesse caso, dentro de
determinado grau de precisão decorrente da limitação do instrumento de medida, a variável
aleatória X (comprimento da peça) pode assumir qualquer valor em um intervalo da reta real,
sendo, dessa forma, uma variável contínua.
Chama-se variável aleatória contínua toda variável aleatória que pode assumir valores
correspondentes a quaisquer pontos contidos em um ou mais intervalos (isto é, valores que
são incontáveis).
59
CAPÍTULO 6 • Distribuição de probabilidade de variáveis aleatórias contínuas
» A profundidade na qual uma perfuração chega pela primeira vez com sucesso ao petróleo:
0 ≤ x ≤ C , em que C é a profundidade máxima que pode ser obtida.
Nas últimas seções, interessavam apenas situações caracterizadas por variáveis aleatórias discretas.
Agora, o foco está em um outro tipo de variável, isto é, variáveis que aparecem em problemas
nos quais uma grandeza medida assume um valor que pode variar continuamente.
Alguns exemplos como o tempo de espera para ser atendido na emergência de um hospital, o
peso de um camundongo em um experimento de laboratório, o tempo de vida de um capacitor
em um teste de controle de qualidade serão alvo de nossos estudos.
Nos casos citados, não faz sentido associar uma probabilidade a cada valor do resultado de um
experimento, já que existe um número infinito de valores possíveis, distribuídos ao longo de certo
intervalo. Sendo assim, será usada uma função chamada função densidade de probabilidade
para indicar como as probabilidades estão distribuídas ao longo do contradomínio da variável
aleatória.
Observe que uma função contínua f(x) é chamada função densidade de probabilidade se satisfaz
as seguintes condições:
1ª. f ( x ) ≥ 0, ∀x ∈
β
2ª. P ( a ≤ x ≤ b ) =f ( x ) dx
∫
∞ α
3ª. ∫ f ( x ) dx = 1
−∞
Nas condições acima, vale observar que a primeira decorre do fato de que as probabilidades não
podem ser negativas. Já a segunda condição indica que a probabilidade de uma variável aleatória
pode assumir valores em um intervalo, sendo este a área sob a curva da função densidade de
probabilidade no intervalo associado. A terceira condição define que a probabilidade do espaço
amostral é 1, isto é, a probabilidade de ocorrência de algum dos resultados possíveis é certa.
60
Distribuição de probabilidade de variáveis aleatórias contínuas • CAPÍTULO 6
Distribuição normal
Diz-se que X é uma variável aleatória normal, ou que a distribuição X é normal, de parâmetros
µ e σ , se a função densidade de X é dada por:
( X − µ )2
1
=f (X ) e 2σ 2
, −∞ < X < ∞
σ 2π
61
CAPÍTULO 6 • Distribuição de probabilidade de variáveis aleatórias contínuas
Deste modo, para calcular a probabilidade indicada na figura a seguir, deve-se fazer:
a ( X − µ )2
1
P (a ≤ X ≤ b) =
∫b σ 2π e 2σ 2
dx
Este apresenta um grau relativo de dificuldade. Isso porque as integrais envolvidas nesse processo
não possuem solução analítica, de modo que é preciso recorrer a soluções aproximadas. Na
prática, basta construir tabelas de valores aproximados para a distribuição normal padrão,
já que qualquer variável aleatória normal pode ser convertida para a forma padrão por uma
transformação linear. Ou seja:
62
Distribuição de probabilidade de variáveis aleatórias contínuas • CAPÍTULO 6
Vale observar que a tabela contém apenas os valores de Φ(x) para x > 0. Para determinar os valores
de Φ(x) para x< 0, usa-se a relação:
Φ ( −x ) = 1 − Φ ( x )
P ( Z ≤ −=
X ) P(Z ≥ X )
Já que:
P(Z ≥ X ) =
1− P (Z ≤ X )
Importante
Passo a passo para encontrar uma probabilidade correspondendo a uma variável aleatória normal
1º Passo: esboce a distribuição normal e indique a média da variável aleatória x. Então, sombreie a área correspondendo
à probabilidade que você quer encontrar.
2º Passo: converta as bordas da área sombreada de x valores para z valores da variável aleatória normal padrão usando a
fórmula:
X −µ
Z=
σ
3º Passo: use a tabela contida no final do livro didático para encontrar áreas correspondendo aos valores de Z. Se
necessário, use a simetria da distribuição normal para encontrar áreas correspondendo aos valores negativos de Z e o
fato de que a área total de cada lado da média é igual a 0,5 para converter as áreas da tabela contida no final do livro
didático às probabilidades do evento que você sombreou.
63
CAPÍTULO 6 • Distribuição de probabilidade de variáveis aleatórias contínuas
Exercícios resolvidos:
1. Considere uma distribuição normal com média = 100 e variância VAR(X) = 25. Calcule:
P (100 ≤ X ≤ 106 ) ;
a. 100 − 100
=Z =⇒Z 0
5
P (100 ≤ X ≤ 106 )= P ( 0 ≤ Z ≤ 1, 2 )=
P ( 0 ≤ Z ) + P ( Z ≤ 1,=
2 ) 0, 0000 + 0,3849
= 0,3849 ou 38, 49%
P ( 89 ≤ X ≤ 107 )
b.
89 − 100
Z= ⇒Z =−2, 2
5
107 − 100
=Z =⇒ Z 1, 4
5
Buscando o valor de Z = 1,4 na tabela temos: 0,4192
64
Distribuição de probabilidade de variáveis aleatórias contínuas • CAPÍTULO 6
P ( 89 ≤ X ≤ 107 ) = P ( −2, 2 ≤ Z ≤ 1, 4 ) =
P ( −2, 2 ≤ Z ≤ 0 ) + P ( 0 ≤ Z ≤ 1, 4 ) = 0, 4861 + 0, 4192 = 0, 9053 ou 90, 53%
c. P (112 ≤ X ≤ 116 ) ;
112 − 100
=Z =⇒ Z 2, 4
5
65
CAPÍTULO 6 • Distribuição de probabilidade de variáveis aleatórias contínuas
P (112 ≤ X ≤ 116
= ) P ( 2, 2 ≤ Z ≤ 3,=
2)
P ( 0 ≤ Z ≤ 3, 2 ) − P ( 0 ≤ Z ≤ 2, 4 ) =
0, 4819 - 0, 4993 = 0, 0075 ou 0, 75%
P ( X ≥ 108 )
d. ;
108 − 100
=Z =⇒ Z 1, 6
5
P ( X ≥ 108 ) = P ( Z ≥ 1, 6 ) =
0,5 − P ( Z ≥ 1, 6 ) =0,5 − 0, 4452 =0, 0547 ou 5, 47%
2. Um fabricante de peças eletrônicas sabe, por experiências anteriores, que as peças que
ele produz têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração
tem aproximadamente distribuição normal. O fabricante oferece garantia de 312 dias,
ou seja, troca a peça que apresentar defeito nesse período. Sabendo que ele fabrica 1000
peças mensalmente, determine o número de peças que o fabricante deverá trocar pelo
uso da garantia, mensalmente.
Temos que:
=µ 600
= dias, σ 100=dias e X 312.
312 − 600
Z= ⇒Z = −2,88
100
66
Distribuição de probabilidade de variáveis aleatórias contínuas • CAPÍTULO 6
P ( X ≥ 312
= ) P ( Z ≥ −2,88
= )
0,5 − P ( Z ≥ −2,88 ) = 0, 5 - 0, 4980 = 0, 0020
Sintetizando
Vale lembrar que as variáveis aleatórias normais são usadas para modelar muitos fenômenos naturais, como as notas
obtidas pelos alunos em uma prova e os erros cometidos na medida de uma grandeza física, por exemplo.
Para obter probabilidades cumulativas para a variável aleatória normal usando o Excel, primeiro
selecione a aba “Fórmulas”.
67
CAPÍTULO 6 • Distribuição de probabilidade de variáveis aleatórias contínuas
68
Distribuição de probabilidade de variáveis aleatórias contínuas • CAPÍTULO 6
Após clicar na distribuição de sua escolha, nesse caso a distribuição normal, aparecerá uma
caixa de diálogo. Especifique os parâmetros da distribuição (por exemplo, a média m e o desvio
padrão s), clique na probabilidade cumulativa que você deseja (X< = ou >) e especifique o valor
de x de interesse no quadro. Quando você clicar “OK”, a probabilidade normal cumulativa para
o valor de x especificado aparecerá em uma nova planilha Excel.
Sintetizando
69
CAPÍTULO 6 • Distribuição de probabilidade de variáveis aleatórias contínuas
Tabelas estatísticas
Fonte: https://www.ecoevol.ufg.br/adrimelo/bioestat/10-aula-DistNormal-IC.pdf
70
Referências
BARBETTA, P. A. Estatística Aplicada às Ciências Sociais. 5a Edição revisada. Florianópolis: Editora da UFSC. 340p. 2004.
BUSSAB, W. O. e MORETTIN, P. A. Estatística Básica. 6a Edição revisada e atualizada. São Paulo: Editora Saraiva. 2010.
LAPPONI, J. C. Estatística usando o Excel. São Paulo: Lapponi treinamento e editora, 2000.
LEVINE, D.; BERENSON, M. L. Estatística: teoria e aplicações. Rio de Janeiro: LTC, 2000.
MAGALHÃES, M. N. e LIMA, A. C. P. Noções de probabilidade e estatística. 4ª Edição. São Paulo: EDUSP, 2002.
TOLEDO, G. L. e OVALLE, I. I. Estatística Básica. 2a Edição. São Paulo: Editora Atlas, 1991.
SOARES, J. F.; FARIAS, A. A. e CESAR, C. C. Introdução à Estatística. 2a Edição. Rio de Janeiro: LTC, 1998.
Sites consultados
https://www.ecoevol.ufg.br/adrimelo/bioestat/10-aula-DistNormal-IC.pdf
https://www.shutterstock.com/g/Bakhtiar+Zein?searchterm=Popula%C3%A7%C3%A3o%20e%20amostra.
https://marketinganalitico.com.br/marketing-e-estatistica-variaveis/
https://www.ecoevol.ufg.br/adrimelo/bioestat/10-aula-DistNormal-IC.pdf
71