Escolar Documentos
Profissional Documentos
Cultura Documentos
PROBABILIDADE
PROF. DR. RICARDO CARDOSO DE OLIVEIRA
Prof. Me. Ricardo Benedito de Oliveira
REITOR
Reitor:
Prof. Me. Ricardo Benedito de
Oliveira
Pró-Reitoria Acadêmica
Maria Albertina Ferreira do
Nascimento
Prezado (a) Acadêmico (a), bem-vindo Diretoria EAD:
(a) à UNINGÁ – Centro Universitário Ingá.
Prof.a Dra. Gisele Caroline
Primeiramente, deixo uma frase de Novakowski
Sócrates para reflexão: “a vida sem desafios
não vale a pena ser vivida.” PRODUÇÃO DE MATERIAIS
Cada um de nós tem uma grande Diagramação:
responsabilidade sobre as escolhas que Alan Michel Bariani
fazemos, e essas nos guiarão por toda a vida Thiago Bruno Peraro
acadêmica e profissional, refletindo diretamente
em nossa vida pessoal e em nossas relações Revisão Textual:
com a sociedade. Hoje em dia, essa sociedade
é exigente e busca por tecnologia, informação
Fernando Sachetti Bomfim
e conhecimento advindos de profissionais que Marta Yumi Ando
possuam novas habilidades para liderança e Olga Ozaí da Silva
sobrevivência no mercado de trabalho. Simone Barbosa
De fato, a tecnologia e a comunicação Produção Audiovisual:
têm nos aproximado cada vez mais de pessoas, Adriano Vieira Marques
diminuindo distâncias, rompendo fronteiras e
nos proporcionando momentos inesquecíveis.
Márcio Alexandre Júnior Lara
Assim, a UNINGÁ se dispõe, através do Ensino a Osmar da Conceição Calisto
Distância, a proporcionar um ensino de qualidade,
capaz de formar cidadãos integrantes de uma Gestão de Produção:
sociedade justa, preparados para o mercado de Cristiane Alves
trabalho, como planejadores e líderes atuantes.
© Direitos reservados à UNINGÁ - Reprodução Proibida. - Rodovia PR 317 (Av. Morangueira), n° 6114
UNIDADE ENSINO A DISTÂNCIA
01
DISCIPLINA:
ESTATÍSTICA E PROBABILIDADE
SUMÁRIO DA UNIDADE
INTRODUÇÃO.................................................................................................................................................................5
1. CONSIDERAÇÕES BÁSICAS EM ESTATÍSTICA DESCRITIVA.................................................................................6
1.1 UNIVERSO, AMOSTRA E VARIÁVEL........................................................................................................................6
1.2 TÉCNICAS DE AMOSTRAGEM................................................................................................................................ 7
1.3 TIPOS DE GRÁFICOS E SÉRIES ESTATÍSTICAS....................................................................................................8
1.4 DISTRIBUIÇÃO DE FREQUÊNCIA.......................................................................................................................... 11
2. MEDIDAS DE POSIÇÃO............................................................................................................................................ 17
2.1 MÉDIA ARITMÉTICA............................................................................................................................................... 17
2.2 MODA...................................................................................................................................................................... 21
2.3 MEDIANA................................................................................................................................................................23
WWW.UNINGA.BR 3
3. MEDIDAS DE SEPARATRIZES.................................................................................................................................26
4. MEDIDAS DE ASSIMETRIA E CURTOSE................................................................................................................28
5. MEDIDAS DE DISPERSÃO.......................................................................................................................................30
5.1 AMPLITUDE TOTAL ................................................................................................................................................ 31
5.2 VARIÂNCIA.............................................................................................................................................................32
5.3 DESVIO-PADRÃO....................................................................................................................................................36
CONSIDERAÇÕES FINAIS............................................................................................................................................38
WWW.UNINGA.BR 4
EDUCAÇÃO A DISTÂNCIA
INTRODUÇÃO
No ambiente onde estamos inseridos, qualquer pessoa tem acesso a uma grande
quantidade de informações. Ser bem-sucedido é ser capaz de entender e utilizar essas
informações de maneira correta.
Nesta unidade, serão abordados os primeiros passos para a compreensão sobre os
dados estatísticos. Ainda, serão apresentadas as três maneiras de sintetizar numericamente um
conjunto de dados: a média, a mediana e a moda. Vamos discutir a dispersão ou variabilidade
dos dados estudados em relação à média. Essas medidas incluem o estudo da amplitude total, da
variância, do desvio-padrão e do coeficiente de variação. Pegue sua xícara de café, respire fundo
e bons estudos!
WWW.UNINGA.BR 5
EDUCAÇÃO A DISTÂNCIA
WWW.UNINGA.BR 6
EDUCAÇÃO A DISTÂNCIA
Exemplo 1
Dos 50 funcionários da empresa de uma construtora, 20% serão escolhidos para realizar exames
de rotina. Assim, para proceder à escolha desses funcionários, primeiramente, numeramos os
de 1 a 50 e, em seguida, escrevemos os números de 1 a 50 em papéis de mesmo tamanho.
Colocamo-los dentro de uma caixa, agitamos e retiramos, um a um, sem reposição. Os dez
números formarão a amostra.
Uma empresa de telecomunicação tem 5.000 funcionários e, desses, 750 deverão ser sorteados
para realizar os exames de rotina. Observe, nesse exemplo, que os números de elementos do
universo e da amostra são relativamente grandes. Assim, faz-se necessário utilizar-se da tabela
de números aleatórios (Anexo 1). Para obtermos esses 750 elementos da amostra, sorteamos
um algarismo qualquer da tabela, a partir do qual iremos tomar números com dois, três ou mais
dígitos, de acordo com a necessidade, percorrendo as linhas e/ou colunas da tabela de números
aleatórios da esquerda para direita (ou vice-versa) ou, ainda, de cima para baixo (ou vice-versa).
Os números obtidos irão indicar os elementos da amostra.
WWW.UNINGA.BR 7
EDUCAÇÃO A DISTÂNCIA
Exemplo 3
WWW.UNINGA.BR 8
EDUCAÇÃO A DISTÂNCIA
Exemplo 4
Uma série estatística trata-se de toda tabela que apresenta distribuição de um conjunto
de dados em função da época (denominadas séries históricas), do local (denominadas séries
geográficas) ou da espécie (denominadas séries específicas).
Um gráfico estatístico é uma maneira de apresentação dos dados, que tem como objetivo
produzir uma impressão mais rápida e viva do fenômeno estudado uma vez que os gráficos
falam mais rapidamente à compreensão da série. Os gráficos devem ser simples, claros e devem
expressar a verdade sobre o fenômeno em estudo. Veja o Exemplo 5.
WWW.UNINGA.BR 9
EDUCAÇÃO A DISTÂNCIA
Exemplo 5
Mais de 190 representantes de países estão reunidos em Paris para discutir o novo acordo do
clima, que pretende apontar quais ações os países irão adotar para limitar suas emissões de
gases do efeito estufa e, consequentemente, tentar evitar que a temperatura do planeta aumente
mais de 2º C. O mais difícil é fazer com que todos eles concordem com os mesmos termos
e compromissos. Mas todos têm peso igual nas emissões? Veja o gráfico que mostra os dez
maiores emissores.
Figura 1 – Os dez maiores emissores de gases do efeito estufa. Fonte: UOL Notícias (2015).
WWW.UNINGA.BR 10
EDUCAÇÃO A DISTÂNCIA
33,50 30,38 48,38 31,13 29,63 9,25 32,25 38,00 8,63 29,63
9,00 18,00 18,00 1,25 37,88 10,00 25,24 52,00 9,25 53,38
8,75 34,00 7,63 14,00 43,25 16,50 11,38 25,02 18,50 16,63
9,38 8,00 35,25 21,63 19,38 11,50 28,50 78,38 38,88 33,63
Fonte: O autor.
Uma vez organizados os dados em rol, iremos agora resumir esses dados numa tabela de
tal forma que a leitura dos dados seja facilitada. Para isso, definimos:
(i) classe: é a subdivisão dos dados em intervalos ou faixas de valores.
(ii) limite de classe: são os valores extremos de cada classe. Para uma classe, temos o
limitante inferior, que é o menor número que pode pertencer à classe, além do limitante
superior, que é o maior número que pode pertencer à classe.
(iii) amplitude amostral (AA): é a diferença entre o maior e o menor entre os dados
coletados.
(iv) ponto médio de uma classe : são os valores obtidos somando-se o limitante
inferior de classe ao limitante superior e dividindo-se o resultado da soma por 2.
(v) número de classes (i): para a construção de uma tabela de distribuição de frequência,
a primeira coisa com que devemos nos preocupar é determinar o número de classes. Para
tal, fazemos uso da regra de Sturges, a qual é dada pela Eq. (01), a seguir.
WWW.UNINGA.BR 11
EDUCAÇÃO A DISTÂNCIA
Eq. (01)
Ainda, podemos fazer uso da regra da raiz, a qual é dada pela Eq. (02):
Eq. (02)
Eq. (04)
Eq. (05)
Eq. (06)
WWW.UNINGA.BR 12
EDUCAÇÃO A DISTÂNCIA
Eq. (07)
Já que definimos tantas coisas, vamos aplicá-las à Tabela 3. Digamos que nosso objetivo
seja elaborar um relatório acerca da distância horizontal percorrida, em metros, pelo robô
após o ajuste no seu sistema operacional. Vamos apresentar os resultados em uma tabela de
distribuição de frequência. Embora existam tecnologias para gerar distribuições de frequência
automaticamente, os passos para construí-las manualmente são os seguintes:
1º passo: determinar o número de classes desejado. Esse número deve estar entre 5 e
20, por questões práticas e ainda deve ser um número inteiro. Como temos n = 40 observações,
podemos usar o critério de Sturges ou da raiz. Assim, temos, pelo critério de Sturges, o número
de classes igual a:
3º passo: escolha ou o valor mínimo ou um valor conveniente, que seja um pouco menor
do que esse valor mínimo para ser o primeiro limitante inferior de classe. Usando esse limitante
inferior e a amplitude da classe, prossiga e liste os outros limites inferiores de classe, adicionando
a amplitude de classe ao primeiro limite de classe inferior para obter o segundo limite inferior de
classe, e assim por diante.
4º passo: liste os limites inferiores de cada classe em uma coluna vertical e prossiga para
preencher os limitantes superiores. Feito isso, percorra o conjunto de dados, colocando uma
marca apropriada para cada valor dado. Conte as marcas para encontrar a frequência total para
cada classe.
Agora, tendo como base a Tabela 3, vamos construir a Tabela 4, denominada de tabela de
distribuição de frequência. Observe, na Tabela 4, que a primeira na classe temos a frequência dos
valores da distância horizontal percorrida pelo robô, que vai de 1 (inclusive) até 14 (exclusive),
totalizando 12 valores. Nas classes seguintes, usamos ideia análoga.
WWW.UNINGA.BR 13
EDUCAÇÃO A DISTÂNCIA
1 12
2 11
3 12
4 3
5 1
6 1
Total 40
Fonte: O autor.
Percentual de
Classe (i)
redução
1 12 0,300 30,0 12 0,300 30,0
Total 40 1 100 - - -
Fonte: O autor.
WWW.UNINGA.BR 14
EDUCAÇÃO A DISTÂNCIA
E assim por diante, até a sexta classe. As frequências relativas acumuladas foram calculadas
como segue:
Figura 2 – Histograma da distribuição de frequência da distância percorrida por um drone, antes de apresentar
algum tipo de defeito. Fonte: O autor.
WWW.UNINGA.BR 15
EDUCAÇÃO A DISTÂNCIA
Figura 4 – Polígono de frequência acumulada da distância percorrida por um drone, antes de apresentar algum tipo
de defeito. Fonte: O autor.
WWW.UNINGA.BR 16
EDUCAÇÃO A DISTÂNCIA
2. MEDIDAS DE POSIÇÃO
As medidas de posição de uma série de dados nos orientam quanto à posição da distribuição
em relação ao eixo horizontal do histograma. As usualmente empregadas são a média, a mediana
e a moda. Vamos discuti-las em separado.
Eq. (08)
Exemplo 6
A seguir, é informada a tensão, em milivolt (mV), de cinco resistores iguais, quando submeti-
dos a uma mesma corrente elétrica.
7 – 8,5 – 6,5 – 9 – 9
Qual foi a tensão média, em mV, desenvolvida pelos resistores quando submetidos à mesma
corrente elétrica?
Solução: a média aritmética da tensão é
Acabamos de calcular a média aritmética para o caso em que os dados não estão
agrupados. Agora, vamos aprender a calcular a média aritmética para o caso em que os dados
estão agrupados sem intervalo de classe. Nessa situação, como as frequências são números
indicadores da intensidade de cada valor, elas funcionam como fatores de ponderação e, assim,
calculada a média aritmética ponderada, como apresentado pela Eq. (09):
Eq. (09)
WWW.UNINGA.BR 17
EDUCAÇÃO A DISTÂNCIA
Exemplo 7
Fonte: O autor.
Daí, segue que o número médio de acidentes de trabalho nas 100 fábricas de bebida é:
Portanto, o número médio de acidentes de trabalho nas 100 fábricas de bebida foi de 1,7
acidentes.
WWW.UNINGA.BR 18
EDUCAÇÃO A DISTÂNCIA
Vejamos, agora, o caso do cálculo da média aritmética quando os dados estão agrupados
em classe. Nesse caso, convenciona-se que os valores incluídos num determinado intervalo
coincidem com seu ponto médio, e determinamos a média ponderada. Vejamos o exemplo
seguinte.
Exemplo 8
Fonte: O autor.
WWW.UNINGA.BR 19
EDUCAÇÃO A DISTÂNCIA
Exemplo 9
Assim, subtraindo (1) de (2), segue que o salário de João é igual a R$ 15.100.
WWW.UNINGA.BR 20
EDUCAÇÃO A DISTÂNCIA
2.2 Moda
A Moda (Mo) é o valor que ocorre com maior frequência num conjunto de dados, e esse(s)
valor(es) é(são) denominado(s) “valor modal”. Um conjunto de dados poderá ser classificado em:
(i) amodal – quando não apresentar valor modal; (ii) unimodal – quando apresentar único valor
modal; (iii) bimodal – quando apresentar dois valores modais; (iv) trimodal – quando apresentar
três valores modais; (v) polimodal – quando apresentar quatro ou mais valores modais.
Exemplo 10
Os dados a seguir correspondem à pressão manométrica (em MPa) lida em uma adutora ao
longo de 10 horas de observação: 200, 250, 300, 250, 250, 200, 150, 200, 150, 200. Calcule a
moda para esse conjunto de dados.
Solução: organizando os dados em rol crescente, obtemos a seguinte distribuição:
150 – 150 – 200 – 200 – 200 – 200 – 250 – 250 – 250 – 300
Acabamos de calcular a moda para o caso em que os dados não estão agrupados. Agora,
vamos aprender a calcular a moda para o caso em que os dados estão agrupados sem intervalo de
classe. Nessa situação, é muito fácil determinar o valor modal, bastando determinar a classe que
apresenta maior frequência. Vejamos o exemplo que segue.
Exemplo 11
Fonte: O autor.
WWW.UNINGA.BR 21
EDUCAÇÃO A DISTÂNCIA
Vejamos agora o caso do cálculo da moda quando os dados estão agrupados em classe.
Nesse caso, é comum fazer uso da equação de Czuber para o cálculo do valor modal, como
mostra a Eq. (10):
Eq. (10)
Exemplo 12
A Tabela 10 apresenta a distribuição de frequências das notas obtidas numa prova de mecânica
Fonte: O autor.
Determine a nota modal.
Solução: a classe modal corresponde à classe que apresenta maior frequência. É claro que essa
frequência corresponde à terceira classe. Assim,
, , e . Logo, a nota modal é:
WWW.UNINGA.BR 22
EDUCAÇÃO A DISTÂNCIA
A moda é, em geral, usada para medidas rápidas e aproximações de posição ou, ainda,
quando a medida de posição deve ser o valor mais frequente da distribuição.
2.3 Mediana
A mediana (Me) é a medida de posição definida como sendo o número que divide o
conjunto de dados analisado em duas partes iguais, com o número igual de elementos. Dessa
maneira, a mediana encontra-se no centro de uma série estatística organizada em rol.
Ao organizar os dados em rol e este apresentar um número ímpar de elementos, a mediana
será o valor central. Caso o rol tenha um número par de elementos, a mediana será a média
aritmética entre os dois termos centrais. Nesse caso, a mediana será um valor que não pertence
à série de dados.
Exemplo 13
Exemplo 14
Cientistas ambientais mediram as emissões de gases de efeito estufa de uma amostra de vinte
carros. As quantidades listadas estão em toneladas (por ano), expressas em equivalente de CO2.
8,5 – 5,0 – 4,0 – 7,0 – 8,0 – 9,0 – 1,5 – 4,5 – 10,0 – 6,5 – 6,0 – 7,5 – 5,5 – 9,5 – 8,5 – 70 – 9,0 –
8,5 – 3,0 – 20.
Qual é a mediana teórica da quantidade de gases de efeito estufa dessa amostra de carros?
Solução: primeiramente, vamos organizar o conjunto de dados em rol crescente. Assim, temos:
1,5 – 2,0 – 3,0 – 4,0 – 4,5 – 5,0 – 5,5 – 6 – 6,5 – 7,0 – 7,0 – 7,5 – 8,0 – 8,5 – 8,5 – 8,5 – 9,0 – 9,0
– 9,5 – 10,0
Note que temos um número par de elementos, e os dois termos centrais têm média aritmética
igual a 7,0. Portanto, a mediana é igual a 7,0 toneladas (por ano).
WWW.UNINGA.BR 23
EDUCAÇÃO A DISTÂNCIA
Acabamos de calcular a mediana para o caso em que os dados não estão agrupados.
Agora, vamos aprender a calcular a mediana para o caso em que os dados estão agrupados sem
intervalo de classe. Nessa situação, devemos executar os seguintes passos: (i) calcular a frequência
acumulada; (ii) determinar um valor tal, que divida a distribuição em dois grupos que contenham
o mesmo número de elementos. Vejamos o exemplo a seguir.
Exemplo 15
Fonte: O autor.
WWW.UNINGA.BR 24
EDUCAÇÃO A DISTÂNCIA
Vejamos agora o caso do cálculo da mediana quando os dados estão agrupados em classe.
Nesse caso, usa-se a Eq. (11) de interpolação linear:
Eq. (11)
Exemplo 16
Fonte: O autor.
Fonte: O autor.
WWW.UNINGA.BR 25
EDUCAÇÃO A DISTÂNCIA
Depreende-se, da Tabela 14, que n = 40 e que a classe que contém a mediana é a segunda
(hachurada na Tabela 14). Para essa classe, temos: , , e
. Daí:
3. MEDIDAS DE SEPARATRIZES
Essas medidas são valores que ocupam posições no conjunto de dados, em rol, dividindo-o
em partes iguais e podendo ser:
(a) quartis – divide a série em quatro partes iguais. São assim representados Q1 (25% dos
WWW.UNINGA.BR 26
EDUCAÇÃO A DISTÂNCIA
Exemplo 17
Solução: primeiro, temos de organizar os dados em rol. Note que a Tabela 15 já está organizada
em rol. Assim:
(a) para o primeiro quartil, temos que 25% dos valores são menores ou iguais ao valor do
WWW.UNINGA.BR 27
EDUCAÇÃO A DISTÂNCIA
(b) assimétrica negativa se média ≤ mediana ≤ moda. O lado mais longo do polígono
de frequência (cauda da distribuição) está à esquerda do centro, como apresentado na Figura 7.
WWW.UNINGA.BR 28
EDUCAÇÃO A DISTÂNCIA
(c) assimétrica positiva se moda ≤ mediana ≤ média. O lado mais longo do polígono de
frequência está à direita do centro, como apresentado na Figura 8.
Exemplo 18
Eq. (12)
Nela: Q3 e Q1 são o terceiro e primeiro quartis; P90 e P10 são o décimo e nonagésimo
percentis. Quanto à curtose, a distribuição pode ser:
(a) Mesocúrtica – normal. Nem achatada, nem alongada e é tal que C = 0,263, como
apresentado na Figura 9.
WWW.UNINGA.BR 29
EDUCAÇÃO A DISTÂNCIA
(b) Platicúrtica – achatada e, nesse caso, C > 0,263, como ilustra a Figura 10.
(c) Leptocúrtica – alongada e, nesse caso, C < 0,263, como ilustrado na Figura 11.
5. MEDIDAS DE DISPERSÃO
Agora, vamos discutir a dispersão ou variabilidade dos dados estudados. Essas medidas
incluem o estudo da amplitude total, da variância, do desvio-padrão e do coeficiente de variação.
Nossos objetivos aqui são determinar as medidas de dispersão, bem como sua interpretação.
Para iniciar nosso estudo, considere os seguintes conjuntos de dados:
A: 18, 18, 18, 18, 18
B: 16, 17, 18, 19, 20
C: - 47, - 37, - 2, 68, 108
A média aritmética de cada conjunto de dados é:
Note que, embora as médias aritméticas sejam iguais, existe diferença na dispersão desses
dados em relação à média. Temos que o conjunto de dados A é mais homogêneo que o conjunto
de dados B, que, por sua vez, é mais homogêneo que o conjunto de dados C. Ou seja, quando
comparamos esses conjuntos de dados de A para C, temos aumento na dispersão dos dados por
eles apresentados.
Daí, surge a necessidade de medir a dispersão ou variabilidade de um conjunto de dados.
As medidas de dispersão são: amplitude total, variância e desvio-padrão e coeficiente de variação.
WWW.UNINGA.BR 30
EDUCAÇÃO A DISTÂNCIA
Eq. (13)
Trata-se de uma medida de dispersão muito sensível aos valores extremos e não tão útil
quanto as outras medidas de dispersão que estudaremos. Estudemos os exemplos seguintes.
Exemplo 19
Na Tabela 16, estão os valores, em rol, da tensão (em mV) desenvolvida por resistores idênticos
testados em laboratório. Determine a amplitude total desse conjunto de dados.
Solução: antes de calcular a amplitude total, primeiramente, devemos escrever os dados em rol.
Assim sendo, temos que:
WWW.UNINGA.BR 31
EDUCAÇÃO A DISTÂNCIA
Exemplo 20
Na Tabela 17, estão os valores, em rol, da tensão (em mV) desenvolvida por resistores idênticos
testados em laboratório. Determine a amplitude total desse conjunto de dados.
Solução: nessa situação, em que os dados estão organizados por classe, a amplitude é dada por:
. Logo, a amplitude da tensão, desenvolvida pelos resistores em teste, é igual
a 78 mV.
5.2 Variância
A diferença entre cada valor observado e a média é denominada desvio e é dada por
, se o conjunto de dados for um universo, ou por se os dados forem amostrais. Ao
somar todos os desvios, ou seja, ao somar todas as diferenças de cada valor observado em relação
à média, o resultado é igual a zero. Isso significa que essa medida não mede a variabilidade dos
dados. Para resolver esse problema, consideramos o quadrado dos desvios em relação à média.
A variância é uma medida de dispersão estatística, determinando quão longe os valores
coletados estão em relação ao valor esperado. As variâncias populacional e amostral são calculadas
de acordo com as Eq. (14) e (15), respectivamente:
Eq. (14)
Eq. (15)
WWW.UNINGA.BR 32
EDUCAÇÃO A DISTÂNCIA
Exemplo 21
Vejamos agora o cálculo da variância para o caso em que os dados estão agrupados sem
intervalo de classe. Nesse caso, a variância é dada pela Eq. (16):
Eq. (16)
WWW.UNINGA.BR 33
EDUCAÇÃO A DISTÂNCIA
Exemplo 22
Fonte: O autor.
Fonte: O autor.
Vejamos agora o cálculo da variância para o caso em que os dados estão agrupados com
intervalo de classe. Nesse caso, a equação da variância é dada por:
Eq. (17)
WWW.UNINGA.BR 34
EDUCAÇÃO A DISTÂNCIA
Exemplo 23
Fonte: O autor.
Assim, a variância amostral é:
WWW.UNINGA.BR 35
EDUCAÇÃO A DISTÂNCIA
5.3 Desvio-Padrão
Vimos que a variância é calculada a partir dos quadrados dos desvios em relação à média
e que ela é um número cuja unidade está ao quadrado em relação à variável estudada, o que, sob o
aspecto prático, é inconveniente. O desvio-padrão é definido como a raiz quadrada da variância,
o que, do ponto de vista prático, é mais conveniente, pois, assim, a medida de dispersão tem a
mesma unidade da média. O desvio-padrão populacional e amostral é definido pelas Eq. (18) e
(19):
Eq. (18)
Eq. (19)
Exemplo 24
WWW.UNINGA.BR 36
EDUCAÇÃO A DISTÂNCIA
Eq. (20)
Exemplo 25
Como o coeficiente de variação da região A é menor que o da região B, segue que a concentração
de partículas poluidoras na região A é mais homogênea que a da região B.
WWW.UNINGA.BR 37
EDUCAÇÃO A DISTÂNCIA
CONSIDERAÇÕES FINAIS
WWW.UNINGA.BR 38
UNIDADE ENSINO A DISTÂNCIA
02
DISCIPLINA:
ESTATÍSTICA E PROBABILIDADE
SUMÁRIO DA UNIDADE
INTRODUÇÃO ...............................................................................................................................................................40
1. INTRODUÇÃO À PROBABILIDADE........................................................................................................................... 41
2. AS REGRAS DA ADIÇÃO E MULTIPLICAÇÃO PARA O CÁLCULO DE PROBABILIDADE...................................... 51
3. DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE..............................................................................................66
3.1 A DISTRIBUIÇÃO DE PROBABILIDADE BINOMIAL .............................................................................................76
3.2 A DISTRIBUIÇÃO DE PROBABILIDADE DE POISON ..........................................................................................79
3.3 A DISTRIBUIÇÃO NORMAL PROBABILIDADE ....................................................................................................82
CONSIDERAÇÕES FINAIS............................................................................................................................................93
WWW.UNINGA.BR 39
EDUCAÇÃO A DISTÂNCIA
INTRODUÇÃO
WWW.UNINGA.BR 40
EDUCAÇÃO A DISTÂNCIA
1. INTRODUÇÃO À PROBABILIDADE
Exemplo 1
simples. Mas por quê? Com o lançamento simultâneo de três moedas, o evento sair duas caras
e uma coroa pode ser decomposto em eventos mais simples, como: , ou . Por
outro lado, o resultado é um evento simples uma vez que não pode ser decomposto em
resultados individuais. Aí, você poderia se perguntar: o evento não pode ser decomposto
em resultados individuais, tais como c, c e k? A pergunta é ótima, mas a forma de pensar
é incorreta, porque c, c e k não são resultados individuais do lançamento das três moedas.
Lembre-se: com o lançamento de três moedas, n(S) = 8, ou seja, há exatamente 8 resultados
possíveis de eventos simples que já foram listados em S.
WWW.UNINGA.BR 41
EDUCAÇÃO A DISTÂNCIA
Exemplo 2
Eq. (1)
WWW.UNINGA.BR 42
EDUCAÇÃO A DISTÂNCIA
Exemplo 3
WWW.UNINGA.BR 43
EDUCAÇÃO A DISTÂNCIA
Exemplo 4
WWW.UNINGA.BR 44
EDUCAÇÃO A DISTÂNCIA
Exemplo 5
Dois dados idênticos, honestos e com seis faces cada, são lançados simultaneamente. Com base
nessa informação, determine a probabilidade de que:
a) saia, pelo menos, um número 3.
b) a soma dos dois resultados seja igual a 5.
c) saia, pelo menos, um número 3 e a soma dos dois resultados seja igual a 5.
Solução: o espaço amostral contém 36 elementos, e a Tabela 1 o ilustra.
a) Seja X o evento de sair, pelo menos, um número 3. Observe que ele pode ocorrer 11 vezes.
Assim:
b) Seja Y o evento de a soma dos dois resultados ser igual a 5. Observe que ele pode ocorrer 4
vezes. Assim:
c) Observe, nesse caso, que o evento saia, pelo menos, um número 3 e a soma dos dois resultados
seja igual a 5 é a intersecção dos eventos X e Y dos itens (a) e (b). Observe que ele pode ocorrer
2 vezes, a saber: (3,2) e (2,3). Assim:
WWW.UNINGA.BR 45
EDUCAÇÃO A DISTÂNCIA
Exemplo 6
Em uma fábrica, existem 3 máquinas, A, B e C, que produzem diariamente 10.000 peças. Sabe-
se que A, B e C produzem, respectivamente, 2000, 5000 e 3000 peças. Da produção de A, B e
C, respectivamente, 5%,10% e 20% são defeituosas. Seleciona-se uma peça ao acaso e verifica-
se que é defeituosa. Determine a probabilidade de essa peça defeituosa ser proveniente da
máquina C.
Solução: segue do enunciado que o número de peças com defeitos das máquinas A, B e C são,
respectivamente, 100, 500 e 600, totalizando 1200. Seja X o evento de selecionar uma peça ao
acaso e essa ser proveniente da máquina C, temos que:
Determine a probabilidade de que, quando um casal tem três filhos, exatamente dois deles
sejam meninas. Admita que meninos e meninas sejam igualmente prováveis e que o gênero de
uma criança não seja influenciado pelo gênero de qualquer outra criança.
Solução: primeiramente, vamos construir o espaço amostral e vamos denotar por X o evento
de virem a nascer exatamente 2 meninas. O espaço amostral para esse experimento contém 8
elementos, a saber: ,
em que A denota menina, e O denota menino. Observe que o espaço amostral contém 8
possibilidades, 3 correspondem a exatamente 2 meninas de modo que:
WWW.UNINGA.BR 46
EDUCAÇÃO A DISTÂNCIA
Exemplo 8
Uma urna contém de bolas brancas e de bolas pretas, sendo que somente metade das bolas
brancas e das bolas pretas contêm um prêmio em seu interior. Uma bola dessa urna é sorteada
aleatoriamente e, quando aberta, verifica-se que tem um prêmio em seu interior. Na situação
descrita, determine a probabilidade de que essa bola seja branca.
Solução: seja N o número de bolas no interior da urna. Dessas, são brancas e pretas.
De acordo com o enunciado, metade das bolas brancas contém prêmio, ou seja, .
de bolas premiadas. Seja S o espaço amostral das bolas premiadas, segue que . Seja A
o evento de sorteio de bola branca, dentre as que contêm um prêmio, aplicando a Eq. (1)
WWW.UNINGA.BR 47
EDUCAÇÃO A DISTÂNCIA
Exemplo 9
Foi observado que uma loja de departamentos recebe, por hora, cerca de 250 clientes. Desses,
(i) 120 se dirigem ao setor de vestuário;
(ii) 90, ao setor de cosméticos;
(iii) 80, ao setor cinevídeo;
(iv) 50 se dirigem aos setores de vestuário e de cosméticos;
(v) 30 aos setores de cosméticos e de cinevídeo
(vi) 30, aos setores de vestuário e cinevídeo.
Observou-se, ainda, que 50 clientes se dirigem a outros setores, que não vestuário ou
cosméticos ou cinevídeo. Observou-se, ainda, que 50 clientes se dirigem a outros setores, que
não vestuário ou cosméticos ou cinevídeo. Qual a probabilidade de um cliente entrar nessa loja
de departamentos e se dirigir aos setores de vestuário, de cosméticos e de cinevídeo?
Solução: primeiramente, montamos o Diagrama de Venn, como ilustrado na Figura 2. Assim,
em seguida, determinamos o valor de x.
Daí,
WWW.UNINGA.BR 48
EDUCAÇÃO A DISTÂNCIA
WWW.UNINGA.BR 49
EDUCAÇÃO A DISTÂNCIA
Eq. (2)
Exemplo 10
A Tabela 2 apresenta dados de sobrevivência (em dias) de uma corte de animais acometidos
por uma doença aguda. Na primeira coluna, t corresponde aos dias, sendo t = 0 o dia em que a
contagem começou a ser feita. vt, na segunda coluna, é a quantidade de animais vivos no início
do dia t. dt, na terceira coluna, indica quantos animais morreram no decorrer do dia t.
WWW.UNINGA.BR 50
EDUCAÇÃO A DISTÂNCIA
B) Se um animal que estivesse vivo no início do dia t = 3 fosse escolhido ao acaso, a probabilidade
de ele ter morrido até o dia t = 6 seria superior a 50%.
Solução: seja A o evento de o animal estar vivo. Assim, no dia 3, temos, inicialmente, 8.000
animais vivos. Do dia 3 até o início do dia 7, o número de animais que vieram a morrer foi de
3.950 (800 + 1.080 + 720 + 1.350). Aplicando a Eq. (2):
Ou seja, a probabilidade de o animal que estava vivo no dia 3 vir a morrer até o dia 6 é de
49,375% e, portanto, a afirmação está errada.
C) Se um animal que estivesse vivo no início do dia t = 4 fosse escolhido ao acaso, a probabilidade
de ele morrer nesse dia seria igual a 15%.
Solução: seja B o evento de o animal vir a morrer no dia 4. Note que o número de animais que
morrem nesse dia é igual a 1.080, enquanto o número de animais no início desse dia é igual a
7.200. Assim, aplicando a Eq. (2):
Eq. (3)
WWW.UNINGA.BR 51
EDUCAÇÃO A DISTÂNCIA
Eq. (4)
Para facilitar a compreensão do tópico da adição de probabilidade, considere os exemplos
que seguem.
Exemplo 11
Portanto, ao selecionar uma carta ao acaso, a probabilidade de sair uma carta de paus ou uma
figura é de 42,3%.
WWW.UNINGA.BR 52
EDUCAÇÃO A DISTÂNCIA
Exemplo 12
Seja B o evento de sair exatamente uma coroa. Observe que ele pode ocorrer 3 vezes, a saber:
e . Assim, aplicando a Eq. (1):
Daí, a probabilidade de saírem duas caras consecutivas ou exatamente uma coroa é calculada
empregando-se a Eq. (3):
Eq. (5)
Quando aplicamos a Eq. (5), temos de ter em mente que os eventos X e Y são independentes,
isto é, a ocorrência de um não afetará a ocorrência do outro. Na prática, essa observação manifesta-
se com a reposição dos elementos sorteados. O resultado da Eq. (5) pode ser estendido para N
eventos independentes e simples.
WWW.UNINGA.BR 53
EDUCAÇÃO A DISTÂNCIA
Exemplo 13
Solução: a primeira questão é verdadeira e, na segunda, é correta a alternativa (c). Observe que
o espaço amostral para a primeira questão é R = {V, F}, e a probabilidade de essa pessoa acertar
Outra maneira de resolver essa questão é considerar o espaço amostral desse experimento:
as questões. Daí, .
WWW.UNINGA.BR 54
EDUCAÇÃO A DISTÂNCIA
Exemplo 14
Uma bomba centrífuga, que opera em uma refinaria, tem 60% de chances de não cavitar e 80%
de chances de não apresentar problemas mecânicos em seu rotor. Qual a probabilidade de
essa bomba centrífuga não desenvolver nenhum dos problemas citados (cavitação e problema
técnico no rotor)?
Portanto, a probabilidade de essa bomba centrífuga não desenvolver nenhum dos problemas
citados é de 48%.
De um baralho francês com 52 cartas, são retiradas, com reposição, três cartas. Qual a
probabilidade de que as três cartas sejam de paus?
Solução: seja B o evento de sortear aleatoriamente uma carta de paus do baralho. Assim, P(B)
é calculada pela Eq. (1):
Agora, ao retirar três cartas, com reposição, a probabilidade de as três serem de paus é calculada
pela Eq. (5):
WWW.UNINGA.BR 55
EDUCAÇÃO A DISTÂNCIA
Exemplo 16
Um trocador de calor passará por três serviços de manutenção no próximo ano. Apenas duas
empresas prestam tais serviços: a empresa X e a empresa Y. Na ocasião da realização de cada
um dos serviços, o engenheiro mecânico escolherá qual das duas empresas irá realizá-lo. Sabe-
se que a probabilidade de a empresa X ser escolhida para realizar um serviço é quatro vezes
maior do que a probabilidade de a empresa Y ser escolhida para realizar o mesmo serviço.
Determine a probabilidade de todos os três serviços de manutenção, previstos para o ano que
vem, serem realizados por uma mesma empresa.
Solução: observe que a seleção das empresas X e Y são eventos independentes, ou seja, a escol-
ha de uma empresa para realizar um serviço não afeta a escolha dessa empresa ou da outra para
efetuar os demais serviços. Assim, a probabilidade de apenas a empresa X realizar os serviços é
calculada por meio da Eq. (5), considerando três eventos simples:
Portanto, a probabilidade de todos os três serviços de manutenção, previstos para o ano que
vem, serem realizados por uma mesma empresa é calculada como segue:
WWW.UNINGA.BR 56
EDUCAÇÃO A DISTÂNCIA
Exemplo 17
Uma urna contém 4 bolinhas numeradas com os números 1, 3, 5 e 7. Uma bolinha é sorteada
ao acaso, tem seu número observado e é recolocada na urna. Em seguida, uma segunda bolinha
é sorteada ao acaso. Considere as seguintes probabilidades:
• P1: probabilidade de que o número da primeira bolinha esteja entre 4 e 6, excluindo 4
e 6.
• PM: probabilidade de que a média aritmética dos dois números sorteados esteja entre 4
e 6, excluindo 4 e 6.
Determine o valor de P1 + PM.
Solução: vamos calcular P1 e PM de formas separadas.
i) Seja A o evento de a primeira bolinha estar entre 4 e 6, excluindo 4 e 6, ou seja, ser o número
5. Essa probabilidade é calculada pela Eq. (1):
Logo, .
WWW.UNINGA.BR 57
EDUCAÇÃO A DISTÂNCIA
Exemplo 18
De um baralho francês com 52 cartas, são retiradas, sem reposição, três cartas. Qual a
probabilidade de que as três cartas sejam de paus?
Solução: seja A o evento de sortear aleatoriamente a primeira carta de paus do baralho. Assim,
P(A) é calculada pela Eq. (1):
Exemplo 19
Andressa tem três pretendentes: André, José e Ricardo. A probabilidade de que André convide
Andressa para um jantar é de 1/4, enquanto as mesmas probabilidades para José e Ricardo
são 1/3 e 1/2, respectivamente. Caso as pretensões entre os pretendentes sejam independentes
entre si, qual a probabilidade de que Andressa não seja convidada para um jantar por nenhum
de seus pretendentes?
Solução: a probabilidade de Andressa não ser convidada para um jantar por qualquer um de
seus pretendentes constitui um evento independente. Sejam A, J e R os eventos de Andressa
não ser convidada para jantar por André, José e Ricardo, respectivamente.
Temos que , e , respectivamente. Daí, a probabilidade
de que Andressa não seja convidada para um jantar por nenhum de seus pretendentes é
.
WWW.UNINGA.BR 58
EDUCAÇÃO A DISTÂNCIA
Até agora, aplicamos a regra da multiplicação para situações em que os eventos são
independentes. No entanto, há outra situação importante a ser levada em consideração: são as
situações em que temos de ajustar a probabilidade do segundo evento para refletir o resultado
do primeiro, isto é, os eventos são dependentes. Essa situação é denominada de probabilidade
condicional.
Considere, agora, o experimento que seja constituído de dois eventos simples e
independentes, digamos X e Y. Estamos interessados em determinar a probabilidade de o evento
Y ocorrer dado que o evento X já ocorreu. Esse fato é denotado por , lê-se a probabilidade
de o evento Y ocorrer depois que o evento X ocorreu, e a Eq. (6) permite o cálculo dessa
probabilidade.
Eq. (6)
Exemplo 20
Após a escolha de uma bomba centrífuga defeituosa na primeira seleção, temos 29 restantes,
incluindo 5 defeituosas. Considere, agora, que Y seja o evento da seleção da segunda bomba
centrífuga defeituosa, dado que a primeira já foi feita. A probabilidade de a segunda ser
defeituosa é:
Logo, a probabilidade de que ambas sejam defeituosas é determinada usando-se a Eq. (6):
WWW.UNINGA.BR 59
EDUCAÇÃO A DISTÂNCIA
Exemplo 21
Seja B o evento de sortear aleatoriamente a segunda carta do baralho com naipe diferente do da
primeira retirada. Note que, nessa situação, há 39 possibilidades de escolha, porque um tipo de
naipe já saiu na primeira retirada, e eliminamos as 13 possibilidades do naipe sorteado. Assim,
WWW.UNINGA.BR 60
EDUCAÇÃO A DISTÂNCIA
Exemplo 22
Dentre as doenças transmitidas por mosquitos, a dengue é a que vem se alastrando mais
rapidamente pelo globo: em 50 anos, o número de casos aumentou 30 vezes, sendo que 70%
estão concentrados no Sudeste asiático e nas ilhas do Pacífico. Menos de 1% das infecções evolui
para óbito, mas, na última década, dez países entraram para a lista dos afetados pela doença,
tais como Sri Lanka, Nepal, Timor-Leste, Indonésia e Tailândia. A resistência dos mosquitos
aos inseticidas disponíveis e o surgimento do sorotipo 4 do vírus vêm desafiando a comunidade
científica a criar formas de contenção da doença. A Tabela 3 apresenta os resultados de um
exame para detecção da dengue (o método Elisa IgM e IgG), realizado em alguns pacientes em
um hospital público hipotético.
WWW.UNINGA.BR 61
EDUCAÇÃO A DISTÂNCIA
Esse resultado indica que o paciente que está contaminado tem 82,4% de probabilidade de
apresentar o resultado do exame positivo.
b) A probabilidade de o paciente estar contaminado, dado que o exame apresentou resultado
positivo, pode ser escrita como . Fazendo uso da Eq. (6), temos
WWW.UNINGA.BR 62
EDUCAÇÃO A DISTÂNCIA
Exemplo 23
A eficácia de um teste de laboratório para checar uma nova doença nas pessoas que
comprovadamente têm essa doença é de 85%. Esse mesmo teste, no entanto, produz um
falso-positivo (acusa positivo quando não tem comprovadamente a doença) da ordem de 2%.
Em uma comunidade, a incidência dessa doença é de 5%. Ao selecionar uma pessoa nessa
comunidade para realizar o teste, qual a probabilidade de que o resultado desse exame seja
positivo?
Solução: vamos resumir as informações do enunciado no diagrama de árvore da Figura 5.
WWW.UNINGA.BR 63
EDUCAÇÃO A DISTÂNCIA
Exemplo 24
Uma questão de Cálculo II é de múltipla escolha e tem cinco alternativas. Dos alunos de uma
turma de Engenharia, metade sabe resolver a questão, enquanto os demais “chutam” a resposta.
Um aluno da turma é escolhido ao acaso. Qual a probabilidade de que o aluno escolhido tenha
“chutado” a questão, dado que ele acertou a questão?
Observe, no diagrama de árvore, que 60% da turma podem acertar a questão, sendo que 10%
“chutaram”. Assim, a probabilidade de que o aluno escolhido tenha “chutado” a questão, dado
que ele acertou a questão, é calculada pela Eq. (6):
Portanto, a probabilidade de que o aluno escolhido tenha “chutado” a questão, dado que ele
acertou a questão, é de, aproximadamente, 16,7%.
Eq. (7)
WWW.UNINGA.BR 64
EDUCAÇÃO A DISTÂNCIA
Exemplo 25
Logo, a probabilidade de, pelo menos, um dos alunos acertar o problema é calculada pela Eq.
(7):
Exemplo 26
Fonte: O autor.
Na Tabela 4, que mostra a distribuição das idades dos alunos do 8º ano de uma escola, a média
aritmética das idades é igual a 13. A respeito desses estudantes e de suas idades, julgue o item
que segue.
“Se dois estudantes da turma forem aleatoriamente escolhidos para participar do coral da escola,
a probabilidade de pelo menos um deles ter menos de 13 anos de idade é igual a 8/13”.
Solução: note que a turma contém 40 alunos, sendo 15 com 12 anos e 25 com 13 anos ou mais.
Seja X o evento de o aluno selecionado ter 13 anos ou mais. Ao selecionar o primeiro aluno, a
probabilidade de ele ter 13 anos ou mais é:
Daí, a probabilidade de que ambos tenham 13 anos ou mais é calculada pela Eq. (5):
Logo, a probabilidade de que, pelo menos, um tenha menos de 13 anos é calculada por meio
da Eq. (7), como segue:
WWW.UNINGA.BR 65
EDUCAÇÃO A DISTÂNCIA
Exemplo 27
Em uma pescaria, os pescadores Alberto, Bruno e Carlos colocavam os peixes que pescavam
em um mesmo recipiente. Ao final da pescaria, o recipiente continha 16 piaus e 32 piaparas.
Na divisão dos peixes, cada um deles afirmou que teria pescado mais peixes que os outros dois.
Julgue o item a seguir a respeito dessa situação.
“Na situação dada, se 2 peixes fossem retirados do recipiente, aleatoriamente, a probabilidade
Daí, a probabilidade de que ambos sejam piaparas é calculada pela Eq. (5):
WWW.UNINGA.BR 66
EDUCAÇÃO A DISTÂNCIA
Definição 9 - Uma variável aleatória é uma variável que descreve o valor correspondente
ao resultado de um experimento, isto é, trata-se de uma variável que assume valor numérico único,
que é determinado pelo acaso para cada resultado de um experimento e, em geral, é representada
por x. A representação gráfica, de tabela e por equação da descrição da probabilidade para cada
valor da variável aleatória, é denominada de distribuição de probabilidade.
Definição 10 - Uma variável aleatória discreta é aquele tipo de variável cujos valores
assumidos são ou finito ou infinito enumerável. Por outro lado, uma variável aleatória contínua
é aquele tipo de variável que possui infinitos valores em uma escala contínua.
Exemplo 28
São exemplos de variáveis aleatórias discretas: o número de inadimplentes dentre 1.000 pessoas
WWW.UNINGA.BR 67
EDUCAÇÃO A DISTÂNCIA
Exemplo 29
Fonte: O autor.
Note que a probabilidade de não sair nenhuma coroa é de 1/4, a probabilidade de sair apenas
uma coroa é de ½, e a probabilidade de saírem duas coroas é de 1/4. Note, também, que
Eq. (8)
WWW.UNINGA.BR 68
EDUCAÇÃO A DISTÂNCIA
Eq. (9)
Eq. (10)
Eq. (11)
WWW.UNINGA.BR 69
EDUCAÇÃO A DISTÂNCIA
Exemplo 30
Fonte: O autor.
Logo, a média ou esperança é igual a 1. Agora, vamos calcular a variância e, para isso,
construímos a Tabela 8.
Tabela 8 - Cálculo da variância da distribuição de probabilidade.
Fonte: O autor.
WWW.UNINGA.BR 70
EDUCAÇÃO A DISTÂNCIA
Exemplo 31
Em um call center, há 10 atendentes. Estudos preliminares garantem que a probabilidade de
um desses funcionários estar em atendimento é de 60%. Determine a função que descreve a
probabilidade de os atendentes estarem em atendimento.
Solução: segue que a probabilidade de:
i) nenhum atendente estar em atendimento é
ii) um atendente estar em atendimento é
iii) dois atendentes estarem em atendimento é
iv) três atendentes estarem em atendimento é
v) quatro atendentes estarem em atendimento é
vi) cinco atendentes estarem em atendimento é
vii) seis atendentes estarem em atendimento é
viii) sete atendentes estarem em atendimento é
ix) oito atendentes estarem em atendimento é
x) nove atendentes estarem em atendimento é
Fonte: O autor.
WWW.UNINGA.BR 71
EDUCAÇÃO A DISTÂNCIA
Exemplo 32
Exemplo 33
A proporção de álcool em certo composto pode ser considerada uma variável aleatória, com a
seguinte função de densidade: f(x) = ax3(1-x), 0 ≤ x ≤ 1. Nessas condições, determine o valor
de a.
Solução: sabemos que, se x assume todos os valores possíveis em [0, 1], então, .A
variável aleatória em apreço é contínua e, dessa maneira, devemos ter que:
Portanto, a = 20.
WWW.UNINGA.BR 72
EDUCAÇÃO A DISTÂNCIA
Exemplo 34
Uma regra empírica e simples, que nos permite compreender melhor a ideia do desvio-
padrão, é a regra empírica da amplitude. Essa regra afirma que, para muitos conjuntos de dados,
a maior parte dos valores amostrais está localizada até dois desvios-padrão da média. Assim:
WWW.UNINGA.BR 73
EDUCAÇÃO A DISTÂNCIA
Exemplo 35
Em uma urna, há seis bolas idênticas em tamanho e textura, mas que se diferem pela cor. Desse
total de bolas, há quatro pretas e duas brancas. Determine a distribuição de probabilidade da
variável aleatória X, tal que X é o evento de se obter duas bolas brancas dentre as disponíveis.
Solução: primeiramente, vamos construir o espaço amostral e determinar a probabilidade de
o evento X ocorrer em cada situação.
{B,P,B}
As duas bolas brancas saem
em três retiradas
{P,B,B}
{B,P,P,B}
{P,B,P,B}
{B,P,P,P,B}
{P,B,P,P,B}
As duas bolas brancas saem
em cinco retiradas
{P,P,B,P,B}
{P,P,P,B,B}
{B,P,P,P,P,B}
{P,B,P,P,P,B}
{P,P,P,B,P,B}
{P,P,P,P,B,B}
WWW.UNINGA.BR 74
EDUCAÇÃO A DISTÂNCIA
A média, a variância e o desvio-padrão são calculados pelas Eq. (8), (9) e (10), respectivamente,
e são apresentados a seguir:
WWW.UNINGA.BR 75
EDUCAÇÃO A DISTÂNCIA
A análise dos resultados dessa regra empírica nos permite concluir que o resultado de se
obterem duas bolas brancas, dentre as seis disponíveis, deveria, usualmente, ficar entre 2,17 e
7,17. Como há 6 bolas no interior da urna, seria incomum obter como resultado que as duas
bolas brancas saíssem em apenas duas retiradas (pois o valor 2 está fora do intervalo de valores
usuais: 2,17 a 7,17). Observe ainda que, para o valor de 7 ou mais, temos um evento impossível,
pois só temos 6 bolas. Assim, o valor máximo usual é 6, pois é o maior valor possível para o
número de bolas no interior da urna.
Eq. (12)
fracasso e .
WWW.UNINGA.BR 76
EDUCAÇÃO A DISTÂNCIA
Exemplo 36
Gregor Mendel, em 1865, apresentou uma teoria segundo a qual, quando há duas caracterís-
ticas a serem herdadas, uma delas será dominante, e a outra será recessiva. Para validar sua
teoria, Mendel fez um experimento usando ervilhas que podem ter vagens verdes ou amarelas.
Admita que a probabilidade de uma ervilha vir a ter vagem verde seja de 0,75. Determine a
probabilidade de exatamente 4 ervilhas com vagens verdes gerarem 6 proles.
Portanto, a probabilidade de se obterem exatamente 4 ervilhas com vagens verdes entre 6 pro-
les é de 0,297.
Um torno mecânico descalibrado vem apresentando 15% de defeitos. Para uma amostra de 20
peças produzidas, qual é a probabilidade de se obterem exatamente duas peças produzidas com
defeito?
WWW.UNINGA.BR 77
EDUCAÇÃO A DISTÂNCIA
Exemplo 38
Um dado é lançado três vezes. Qual a probabilidade de que a face 4 apareça ao menos uma vez?
Eq. (13)
Nela, é a média.
Eq. (14)
Nela, é a variância.
WWW.UNINGA.BR 78
EDUCAÇÃO A DISTÂNCIA
Exemplo 39
Quando um pesquisador vai a campo e aborda pessoas na rua para serem entrevistadas, o nú-
mero de pessoas que aceitam responder à pesquisa segue uma distribuição binomial. O valor
esperado dessa distribuição é 8, e sua variância é 1,6. Nessas condições, determine a probabili-
dade de uma pessoa aceitar responder à pesquisa.
Solução: segue, do enunciado, que e Substituindo a Eq. (13) na Eq. (14), temos
que:
Eq. (15)
WWW.UNINGA.BR 79
EDUCAÇÃO A DISTÂNCIA
Exemplo 40
O número médio de erros de digitação cometidos por um digitador é de quatro por página. Se
mais que quatro erros aparecem em uma página, o digitador deve redigitar novamente toda
a página. Qual a probabilidade de uma página selecionada aleatoriamente não precisar ser
redigitada?
Solução: seja X o número de erros cometidos pelo digitador por página. Temos que .
Para não precisar redigitar uma página, ela poderá conter até 4 erros. Assim:
Exemplo 41
Solução: seja Y o número de vendas efetuadas. Assim, o número de vendas esperadas pelo
engenheiro é . A probabilidade de esse engenheiro agrônomo efetuar,
pelo menos, uma venda é calculada como:
Portanto, a probabilidade de ele efetuar ao menos uma venda nos 100 contatos é de,
aproximadamente, 95,0%.
WWW.UNINGA.BR 80
EDUCAÇÃO A DISTÂNCIA
Exemplo 42
Em um posto de gasolina, entram para abastecer, em média, 60 carros por hora. Qual a
probabilidade de, a cada 5 minutos, entrarem nesse posto para abastecer pelo menos 3 carros?
Solução: seja X o número que entra no posto para abastecer a cada 5 minutos. Temos que
Aplicando a Eq. (11) para o cálculo de P(0), P(1) e P(2), segue que:
(a) 0,594 (b) 0,910 (c) 0,766 (d) 0,628 (e) 0,750
Aplicando a Eq. (13) para o cálculo de P(0), P(1) e P(2), segue que:
WWW.UNINGA.BR 81
EDUCAÇÃO A DISTÂNCIA
Eq. (16)
WWW.UNINGA.BR 82
EDUCAÇÃO A DISTÂNCIA
Figura 10 – Distribuições normais para alguns valores de média e variância. Fonte: O autor.
Figura 11 – A curva da distribuição normal e a regra para identificar valores outliers. Fonte: O autor.
A análise da Figura 11 nos permite afirmar que, em um conjunto de dados, valores que
distam até um desvio-padrão da média são relativamente comuns (algo em torno de 68%). Por
outro lado, dados com valores acima de três desvios-padrões da média são muito improváveis,
tanto que podemos rotulá-los como outliers, ocorrendo com probabilidade de 0,3%.
Obviamente, não precisamos nos limitar à medida da distância em relação à média
em números inteiros de desvios-padrões. Com um pouco de algebrismo, podemos estimar a
probabilidade de observar valores acima de k desvios-padrões da média. Dessa forma, podemos
comparar a raridade de dois valores (mesmo que provenientes de duas distribuições distintas)
comparando quantos desvios-padrões eles estão afastados de suas respectivas médias. Essa
medida, em números de desvios-padrões ( ) que a variável x está de sua média ( ), é denominada
de z-score e é definida como:
WWW.UNINGA.BR 83
EDUCAÇÃO A DISTÂNCIA
Eq. (17)
Exemplo 44
Portanto, dessa maneira, a área abaixo da curva da distribuição normal até z = 0,75 é igual a
0,7734 unidades de área e denotamos isso por
b)
WWW.UNINGA.BR 84
EDUCAÇÃO A DISTÂNCIA
Portanto,
c)
Assim,
WWW.UNINGA.BR 85
EDUCAÇÃO A DISTÂNCIA
Exemplo 45
Solução: estamos interessados em determinar o z-score para a situação em que a área acumulada
é a partir da esquerda até a linha z-score é de 0,9793. Observe a Figura 19.
b)
Solução: estamos interessados em determinar o z-score para a situação em que a área acumulada
é a partir da esquerda até a linha z-score seja igual de 0,2546. Observe a Figura 21.
WWW.UNINGA.BR 86
EDUCAÇÃO A DISTÂNCIA
Solução: estamos interessados em determinar o z-score para a situação em que a área acumulada
é a partir da linha do z-score para direita. Observe que a área não hachurada é de 0,8849 (1 –
0,1151). Observe a Figura 23.
d)
Solução: estamos interessados em determinar o z-score para a situação em que a área acumulada
é a partir da linha do z-score para direita. Note que a área não hachurada é de 0,0559 (1 –
0,9441). Observe a Figura 25.
WWW.UNINGA.BR 87
EDUCAÇÃO A DISTÂNCIA
Exemplo 46
Em um exame nacional, a média dos estudantes foi de 1020, com desvio-padrão de 90.
Assumindo que as notas sejam normalmente distribuídas, determine a probabilidade de, ao se
selecionar ao acaso um estudante, ele apresente nota superior a 1200.
WWW.UNINGA.BR 88
EDUCAÇÃO A DISTÂNCIA
Exemplo 47
Geometricamente, a probabilidade de, ao selecionar ao acaso um paciente que faça esse exame e
o tempo transcorrido para que o tempo seja de até 80 minutos, corresponde à região hachurada
na Figura 27, isto é, a região à esquerda da reta de z = -0,94.
WWW.UNINGA.BR 89
EDUCAÇÃO A DISTÂNCIA
Exemplo 48
A distribuição dos níveis de colesterol total em mulheres, entre 20 e 34 anos, segue distribuição
normal, com média de 186 miligramas por decilitro e o desvio-padrão de 35,8 miligramas por
decilitro. Encontre a probabilidade de que uma mulher entre 20 e 34 anos seja selecionada
aleatoriamente e apresente a taxa de colesterol total entre 200 e 239 miligramas por decilitro.
Solução: depreende-se do enunciado que miligramas por decilitro,
miligramas por decilitros e queremos determinar a probabilidade de, ao selecionar ao acaso
uma mulher entre 20 e 34 anos, que ela apresente taxa de colesterol total entre 200 e 239
miligramas por decilitro, . Inicialmente, calculamos os z-scores:
WWW.UNINGA.BR 90
EDUCAÇÃO A DISTÂNCIA
Exemplo 49
Durante um período, registrou-se, em uma fábrica, a quantidade diária de óleo (Q), em litros,
consumida para a produção de um produto. Concluiu-se que a população formada por essas
quantidades é normalmente distribuída com média igual a 50 litros por dia. Sabe-se que 5%
dos valores dessas quantidades são inferiores a 41,8 litros, e 90% possuem um valor de, no
máximo, x litros. Determine o valor de x, em litros.
Solução: depreende-se do enunciado que litros, e 5% das quantidades são inferiores
a 41,8 litros. Esses 5% inferiores correspondem ao z-score de - 1,64 (busque esse resultado na
tabela de z-score no anexo). Assim, determinamos o desvio-padrão:
Agora, 90% dos valores possuem um máximo de x litros. Daí, z-score é 1,28 (busque por esse
valor na tabela de z-score no anexo):
Em um concurso público, serão chamados para contratação imediata 20% dos candidatos com
as maiores notas. As notas seguem uma distribuição normal, com média 5,5 e desvio-padrão
3. Determine a nota mínima para que o candidato seja chamado para contratação imediata.
Solução: depreende-se do enunciado que e . Note que, se 20% dos candidatos
com as maiores notas serão chamados de forma imediata, então, 80% não serão chamados de
forma imediata. Assim, na tabela de z-score, buscamos pelo valor de área mais próximo de
0,80. Isso corresponde a um valor de z-score próximo de 0,85 (confira esse resultado na tabela
de z-score que está anexa). Daí, se N denota a variável nota, temos que:
Portanto, a nota que o candidato necessita para ser chamado de imediato no concurso público
é igual a 8,0.
WWW.UNINGA.BR 91
EDUCAÇÃO A DISTÂNCIA
WWW.UNINGA.BR 92
EDUCAÇÃO A DISTÂNCIA
CONSIDERAÇÕES FINAIS
WWW.UNINGA.BR 93
UNIDADE ENSINO A DISTÂNCIA
03
DISCIPLINA:
ESTATÍSTICA E PROBABILIDADE
INTERVALOS DE CONFIANÇA
E TESTE DE HIPÓTESE
PROF. DR. RICARDO CARDOSO DE OLIVEIRA
SUMÁRIO DA UNIDADE
INTRODUÇÃO................................................................................................................................................................ 95
1. TEORIA DA ESTIMAÇÃO DE PARÂMETROS........................................................................................................... 96
2. ESTIMAÇÃO POR INTERVALO................................................................................................................................97
2.1 ESTIMAÇÃO POR INTERVALOS DE CONFIANÇA DA MÉDIA.............................................................................. 98
2.2 ESTIMAÇÃO POR INTERVALOS DE CONFIANÇA DA PROPORÇÃO POPULACIONAL.....................................104
3. TESTE DE HIPÓTESE...............................................................................................................................................106
3.1 CONSTRUÇÃO DE UM TESTE DE HIPÓTESE PARA MÉDIA POPULACIONAL...................................................107
3.2 CONSTRUÇÃO DE UM TESTE DE HIPÓTESE PARA PROPORÇÃO POPULACIONAL.......................................114
CONSIDERAÇÕES FINAIS............................................................................................................................................116
WWW.UNINGA.BR 94
EDUCAÇÃO A DISTÂNCIA
INTRODUÇÃO
WWW.UNINGA.BR 95
EDUCAÇÃO A DISTÂNCIA
WWW.UNINGA.BR 96
EDUCAÇÃO A DISTÂNCIA
WWW.UNINGA.BR 97
EDUCAÇÃO A DISTÂNCIA
Objetivo
Construir um intervalo de confiança que contenha a média populacional, ou seja, obter um
intervalo do tipo: em que E é a margem de erro.
Requisitos
i) A amostra é aleatória simples;
ii) O desvio-padrão populacional é conhecido;
iii) A população segue distribuição normal.
ou
ou
Fonte: O autor.
WWW.UNINGA.BR 98
EDUCAÇÃO A DISTÂNCIA
Passo 2 Determine o valor crítico , que corresponde ao nível de confiança desejado. Usar
a tabela do Anexo 2.
Passo 3
Calcular a margem de erro:
Passo 4 De posse dos valores da margem de erro (E) e da média amostral, , determine os
limitantes do intervalo de confiança: e .
Fonte: O autor.
A altura de uma amostra de 49 mulheres segue distribuição normal, com média 1,60 m e
variância 0,0036 m2. Determine o intervalo de confiança que contenha a média da população
de mulheres, com 95% de confiança.
Figura 2 – Construção do intervalo de confiança com 95% de nível de confiança. Fonte: O autor.
WWW.UNINGA.BR 99
EDUCAÇÃO A DISTÂNCIA
Portanto, com 95% de confiança, você pode dizer que a média das alturas de todas as mulheres
está entre 1,58 e 1,62 cm.
Os valores críticos são valores que separam amostras estatísticas prováveis das
amostras estatísticas improváveis.
Figura 3 – Construção do intervalo de confiança com 90% de nível de confiança. Fonte: O autor.
WWW.UNINGA.BR 100
EDUCAÇÃO A DISTÂNCIA
Assim, com 90% de confiança, você pode dizer que a média das alturas das mudas nativas do
Pantanal está entre 14,96 e 15,04 cm. Portanto, com 90% de confiança, a amplitude do intervalo
de confiança para a média é .
Exemplo 3
Logo, necessitamos de uma amostra aleatória simples de, pelo menos, 97 alunos de Medicina
Veterinária. Com essa amostra aleatória simples de 97 alunos de Medicina Veterinária, teremos
95% de confiança de que a média amostral estará a menos de 3 pontos de QI da verdadeira
média populacional .
WWW.UNINGA.BR 101
EDUCAÇÃO A DISTÂNCIA
Requisitos
i) A amostra é aleatória simples;
ii) A população segue distribuição normal.
ou
ou
Fonte: O autor.
WWW.UNINGA.BR 102
EDUCAÇÃO A DISTÂNCIA
Passo 3
Calcular a margem de erro:
Passo 4 De posse dos valores da margem de erro (E) e da média amostral, , determine os
limitantes do intervalo de confiança: e .
Fonte: O autor.
WWW.UNINGA.BR 103
EDUCAÇÃO A DISTÂNCIA
Objetivo
Construir um intervalo de confiança para se estimar uma proporção populacional.
Requisitos
i) A amostra é aleatória simples;
ii) A população segue distribuição binomial (aquela em que há duas categorias de resultados);
iii) As proporções de “sucesso” e “fracasso” são conhecidas.
Determinação do intervalo de confiança
ou
ou
Fonte: O autor.
WWW.UNINGA.BR 104
EDUCAÇÃO A DISTÂNCIA
Passo 2
Use a tabela do anexo 2 para determinar
Passo 4 De posse dos valores da margem de erro (E) e da proporção amostral, , determine
os limitantes do intervalo de confiança: e .
Fonte: O autor.
Exemplo 5
Solução:
a) Segue do enunciado que e, ainda, a variável estudada segue distribuição
normal (condições do passo 1 são verificadas).
WWW.UNINGA.BR 105
EDUCAÇÃO A DISTÂNCIA
3. TESTE DE HIPÓTESE
alternativa (H1) é aquela que sugere a não igualdade (>, < ou ≠) do valor 0
para o parâmetro
populacional , ou a não igualdade de dois parâmetros 1
e 2
(>, < ou ≠).
Fonte: O autor.
O problema aqui consiste em rejeitar, ou não, a hipótese nula com base numa amostra
aleatória, convenientemente selecionada. Como vamos tomar decisões baseadas em uma amostra,
estaremos sujeitos a cometer dois tipos de erros que, comparados, podem ser mais ou menos
graves. A saber:
• erro tipo I: ocorre se a hipótese nula é rejeitada quando é verdadeira. A probabilidade deste
tipo de erro é denotada por:
• erro tipo II: ocorre se a hipótese nula não é rejeitada quando é falsa. A probabilidade deste
tipo de erro é denotada por:
WWW.UNINGA.BR 106
EDUCAÇÃO A DISTÂNCIA
estatisticamente significativas. Para medir essas diferenças, usamos a estatística do teste obtida
da distribuição de , que é o estimador de .
ou
WWW.UNINGA.BR 107
EDUCAÇÃO A DISTÂNCIA
Figura 4 – Regiões críticas para teste de hipótese: (A) unilateral à esquerda, (B) bilateral, (C) unilateral à direita.
Fonte: O autor.
Exemplo 6
Um pesquisador deseja testar se a renda do filho primogênito é maior que a renda média de
seus irmãos. Formula a hipótese nula Ho de que a diferença de rendas (d) = 0 e a hipótese
alternativa H1, d > 0, isto é, a de que a renda do primogênito seja maior que a média das rendas
dos irmãos. Desse modo, o(a)
(A) erro do tipo I consiste em aceitar Ho se Ho for falsa.
(B) erro do tipo II consiste em rejeitar Ho se Ho for verdadeira.
(C) poder do teste diminui com o tamanho da amostra.
(D) probabilidade do erro do tipo II é igual a (1 – poder do teste).
(E) probabilidade do erro do tipo II ou do tipo I é chamada de nível de significância do teste.
Solução: temos que o erro do tipo I ocorre quando a hipótese nula é rejeitada quando é
verdadeira, e o erro do tipo II ocorre quando a hipótese nula não é rejeitada quando é falsa.
A probabilidade de se cometer o erro tipo I, ou seja, de rejeitar a hipótese H0 quando ela é
verdadeira, é denominada de nível de significância do teste. Temos, ainda, que o poder do
teste aumenta com o tamanho da amostra. Assim, resta-nos a alternativa (D).
WWW.UNINGA.BR 108
EDUCAÇÃO A DISTÂNCIA
Exemplo 7
Solução: note que temos 30 amostras, e o desvio-padrão é conhecido. Vamos seguir as quatro
etapas. Acompanhe:
Etapa 1: escrever a formulação das hipóteses.
WWW.UNINGA.BR 109
EDUCAÇÃO A DISTÂNCIA
Figura 6 – Esboço da região crítica e localização do valor de nessa região. Fonte: O autor.
Etapa 4: decisão.
Note que o valor de está fora da região crítica. Portanto, pode-se afirmar,
com 95% de certeza, que não será necessário parar a linha de produção para calibração.
WWW.UNINGA.BR 110
EDUCAÇÃO A DISTÂNCIA
Exemplo 8
O rótulo das garrafas de certo refrigerante indica que o seu conteúdo corresponde ao volume
de 290 mL. A variável aleatória que representa o volume de líquido no interior dessas garrafas
é X. A máquina que enche essas garrafas o faz segundo uma distribuição normal, com média
e variância igual a 36 mL2, qualquer que seja o valor de . A máquina foi regulada para = 290
mL. Semanalmente, uma amostra de 9 garrafas é colhida para verificar se a máquina está, ou
não, desregulada para mais ou para menos. Para isso, constrói-se um teste de hipótese bilateral,
no qual:
O nível de significância do teste foi fixado em . A hipótese nula não será rejeitada se a média
apresentada pela amostra estiver entre 285,66 mL e 294,34 mL. Nessas condições, determine o
valor do nível de significância do teste ( ).
e, ainda:
Daí, traçamos a seguinte curva normal, que mostra a região de aceitação da Ho, a zona de
rejeição da Ho e os valores de Ztestes, como ilustrado na Figura 7.
WWW.UNINGA.BR 111
EDUCAÇÃO A DISTÂNCIA
Exemplo 9
WWW.UNINGA.BR 112
EDUCAÇÃO A DISTÂNCIA
Etapa 4: decisão.
Note que o valor de está dentro da região crítica, e rejeitamos a hipótese
nula. Portanto, pode-se afirmar, com 95% de certeza, que a média do preço do equipamento de
ultrassom seja inferior a R$ 23.900,00.
WWW.UNINGA.BR 113
EDUCAÇÃO A DISTÂNCIA
WWW.UNINGA.BR 114
EDUCAÇÃO A DISTÂNCIA
Exemplo 10
Um produtor afirma que a proporção de pés de laranja contaminados com certa doença em
sua propriedade é de apenas 12%. Em um estudo com uma amostra com 100 elementos,
selecionados aleatoriamente, 18 apresentaram a doença. Existe evidência amostral para
contestar a afirmação do produtor, ao nível de significância de 5%?
Etapa 4: decisão.
Como pertence à região crítica, rejeitamos a hipótese H0. Logo, pelos dados
amostrais, existe evidência amostral para contestar a afirmação do produtor, ao nível de
significância de 5%.
WWW.UNINGA.BR 115
EDUCAÇÃO A DISTÂNCIA
CONSIDERAÇÕES FINAIS
WWW.UNINGA.BR 116
UNIDADE ENSINO A DISTÂNCIA
04
DISCIPLINA:
ESTATÍSTICA E PROBABILIDADE
CORRELAÇÃO E REGRESSÃO
PROF. DR. RICARDO CARDOSO DE OLIVEIRA
SUMÁRIO DA UNIDADE
INTRODUÇÃO................................................................................................................................................................118
1. CORRELAÇÃO DE DADOS.........................................................................................................................................119
2. REGRESSÃO LINEAR...............................................................................................................................................122
CONSIDERAÇÕES FINAIS............................................................................................................................................127
WWW.UNINGA.BR 117
EDUCAÇÃO A DISTÂNCIA
INTRODUÇÃO
WWW.UNINGA.BR 118
EDUCAÇÃO A DISTÂNCIA
1. CORRELAÇÃO DE DADOS
Dizemos que duas variáveis estão ligadas por uma relação estatística quando existe
correlação entre elas, ou seja, existe correlação entre duas variáveis quando os valores de uma
variável estão relacionados, de alguma maneira, aos valores de outra variável.
Vejamos alguns exemplos: a idade e a altura das crianças; o tempo de prática de esportes
e o ritmo cardíaco; o tempo de estudo e a nota na prova; a taxa de desemprego e a taxa de
criminalidade; a expectativa de vida e a taxa de analfabetismo; a taxa de juros e a inflação.
Assim, para Larson e Farber (2010), uma correlação é uma relação entre duas variáveis.
Os dados podem ser representados por pares ordenados (x,y), em que x é a variável independente
(ou explanatória), e y é a variável dependente (ou resposta).
As variáveis altura e peso de uma criança recém-nascida, por exemplo, apresentam-se, em
geral, correlacionadas positivamente, pois, quase sempre, a criança que “ganha altura” também
“ganha peso”. Por outro lado, no Brasil, a variável renda familiar e o número de elementos da
família costumam se apresentar correlacionados negativamente, pois as famílias de baixa renda,
em geral, tendem a ter mais filhos do que as de alta renda.
A Figura 1 ilustra algumas correlações.
Quando se trabalha com duas variáveis, diz-se correlação e regressão simples. Quando
se trabalha com mais de duas variáveis, fala-se de correlação e regressão múltipla.
Antes de realizar qualquer análise estatística formal sobre regressão, devemos usar um
diagrama de dispersão para explorar os dados coletados visualmente. Coletam-se dados exibindo
os valores correspondentes das variáveis. Assim, faz-se o gráfico com os dados coletados em um
sistema de coordenadas retangulares. O conjunto resultante é chamado diagrama de dispersão,
que é uma maneira de visualizarmos se duas variáveis se apresentam correlacionadas. Veja a
Figura 1, anterior.
WWW.UNINGA.BR 119
EDUCAÇÃO A DISTÂNCIA
Depreende-se da Figura 2 que existe correlação positiva entre as variáveis “gastos com
propaganda” e “vendas”, ou seja, o aumento nos gastos com propaganda ocasiona aumento nas
vendas da loja.
WWW.UNINGA.BR 120
EDUCAÇÃO A DISTÂNCIA
Eq. 01
Fonte: O autor.
WWW.UNINGA.BR 121
EDUCAÇÃO A DISTÂNCIA
Daí, fazendo uso da Eq. 01, segue que o valor do coeficiente de correlação de Pearson é:
2. REGRESSÃO LINEAR
Eq. 02
Eq. 03
Eq. 04
WWW.UNINGA.BR 122
EDUCAÇÃO A DISTÂNCIA
WWW.UNINGA.BR 123
EDUCAÇÃO A DISTÂNCIA
Vamos fazer outro exemplo para sedimentar o conhecimento acerca da regressão linear.
Acompanhe.
Exemplo 1
Fonte: O autor.
Solução:
a) De posse dos valores da Tabela 3, podemos empregar um software (Excel, por exemplo) e
compor o diagrama de dispersão, que está apresentado na Figura 3.
Depreende-se da Figura 3 que existe uma relação linear entre as variáveis estudadas. Para
determinar os demais itens, vamos construir a Tabela 4, como segue.
WWW.UNINGA.BR 124
EDUCAÇÃO A DISTÂNCIA
Fonte: O autor.
d) O coeficiente de determinação é:
E, de acordo com o modelo especificado, 99,2% das variações da quantidade de soja produzida
são explicadas pelas variações da quantidade de fertilizante empregadas, e 0,8% das variações
da quantidade de soja produzida são explicadas por outras variáveis ou combinações de outras
variáveis.
WWW.UNINGA.BR 125
EDUCAÇÃO A DISTÂNCIA
WWW.UNINGA.BR 126
EDUCAÇÃO A DISTÂNCIA
CONSIDERAÇÕES FINAIS
WWW.UNINGA.BR 127
ENSINO A DISTÂNCIA
REFERÊNCIAS
AMAZON. Estatística Aplicada. 2016. Disponível em: https://www.amazon.com.br/
Estat%C3%ADstica-aplicada-Ron-Larson-ebook/dp/B01IPIN4YC. Acesso em: 1 mar. 2021.
G1. Emissões mundiais de CO² sobem em 2011 e batem recorde, diz Instituto. 2012. Disponível
em: http://g1.globo.com/natureza/noticia/2012/11/emissoes-mundiais-de-co2-sobem-em-2011-
e-batem-recorde-diz-instituto.html. Acesso em: 25 fev. 2021.
LARSON, R.; FARBER, B. Estatística aplicada. 6. ed. São Paulo: Pearson, 2016.
UOL NOTÍCIAS. Dez países emitem quase 70% dos gases do efeito estufa do mundo. 2015.
Disponível em: https://noticias.uol.com.br/ciencia/infograficos/2015/12/06/dez-paises-emitem-
quase-70-dos-gases-do-efeito-estufa-do-mundo.htm. Acesso em: 25 fev. 2021.
WWW.UNINGA.BR 128
ENSINO A DISTÂNCIA
ANEXOS
ANEXO 1 – Números aleatórios
WWW.UNINGA.BR 129
ENSINO A DISTÂNCIA
ANEXOS
ANEXO 2 – Tabela Normal Reduzida
Tabela da Distribuição Normal Padrão
P(Z<z)
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
WWW.UNINGA.BR 130
ENSINO A DISTÂNCIA
ANEXOS
ANEXO 3 – Distribuição t de Student
WWW.UNINGA.BR 131