Escolar Documentos
Profissional Documentos
Cultura Documentos
Probabilidades
Bráulio Roberto Gonçalves Marinho Couto
Janaína Giovani Noronha de Oliveira
Octávio Alcântara Torres
Reinaldo Carvalho de Morais
Bráulio Roberto Gonçalves Marinho Couto
Janaína Giovani Noronha de Oliveira
Octávio Alcântara Torres
Reinaldo Carvalho de Morais
ESTATÍSTICA E PROBABILIDADES
Belo Horizonte
Junho de 2015
COPYRIGHT © 2015
GRUPO ĂNIMA EDUCAÇÃO
Todos os direitos reservados ao:
Grupo Ănima Educação
Todos os direitos reservados e protegidos pela Lei 9.610/98. Nenhuma parte deste livro, sem prévia autorização
por escrito da detentora dos direitos, poderá ser reproduzida ou transmitida, sejam quais forem os meios
empregados: eletrônicos, mecânicos, fotográficos, gravações ou quaisquer outros.
Edição
Grupo Ănima Educação
Vice Presidência
Arthur Sperandeo de Macedo
Coordenação de Produção
Gislene Garcia Nora de Oliveira
Ilustração e Capa
Alexandre de Souza Paz Monsserrate
Leonardo Antonio Aguiar
Equipe EaD
Conheça
o Autor
Bráulio Roberto Gonçalves Marinho Couto é
doutor em Bioinformática, mestre em Ciência
da Computação, especialista em Estatística,
bacharel em Engenharia Química e técnico
em Química. Atuante nas áreas de Estatística,
Cálculo Numérico, Informática em Saúde,
Epidemiologia Hospitalar e Bioinformática.
Professor do Centro Universitário de Belo
Horizonte (UniBH).
Conheça
a Autora
Janaína Giovani Noronha de Oliveira
é mestre em Estatística e graduada
em Licenciatura em Matemática com
Habilitação em Física. Possui experiência
como docente na área de Matemática e
Estatística do Ensino superior e médio.
Experiência com orientação de Monografias.
Conheça
o Autor
Octávio Alcântara Torres é bacharel em
Estatística e mestre em Demografia. Possui
experiência nas áreas de probabilidade
e estatística, regressão e correlação,
análise estatística multivariada e controle
estatístico de processo. Áreas de interesse:
projeções populacionais, projeções de mão
de obra qualificada, pesquisa de mercado,
estatística aplicada.
Conheça
o Autor
Reinaldo Carvalho de Morais é mestre e
bacharel em Administração Pública, graduado
em Estatística e especialista em Gestão
Financeira. Possui experiência em pesquisas
sobre economia e finanças públicas mineiras,
bem como docência nas disciplinas de
estatística, de economia, de engenharia
econômica, de matemática financeira e de
administração da produção.
Apresentação
da disciplina
Egressos de cursos de Engenharia e Tecnologia são profissionais que
resolvem problemas. E como isso ocorre? Pela aplicação eficiente
do método científico. Pois bem, é disso que se trata essa disciplina:
apresentar ferramentas estatísticas que possibilitarão a você
transformar-se num especialista em qualquer área do conhecimento
e, portanto, apto a resolver problemas. A disciplina é dividida em oito
unidades cujo objetivo é introduzir o aluno na área da Estatística e
Probabilidades, tornando-o capaz de planejar e de executar experimentos
de pequeno e médio porte nas áreas de Ciências Exatas e de Engenharia.
Além de fazer a análise exploratória dos dados e de realizar inferências,
por meio da tomada de decisão na presença de incerteza.
Bom trabalho!
UNIDADE 2 023
Análise exploratória de dados 024
Síntese gráfica de dados 026
Síntese tabular de dados 047
Síntese numérica de dados 048
Revisão 059
UNIDADE 3 061
Introdução à teoria de probabilidades 062
A teoria das probabilidades 064
Probabilidade clássica e probabilidade frequentista 066
Leis básicas de probabilidades 067
União e interseção de eventos 068
Tabelas de contingência 070
Eventos independentes 072
Teorema de Bayes 072
Revisão 076
UNIDADE 4 079
Modelos probabilísticos 080
Variáveis aleatórias 081
Modelos probabilísticos 088
Distribuição binomial 088
Distribuição Poisson 089
Distribuição normal 090
Revisão 095
UNIDADE 5 096
Estimação de médias e proporções 097
Teorema central do limite 099
Estimação pontual e por intervalos de confiança para uma
média populacional 103
Estimação pontual e por intervalos de confiança para uma
proporção populacional 112
Uso do Excel no cálculo de intervalos de confiança para
média e proporção 116
Introdução ao programa EpiInfo 120
Revisão 121
UNIDADE 6 124
Planejamento de experimentos 125
Cálculo de tamanho de amostra baseado em intervalos de
confiança para uma proporção 127
Cálculo de tamanho de amostra baseado em intervalos de confiança
para uma média 132
Planejamento de experimentos 135
Planejamento de experimentos - terminologia básica 140
Revisão 144
UNIDADE 7 147
Testes de Hipóteses 148
A construção e o significado de uma hipótese estatística 149
Testes para uma amostra 151
Testes para duas ou mais amostras 167
Revisão 172
UNIDADE 8 174
Análise de correlação e regressão 175
Análise de correlação 176
Regressão linear simples 185
Regressão linear múltipla 193
Revisão 200
REFERÊNCIAS 202
Introdução à
estatística
Introdução
Conceitos
básicos
Você sabe o que é população? E amostra? Vejamos o exemplo a seguir.
Vamos supor que uma cozinheira esteja preparando dois litros de sopa.
006
unidade 1
ESTATÍSTICA E PROBABILIDADES
População:
007
unidade 1
ESTATÍSTICA E PROBABILIDADES
008
unidade 1
ESTATÍSTICA E PROBABILIDADES
Inferência População
amostrada
Amostra
Por que usar amostras? Por que não incluir no estudo todos os
indivíduos da população?
009
unidade 1
ESTATÍSTICA E PROBABILIDADES
010
unidade 1
ESTATÍSTICA E PROBABILIDADES
erroneamente que uma boa amostra deve conter pelo menos, digamos,
30% da população. O que a cozinheira diria disto? Para provar dois litros
de sopa, quanto de amostra ela teria que avaliar? Isso mesmo, uma pitada. Amostra
probabilística:
E para provar 400 litros de sopa, ela beberia um prato inteiro? Não. Ela
existe uma garantia,
provará a mesma pitada, pois sabe que, o mais importante nesse processo em termos de
inferencial não é o tamanho da amostra, mas provar uma amostra não probabilidade, de que
viciada, representativa de toda a sopa. qualquer membro
da população possa
ser selecionado para
Voltando aos processos de amostragem, as amostras podem ser amostra.
classificadas em probabilísticas e não probabilísticas:
Amostra probabilística:
011
unidade 1
ESTATÍSTICA E PROBABILIDADES
012
unidade 1
ESTATÍSTICA E PROBABILIDADES
E, por que esse conceito é tão importante? Porque, no fim das contas,
é a variável que é analisada e não a informação que ela contém. Por
isso, é importante que você, antes de sair coletando informações,
analise o seu questionário de coleta de dados, identifique cada variável
envolvida e responda perguntas, tais como: O que exatamente a
variável está medindo? Para que serve esta variável e, principalmente,
é possível analisá-la? E com que método estatístico?
Uma variável é a
quantificação de
uma característica
de interesse da
pesquisa (SOARES e
Uma variável é a quantificação de uma característica de interesse da SIQUEIRA, 2002).
pesquisa (SOARES e SIQUEIRA, 2002). Refere-se ao fenômeno a ser
Observe que, como o próprio nome diz, uma variável deve variar, ou seja,
013
unidade 1
ESTATÍSTICA E PROBABILIDADES
TIPOS CARACTERÍSTICAS
014
unidade 1
ESTATÍSTICA E PROBABILIDADES
Tipos de
variáveis
Se considerarmos a maioria absoluta das variáveis envolvidas em
experimentos de pequeno e médio porte nas áreas de Ciências
Exatas e Engenharia, teremos duas situações para o tipo da variável.
015
unidade 1
ESTATÍSTICA E PROBABILIDADES
016
unidade 1
ESTATÍSTICA E PROBABILIDADES
017
unidade 1
ESTATÍSTICA E PROBABILIDADES
<http://www.agriambi.com.br/revista/suplemento/index_arquivos/
PDF/181.pdf>
018
unidade 1
ESTATÍSTICA E PROBABILIDADES
tanques com efluente de frigorífico após passar num sistema de filtro com
Tratamentos: (A) controle (água potável + ração); (B) efluente tratado (efluente do sistema de
filtro de aguapé + ração)
Médias seguidas da mesma letra, na linha, não diferem significadamente pelo teste t de Student ao nível 5% de significância
019
unidade 1
ESTATÍSTICA E PROBABILIDADES
020
unidade 1
ESTATÍSTICA E PROBABILIDADES
Revisão
Vimos nessa unidade alguns dos principais tópicos introdutórios do
campo da Estatística. Em resumo, estudamos sobre:
Tipos de variáveis:
021
unidade 1
ESTATÍSTICA E PROBABILIDADES
022
unidade 1
Análise
exploratória
de dados
Introdução
Agora que você já tem acesso aos dados, qual o próximo passo para
resolvermos o problema de reprovação e abandono em Cálculo,
GAAL, Química Geral e AEDS? A primeira etapa de qualquer análise
estatística, ou melhor, a fase preliminar da busca das informações
agregadas a dados já coletados, é a análise exploratória dos
mesmos. Como o próprio nome diz, a análise exploratória dos
dados é o conjunto de ferramentas da Estatística Descritiva que têm
como objetivo fazer uma síntese dos dados, organizando-os sob a
forma de tabelas, gráficos e números. Portanto, para entendermos e
resolvermos nosso problema de reprovação, precisamos estudar as
ferramentas da Estatística Descritiva:
Síntese gráfica
de dados
Uma figura vale mais que mil palavras! Isso é verdade, entretanto um
gráfico vale mais que mil palavras se e somente se ele for desenhado
de forma clara, correta e concisa. Sempre desenhe gráficos a partir
de seus dados, mas tente fazê-los de tal forma que a frase “basta
olhar para entender” seja válida. Os gráficos mais úteis para análise
de dados de experimentos de pequeno e médio porte na área de
Ciências Exatas e Engenharia são: gráficos de pizza, barras, colunas,
linha, séries históricas, histograma, gráfico de Pareto, gráfico misto,
de coluna e de linha, diagrama de dispersão e box-plot (tabela 3).
De todos esses, somente vejo sentido em construi-los “à mão”
histogramas e diagramas de dispersão. Entretanto, na prática
devemos construir gráficos usando ferramentas computacionais
como o Excel.
026
unidade 2
ESTATÍSTICA E PROBABILIDADES
027
unidade 2
ESTATÍSTICA E PROBABILIDADES
A maioria absoluta (58%) dos 760 artigos publicados nos volumes 298 a 301 da NEJM utilizou somente técnicas de
Estatística Descritiva na análise dos dados. Praticamente um quarto dos artigos usou teste t de student e 15% aplicou
teste de qui-quadrado nas tabelas de contingência, ferramentas que serão discutidas na Unidade 7 deste livro.
028
unidade 2
ESTATÍSTICA E PROBABILIDADES
Análise de 21 disciplinas avaliadas em sete semestres (2011/1 a 2014/1), considerando amostra de 78.399 alunos.
Quatro disciplinas têm mais de 40% de seus alunos reprovados: Cálculo Diferencial, Geometria Analítica e Álgebra
Linear, Cálculo de Várias Variáveis e Algoritmo e Estruturas de Dados.
029
unidade 2
ESTATÍSTICA E PROBABILIDADES
030
unidade 2
ESTATÍSTICA E PROBABILIDADES
031
unidade 2
ESTATÍSTICA E PROBABILIDADES
FIGURA 7 – Gráfico distorcido: desenhando a figura com a altura muito pequena, em relação
à largura, a informação é falseada e se tem a sensação de estabilidade dos dados.
032
unidade 2
ESTATÍSTICA E PROBABILIDADES
033
unidade 2
ESTATÍSTICA E PROBABILIDADES
034
unidade 2
ESTATÍSTICA E PROBABILIDADES
Fonte: Elaborado pelo autor baseado nos dados em DAFICO, Dario de Araújo. Método Simples para Explicar a Resistência
à Compressão do Concreto de Alto Desempenho. Disponível em: http://www2.ucg.br/nupenge/pdf/Dario.pdf. Acesso em
14 maio 2015.
035
unidade 2
ESTATÍSTICA E PROBABILIDADES
036
unidade 2
ESTATÍSTICA E PROBABILIDADES
037
unidade 2
ESTATÍSTICA E PROBABILIDADES
038
unidade 2
ESTATÍSTICA E PROBABILIDADES
039
unidade 2
ESTATÍSTICA E PROBABILIDADES
040
unidade 2
ESTATÍSTICA E PROBABILIDADES
0 0 0 1 5 5 6 9 13 17 18 21
0 0 0 1 5 5 6 10 13 17 18 21
0 0 0 1 5 5 6 11 14 17 20 22
0 0 0 2 5 5 9 11 14 17 20 22
0 0 0 2 5 5 9 12 14 17 20 24
0 0 0 3 5 5 9 12 14 17 20 24
0 0 0 3 5 5 9 13 15 17 20 25
0 0 0 5 5 6 9 13 15 17 20 25
0 0 0 5 5 6 9 13 17 18 21 25
0 0 1 5 5 6 9 13 17 18 21 25
041
unidade 2
ESTATÍSTICA E PROBABILIDADES
042
unidade 2
ESTATÍSTICA E PROBABILIDADES
043
unidade 2
ESTATÍSTICA E PROBABILIDADES
044
unidade 2
ESTATÍSTICA E PROBABILIDADES
045
unidade 2
ESTATÍSTICA E PROBABILIDADES
FIGURA 17 – Exemplo de box-plot para uma variável quantitativa genérica: quanto maior o
tamanho das duas caixas, vermelho e cinza, maior a variabilidade e dispersão dos dados.
046
unidade 2
ESTATÍSTICA E PROBABILIDADES
FIGURA 18 – Box-plot com as taxas de aprovação de oito disciplinas de ciclo básico de cursos
de Engenharia: Desenho e Estatística se destacam das outras disciplinas, que têm taxas de
aprovação bem menores e mais heterogêneas. Cálculo Integral é a disciplina com menor taxa de
aprovação e maior variabilidade dos dados.
Síntese tabular
de dados
Na análise exploratória de dados, em última instância, todos os
resultados são apresentados ou na forma de figuras ou de tabelas.
Assim como nos gráficos, invista no título da tabela e sempre
coloque respostas claras para pelo menos quatro perguntas: O
que? Quem? Quando? Onde? Sugerimos que a interpretação das
informações na tabela também seja colocada no próprio título. Se
necessário, coloque notas explicativas, usando siglas somente
para coisas realmente conhecidas. A tabela 4 é um exemplo de
formato de tabelas, apresentando modelo para síntese de variáveis
categóricas de uma base de dados.
047
unidade 2
ESTATÍSTICA E PROBABILIDADES
Síntese numérica
de dados
A síntese numérica de variáveis categóricas é muito simples, basta
que você apresente suas categorias, a frequência de valores em
cada categoria e os respectivos percentuais, tal como apresentado
na tabela 3. Já a síntese de variáveis quantitativas é mais ampla e
envolve resumir dois aspectos:
048
unidade 2
ESTATÍSTICA E PROBABILIDADES
Md = 9
{17; 17; 20; 20; 20; 24; 26; 28; 30; 40; 50; 50; 50; 50; 50; 51; 51; 52}
049
unidade 2
ESTATÍSTICA E PROBABILIDADES
30 + 40
Md = = 35
2
Se média e
Algumas pessoas se perguntam: “Quantas casas decimais devo
mediana forem
apresentar no resultado?”. Quanto menos casas decimais você semelhantes,
conseguir apresentar nos seus resultados, melhor para o entendimento então usar a média
da informação! Apresente seus resultados usando o mesmo número
para representar
os dados.
de casas decimais que os dados originais ou, no máximo, uma casa
decimal além do original, como foi feito nos cálculos anteriores.
050
unidade 2
ESTATÍSTICA E PROBABILIDADES
Pessoa A B C D E
Número de filhos 0 1 1 2 3
Isso mesmo, essas pessoas têm, em média, 1,4 filhos! Você deve
estar se perguntado, “como assim... um e 0,4 filho? Não existe
051
unidade 2
ESTATÍSTICA E PROBABILIDADES
Pessoa A B C D E
Número de filhos 0 1 1 2 3
Pessoa A B C D E
Número de filhos 0 1 1 2 3
052
unidade 2
ESTATÍSTICA E PROBABILIDADES
053
unidade 2
ESTATÍSTICA E PROBABILIDADES
054
unidade 2
ESTATÍSTICA E PROBABILIDADES
CV INTERPRETAÇÃO
CV <= 20% Dados com pouca variabilidade, bem comportados, homogêneos. A variável
tem um comportamento bem previsível.
CV > 100% Neste caso, o desvio padrão é maior que a média. Dados com variabilidade
extrema, muito heterogênea. A variável tem um comportamento caótico,
completamente imprevisível.
2,1
Tempo para correr 100 metros: cv = x 100 = 18,26%;
11,5
0,8
Salto em altura: cv = x 100 = 36%;
2,2
055
unidade 2
ESTATÍSTICA E PROBABILIDADES
que está sendo usada. Resuma os dados por meio de gráficos, números e
o problema investigado.
056
unidade 2
ESTATÍSTICA E PROBABILIDADES
057
unidade 2
ESTATÍSTICA E PROBABILIDADES
Além de gráficos, tabelas com a síntese numérica dos dados coletados no estudo
ações como o “Cálculo Zero”, pois o fato de se ofertar essa disciplina afetava o
Referência:
058
unidade 2
ESTATÍSTICA E PROBABILIDADES
Revisão
Vimos nesta unidade os principais tópicos da análise exploratória
de dados, também denominada de Estatística Descritiva:
Síntese gráfica: Uma figura vale mais que mil palavras! Isso é
verdade, entretanto um gráfico vale mais que mil palavras se e
somente se ele for desenhado de forma clara, correta e concisa.
Sempre desenhe gráficos a partir de seus dados, mas tente fazê-
los de tal forma que a frase “basta olhar para entender” seja válida.
Os gráficos mais úteis para análise de dados de experimentos de
pequeno e médio porte na área de Ciências Exatas e Engenharia
são: gráficos de pizza, barras, colunas, linha, séries históricas,
histograma, gráfico de Pareto, gráfico misto, de coluna e de linha,
diagrama de dispersão e box-plot. Na prática devemos construir Na análise
gráficos usando ferramentas computacionais como o Excel. exploratória de
dados, em última
instância, todos
Síntese tabular de dados: Na análise exploratória de dados, em
os resultados são
última instância, todos os resultados são apresentados ou na forma apresentados ou na
de figuras ou de tabelas. Assim, invista no título da tabela e sempre forma de figuras ou
coloque respostas claras para pelo menos quatro perguntas: O
de tabelas.
que? Quem? Quando? Onde? Também sugiro que a interpretação
das informações na tabela seja colocada no próprio título. Se
necessário, coloque notas explicativas, usando siglas somente para
coisas realmente conhecidas.
059
unidade 2
ESTATÍSTICA E PROBABILIDADES
060
unidade 2
Introdução à
teoria de
probabilidades
Introdução
A teoria das
probabilidades
A teoria das probabilidades nasce na Idade Média com os
tradicionais jogos de azar existentes na Corte. Jogos de
cartas e dados, ou mesmo os lançamentos de moeda são
classificados como fenômenos que envolvem o acaso, assim
como a maioria dos jogos esportivos. Uma aplicação direta
da teoria das probabilidades no campo das Engenharias é o
processo de decisão, seja para aumentar o investimento ou
cortar despesas, no qual o profissional do mercado de trabalho
deve arriscar-se mantendo “os pés no chão”.
ser definido como uma coleção de objetos, itens ou serviços que possuem
espaço amostral.
064
unidade 3
ESTATÍSTICA E PROBABILIDADES
Ω = ( possibilidades )(repetições)= 23 = 8
Ω = ( possibilidades ) . ( possibilidades ) = 2 . 6 = 12
065
unidade 3
ESTATÍSTICA E PROBABILIDADES
Probabilidade
clássica e
probabilidade
frequentista
A probabilidade de realização de um evento A é dada pelo quociente
entre o número de ocorrências de A pelo número de eventos
possíveis, ou seja:
número de orcorrências de A
P(A)=
espaço amostral (Ω)
066
unidade 3
ESTATÍSTICA E PROBABILIDADES
Leis básicas de
probabilidades A probabilidade
pode ser resumida
como o quociente
Para qualquer evento E de um espaço amostral Ω : 0 ≤ P ( E ) ≤ 1; do que se “quer”
pelo que se “tem”.
P ( Ω ) = 1;
067
unidade 3
ESTATÍSTICA E PROBABILIDADES
matemáticas, ou seja:
Associatividade (A∩B)∩C=A∩(B∩C)
(AUB)UC=AU(BUC)
Distributividade (A∩B)UC=(AUC)∩(BUC)
(AUB)∩C=(A∩C)U(B∩C)
Modulares A ∩Ω = A
A ∩Ω = Ω
A ∩Ø = Ø As operações
A Ø=A com os eventos
utilizam as mesmas
Leis de De Morgan A∩B = AUB propriedades
AUB = A∩B matemáticas.
Dupla negação A=A
União e interseção
de eventos
A união de dois eventos A e B, indicada por A U B, é o evento que
contém todos os elementos de A e todos os elementos de B.
P(AUB)=P(A)+P(B)-P(A∩B)
068
unidade 3
ESTATÍSTICA E PROBABILIDADES
TIPO SANGUÍNEO
O A B AB TOTAL
Negativo 28 25 8 4 65
45 + 65 - 8 = 0,2494
409
069
unidade 3
ESTATÍSTICA E PROBABILIDADES
deles se realize.
ocorrência do outro.
Tabelas de independentes.
contingência
As tabelas de contingência são aplicadas na avaliação do
relacionamento das categorias com respeito aos grupos segundo
dois modos: independência ou homogeneidade. Ou seja, eventos
com dupla entrada.
070
unidade 3
ESTATÍSTICA E PROBABILIDADES
Defeito 10 5 15
P (defeito) = 15 = 0,0075
2000
071
unidade 3
ESTATÍSTICA E PROBABILIDADES
Eventos
independentes
Um ou mais eventos pode (m) ser classificado (s) como
independente (s) quando a realização de um dos eventos não afeta
a probabilidade de ocorrência do outro, e vice-versa.
P(A∩ B)
P(A|B)=
P(B)
para P ( B ) > 0.
P ( B | Ei ) . P ( E i )
P ( Ei | B ) =
P(B)
072
unidade 3
ESTATÍSTICA E PROBABILIDADES
P ( Ei | B ) = P ( B | Ei ) . P ( Ei )
∑ P ( B | Ej ) . P (Ej )
P ( E ) = P ( E ∩ B1 ) + P ( E ∩ B2 ) + P ( E ∩ B3 ) + ... + P ( E ∩ Bn )
P (E) = P (B1) . P (E | B1) + P (B2) P (E | B2) + P (B3 ) P (E | B3) + ... + P(Bn ) P (E | Bn)
Portanto,
P ( E ) = ∑ P ( Bi ) . P ( E | Bi )
Numa sala de aula, sabe-se que 10% dos homens e 2% das mulheres
073
unidade 3
ESTATÍSTICA E PROBABILIDADES
Se a empresa aqui citada produzir dois lotes com duas mil unidades em
cada por semana, distribuídas entre 1000 cervejas, 600 refrigerantes e 400
sucos por lote, com aproximadamente 0,2, 0,1 e 0,15 por cento de itens
074
unidade 3
ESTATÍSTICA E PROBABILIDADES
evento.
075
unidade 3
ESTATÍSTICA E PROBABILIDADES
2. ( 0,5 . 0,2 . 0,15 + 0,5 .0,3 .0,1 + 0,5 .0,5 .0,2) 0,0800
Revisão
A teoria das probabilidades é utilizada em todas as áreas do
conhecimento. Ela visa auxiliar o profissional no mercado de
trabalho a predizer valores futuros, estimando as “chances” de
ocorrência de um evento antes que ele ocorra.
076
unidade 3
ESTATÍSTICA E PROBABILIDADES
Filmes
Jennifer E. Smith
Com uma certa atmosfera de ‘Um dia’, mas voltado para o público jovem
outro voo depois de perder o seu, ela conhece Oliver. Um britânico fofo,
sobre tudo, eles provam que o tempo é, sim, muito, muito relativo. Passada
não ter dinheiro para pagar as contas escolares, mas a solução está
onde ele menos esperava: nas cartas. Ele é recrutado para integrar o
077
unidade 3
ESTATÍSTICA E PROBABILIDADES
estatística) Micky Rosa (Kevin Spacey) como líder. A contagem das cartas
vencer nos grandes cassinos. Seduzido pelo dinheiro e pelo estilo de vida
de Vegas, e pela sua inteligente e sexy amiga Jill Taylor (Kate Bosworth),
Apesar da contagem da carta não ser ilegal, o risco é cada vez mais elevado
078
unidade 3
Modelos
probabilísticos
Introdução
• Variáveis
Assim como a Matemática, também a Estatística apresenta
aleatórias
funções que norteiam o comportamento de suas variáveis, como
• Modelos
as retas, parábolas e hipérboles. Na Estatística temos os modelos probabilísticos
probabilísticos. Esses modelos são funções paramétricas que
• Distribuição
descrevem o comportamento de uma variável em estudo. binomial
• Distribuição
Possion
• Distribuição
normal
• Revisão
ESTATÍSTICA E PROBABILIDADES
Variáveis
aleatórias
O estudo das variáveis aleatórias é de suma importância nas
engenharias ou mesmo em qualquer outra área do conhecimento
técnico e científico. Isso porque, nem sempre, os dados que
compõem o estudo estatístico são números, sendo necessário
descobrir um meio de transformá-los em números, a partir de uma
função chamada de ‘variável aleatória’, visando facilitar a estimativa
das medidas estatísticas.
Probabilidade As variáveis
aleatórias podem
Seja um experimento aleatório qualquer de um espaço amostral Ω e um ser classificadas
como contínuas ou
espaço de probabilidades P. Então a variável aleatória X no espaço de
discretas, de acordo
probabilidade é uma função real definida no espaço amostral Ω, tal que com o domínio da
( X ≤ x ) é um evento aleatório para qualquer x real. variável abordada
no estudo.
As variáveis aleatórias podem ser classificadas como contínuas ou
discretas, de acordo com o domínio da variável abordada no estudo.
São classificadas como variáveis discretas as funções para as
quais é possível associar um único número real a cada evento de
uma partição do espaço amostral Ω. Portanto são variáveis que
resultam de processos aleatórios nos quais os resultados possíveis
são casuais e formam um conjunto enumerável.
081
unidade 4
ESTATÍSTICA E PROBABILIDADES
Variáveis discretas
É função P ( x ) aquela nas quais se associam probabilidades aos
valores da variável aleatória X abordada no estudo estatístico. Ou
seja, quando uma variável aleatória X assume os valores x1,x2,x3,…
,xn com as respectivas probabilidades p ( x1 ), p ( x2 ), p ( x3 ) ,…,
p (xn) definidas por uma P ( X ), na qual a soma de todas as possíveis
probabilidades é igual a um, conforme apresentado na tabela 7, ou
seja:
X x1 x2 x3 ... xn
P (X) p ( x1 ) p ( x2 ) p ( x3 ) ... p ( xn )
082
unidade 4
ESTATÍSTICA E PROBABILIDADES
Var ( x ) = E ( x2 ) - [ E ( x ) ] 2
n
2
E ( x2 ) = ∑ xi . p ( xi )
i =1
DP ( x ) = √Var ( x )
X VALORES ASSOCIADOS
P(Y)
Y À VARIÁVEL X
083
unidade 4
ESTATÍSTICA E PROBABILIDADES
que uma ou mais variáveis são uma f.d.p. quando a soma de todas as
f.d.p. quando:
n
∑ p ( xi ) = p ( x1) + ( x2 ) + p ( x3 ) + ... + p ( xn ) = 1
i =1
distribuição de probabilidades:
Y VALORES ASSOCIADOS
P(X)
X À VARIÁVEL Y
n n
E ( X, Y ) = ∑ ∑ xi . yj . p ( xi , yj )
i =1 j =1
084
unidade 4
ESTATÍSTICA E PROBABILIDADES
Portanto,
E ( X, Y ) = a . d . p ( a , d ) + b . d . p ( b, d ) + c . d . p ( c, d ) + a . e . p ( a, e ) + b . e . p ( b , e ) +
+ c . e . p ( c, e ) + a . f . p ( a, f ) + b . f . p ( b, f ) + c . f . p ( c, f )
X
Y a b c P(Y)
d P (a, d ) P ( b, d) P ( c, d ) P(d)
e P ( a, e ) P ( b, e ) P ( c, e ) P(e)
f P ( a, f ) P ( b, f ) P ( c, f ) P(f)
P(X) P ( a ) P ( b ) P(c) 1
Variáveis contínuas
É uma função f ( x ) aquela nas quais se associam probabilidades
aos infinitos valores da variável aleatória X, abordada no estudo
estatístico. Ou seja, quando uma variável aleatória X assume
infinitos valores em um determinado intervalo ( a, b ), sendo a
probabilidade igual a zero para valores fora desse intervalo e a
soma de todas as possíveis probabilidades contidas nesse intervalo
igual a um. Portanto, para as variáveis contínuas, temos que:
• f (x) ≥ 0,∀ x ∊ R;
+ oo
• ∫
- oo
f ( x ) dx = 1 (toda área sob a curva de probabilidade, ou
curva de frequência, definida por f ( x ) vale um);
b
• P ( a ≤ x ≤ b) = ∫
a
f ( x ) dx (probabilidade correspondente
à área sob a curva limitada pelo intervalo compreendido
entre x = a e x = b ). Esse assunto será mais detalhado
posteriormente no estudo da distribuição normal.
085
unidade 4
ESTATÍSTICA E PROBABILIDADES
E (x) = ∫ x .f ( x ) dx
a
Var ( x ) = E ( x2 ) - [ E ( x ) ]2,
E ( x ) = ∫ x2 . f ( x ) dx〗
2
a
A covariância
para as variáveis
Para uma variável aleatória contínua bidimensional, definida
contínuas ou
em todos os valores dos números reais, a função densidade de discretas, ou seja, a
probabilidade conjunta f ( x, y ) é uma função que satisfaz: medida estatística
que possibilita
• f ( x, y ) ≥ 0, para todo ( x, y ) ∊ R2; verificar se as
variáveis envolvidas
na análise são
• ∫ ∫
R R
f ( x, y ) d x d y =1 diretamente ou
inversamente
O valor esperado da distribuição conjunta, indicado por E ( X, Y ), é proporcionais.
dado por:
E ( X, Y ) = ∫ ∫
R R
x . y . f ( x, y ) d x d y
086
unidade 4
ESTATÍSTICA E PROBABILIDADES
Cov ( X, Y ) = E ( X, Y ) - E ( X ) . E ( Y )
ρ X, Y = Cov ( X, Y )
σX . σY
Sendo -1 ≤ ρ X,Y ≤ 1.
E(X)=μ Var ( x ) = σ2
E(a)=a Var ( a ) = 0
087
unidade 4
ESTATÍSTICA E PROBABILIDADES
Modelos
probabilísticos
Assim como na Matemática, temos os modelos que representam
o comportamento da variável abordada no estudo, ou seja,
as retas, parábolas e hipérboles dentre tantas outras funções
matemáticas. Na Estatística, os modelos probabilísticos descrevem
o comportamento de uma variável, sendo possível calcular
a probabilidade associada aos eventos da variável abordada
no estudo, recorrendo apenas aos modelos probabilísticos.
Esses modelos são chamados de distribuições, apresentando
particularidades próprias que facilitam a sua identificação, podendo
ser divididos em contínuos e discretos, assim como as variáveis
estudadas no início deste tópico. A distribuição
binomial é denotada
por X~Bin ( n; p ),
sendo n o número
Distribuição de amostragens
(tentativas) e p
binomial a probabilidade
de sucesso do
experimento.
A distribuição binomial é denotada por X~Bin ( n; p ), sendo
n o número de tentativas e p a probabilidade de sucesso do
experimento. Trata-se de uma distribuição discreta, aplicada em
casos dicotômicos, ou seja, experimentos aleatórios com apenas
duas possibilidades de resposta, denotadas por sucesso ou falha.
Podemos citar como exemplo o lançamento de uma moeda, um
item ter defeito ou não, um funcionário faltar ou não.
088
unidade 4
ESTATÍSTICA E PROBABILIDADES
E ( x ) = μ = n . p e Var ( x ) = σ2 = np . ( 1 - p ), respectivamente.
n n-x
P ( X = x ) = ( x ). px. ( 1 - p )
n
sendo: ( ) a combinação de n elementos x a x, ou seja:
x
n
( )= n! e p a probabilidade de sucesso.
x
( n- x) ! . x!
Distribuição
Poisson
A distribuição Poisson é denotada por X~Poisson (λ), sendo
1
λ a taxa média, ou seja, λ = μ e sendo λ também sempre
inversamente proporcional ao intervalo de tempo ou espaço
definido no problema. Portanto, o seu valor deve corresponder
ao tamanho do intervalo apresentado. Assim, para qualquer
089
unidade 4
ESTATÍSTICA E PROBABILIDADES
e-λ . λx
P(X=x)=
x!
A distribuição
Poisson pode ser
A distribuição Poisson pode ser aplicada como um caso limite da aplicada como
binomial, quando o tamanho da amostra em eventos dicotômicos é
um caso limite da
binomial, quando
maior que 30. o tamanho da
amostra em eventos
dicotômicos
é maior que 30.
Distribuição
normal
A distribuição normal é denotada por X~Normal (μ; σ2 ), sendo
o valor esperado, ou seja, a média da distribuição normal e a
variância dadas por:
090
unidade 4
ESTATÍSTICA E PROBABILIDADES
A distribuição
amostral de
muitas estatísticas
tenderem à
distribuição normal,
As principais propriedades da distribuição normal são: em face do teorema
do limite central.
1. ter a forma de um sino;
091
unidade 4
ESTATÍSTICA E PROBABILIDADES
x-μ
z=
σ
A área total limitada pela curva normal e pelo eixo das abscissas é
1u.a. (uma unidade de área), ou seja, 100%, sendo as áreas sob a
curva limitadas pela distância entre o desvio padrão e a média. Essa
área é apresentada na tabela a seguir.
092
unidade 4
ESTATÍSTICA E PROBABILIDADES
093
unidade 4
ESTATÍSTICA E PROBABILIDADES
final de cada ano, sendo que o número exato deles depende da frequência
distribuição de probabilidade:
X 0 1 2 3
P(X) 0,10 0,30 0,40 0,20
E ( X ) = 1,7
094
unidade 4
ESTATÍSTICA E PROBABILIDADES
Revisão
A distribuição discreta é usada em casos cujos dados analisados podem
ser alocados em uma tabela de probabilidades, sendo que aquelas
localizadas no centro da tabela são classificadas como probabilidade
conjunta e as localizadas nas laterais, como probabilidades marginais.
Binomial Não usual para amostras com Quando os eventos estudados permitem apenas
mais de 30 elementos. duas respostas possíveis.
Para estudar mais sobre os conteúdos abordados nessa unida, sob perspectiva aplicada, consulte as
MOORE, David. A estatística básica e sua prática. Rio de Janeiro. LTC, 2014.
Para uma fundamentação matemática mais aprofundada sobre o assunto, consulte a seguinte obra:
MONTGOMERY, Douglas; RUNGER, George Estatística aplicada e probabilidade para engenheiros. 3 ed.
095
unidade 4
Estimação de
médias
e proporções
Introdução
• Teorema
Nas unidades anteriores, você estudou três grandes áreas do
central do limite
método estatístico: amostragem e coleta de dados; análise
• Estimação
exploratória de dados; e teoria de probabilidades. A partir de agora, pontual e por
você vai entender como essas áreas se relacionam para construir a intervalos de
confiança para
quarta área do método estatístico, que é a decisão na presença de
uma média
incerteza ou estatística inferencial. populacional
• Estimação
A estatística inferencial recebe esse nome por ser um conjunto de pontual e por
métodos e técnicas que permitem, a partir dos dados provenientes
intervalos de
confiança para
de uma amostra, inferir informações sobre toda a população alvo uma proporção
do estudo. Logicamente existe uma incerteza associada a esse populacional
processo, mas ela é quantificada através dos níveis de confiança • Uso do Excel
e margens de erro do estudo. Essa é a grande contribuição da no cálculo de
intervalos
estatística inferencial, permitir que se conheça o nível de incerteza de confiança
da informação antes de tomar decisões. para média e
proporção
Teorema central
do limite
Imagine a seguinte situação: um engenheiro de produção deseja
monitorar um processo de produção de fibra sintética de maneira
a garantir que a característica de qualidade resistência à tração
esteja sempre dentro dos limites de especificação. É conhecido
que a resistência à tração das fibras produzidas naquela empresa
é normalmente distribuída com média de 75 psi (libras força por
polegada quadrada) com desvio-padrão de 3,5 psi.
099
unidade 5
ESTATÍSTICA E PROBABILIDADES
X-μ
z=
σ
⁄√n
μX = μ e desvio-padrão σX = σ ⁄
√n .
EXEMPLO
100
unidade 5
ESTATÍSTICA E PROBABILIDADES
73,6 - 75
z= = -2
3,5
⁄√ 25
Então,
101
unidade 5
ESTATÍSTICA E PROBABILIDADES
102
unidade 5
ESTATÍSTICA E PROBABILIDADES
Estimação pontual
e por intervalos de
confiança para uma
média populacional
Neste tópico, você vai aprender a obter uma estimativa para média
populacional e calcular a precisão dessa estimativa. Você vai
entender por que apresentar a margem de erro e o nível de confiança
da pesquisa é tão importante quanto apresentar a estimativa
pontual para média. Após a leitura deste tópico, você terá um novo
olhar sobre as estatísticas que lhe são apresentadas diariamente
em jornais ou revistas.
103
unidade 5
ESTATÍSTICA E PROBABILIDADES
104
unidade 5
ESTATÍSTICA E PROBABILIDADES
E = Zα/ σ
2
Onde:
105
unidade 5
ESTATÍSTICA E PROBABILIDADES
E = Zα/ S
2
4
E = 1,96 = 1,325
√35
IC [ μ; ( 100 - α ) % ] = ±E
106
unidade 5
ESTATÍSTICA E PROBABILIDADES
Exemplo:
Solução:
IC [ μ; 95% ] = ±E
E = Zα/ S
2
Logo:
2
E = 1,96 * = 0,663
√35
Então:
107
unidade 5
ESTATÍSTICA E PROBABILIDADES
108
unidade 5
ESTATÍSTICA E PROBABILIDADES
109
unidade 5
ESTATÍSTICA E PROBABILIDADES
Exemplo:
110
unidade 5
ESTATÍSTICA E PROBABILIDADES
Solução:
E = t S
n
111
unidade 5
ESTATÍSTICA E PROBABILIDADES
E = 2,262 . 45 = 32,189
√10
O intervalo de confiança pode ser então obtido:
Estimação pontual
e por intervalos
de confiança para
uma proporção
populacional
Como são calculadas as margens de erro das pesquisas eleitorais?
Possivelmente no início da unidade você tenha ficado instigado a
descobrir como é feito esse cálculo. Antes de dar início, é preciso
entender que as pesquisas eleitorais buscam descobrir o percentual
de eleitores que são favoráveis ao candidato A ou B, e esses
percentuais são tratados na estatística como proporções.
112
unidade 5
ESTATÍSTICA E PROBABILIDADES
1.300
pˆ = = 0,52
2.500
113
unidade 5
ESTATÍSTICA E PROBABILIDADES
ˆpqˆ
E = Zα
/2 √ n
IC [ p ; ( 100 - α) % ]= pˆ ± E
114
unidade 5
ESTATÍSTICA E PROBABILIDADES
Exemplo:
Solução:
pˆ = 21 = 0,14
150
E = Zα ˆˆ
pq
/2 n
0,14 × 0,86
E = 1,645 150 = 0,047
ˆ±E
IC [ p ; 90% ] = p
115
unidade 5
ESTATÍSTICA E PROBABILIDADES
Uso do Excel no
cálculo de intervalos
de confiança para
média e proporção
Agora que você já sabe exatamente como são obtidos os intervalos
O intervalo de
de confiança, vamos utilizar o Excel para construir uma calculadora
confiança para a
de intervalos de confiança. Começaremos pelo intervalo para média. média populacional
pode ser obtido
Nos tópicos anteriores, vimos que o intervalo de confiança para a
de duas maneiras:
utilizando a
média populacional pode ser obtido de duas maneiras: utilizando distribuição normal
a distribuição normal (estatística z) ou a distribuição t-student (estatística z)
(estatística t). Vimos também que a distribuição t-student é ou a distribuição
t-student
utilizada quando o tamanho da amostra é menor que 30 e o desvio-
(estatística t).
padrão populacional é desconhecido. Nos outros casos, utilizamos
a distribuição normal.
116
unidade 5
ESTATÍSTICA E PROBABILIDADES
117
unidade 5
ESTATÍSTICA E PROBABILIDADES
118
unidade 5
ESTATÍSTICA E PROBABILIDADES
119
unidade 5
ESTATÍSTICA E PROBABILIDADES
Introdução ao
programa EpiInfo
O software EpiInfo é uma ferramenta muito útil para análise de
dados. Esse software foi desenvolvido pelo Centro de Controle de
Doenças (CDC) para análise de dados epidemiológicos, entretanto
pode ser utilizado em qualquer área, inclusive em engenharia. O
software está disponível no site www.cdc.gov/epiinfo
Solução:
variável diâmetro dos anéis e, além disso, também não temos informação
120
unidade 5
ESTATÍSTICA E PROBABILIDADES
IC [ μ ;99% ] = x ± E
E = Zα/ S
2
Logo:
0,02
E = 2,575 * = 0,008
√40
Então:
Dessa forma, afirmamos com 99% de confiança que o diâmetro médio dos
Revisão
Nesta unidade, você aprendeu a construir estimativas pontuais e por
intervalos para os verdadeiros parâmetros populacionais através de
dados provenientes de amostras. Aprendeu também que existem
ao menos quatro maneiras de obter estimativas intervalares, e que
a escolha da maneira adequada para cada situação é determinada
basicamente pelo tipo de dados (qualitativo ou quantitativo) e
pelo tamanho da amostra ( n < 30 ou n ≥ 30 ). O esquema abaixo
apresenta de maneira resumida o processo de decisão:
121
unidade 5
ESTATÍSTICA E PROBABILIDADES
Tipo de dados
Equação 1: x ± Zα/ σ
2
Equação 2: x ± Zα/ S
2
Equação 3: x ± t S
n
ˆ qˆ
p
Equação 4: pˆ ± Zα 2
/ √ n
Sampaio Filho; rev. téc. Galo Carlos Lopez Noriega. São Paulo: Pearson
122
unidade 5
ESTATÍSTICA E PROBABILIDADES
PELLI_ABNT%20NBR%2014653-2%20%282%C2%BAProjeto%29212751_1.
123
unidade 5
Planejamento de
experimentos
Introdução
• Cálculo de
Uma situação que utiliza o planejamento de experimentos muito tamanho de
frequentemente é o estudo dos efeitos do tratamento térmico de amostra baseado
em intervalos de
metais sobre suas propriedades mecânicas. Considere que uma confiança para
equipe de engenharia deseja estudar o efeito de três diferentes uma proporção
tipos de banho de têmpera sobre a dureza de um determinado tipo • Cálculo de
de aço. Os tipos de banho de têmpera utilizados são têmpera em
1 tamanho de
amostra baseado
água, têmpera em óleo e têmpera em solução aquosa de cloreto em intervalos de
de sódio (água salgada). O propósito do estudo é determinar qual confiança para
uma média
banho de têmpera produzirá a dureza máxima do aço.
• Planejamento
de experimentos
A princípio, a equipe considerou suficiente para o propósito do
• Planejamento
estudo submeter um determinado número de corpos de provas a
de experimentos
cada meio de têmpera e medir a dureza da liga metálica. A partir - terminologia
básica
• Revisão
A têmpera consiste essencialmente em aquecer uma peça de aço a uma certa
temperatura e, a seguir, resfriá-la rapidamente em um banho, usualmente água, óleo
ou soluções salinas. Seu objetivo é, em geral, aumentar a dureza do aço e tornar
mais elevadas suas resistências à tração, à compressão e ao desgaste
desses resultados calcular-se-ia a dureza média em cada um dos
diferentes tipos de banho. Aquele que apresentasse a maior dureza
média seria o mais adequado.
Cálculo de
tamanho de
amostra baseado
em intervalos de
confiança para
uma proporção
Para alguns pesquisadores, a definição do tamanho da amostra
é o único cuidado necessário para validade estatística do estudo.
Como você observou na introdução dessa unidade, existe uma série
de cuidados que devem ser tomados ao conduzir experimentos em Se o objetivo do
engenharia, além do tamanho da amostra. A começar pelo objetivo estudo é comparar
resultados expressos
do estudo.
em forma de
porcentagens
Se o objetivo do estudo é comparar resultados expressos em forma ou proporções,
existe um método
de porcentagens ou proporções, existe um método adequado para
adequado para o
o cálculo do tamanho amostral. Se o objetivo é comparar resultados cálculo do tamanho
expressos em forma de médias, existe outro método adequado para amostral.
o cálculo do tamanho amostral. Diversos outros fatores podem ser
considerados nestes cálculos, alterando, assim, a adequação de
cada método.
Exemplo 8
127
unidade 6
ESTATÍSTICA E PROBABILIDADES
ˆˆ
(Z α/2 )2 pq
n=
E2
Onde:
128
unidade 6
ESTATÍSTICA E PROBABILIDADES
(Z α/2 )20,25
n=
E2
1,962 x 0,25
n=
0,022
n = 2.401
n = 456,19 � 457
129
unidade 6
ESTATÍSTICA E PROBABILIDADES
456,19 correias. Como não faz sentido amostrar 0,19 correia, devemos
130
unidade 6
ESTATÍSTICA E PROBABILIDADES
ˆˆ (zα )2
N pq /2
n=
ˆˆ (zα/ )2 + (N - 1) E 2
pq 2
1,6452 x 0,25
n= = 752
0,032
n = 89
n = 60
131
unidade 6
ESTATÍSTICA E PROBABILIDADES
Cálculo de tamanho de
amostra baseado em
intervalos de confiança
para uma média
No início dessa unidade falamos que o cálculo do tamanho amostral
depende de vários fatores, sendo o principal deles o objetivo do
estudo. Nesta seção você aprenderá a calcular o tamanho amostral
para um estudo que tem o interesse de estimar uma média
populacional. Os parâmetros controlados continuam sendo o nível
de confiança e a margem de erro máxima desejados para o estudo.
Vejamos um exemplo:
Exemplo 9
zα/2 .σ
n=
E
132
unidade 6
ESTATÍSTICA E PROBABILIDADES
Onde:
n: é o tamanho da amostra
σ: é o desvio-padrão populacional
n=
{ 2,5753 x 6 } 2 Devemos sempre
arredondar o
resultado para cima.
n = 26,5 ˜ 27
133
unidade 6
ESTATÍSTICA E PROBABILIDADES
N(zσ /2 σ)2
n=
(N - 1)E 2 + (Zα/2 σ)2
Exemplo 10
134
unidade 6
ESTATÍSTICA E PROBABILIDADES
n=
[ 1,965 x 30 ]2
n = 139
Planejamento de
experimentos
O planejamento de experimentos, também conhecido como
DOE (Design of Experiments), é um conjunto de técnicas
estatísticas que visa garantir uma coleta de dados eficiente
para uma análise de dados que seja informativa e confiável.
Esse conjunto de técnicas tem vasta utilização em diversas
135
unidade 6
ESTATÍSTICA E PROBABILIDADES
136
unidade 6
ESTATÍSTICA E PROBABILIDADES
Y
SISTEMA Varíaveis resposta
Entradas (Características de
(PRODUTO/PROCESSO
Qualidade)
Fatores controláveis
(especificados pelo pesquisador)
137
unidade 6
ESTATÍSTICA E PROBABILIDADES
138
unidade 6
ESTATÍSTICA E PROBABILIDADES
139
unidade 6
ESTATÍSTICA E PROBABILIDADES
FIGURA 34 - Blocagem dos cimentos para cada tipo de técnica de mistura do concreto
Planejamento de
experimentos -
terminologia básica
Agora que você já aprendeu quais são os princípios básicos do DOE,
vamos aprender alguns termos comuns e muito úteis para o bom
planejamento do experimento. Serão apresentados seis termos
básicos, a saber: Unidade Experimental, Fatores, Níveis de um
Fator, Tratamento, Ensaio e Variável Resposta (ou desfecho). Para
140
unidade 6
ESTATÍSTICA E PROBABILIDADES
141
unidade 6
ESTATÍSTICA E PROBABILIDADES
Considere que você tenha uma máquina de secar roupas que trabalha
aleatorização.
142
unidade 6
ESTATÍSTICA E PROBABILIDADES
blocagem.
SOLUÇÂO:
de lavar.
exemplo.
e T3 = Alto.
para secagem das roupas, que pode ser medido em minutos, por
exemplo.
b. Para este estudo, uma réplica seria secar umas três trouxas de
143
unidade 6
ESTATÍSTICA E PROBABILIDADES
ser controlada para que cada ensaio seja feito de forma mais
seis peças jeans, deve-se alocar duas para cada trouxa de roupas.
Revisão
Nesta unidade você aprendeu que, para calcular o tamanho
amostral, diversos fatores devem ser levados em consideração.
Em especial você aprendeu a calcular o tamanho amostral em
quatro situações: quando o objetivo do estudo é a estimativa de
uma proporção populacional, sendo o tamanho populacional finito
ou “infinito”. E quando o objetivo do estudo é a estimativa de uma
média populacional, novamente, sendo o tamanho populacional
finito ou “infinito”. O quadro abaixo resume essas situações:
144
unidade 6
ESTATÍSTICA E PROBABILIDADES
e rev téc Ana Maria Lima de Farias, Vera Regina Lima de Farias e Flores.
145
unidade 6
ESTATÍSTICA E PROBABILIDADES
da UFMG, 1996.
146
unidade 6
Testes de
Hipóteses
Introdução
A construção e
o significado de
uma hipótese
estatística
Uma hipótese estatística pode ser construída a partir de alguma teoria
sobre determinado assunto, ou através de alguma afirmação sobre
certo parâmetro da população em análise. No caso do engenheiro
interessado em testar se o tempo médio de duração de um fusível
é 1.000 horas, a hipótese não se deu através de uma teoria, mas
possivelmente em função da experiência dele com o assunto.
Exemplo 11
149
unidade 7
ESTATÍSTICA E PROBABILIDADES
SOLUÇÃO:
H0: μ = 30 minutos
H1: μ ≠ 30 minutos
Nível de
Além da definição acerca das hipóteses, o nível de significância significância:
também deve ser escolhido pelo analista.
Consiste na
probabilidade de
rejeitar a hipótese
nula, dado que ela é
verdadeira.
nula, dado que ela é verdadeira. Geralmente é representado pela letra grega
150
unidade 7
ESTATÍSTICA E PROBABILIDADES
151
unidade 7
ESTATÍSTICA E PROBABILIDADES
Exemplo 12
152
unidade 7
ESTATÍSTICA E PROBABILIDADES
1ª e
tapa: Estabeleça as hipóteses de interesse
2-U
m parâmetro refere-se à determinada medida que caracterize a população de
interesse. Os parâmetros mais frequentemente investigados através dos testes
de hipóteses são: a média, o desvio-padrão, no caso de variáveis quantitativas e a
proporção, no caso de variáveis categóricas.)
3-A
variabilidade amostral ocorre porque existem chances de tomarmos tanto
amostras parecidas com a população de interesse quanto amostras pouco
semelhantes à população. Qualquer processo de amostragem sujeita-se a essa
situação. Cabe ao pesquisador levar esse fato em consideração ao construir um
teste de hipóteses
153
unidade 7
ESTATÍSTICA E PROBABILIDADES
-μ
Z= σ
x
σ
σx = √n
s
s = √n
x
-μ
Z = s/√n
154
unidade 7
ESTATÍSTICA E PROBABILIDADES
502 - 500
Z= = 4,0
3/√36
155
unidade 7
ESTATÍSTICA E PROBABILIDADES
4-O
bserve pela Figura 35 que 34% + 13,5% = 47,5%. Ao multiplicarmos esse valor
por dois, obtemos os 95%.
156
unidade 7
ESTATÍSTICA E PROBABILIDADES
157
unidade 7
ESTATÍSTICA E PROBABILIDADES
158
unidade 7
ESTATÍSTICA E PROBABILIDADES
4ª etapa: Conclusão
Exemplo 13
1ª e
tapa: Estabeleça as hipóteses de interesse
H0 : μ = 120 centímetros
H1 : μ ≠ 120 centímetros
-μ
Z=
s/√n
159
unidade 7
ESTATÍSTICA E PROBABILIDADES
120,2 - 120,0
Z= = 1,0
1,6/√64
5-O
valor 0,10 refere-se aos 10% escolhidos como nível de significância pelo
pesquisador. Tal valor consiste na probabilidade de rejeitar a hipótese nula, dado
que ela é verdadeira, ou seja, probabilidade de tomar uma decisão equivocada em
relação à hipótese.
160
unidade 7
ESTATÍSTICA E PROBABILIDADES
161
unidade 7
ESTATÍSTICA E PROBABILIDADES
4ª etapa: Conclusão
Exemplo 14
1ª e
tapa: Estabeleça as hipóteses de interesse
H0: μ = 10 milímetros
H1: μ ≠ 10 milímetros
162
unidade 7
ESTATÍSTICA E PROBABILIDADES
- μ = 10,2 - 10,0
t=
s/√n 0,2/√16 = 4,0
163
unidade 7
ESTATÍSTICA E PROBABILIDADES
4ª etapa: Conclusão
164
unidade 7
ESTATÍSTICA E PROBABILIDADES
π (1 -π)
Sp =
n
Exemplo 15
1ª e
tapa: Estabeleça as hipóteses de interesse
H0: π = 0,30
H1: π ≠ 0,30
165
unidade 7
ESTATÍSTICA E PROBABILIDADES
Sp =
π (1 -π)
n
=
0,30 (1 - 0,30)
49
=
0,21
49
= √0,004286 = 0,0655
166
unidade 7
ESTATÍSTICA E PROBABILIDADES
4ª etapa: Conclusão
167
unidade 7
ESTATÍSTICA E PROBABILIDADES
1 - 2
Z=
n1 n2
Exemplo 16
H0: μA = μB
H1: μA ≠ μB
168
unidade 7
ESTATÍSTICA E PROBABILIDADES
4ª Etapa: Conclusão
ˆ2
pˆ 1 - p
√
Z=
p (1 - p) + p (1 - p)
n1 n2
169
unidade 7
ESTATÍSTICA E PROBABILIDADES
x +x
p = n 1 + n 2 (proporção amostral combinada)
1 2
Exemplo 17
H0 : p1 = p2
H1 : p1 ≠ p2
170
unidade 7
ESTATÍSTICA E PROBABILIDADES
4ª Etapa: Conclusão
171
unidade 7
ESTATÍSTICA E PROBABILIDADES
possam assumir pode ser útil para a otimização do processo. Por exemplo:
Revisão
Nessa unidade aprendemos os fundamentos dos testes de
hipóteses. O principal objetivo deles é contrapor uma hipótese de
interesse, conhecida como hipótese nula, a uma hipótese contrária,
conhecida como hipótese alternativa, em relação a um parâmetro
de interesse (geralmente a média, no caso de variáveis quantitativas
e a proporção, no caso de variáveis categóricas).
172
unidade 7
ESTATÍSTICA E PROBABILIDADES
MOORE, David. A estatística básica e sua prática. Rio de Janeiro: LTC, 2014.
173
unidade 7
Análise de
correlação
e regressão
Introdução
Análise de
correlação
Quando temos interesse em investigar o quanto duas variáveis
quantitativas estão associadas, podemos utilizar uma medida
conhecida como coeficiente de correlação.
Diagrama de dispersão
O coeficiente de
Antes de calcular a correlação entre duas variáveis, é interessante correlação mede o
representar os dados num diagrama de dispersão.
grau de intensidade
do relacionamento
linear entre
duas variáveis
quantitativas.
Diagrama de dispersão: Consiste na representação gráfica de duas
176
unidade 8
ESTATÍSTICA E PROBABILIDADES
800
700
600
Valor do imóvel (R$ mil)
500
400
300
200
100
-
0 50 100 150 200 250 300
Área (em metros quadrados)
6-A
ssociação negativa: Duas variáveis apresentam associação negativa quando o
crescimento de uma se associa à diminuição da outra, ou o contrário, a queda em
uma se associa ao acréscimo da outra.
177
unidade 8
ESTATÍSTICA E PROBABILIDADES
80
70
60
50
40
Y
30
20
10
0
0 5 10 15 20
X
178
unidade 8
ESTATÍSTICA E PROBABILIDADES
15
14
14
13
13
Y
12
12
11
11
10
0 5 10 15 20
X
Fonte: Elaborado pelo autor
179
unidade 8
ESTATÍSTICA E PROBABILIDADES
∑ ( x -x ) ( y - y )
Cor ( X, Y ) = r =
sxsy ( n - 1)
X - Temperatura (º Celsius) 100 110 120 130 140 150 160 170 180 190
Y - Resultado (porcentagem) 45 51 54 61 66 70 74 78 85 89
Solução:
180
unidade 8
ESTATÍSTICA E PROBABILIDADES
100
90
80
Y - Resultado (%)
70
60
50
40
30
20
10
0
0 50 100 150 200
X - Temperatura (º C)
3985 3985
Cor ( X, Y ) = r = = = + 0,99
( 30,3) (14,7) (10 -1) 4008,7
181
unidade 8
ESTATÍSTICA E PROBABILIDADES
Exemplo 19
Preço (X) 10 11 12 13 14 15 16 17 18 19
Quantidade (Y) 200 171 168 165 170 147 120 130 105 124
Solução:
220
200
180
Y - Quantidade
160
140
120
100
8 10 12 14 16 18 20
X - Preço
Fonte: Elaborado pelo autor
182
unidade 8
ESTATÍSTICA E PROBABILIDADES
TABELA 16 - Dados para o cálculo do coeficiente de correlação entre preço (X) e quantidade (Y)
Preço (X) Quantidade (Y) (𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ) (𝑦𝑦𝑖𝑖 − 𝑦𝑦�) (𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦�)
10 200 -4,5 50 -225
11 171 -3,5 21 -73,5
12 168 -2,5 18 -45
13 165 -1,5 15 -22,5
14 170 -0,5 20 -10
15 147 0,5 -3 -1,5
16 120 1,5 -30 -45
17 130 2,5 -20 -50
18 105 3,5 -45 -157,5
19 124 4,5 -26 -117
𝑛𝑛
Média (X) = 14,5 Média (Y) = 150 �(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )(𝑦𝑦𝑖𝑖 − 𝑦𝑦
�) = -747
Desv. Pad (X) = 3,0 Desv. Pad (Y) = 29,6 𝑖𝑖 =1
-747 -747
Cor ( X, Y ) = r = = = - 0,93
( 3,0) (29,6) (10 -1) 799,2
183
unidade 8
ESTATÍSTICA E PROBABILIDADES
= CORREL (matriz1;matriz2)
184
unidade 8
ESTATÍSTICA E PROBABILIDADES
Regressão
linear simples
A regressão linear simples tem como objetivo estimar uma equação
que relacione matematicamente duas variáveis, sendo que uma
delas é explicada pela outra. A variável explicada geralmente é
denominada variável resposta ou variável dependente. A variável
explicativa é denominada variável explanatória ou variável
independente.
185
unidade 8
ESTATÍSTICA E PROBABILIDADES
à reta.
Yi = β 0 + β 1 X i + ε i Método dos
mínimos
quadrados: É uma
técnica estatística
Onde:
utilizada para
resumir um conjunto
Yi = valor da variável dependente na i-ésima tentativa, ou observação; de variáveis
quantitativas numa
equação.
β0 = primeiro parâmetro da equação de regressão, o qual indica o
intercepto no eixo Y, ou seja, o valor de Y quando X = 0;
186
unidade 8
ESTATÍSTICA E PROBABILIDADES
^ ^ ^
Y = β 0+ β 1X
A análise de
A estimativa dos parâmetros β0 e β1 do modelo se dá a partir das regressão se
seguintes fórmulas: distingue da
correlação por supor
uma relação de
^ ∑ XY - nXY causalidade entre as
β1 =
∑ X2 - nX2
variáveis resposta e
explanatória.
^
βo = Y - β^ 1X
Exemplo 20
187
unidade 8
ESTATÍSTICA E PROBABILIDADES
Horas de Nota na
Estudante
estudo (X) prova (Y)
1 20 72
2 15 62
3 35 87
4 26 77
5 30 90
6 24 83
7 18 68
Fonte: Elaborado pelo autor
Solução:
[a] P
odemos incluir mais duas colunas na tabela para facilitar a
operacionalização dos cálculos:
Horas de Nota na 2
Estudante X X.Y
estudo (X) prova (Y)
1 20 72 400 1440
2 15 62 225 930
3 35 87 1225 3045
4 26 77 676 2002
5 30 90 900 2700
6 24 83 576 1992
7 18 68 324 1224
2
MÉDIA (X) = 24 MÉDIA(Y) = 77 ΣX = 4.326 ΣXY = 13.333
Fonte: Elaborado pelo autor
188
unidade 8
ESTATÍSTICA E PROBABILIDADES
^
Y = 44,6 + 1,35 . X
[b] Para calcular o valor estimado da nota (Y) com base no número
de horas estudadas (X), basta inserir o valor de X na equação.
Considerando X = 20, temos:
^
Y = 44,6 + 1,35 . 20 = 44,6 + 27 = 71,6
FIGURA 52 - Previsão da NOTA (Y) com base no número de HORAS DE ESTUDO (X)
189
unidade 8
ESTATÍSTICA E PROBABILIDADES
190
unidade 8
ESTATÍSTICA E PROBABILIDADES
Estatística de regressão
R múltiplo 0,918
R-Quadrado 0,843
R-quadrado ajustado 0,811
Erro padrão 4,470
Observações 7
Fonte: Elaborado pelo autor
191
unidade 8
ESTATÍSTICA E PROBABILIDADES
ANOVA
gl SQ MQ F Valor p
Regressão 1 536,085 536,085 26,8271 0,00353
Resíduo 5 99,915 19,983
Total 6 636
Fonte: Elaborado pelo autor
H0: β0 = 0
H1: β0 ≠ 0
H0: β1 = 0
H1: β1 ≠ 0
A equação estimada é:
^
Y = 44,6 +1,35 . X1
192
unidade 8
ESTATÍSTICA E PROBABILIDADES
^
Y = 44,6 + 1,35 x 30 = 44,6 + 40,5 = 85
Na regressão
linear simples, uma
Regressão variável resposta
pode ser explicada
linear múltipla por uma variável
explanatória.
193
unidade 8
ESTATÍSTICA E PROBABILIDADES
Yi = β 0 + β 1 X 1 + β 2 X 2 + … + β k X k + ε i
Onde:
Exemplo 22
194
unidade 8
ESTATÍSTICA E PROBABILIDADES
195
unidade 8
ESTATÍSTICA E PROBABILIDADES
Chart
Title
800.000,00
700.000,00
y
=
1868,2x
+
239876
600.000,00
R²
=
0,55094
Axis
Title
500.000,00
400.000,00
Series1
300.000,00
200.000,00
Linear
(Series1)
100.000,00
-‐
0
50
100
150
200
250
300
Axis
Title
196
unidade 8
ESTATÍSTICA E PROBABILIDADES
Solução
197
unidade 8
ESTATÍSTICA E PROBABILIDADES
A equação estimada é:
^
Y = 86.873 + 1.335X1 + 67.719X2
198
unidade 8
ESTATÍSTICA E PROBABILIDADES
^
Y = 86.873 + 106.800 + 203.157 = R$ 396.830
verdade, esses modelos podem ser utilizados com um número bem maior
de variáveis explicativas.
199
unidade 8
ESTATÍSTICA E PROBABILIDADES
de itens em estoque. Nesse caso, ele não pode estocar muito, pois os
de tempo.
Revisão
A presente unidade tratou do tema relação entre duas ou mais
variáveis quantitativas. Foi demonstrado que, para o estudo de
duas variáveis quantitativas simultaneamente, faz-se interessante
o uso de diagramas de dispersão com o objetivo de inspecionar
visualmente se elas apresentam associação. Devemos observar,
principalmente, a forma, a intensidade e a direção da relação entre as
variáveis. Além disso, também é importante o cálculo do coeficiente
de correlação, que fornece um valor entre 0 e 1, podendo ser negativo
no caso de relacionamento linear inverso entre as variáveis.
200
unidade 8
ESTATÍSTICA E PROBABILIDADES
seguintes obras:
MOORE, David. A estatística básica e sua prática. Rio de Janeiro: LTC, 2014.
TRIOLA, Mário. Introdução à Estatística. 10 ed. Rio de Janeiro: LTC. 2008. 722p.
201
unidade 8
ESTATÍSTICA E PROBABILIDADES
Referências
BARBETTA, Pedro Alberto, REIS, Marcelo Menezes, BORNIA, Antônio
Cezar. Estatística: Para Cursos de Engenharia e Informática. 3 ed. Atlas,
2010. VitalBook file.
202
ESTATÍSTICA E PROBABILIDADES
MOORE, David. A estatística básica e sua prática. Rio de Janeiro. LTC, 2014.
203
ESTATÍSTICA E PROBABILIDADES
204
www.animaeducacao.com.br