Escolar Documentos
Profissional Documentos
Cultura Documentos
SEGURANÇA DA INFORMAÇÃO
PROBABILIDADE E ESTATÍSTICA
OURINHOS
2022
FATEC OURINHOS
SEGURANÇA DA INFORMAÇÃO
PROBABILIDADE E ESTATÍSTICA
OURINHOS
2022
SUMÁRIO
A média de uma amostra recolhida x̅ pode ou não coincidir com a verdadeira média
populacional μ. Para isso, é possível considerar um intervalo de médias amostrais onde está
média populacional possa estar contida. Quanto maior este intervalo, maior a probabilidade de
isso ocorrer.
Figura 1. Exemplo de Intervalo de Confiança de 90% entre seu limite superior (a) e inferior (-a).
1 REGRESSÃO LINEAR SIMPLES
A regressão linear simples é uma espécie de modelo na estatística cujo objetivo é indicar qual
será o comportamento de uma variável dependente (Y) como uma função que contenha uma
ou mais variáveis independentes (X).
Nesse caso, utilizaremos apenas uma variável independente e uma dependente. Se tivermos
mais que uma variável independente (X), utilizaremos a regressão linear múltipla.
Utilizamos a regressão linear simples para descrever a relação linear entre duas variáveis. Com
isso, ela é útil em algumas circunstâncias, como por exemplo:
Considere uma loja que vende peças de computadores. A quantidade de peças vendidas e o
valor das vendas são apresentados na tabela a seguir. Sejam y os valores arrecadados com a
venda de peças a cada hora e x a quantidade de clientes atendidos, ajuste um modelo de
regressão linear simples para os dados apresentados.
Em que Sxy seria o desvio padrão de y e o Sxx seria o valor do desvio padrão
de x.
Nesse caso, as fórmulas de desvio padrão seriam essas:
Não se preocupe, pois utilizando a tabela anterior do exercício, os dados serão preenchidos.
Vamos verificar os dados, fornecidos:
Retornando na fórmula: α = y – βx, utilizaremos y=2 e x=3, para encontrar o valor faltante de
alfa:
α = 2 – 0.7 * 3
α = 0,1.
Ou seja, a fórmula será igual a:
2 TESTE DE HIPÓTESE
O teste de hipótese é uma ferramenta estatística baseada na utilização de uma amostra aleatória
extraída de uma população de interesse, com o objetivo de testar uma afirmação sobre um
parâmetro ou característica desta população.
Não se trata de uma simples comparação matemática entre dois ou mais valores, mas da
necessidade de compreender se o valor obtido a partir de uma determinada amostra representa
uma simples variação amostral da situação atual ou não.
Imagine que o dono de duas farmácias mediu, durante 15 dias, o tempo de espera do cliente na
fila do caixa. Ao calcular o tempo médio, os valores obtidos foram 5 minutos na loja A e 3,5
minutos na loja B. Podemos afirmar que o tempo médio de espera na loja B é menor?
Para respondermos à pergunta podemos construir duas hipóteses uma hipótese nula (H0), em
que o tempo médio de espera é significativamente igual nas duas lojas. E uma hipótese
alternativa (Ha), em que existe diferença significativa entre o tempo médio da loja A e loja B.
A partir das hipóteses formuladas temos a possibilidade de quatro ocorrências, aceitando ou
rejeitando uma das hipóteses, como mostrado abaixo:
Ou seja, se a hipótese nula for verdadeira e a rejeitarmos, cometeremos um equívoco, esse erro
é chamado de erro tipo I. O correto seria aceitar essa hipótese.
Por outro lado, se a hipótese alternativa for verdadeira e rejeitarmos H0, tomaremos uma
decisão correta, se não rejeitássemos, estaríamos cometendo o erro tipo II.
3.2 Quais os tipos de teste de hipótese?
A partir dos conceitos discutidos, podemos aplicar alguns tipos de testes de hipóteses para a
combinação de uma variável x discreta com uma variável y contínua. Confira abaixo um
exemplo prático no Minitab para algumas dessas aplicações.
Exemplo:
O Green Belt responsável pelo projeto de consolidação de tubos na Voitto Labs, conseguiu
adquirir informações de mercado e identificou que os concorrentes estão trabalhando, em
média, com um índice de consolidação igual a 1,75.
Através do teste t para uma amostra o Green Belt fará uma validação estatística para concluir
se a Voitto Labs possui um resultado igual ou pior que dos concorrentes.
Neste exemplo podemos perceber claramente que se trata de um teste t para uma amostra, pois
a comparação que se deseja fazer é entre uma única empresa com um valor de referência.
A primeira coisa que se deve fazer é definir qual vai ser a hipótese nula e qual vai ser a hipótese
alternativa. Nesse exemplo vamos utilizar H0: índice de consolidação Voitto Labs = 1,75 e Ha:
índice de consolidação Voitto Labs ≠ 1,75.
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste t para 1
amostra.
Selecione Índice de consolidação como a variável > clique em realizar teste de hipóteses >
digite 1,75 em média hipotética > clique em opções e Escolha o teste ≠ como Hipótese
alternativa.
Dessa forma o Minitab nos retorna o valor do p-valor. Basta então analisá-lo. Basta então
analisá-lo. Se p-valor < α rejeita-se H0. Se p-valor ≥ α não se rejeita H0. Onde α é o nível de
significância, que estamos utilizando 5%.
3.2.2 Teste de hipótese ANOVA
Também conhecida como Análise de Variância, a ANOVA compara a média de mais de duas
amostras e determina se pelo menos uma difere significativamente.
Exemplo:
O fato que uma possível causa de um determinado problema seja a diferença de desempenho
das linhas de produção. Na Voitto Labs, o layout na área de produção é separado em quatro
linhas: verde, azul, vermelha e amarela.
O Green Belt fará uma análise de variância para determinar se o desempenho médio das linhas
é igual ou se pelo menos uma linha possui desempenho significativamente diferente das outras.
A hipótese nula nesse caso é de que H0: linha verde = linha azul = linha amarela = linha
vermelha. Já a hipótese alternativa é Ha: pelo menos um desempenho médio é
significativamente diferente.
Após fazer a análise no Minitab de forma similar aos exemplos anteriores basta analisar se p-
valor < α e assim rejeitar H0 e se p-valor ≥ α não rejeitar H0.
Exemplo:
Além de monitorar a produtividade dos operadores, a empresa Voitto Cars também acompanha
de perto o índice de refugo de peças produzidas. A empresa estabelece como meta um índice
de refugo igual ou menor que 2%.
Um Black Belt deseja verificar se as melhorias que ele realizou no processo e nos equipamentos
resultaram em um índice dentro da meta da empresa. Uma amostra aleatória de 480 peças foi
coletada e avaliada. Na amostra, 11 peças foram consideradas defeituosas e, consequentemente,
refugadas.
Através do teste para 1 proporção podemos comparar o resultado da amostra com o valor de
referência do índice de refugo.
Vamos tomar H0: proporção de peças refugadas na amostra = 2% e Ha: proporção de peças
refugadas na amostra ≠ 2%
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste para 1
proporção.
Selecione dados sumarizados > digite 11 em número de eventos: > 480 em número de ensaios:
> clique em realizar teste de hipóteses > digite 0,02 em proporção hipotética.
Confira se o nível de confiança está em 95% > escolha o teste ≠ como hipótese alternativa.
Rejeitamos H0 se p-valor < α e não rejeitar H0 se p-valor ≥ α. Para α = 0,05.