Você está na página 1de 12

FATEC OURINHOS

SEGURANÇA DA INFORMAÇÃO

PROBABILIDADE E ESTATÍSTICA

OURINHOS
2022
FATEC OURINHOS
SEGURANÇA DA INFORMAÇÃO

CINTIA RIBEIRO ALHER


LEONARDO VINICIUS ENGLAR DA SILVA
MARCO AURELIO MENEGHEL
MARIA CLARA RAMOS

PROBABILIDADE E ESTATÍSTICA

Probabilidade e estatística: Intervalo de


Confiança, Regressão Linear Simples, Teste de
Hipótese, apresentado à Fatec Ourinhos, como
exigência parcial à aprovação na Disciplina:
Probabilidade e estatística.
Professor: Marcelo Tutia.

OURINHOS
2022
SUMÁRIO

1. INTERVALO DE CONFIANÇA .................................................................................... 4


1.1 Exemplo de intervalo de Confiança: ................................................................................ 4
1 REGRESSÃO LINEAR SIMPLES ................................................................................ 5
2.1 Exemplos de Regressão Linear Simples: ......................................................................... 6
2 TESTE DE HIPÓTESE ................................................................................................... 8
3.1 Como fazer um teste de hipótese? .................................................................................... 9
3.2 Quais os tipos de teste de hipótese? ............................................................................... 10
3.2.1 Teste de hipótese tipo t para 1 amostra ....................................................................... 10
3.2.2 Teste de hipótese ANOVA .......................................................................................... 11
3.2.3 Teste de hipótese para 1 proporção ............................................................................. 11
1. INTERVALO DE CONFIANÇA

Intervalo de confiança é um intervalo numérico (de um parâmetro populacional, como a média


ou o desvio-padrão), associado a uma probabilidade (o nível de confiança), que representa a
confiança de que o intervalo contém o parâmetro.
É um intervalo observado que pode variar de amostra para amostra e que com dada frequência
inclui o parâmetro de interesse real não observável.
É expresso em porcentagem, denominadas por nível de confiança, sendo 90%, 95% e 99% as
mais indicadas.
O intervalo de confiança é importante para indicar a margem de incerteza (ou imprecisão)
frente a um cálculo efetuado. Esse cálculo usa a amostra do estudo para estimar o tamanho real
do resultado na população de origem.
O cálculo de um intervalo de confiança é uma estratégia que considera a amostragem de erro.
A dimensão do resultado do seu estudo e seu intervalo de confiança caracterizam os valores
presumíveis para a população original. Quanto mais estreito for o intervalo de confiança, maior
é a probabilidade de a porcentagem da população de estudo representar o número real da
população de origem dando maior certeza quanto ao resultado do objeto de estudo.

1.1 Exemplo de intervalo de Confiança:

A média de uma amostra recolhida x̅ pode ou não coincidir com a verdadeira média
populacional μ. Para isso, é possível considerar um intervalo de médias amostrais onde está
média populacional possa estar contida. Quanto maior este intervalo, maior a probabilidade de
isso ocorrer.

Figura 1. Exemplo de Intervalo de Confiança de 90% entre seu limite superior (a) e inferior (-a).
1 REGRESSÃO LINEAR SIMPLES

A regressão linear simples é uma espécie de modelo na estatística cujo objetivo é indicar qual
será o comportamento de uma variável dependente (Y) como uma função que contenha uma
ou mais variáveis independentes (X).
Nesse caso, utilizaremos apenas uma variável independente e uma dependente. Se tivermos
mais que uma variável independente (X), utilizaremos a regressão linear múltipla.
Utilizamos a regressão linear simples para descrever a relação linear entre duas variáveis. Com
isso, ela é útil em algumas circunstâncias, como por exemplo:

• Para prever o valor de uma variável pelo valor da outra;


• Para entender se uma variável está relacionada com a outra
• Criar um modelo base antes de criar modelos de Regressão Linear Múltipla
• Como exemplos práticos, podemos:
Avaliar o coeficiente de inteligência de acordo com a idade
Entender se “insônia” é um preditor de “depressão”
Ter como base os valores de regressão para “depressão” prevista por
“insônia” para, em seguinte, acrescentar novas variáveis.

Fórmula de uma regressão linear simples

As variáveis da equação podem ser interpretadas como:


y: o y são os valores previstos, para fazer uma previsão sobre ele(s);
x: é a variável independente;
α: o valor alfa indica o valor de “y”, quando “x” for igual a zero;
β: é a variável que determina a quão inclinada a reta será, pois, ela determinará se a
relação entre as variáveis é grande ou pequena.
Figura 2. Exemplo de Gráfico linear simples.

2.1 Exemplos de Regressão Linear Simples:

Considere uma loja que vende peças de computadores. A quantidade de peças vendidas e o
valor das vendas são apresentados na tabela a seguir. Sejam y os valores arrecadados com a
venda de peças a cada hora e x a quantidade de clientes atendidos, ajuste um modelo de
regressão linear simples para os dados apresentados.

Horas x: Clientes Atendidos (a cada 1h) y: Vendas (a cada R$ 1000,00)


1 1 1
2 2 1
3 3 2
4 4 2
5 5 4

A função linear, escrevemos y = α + βx. Isolando o alfa, temos: α = y – βx.


Passo 1: Para facilitarmos nossos cálculos, devemos construir uma tabela que contenha a
coluna x², a coluna y² e, a multiplicação de ambas:
X: Clientes
Horas Atendidos (a cada Y: Vendas (a cada R$ 1000,00) x² y² x*y
1h)
1 1 1 1 1 1
2 2 1 4 1 2
3 3 2 9 4 6
4 4 2 16 4 8
5 5 4 25 16 20
Somatório: 15 10 55 26 37

Passo 2: Para calcularmos o valor de β, devemos fazer o seguinte:

Em que Sxy seria o desvio padrão de y e o Sxx seria o valor do desvio padrão
de x.
Nesse caso, as fórmulas de desvio padrão seriam essas:

Não se preocupe, pois utilizando a tabela anterior do exercício, os dados serão preenchidos.
Vamos verificar os dados, fornecidos:

• O somatório de todos os itens da coluna x, da tabela, é igual a 15 (5+4+3+2+1),


concorda? Então, Σxi = 15.
• O somatório de todos os itens da coluna y, da tabela, é igual a 15 (4+2+2+1+1). Então,
Σyi = 10.
• O somatório de todos os itens da coluna Σx2, da tabela, é igual a 55 (1+4+9+16+25),
então, Σx2 = 55.
• O somatório de todos os itens da coluna Σx * Σy da tabela, é igual a 37 (1+2+6+8+20),
então, Σx * Σy = 37.
• Com base nos dados acima, já conseguimos utilizar as fórmulas:

Feito isso, agora iremos retornar na fórmula do β:

Retornando na fórmula: α = y – βx, utilizaremos y=2 e x=3, para encontrar o valor faltante de
alfa:
α = 2 – 0.7 * 3
α = 0,1.
Ou seja, a fórmula será igual a:

2 TESTE DE HIPÓTESE

O teste de hipótese é uma ferramenta estatística baseada na utilização de uma amostra aleatória
extraída de uma população de interesse, com o objetivo de testar uma afirmação sobre um
parâmetro ou característica desta população.
Não se trata de uma simples comparação matemática entre dois ou mais valores, mas da
necessidade de compreender se o valor obtido a partir de uma determinada amostra representa
uma simples variação amostral da situação atual ou não.

3.1 Como fazer um teste de hipótese?

Imagine que o dono de duas farmácias mediu, durante 15 dias, o tempo de espera do cliente na
fila do caixa. Ao calcular o tempo médio, os valores obtidos foram 5 minutos na loja A e 3,5
minutos na loja B. Podemos afirmar que o tempo médio de espera na loja B é menor?
Para respondermos à pergunta podemos construir duas hipóteses uma hipótese nula (H0), em
que o tempo médio de espera é significativamente igual nas duas lojas. E uma hipótese
alternativa (Ha), em que existe diferença significativa entre o tempo médio da loja A e loja B.
A partir das hipóteses formuladas temos a possibilidade de quatro ocorrências, aceitando ou
rejeitando uma das hipóteses, como mostrado abaixo:

Figura 3. Teste de hipótese

Ou seja, se a hipótese nula for verdadeira e a rejeitarmos, cometeremos um equívoco, esse erro
é chamado de erro tipo I. O correto seria aceitar essa hipótese.
Por outro lado, se a hipótese alternativa for verdadeira e rejeitarmos H0, tomaremos uma
decisão correta, se não rejeitássemos, estaríamos cometendo o erro tipo II.
3.2 Quais os tipos de teste de hipótese?

A partir dos conceitos discutidos, podemos aplicar alguns tipos de testes de hipóteses para a
combinação de uma variável x discreta com uma variável y contínua. Confira abaixo um
exemplo prático no Minitab para algumas dessas aplicações.

3.2.1 Teste de hipótese tipo t para 1 amostra

Determina se a média de uma amostra difere de maneira significativa de um valor especificado


como padrão.

Exemplo:
O Green Belt responsável pelo projeto de consolidação de tubos na Voitto Labs, conseguiu
adquirir informações de mercado e identificou que os concorrentes estão trabalhando, em
média, com um índice de consolidação igual a 1,75.
Através do teste t para uma amostra o Green Belt fará uma validação estatística para concluir
se a Voitto Labs possui um resultado igual ou pior que dos concorrentes.
Neste exemplo podemos perceber claramente que se trata de um teste t para uma amostra, pois
a comparação que se deseja fazer é entre uma única empresa com um valor de referência.
A primeira coisa que se deve fazer é definir qual vai ser a hipótese nula e qual vai ser a hipótese
alternativa. Nesse exemplo vamos utilizar H0: índice de consolidação Voitto Labs = 1,75 e Ha:
índice de consolidação Voitto Labs ≠ 1,75.
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste t para 1
amostra.
Selecione Índice de consolidação como a variável > clique em realizar teste de hipóteses >
digite 1,75 em média hipotética > clique em opções e Escolha o teste ≠ como Hipótese
alternativa.
Dessa forma o Minitab nos retorna o valor do p-valor. Basta então analisá-lo. Basta então
analisá-lo. Se p-valor < α rejeita-se H0. Se p-valor ≥ α não se rejeita H0. Onde α é o nível de
significância, que estamos utilizando 5%.
3.2.2 Teste de hipótese ANOVA

Também conhecida como Análise de Variância, a ANOVA compara a média de mais de duas
amostras e determina se pelo menos uma difere significativamente.

Exemplo:
O fato que uma possível causa de um determinado problema seja a diferença de desempenho
das linhas de produção. Na Voitto Labs, o layout na área de produção é separado em quatro
linhas: verde, azul, vermelha e amarela.
O Green Belt fará uma análise de variância para determinar se o desempenho médio das linhas
é igual ou se pelo menos uma linha possui desempenho significativamente diferente das outras.
A hipótese nula nesse caso é de que H0: linha verde = linha azul = linha amarela = linha
vermelha. Já a hipótese alternativa é Ha: pelo menos um desempenho médio é
significativamente diferente.
Após fazer a análise no Minitab de forma similar aos exemplos anteriores basta analisar se p-
valor < α e assim rejeitar H0 e se p-valor ≥ α não rejeitar H0.

3.2.3 Teste de hipótese para 1 proporção

Determina à proporção que uma amostra difere de maneira significativa de um valor


especificado como padrão.

Exemplo:
Além de monitorar a produtividade dos operadores, a empresa Voitto Cars também acompanha
de perto o índice de refugo de peças produzidas. A empresa estabelece como meta um índice
de refugo igual ou menor que 2%.
Um Black Belt deseja verificar se as melhorias que ele realizou no processo e nos equipamentos
resultaram em um índice dentro da meta da empresa. Uma amostra aleatória de 480 peças foi
coletada e avaliada. Na amostra, 11 peças foram consideradas defeituosas e, consequentemente,
refugadas.
Através do teste para 1 proporção podemos comparar o resultado da amostra com o valor de
referência do índice de refugo.
Vamos tomar H0: proporção de peças refugadas na amostra = 2% e Ha: proporção de peças
refugadas na amostra ≠ 2%
Após a coleta de dados, abra o Minitab e selecione stat > estatísticas básicas > teste para 1
proporção.
Selecione dados sumarizados > digite 11 em número de eventos: > 480 em número de ensaios:
> clique em realizar teste de hipóteses > digite 0,02 em proporção hipotética.
Confira se o nível de confiança está em 95% > escolha o teste ≠ como hipótese alternativa.
Rejeitamos H0 se p-valor < α e não rejeitar H0 se p-valor ≥ α. Para α = 0,05.

Você também pode gostar