Você está na página 1de 9

Aula 3

Matemática Computacional Conversa Inicial

Prof. Gian Carlo Brustolin

Matemática computacional

Conceitos de probabilidade
Probabilidade e estatística
Amostragem
A ciência da computação sempre
Estatística descritiva
buscou algoritmos determinísticos,
mas a complexidade dos problemas Inferência estatística
enfrentados atualmente a obrigou a se Distribuições estatísticas notáveis
aproximar das soluções estocásticas

Espaço amostral
Conceitos de Probabilidade
Evento
Probabilidade

1
Junção de todos os possíveis resultados obtidos
Espaço amostral
a partir de um determinado experimento
De “S” (do inglês Space)
ou Ω (letra grega ômega)
S = { DM, DN, IM, IN}
Junção de todos os possíveis Figura 1 - Resultados e Espaço Amostral II (autoral)

Mouse OK (M)
resultados obtidos a partir de
Jogo Disponível (D)
um determinado experimento Mouse não OK (N)
Logar
Mouse OK (M)
Jogo Indisponível (I)
Mouse não OK (N)

Evento Probabilidade

Probabilidade é a chance de que um


Qualquer subconjunto de
determinado evento ocorra
S será dito evento de S
Ex.: Se S={1,2,3,4,5,6,7,8,9,0,+,-,*,/,=,C}
Em um teclado numérico, composto de
qual P(9)?
S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 0, +, -, *, /, =, C}
podemos imaginar os eventos Se existem 16 teclas, a chance de aperta
a tecla 9 é uma em 16 possibilidades
Números pares = {2, 4, 6, 8}
P(9)=1/16, ou seja, 0,0625
Operadores matemáticos = {+, -, *, /, =}
ou ainda 6,25%

Ex.3: Se S={1,2,3,4,5,6,7,8,9,0,+,-,*,/,=,C}
qual P(par) ou menor que 7?
Ex.2: Se S={1,2,3,4,5,6,7,8,9,0,+,-,*,/,=,C} 4 chances em 16 possibilidades
qual P(par)? ou 4/16 de ser par
4 chances em 16 possibilidades 6 chances em 16 possibilidades
ou 4/16, ou seja, 25% ou 6/16 de ser < 7
4/16 +6/16 – 3/16 = 7/16 = 0,4375
P(AUB) = P(A) + P(B) – P(AՈB)

2
Amostragem Para ser possível a descrição de um
fenômeno amplo é necessário reduzir
o campo de análise pela amostragem

Amostragem aleatória simples

Ao amostrarmos uma população


devemos garantir a presença de
Amostragem aleatória simples elementos representativos de
toda a variedade da população
Variação amostral
Amostra aleatória simples é escolhida de forma
Vícios de amostragem
que cada coleção de n itens da população é
igualmente provável de compor a amostra
Eficaz em experimentos
equiprováveis e homogêneos

Variação amostral Vícios de amostragem

Ao usarmos a técnica de amostragem


aleatória simples poderemos inferir sobre Garantir a plena aleatoriedade
a qualidade de toda a população, mas uma da amostra não é simples
segunda amostragem, pela mesma técnica, Coletadas as amostras é interessante
pode levar a um resultado ligeiramente testar sua aleatoriedade
diferente Alternativas
A relação entre a amostra puramente Amostragem estratificada,
aleatória e a população é matematicamente amostragem ponderada
conhecida

3
Figura 2 – Vícios em amostragem aleatória simples

Estatística Descritiva

(adaptado de Navidi, 2012 p. 7)

Estatística descritiva monovariada


Apresentar os dados de forma útil Medidas descritivas em estatística
para as análises que desejamos monovariada
Para a estatística descritiva, eventual Estatística descritiva bivariada
viés na amostra não é importante Medidas descritivas em estatística
bivariada

TABELA DESCRITIVA MONOVARIÁVEL CATEGÓRICA


Estatística descritiva monovariada Sexo Frequência % % de respostas válidas
1 feminino 159 38,7 39,1
2 masculino 248 60,3 60,9
Subtotal 407 99,0 100,0

Apenas uma característica da 9 sem resposta 4 1,0 -


Total 411 100,0 -
população é observada e descrita Elaborado com base em (BECKER, 2015, pg.48).

GRÁFICOS DESCRITIVOS DE MONOVARIÁVEL CATEGÓRICA


Variável
70,00% 60,90%
Nominal (em categorias ou categórica) ou 60,00%
50,00%
60,90%
39,10%
40,00%
39,10%
Métrica (intervalares ou de razão) 30,00%
20,00%
10,00%
0,00% 1 Feminino 2 Masculino
1 Feminino 2 Masculino (adaptada de Becker, 2015, p. 49)

4
FIGURA 3– TABELA DESCRITIVA DE MONOVARIÁVEL MÉTRICA
Diâmetro (mm) Frequência %
20,5 – 22,5 15 3,6
22,5 – 24,5 17 4,1
24,5 – 26,5 14 3,4
Variável métrica (intervalares ou de razão) 26,5 – 28,5 12 2,9
28,5 – 30,5 20 4,9
deve ser descrita em intervalos ou faixas 30,5 – 32,5 24 5,8
32,5 – 34,5 21 5,1
Número faixas: 𝑛 faixas onde 𝑛 34,5 – 36,5 35 8,5
36,5 – 38,5 21 5,1
representa o tamanho da amostra 38,5 – 40,5 39 9,5
40,5 – 42,5 44 10,7
Problema de escolha do intervalo 42,5 – 44,5
44,5 – 46,5
45
50
10,9
12,2
interfere na envoltória 46,5 – 48,5 29 7,1
48,5 – 50,5 14 3,4
50,5 – 52,5 8 1,9
52,5 – 54,5 3 0,7
Total 411 100,0
Elaborado com base em (BECKER, 2015, pg.56).

Figura 4 – Histograma de monovariável métrica Medidas descritivas em


60 estatística monovariada
50

40

30
Média - média aritmética simples
20
Fornece uma aproximação da
10 centralidade da distribuição
0

(adaptada de Becker, 2015, p. 56)

Desvio em torno da Média


Variabilidade - concentração de amostras Variância
nas proximidades da média, ou isoladas e Somatório do quadrado os desvios
distantes em relação a esta
Fornece uma aproximação da
Calculado pela diferença entre o variabilidade das amostras
valor da média e o valor da amostra em torno da média
Somatório dos desvios = zero

5
Estatística descritiva bivariada

Desvio Padrão Duas características independentes da


população são observadas e descritas
Raiz quadrada da variância
Identificação das variações conjuntas
Fornece uma aproximação
variabilidade das amostras Se duas variáveis são independentes
em torno da média na mesma não pode haver correção entre elas
dimensão que as amostras É possível que tenhamos ambas
categóricas, uma delas métricas
ou ambas métricas

FIGURA 5 – TABELA DESCRITIVA BIVARIÁVEL CATEGÓRICA Figura 6 – Diagrama de dispensão

Sexo

Local de trabalho 1 feminino 2 masculino Total da linha

1 direção geral 13 28 41

2 superintendências 24 33 57 Ambas as métricas

3 agências 89 136 225

4 órgãos regionais 33 50 83

Total da coluna 159 247 406


Elaborado com base em (BECKER, 2015, pg. 80).
(adaptada de Becker, 2015, p. 80)

Medidas descritivas em estatística bivariada

Medidas de dependência
entre as variáveis analisadas Inferência Estatística
Covariância
Coeficiente de Correlação,
coeficiente de Pearson ou “p”
válida se a relação for linear

6
É possível inferir os parâmetros Estimativa tendenciosa
descritivos de uma população a
Intervalo de confiança
partir dos mesmos parâmetros
obtidos das amostras Tamanho da amostra

Estimativa tendenciosa Intervalo de confiança

A média de uma amostragem se aproximará da


média populacional, conforme aumentamos o
É necessário que haja um compromisso
número de amostras, mas não será igual a essa
entre a amostra e a população
Diferença entre as médias
A coincidência entre a média da (de amostragem e populacional)
distribuição amostral e a média é chamada de nível de confiança
da população é suficiente para
Por exemplo, nível de confiança de 99% -
amostragem não tendenciosa
variação de 1% acima ou abaixo do valor
calculado na amostra - intervalo de confiança

NÚMERO DE AMOSTRAS
Tamanho da amostra Suponha que uma instalação (autoral)
industrial produza tecidos de
determinado material 30 amostras

Quantas amostras precisam ser Esta instalação produz


90 amostras
coletadas minimamente para que 2 toneladas de tecido verde
seja possível a inferência estatística com 1,5m de largura 60 amostras

3t de tecido azul de 1,5m


Segundo Spiegel e Stephens, 2009 p. 292,
90 amostras
este número é 30 1t de tecido amarelo de 1,5m
3t de tecido verde com 3m de largura
Para n<30 a inferência é possível, 60 amostras
2t de tecido azul de 3m
mas precisa ser avaliada
45 amostras
1,5t de tecido amarelo de 3m

7
Distribuição normal
Distribuições Estatísticas Notáveis
Distribuição de Poisson
Distribuição binominal

Distribuição normal Distribuição normal

Processos em que a variável


de interesse é resultante de
pequenas variações
independente
Medidas naturais,
antropomórficas e
medidas industriais
zizou7/shutterstock

Distribuição de Poisson Distribuição de Poisson

Descreve a possibilidade de ocorrência de


dado fenômeno em um intervalo de tempo
Exemplo:
call centers para estimar a probabilidade de
ocorrência de dada demanda de atendimento
em determinado período de tempo, conhecida
a média de atendimentos por período
(fonte www.researchgate.net/publication/260050332_Seguranca_Estrutural/figures?lo=1)

8
Distribuição binomial Figura 7 – Distribuição Binomial

Adéqua-se bem a eventos de 𝑛 repetições


independentes, sob as mesmas condições,
nas quais a probabilidade de ocorrência de
um evento 𝐴 é constante
Exemplo: determinação da probabilidade
de um grupo de clientes responder a uma
pesquisa se sabemos que a resposta média
dos clientes é de P% das pesquisas enviadas
(fonte: www.inf.ufsc.br)

A necessidade de tratamento estatístico


de dados em análise de segurança da
Finalizando informação, inteligência artificial e
tratamento de congestionamento
de redes por exemplo forçaram a
aplicação deste conhecimento

Você também pode gostar