Você está na página 1de 30

Aula

Testes de Aderência
Testes de Aderência
•  Os testes de aderência fazem parte dos chamados
testes não paramétricos, ou seja, os dados não seguem
uma determinada distribuição, geralmente a normal. O
objetivo destes testes é verificar se os dados de uma
amostra aderem (seguem) uma distribuição teórica ou
empírica.
•  O objetivo destes testes é verificar se os dados de uma
amostra aderem (seguem) uma distribuição teórica ou
empírica.
•  Dois testes se destacam pela sua importância:
- Teste Qui-Quadrado
- Teste de Kolmogorov-Smirnov
Testes de Aderência
O objetivo é garantir que a curva sob teste realmente representa o processo do
qual foram coletados os dados:

Primeiro teste: TESTE DO CHI-QUADRADO (X2)


Válido apenas para distribuições discretas
k
( f0 − fe )2
χ2 =∑
i=1 fe

Onde:
k = número de classes ou intervalos
f0 = frequência observada nas classes
fe = frequência esperada nas classes
∑ = somatório de todas as classes
k
Testes Qui-Quadrado
Baseia-se no cálculo dos desvios entre as frequências
acumuladas observadas em cada classe e as frequências teóricas
(usando-se o modelo escolhido) nas mesmas classes.
O objetivo é garantir que a curva sob teste realmente
representa o processo do qual foram coletados os
dados:
Quanto menor o valor
k (f − f ) 2
0i ei
de X 2 , melhor é o
2
χ = ∑ ajuste. Se X2 = zero, o
i=1 fe ajuste é perfeito.
i
Testes Qui-Quadrado
Escolhendo-se um nível de significância α(100%) e K-1-n graus de
liberdade, obtém-se da tabela de distribuição do qui-quadrado, o valor
χ2crítico . Se χ2 for maior que χ2crítico , rejeita-se a hipótese de que a amostra
observada provém da uma população com a distribuição teórica adotada.
Na aplicação do teste é recomendável que o valor mínimo de
frequências seja 5. Se esse valor for muito pequeno, ele pode ser
combinado com valores esperados adjacentes . Também recomenda-se
que as amostras tenham pelo menos 25 elementos. A tabela a seguir
apresenta sugestões para o número de classes para esse teste:


Testes de Aderência
Testes de Aderência

Normal Uniforme

Erlang Exponencial

...etc. Beta
Triangular
Testes de Aderência

ü Normal

Uniform

Exponential
Testes de Aderência

Exponencial Triangular Erlang


Erro: 0.45 Erro: 0.33 Erro: 0.39

Beta Uniforme
Normal Erro: 0.21 Erro: 0.48
Erro: 0.15

Normal
Média 3.34
Desvio padrão 1.82
Considerações Importantes

Sobre o tamanho da amostra:


Quanto maior a amostra (quantidade de tomadas de tempo ou registros), melhor o
histograma irá representar o comportamento da distribuição teórica.
Exemplos para uma curva NORMAL de média 8, desvio de 2:

Histograma gerado com


amostra de 50 valores
Considerações Importantes
Histograma gerado com Histograma gerado com
amostra de 100 valores amostra de 500 valores

Histograma gerado com Histograma gerado com


amostra de 1000 valores amostra de 5000 valores
Exemplo
Para monitorar o tráfego de chamadas telefônicas
em uma central de atendimento, foram registradas as
chamadas em intervalos de 5 minutos. Os valores
esperados para o possível número de chamadas em
cada intervalo vão de 0 a um máximo de 13
chamadas. Foram registrados 400 intervalos e os
resultados estão mostrados na tabela a seguir.
A hipótese a considerar é a verificação da
aderência dos dados com relação a uma distribuição
de Poisson, com média λ= 4,6.


Frequência esperada = n × prob. Poisson
Ex.: Freq. Esp. = 400 × 0,0101 = 4,0

H0 : A variável aleatória possui distribuição da Poisson com


média λ = 4,6
H1 : A variável aleatória não possui distribuição de Poisson
com média λ = 4,6
Valor crítico χ2
α = 5%
Como limitação do teste, não se devem usar classes com
frequências menores que 5, portanto a primeira classe deve ser
acumulada na segunda e as três últimas acumuladas na anterior.
ν = k – 1 – p = 10 -1 -1 = 8, p é o número de parâmetros da
distribuição sob hipótese.
Teste de Kolmogorov-Smirnov

•  Abreviadamente K-S,
• Ao contrário do teste do Qui-quadrado, não
se aplica a dados qualitativos nem a variáveis
discretas, pois a tabela disponível para este teste
só é exata caso a distribuição em teste seja contínua
Teste Kolmogorov-Smirnov
•  Compara a função acumulada (ou função de
repartição) do modelo teórico com a função
acumulada de probabilidade observada (feita
a partir dos valores observados)
•  Para se comparar se o modelo observado
adere ao modelo teórico, o teste calcula a
distância absoluta máxima entre duas
distribuições acumuladas.
Cálculo da Distância Máxima

D = max F(x)− S(x)

D = Distância máxima absoluta


S(x) = Função acumulada observada
F(x) = Função acumulada teórica
Hipóteses
H0: O modelo é adequado para representar a
distribuição da população (D ≤ Dcrítico)

Ha: O modelo não é adequado para representar a
distribuição da população

Dcr;itico é relacionado na tabela de valores críticos do
teste KS para diferentes níveis de significância
Nível Descritivo
p - value
•  O processo de modelagem de dados para simulação
termina com algum teste estatístico para determinar se
o modelo probabilístico selecionado tem ou não
aderência ao conjunto de dados observados.
•  Escolhe-se um nível de significância, e se o valor obtido
na amostra, para um dado parâmetro, for menor que
um valor crítico tabelado, então a hipótese de aderência
de dados não é rejeitada.
•  Os softwares fornecem, ainda, um outro valor para
determinação de aderência de dados denominado p-
value, a partir do qual são tomadas decisões de rejeição
ou não das hipóteses de aderência.

Nível Descritivo
p - value

O p-value, ou nível descritivo representa o menor nível de significância
que pode ser assumido para se rejeitar a hipótese de aderência, ou seja:

- Se p-value ≤ α, então H0 é rejeitada ao nível de significância α

- Se p-value > α, então H0 não é rejeitada ao nível de significância α


Portanto, quanto menor o p-value, mais razões temos para rejeitar a
hipótese




hipóteses de aderência. O p-value, ou nível descritivo representa o menor nível de
Nível Descritivo
significância que pode ser assumido para se rejeitar a hipótese de aderência, ou seja:


p - value
Se p-value ≤ α, então H é rejeitada ao nível de significância α
0

Se p-value > α, então H0 não é rejeitada ao nível de significância α


Para definir os critérios de classificação de
• Portanto, quanto menor o p-value, mais razões temos para rejeitar a hipótese
p-value, usam-se os dados a seguir:
Para definir os critérios de classificação de p-value, usam-se os dados a seguir:

Valor Critério
p-value < 0,01 Evidência forte contra a hipótese de aderência
0,01 ≤ p-value < 0,05 Evidência moderada contra a hipótese de aderência
0,05 ≤ p-value < 0,10 Evidência potencial contra a hipótese de aderência
0,10 ≤ p-value Evidência fraca ou inexistente contra a hipótese de aderência

7. Validação de Modelos de Simulação

A validação deve garantir que os modelos criados são isentos de erros de sintaxe e /
Validação dos modelos de simulação
•  A validação deve garantir que os modelos criados são
isentos de erros de sintaxe e / ou de lógica, bem como
ser representativo do sistema real ou projetado.
•  Na prática, estas ações de verificação e validação, além
da análise dos resultados, acontecem por todo o
processo de elaboração do modelo.
•  A verificação e validação se dá após o desenvolvimento
computacional de simulação pode-se encontrar uma das
seguintes categorias:
1. Não-validado e não-verificado
2. Não-validado e verificado
3. Validado e não-verificado
4. Validado e verificado
Por exemplo, um modelo não-validado e
verificado seria aquele em que todos os
pressupostos estão corretamente
implementados, isto é, computacionalmente
falando, o programa está correto , ma seus
resultados estão longe da realidade do sistema
real. O objetivo principal do processo de
validação e verificação é dispor de modelos que
se encontrem na última das quatro categorias

Nível Descritivo
p - value
•  O processo de modelagem de dados para simulação
termina com algum teste estatístico para determinar se
o modelo probabilístico selecionado tem ou não
aderência ao conjunto de dados observados.
•  Escolhe-se um nível de significância, e se o valor obtido
na amostra, para um dado parâmetro, for menor que
um valor crítico tabelado, então a hipótese de aderência
de dados não é rejeitada.
•  Os softwares fornecem, ainda, um outro valor para
determinação de aderência de dados denominado p-
value, a partir do qual são tomadas decisões de rejeição
ou não das hipóteses de aderência.

Nível Descritivo
p - value

O p-value, ou nível descritivo representa o menor nível de significância
que pode ser assumido para se rejeitar a hipótese de aderência, ou seja:

- Se p-value ≤ α, então H0 é rejeitada ao nível de significância α

- Se p-value > α, então H0 não é rejeitada ao nível de significância α


Portanto, quanto menor o p-value, mais razões temos para rejeitar a
hipótese




hipóteses de aderência. O p-value, ou nível descritivo representa o menor nível de
Nível Descritivo
significância que pode ser assumido para se rejeitar a hipótese de aderência, ou seja:


p - value
Se p-value ≤ α, então H é rejeitada ao nível de significância α
0

Se p-value > α, então H0 não é rejeitada ao nível de significância α


Para definir os critérios de classificação de
• Portanto, quanto menor o p-value, mais razões temos para rejeitar a hipótese
p-value, usam-se os dados a seguir:
Para definir os critérios de classificação de p-value, usam-se os dados a seguir:

Valor Critério
p-value < 0,01 Evidência forte contra a hipótese de aderência
0,01 ≤ p-value < 0,05 Evidência moderada contra a hipótese de aderência
0,05 ≤ p-value < 0,10 Evidência potencial contra a hipótese de aderência
0,10 ≤ p-value Evidência fraca ou inexistente contra a hipótese de aderência

7. Validação de Modelos de Simulação

A validação deve garantir que os modelos criados são isentos de erros de sintaxe e /
Validação dos modelos de simulação
•  A validação deve garantir que os modelos criados são
isentos de erros de sintaxe e / ou de lógica, bem como
ser representativo do sistema real ou projetado.
•  Na prática, estas ações de verificação e validação, além
da análise dos resultados, acontecem por todo o
processo de elaboração do modelo.
•  A verificação e validação se dá após o desenvolvimento
computacional de simulação pode-se encontrar uma das
seguintes categorias:
1. Não-validado e não-verificado
2. Não-validado e verificado
3. Validado e não-verificado
4. Validado e verificado
Por exemplo, um modelo não-validado e
verificado seria aquele em que todos os
pressupostos estão corretamente
implementados, isto é, computacionalmente
falando, o programa está correto , ma seus
resultados estão longe da realidade do sistema
real. O objetivo principal do processo de
validação e verificação é dispor de modelos que
se encontrem na última das quatro categorias

Você também pode gostar