Escolar Documentos
Profissional Documentos
Cultura Documentos
Ministrado por
Andrea Vanzillotta
06/09/2016
Conteúdo Programático
• Introdução
• O que são testes de aderência de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
2
Introdução
• Por que realizar estudos de aderência em avaliações atuariais?
– O cálculo atuarial é baseado em hipóteses que precisam periodicamente ser
verificadas quanto a sua adequação (ajuste entre eventos esperados e eventos
ocorridos)
(*)
Item 1 do anexo da Resolução CGPC 11/2002: As hipóteses biométricas, demográficas,
econômicas e financeiras devem estar adequadas às características da massa de
participantes e ao regulamento do plano de benefícios.
3
O que diz a legislação
(Resoluções do CGPC)
• Analisando o texto consolidado da Resolução CGPC 18/2006(*), temos:
• Para todas as hipóteses (exceto taxa de juros) o estudo técnico deverá conter descrição e
justificativa da metodologia utilizada, que deverá comprovar, por meio de testes
estatísticos ou atuariais, a aderência das hipóteses atuariais e ser adequada às
características do plano de benefícios e de sua massa de participantes e assistidos (art. 7º).
• Caso seja constatada pelo atuário responsável pelo plano de benefícios a inviabilidade de
demonstração de aderência de hipótese, deverão constar do estudo técnico as justificativas
que tenham levado a essa conclusão, bem como o critério adotado para escolha da
referida hipótese. (art. 8º)
56. Além das informações constantes das Demonstrações Atuariais - DA, a avaliação atuarial deve abranger outras informações
julgadas relevantes para a gestão dos planos de benefícios, tais como plano de custeio, projeções atuariais, estudos de cenários,
estudos de aderência de hipóteses atuariais, entre outras.
67. Cabe ao atuário a proposição das hipóteses atuariais a serem utilizadas na avaliação atuarial, identificando o conjunto de
hipóteses aplicáveis ao plano de benefícios por meio de estudos de aderência, com foco prospectivo. Dessa forma, o atuário deve
indicar as hipóteses que melhor expressem as tendências futuras do plano, de acordo com os cenários existentes na data da
avaliação atuarial, bem como apresentar os impactos da sua aplicação em comparação com outras hipóteses.
81. Caso seja adotada uma hipótese na avaliação atuarial em decorrência de conservadorismo, de imaterialidade ou de
simplificação, este critério deve ser explicitado pelo atuário em seu parecer, indicando qualquer necessidade de ajuste das
hipóteses utilizadas, tendo como base estudos de aderência ou fatos que tenham ocorrido desde a última avaliação atuarial.
B) FACE 1 2 3 4 5 6
OBS 3 6 3 7 3 8
ESP 5 5 5 5 5 5
C) FACE 1 2 3 4 5 6
OBS 27 18 18 22 25 10
ESP 20 20 20 20 20 20
6
1,5
5
OBS OBS
4
1 ESP ESP
3
2
0,5
1
0 0
1 2 3 4 5 6 1 2 3 4 5 6
9
D) FACE 1 2 3 4 5 6
OBS 45 51 50 48 46 60
ESP 50 50 50 50 50 50
E) FACE 1 2 3 4 5 6
OBS 94 104 97 91 112 102
ESP 100 100 100 100 100 100
F) FACE 1 2 3 4 5 6
OBS 959 956 1042 1049 989 1005
ESP 1000 1000 1000 1000 1000 1000
10
11
Conclusão:
• A análise “visual” e gráfica pode muita das vezes ser subjetiva,
por isso é necessário uma metodologia científica que
estabeleça um conjunto de normas e critérios para a
determinação da aderência (ou não) entre duas amostras.
12
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
13
Testes de Hipóteses
• Uma hipótese estatística é uma afirmação acerca dos
parâmetros (média, desvio padrão) de uma população ou
acerca da distribuição da população.
– Exemplo 1: ao jogar uma moeda, a probabilidade de sair cara é de 50%
– Exemplo 2: a longevidade dos participantes do Plano A tem
comportamento semelhante ao previsto pela tábua AT-2000
14
Teste de hipóteses
• É um método de inferência estatística usando dados de um estudo científico.
15
Procedimento para realizar
um teste de hipóteses
• Em primeiro lugar, precisamos definir qual a hipótese que
queremos testar.
16
Definição de H0 e H1
• Pelos exemplos anteriores, temos duas hipóteses:
17
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
18
Erros do Tipo I e Tipo II
Aceitar H0 Rejeitar H0
Erro do tipo I
H0 verdadeira Decisão correta
( )
Erro do tipo II
H0 falsa Decisão correta
(b)
• Se por outro lado, aceitamos uma hipótese quando ela deveria ser REJEITADA,
dizemos que foi cometido um erro do TIPO II (β).
– Exemplo: aceitei a tábua AT-2000 quando na verdade ela é não é
aderente 19
Nível de Significância () e grau de
confiança
• Para testar uma dada hipótese, a probabilidade com a qual
estamos nos arriscando a cometer um erro Tipo I (rejeitar
quando a hipótese é verdadeira) é denominada nível de
significância do teste.
21
Quanto maior o valor
de α, menor a região
de aceitação (mais
rigoroso é o teste)
22
Observação:
• Devemos selecionar o nível de antes de analisar os dados.
23
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
24
Valor-p (ou p-valor)
• É a probabilidade de se obter uma estatística de teste igual ou mais
extrema que aquela observada em uma amostra, sob a hipótese nula.
27
Atenção!!
• O valor-p não é a probabilidade da hipótese nula de um teste ser verdadeira.
– Um valor-p de 0,996 não significa dizer que a probabilidade de H0 ser verdadeira é de 99,6%
– Se estivermos testando duas tábuas e para a primeira o p-valor deu 0,895 e para a segunda, 0,913,
não significa dizer que a segunda tábua é “mais aderente” que a primeira. A leitura que se faz é que
ambas não foram rejeitadas.
• Valor-p e nível de significância não são sinônimos. O valor-p é sempre obtido de uma
amostra, enquanto o nível de significância é geralmente fixado (arbitrado) antes da coleta
dos dados.
• Quanto maior o p-valor, maior poderia ser o poder do teste, dado que ele indica o valor
máximo de (nível de significância) com o qual H0 seria aceito.
28
Como calcular o valor-p?
• Se tudo isso ocorrer, é muito provável que a amostra seja aceitavelmente simétrica, terá com
certeza apenas um ponto máximo, centrado no intervalo de classe onde está a média da
distribuição, e o seu histograma de frequências terá um contorno que seguirá
aproximadamente o desenho em forma de sino da curva normal.
32
Testes Paramétricos e
Não Paramétricos
• Uma vez que seja possível inferir o cumprimento desses
requisitos, é possível utilizar a estatística paramétrica. Caso
contrário, a alternativa é a estatística não paramétrica.
33
Testes Paramétricos
• Os testes paramétricos assumem que a distribuição de probabilidade da
população da qual retiramos os dados seja conhecida e que somente os
valores de certos parâmetros, tais como a média e o desvio padrão, sejam
desconhecidos.
35
Algumas restrições ao uso
dos testes não paramétricos
• Em geral não levam em consideração a magnitude dos dados. Em muitos
casos isso se traduz num desperdício de informações.
37
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
38
Teste Kolmogorov-Smirnov
• Para uma amostra
– é uma prova de aderência, isto é, avalia o grau de concordância entre a distribuição de um conjunto
de valores amostrais (valores observados) e determinada distribuição teórica específica.
– A prova bilateral é sensível a qualquer diferença nas distribuições das quais se extraíram as
amostras: diferenças na posição central, na dispersão, na assimetria, etc.
– A prova unilateral é utilizada para determinar se os valores da população da qual se extraiu uma das
amostras são, ou não, estocasticamente maiores ou menores do que os valores da população que
originou a outra amostra, por exemplo, se a distribuição da probabilidade de mortalidade é menor
ou igual à distribuição teórica esperada.
39
Teste de Kolmogorov Smirnov (K-S) para
duas amostras independentes (bilateral)
• A prova K-S de duas amostras comprova que elas foram extraídas da mesma população (ou
de populações com a mesma distribuição).
• A prova testa se os valores amostrais podem ser considerados oriundos de uma população
com uma suposta distribuição teórica, utilizando para isso a distribuição de frequências
acumuladas.
40
Exemplo (duas amostras, bilateral)
(A) (B) (C) (D) (E) (F)
ESPERADO CUMUL % CUMUL % DIFERENÇA
IDADE OBS
AT-2000 AT-2000 OBS (MÓDULO)
até 30 anos 1 1 0,0256 0,0385 0,0128
31 a 40 anos 1 2 0,0513 0,1154 0,0641
41 a 50 anos 2 4 0,1026 0,2692 0,1667
51 a 60 anos 8 6 0,3077 0,5000 0,1923
61 a 70 anos 12 4 0,6154 0,6538 0,0385
71 a 80 anos 8 5 0,8205 0,8462 0,0256
> 80 anos 7 4 1,0000 1,0000 -
TOTAL 39 26
D-calc 0,1923
= 0,05 D-crit 0,3443
H0: a tábua AT-2000 se ajusta à distribuição dos eventos observados
H1: a tábua AT-2000 não se ajusta à distribuição dos eventos observados
Como D-calc é MENOR que o D-crit, não há evidências suficientes para rejeitar H0
41
Metodologia
42
Resultado para outras tábuas
(A) (B) (C) (D) (E) (F)
ESPERADO CUMUL % CUMUL % DIFERENÇA
IDADE OBS
AT-83 AT-83 OBS (MÓDULO)
até 30 anos 1 1 0,0204 0,0385 0,0181
31 a 40 anos 2 2 0,0612 0,1154 0,0542
41 a 50 anos 3 4 0,1224 0,2692 0,1468
51 a 60 anos 10 6 0,3265 0,5000 0,1735
61 a 70 anos 15 4 0,6327 0,6538 0,0212
71 a 80 anos 10 5 0,8367 0,8462 0,0094
> 80 anos 8 4 1,0000 1,0000 -
TOTAL 49 26
D-calc 0,1735
= 0,05 D-crit 0,3300
Como D-calc é MENOR que o D-crit, não há evidências suficientes para rejeitar H0
43
Resultados para outras
tábuas
GAM-94 D-calc 0,2500
= 0,05 D-crit 0,3364
Não há evidências
AT-2000 suav 10% D-calc 0,1857
= 0,05 D-crit 0,3521 suficientes para
RP-2000 D-calc 0,2907 rejeitar H0 em
= 0,05 D-crit 0,3379
nenhuma dessas
BR SOBREV 2010 D-calc 0,1471 tábuas
= 0,05 D-crit 0,3543
44
Cálculo do p-valor no teste K-S
45
Resultados encontrados no Excel utilizando
o add-in disponível no site “Real Statistics
Using Excel”
D crit D crit p-valor
TÁBUA D calc
(tabela) (add-in) (add-in)
AT-2000 0,1923 0,3443 0,3314 0,5638
AT-83 0,1735 0,3300 0,3182 0,6433
GAM-94 0,2500 0,3364 0,3241 0,2226
AT-2000 suav 10% 0,1857 0,3521 0,3386 0,6358
RP-2000 0,2907 0,3379 0,3255 0,1054
BR SOBREV 2010 0,1471 0,3543 0,3406 0,8818
51
Cálculo do Qui-Quadrado
DISTRIBUIÇÃO OBSERVADA DISTRIBUIÇÃO TEÓRICA
IDADE AT-83 OBS TOTAL AT-83 OBS TOTAL
até 30 anos 1 1 2 1,307 0,693 2
31 a 40 anos 2 2 4 2,613 1,387 4
41 a 50 anos 3 4 7 4,573 2,427 7
51 a 60 anos 10 6 16 10,453 5,547 16
61 a 70 anos 15 4 19 12,413 6,587 19
71 a 80 anos 10 5 15 9,800 5,200 15
> 80 anos 8 4 12 7,840 4,160 12
TOTAL 49 26 75 49 26 75
até 30 anos 1 1 2
31 a 40 anos 2 2 4
41 a 50 anos 3 4 7 H0: a tábua AT-83 é aderente
51 a 60 anos 10 6 16 H1: a tábua AT-83 não é aderente
61 a 70 anos 15 4 19
71 a 80 anos 10 5 15
> 80 anos 8 4 12
TOTAL 49 26 75
Como 2-calc é MENOR que o 2-crit, não há
QUI-QUADRADO CALCULADO 3,8169
evidências suficientes para rejeitar H0
GRAUS DE LIBERDADE 6
GRAU DE SIGNIFICâNCIA () 0,05
VALOR CRÍTICO DO QUI-QUADRADO 12,5900 (valor tabelado - Tabela C no Apêndice)
12,5916 (fórmula Excel)
p-valor 0,7014 (fórmula Excel)
54
Quando usar o teste 2
55
Quando usar o teste 2
• Para tabelas de contingência com gl > 1
– Pode ser usado se menos do que 20% das células têm frequência
esperada menor do que 5 e se nenhuma célula tem frequência
esperada menor do que 1. (o exemplo anterior não atende a essas
condições!!!)
O resultado de um teste de hipóteses não deve ser visto como “verdade absoluta”.
Teste não é oráculo !!!
Nenhum teste, por mais sofisticado que seja, vai substituir essa análise.
63
Comentários Finais
• É consenso que as premissas atuariais precisam ter sua adequação e
aderência verificada periodicamente.
• Portal Action
http://www.portalaction.com.br
• Real Statistics Using Excel (download gratuito de add-in para Excel 2010 e
2013)
http://www.real-statistics.com/
65
Contato:
Andrea Vanzillotta
andrea.vanzi@terra.com.br
andrea@hrservicosatuariais.com.br
21-99991-9959 (celular)
21-2531-1422 (escritório)
HR Serviços Atuariais Ltda.
66