Você está na página 1de 66

IBA CURSOS

Estudos de Aderência para Tábuas Biométricas

Ministrado por
Andrea Vanzillotta
06/09/2016
Conteúdo Programático
• Introdução
• O que são testes de aderência de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
2
Introdução
• Por que realizar estudos de aderência em avaliações atuariais?
– O cálculo atuarial é baseado em hipóteses que precisam periodicamente ser
verificadas quanto a sua adequação (ajuste entre eventos esperados e eventos
ocorridos)

– A legislação pertinente, desde 2002(*), menciona a necessidade de adequação


das premissas atuariais às características da massa e do plano.

(*)
Item 1 do anexo da Resolução CGPC 11/2002: As hipóteses biométricas, demográficas,
econômicas e financeiras devem estar adequadas às características da massa de
participantes e ao regulamento do plano de benefícios.
3
O que diz a legislação
(Resoluções do CGPC)
• Analisando o texto consolidado da Resolução CGPC 18/2006(*), temos:

– A comprovação de adequação das hipóteses biométricas, demográficas, econômicas e


financeiras é exigida para os planos BD ou que venham a adquirir essa característica na
fase de concessão (item 1.1.)

– A adequação da tábua biométrica utilizada para projeção de longevidade deverá ser


atestada por meio de estudo específico cujos resultados comprovem a aderência, nos
três últimos exercícios (item 2.4)

– Os estudos técnicos deverão observar a aderência das tábuas de mortalidade e invalidez


considerando, no mínimo, o período histórico dos últimos três exercícios (item 4.5).
(*) considerando as alterações trazidas pela Res 09/2012 e Res 15/2014
4
O que diz a legislação
Instrução PREVIC 23/2015(*)
• Todas as hipóteses atuariais adotadas na avaliação atuarial devem estar embasadas em
estudo técnico de adequação (art. 4º).

• Para todas as hipóteses (exceto taxa de juros) o estudo técnico deverá conter descrição e
justificativa da metodologia utilizada, que deverá comprovar, por meio de testes
estatísticos ou atuariais, a aderência das hipóteses atuariais e ser adequada às
características do plano de benefícios e de sua massa de participantes e assistidos (art. 7º).

• Caso seja constatada pelo atuário responsável pelo plano de benefícios a inviabilidade de
demonstração de aderência de hipótese, deverão constar do estudo técnico as justificativas
que tenham levado a essa conclusão, bem como o critério adotado para escolha da
referida hipótese. (art. 8º)

(*) com vigência obrigatória a partir de 01/01/2016 5


Guia Previc - Melhores Práticas
Atuariais
32. O gerenciamento do risco atuarial inclui a verificação dos seguintes itens: (...)
- aderência das premissas e hipóteses atuariais; (...)

56. Além das informações constantes das Demonstrações Atuariais - DA, a avaliação atuarial deve abranger outras informações
julgadas relevantes para a gestão dos planos de benefícios, tais como plano de custeio, projeções atuariais, estudos de cenários,
estudos de aderência de hipóteses atuariais, entre outras.

67. Cabe ao atuário a proposição das hipóteses atuariais a serem utilizadas na avaliação atuarial, identificando o conjunto de
hipóteses aplicáveis ao plano de benefícios por meio de estudos de aderência, com foco prospectivo. Dessa forma, o atuário deve
indicar as hipóteses que melhor expressem as tendências futuras do plano, de acordo com os cenários existentes na data da
avaliação atuarial, bem como apresentar os impactos da sua aplicação em comparação com outras hipóteses.

81. Caso seja adotada uma hipótese na avaliação atuarial em decorrência de conservadorismo, de imaterialidade ou de
simplificação, este critério deve ser explicitado pelo atuário em seu parecer, indicando qualquer necessidade de ajuste das
hipóteses utilizadas, tendo como base estudos de aderência ou fatos que tenham ocorrido desde a última avaliação atuarial.

Obs: Publicado em dez/2012 6


Mas como verificar a aderência e
adequação de uma hipótese atuarial?

• Imagine a situação onde você precisa atestar a “honestidade”


de um dado.

• Você não assistiu aos arremessos, deve se basear apenas na


série de observações que lhe foi entregue. Mas você sabe
exatamente qual seria a frequência esperada.

• Em qual (ou quais) dos exemplos seguintes você não hesitaria


em afirmar que o dado é honesto, não viesado?
7
A) FACE 1 2 3 4 5 6
OBS 0 2 2 1 1 0
ESP 1 1 1 1 1 1

VAR% -100% 100% 100% 0% 0% -100%

B) FACE 1 2 3 4 5 6
OBS 3 6 3 7 3 8
ESP 5 5 5 5 5 5

VAR% -40% 20% -40% 40% -40% 60%

C) FACE 1 2 3 4 5 6
OBS 27 18 18 22 25 10
ESP 20 20 20 20 20 20

VAR% 35% -10% -10% 10% 25% -50%


8
2,5 9
EXEMPLO A EXEMPLO B
8
2 7

6
1,5
5
OBS OBS
4
1 ESP ESP
3

2
0,5
1

0 0
1 2 3 4 5 6 1 2 3 4 5 6

9
D) FACE 1 2 3 4 5 6
OBS 45 51 50 48 46 60
ESP 50 50 50 50 50 50

VAR% -10% 2% 0% -4% -8% 20%

E) FACE 1 2 3 4 5 6
OBS 94 104 97 91 112 102
ESP 100 100 100 100 100 100

VAR% -6% 4% -3% -9% 12% 2%

F) FACE 1 2 3 4 5 6
OBS 959 956 1042 1049 989 1005
ESP 1000 1000 1000 1000 1000 1000

VAR% -4% -4% 4% 5% -1% 0%

10
11
Conclusão:
• A análise “visual” e gráfica pode muita das vezes ser subjetiva,
por isso é necessário uma metodologia científica que
estabeleça um conjunto de normas e critérios para a
determinação da aderência (ou não) entre duas amostras.

• Essa metodologia científica são os testes de hipótese ou


testes de aderência de hipóteses.

12
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
13
Testes de Hipóteses
• Uma hipótese estatística é uma afirmação acerca dos
parâmetros (média, desvio padrão) de uma população ou
acerca da distribuição da população.
– Exemplo 1: ao jogar uma moeda, a probabilidade de sair cara é de 50%
– Exemplo 2: a longevidade dos participantes do Plano A tem
comportamento semelhante ao previsto pela tábua AT-2000

• Um teste de hipóteses é um procedimento que conduz a uma


decisão acerca da hipótese (com base numa amostra).

14
Teste de hipóteses
• É um método de inferência estatística usando dados de um estudo científico.

• Em inferência estatística, estamos preocupados em extrair conclusões sobre


um grande grupo de objetos ou fatos que estão ainda por ocorrer, com base
na observação de objetos e fatos que tenham ocorrido no passado.

• Como podemos determinar se diferenças observadas entre duas amostras são


devidas meramente ao acaso ou a outros fatores? Ou como determinar que
uma amostra provém de uma população específica?

• Os procedimentos de inferência estatística introduzem ordem em qualquer


tentativa de extrair conclusões da evidência proporcionada por amostras.

15
Procedimento para realizar
um teste de hipóteses
• Em primeiro lugar, precisamos definir qual a hipótese que
queremos testar.

• Exemplo: se queremos verificar se a tábua AT-2000 é ou não


aderente à massa de participantes do Plano A, formulamos a
hipótese de que ela é aderente.

16
Definição de H0 e H1
• Pelos exemplos anteriores, temos duas hipóteses:

H0: a probabilidade de sair cara é 50%


H1: a probabilidade de sair cara é diferente de 50%

H0: a tábua AT-2000 é aderente


H1: a tábua AT-2000 não é aderente

A hipótese H0 é sempre de igualdade e é chamada de hipótese nula ou


simplesmente hipótese.

Já H1 é denominada de hipótese alternativa.

17
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
18
Erros do Tipo I e Tipo II
Aceitar H0 Rejeitar H0
Erro do tipo I
H0 verdadeira Decisão correta
( )
Erro do tipo II
H0 falsa Decisão correta
(b)

• Se rejeitamos uma hipótese quando ela, na realidade, é VERDADEIRA, dizemos que


foi cometido um erro do TIPO I ().
– Exemplo: rejeitei a tábua AT-2000 quando na verdade ela é aderente

• Se por outro lado, aceitamos uma hipótese quando ela deveria ser REJEITADA,
dizemos que foi cometido um erro do TIPO II (β).
– Exemplo: aceitei a tábua AT-2000 quando na verdade ela é não é
aderente 19
Nível de Significância () e grau de
confiança
• Para testar uma dada hipótese, a probabilidade com a qual
estamos nos arriscando a cometer um erro Tipo I (rejeitar
quando a hipótese é verdadeira) é denominada nível de
significância do teste.

• Quando dizemos que o teste foi efetuado com nível de


significância =5%, significa dizer que existem 5 chances em
100 de que iremos rejeitar uma hipótese verdadeira, ou seja,
tem-se 95% de confiança de que a hipótese verdadeira foi
aceita.
20
Poder do Teste
• O Poder do Teste tem como objetivo conhecer o quanto o teste de
hipóteses controla um erro do Tipo II (aceitar como verdadeira uma
hipótese falsa).

• Quanto maior o nível de significância (), maior o poder do teste.

• Quando aumentamos o nível de significância, reduzimos a região de


aceitação. Como resultado, é maior a chance de rejeitar a hipótese
nula. Isto significa que temos menos chance de aceitar a hipótese
nula quando ela é falsa.

21
Quanto maior o valor
de α, menor a região
de aceitação (mais
rigoroso é o teste)

22
Observação:
• Devemos selecionar o nível de  antes de analisar os dados.

• Nos testes de aderência das premissas atuariais, é aceitável


um nível de significância de  = 5%

23
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
24
Valor-p (ou p-valor)
• É a probabilidade de se obter uma estatística de teste igual ou mais
extrema que aquela observada em uma amostra, sob a hipótese nula.

• Uma outra interpretação para o valor-p é que este é menor nível de


significância com que não se rejeitaria a hipótese nula.

• Em termos gerais, um valor-p pequeno indica que os dados observados


seriam muito improváveis caso o H0 fosse verdadeiro. Logo, não se deve
aceitar H0 (no nosso exemplo, que a tábua AT-2000 é aderente).

• O parâmetro para medição do valor-p deve ser o nível de significância


escolhido (=5%).
25
Exemplo:
H0: a tábua AT-2000 é aderente
H1: a tábua AT-2000 não é aderente

• Nível de significância =5% (0,05)


• Valor-p : 0,0325

• Como 0,0325 é menor que 0,05, rejeita-se H0 (rejeito a hipótese de


que a tábua AT-2000 é aderente ao comportamento de
longevidade/mortalidade dos participantes de onde foram
coletados os dados da amostra utilizada)
O risco de rejeitar a hipótese nula H0 quando ela é verdadeira é de 3,25%.
26
• Então, quando o valor-p for MAIOR que o nível de
significância, significa que provamos que a hipótese nula é
verdadeira (a tábua AT-2000 é aderente)?

• NÃO. O máximo que podemos afirmar é que ela não parece


ser falsa. Formalmente, dizemos que “não existem evidências
suficientes para rejeitar H0”.

27
Atenção!!
• O valor-p não é a probabilidade da hipótese nula de um teste ser verdadeira.
– Um valor-p de 0,996 não significa dizer que a probabilidade de H0 ser verdadeira é de 99,6%
– Se estivermos testando duas tábuas e para a primeira o p-valor deu 0,895 e para a segunda, 0,913,
não significa dizer que a segunda tábua é “mais aderente” que a primeira. A leitura que se faz é que
ambas não foram rejeitadas.

• Valor-p e nível de significância não são sinônimos. O valor-p é sempre obtido de uma
amostra, enquanto o nível de significância é geralmente fixado (arbitrado) antes da coleta
dos dados.

• Quanto maior o p-valor, maior poderia ser o poder do teste, dado que ele indica o valor
máximo de  (nível de significância) com o qual H0 seria aceito.

28
Como calcular o valor-p?

• Ele é calculado a partir da distribuição de probabilidade que


está sendo assumida no teste de hipótese realizado.

• Pode ser calculado por um pacote estatístico ou no Excel, que


tem disponível algumas funções de probabilidade, mas não
todas (dependendo do teste, será necessário instalar um add-
in ou suplemento).

• Vamos ver isso mais adiante nos exemplos.


29
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
30
A lógica do teste de
hipóteses
• Definição da hipótese nula
• Escolha do teste que será aplicado
• Definição do nível de significância ()
• Cálculo da estatística do teste e do valor-p
• Conclusão (rejeitar ou não H0)

Como escolher o teste que será aplicado ao


caso em estudo?
31
Testes Estatísticos
• Os testes estatísticos podem ser divididos em dois grandes grupos, conforme fundamentem
ou não os seus cálculos na premissa de que a distribuição de frequências dos erros amostrais
é normal, as variâncias são homogêneas, os efeitos dos fatores de variação são aditivos e os
erros independentes.

• Se tudo isso ocorrer, é muito provável que a amostra seja aceitavelmente simétrica, terá com
certeza apenas um ponto máximo, centrado no intervalo de classe onde está a média da
distribuição, e o seu histograma de frequências terá um contorno que seguirá
aproximadamente o desenho em forma de sino da curva normal.

32
Testes Paramétricos e
Não Paramétricos
• Uma vez que seja possível inferir o cumprimento desses
requisitos, é possível utilizar a estatística paramétrica. Caso
contrário, a alternativa é a estatística não paramétrica.

• Os termos paramétrico e não-paramétrico referem-se à


média e ao desvio-padrão, que são os parâmetros que
definem as populações que apresentam distribuição normal.

33
Testes Paramétricos
• Os testes paramétricos assumem que a distribuição de probabilidade da
população da qual retiramos os dados seja conhecida e que somente os
valores de certos parâmetros, tais como a média e o desvio padrão, sejam
desconhecidos.

• São testes que envolvem problemas nos quais a distribuição da população


é conhecida e as hipóteses testadas envolvem apenas parâmetros
populacionais.

• Exemplos de testes paramétricos: teste para média de uma população,


teste para a proporção, teste para a variância, ANOVA,...
34
Testes Não Paramétricos
• Um teste não-paramétrico é aquele cujo modelo não especifica condições
sobre os parâmetros da população da qual a amostra foi obtida.

• Mesmo quando existem certas pressuposições, estas são mais brandas do


que aquelas associadas aos testes paramétricos.

• Exemplos de testes não paramétricos: Qui Quadrado, Kolmogorov


Smirnov, Teste Exato de Fisher, dentre outros.

35
Algumas restrições ao uso
dos testes não paramétricos
• Em geral não levam em consideração a magnitude dos dados. Em muitos
casos isso se traduz num desperdício de informações.

• Quando todas as exigências do modelo estatístico estão satisfeitas, o teste


paramétrico tem mais poder. Para se obter a mesma eficiência com um
teste não-paramétrico é necessário um amostra maior.

• A obtenção, utilização e interpretação das tabelas (distribuições de


probabilidade) são em geral, mais complexas.
36
Algumas vantagens dos
Testes não Paramétricos
• São mais eficientes do que os paramétricos quando os dados da
população não têm uma distribuição normal (ou seja, dispensam a
normalidade dos dados).

• Independem da forma da população da qual a amostra foi obtida.

• São, em geral, de mais simples e de mais fácil aplicação e exigem, quase


sempre, menor volume de cálculos.

• Existem testes não-paramétricos que nos permitem trabalhar com dados


de diferentes populações, o que não é possível com os paramétricos.

37
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
38
Teste Kolmogorov-Smirnov
• Para uma amostra
– é uma prova de aderência, isto é, avalia o grau de concordância entre a distribuição de um conjunto
de valores amostrais (valores observados) e determinada distribuição teórica específica.

• Para duas amostras independentes


– comprova se as duas amostras foram extraídas da mesma população (ou de populações com a
mesma distribuição).

– A prova bilateral é sensível a qualquer diferença nas distribuições das quais se extraíram as
amostras: diferenças na posição central, na dispersão, na assimetria, etc.

– A prova unilateral é utilizada para determinar se os valores da população da qual se extraiu uma das
amostras são, ou não, estocasticamente maiores ou menores do que os valores da população que
originou a outra amostra, por exemplo, se a distribuição da probabilidade de mortalidade é menor
ou igual à distribuição teórica esperada.
39
Teste de Kolmogorov Smirnov (K-S) para
duas amostras independentes (bilateral)

• A prova K-S de duas amostras comprova que elas foram extraídas da mesma população (ou
de populações com a mesma distribuição).

• A prova testa se os valores amostrais podem ser considerados oriundos de uma população
com uma suposta distribuição teórica, utilizando para isso a distribuição de frequências
acumuladas.

• Se as duas amostras foram extraídas da mesma população, então é de se esperar que as


distribuições acumuladas das duas amostras sejam bem próximas uma das outras, acusando
apenas desvios casuais em relação à distribuição da população. Se as distribuições
acumuladas são “diferentes” ou “distantes” uma da outra em qualquer ponto, isto sugere
que as amostras são oriundas de populações também distintas.

40
Exemplo (duas amostras, bilateral)
(A) (B) (C) (D) (E) (F)
ESPERADO CUMUL % CUMUL % DIFERENÇA
IDADE OBS
AT-2000 AT-2000 OBS (MÓDULO)
até 30 anos 1 1 0,0256 0,0385 0,0128
31 a 40 anos 1 2 0,0513 0,1154 0,0641
41 a 50 anos 2 4 0,1026 0,2692 0,1667
51 a 60 anos 8 6 0,3077 0,5000 0,1923
61 a 70 anos 12 4 0,6154 0,6538 0,0385
71 a 80 anos 8 5 0,8205 0,8462 0,0256
> 80 anos 7 4 1,0000 1,0000 -
TOTAL 39 26
D-calc 0,1923
 = 0,05 D-crit 0,3443
H0: a tábua AT-2000 se ajusta à distribuição dos eventos observados
H1: a tábua AT-2000 não se ajusta à distribuição dos eventos observados

Como D-calc é MENOR que o D-crit, não há evidências suficientes para rejeitar H0
41
Metodologia

42
Resultado para outras tábuas
(A) (B) (C) (D) (E) (F)
ESPERADO CUMUL % CUMUL % DIFERENÇA
IDADE OBS
AT-83 AT-83 OBS (MÓDULO)
até 30 anos 1 1 0,0204 0,0385 0,0181
31 a 40 anos 2 2 0,0612 0,1154 0,0542
41 a 50 anos 3 4 0,1224 0,2692 0,1468
51 a 60 anos 10 6 0,3265 0,5000 0,1735
61 a 70 anos 15 4 0,6327 0,6538 0,0212
71 a 80 anos 10 5 0,8367 0,8462 0,0094
> 80 anos 8 4 1,0000 1,0000 -
TOTAL 49 26
D-calc 0,1735
 = 0,05 D-crit 0,3300

H0: a tábua AT-83 se ajusta à distribuição dos eventos observados


H1: a tábua AT-83 não se ajusta à distribuição dos eventos observados

Como D-calc é MENOR que o D-crit, não há evidências suficientes para rejeitar H0
43
Resultados para outras
tábuas
GAM-94 D-calc 0,2500
 = 0,05 D-crit 0,3364
Não há evidências
AT-2000 suav 10% D-calc 0,1857
 = 0,05 D-crit 0,3521 suficientes para
RP-2000 D-calc 0,2907 rejeitar H0 em
 = 0,05 D-crit 0,3379
nenhuma dessas
BR SOBREV 2010 D-calc 0,1471 tábuas
 = 0,05 D-crit 0,3543

44
Cálculo do p-valor no teste K-S

• Não é possível encontrar o p-valor apenas com o uso das


Tabelas.

• Como o Excel não dispõe de função específica de distribuição


de probabilidade K-S, a alternativa é efetuar os cálculos
através de um software estatístico (R, SPSS, Matlab,...) ou
instalando um suplemento (add-in) no Excel.

45
Resultados encontrados no Excel utilizando
o add-in disponível no site “Real Statistics
Using Excel”
D crit D crit p-valor
TÁBUA D calc
(tabela) (add-in) (add-in)
AT-2000 0,1923 0,3443 0,3314 0,5638
AT-83 0,1735 0,3300 0,3182 0,6433
GAM-94 0,2500 0,3364 0,3241 0,2226
AT-2000 suav 10% 0,1857 0,3521 0,3386 0,6358
RP-2000 0,2907 0,3379 0,3255 0,1054
BR SOBREV 2010 0,1471 0,3543 0,3406 0,8818

É fácil observar que, quanto maior o D-calc, menor será o p-valor.

O D-crit calculado no Excel é sempre um pouco menor que o valor tabelado.


46
Comentários sobre o teste K-S

• No teste K-S é recomendado começar com tantos intervalos


quanto forem possíveis, e assim não perder informações
inerentes aos dados.

• Quando comparado ao teste t (teste paramétrico) tem poder-


eficiência alto (em torno de 95%) para pequenas amostras
(<25). Quando o tamanho da amostra cresce, o poder-eficiência
decresce levemente.

• É na maioria dos casos mais poderoso que o 2.


47
Atenção ao interpretar o resultado do
teste K-S
O teste K-S verifica se o evento estudado se ajusta a uma determinada
distribuição (no caso, a tábua biométrica em análise). Mas o fato de duas
amostras terem distribuição semelhante, não significa necessariamente que os
valores observados são próximos aos valores esperados, como se verifica no
exemplo abaixo:
(A) (B) (C) (D) (E) (F)
CUMUL %
CUMUL % DIFERENÇA
IDADE TÁBUA XYZ OBS BR SOBREV
OBS (MÓDULO)
2010
até 30 anos 10 5 0,0625 0,0617 0,0008
31 a 40 anos 20 9 0,1875 0,1728 0,0147
41 a 50 anos 30 16 0,3750 0,3704 0,0046
51 a 60 anos 40 20 0,6250 0,6173 0,0077
61 a 70 anos 30 16 0,8125 0,8148 0,0023
71 a 80 anos 20 10 0,9375 0,9383 0,0008
> 80 anos 10 5 1,0000 1,0000 -
TOTAL 160 81
D-calc 0,0147
Não existem evidências
 = 0,05 D-crit 0,1819 suficientes para rejeitar H0 48
p valor 1,0000
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
49
Teste de Qui-Quadrado
• Para uma amostra
– É uma prova de aderência, ou seja, é usado quando se quer comprovar
se existe diferença significativa entre a frequência observada e o
respectivo número esperado.

• Para duas amostras independentes


– Visa verificar se as distribuições de duas ou mais amostras não
relacionadas diferem significativamente em relação à determinada
variável. Utiliza-se esta prova quando os dados se apresentam sob
forma de frequências em categorias discretas. Pode aplicar o teste
para determinar a significância de diferenças entre dois grupos
independentes.
50
Exemplo (duas amostras)

51
Cálculo do Qui-Quadrado
DISTRIBUIÇÃO OBSERVADA DISTRIBUIÇÃO TEÓRICA
IDADE AT-83 OBS TOTAL AT-83 OBS TOTAL
até 30 anos 1 1 2 1,307 0,693 2
31 a 40 anos 2 2 4 2,613 1,387 4
41 a 50 anos 3 4 7 4,573 2,427 7
51 a 60 anos 10 6 16 10,453 5,547 16
61 a 70 anos 15 4 19 12,413 6,587 19
71 a 80 anos 10 5 15 9,800 5,200 15
> 80 anos 8 4 12 7,840 4,160 12
TOTAL 49 26 75 49 26 75

Graus de liberdade: (nº linhas – 1) x (nº colunas – 1)


Graus de liberdade: (7-1) x (2-1) = 6
52
DISTRIBUIÇÃO OBSERVADA

IDADE AT-83 OBS TOTAL

até 30 anos 1 1 2
31 a 40 anos 2 2 4
41 a 50 anos 3 4 7 H0: a tábua AT-83 é aderente
51 a 60 anos 10 6 16 H1: a tábua AT-83 não é aderente
61 a 70 anos 15 4 19
71 a 80 anos 10 5 15
> 80 anos 8 4 12
TOTAL 49 26 75
Como 2-calc é MENOR que o 2-crit, não há
QUI-QUADRADO CALCULADO 3,8169
evidências suficientes para rejeitar H0
GRAUS DE LIBERDADE 6
GRAU DE SIGNIFICâNCIA () 0,05
VALOR CRÍTICO DO QUI-QUADRADO 12,5900 (valor tabelado - Tabela C no Apêndice)
12,5916 (fórmula Excel)
p-valor 0,7014 (fórmula Excel)

O risco de rejeitar a hipótese nula H0 quando ela é verdadeira é de 70,14%.


53
Fórmulas no Excel para o 2
• Para determinar o valor tabelado:
=INV.QUIQUA.CD(probabilidade; graus de liberdade)
=INV.QUIQUA.CD(0,05;6) = 12,5916

• Para calcular o p-valor:


=DIST.QUIQUA.CD(valor calculado; graus de liberdade)
=DIST.QUIQUA.CD(3,8168;6) = 0,7014

54
Quando usar o teste 2

55
Quando usar o teste 2
• Para tabelas de contingência com gl > 1
– Pode ser usado se menos do que 20% das células têm frequência
esperada menor do que 5 e se nenhuma célula tem frequência
esperada menor do que 1. (o exemplo anterior não atende a essas
condições!!!)

– Se essas condições não são verificadas nos dados, deve-se combinar


categorias adjacentes para aumentar as frequências esperadas nas
várias células. Isso pode ser feito apropriadamente se tais
combinações não tiram o significado dos dados.
56
H0: a tábua AT-83 é aderente
H1: a tábua AT-83 não é aderente

DISTRIBUIÇÃO OBSERVADA DISTRIBUIÇÃO TEÓRICA


ESPERADO
IDADE AT-83 OBS TOTAL OBS TOTAL
AT-83
até 50 anos 6 7 13 8,493 4,507 13
51 a 60 anos 10 6 16 10,453 5,547 16
61 a 70 anos 15 4 19 12,413 6,587 19
> 70 anos 18 9 27 17,640 9,360 27
TOTAL 49 26 75 49 26 75

QUI-QUADRADO CALCULADO 3,7441 Como 2-calc é MENOR


GRAUS DE LIBERDADE 4 que o 2-crit, não há
GRAU DE SIGNIFICâNCIA () 0,05 evidências suficientes
VALOR CRÍTICO DO QUI-QUADRADO 9,4900 (valor tabelado - Tabela C no Apêndice) para rejeitar H0
9,4877 (fórmula Excel)
p-valor 0,4417 (fórmula Excel)

O risco de rejeitar a hipótese nula H0 quando ela é verdadeira é de 44,17%.


57
Comentários sobre o teste 2
• O teste 2 nunca deve ser utilizado em proporções ou
em porcentagens.

• Seu poder aumenta à medida que aumenta o tamanho


da amostra.

• Para amostras pequenas, o teste de Kolmogorov-


Srmirnov é mais adequado.
58
Atenção ao interpretar o resultado do teste
Qui Quadrado para duas amostras

DISTRIBUIÇÃO OBSERVADA DISTRIBUIÇÃO TEÓRICA


IDADE TÁBUA XYZ OBS TOTAL AT-83 OBS TOTAL
até 30 anos 10 5 15 9,959 5,041 15
O teste Qui Quadrado
31 a 40 anos 20 9 29 19,253 9,747 29 apontaria um ajuste
41 a 50 anos 30 16 46 30,539 15,461 46 “quase perfeito” nesse
51 a 60 anos 40 20 60 39,834 20,166 60 exemplo, o que
61 a 70 anos 30 16 46 30,539 15,461 46 claramente não atende ao
71 a 80 anos 20 10 30 19,917 10,083 30
objetivo inicial do teste de
> 80 anos 10 5 15 9,959 5,041 15
TOTAL 160 81 241 160 81 241
uma tábua biométrica,
que é verificar se os
QUI-QUADRADO CALCULADO 0,1470 eventos esperados estão
GRAUS DE LIBERDADE 6 próximo ao esperado.
GRAU DE SIGNIFICâNCIA () 0,05
VALOR CRÍTICO DO QUI-QUADRADO 12,5900 (valor tabelado - Tabela C no Apêndice)
12,5916 (fórmula Excel) Não existem evidências
p-valor 0,9999 (fórmula Excel) suficientes para rejeitar H0
59
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
60
Outros testes utilizados
• De acordo com os resultados da pesquisa feita pela Comissão de Fechadas
do IBA em 2012:

– Análise comparativa dos eventos observados versus eventos


esperados.

– Comparação entre a reserva esperada e a reserva obtida.

O testes mais utilizados, de acordo com a pesquisa,


são os teste de Kolmogorov Smirnov e Qui Quadrado
61
Conteúdo Programático
• Introdução
• O que são testes de hipótese
• Nível de significância
• Valor p (ou p-valor)
• Testes Paramétricos x Testes Não Paramétricos
• Teste Kolmogorov-Smirnov
• Teste de Qui-Quadrado
• Outros testes utilizados
• Comentários Finais
62
“Assim como é importante reconhecer importância do
significado, é igualmente importante não extrair
significado de onde ele não existe”.

“O andar do bêbado”, de Leonard Mlodinow

O resultado de um teste de hipóteses não deve ser visto como “verdade absoluta”.
Teste não é oráculo !!!

É preciso analisar os resultados encontrados dentro do contexto do plano de


benefícios e para isso é fundamental a experiência e o conhecimento do atuário.

Nenhum teste, por mais sofisticado que seja, vai substituir essa análise.

63
Comentários Finais
• É consenso que as premissas atuariais precisam ter sua adequação e
aderência verificada periodicamente.

• E embora pela legislação atual os órgãos estatutários sejam os


responsáveis pela aprovação das premissas, é inegável que a decisão será
baseada nos resultados de algum estudo feito nesse sentido.

• O papel do atuário nesse processo é fundamental, pois ele é um


profissional capacitado para elaborar esse estudo e apresentar seus
comentários, observações e, dependendo do caso, suas recomendações.
64
Bibliografia e indicação de sites
• Estatística Não Paramétrica para Ciências do Comportamento
Sidney Siegel e N. John Castellan, Jr – 2ª Edição – Artmed Editora

• Portal Action
http://www.portalaction.com.br

• Real Statistics Using Excel (download gratuito de add-in para Excel 2010 e
2013)
http://www.real-statistics.com/

• XLSTAT Statistical Software for Excel


http://www.xlstat.com/en/

65
Contato:
Andrea Vanzillotta
andrea.vanzi@terra.com.br
andrea@hrservicosatuariais.com.br

21-99991-9959 (celular)
21-2531-1422 (escritório)
HR Serviços Atuariais Ltda.

66

Você também pode gostar