Escolar Documentos
Profissional Documentos
Cultura Documentos
Estimada
Observada Percentagem correta
0 1
0 31 7 81,6
1 6 16 72,7
Percentagem total 78,3
Da mesma maneira, a área sob a curva ROC que varia de zero a um, pode
ser empregada como um índice da exatidão do teste, sendo tanto melhor
quanto maior for esta área.
Como a variável dependente estimada pode assumir um valor entre
zero e um, neste estudo, foi utilizado um ponto de corte de 0,5 para o
modelo, de forma que as amostras com resultados inferiores a 0,5 são
classificadas como “presença de 9 ou menos indivíduos por m2, em média,
no solo ” e as amostras com resultados superiores a esse valor são
classificadas como “presença de mais de 9 indivíduos por m2, em média, no
solo”.
Para a construção da Curva ROC, foram calculadas a sensibilidade
(proporção de acerto na previsão da ocorrência de um evento nos casos em
que ele de fato ocorreu) e a especificidade (proporção de acerto na previsão
da não ocorrência de um evento nos casos em que ele de fato não ocorreu)
para todas as observações da amostra, considerando diferentes pontos de
corte do modelo. Graficamente, a Curva ROC do modelo desenvolvido,
apresenta o seguinte formato:
Gráfico 1 – Curva ROC
No modelo desenvolvido, a área sob a curva foi de 0,853, o que, segundo Hosmer e
Lemeshow (2000), é uma excelente capacidade de discriminação (Tabela 6).
Além de obter um modelo, testar a significância de seus parâmetros e verificar a acurácia
e eficiência desse modelo encontrado, outra análise interessante de ser feita é a da razão das
∧
probabilidades, calculada por exp ( βˆ ) . A Tabela 7 mostra os valores dessas razões para o
modelo final.
Tabela 7 – Razão de Chance do modelo final
∧ ∧
Variáveis β̂ exp ( βˆ ) IC 95% exp ( βˆ )
Constante 2,336 10,337
dsist1 3,590 36,245 [4,803; 273,511]
Kser 0,431 1,538 [1,131; 2,091]
Cotser 4,665 106,197 [0,863; 13074,718]
Moser -2,698 0,067 [0,005; 0,995]
Dentre os fatores que influenciam a presença de mais ou menos indivíduos por m2 no solo
nas áreas estudadas, a variável dummy “diferença entre o Sistema Convencional e Mata” atuou
de forma positiva, assim como as variáveis “Potássio em serrapilheira” e “Carbono orgânico
total em serrapilheira”, isto é, quando há aumento em unidades dessas variáveis, as chances de
aumentar o número de indivíduos também aumenta.
Em relação ao Sistema Convencional, categoria de referência utilizada na codificação das
variáveis dummy, o Sistema “Mata” aumenta mais de 36 vezes a chance de se encontrar mais de
9 indivíduos por m2 no solo das áreas estudadas, podendo esse valor variar entre [4,803;
273,511], com 95% de confiança.
O aumento de uma unidade (em gkg-1) de Potássio em serrapilheira, aumenta em
aproximadamente 54% as chances de ocorrência de mais de 9 indivíduos por m2 no solo. Pode-se
dizer então, que se tem 95% de confiança de que a variação da razão de chance devido ao
acréscimo de uma unidade na variável X 2 está compreendido no intervalo 13% e 109%.
A quantidade de carbono orgânico total em serrapilheira é uma variável de grande
importância no modelo, pois o aumento de uma unidade dessa variável, aumenta em mais de 106
vezes a chance de se encontrar mais de 9 indivíduos por m2 no solo, tem-se 95% de confiança de
que esse valor possa variar dentro do intervalo [0,863; 13074,718].
Pelo valor negativo do coeficiente β4 da matéria orgânica da serrapilheira, pode-se
afirmar que a quantidade de indivíduos presentes por m2 no solo é maior que 9 indivíduos em
média, em locais com baixa quantidade de matéria orgânica. Pode-se deduzir pela observação da
∧
exp ( βˆ ) na Tabela 7, que, com o aumento de uma unidade na variável, as chances de se
encontrar mais de 9 indivíduos no solo diminui em 93%, podendo esse valor variar entre 1% e
99%, com 95% de confiança.