Você está na página 1de 221

i

SUMRIO
LISTA DE TABELAS .................................................................................................... IV
LISTA DE ILUSTRAES ............................................................................................V
RESUMO...................................................................................................................... VIII
ABSTRACT..................................................................................................................... IX
1. INTRODUO............................................................................................................. 1
1.1 TEMAS DE ESTUDO.............................................................................................. 1
1.2 O PROBLEMA......................................................................................................... 3
1.3 OBJETIVOS ............................................................................................................. 4
1.4 JUSTIFICATIVA ..................................................................................................... 5
1.5 ESTRUTURA DO TRABAHO................................................................................ 7
2. REVISO DE LITERATURA.................................................................................. 10
2.1 TEORIA CLSSICA DOS TESTES ..................................................................... 10
2.1.1 Introduo ........................................................................................................ 10
2.1.2 Concepo Bsica ............................................................................................ 10
2.1.3 Confiabilidade.................................................................................................. 11
2.1.4 Correlao Bisserial e Bisserial por Ponto....................................................... 12
2.2 TEORIA DA RESPOSTA AO ITEM..................................................................... 13
2.2.1 Introduo ........................................................................................................ 13
2.2.2 Pressupostos Bsicos ....................................................................................... 15
2.2.3 Modelo Logstico de Trs Parmetros Unidimensional
Dicotmico................................................................................................................ 17
2.2.3.1 Curva caracterstica do item CCI........................................................... 18
2.2.3.4 Estimao dos parmetros dos itens e das habilidades dos
indivduos........................................................................................................ 28
2.2.3.4.1 Introduo ........................................................................................... 28
2.2.3.4.2 Estimao dos parmetros dos itens ................................................... 30
2.2.3.4.3 Estimao das habilidades dos indivduos. ......................................... 45
2.2.3.4.3.1 Estimao por mxima verossimilhana....................................... 45
2.2.3.4.3.2 Estimao modal bayesiana ou maximum a posteriori
(MAP). ............................................................................................................ 47
2.2.3.4.3.3 Estimao bayesiana da mdia a posteriori ou
expected a posteriori (EAP). ........................................................................... 49
2.2.4 Clculo do Escore Verdadeiro. ........................................................................ 50
2.3 ANLISE FATORIAL........................................................................................... 51
2.3.1 Introduo ........................................................................................................ 51
2.3.2 Conceitos Fundamentais e Pressupostos Bsicos ............................................ 52
2.3.3 O Modelo de Anlise Fatorial Ortogonal......................................................... 58
2.3.4 Seleo do Nmero de Fatores. ....................................................................... 62
2.3.5 Mtodos de Estimao do Modelo Fatorial ..................................................... 64
ii
2.3.5.1- Mtodo das componentes principais........................................................ 64
2.3.5.2 Mtodo da mxima verossimilhana. ....................................................... 66
2.3.6 Rotao de Fatores........................................................................................... 69
2.3.6.1 Mtodo de rotao Varimax...................................................................... 70
2.3.7 Escores Fatoriais .............................................................................................. 74
2.3.7.1 Mtodo dos mnimos quadrados ponderados............................................ 75
2.3.7.2 Mtodo da regresso ................................................................................. 77
2.3.8 Consideraes Adicionais................................................................................ 80
2.4 RECONHECIMENTO DE PADRES E CLASSIFICAO.............................. 85
2.4.1 Introduo ........................................................................................................ 85
2.4.2 Conceitos Gerais de Reconhecimento e Classificao .................................... 86
2.4.2.1 Custo esperado de erro de classificao (ECM) ....................................... 89
2.4.2.2. Probabilidade total de erro de classificao............................................. 92
2.4.3 Reconhecimento e Classificao para Duas Populaes ................................. 93
2.4.3.1 Funo de classificao de Anderson populaes
gaussianas e matrizes de correlao iguais. .................................................... 93
2.4.3.2. Classificao quadrtica populaes no necessariamente
gaussianas e matrizes de correlao diferentes. .............................................. 95
2.4.3.3. Mtodo discriminante linear de Fischer populaes no
necessariamente gaussianas e matrizes de covarincias iguais....................... 96
2.4.3.4. Regresso logstica: modelo para variveis dicotmicas....................... 100
2.4.3.4.1. Introduo ........................................................................................ 100
2.4.3.4.2. Modelo logstico linear simples ....................................................... 100
2.4.3.4.3. Modelo logstico linear mltiplo...................................................... 101
2.4.4. Reconhecimento e Classificao para Vrias Populaes. ........................... 102
2.4.4.1. Introduo .............................................................................................. 102
2.4.4.2 Mtodo de mxima verossimilhana para vrias populaes
populaes gaussianas e matrizes de covarincias diferentes....................... 103
2.4.4.3 Mtodo linear de Fisher para vrias populaes populaes
no necessariamente gaussianas e matrizes de covarincias iguais.............. 106
2.4.4.4 Mtodo distncia mnima populaes no necessariamente
gaussianas e matrizes de covarincias iguais................................................ 111
2.4.4.5 Mtodo distncia Mahalanobis populaes no
necessariamente gaussianas e matrizes de covarincias iguais..................... 112
2.4.5. Avaliao de Desempenho de Classificao................................................. 113
3 MATERIAIS E MTODOS ..................................................................................... 116
3.1 INTRODUO.................................................................................................... 116
3.2 MTODOS ESTATSTICOS DE ANLISE...................................................... 116
3.2.1. Teoria Clssica dos Testes ............................................................................ 116
3.2.2. Teoria da Resposta ao Item........................................................................... 117
3.2.2 Anlise Fatorial .............................................................................................. 117
3.2.3 Reconhecimento de Padres e Classificao ................................................. 119
3.3 COLETA DE DADOS.......................................................................................... 120
3.3.1 Avaliao de Candidatos ao Vestibular e Evaso de Alunos do
curso de Estatstica da UFPR. ................................................................................. 120
3.3.1.1 Coleta de dados....................................................................................... 120
iii
3.3.1.2 Procedimentos de avaliao.................................................................... 121
3.3.2 Avaliao de Fornecedores ............................................................................ 121
3.3.2.1 Procedimentos de avaliao. ................................................................... 121
3.4 ELABORAO DO PROGRAMA..................................................................... 121
4- RESULTADOS E DISCUSSO.............................................................................. 125
4.1- AVALIAO DO INSTRUMENTRO DO TESTE DA MATRIA M DO
VESTIBULAR DA UNIVERSIDADE U E RANQUEAMENTO DOS ESCORES
VERDADEIROS DOS CANDIDATOS UTILIZANDO A TEORIA DA
RESPOSTA AO ITEM............................................................................................... 125
4.1.1- Anlise do Teste da Matria M..................................................................... 125
4.1.2- Anlise dos Itens do Teste da Matria M..................................................... 127
4.1.3- Ranqueamento dos Candidatos utilizando Escores Verdadeiros.................. 137
4.2- EVASO DE ALUNOS DO CURSO DE ESTATSTICA DA UFPR................ 139
4.3- ANLISE DE FORNECEDORES...................................................................... 143
5. CONCLUSO E RECOMENDAES................................................................. 148
REFERNCIAS............................................................................................................ 150
APNDICES ................................................................................................................. 154

iv
LISTA DE TABELAS
TABELA 1- EXEMPLO DE ITENS POR INDIVDUOS.......................................... 32
TABELA 2- EXEMPLO DE ITENS POR PADRES DE RESPOSTA................... 32
TABELA 3- ASSOCIAO DAS VARIVEIS OBSERVVEIS X
1
E X
2
.............. 81
TABELA 4- AMOSTRAS DE FAMLIAS PROPRIETRIAS E NO
PROPRIETRIAS DE CERTO EQUIPAMENTO COM BASE NA RENDA E
TAMANHO DO LOTE DE SUAS MORADIAS......................................................... 87
TABELA 5- MATRIZ DO CUSTO DE CLASSIFICAO...................................... 90
TABELA 6- TABELA DE CLASSIFICAO USANDO O MTODO DE FISHER
......................................................................................................................................... 113
TABELA 7- TABELA DE CLASSIFICAO USANDO O MTODO DE FISHER
E PROCEDIMENTO DE RETENO DE LACHENBRUCH.............................. 115
TABELA 8- ESTATSTICAS DESCRITIVAS NMERO DE ACERTO DOS
CANDIDATOS.............................................................................................................. 126
TABELA 9- ANLISE DOS ITENS DO TESTE DA MATRIA M DO
VESTIBULAR DA UNIVERSIDADE U.................................................................... 128
TABELA 10- RANQUEAMENTO DOS ESCORES VERDADEIROS.................. 138
TABELA 11- ESTATSTICAS DESCRITIVAS DOS ESCORES VERDADEIROS
DOS CANDIDATOS .................................................................................................... 139
TABELA 12- TABELA DE CLASSIFICAO FEITA PELO MTODO LINEAR
DE FISHER................................................................................................................... 140
TABELA 13- CLASSIFICAO DO GRUPO DE TESTE..................................... 142
TABELA 14- COMPARAO ENTRE OS MTODOS DE FISHER,
DISCRIMINANTE QUADRTICO E REDES NEURAIS. .................................... 143
TABELA 15- ANLISE FATORIAL MTODO DAS COMPONENTES
PRINCIPAIS ................................................................................................................. 145
TABELA 16- CLASSIFICAO DAS EMPRESAS FORNECEDORAS ............. 146
TABELA 17- TABELA DE CLASSIFICAO USANDO O PROCEDIMENTO DE
RETENO DE LACHENBRUCH........................................................................... 147
v

LISTA DE ILUSTRAES

FIGURA 1- GRFICO DA CURVA CARACTERSTICA DO ITEM 1 ............ 20
FIGURA 2- GRFICO DA CURVA CARACTERSTICA DO ITEM 2 ............ 20
FIGURA 3- GRFICO DAS CURVAS CARACTERSTICAS DOS ITENS 1 E 2
................................................................................................................................... 21
FIGURA 4- GRFICO DAS CURVAS CARACTERSTICAS DOS ITENS 3 E 4
................................................................................................................................... 21
FIGURA 5- GRFICO DAS CURVAS CARACTERSTICAS DOS ITENS 1 E 5
................................................................................................................................... 22
FIGURA 6- GRFICO DA CURVA CARACTERSTICA E DA FUNO DE
INFORMAO DO ITEM 6 ................................................................................. 23
FIGURA 7- GRFICO DA CURVA CARACTERSTICA E DA FUNO DE
INFORMAO DO ITEM 7 ................................................................................. 23
FIGURA 8- GRFICO DA CURVA CARACTERSTICA E DA FUNO DE
INFORMAO DO ITEM 8 ................................................................................. 24
FIGURA 9- GRFICO DAS CURVAS CARACTERSTICAS DOS ITENS DO
INSTRUMENTO A................................................................................................. 26
FIGURA 10- GRFICO DAS CURVAS CARACTERSTICAS DOS ITENS DO
INSTRUMENTO B ................................................................................................. 26
FIGURA 11- INTERPRETAO GEOMTRICA DAS COMPONENTES
PRINCIPAIS............................................................................................................ 54
vi
FIGURA 12- GRFICO DAS AMOSTRAS DE FAMLIAS PROPRIETRIAS
E NO-PROPRIETRIAS COM BASE NA RENDA E TAMANHO DOS
LOTES DE SUAS MORADIAS............................................................................. 87
FIGURA 13- REGIES DE CLASSIFICAO PARA DUAS POPULAES 88
FIGURA 14- CLASSIFICAO DAS REGIES PARA DUAS POPULAES
................................................................................................................................... 89
FIGURA 15- ROTAO DOS FATORES........................................................... 118
FIGURA 16- FLUXOGRAMA DO PROGRAMA SIAVAL 1.0......................... 123
FIGURA 17- RELATRIO DE SADA DA ANLISE FATORIAL................. 124
FIGURA 18- RELATRIO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM NA TEORIA DA RESPOSTA AO ITEM........... 124
FIGURA 19- HISTOGRAMA DO NMERO DE ACERTOS DOS
CANDIDATOS ...................................................................................................... 126
FIGURA 20- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 13 ............................................................................. 131
FIGURA 21- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 36 ............................................................................. 131
FIGURA 22- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 37 ............................................................................. 132
FIGURA 23- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 43 ............................................................................. 132
FIGURA 24- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 48 ............................................................................. 133
vii
FIGURA 25- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 54 ............................................................................. 134
FIGURA 26- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 55 ............................................................................. 134
FIGURA 27- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 60 ............................................................................. 135
FIGURA 28- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 57 ............................................................................. 136
FIGURA 29- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 35 ............................................................................. 136
FIGURA 30- DESCRIO DOS ESCORES VERDADEIROS......................... 138





viii

RESUMO

Na ltima dcada, a utilizao de mtodos estatsticos multivariados passou a ter papel
importante na anlise de desempenho. Ao estudar esses mtodos, verificou-se que a
Teoria Clssica dos Testes (TCT) e a Teoria da Resposta aos Itens (TRI) tm um papel
importante nesse tipo de anlise. Quando integradas, as tcnicas de Anlise Fatorial e de
Reconhecimento de Padres e Classificao fornece ao pesquisador uma gama maior de
opes de estudo e aplicaes. Apresentam-se nesse trabalho trs aplicaes das tcnicas
estatsticas supracitadas: a primeira analisou um teste de vestibular atravs da TCT e TRI,
sugerindo o emprego de escores verdadeiros para o ranqueamento dos candidatos, a
segunda criou um procedimento para detectar alunos com possibilidades de evaso aps o
primeiro ano de curso de graduao aplicando o Mtodo Discriminante Linear de Fisher e
a terceira props uma aplicao na rea da Engenharia de Produo, que atualmente tem
sido assunto de grande interesse para as empresas. Ou seja, propiciando o ranqueamento
de fornecedores e a possibilidade de premiao, estimulando a competitividade e a
melhoria da qualidade. Para esta ltima aplicao utilizou-se escores fatoriais. Sugeriu-se
que as empresas classifiquem seus novos fornecedores em grupos pr-definidos com a
utilizao do Mtodo Discriminante Linear de Fisher. Um dos produtos resultantes deste
trabalho o programa chamado de SIAVAL 1.0, que possui uma interface amigvel com
o usurio e incorpora os mtodos: Teoria Clssica dos Testes, Teoria da Resposta ao
Item, Anlise Fatorial e Reconhecimento de Padres e Classificao. Portanto, o
programa e as aplicaes sugeridas podem proporcionar um avano importante para
anlise de desempenho em qualquer rea.

Palavras-chave: Teoria Clssica dos Testes, Teoria da Resposta ao Item, Anlise Fatorial,
Reconhecimento de Padres e Classificao


ix

ABSTRACT

In the last decade, the use of multivariates statistical methods started to have important
paper in the acting analysis. When studying those methods, it was verified that the
Classic Test Theory (CTT) and the Item Response Theory (IRT) have had an important
paper in that analysis type. When integrated the techniques of Factorial Analysis and
Pattern Recognition and Classification, it supplies the researcher a larger range of study
options and applications. This work presents three applications of the statistical
techniques mentioned above: the first analyzed a university entrance examination
through CTT and IRT, suggesting the job of true scores for candidates' ranking, the
second one created a procedure to detect students with drop out possibilities after the
first year of degree course applying the Fisher Linear Discriminant Method and the third
proposed an application in the area of the Production Engineering, that now has been
subject of great interest for the companies. In other words, propitiating the
ranqueamento of suppliers and the award possibility, stimulating the competitiveness and
the improvement of the quality. For this last application it was used factorial scores. It
suggested that the companies classify their new suppliers in pr-defined groups with the
use of the Fisher Linear Discriminant Method. One of the resulting products of this work
is the software call of SIAVAL 1.0, that has a friendly interface with the user and
incorporates the methods: Classic Test Theory, Item Response Theory, Factorial Analysis
and Pattern Recognition and Classification. Therefore, the program and the suggested
applications can provide an important progress for acting analysis in any area.


Keywords: Classic Test Theory, Item Response Theory, Factorial Analysis, Pattern
Recognition and Classification.



1. INTRODUO
1.1 TEMAS DE ESTUDO

Avaliao um processo sistemtico e metodolgico que atravs da atribuio de
um juzo de valor, visa explicar e compreender fenmenos com o intuito de refletir, rever
conceitos, redefinir estratgias, superar dificuldades, transformar, acompanhar, adequar
necessidades ao meio, impulsionar a melhoria da qualidade, constatar conhecimentos,
interpretar estruturas, verificar processos ou situaes que ocorrem com indivduos ou
objetos nas vrias reas do conhecimento.
O processo avaliativo implica numa metodologia que busca, atravs de variveis
quantitativas e qualitativas, modelos que possibilitam inferncias fidedignas.
A palavra avaliao causa sempre algum impacto nos indivduos envolvidos no
processo, ou seja, receio nos que sero avaliados e preocupao nos que avaliaro. Os
primeiros, por razes bvias, se sentem apreensivos na tentativa de atingir objetivos e
inseguros quanto ao instrumento imposto pelo avaliador. Os segundos em alguns
momentos no se sentem preparados para fazer a avaliao, dado a complexidade de
verificar habilidades e em alguns casos o desconhecimento de tcnicas estatsticas, entre
outras. Na maioria das vezes o avaliador entende muito do contedo a ser avaliado, mas
se defronta com a dificuldade de elaborao e validao do instrumento para faz-lo.
Alm disso, aps aplicar o instrumento o avaliador se v com um conjunto de itens
respondidos e frente ao desconhecimento das possibilidades existentes em analis-los.
Ento, parte para procedimentos do tipo de ponderaes dos itens, valorizando aqueles
que consideram por experincia mais importante. Estas tcnicas sempre so questionveis
e exigem muitas vezes a apresentao prvia dos instrumentos aos avaliados para que
estes se sintam confiantes nos procedimentos adotados.
Vrias reas do conhecimento fazem avaliaes e em quase todos os lugares
indivduos ou produtos esto sendo avaliados. Os modelos de anlise de dados em
avaliao tm origem nas reas de psicologia e educao, mas podem ser aplicados em
outros campos do conhecimento. H vrios exemplos presentes na nossa vida diria em
que poderiam ser usados os mtodos que sero apresentados neste trabalho, mas no o
so pelas dificuldades j mencionadas. Seguem alguns exemplos.
2
- Ao ingressar em uma academia de ginstica, natao, musculao, etc.; preciso
fazer uma avaliao fsica para designar o tipo de esforo suportado pelo corpo.
Essa avaliao se bem feita implica na realizao alm de exames mdicos e de
fisioterapia e tambm o questionamento sobre o tipo de vida do indivduo,
gerando um conjunto considervel de itens a ser analisado.
- No lanamento de um novo produto de linha branca (geladeiras, mquinas de
lavar, etc.) no mercado a estratgia de avaliao do produto selecionar pessoas
ou famlias que ficaro com o produto por cerca de um ano. Neste perodo e
imediatamente aps, so feitas entrevistas e respondidos questionrios. A anlise
deste conjunto de itens coletados proporciona aos empresrios a retificao de
problemas, o tipo de clientela que vai ser atingida, orientando a equipe de
marketing numa estratgia de propaganda, uma estimativa da quantidade de peas
que devem ser fabricadas, o nvel da satisfao com o produto e a viabilidade de
fabricao do mesmo.
- Na necessidade ou desejo de se fazer um regime alimentar, primeiramente feito
por um bom nutricionista uma avaliao fsica, de hbitos e s vezes at
psicolgica para verificar o tipo de tratamento indicado ao indivduo.
- Avaliar Projetos tem sido um tema bastante atual cujos objetivos so: determinar
os melhores projetos, verificar se um projeto em qualquer rea est alcanando ou
alcanou os resultados esperados, determinar a importncia de itens como custo,
tempo de execuo, entre outros.
- Nos ltimos anos cada vez mais as empresas avaliam seus colaboradores e
algumas delas vinculam a remunerao dos funcionrios ao desempenho dos
mesmos, isto , alm do pagamento dos salrios so includos pagamentos
referentes a gratificaes e a distribuio partes dos resultados;
- Avaliao de Fornecedores outra atividade que vem recentemente preocupando
as empresas. De modo geral somente empresas de grande porte fazem este tipo de
avaliao e isto tem induzido reduo de custos e melhoria da qualidade dos
produtos e processos.
Um dos objetivos deste trabalho o de atender usurios leigos que necessitem
fazer avaliao de desempenho e para isso foi desenvolvido um sistema chamado de
3
SIAVAL 1.0 que facilita a anlise de itens de um instrumento dicotmico, com
ranqueamento e reconhecimento de indivduos (empresas ou objetos) e classificao,
integrando quatro importantes reas que so: Teoria Clssica dos Testes, Teoria da
Resposta ao Item, Anlise Fatorial e Reconhecimento de Padres e Classificao. Com o
intuito de exemplificar e de verificar o desempenho do programa proposto foram
apresentados exemplos em duas reas do conhecimento: educao (desempenho de
candidatos em um teste de Concurso Vestibular e anlise de alunos de graduao com
risco de evaso) e engenharia de produo (avaliao de fornecedores de empresas).

1.2 O PROBLEMA

Apesar da existncia de aplicaes da Teoria Clssica dos Testes, Teoria da
Resposta ao Item, Anlise Fatorial e Reconhecimento de Padres em avaliao,
encontram-se dificuldades na sua compreenso, execuo e interpretao. Estas
dificuldades, s podem ser sanadas com muito estudo e amplo conhecimento de
estatstica. Estudiosos das reas de aplicao que poderiam estar usufruindo destas
tcnicas no o fazem por estes motivos.
A Teoria Clssica dos Testes e a Teoria da Resposta ao Item (TRI), indispensveis
em qualquer tipo de avaliao, vm sendo utilizada h pouco tempo e por poucas pessoas
na UFPR, no Estado do Paran e tambm no Pas. preciso incentivar, no Brasil, as
pessoas que trabalham com avaliao de todas as reas a usarem estas tcnicas
principalmente na anlise dos itens de seus instrumentos.
Muitos programas computacionais tm sido desenvolvidos para utilizao da TRI
nos ltimos tempos, tais como BILOG, TESTFACT, PARSCALE. MULTILOG,
LOGIST, etc. Aqui no Brasil, devido ao pouco tempo de estudo da teoria no existe
nenhum programa brasileiro disponvel no mercado. Estes programas atendem as
necessidades dos atuais usurios da TRI, porm o manuseio e a anlise dos dados devem
ser feitas por uma pessoa especializada e, tambm, no existe uma interface com os
sistemas de avaliao existentes nos ncleos de avaliao.
Anlise Fatorial e Reconhecimento de Padres e de Classificao so tcnicas
estatsticas muito conhecidas, porm sua utilizao s foi possvel quando os recursos
4
computacionais se tornaram acessveis, velozes e com grande capacidade de memria.
Existem muitos programas que fazem estas duas anlises (STATGRAPHICS,
STATISTICA, SPSS, R, etc.), porm ainda so muito caros e requerem um conhecimento
de uso do programa e de anlise dos resultados.
Muitas avaliaes feitas no utilizam tcnicas estatsticas nas suas anlises,
devido ao desconhecimento dos usurios dos mtodos que podem usufruir e o difcil
acesso aos programas computacionais.
No existe um programa de avaliao que tenha integrado as trs teorias para
atender as necessidades do Ncleo de Concurso da Universidade Federal do Paran e
seria muito til a ele e s outras instituies que mantenham processos de aplicao de
concursos em vrios nveis.
Na rea da engenharia, verificou-se em visitas feitas as empresas de grande porte
que vrias delas fazem avaliao de fornecedores, porm sentem necessidade de que os
seus fornecedores tambm avaliem os fornecedores deles, isto chamado de cadeia da
qualidade. Detectou-se tambm em pesquisas bibliogrficas poucos trabalhos neste
assunto e falta uma proposta de ranqueamento de fornecedores que atenda as mdias e
pequenas empresas .

1.3 OBJETIVOS

O propsito principal deste trabalho avaliar o uso das tcnicas estatsticas e
apresentar, s pessoas envolvidas ou que venham a se envolver com avaliao de
desempenho, estas tcnicas, de forma que auxilie e facilite a anlise.
Outro objetivo deste trabalho agregar Anlise Fatorial e Reconhecimento de
Padres e Classificao s tcnicas j utilizadas em avaliao de desempenho, que so:
Teoria Clssica dos Testes e Teoria da Resposta ao Item; com o intuito de melhorar a
qualidade das avaliaes no pas. Assim, pretende-se construir uma ferramenta que
englobe estas tcnicas possibilitando ao usurio fazer anlise de instrumentos de
avaliao, ranqueamento de indivduos (ou empresas) e classificar um novo indivduo em
alguma categoria pr-determinada.
5
Criar um sistema integrando a Teoria Clssica dos Testes, Teoria de Resposta ao
Item, a Anlise Fatorial e o Reconhecimento de Padres. Implementar
computacionalmente, aplicar e validar o modelo proposto.
O programa proposto pretende ser de fcil utilizao tanto para os especialistas
quanto para pessoas leigas e gera relatrios contendo as interpretaes dos resultados e
grficos que proporcionem, aos responsveis pela avaliao, compreenso e decises
rpidas.
Assim, com intuito de apresentar algumas possibilidades do programa, avaliou-se
o desempenho dos candidatos ao vestibular de uma Universidade X, fez-se o
ranqueamento dos fornecedores de uma Empresa Y e previu-se uma possvel evaso de
alunos a partir de variveis observadas no trmino do primeiro semestre do curso de
Estatstica da Universidade Federal do Paran.

1.4 JUSTIFICATIVA

Nas ltimas dcadas, segundo notas do editor em HAMBLETON,
SWAMINATHAN & ROGERS (1991, p. vii), tem-se observado uma revoluo em
medidas educacionais e psicolgicas com a aplicao da Teoria da Resposta ao Item
(TRI). Alm disso, a TRI est sendo usada comumente por grandes companhias no
planejamento de testes, montagem de teste, calibrao de teste, construo de um banco
de itens, investigao do vis dos itens do teste e outros procedimentos comuns no
processo de desenvolvimento de um instrumento.
Escolheu-se neste trabalho a anlise de itens com respostas dicotmicos ou
dicotomizadas dado que existe uma necessidade imediata do Ncleo de Concursos da
UFPR. Porm, espera-se que esta seja uma primeira verso do programa e que as
subseqentes incluam outros tipos de modelos. Esta primeira verso experimental, mas
pretende-se deix-la na forma comercial.
A opo pelos Modelos Logsticos de Dois e Trs Parmetros Unidimensionais
Dicotmicos deve-se ao fato de ser este o modelo mais usado e recomendado pelos
pesquisadores. Se em algum caso no houver a possibilidade de respostas de acerto ao
6
acaso pode-se aplicar o Modelo Logstico de Dois Parmetros (caso da Avaliao de
Fornecedores).
A estimao dos parmetros dos itens foi feita atravs do Mtodo de Mxima
Verossimilhana Marginal via algoritmo EM com as reformulaes sugeridas por BOCK
& AITKIN (1981, p. 443-459) que possibilita uma melhor convergncia quando utilizado
o mtodo de resolues de equaes no-lineares de Newton-Raphson.
A estimao das habilidades dos indivduos (empresas) foi realizada aps a
estimao dos parmetros dos itens utilizando o estimador de Baysiano EAP (Expected A
Posteriori), que no caso o mais indicado dado que no necessita usar mtodos de
resoluo de equaes e deixa o programa mais rpido.
A Anlise Fatorial foi aplicada no ranqueamento de fornecedores de uma empresa
de grande porte. A partir de dados fornecidos por empresa foi avaliado o grau de
relacionamento entre eles, com base nos coeficientes de correlao. Da matriz de
correlao obtida foram determinados os autovalores e autovetores, dos quais se obteve o
nmero de fatores considerando-se 90% da proporo da varincia explicada. Na
estimao dos fatores foi utilizado o Mtodo de Componentes Principais, e para uma
melhor interpretao dos resultados optou-se fazer uma Rotao Varimax. Os escores
fatoriais foram estimados pelo Mtodo dos Mnimos Quadrados. A diversidade de
mtodos e procedimentos necessrios ao fazer uma anlise fatorial dificulta a escolha dos
mesmos, sendo assim optou-se nos que tem apresentado melhores resultados prticos.
A escolha do mtodo de Reconhecimento de Padres e de Classificao utilizado
para alocar e reconhecer um novo indivduo em alguma categoria predeterminada aplica-
se bem as de anlises pretendidas pelo programa, visto que sero analisados dados de
uma mesma populao. Por isso o programa contempla o Mtodo Linear de Fisher para
Vrias Populaes, dado no h necessidade de verificao da distribuio de
probabilidade dos dados.
Nos ltimos anos uma das preocupaes das grandes empresas est focada no
estreitamento do relacionamento com seus fornecedores, pois o fortalecimento deste
vnculo, tambm chamado de parceria, garante s empresas uma melhoria de qualidade e
preo tornando-as mais competitivas no mercado. Segundo ALVAREZ & QUEIROZ
(2003, p.1), inicialmente os processos de parceria eram feitos em cima de Contratos de
7
Fornecimento que implicava num longo perodo de avaliao e qualificao do
fornecedor. Isto gerava uma srie de responsabilidades e compromissos impostos pelas
empresas aos fornecedores e acarretava conflitos de interesses ao longo do processo. Por
este motivo algumas empresas, preocupadas com estas questes, criaram processos de
integrao e tornaram-se mais flexveis, de maneira que as expectativas de ambas as
partes possam obter benefcios mtuos.
A avaliao de fornecedores assegura empresa uma melhoria substancial no seu
processo de produo principalmente garantindo uma melhor qualidade dos insumos e
reduo dos prazos de entrega. Assim, a rea de Gesto Empresarial est envolvida nesta
avaliao, principalmente porque o benefcio maior da empresa est focado na reduo de
custos, portanto geralmente ela que conduz o tema.
Procurou-se seguir no desenvolvimento dos mtodos as notaes mais utilizadas,
principalmente no caso da Teoria da Resposta ao Item, onde as notaes e as seqncias
das idias esto embasadas no livro dos autores Dalton Francisco de Andrade, Hliton
Tavares e Raquel da Cunha Valle intitulado Teoria da Resposta ao Item: conceitos e
aplicaes, citados vrias vezes nesta tese, dado sua facilidade de compreenso e a
inteno de preservar a mesma nomenclatura (terminologia) aqui no Brasil.

1.5 ESTRUTURA DO TRABAHO

O presente trabalho de tese se encontra estruturado nos captulos da Introduo,
Reviso de Literatura, Materiais e Mtodos, Anlise dos Dados, Concluses e
Recomendaes e Referncias, bem como, os Apndices.
Na Introduo, Captulo 1, definiu-se sucintamente avaliao, as tcnicas
propostas neste trabalho e os campos de aplicao em que poderiam ser usadas. As
dificuldades de aplicao das tcnicas se resumem no desconhecimento das mesmas e nos
obstculos das aplicaes dos programas encontrados no mercado. A razo e a finalidade
para propor a implementao de um programa de avaliao integrando as tcnicas de
Teoria da Resposta ao Item, Anlise Fatorial e Reconhecimento de Padres e
Classificao, com aplicaes em duas reas (educao e engenharia de produo) so
apresentadas neste captulo.
8
As tcnicas estatsticas dispostas nesta tese no Captulo 2 fundamentam os meios
de avaliar o instrumento, categorizar os avaliados e classificar um novo indivduo em
alguma categoria de interesse na avaliao.
Na seo 2.1, apresentam-se algumas estatsticas da Teoria Clssica dos Testes
que podem auxiliar muito na avaliao, como por exemplo, a confiabilidade
(fidedignidade) do instrumento, correlao bisserial e correlao bisserial por ponto.
A Teoria da Resposta ao Item que possibilita a anlise dos itens do instrumento
discutida na seo 2.2. A princpio, foram definidos os pressupostos bsicos, com a
incluso de um breve histrico da teoria. Em seguida, foram enunciados: o Modelo
Logstico de Trs Parmetros Unidimensional Dicotmico com a respectiva Curva
Caracterstica do Item (CCI), a Funo de Informao do Item, a Funo de Informao
do Instrumento, o mtodo de estimao dos parmetros dos itens e o mtodo de estimao
das habilidades dos indivduos.
A tcnica da Anlise Multivariada, utilizada no ranqueamento, apresentada na
seo 2.3. Nesta seo, so retratados alguns conceitos fundamentais e pressupostos
bsicos, o Modelo de Anlise Fatorial Ortogonal, o critrio de seleo do nmero de
fatores e dois mtodos de estimao: Mtodo das Componentes Principais e Mtodo da
Mxima Verossimilhana. Alm disso, citou-se o Mtodo de Rotao Varimax e dois
mtodos de obteno do escores fatoriais: Mtodo dos Mnimos Quadrados Ponderados e
Mtodo da Regresso.
A alocao de um novo indivduo em uma classe pr-determinada feita pelas
tcnicas de Reconhecimento de Padres e Classificao, relatada na seo 2.4, que
inicialmente apresenta os conceitos e procedimentos necessrios ao seu entendimento.
Continuando a seo, descreve-se o Mtodo de Fischer para discriminao e classificao
entre duas ou mais populaes, o Mtodo de Mxima Verossimilhana para vrias
populaes supostamente Gaussianas entre outros.
No Captulo 3 descrevem-se os materiais e mtodos utilizados neste trabalho. Est
dividido nas seguintes sees: Introduo, Mtodos Estatsticos Utilizados, Coletas de
Dados e Elaborao do Programa.
Os resultados das anlises de dados reais utilizando o programa encontram-se
descritos no Captulo 4.
9
Finalmente as concluses e recomendaes so apresentadas no Captulo 5 e na
seqncia seguem as Referncias e os Apndices.
10
2. REVISO DE LITERATURA
2.1 TEORIA CLSSICA DOS TESTES
2.1.1 Introduo

A anlise de desempenho em testes de avaliao tem sido objeto de muitos
estudos em vrias reas nas ltimas dcadas e nos campos da psicometria e de medidas
educacionais. H muito tempo modelos vm sendo desenvolvidos com as seguintes
finalidades: avaliar as caractersticas latentes de indivduos, fazer comparaes entre
grupos de indivduos e possibilitar a anlise dos instrumentos utilizados. O modelo mais
popular para testes o da Teoria Clssica dos Testes (TCT), porm com um nmero de
deficincias que limita a sua utilizao nos tempos atuais, dado que a Teoria da Resposta
ao Item (TRI) atende melhor s expectativas dos pesquisadores.
No entanto, alguns elementos da TCT ainda so importantes na interpretao dos
resultados de um teste e sero, brevemente, abordados aqui.
Segundo Hwang (2002, p.27) os primeiros trabalhos desenvolvidos sobre este
tema foram os de Spearman (1907, 1913), Gulliksens (1950) e posteriormente Lord and
Novick (1968) fizeram uma exposio completa da teoria.

2.1.2 Concepo Bsica

A Teoria Clssica dos Testes (TCT) consiste em um modelo relativamente
simples. Sero demonstrados aqui sumariamente os princpios desta teoria necessrios
complementao dos estudos feitos atravs da Teoria da Resposta ao Item descrita no
prximo item.
O modelo se fundamenta na observao dos escores, X
ij
, do respondente i no item
j, segundo LORD & NOVICK (1968, p.34). Assim, o modelo matemtico definido por:
X
ij
=
i
+
ij

onde a constante
i
o verdadeiro escore do respondente i onde i = 1, 2, 3, ..., n
(desconhecido) e
ij
uma perturbao aleatria ou erro de observao na resposta do
avaliado i no item j.
A definio do escore verdadeiro na TCT fundamental e dado por:
11

i
= E(X
ij
)

Dessa forma tem-se uma distribuio de probabilidade para a varivel aleatria do
verdadeiro escore dada por f(x
ij
) com mdia
i
e varincia V(X
ij
) = V(
ij
). Dado que
i

uma constante, tm-se que o erro ou perturbao aleatria possui uma distribuio dada
por f(
ij
) com mdia zero apresentada a seguir e varincia V(
ij
) = V(X
ij
).=
i
2
. E, sendo
ij

= X
ij
-
i
, tem-se que:
E(
ij
) = E(X
ij
-
i
) = E(X
ij
)- E(X
ij
)=
i
-

i
= 0 (1)
e
V(
ij
) = V(X
ij
-
i
) =
i
2
(2)
O elemento chave na TCT vem da definio da mensurao paralela,
especialmente na anlise da preciso de mensuramento. Duas medidas distintas X
ij
e X
ij*

so ditas mensuraes paralelas se:
E(X
ij
) = E(X
ij*
) =
i
(3)
V(X
ij
) = V(X
ij*
) =
2
i
para j j* (4)
Assim, o mensuramento paralelo assume que os escores observados dos
indivduos tem a mesma mdia e mesma varincia. A estimao desses parmetros mdia
e varincia com base em uma amostra de tamanho n so respectivamente:

=
= =
n
i
ij
i i
n
X
X
1
e
1
1
2
2

=

=
n
) X X (

n
i
ij
i
(5)
A prova deste resultado encontra-se em LORD & NOVICK (1968, p.48).

2.1.3 Confiabilidade

Um conceito muito importante na TCT o da confiabilidade, pois determina a
fidedignidade com que o escore no teste mensurado. De acordo com CHAVES NETO
& TURIM (2003), a confiabilidade de um teste depende da interao entre trs fatores: do
prprio teste, das condies de aplicao e do grupo de respondentes. Sabe-se, portanto,
que quando um grande nmero de itens aplicado tm-se escores mais confiveis, visto
que h maior representatividade na amostra de contedos, ou seja, existe validade de
contedo.
12
Neste trabalho analisou-se respostas dicotmicas, portanto, tem-se uma
distribuio discreta de probabilidade do tipo Bernoulli cuja mdia dada por
i
= p
i
e a
varincia por
i
2
= p
i
(1-p
i
), onde p
i
representa a proporo dos examinados que
responderam corretamente ao item i. O coeficiente de correlao de Kuder-Richardson
(DOWNIE & HEATH, 1959 p. 195) um bom estimador da confiabilidade e dado por:
)
s
) p 1 ( p
1 (
1 n
n
2
n
1 i
i i
KR

= (6)
onde:
n = nmero de itens do teste
p
i
= proporo dos respondentes que acertaram o item i
s
2
= varincia dos escores do teste com base nos N escores dos respondentes
Um teste considerado confivel quando a correlao de Kuder-Richardson for
maior ou igual a 0,90 (CHAVES & TURIN, 2005 p.51).

2.1.4 Correlao Bisserial e Bisserial por Ponto

A correlao bisserial, denotada por r
bis
, apropriada quando se tem interesse no
grau de relacionamento entre dois tipos de escalas, mas por uma razo lgica uma das
duas mais sensivelmente interpretada como uma escala nominal criada artificialmente.
A correlao bisserial por ponto, r
bpi
, apropriadamente aplicada quando a varivel
nominal ocorre naturalmente, por exemplo, na distribuio do gnero (masculino e
feminino).
As correlaes bisserial e bisserial por ponto so medidas estatsticas que medem
a relao existente entre o resultado de um item em particular com o resultado do teste
(escore bruto total), isto , mede a capacidade de discriminao do item em relao ao
resultado do teste.
A correlao bisserial por ponto uma estimava natural dada por:
i
i
t
t i
bpi
p 1
p
.
s
X X
r

= (7)
onde:
13
i
X = mdia dos escores do item i.
t
X = mdia total dos escores.
s
t
= desvio padro total dos escores.
p
i
= proporo dos respondentes que acertaram o item i.
O coeficiente de correlao bisserial considera Z ~ N(0,1) uma varivel aleatria
(no observada) associada habilidade do respondente. Considerando que o escore bruto
do respondente se associa linearmente a esta varivel aleatria. De acordo com SOARES
(2005, p.84), dado a linearidade aplica-se o coeficiente de correlao de Pearson
resultando na equao a seguir:

y
p
s
X X
r
i
t
t i
bis
.

= (8)
onde y = f(z) a ordenada da curva normal padro correspondente a p
i
e os outros termos
so os mesmos usados na correlao bisserial por ponto. Assim, existe uma relao entre
as duas correlaes (bisserial e bisserial por ponto) dada por:

y
) p 1 .( p
. r r
i i
bpi bis

= (9)
Outros ndices so estudados na TCT, como o grau de dificuldade e o ndice de
discriminao, ambos com base na proporo de acerto dos escores. No entanto, estes
ndices so tratados como parmetros e analisados na Teoria da Resposta ao Item,
descrita no item 2.2 a seguir.

2.2 TEORIA DA RESPOSTA AO ITEM
2.2.1 Introduo

A Teoria da Resposta ao Item (TRI) foi apresentada primeiramente por Lord na
dcada de 50. Porm devido s grandes dificuldades computacionais da poca passaram a
ser aplicados de fato cerca de 20 anos. No Brasil, segundo ANDRADE, TAVARES &
VALLE (2000, p.5), a TRI foi usada a partir de 1995, a princpio, na anlise dos dados do
Sistema Nacional de Ensino Bsico SAEB.
14
Inicialmente a TRI foi concebida para resolver problemas na rea de avaliao
educacional e da psicometria, porm, tais conceitos tm despertado interesse tambm em
outras reas, tais como: na rea mdica vista no artigo Application of the Rasch Analysis:
exploring differences in depression between african-american and white children
(DeROOS & ALLEN-MEARES, 1998, p.93-107); no campo da gentica no artigo de
TAVARES, ANDRADE & PEREIRA (2004, p.679-685) intitulado Detection of
determinant genes and diagnostic via item response theory;em marketing na Dissertao
de Mestrado Tcnica derivada da teoria da resposta ao item aplicada ao setor de
servios (COSTA, 2001); em gesto da qualidade no artigo de -ALEXANDRE,
ANDRADE, VASCONCELOS & ARAJO (2002, p.129-141) denominado Uma
proposta de anlise de um construto para a medio dos fatores crticos da gesto pela
qualidade atravs da teoria da resposta ao item.
Os primeiros passos no desenvolvimento da Teoria da Resposta ao Item (TRI),
segundo HISTORY OF ITEM RESPONSE THEORY disponvem em http://www.
uic.edu/classes/ot/ot540/history.html e acessado em abril de 2005, foram dados por Binet
& Simon em 1916, quando traaram nveis de desempenho de indivduos com algumas
variveis independentes e usaram estas relaes para o melhoramento de testes. Em 1936,
Richardson introduziu a estimativa do parmetro da TRI (modelo unidimensional com
um parmetro) que derivava dos conceitos da Teoria Clssica dos Testes (TCT). Lawley
introduziu novos procedimentos para a estimao deste parmetro alguns anos depois
(1944). Contudo, na maioria das obras pesquisadas, dado a Lord o desgnio de precursor
dos estudos da TRI, pois ele apresentou o modelo unidimensional de dois parmetros
com a utilizao da funo distribuio da normal, em 1952 nos Estados Unidos da
Amrica.
Segundo LINDEN & HAMBLETON (1996, p. 13), por volta de 1958, Birnbaum
substituiu a funo distribuio da normal do modelo de Lord pela funo logstica, o que
deu maior facilidade no tratamento matemtico nos programas desenvolvidos naquela
poca.
Rasch em 1960, segundo ANDERSEN & OLSEN (2001, p.11-20), props um
modelo baseado na concepo de uma distribuio de Poisson para o nmero de erros em
leituras de textos, que com aprimoramentos, como o uso da funo logstica, tornou-se o
15
modelo conhecido como modelo logstico de um parmetro-ML1 e chamado de Modelo
Rasch, motivando o desenvolvimento do modelo com dois parmetros (ML2) ao modelo
inicialmente proposto por Lord.
Segundo LINDEN & HAMPLETON (1996, p.13) foi Birnbaum que
implementou, em 1968, um terceiro parmetro no modelo de Rash que ficou conhecido
como Modelo Logstico de Trs Parmetros ML3. Deve-se tambm a Birnbaum a
descrio da Funo de Informao do Item (utilizando um modelo de mensurao de
Fisher) e tambm a primeira tcnica utilizando Mxima Verossimilhana para estimar os
parmetros dos itens.
O primeiro programa computacional da TRI chamado BICAL foi desenvolvido
por Wright e Panchapakesan em 1969, e facilitou muito as aplicaes do modelo de
Rasch.
A partir da vrios modelos foram desenvolvidos tais como: os nominais, de
resposta gradual, multidimensionais, longitudinais, no-paramtricos, etc. Tambm,
alguns mtodos de estimao dos parmetros foram aparecendo, inclusive o mtodo
bayesiano. Em decorrncia de tudo isto, surgiram outros programas computacionais tais
como: LOGIST de Lord, BILOG de Mislevy e Bock, PARSCALE de Muraki e Bock,
TESTFACT de Wilson, Wood e Gibbons, MULTILOG de Thissen entre outros. Alguns
nomes importantes que contriburam para desenvolvimento desta teoria so: Samejima,
Zimowski, Lieberman, Hambleton, Baker, etc. No Brasil, destacam-se os nomes: Dalton
F. de Andrade, R. Klein, Hliton R. Tavares, Raquel C.Valle, entre outros.

2.2.2 Pressupostos Bsicos

A Teoria da Resposta ao Item (TRI) uma tcnica originria da Teoria Clssica
dos Testes (TCT) a qual se fundamenta apenas nos resultados obtidos pelos respondentes
do conjunto de respostas aos itens que compe o instrumento de avaliao (escores). A
TRI, a princpio desenvolvida para respostas dicotmicas, usa a probabilidade de
respostas corretas aos itens de um instrumento de avaliao para determinar os seus
parmetros (poder de discriminao, dificuldade e acerto casual) e as habilidades dos
respondentes, de preferncia na mesma quantidade latente contnua (ou espao latente no
16
caso multidimensional). Isto significa que esta teoria permite medir os indivduos na sua
caracterstica latente estimulada pela coleo de itens do instrumento de avaliao usado,
por exemplo, a habilidade em alguma rea, atitude em certa situao, necessidade ou
desejo de alguma coisa, satisfao, qualidade, etc. Ao mesmo tempo esta teoria analisa
cada item na mesma dimenso, como ilustrao disto se ter itens fceis e difceis no
caso de uma avaliao educacional, desfavorveis e favorveis em avaliao de atitudes,
etc. Em suma, dependendo do estudo em que se vai aplicar a TRI os traos latentes dos
respondentes e os parmetros dos itens tm significados prprios.
H vrias propostas de modelagem da teoria que dependem principalmente de trs
contextos: o tipo de resposta proposta aos itens, o nmero de populaes (ou grupos)
envolvidas e a quantidade de traos latentes medidos.
Quanto ao tipo de resposta, os itens podem ter respostas dicotmicas,
dicotomizadas e no-dicotmicas. As dicotmicas se referem s respostas com duas
possibilidades sendo uma de sucesso e a outra de fracasso (certo ou errado, satisfeito ou
insatisfeito, etc.). Para as dicotomizadas atribui-se, por exemplo, a itens com respostas de
mltipla escolha que podem ser analisados como certo ou errado ou ainda quando o
instrumento permitir respostas abertas (livre) e que possibilitem a posteriori sua
dicotomizao. No caso de itens com respostas de carter no-dicotmicas, estes so
principalmente empregados em anlises cujas respostas no possam se dicotomizadas
como,por exemplo, as de carter ordinal. Na atualidade existem modelos na TRI
especficos para analisar instrumentos para todos os tipos de variveis sejam elas de
carter qualitativo (nominal e ordinal) ou quantitativo (discretas e contnuas).
No que se refere ao nmero de populaes analisadas, os modelos dividem-se em
duas categorias: os envolvendo uma populao e os que consideram duas ou mais
populaes na anlise. Todo o desenvolvimento da teoria foi definido a princpio para
uma populao, porm quando se trata de duas ou mais populaes a comparao s
poder ser feita se existirem alguns itens comuns nos instrumentos. Os modelos que
envolvem mais de uma populao so basicamente uma extenso dos anteriores. Uma das
alternativas para comparar vrias populaes , por exemplo, o uso da Equalizao
definida por Kolen & Brennam em 1995, que significa colocar na mesma mtrica os
parmetros de itens ou populaes distintas. Pode-se usar, tambm, o Modelo para Vrias
17
Populaes, desenvolvido por Bock & Zimowski em 1997, que na realidade uma
equalizao automtica (ANDRADE, TAVARES & VALLE, 2000 p.93).
A classificao dos modelos com relao quantidade de traos latentes ou
habilidades analisadas, chamados de modelos unidimensionais quando estes consideram
uma habilidade e multidimensionais quando se examinam duas ou mais habilidades num
mesmo instrumento. Os modelos unidimensionais so os mais utilizados na prtica e toda
a teoria matemtica da TRI foi fundamentada com este enfoque, porm pode-se
encontrar, por exemplo, em LINDEN & HAMBLETON (1996, captulo III) referncias
sobre os modelos multidimensionais.
Mais recentemente outros modelos foram introduzidos como os no-paramtricos,
os longitudinais, entre outros. Os modelos longitudinais, por exemplo, analisam os
parmetros dos itens e das habilidades ao longo do tempo, o que possibilita acompanhar
os indivduos em duas ou mais avaliaes com base na formulao de correlaes e
curvas de crescimento associadas a vetores de mdias, toda formulao pode ser
encontrada em TAVARES, 2001.
Neste trabalho, ser apresentado o desenvolvimento do Modelo Logstico de Trs
Parmetros Unidimensionais Dicotmicos e a estimao dos parmetros dos itens
utilizando o Mtodo de Mxima Verossimilhana Marginal com algoritmo EM. Deve-se
notificar que o desenvolvimento feito para estimar os parmetros do modelo escolhido
semelhante para outros modelos.

2.2.3 Modelo Logstico de Trs Parmetros Unidimensional Dicotmico.

O Modelo Logstico de Trs Parmetros Unidimensional proposto por Birnbaum
ao descrito por Rasch dado por:

( )
i j i
b Da
i i j ji
e
) c ( c ) | U ( P

+
+ = =

1
1
1 1 (10)
onde
P(U
ji
=1|
j
) = probabilidade do respondente j acertar o item i dado que ele possui uma
habilidade
j
.
U
ji
= resposta dada pelo respondente j ao item i.
18

j
= habilidade ou trao latente do respondente j.
a
i
= parmetro de discriminao do item i.
b
i
= parmetro de dificuldade do item i.
c
i
= parmetro de acerto casual do item i.
D = fator de escala geralmente igual a 1,7 para que a funo logstica fornea resultados
semelhantes ao da distribuio normal.
O parmetro de acerto casual (c
i
) refere-se probabilidade de um respondente
com habilidade baixa de acertar o item (ao acaso). Quando no se necessita desse
parmetro, na anlise, ele pode ser retirado e tm-se o Modelo Logstico de Dois
Parmetros (ML-2), e retirando ainda o parmetro de discriminao (a
i
) tem-se o Modelo
de Um Parmetro (ML-1) chamado de Modelo de Rasch, que considera que todos os itens
discriminam da mesma forma.

2.2.3.1 Curva caracterstica do item CCI

Segundo ANDRADE, TAVARES & VALLE (2000, p.10), o modelo logstico
permite que se interprete graficamente os parmetros dos itens e se pode verificar que
indivduos com maior habilidade possuem maior probabilidade de acertar o item e
constata-se, ainda, que esta relao no-linear.
Na Figura 1, chamada de Curva Caracterstica do Item CCI que obtida da
equao 1, pode-se observar que o parmetro de discriminao do item i (a
i
)
proporcional a derivada da tangente da curva no ponto de inflexo e na prtica sua
variao aceita entre zero e dois (HAMBLETON, SWAMINATHAN & ROGERS,
1991, p. 15). Assim, altos valores indicam que o item tem maior poder de separar
indivduos dentro dos diferentes nveis de habilidade. O parmetro de dificuldade do item
i (b
i
), medido na mesma escala da habilidade (geralmente delimitado no intervalo da
normal padro, como por exemplo de -4 +4), representa a habilidade necessria para
uma probabilidade de resposta correta correspondente a (1+c
i
)/2 e em conseqncia
disso, quanto maior o valor de b
i
mais difcil o item. O parmetro de acerto casual (c
i
)
representa a probabilidade de resposta correta para um respondente com habilidade baixa,
por conseguinte quando o instrumento no permitir um acerto casual dos itens este
19
parmetro ser igual a zero e neste caso b
i
representa o valor da habilidade do
respondente com chance de acerto igual a 50%.
A anlise deve ser feita observando o grfico e os parmetros obtidos. Os critrios
de identificao do modelo dependem do tipo de avaliao que se pretenda fazer e de
consideraes baseadas na experincia do avaliador, porm de maneira geral pode-se
considerar que para o parmetro de discriminao tm-se um item com discriminao alta
quando este valor estiver prximo ou maior que 2, mdio ao redor de 1 e baixo quando
menor do que 0,5; pode-se observar esse valor na inclinao da curva, assim quanto
maior for a inclinao maior o poder de discriminao do item.
O parmetro de dificuldade pode ser considerado alto quando assumir valores
prximos ou maiores que a 4, mdio em torno de zero e baixo quando for prximo ou
abaixo de -4, assim no grfico quanto mais a direita estiver a curva mais difcil o item.
O parmetro de acerto casual depende do nmero de alternativas usadas nos itens,
sendo assim um item com pouca probabilidade de acerto casual deve ficar em torno de
zero e com grande probabilidade de acerto casual deve ser igual ou maior que a razo
(1/nmero de alternativas). No grfico o parmetro acerto casual o valor correspondente
projeo da curva no eixo y quando ela tende a menos infinito.
Cabe aqui comentar que um item ruim aquele que tem um parmetro de
discriminao baixo (abaixo de 0,5) e tambm um parmetro de dificuldade muito alto
(acima de 3,5) e muito baixo (abaixo de -3.5).
Alguns itens foram construdos para demonstrar o significado dos valores obtidos
nos seus parmetros procedendo-se as seguintes anlises:
Na Figura 1 pode-se verificar que o item 1 tem discriminao alta de 1,8,
dificuldade acima da mdia de 1,0 (ponto de inflexo denotado por uma cruz) e
impossibilidade de acerto casual (zero).







20

FIGURA 1- GRFICO DA CURVA CARACTERSTICA DO ITEM 1

A ttulo de comparao podemos ver que o item 2 no grfico da Figura 2 possui o
mesmo grau de dificuldade b = 1,0, nenhuma possibilidade de acerto casual c = 0, porm
um ndice de discriminao baixo a = 0,4. Veja a pequena inclinao da curva em
contraste com a alta inclinao da curva da Figura 1.

FIGURA 2- GRFICO DA CURVA CARACTERSTICA DO ITEM 2

Plotando as curvas caractersticas dos dois itens juntos na Figura 3 pode-se
perceber melhor que a inclinao da Curva Caracterstica do Item 2 menor que a do
item 1. Isto significa que o item 1 um item melhor para se aplicar do que o item 2, pois
tem maior poder de discriminao.
FONTE: A AUTORA SIAVAL 1.0
FONTE: A AUTORA SIAVAL 1.0
21


FIGURA 3- GRFICO DAS CURVAS CARACTERSTICAS DOS
ITENS 1 e 2
Ao se analisar outro caso com outros dois itens designados por 3 e 4, nos quais os
parmetros de discriminao sejam iguais a 1,8 e no exista a possibilidade de acerto
casual (c = 0) e com o parmetro de dificuldade igual a 1,0 no item 3 e 0,5 no item 4,
observa-se na Figura 4 que a curva do item 3 est mais direita. Assim, dado que os dois
itens possuem discriminao alta, seria uma melhor escolha o item 3 para instrumentos
onde sabido que os respondentes possuem maior habilidade e o item 4 para os de menor
habilidade.


FIGURA 4- GRFICO DAS CURVAS CARACTERSTICAS DOS
ITENS 3 e 4
FONTE: A AUTORA SIAVAL
FONTE: A AUTORA SIAVAL 1.0
22

Caso o parmetro de acerto casual seja significativo, observa-se no Figura 5 que o
item 1 j citado (a = 1,8, b = 1 e c = 0) comparado com um item 5 (a = 1,8, b = 1 e c =
0,25) que possui um acerto casual de 25%.


FIGURA 5- GRFICO DAS CURVAS CARACTERSTICAS DOS ITENS 1 E 5

Percebe-se que o item 5 possui o parmetro de acerto casual alto (0,25) que
deforma a curva, porm continua praticamente com as mesmas caractersticas,
interferindo pouco na anlise.

Funo de Informao do Item e do Instrumento:

Uma importante informao utilizada, conjuntamente com a CCI, a Funo de
Informao do Item, denotada por I
i
(
j
), que no caso do modelo logstico de trs
parmetros foi apresentada por Birnbaum em 1968 e citada em HAMBLETON,
SWAMINATHAN & ROGGERS (1991. p. 91), como:
( )
( ) ( )
2
2 2
2
+ +
1
=
1 = 1 1 =

1 =
=
] e c ][ e c [
) c ( a D
)] / U ( P )[ / U ( P
]
) / U ( P
[
I
i j i i j i
i
b Da
i
b Da
i
i
j ji j ji
j
j ji
j i



(11)

FONTE: A AUTORA SIAVAL 1.0
23
Examinando o Figura 6 a seguir, que contm a Curva Caracterstica do item 6 (a =
0,8, b = 0,5 e c = 0) e a sua Funo de Informao, verifica-se que o valor mximo de
informao do item se d no ponto de inflexo da CCI, isto , onde = b.



FIGURA 6- GRFICO DA CURVA CARACTERSTICA E DA FUNO DE
INFORMAO DO ITEM 6

Quando o parmetro de acerto casual grande tem-se que o item menos til para
determinar a habilidade, o que fica evidente no Figura 7 cujas curvas estudadas se
referem ao item 7 com parmetros: a = 0,8, b = 0,5 e c = 0,3.


FIGURA 7- GRFICO DA CURVA CARACTERSTICA E DA FUNO DE
INFORMAO DO ITEM 7
FONTE: A AUTORA SIAVAL 1.0
FONTE: AUTORA SIAVAL 1.0
24
Se o parmetro de discriminao muito pequeno tem-se pouca informao do
item, como se pode observar no Figura 8 cujo item 8 analisado tem os parmetros a = 0,5,
b = 0,5 e c = 0.

FIGURA 8- GRFICO DA CURVA CARACTERSTICA e DA FUNO
DE INFORMAO DO ITEM 8


Para se determinar informao que contm todo instrumento deve-se somar
todas as informaes geradas pelas funes dos itens em alguns valores de de interesse,
como por exemplo, no primeiro, segundo e terceiro quartis (ou outra escolha mais
detalhada). Esta funo denotada por SI(
j
) e dada por:
( ) ( )

=
=
I
1 i
j i j
I SI (12)
Segundo HAMBLETON, SWAMINATHAM & ROGERS (1991, p.94), a
contribuio de um item individualmente no teste pode ser determinada sem
conhecimento de outro item do teste, isto , os itens so considerados na TRI como
independentes. Isto que difere da confiabilidade feita pela Teoria Clssica dos Testes
(TCT), que usa a correlao bisserial de ponto. A vantagem obtida quando se deseja
trocar um dos itens, pois os outros no so afetados por esta troca. Assim, se pode
direcionar a retirada deste item adequando-o para a habilidade dos indivduos que se
pretende atingir com teste, ou seja, quando um item possue parmetro de dificuldade alto
ele no discrimina indivduos que sabido ter habilidade baixa e vice-versa.
FONTE: A AUTORA SIAVAL 1.0
25
A quantidade de informao do teste na habilidade
j
oriundo do inverso da
preciso com que a habilidade estimada no ponto
j
e chamada de Erro Padro de
Estimao, dada por:

) ( SI
) ( EP
j
j

1
= (13)
O Erro Padro de
j
, EP(
j
), o desvio padro da distribuio assintoticamente
normal da estimativa de mxima verossimilhana da habilidade, onde:
( )
| |
( )
| |
( )
) ( SI
I
e . e c
) c ( a D
) ( L log
E
S
j
I
i
j i
I
i
b Da b Da
i
i
j
j
i j i i j i
i
j

1 1
1
1
1 1
1
1
2
2 2
2
2
= =
(
(

+ +

=
|
|
.
|

\
|

=
=

(14)
Estas funes caracterizam as informaes de um instrumento que possibilitam a
comparao com outros. Assim, na existncia de um banco de itens, pode-se atravs de
anlises deste tipo escolher um instrumento que atenda melhor a necessidade do
pesquisador.
Para melhor exemplificar, as Figuras 9 e 10 demonstram dois agrupamentos de
itens diferentes (ou de dois instrumentos diferentes). No primeiro, instrumento A, a soma
de todas as informaes no trs quartis resultou um valor de 3,3549 com um erro padro
de 0,5460. No segundo, instrumento B, a soma forneceu um valor de 1,3277 com erro
padro de 0,8678. Conseqentemente, o instrumento A seria o escolhido, pois ele fornece
melhores resultados com uma maior quantidade de informao concentrada.
26

FIGURA 9- GRFICO DAS CURVAS CARACTERSTICAS DOS
ITENS DO INSTRUMENTO A


FIGURA 10- GRFICO DAS CURVAS CARACTERSTICAS DOS
ITENS DO INSTRUMENTO B

Na construo de um banco de itens se faz necessrio comparar a informao de
dois testes que tenham o mesmo nvel de habilidade. Usa-se, ento a relao denotada por
FONTE: A AUTORA SIAVAL 1.0
27
Eficincia Relativa (ER(
j
)) apresentada a seguir, onde SI
A
(
j
) representa a funo de
informao do teste A e SI
B
(
j
) a do teste B.
( )
( )
5268 , 2
3277 , 1
3549 , 3
SI
SI
) ( ER
j B
j A
j
= =

= (15)
As anlises apresentadas possibilitam selecionar itens de testes que apresentaram
melhor desempenho numa habilidade determinada. Suponha, por exemplo, que se deseja
aplicar um teste onde se sabe que os respondentes possuem habilidade alta. Assim, se
outros testes j tenham sido feitos com outras populaes, verifica-se atravs da
eficincia relativa o melhor conjunto de itens que possibilite discriminao desta
habilidade. Uma importante aplicao desta relao se d quando se quer construir um
banco de itens, pode-se, portanto, selecionar os melhores itens para cada nvel de
habilidade, e a construo dos testes fica facilitada.

Propriedades da TRI:

Uma propriedade importante da TRI a invarincia dos parmetros dos itens e
habilidades, que segundo HAMBLETON, SWAMINATHAN & ROGGERS (1991,
p.18), o que distingue a TRI da Teoria Clssica dos Testes. Esta propriedade sustenta
que os parmetros dos itens e a distribuio das habilidades dos respondentes so
independentes. Isto significa que a CCI a mesma para duas populaes diferentes, uma
vez calibrados os itens. Esta propriedade a base da TRI e possibilita a obteno de um
banco de dados, investigao do vis do item e a adaptao do teste ao que se prope.
Deve-se ressaltar que a propriedade de invarincia vlida somente quando um modelo
da TRI for ajustado satisfatoriamente aos dados de interesse (calibrados).
Modelos que pressupe um instrumento que mea somente um trao latente
(habilidade) possuem uma propriedade chamada de unidimensionalidade. Na realidade
isto no acontece, pois os respondentes utilizam mais de uma habilidade para responder
os itens propostos. Assim, para satisfazer o postulado, segundo ANDRADE, TAVARES
& VALLE (2.000, p.16), basta aceitar que nos itens selecionados, para determinado
instrumento, exista uma habilidade que predomina sobre as demais, que exatamente o
fator que est sendo pesquisado. Verifica-se esta independncia utilizando correlaes
28
tetracricas, apresentada nesta tese nos procedimentos de Anlise Fatorial. Modelos que
assumem mais de uma habilidade so referidos como multidimensionais e possuem
estruturas mais complexas.
Quando num modelo a unidimensionalidade adotada, assume-se outra
propriedade chamada de independncia local. Esta propriedade significa que fixada uma
habilidade s respostas dadas aos diferentes itens do instrumento so independentes.
Desta forma, est se supondo que o conjunto dos nveis de habilidade representa o espao
latente completo. A independncia local uma suposio fundamental estimao dos
parmetros dado que a probabilidade do indivduo com a habilidade
j
acertar um item
(U
i
) no afeta a probabilidade dele acertar outro item (U
i
), conseqentemente a
probabilidade conjunta de um indivduo com habilidade
j
acerta os n itens um
instrumento dada por:
( ) ( ) ( ) ( ) ( )
C
n
1 i
j i j n j 2 j 1 j n 2 1
/ U P / U P ... / U P . / U P / U ,..., U , U P
=
= = (16)
A presente formulao permite a estimao dos parmetros por mtodos
estatsticos de bom desempenho, como o da Mxima Verossimilhana.
Uma observao importante feita por HAMBLETON, SWAMINATHAN &
ROGERS (1991, p.11-12) a de que a propriedade de independncia local faz mais
sentido quando todas as habilidades esto sendo medidas, por se ter realmente o espao
latente completo, logo esta propriedade pode ser aceita tambm para estudos onde no se
considera a unidimensionalidade.

2.2.3.4 Estimao dos parmetros dos itens e das habilidades dos indivduos
2.2.3.4.1 Introduo

Os mtodos de estimao dos parmetros dos itens e das habilidades dos
respondentes mais citados na literatura so:
-Mtodo da Mxima Verossimilhana para os parmetros dos itens e habilidades
separadamente, isto , primeiro se estima os parmetros dos itens com a resoluo de um
sistema de 3 equaes no-lineares e no passo seguinte as habilidades resolvendo n
(nmero de indivduos) equaes no-lineares, onde so aplicados os mtodos iterativos
29
de Newton-Raphson ou Scoring de Fisher. Este mtodo, segundo BAKER & KIM
(2004, p.53) tem mostrado para modelos abaixo de dois parmetros que bastante
robusto e sempre converge, mas no modelo de trs parmetros no muito robusto e no
converge facilmente dado que a soluo depende dos valores iniciais.
-Mtodo de Mxima Verossimilhana Conjunta para os parmetros dos itens e
habilidades, segundo HAMBLETON, SWAMINATHAN & ROGERS (1991, p.46-47)
foi muito utilizado na dcada de 70 nos primeiros programas da TRI (BICAL e LOGIST).
Na anlise de ANDRADE, TAVARES & VALLE (2.000, p.77) apresenta vrios
problemas de utilizao (indeterminao, propriedades assintticas, computacionalmente
trabalhoso, etc.), porm serviu como base para outros procedimentos.
-Mtodo da Mxima Verossimilhana Marginal, desenvolvido por Bock & Lieberman em
1970 para um modelo normal com dois parmetros segundo BOCK & AITKIN (1981
p.443-459), determina uma distribuio para as habilidades e trabalha com a
probabilidade marginal, considerando os itens independentes entre si. A partir desta
suposio estima os itens atravs de um algoritmo chamado EM (Esperana e
Maximizao) apresentado por Dempster, Laird & Rubin em 1977, citado por BOCK &
AITKIN (1981 p.444). Este mtodo o mais empregado, pois possui propriedades
assintticas para os parmetros de discriminao (a
i
) e dificuldade (b
i
) e ainda os
parmetros de acerto casual (c
i
) so consistentes. No entanto, apresenta problemas de
estimao dos parmetros dos itens quando existirem itens com acerto ou erro total e
tambm na estimao das habilidades quando respondentes acertam ou erram todos os
itens.
-Mtodo Bayesiano Conjunto (proposto por Swaminathan and Gifford, em vrios artigos
apresentados nos anos de 1982, 1985 e 1986, citados por SWAMINATHAN,
HAMBLETON, SIRECI, XING & RIZAVI (2003, p. 27-51) assume que os parmetros
de discriminao (a
i
) tem distribuio qui-quadrado, os de dificuldade (b
i
) so
independentes e identicamente distribudos com distribuio normal e os de acerto casual
(c
i
) tem distribuio beta. Na estimao utiliza-se mxima verossimilhana conjunta.
-Mtodo Bayesiano Marginal considera que o parmetro de discriminao (a
i
) tem
distribuio lognormal, de dificuldade (b
i
) so independentes e identicamente distribudos
30
com distribuio normal e o de acerto casual (c
i
) tem distribuio beta, como no mtodo
anterior. A estimao feita usando com o algoritmo EM.

2.2.3.4.2 Estimao dos parmetros dos itens

Escolheu-se o mtodo de mxima verossimilhana marginal com algoritmo EM
no desenvolvimento deste trabalho dado que vrios autores, alguns j citados, o indicam e
na maioria dos artigos pesquisados, este um dos mtodos mais utilizados e apresenta
bons resultados. Portanto, a seguir apresenta-se o seu desenvolvimento terico.

Mtodo da Mxima Verossimilhana Marginal:

O mtodo de mxima verossimilhana um mtodo estatstico para estimar um
vetor de parmetros populacionais ( ) de alguma distribuio de probabilidade f(x) a
partir da maximizao da funo de verossimilhana. A funo de verossimilhana de n
variveis aleatrias X
1
, X
2
, X
3
,...,X
n
definida em MOOD, GRAYBILL & BOES (1974,
p. 276-286), como sendo a densidade conjunta das n variveis aleatrias denotada por

=
n
1 i
i n 2 1
) | f(x = ) x ,..., x , x ; L( , onde no caso (espao paramtrico) e representa os
parmetros da distribuio. O estimador de mxima verossimilhana de o vetor


que maximiza a funo de verossimilhana L(, x ).
No caso da Teoria da Resposta ao Item, a probabilidade do respondente j acertar o
item i dado que ele possui a habilidade
j
modelada por uma funo logstica dada por:
( )
i j i
b Da
i i j ji
e
) c ( c ) | U ( P

+
+ = =

1
1
1 1 (17)
onde i = 1,..., I e j = 1,...,n sendo I o nmero de itens e n o nmero de indivduos
avaliados.
Assim, a Funo de Verossimilhana dada por:

1 = 1 = 1 =
1 = = 1 = = 1 = =
n
j
I
i
i
j ..
n
j
j . j
i
j .. j
i
) , | U ( P ) | U ( P ) , | U ( P ) , ( L (18)
31
onde | |
i i i
i
c b a = o vetor dos parmetros dos itens. A obteno deste resultado
foi possvel devido suposio de Independncia Local.
A estimao por Mxima Verossimilhana de ) , ( L
j
i
implica em derivar o
logaritmo da equao em relao ao vetor de parmetros dos itens
i
j
i
) , ( L log

e
igualar a zero para obter, no caso, um sistema constitudo de trs equaes. A estimativa
dos parmetros dos itens (
i
a ,
i
b ,
i
c ) seria imediata caso as habilidades
j
fossem
conhecidas, e poder-se- utilizar o mtodo iterativo de Newton-Raphson para resoluo
de equaes no-lineares. Porm, na maioria dos casos, as habilidades no so
conhecidas, o que implica na utilizao do Mtodo de Mxima Verossimilhana Conjunta
(parmetros dos itens e habilidades), que segundo ANDRADE, TAVARES & VALLE
(2.000, p.77) possui problemas de indeterminao.
Segundo BACKER & KIM (2004, p.158-174), em 1970 Bock e Lieberman
apresentaram uma soluo onde se assume que as habilidades dos respondentes possuem
uma funo distribuio emprica G(
j
) e se n, o nmero de indivduos, for
suficientemente grande pode-se supor que esta distribuio seja contnua e sua funo
densidade de probabilidade seja g(
j
/). Assim, pelo Teorema Central do Limite tem-se
que pode ter uma distribuio aproximadamente normal onde representa o vetor de
parmetros dado por = [
2
].
A estimao dos parmetros dos itens e habilidades na mesma mtrica feita com
base na distribuio normal padro N(0,1) em ambos os casos. Para suprimir as
habilidades da funo adota-se a marginal da distribuio conjunta de itens e habilidades
e, ainda, para garantir a propriedade de suficincia dos parmetros estimados tem-se que:
( ) ( )
j j
i
j
i
. j
d ) , ( g . , , / . Uj P , / U P

= (19)
como ) , , / . Uj ( P
i
j
no depende de = (,
2
) e ) 1 , 0 ( N ~ ) / ( g
j
temos que:
( ) ( )
j j
i
j
i
j
d g Uj P U P ) / ( . , / . , /
.

= (20)
Usando a propriedade de independncia local da TRI pode-se escrever a
probabilidade associada ao vetor de respostas U.. como:
32
( ) ( ) ( )

=

=
= =
n
1 j
j j
i
j
n
1 j
i
. j
i
..
d ) / ( g . , / . Uj P , / U P , / U P (21)
Para se obter vantagens computacionais ANDRADE, TAVARES & VALLE
(2.000, p.53) recomendam que se utilize padres de respostas ao invs de indivduos. Isto
significa dizer que j no representa mais um indivduo e sim um padro de resposta. Por
exemplo, se 5 indivduos tivessem respondido a 3 itens, como nas tabelas a seguir, tem-se
j variando de 1 a 3.

TABELA 1- EXEMPLO DE ITENS POR INDIVDUOS
ITENS
INDIVDUOS
1 2 3
1 1 0 1
2 0 1 0
3 0 0 1
4 1 0 1
5 0 1 0
FONTE: A AUTORA

TABELA 2- EXEMPLO DE ITENS POR PADRES DE RESPOSTA
ITENS
PADRES DE RESPOSTA
1 2 3
1 1 0 1
2 0 1 0
3 0 0 1
FONTE: A AUTORA

Denota-se por r
j
o nmero de indivduos com padres de respostas iguais. No
exemplo, 2 indivduos obtiveram padro de resposta r
1
, ento r
1
seria igual a 2 e
considerando os outros padres ter-se-ia r
2
= 2 e r
3
= 1. Chamando de S o nmero
mximo de padres e s min(n,S) para todo r
j
> 0 tem-se que n r
s
1 j
j
=

=
(nmero de
indivduos), ter-se-ia S = 3 e n=5.
33
Desta forma, dada a existncia de independncia entre as respostas, a distribuio
) , / .. U ( P
i
segue uma Distribuio Multinomial e a equao de verossimilhana
dada por:
( ) ( ) | |

=
=
=
s
1 j
r
i
j
s
1 j
j
i
j
, / . u P
! r
! n
, L onde j = 1, ...,s e i = 1, ..., I (22)
Aplicando-se o Mtodo de Estimao de Mxima Verossimilhana tem-se que:
( ) ( ) | |

=
=
+
|
|
|
|
.
|

\
|
=
s
j
i
j s
j
j
i
uj P r
r
n
L
1
1
, / . ln .
!
!
ln , ln (23)
e

( ) | |
0
, ln
=

i
i
L


i=1,..., I (24)
A resoluo destas equaes (ver ANDRADE, TAVARES & VALLE, 2000 p.
54-57), chega s seguintes equaes de estimao dos parmetros a
i
, b
i
e c
i
:
( )
( ) ( )


=

(

|
|
.
|

\
|

s
j
j
i i
i
i
i
i ji j
i
i
d g
Q P
W P
P u r
L
1
*
* *
, ln



(25)
derivando a equao em relao a a
i
, b
i
e c
i
obtm-se:

( ) ( )( ) | | ( )
( ) ( ) | | ( )
( ) ( )

=
(

=
=


=

=

=

s
1 j
i
*
j
*
i
i
i ji j
s
1 j
i
*
j i i ji j i i
i
s
1 j
*
j i i i ji j i
c para 0 d g .
P
W
P u r
b para 0 d g . W P u r c 1 Da
a para 0 d g . W b P u r c 1 D



(26)
onde:

( )
| |
1
b Da
i i i
i i
e 1 ). c 1 ( c P


+ + =

(27)

( )
| |
1
b Da *
i
i i
e 1 P


+ =

(28)

*
i
*
i
P 1 Q = (29)
34

( )
( )
i i
*
i
*
i
i
P 1 P
P 1 P
W

= (30)
( ) ( )
( ) ( )
( )


, | u P
| g . , | u P
, , u | g g
. j
. j
. j
*
j
= = (31)
Segundo ANDRADE, TAVARES & VALLE (2000, p.59); estas equaes envolvem
integrais que no apresentam soluo analtica e sugerem como soluo uma
aproximao com o Mtodo da Quadratura Gaussiana, tambm chamado de Mtodo de
Hermite-Gauss. Este mtodo, segundo BURDEN & FAIRES (1997, p.222-227), usa
valores da funo com igualdade nos espaos dos pontos e permite calcular por
aproximao a integral de uma funo contnua pela integrao de funes lineares (soma
de reas de trapzios) obtidos na escolha de pontos (ns de quadratura) igualmente
espaados. Os ns, por exemplo, x
1
, x
2
,...,x
n
num intervalo [a,b] e coeficientes c
1
, c
2
,..., c
n

so escolhidos de tal maneira que apresentem um mnimo de erros obtidos na
aproximao de funo arbitrria f, dado por:
( )


=
=
b
a
n
1 i
i i
x f c dx ) x ( f (32)
No caso da TRI, supe-se que a funo ( ) / g seja normalmente distribuda com
mdia zero e varincia igual a 1 (Normal Padro), pode-se usar a quadratura gaussiana,
pois sendo ela uma funo contnua com momentos finitos permite uma aproximao
com razovel grau de acurcia por uma distribuio discreta com um nmero finito de
pontos (isto , por um histograma). Ento, segundo BAKER & KIM (2004, p.164), os ns
de quadratura so dados por
k
, com k=1,2,...,q e considera os pesos iguais a
( )
k k k
. / g A = onde
1 2 k
= e a largura do intervalo entre dois pontos de
quadratura. Os pontos de quadratura
k
e os peso A
k
, de acordo com BOCK & AITKIN
(1981, p.449), so obtidos resolvendo uma coleo de equaes que se encontra numa
tabela para distribuio gaussiana no livro de Stroud, A. H. & Sechrest, D. intitulado
Gaussian Quadrature Formulas da editora Prentice-Hall de 1966. Bock & Lieberman
indicam que estes valores podem ser aproximados para uma distribuio gaussiana
padro se os ns forem multiplicados por 2 e os respectivos pesos divididos por .
Reescrevendo as equaes em termos de quadraturas fica:
35
| |

=
=
I
1 i
u
ki
u
ki
i
k . j
ji ji
Q . P ) , / u ( P (33)
fazendo

( )
| |
ki ki
1
b Da
i i ki
P 1 Q
e 1 ). c 1 ( c P
i k i
=
+ + =


(34)

e como ( )
k k k
. / g A = ento se pode escrever:

=
q
1 k
k
i
k . j
i
. j
1
k k
i
k . j k
i
k . j
A ). , / u ( P ) , / u ( P
. A ). , / u ( P ) / ( g ). , / u ( P


(35)
e

( )
1
k
q
1 k
k
i
k . j
k
i
k . j
i
. j
k
i
k . j
i
. j k k
*
j
A ) , / u ( P
A ). , / u ( P

) , / u ( P
/ g ) , / u ( P
) , , u / ( P ) ( g

= =






(36)
Na execuo do mtodo da mxima verossimilhana usa-se a notao:

( )
| |
( )
| | { }
( )
| |
( )
| |
ki ki
*
ki
*
ki
ki
1
b Da *
ki
*
ki
1
b Da *
ki
1
b Da
i i ki ki
1
b Da
i i ki
Q P
Q P
W
, e 1 1 P 1 Q
, e 1 P
, e 1 ). c 1 ( c 1 P 1 Q
, e 1 ). c 1 ( c P
i k i
i k i
i k i
i k i
=
+ = =
+ =
+ + = =
+ + =

(37)
( ) ( ) 0 g
Q P
W P
P u r
) , ( L log
s
1 j
q
1 k
k
*
j
*
ki
*
ki
ki
i
ki
ki ji j
i
i
=
(

|
|
.
|

\
|

= =

(38)
.
derivando em relao a a
i
, b
i
e c
i
obtm-se:

36
( )( ) | | ( )
( ) | | ( )
( ) ( )

=
(

=
=

= =
= =
= =
i
s
1 j
q
1 k
k
*
j
*
ki
ki
ki ji j
i
s
1 j
q
1 k
k
*
j ki ki ji j i i
i
s
1 j
q
1 k
k
*
j ki i k ki ji j i
c para 0 g .
P
W
P u r
b para 0 g . W P u r ) c 1 ( Da
a para 0 g . W b P u r ) c 1 ( D


(39)
Mais uma vez estas equaes no apresentam solues explicitas na estimao dos
parmetros dos itens, o que implica estim-los simultaneamente gerando um grande
esforo computacional (inverso de uma matriz de 3I x 3I, onde I representa o nmero de
itens).
A reformulao de BOCK & AITKIN (1981, p. 443-459) possibilitou melhor soluo
para o problema assumindo que os itens so independentes entre si, os indivduos so
independentes e que os itens e indivduos so independentes.
Esta suposio facilita os clculos, dado que a inverso do Jacobiano da matriz do
mtodo de resolues de equaes no-lineares de Newton-Raphson, se torna bloco
diagonal dado que para dois itens diferentes tem-se que:
l i para 0
) , ( L log
l i
i
2
=



(40)
As equaes em forma de quadratura so dadas a seguir derivando o logaritmo da
funo de verossimilhana e igualando a zero.
( ) ( ) 0
Q P
W P
g P r g u r
) , ( L log
q
1 k
*
ki
*
ki
ki
i
ki
s
1 j
s
1 j
k
*
j ki j k
*
j ji j
i
i
=
|
|
.
|

\
|

|
|
.
|

\
|
=


= = =


(41)
fazendo,
( )

=
=
s
1 j
k
*
j ji j ki
g u r r (42)
( )

=
=
s
1 j
k
*
j j ki
g r f (43)
ento:

37

( )| |
| |
| |

=
=
=

=
=
=
q
1 k
i
*
ki
ki
ki ki ki
q
1 k
i ki ki ki ki i i
q
1 k
i ki ki ki ki i k i
c para 0
P
W
f P r
b para 0 W f P r ) c 1 ( Da
a para 0 W f P r b ) c 1 ( D
(44)
As equaes r
ki
e f
ki
so conhecidas na literatura da TRI como dados artificiais,
e BOCK & AITKIN (1981, p.444) sugerem o emprego do algoritmo EM (Esperana e
Maximizao) de Dempster, Laird & Rubin para estimar os parmetros dos itens com as
devidas modificaes implementadas por eles.

Algoritmo EM:

O algoritmo EM, segundo BAKER & KIM (2004, p.169), um procedimento
iterativo para encontrar os estimadores de mxima verossimilhana dos modelos
probabilsticos dos parmetros da TRI em presena de variveis aleatrias no-
observveis
k
(parmetros de habilidade) com probabilidades
k
onde k varia de 1 a q
seria o nmero de pontos de quadratura adotado. O passo E representa o passo de clculo
da Esperana e o M o passo de Maximizao.
Na TRI somente o modelo de um parmetro ML-1 pertence famlia exponencial,
os modelos ML-2 e ML-3 no pertencem famlia exponencial e no possvel avaliar se
o estimador suficiente. Como um substituto, o valor esperado do logaritmo da funo
logstica condicional as variveis no observveis
k
, so tratadas como se elas fossem
conhecidas e este o passo chamado de E.
Concebendo que as habilidades so restritas para um conjunto de valores finitos, q e
estes valores (
k
) tm respectivas probabilidades
k
, e ainda, denotando como r
ki
o
nmeros de acertos do item i com quadratura k e f
ki
o nmero tentativas por indivduos
cada uma das k habilidades do item i. Se a habilidade (
k
) de n indivduos so
consideradas como amostras aleatrias para a distribuio anteriormente mencionada, a
probabilidade conjunta dada por uma distribuio multinomial a seguir.
38
( ) I 1,2,..., i ,
! f
! n
/ f P
q
1 k
f
k
q
1 k
ki
k i
ki
= =

=
=
(45)
Fazendo ( )
qi i 2 i 1
i
f ,..., f , f ' f = com f= (f
1
,f
2
,...,f
I
) , ( )
qi i 2 i 1 i
r ,..., r , r ' r = com r' =
(r
1,
r
2
,...,r
I
) e ( )
q 2 1
,..., , ' = a probabilidade de ocorrerem r
ki
acertos no item i dentre
as f
ki
tentativas por respondentes com habilidade
k
dada por:

ki ki ki
r f
ki
r
ki
ki
ki
k ki ki
Q P
r
f
) , f / r ( P

|
|
.
|

\
|
= (46)
Ento, a probabilidade conjunta de f e r dado e
k
escrita por:
P(f,r/ ' ,
k
)= P(f/ ' ,
k
).P(r/f, ' ,
k
)=
=P(f/
k
).P(r/h, ' )=
= ( ) ( )
(


= = =
I
1 i
q
1 k
k ki ki
I
1 i
k i
, f / r P . / f P (47)
Logo, o logaritmo da funo de verossimilhana dado por:
( ) ( ) ( )
( ) ( ) ( )

1 ln log ln / ' ln
, / ln / ' ln ln
1 1
1 1

= =
= =
(

+ +
|
|
.
|

\
|
+ =
+ =
I
i
q
k
ki ki ki ki ki
ki
ki
k
I
i
q
k
k ki ki k
i
P r f P r
r
f
f P
f r P f P L


(48)
Fazendo ( )

= =
|
|
.
|

\
|
+ =
I
i
q
k ki
ki
k
r
f
f P C
1 1
ln / ' ln que constante em relao a tm-se:
( ) ( ) ( ) { }

= =
+ + = =
I
i
q
k
ki ki ki ki ki
i
P r f P r C L
1 1
1 ln ln ln (49)
e como fe r no so observveis e fazendo,
( )
i
.. ki ki
, u / r E r = (50)

( )
i
.. ki ki
, u / f E f = (51)

( )
i
..
, u / C E C = (52)
39

( ) | | ( ) ( ) { }

= =
+ + =
I
i
q
k
ki ki ki ki ki
i
P r f P r C L E
1 1
1 ln ln ln (53)

A derivada do logaritmo da equao dada por:
( )
( )
( )
( )
( )
( ) ( )
( )

=
=
=
=
=
|
|
.
|

\
|


=
=
(


|
|
.
|

\
|

=
=
(


|
|
.
|

\
|

=
=
(


|
|
.
|

\
|

=
=

(
(


+
|
|
.
|

\
|

q
k
i
ki
ki ki
ki ki ki
ki ki
ki ki ki ki ki ki
q
k
i
ki
ki ki
ki ki ki ki ki
q
k
i
ki
ki
ki ki
ki
ki
q
k
i
ki
q
k
i
ki
ki
ki ki
i
ki
ki
ki
i
i
P
Q P
P f r
Q P
P r P f P r P
Q P
P r f Q r P
Q
r f
P
r
P
P
Q
r f
P
P
r
L
1
1
1
1
1

1


1 1

1 1 1
ln



(54)
Usando os resultados demonstrados no Apndice 1:
( )( )
*
ki
*
ki i k i
i
ki
Q P b c 1 D
a
P
=

(55)

( )
*
ki
*
ki i i
i
ki
Q P c 1 Da
b
P
=

(56)

*
ki
*
ki
i
ki
Q P 1
c
P
= =

(57)

e derivando a equao em relao aos parmetros dos itens obtm-se:

( )
( ) ( )
( )( ) | |
( ) ( )( )


=
= =
=
=

=
|
|
.
|

\
|

q
1 k
ki i k ki ki ki i
q
1 k
*
ki
*
ki i k i
ki ki
ki ki ki
q
1 k
i
ki
ki ki
ki ki ki
i
i
W b P f r c 1 D
Q P b c 1 D
Q P
P f r
a
P
Q P
P f r
a
L

(58)
40

( )
( ) ( )
( ) | |
( ) ( )


=
= =
=
=

=
|
|
.
|

\
|

q
1 k
ki ki ki ki i i
q
1 k
*
ki
*
ki i i
ki ki
ki ki ki
q
1 k
i
ki
ki ki
ki ki ki
i
i
W P f r c 1 Da
Q P c 1 Da
Q P
P f r
b
P
Q P
P f r
b
L
(59)

( )
( ) ( )
( )

= = =
=

=
|
|
.
|

\
|

q
1 k
*
ki
ki
ki ki ki
q
1 k
*
ki
ki ki
ki ki ki
q
1 k
i
ki
ki ki
ki ki ki
i
i
P
W
P f r Q
Q P
P f r
c
P
Q P
P f r
c
L
(60)

( ) ( )( )
( ) ( )
( )

=
=
=
=

=
=
=
i
q
1 k
*
ki
ki
ki ki ki
i
q
1 k
ki ki ki ki i i
i
q
1 k
ki i k ki ki ki i
c para 0
P
W
P f r
b para 0 W P f r c 1 Da
a para 0 W b P f r c 1 D
F

(61)

Finalmente resolvendo este sistema de equaes no lineares (F) atravs do Mtodo
de Newton-Raphson com intuito de obter as estimativas dos parmetros dos itens, o passo
M ter sido feito.
O Mtodo de Newton-Raphson um mtodo iterativo e segundo BURDEN &
FAIRES (1997, p.601), geralmente esperado que d convergncia quadrtica, contanto
que seja fornecido um valor inicial suficientemente prximo do alvo e que o Jacobiano da
matriz exista. Assim, resolve-se o sistema:
F=

3
2
1
F
F
F
(62)
por

( )
( )
( )
( )
( )
( )
( )
( )
( )
(
(
(

+
(
(
(

=
(
(
(

1 t
i
1 t
i
1 t
i
1 t
i
1 t
i
1 t
i
t
i
t
i
t
i
z
y
x
c
b

a
c
b

a
(63)
onde
41
( )
( )
( )

c
b

a
1 t
i
1 t
i
1 t
i
(
(
(

a matriz dos valores dos parmetros dos itens na iterao t-1


e
( )
( )
( )
( ) ( ) ( )
( ) | |
( ) ( ) ( )
( )
1 t
i
1 t
i
1 t
i
1
1 t
i
1 t
i
1 t
i
1 t
i
1 t
i
1 t
i
c , b

, a F c , b

, a J
z
y
x

=
(
(
(

(64)

sendo
( ) ( ) ( )
( )
1 t
i
1 t
i
1 t
i
c , b

, a J

o Jacobiano da matriz dada por:


( ) ( ) ( )
( )
(
(
(
(
(
(
(

=

i
3
i
3
i
3
i
2
i
2
i
2
i
1
i
1
i
1
1 t
i
1 t
i
1 t
i
c
F
b
F
a
F
c
F
b
F
a
F
c
F
b
F
a
F
c , b

, a J (65)
sendo que,

( ) ( )
( ) | |
( ) ( ) ( )

=
=
(

=
=

k
1 i
i
ki
ki ki
i
ki
ki ki ki i k i
k
1 i
i
ki ki ki ki
i k i
i
1
a
P
W f
a
W
P . f r b c 1 D
a
W P . f r
b c 1 D
a
F

(66)

( )
( ) | |
( ) ( )

=
=
(

=
=

k
1 i
i
ki
ki ki
i
ki
ki ki ki i i
k
1 i
i
ki ki ki ki
i i
i
2
b
P
f W
b
W
P . f r c 1 Da
b
W P . f r
c 1 Da
b
F
(67)

42

( )
( )
( )

=
=
=
)
`


=
=

(
(
(
(

=
=

k
1 i
i
ki
ki ki
i
ki
*
ki
ki ki ki
k
1 i
i
ki
ki *
ki
ki
*
ki
i
*
ki
ki
i
ki *
ki
ki ki ki
k
1 i
i
*
ki
ki
ki ki ki
i
3
b
P
f W
b
W
P
P . f r

b
P
f
P
W
P
c
P
W
b
W
P
P . f r
c
P
W
P . f r
c
F
(68)
pelos resultados obtidos nos Apndices 1 e 2:
( )( )
*
ki
*
ki i k i
i
ki
Q P b c 1 D
a
P
=

(69)
( )
( )
i
ki
i
*
ki
*
ki i k
i
*
ki
a
P
c 1
1
Q P b D
a
P

= =

(70)
( )
( )
( )
i
ki
ki ki i
*
ki
ki ki
i
ki
a
P
Q P
1
c 1
P 2 1
P 2 1 W
a
W

+ =

(71)
( )
*
ki
*
ki i i
i
ki
Q P c 1 Da
b
P
=

(72)
( )
i
ki
i
*
ki
*
ki i
i
*
ki
b
P
c 1
1
Q P Da
b
P

= =

(73)
( )
( )
( )
i
ki
ki ki i
*
ki
ki ki
i
ki
b
P
Q P
1
c 1
P 2 1
P 2 1 W
b
W

+ =

(74)
*
ki
*
ki
i
ki
Q P 1
c
P
= =

(75)
0
c
P
i
*
ki
=

(76)
( )
( )
( )
( )
( )
( )
ki i
*
ki
ki ki
i
ki
ki ki i
*
ki
ki ki
i
ki
P
1
c 1
P 2 1
P 2 1 W
c
P
Q P
1
c 1
P 2 1
P 2 1 W
c
W
(

+ =
=

+ =

(77)

43
Assim fornecendo-se um vetor inicial obtidos para cada ponto de quadratura k
( )
( )
( )
(
(
(

0
i
0
i
0
i
c
b

a
consegue-se o vetor estimado para cada item, pela resoluo da equao
( )
( )
( )
( )
( )
( )
( )
( )
( )
(
(
(

+
(
(
(

=
(
(
(

1 t
i
1 t
i
1 t
i
1 t
i
1 t
i
1 t
i
t
i
t
i
t
i
z
y
x
c
b

a
c
b

a
onde t a iterao e volta-se ao passo E at que um critrio de
parada seja estabelecido.
No caso deste trabalho o critrio mais indicado, segundo BURDEN & FAIRES
(1997, p.600) dado por:

( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
<
(
(
(

(
(
(

=
(
(
(

(
(
(

1 t
i
1 t
i
1 t
i
t
i
t
i
t
i
1 t
i
1 t
i
1 t
i
t
i
t
i
t
i
c
b

a
c
b

a
max
c
b

a
c
b

a
onde
(
(
(

2
2
2
10
10
10
(78)

Resumidamente o algoritmo EM feito nos seguintes passos:
E: Usam-se os pontos de quadratura
k
com os respectivos pesos A
k
para fazer
estimativas iniciais dos parmetros dos itens
i

com o intuito de determinar os


valores ( )
k
*
j
g e para gerar os valores
ki
r e
ki
f .
M: Resolve-se o sistema de equaes usando o algoritmo de Newton-Raphson.
Os passos so repetidos at que o critrio de parada seja alcanado.
Os procedimentos usados na estimao do Modelo Logstico de Dois Parmetros
semelhante ao apresentado para o Modelo Logstico de Trs Parmetros. A seguir se
far uma breve descrio dos procedimentos.
O Modelo Logstico de Dois Parmetros, no possui o parmetro de acerto casual
(c
i
)e dado por:

( )
i j i
b a j ji
e
) / U ( P
-
+ 1
1
= 1 =

(79)
onde
P(U
ji
=1/
j
) = probabilidade do respondente j acertar o item i dado que ele possui uma
habilidade
j
.
U
ji
= resposta dada pelo respondente j ao item i.
44

j
= habilidade ou trao latente do respondente j.
a
i
= parmetro de discriminao do item i.
b
i
= parmetro de dificuldade do item i.
Segundo, BAKER & KIM (2004, p. 333) por questes de convenincia feita a
seguinte parametrizao:

j i i ij
a d Z + = (80)
O implica que d
i
o intercepto e a
i
o grau de inclinao. O parmetro de
dificuldade ser obtido por:

i
i
i
a
d
- b = (81)
Portanto, os parmetros estimados sero a
i
e d
i
e no final obtm-se b
i
atravs da
equao 81.
O sistema de equaes a ser resolvido dado por:
( )
( )

=
=
=

=
=
i
q
1 k
i
q
1 k
d para 0 -
a para 0 -
k ki ki ki
ki ki ki
X P f r
P f r
F (82)
Sendo:

k i i
X a d - ki
e
P
+
+ 1
1
= (83)
Q
ki
= 1- P
ki
(84)
Derivando as equaes em relao a a
i
e d
i
obtm-se:

=
=

q
k
ki ki ki
i
X Q P
a
F
1
2
ki
1
f - (85)

=
=

q
k
ki ki ki
i i
X Q P
a
F
d
F
1
ki
2 1
f - (86)

=
=

q
k
ki ki
i
Q P
d
F
1
ki
1
f - (87)
Aplicando o algoritmo EM ,como demonstrado para trs parmetros, obtm-se as
estimativas de a
i
e d
i
, retoma-se a equao 80 e encontra-se o parmetro de dificuldade
b
i
.
45
Na seo seguinte apresentam-se alguns mtodos de estimao das habilidade (
j
)
dos indivduos.

2.2.3.4.3 Estimao das habilidades dos indivduos.

A estimao das habilidades feita considerando-se os parmetros dos itens j
calibrados e segundo TAVARES (2001, p. 44) os principais modelos de estimao das
habilidades so o por mxima verossimilhana e os baysianos. Apresentadas nas
prximas sees.

2.2.3.4.3.1 Estimao por mxima verossimilhana.

Assumindo a independncia entre as respostas de diferentes indivduos e a
independncia local, segundo ANDRADE, TAVARES & VALLE (2000, p. 44), a
estimao por mxima verossimilhana aplicada na equao que segue.
( ) ( ) | |

= =
+ =
n
j
I
i
ji ji ji ji
Q u P u L
1 1
ln 1 ln ln (88)
Onde j volta a ser o nmero de indivduos. Derivando a equao anterior obtm-se
(resoluo apresentada no Apndice 3):

( )
( )( )

=
= =

I
i
ji ji ji i i
j
W P u c a D
L
1
0 1
ln


(89)
E, utilizando o mtodo de Newton-Raphson novamente, dado que a equao no
apresenta soluo explicita.
Fazendo,
( )( )

=
=
I
1 i
ji ji ji i i j
W P u c 1 a D ) ( F (90)

( )
( )
( )
( ) ( ) ( )
( ) | |
( )
( )
( )
( )
( )
( ) | |
1 t
n
1 t
2
1 t
1
1
1 t
n
1 t
2
1 t
1
1 t
n
1 t
2
1 t
1

,...,

J
y
y
y

=
(
(
(
(
(

L
M
(91)
sendo
( ) ( ) ( )
( )
1 t
n
1 t
2
1 t
1

,...,

J

o Jacobiano da matriz dada por:
46

( ) ( ) ( )
( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
(
(
(
(
(
(
(
(

=

n
n
n
2
n
1
n
n
2
2
2
1
1
n
1
2
1
1
1 t
n
1 t
2
1 t
1
F F F
F F F
F F F
det

,...,


L
M O M M
L
L
(92)
Considerando a habilidade de um indivduo no depende da habilidade de outro o
Jacobiano da matriz se torna bloco diagonal e fica:
( ) ( ) ( )
( )
( )
( )
( )
(
(
(
(
(
(
(
(

=

n
n
2
2
1
1
1 t
n
1 t
2
1 t
1
F
0 0
0
F
0
0 0
F
det

,...,


L
M O M M
L
L
(93)
onde

( ) ( )
( )
2
j i
j i
2
i
i j i 2
i
j
j
1
P
Q
c 1
c ) ( P
a * D
F

(94)
Assim fornecendo um vetor inicial
( )
( )
( )
(
(
(
(
(

0
n
0
2
0
1

M
obtm-se um vetor estimado para as
habilidades dos indivduos pela resoluo de
( )
( )
( )
(
(
(
(
(

t
n
t
2
t
1

M
=
( )
( )
( )
(
(
(
(
(

1 t
n
1 t
2
1 t
1

M
+
( )
( )
( )
(
(
(
(
(

1 t
n
1 t
2
1 t
1
y
y
y
M
at que um critrio
de parada seja estabelecido, que no caso pode ser dado por:
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
(
(
(
(
(

= <
(
(
(
(
(

(
(
(
(
(

=
(
(
(
(
(

(
(
(
(
(

3
3
3
1 t
n
1 t
2
1 t
1
t
n
t
2
t
1
1 t
n
1 t
2
1 t
1
t
n
t
2
t
1
10
10
10

max

M M M M M

. (95)

47
2.2.3.4.3.2 Estimao modal bayesiana ou maximum a posteriori (MAP).

De acordo com BAKER & KIM (2004, p. 192) a habilidade dos respondentes
obtida com o mximo da distribuio normal ) ( g
*
j
com parmetros populacionais
conhecidos dada por:

) , | (
) | ( ) , | (
) (
..
.. *

j
j j j
j j
U P
g U P
g = (96)
Assim, segundo TAVARES (2001, p. 45) a equao de estimao dada por:
0
) | ( ln ) , | ( ln ) ( ln
..
*
=

j
j
j
j j
j
j j
g U P g


(97)
Logo, pela independncia local tem-se que:


= =
=
(

=
I
i
j i ji
I
i
j i ji j j
U P U P U P
1 1
..
) , | ( ln ) , | ( ln ) , | ( ln (98)
Derivando a equao acima em relao s habilidades
j
e usando conceitos e
expresses citadas anteriormente na estimao dos itens tem-se uma expresso j
apresentada na estimao por mxima verossimilhana dada por:

=
=

I
i
ji ji ji i i
j
j j
W P u c a D
U P
1
..
) )( 1 (
) , | ( ln


(99)
e ainda adotando a distribuio normal a priori para
j
, segundo ANDRADE,
TAVARES & VALLE (2000, p. 74), a segunda parcela :

( )
2
) | ( ln

j
j
j
g
(100)
e a equao de estimao de
j
a apresentada a seguir.
( ) ( )


I
i
j
ji ji ji i i j
W P u c a D
1
2
) (
. . 1 :


(101)
Utilizando, mais uma vez a resoluo de Newton-Raphson do sistema de equaes
no-lineares tem-se que a segunda derivada da equao em relao
j
dada por:
Fazendo,
48
( )( )
2
j
I
1 i
ji ji ji i i j
) (
W P u c 1 a D ) ( F


=

=
(102)

( )
( )
( )
( ) ( ) ( )
( ) | |
( )
( )
( )
( )
( )
( ) | |
1 t
n
1 t
2
1 t
1
1
1 t
n
1 t
2
1 t
1
1 t
n
1 t
2
1 t
1

,...,

J
y
y
y

=
(
(
(
(
(

L
M
(103)
sendo
( ) ( ) ( )
( )
1 t
n
1 t
2
1 t
1

,...,

J

o Jacobiano da matriz dada por:

( ) ( ) ( )
( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
(
(
(
(
(
(
(
(

=

n
n
n
2
n
1
n
n
2
2
2
1
1
n
1
2
1
1
1 t
n
1 t
2
1 t
1
F F F
F F F
F F F
det

,...,


L
M O M M
L
L
(104)
Considerando a habilidade de um indivduo no depende da habilidade de outro o
Jacobiano da matriz se torna bloco diagonal:
( ) ( ) ( )
( )
( )
( )
( )
(
(
(
(
(
(
(
(

=

n
n
2
2
1
1
1 t
n
1 t
2
1 t
1
F
0 0
0
F
0
0 0
F
det

,...,


L
M O M M
L
L
(105)
onde

( ) ( )
( )
2
j i
j i
2
i
i j i 2
i
j
j
1
P
Q
c 1
c ) ( P
a * D
F

(106)
49
Assim fornecendo um vetor inicial
( )
( )
( )
(
(
(
(
(

0
n
0
2
0
1

M
obtm-se um vetor estimado para as
habilidades dos indivduos pela resoluo de
( )
( )
( )
(
(
(
(
(

t
n
t
2
t
1

M
=
( )
( )
( )
(
(
(
(
(

1 t
n
1 t
2
1 t
1

M
+
( )
( )
( )
(
(
(
(
(

1 t
n
1 t
2
1 t
1
y
y
y
M
at que um critrio
de parada seja estabelecido. Que no caso pode ser dado por:
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
(
(
(
(
(

= <
(
(
(
(
(

(
(
(
(
(

=
(
(
(
(
(

(
(
(
(
(

3
3
3
1 t
n
1 t
2
1 t
1
t
n
t
2
t
1
1 t
n
1 t
2
1 t
1
t
n
t
2
t
1
10
10
10

max

M M M M M

. (107)

2.2.3.4.3.3 Estimao bayesiana da mdia a posteriori ou expected a posteriori (EAP).

A estimao de
j
neste caso feita diretamente, sem necessitar de nenhum
mtodo iterativo. Segundo BAKER & KIM (2004, p.193) o estimador baseia-se na forma
do teorema de Bayes de ) ( g
j
*

dado por:

) , | (
) | ( ) , | (
) (
..
.. *

j
j j j
j j
U P
g U P
g = (108)
Dada a concepo de independncia local probabilidade do respondente j
responder o instrumento dado por:
( ) ( )

=
n
1 i
u 1
j i
u
j i j j
ji ji
Q P ) , | U ( P (109)
No denominador tem-se que:
( ) d g ) | U ( P ) U ( P
j j

= (110)
Desta forma a esperana a posteriori de
j
, dado
j
U :
50
( )
( ) ( ) ( )
( ) ( ) ( )

=
n
i
u
j i
u
j i
n
i
u
j i
u
j i j
j j
d Q P g
d Q P g
U E
ji ji
ji ji
1
1
1
1
.
.
, |


(111)
Utilizando as aproximaes das integrais na forma de quadratura obtem-se:

=
=
= =
nq
1 k
k k k
nq
1 k
k k k
j j j
) X ( A ) X ( L X
) X ( A ) X ( L X
) , U | ( E

(112)
onde ( )
k
X A so os pesos ajustados para valores fixos de
k
X produzidos na estimao
dos itens no final de cada etapa EM e ( )
k
X L dado por:
( )

=

=
n
1 i
u 1
k i
u
k i k
ji ji
) X ( Q ) X ( P X L (113)

2.2.4 Clculo do Escore Verdadeiro.

O clculo do escore verdadeiro dos respondentes obtido a partir dos parmetros
estimados da TRI (
j i i i

e c , b

, a ), onde j representa o respondente e i o item, sendo que


este ltimo varia de 1 a I-r, onde I corresponde ao total de itens e r o nmero de itens que
no se ajustaram ao modelo(itens ruins) e j o respondente. Assim, o escore verdadeiro EV
j

dado por:

=
=
r I
1 i
j i i i j
)

, c , b

, a ( P EV (114)
onde,

)

(
1
1
) 1 ( )

, ,

, (
i j i
b a D
i i j i i i
e
c c c b a P

+
+ =

(115)
Para uma melhor interpretao dos valores obtidos nos escores verdadeiros pode-
se dividir o valor encontrado pelo nmero de itens que selecionados na anlise, isto , o
total de (I-r) itens. Dessa maneira fica-se uma escala de valores de 0 a 1.
Como as habilidades
j
tambm so estimadas somente pelos itens considerados
bons, os escores verdadeiros dos respondentes tero mais consistncia e o respondente
ser melhor avaliado pelo teste.
51

2.3 ANLISE FATORIAL
2.3.1 Introduo

A Anlise Fatorial foi desenvolvida pelo psiclogo Charles Spearman a mais de
100 anos atrs quando notou, observando escores de crianas em idade escolar, que estas
tinham uma grande variedade de similaridades aparentemente sem conexo, mas que
poderiam ser postuladas em uma habilidade mental geral, denotada por g, formando a
base e moldando o desempenho cognitivo humano, isto , as habilidades matemticas,
verbais, artsticas, raciocnios lgicos, etc. Assim, estas habilidades seriam explicadas por
uma nica medida chamada fator de inteligncia geral (g). Raymond Cattell expandiu
esta idia. A princpio desenvolveu uma teoria com dois fatores de inteligncia, e depois
de verificar a performance de seus prprios testes apresentou a teoria de multifatores para
explicar inteligncia. A teoria de Cattell props fatores alternativos no desenvolvimento
intelectual, incluindo fatores de motivao e psicolgicos. Cattell alm de desenvolver
vrios mtodos matemticos para ajustamentos grficos psicomtricos, era defensor forte
de Anlise Fatorial e Psicometria. Ele acreditou que toda a teoria deveria ser derivada da
pesquisa que apia o uso contnuo de observaes empricas e testes, objetivando estudar
inteligncia humana (Wikipedia, http://en.wikipedia.org/wiki/Factor_analysis consultado
em abril de 2005).
O termo Anlise Fatorial foi introduzido primeiro por Thurstone em 1931
(Electronic Statistics Textbook, http://www.statsoft.com/textbook/stfacan.html consultado
em abril de 2005). Para exemplificar o propsito desta anlise suponha que se queira
medir a satisfao de pessoas com suas vidas. Aplica-se um questionrio de satisfao
com vrios itens; um dos quais seria, o quanto satisfeito ele est com suas atividades de
lazer (item 1) e como intensamente ele est procurando uma destas atividades (item 2).
Provavelmente, as respostas para os dois itens so altamente correlacionadas. Dado que
h uma correlao alta entre os dois itens, pode-se concluir que eles so bastante
redundantes e as duas variveis correlacionadas poderiam resultar em um fator, isto
ilustra bem a idia bsica da anlise fatorial. Se o exemplo fosse estendido para mais
variveis, o princpio bsico de expressar duas ou mais variveis por fatores, reduz o
52
espao de atributo de um nmero grande de variveis para um nmero menor de fatores e
como tal um procedimento independente, isto , nenhuma varivel dependente
especificada.
Segundo HAIR, ANDERSON, TATHAM & BLACK (2005, p.91), a Anlise
Fatorial analisa a estrutura da correlao entre as variveis em estudo (itens de testes,
respostas em questionrios, etc.) definindo um conjunto de dimenses latentes comuns
chamadas fatores. Ela uma tcnica de interdependncia na qual so consideradas todas
as variveis, de tal modo que os fatores so formados para maximizar seu poder de
explicao do conjunto inteiro de variveis.
O foco maior das tcnicas de anlise fatorial condensar a informao contida em
diversas variveis originais em um conjunto menor (fatores) com uma perda mnima de
informao, mas com a vantagem de no haver correlao entre os fatores. Assim, dois
objetivos maiores podem ser alcanados: reduzir o nmero de variveis e descobrir a
estrutura nas relaes entre variveis.
No curso do desenvolvimento terico da Anlise Fatorial que segue nas prximas
sees, ser dada nfase aos procedimentos utilizados neste trabalho.

2.3.2 Conceitos Fundamentais e Pressupostos Bsicos

A primeira tcnica em Anlise Fatorial usada, originada a partir de dois trabalhos
de Charles Edward Spearman: General intelligence objectively determined and
mesured, publicado no American Journal of Psychology 15, pginas 201 a 293, de 1904
e no livro The Abilities of Man, their nature and measurement da editora Macmillan de
1927, gerou varias outras. Porm a mais comumente usada a Anlise Fatorial,
utilizando Componentes Principais, desenvolvida por Karl Pearson em 1901, atravs do
artigo publicado na Philosophical Magazine, 2 pginas 559 a 572 intitulado On lines
and planes of closest fit to a system of points in space, e completada por Harold
Hotelling em Analysis of a complex of statistical variables into principal components,
pginas 417 a 441 e 498 a 520, no Journal of Educational Psychological nmero 24
datado de 1933 A Anlise de Componentes Principais (PCA) apresentada a seguir resolve
um problema semelhante para o problema de Anlise Fatorial Comum, que foi
53
introduzida pelo psiclogo Charles Edward Spearman, enquanto que a Anlise de
Componentes Principais (PCA - Principal Components Analysis) foi desenvolvida por
um estatstico. PCA declara e resolve um problema estatstico bem definido, e com
exceo de casos especiais sempre d uma soluo muito boa com a vantagem de possuir
algumas propriedades matemticas bem consistentes. Pode-se descrever at problemas
prticos muito artificiais para os quais PCA prov a soluo exata (FURTADO, 1999,
p.37).
A Anlise de Componentes Principais, segundo CHAVES NETO (2004, p.17),
procura explicar a estrutura de covarincia da matriz de dados (X) atravs de
combinaes lineares (Y) no correlacionadas das p variveis originais. Embora p
componentes sejam necessrias para reproduzir a variabilidade total do sistema,
freqentemente muito desta variabilidade pode ser explicada por um nmero pequeno, k,
de componentes principais. Neste caso, existe quase a mesma quantidade de informao
nas k componentes que nas p variveis originais. As k componentes principais podem
ento substituir as p variveis originais e, o conjunto de dados originais que consiste de n
medidas das p variveis, reduzido para um formado por n medidas das k componentes
principais.
Nas componentes principais da populao, algebricamente, as componentes so
combinaes lineares particulares das p variveis X
1
, X
2
,..., Xp. No entanto,
geometricamente, elas representam a seleo de um novo sistema de coordenadas obtidas
por rotao do sistema original com X
1
, X
2
, ... , X
p
como eixos. Os novos eixos Y
1
, Y
2
, ...
,Y
p
representam as direes com variabilidade mxima e fornecem uma descrio mais
simples e mais parcimoniosa da estrutura de covarincia.
As componentes principais dependem da matriz de covarincias (ou da matriz
de correlao ) das v.as X
1
, X
2
,...,X
p
. O seu desenvolvimento no necessita da suposio
de Gaussianidade. Por outro lado, a anlise de componentes principais obtidas de
populaes normais multivariadas tem sua interpretao usual em termos de elipsides de
densidade constante. A figura 11 a seguir mostra as direes de eixos ortogonais originais
(X
i
) e dos eixos ortogonais das componentes principais (Y
i
) colocados nas direes de
maior variabilidade.

54











FIGURA 11- INTERPRETAO GEOMTRICA DAS
COMPONENTES PRINCIPAIS

Seja o vetor aleatrio denotado por X= [X
1
, X
2
,...,X
p
] e que tem vetor de mdias
E(X) = e matriz de covarincia V(X) = com os autovalores
1

2
...
p
0, ento
se obtm as combinaes lineares (Y) dadas por:
Y
1
= c
1
X = c
11
X
1
+ c
21
X
2
+ ... +c
p1
X
p

Y
2
= c
2
X = c
12
X
1
+ c
22
X
2
+ ... +c
p2
X
p



M
Y
p
= c
p
X = c
1p
X
1
+ c
2p
X
2
+ ... +c
pp
X
p
(116)
onde
p
C
p =
(
(
(
(
(

pp p 2 p 1
2 p 22 12
1 p 21 11
c ... c c
... ... ... ...
c ... c c
c ... c c

Logo, tem-se Y =
(
(
(
(
(

p
2
1
Y
...
Y
Y
=
(
(
(
(
(

pp p 2 p 1
2 p 22 12
1 p 21 11
c ... c c
... ... ... ...
c ... c c
c ... c c
(
(
(
(
(

p
2
1
X
...
X
X
=
p
C
p
X

e das propriedades
de esperana e varincia de variveis aleatrias multivariadas tem-se que:

E(Y
i
) = E(c
i
X) = c
i
E(X) = c
i
(117)
V(Y
i
) = V(c
i
X) = c
i
V(X)c
i
= c
i
c
i
(118)
Y
1
Y
2
X
1
X
2
55
COV(Y
i
,Y
k
) = c
i
c
k
(119)
COV(Y
p
) = V(
p
C
p
X) = CC (120)

As componentes principais so as combinaes lineares no-correlacionadas Y
1
,
Y
2
, ... ,Y
p
cujas varincias so to grandes quanto possveis, assim a primeira componente
principal a combinao linear com varincia mxima, ou seja, aquela que maximiza
V(Y
1
) = V(c
1
X) sujeito restrio c
1
c
1
= 1 (vetor de comprimento unitrio); a segunda
componente principal a combinao linear que maximiza V(Y
2
) = V(c
2
X) sujeito
restrio c
2
c
2
=1 e assim sucessivamente at a p-sima componente principal, que a
combinao linear que maximiza V(Y
p
) = V(c
p
X) sujeito restrio c
p
c
p
=1.
Suponha que
pxp
B seja uma matriz positiva definida com autovalores
0 ...
p 2 1
> associados aos autovetores normalizados
p 2 1
e ,..., e , e . Ento
1
0 x
x ' x
x B ' x
mx =

obtido quando
1
e x =
e assim sucessivamente at
p
0 x
x ' x
x B ' x
mx =

obtido quando
p
e x =
Alm disso,
1 k
e ,..., e x
x ' x
x B ' x
mx
k 1
+

= obtido quando
1 k
e x
+
= , com k = 1, 2, ..., p-1.
Assim, seja
pxp
P uma matriz ortogonal, cujas colunas so os autovetores
p 2 1
e ,..., e , e e seja uma matriz diagonal com autovalores
p 2 1
,... , ao longo de sua
diagonal. Seja ' P P B
2 / 1 2 / 1
= e x P y = . Conseqentemente, x 0 implica y 0.
Ento,
{
1
p
1 i
2
i
p
1 i
2
i
1
p
1 i
2
i
p
1 i
2
i i 2 / 1 2 / 1
I
2 / 1 2 / 1
y
y
y
y
y ' y
y ' y
y ' y
x P P ' P P ' x
x ' PP ' x
x B B x
x ' x
x B ' x
pxp


= = =

= =

=
=
=
=
(121)
trocando-se
56
x =
1
e tem-se
(
(
(
(

= =
0
0
1
e ' P y
.
.
1
M
, pois

=
=
1 k , 0
1 k , 1
e ' e
1 k
. (122)
Para esta escolha de x ,
1
1
1 y ' y
y ' y


= = , ou
1 1 1
1 1
1 1
e B ' e
e ' e
e B ' e
= = . Um argumento
similar produz a segunda parte.
Agora x = P y =
p p 2 2 1 1
e y ... e y e y + + + , como x
k 1
e ,..., e implica
k i , y e ' e y ... e ' e y e ' e y x ' e 0
i p i p 2 i 2 1 i 1 i
= + + + = =
Portanto, para x perpendicular aos primeiros k autovetores
i
e , tem-se:

+ =
+ =
=
p
1 k i
2
i
p
1 k i
2
i i
y
y
x ' x
x B ' x

(123)
Tomando 0 y ... y , 1 y
p 2 k 1 k
= = = =
+ +
, obtem-se o mximo declarado.
Seja a matriz de covarincias associada ao vetor aleatrio X= [X
1
, X
2
, ... ,X
p
]
com pares de autovalor-autovetor dados por (
1
, e
1
),(
2
, e
2
), ... ,(
p
, e
p
) onde
1

2
...

p
0; tem a i-sima componente principal dada por Y
i
= e
i
X e tem V(Y
i
) = e
i
e
i
=
i

e cov(Y
i
, Y
k
) = 0 i k. Ento, se algum
i
igual a outro, na escolha do correspondente
vetor de coeficientes e
i,
Y
i
ento ele no nico.
Fazendo B = , tem-se:
1
0 l
'
'
mx

l l
l l
(obtido quando
1
e = l )
Se os autovetores so normalizados, 1 e ' e
1 1
= , ento
1
0 l
'
'
mx

l l
l l
) Y ( Var e ' e
e ' e
e ' e
1 1 1
1 1
1 1
= = =


Similarmente,
1 k
e ,..., e , e l
'
'
mx
k 2 1
+

l l
l l
, k = 1, 2, ..., p-1
Para a escolha de
1 k
e
+
= l , com 0 e ' e
i 1 k
=
+
, para i = 1, 2, ..., k e k = 1, 2, ..., p-1,
57
) Y ( Var e ' e
e ' e
e ' e
1 k 1 k 1 k
1 k 1 k
1 k 1 k
+ + +
+ +
+ +
= =

(124)
No entanto, da definio de autovalor e autovetor, tem-se:
1 k 1 k 1 k 1 k 1 k 1 k 1 k 1 k 1 k
) e ' e ( ) e ( ' e ) e ( ' e
+ + + + + + + + +
= = = (125)
Portanto,
1 k 1 k
) Y ( Var
+ +
= .
Resta mostrar que
1
e perpendicular a
k
e , dado que 0 ) Y , Y ( Cov
k i
= . Os
autovetores de so ortogonais se todos os autovalores
p 2 1
,..., , so distintos. Se os
autovalores no so todos distintos, os autovetores correspondentes aos autovalores
comuns podem ser escolhidos ortogonais. Ento, para quaisquer dois autovetores
i
e e
k
e , 0 e ' e
k i
= , i k. Desde que
k k k
e e = , a pr-multiplicao por ' e
i
leva a
0 e ' e e ' e e ' e ) Y , Y ( Cov
k i k k k i i i k i
= = = = para i k, como se queria demonstrar.
As componentes principais podem ser obtidas, tambm, de v.as padronizadas, ou
seja, de Z
i
=
ii
i i
X


i = 1,2, ... ,p que em notao matricial Z = (V
1/2
)
-1
[X - ] onde
V
1/2
a matriz desvio padro, dada por:
V
1/2
=
(
(
(
(
(

pp
22
11
0 0 0
0 ... 0 0
0 0 0
0 0 0

=
(
(
(
(
(

p
2
1
0 0 0
0 0 0
0 0 0
0 0 0

O
(126)
Verifica-se facilmente que sendo E(Z) = 0 ento V
1/2
V
1/2
= , as componentes
principais de Z podem ser obtidas dos autovalores e autovetores da matriz de correlao
de X.
Para se obter as componentes principais a partir da amostra dada por x
1
, x
2
,...,x
n

que so n observaes do vetor aleatrio X p-dimensional com vetor de mdias e matriz
de covarincia , usa-se a matriz de covarincia amostral S ou a matriz de correlao
amostral R. Ento as componentes principais da amostra so determinadas a partir dessas
matrizes e so definidas como as combinaes lineares que maximizam a varincia
amostral. Sendo assim, com S como a matriz de covarincia amostral de ordem pxp com
58
os pares de autovalor-autovetor (
1

,
1
e ),(
2

,
2
e ), ... ,(
p

,
p
e ) onde
1

...
p

0, a
i-sima componente principal amostral dada por
Y

i
=
i

x

=
1i
x
1
+
2i
x
2
+ ... +
pi
x
p
i = 1,2, ... ,p
.
(127)

A varincia amostral de
k
Y

dada por
k


onde k = 1, 2,..., p e valem os resultados
provados para a situao populacional considerando o contexto amostral.
O modelo usado neste trabalho requer, ainda, duas condies importantes que so:
linearidade e ortogonalidade. Segue o desenvolvimento do modelo ortogonal.

2.3.3 O Modelo de Anlise Fatorial Ortogonal

Seja a varivel aleatria observvel X com p componentes e oriunda de uma
distribuio com mdia e matriz de covarincia . O modelo fatorial postula que X
linearmente dependente sobre algumas variveis aleatrias no observveis F
1
, F
2
, ..., F
m
,
chamadas fatores comuns e p fontes de variao aditivas
1
,
2
, ...,
p
, chamadas erros ou,
algumas vezes, fatores especficos, dados por:
X
1
-
1
= l
11
F
1
+ l
12
F
2
+ ... + l
1m
F
m
+
1
X
2
-
2
= l
21
F
1
+ l
22
F
2
+ ... + l
2m
F
m
+
2
M
X
i
-
i
= l
i1
F
1
+ l
i2
F
2
+ ... + l
im
F
m
+
i
(128)

M
X
p
-
p
= l
p1
F
1
+l
p2
F
2
+ ... +l
pm
F
m
+
p

ou em notao matricial como
1 px 1 mx
pxm
1 px
F L X + =
O coeficiente l
ij
chamado peso ou carregamento na i-sima varivel do j-simo
fator, tal que a matriz L de dimenso (p x m) a matriz de carregamento dos fatores.
Note que o fator especfico ou erro
i
associado somente com a i-sima resposta X
i
. Os
desvios X
1
-
1
, X
2
-
2
, ..., X
p
-
p
so expressos em termos de p+m variveis aleatrias:
F
1
, F
2
, ...,

F
m
,
1
,
2
, ...,
p
que no so observveis (latentes).
Assumindo que:

59
E(F) = 0
1 mx
, cov(F) = E(FF) = I
m
(129)

E() = 0
1 px
, cov() = E() =
(
(
(
(
(
(

=
p
3
2
1
pxp
... 0 0 0
... ... ... ... ...
0 ... 0 0
0 ... 0 0
0 ... 0 0

(130)
e com F e independentes, tem-se que cov (,F) = E(,F) =
pxp
0 com m=p, assim com
estas suposies pode-se construir o Modelo Fatorial Ortogonal com m fatores comuns
como:

1 px
1 mx pxm
1 px
F L X + = (131)
com m < p e, onde
i
= mdia da varivel i; i = 1, 2, 3, ..., p
i
= i-simo fator especfico
j
F = j-simo fator comum; j = 1, 2, 3, ..., m
ij
l = carregamento da i-sima varivel no j-simo fator
Os vetores aleatrios no observveis F e satisfazem as seguintes
propriedades:
- F e so independentes
- E( F ) = 0 , Cov( F ) = I
- E( ) = 0 , Cov( ) = , onde uma matriz diagonal com a
varincia especfica
i
na diagonal principal
Considerando a matriz covarincia de X e voltando ao modelo fatorial ortogonal
tem-se que:
(X - ) (X - ) = (LF + ) (LF + )
= (LF + ) ((LF) + ) =
= LF(LF) + (LF) + LF + (132)
a matriz de covarincia de X :

60
= cov (X) = E(X - ) (X - )= E[LF(LF)+ (LF) + LF + ]
= LE(FF)L + E(F) L + LE(F) + E()
=
pxp pxp pxp pxp
0 0 L L + + + (133)
= LL+
e a matriz de covarincia para o Modelo Fatorial Ortogonal dada por:
cov(X,F) = E(X - )(F - 0)= E(X - )F= E( + LF + - )F
cov(X,F) = E(LF + )F = LE(FF) + E(F) = LI
m
+ 0 (134)
cov(X,F) = L
Conseqentemente temos V(X
i
) = l l l
i i im i 1
2
2
2 2
+ + + + ...
cov(X
i
, X
k
) = l
i1
l
k1
+ l
i2
l
k2
+ ... + l
im
l
km
(135)
cov(X
i
, F
j
) = l
ij
(136)
A poro da varincia da i-sima varivel aleatria X
i
advinda como contribuio
dos m fatores comuns chamada Comunalidade e a poro da V(X
i
) =
i
2
oriunda do
fator especfico a Varincia Especfica, assim:
V(X
i
) = V[
i
+ l
i1
F
1
+l
i2
F
2
+...+l
im
F
m
+
i
]=
= ) ( V ) F ( V ... ) F ( V ) F ( V
i m
2
im 2
2
2 i 1
2
1 i
+ + + + l l l =
= 0 +
i
2
im
2
2 i
2
1 i
1 ... 1 1 + + + + l l l
V(X
i
) =
i im i i
... + + + +
2 2
2
2
1
l l l (137)
Assim, sendo V(X
i
) =
i
2
i
h + , i = 1, 2, ... , p e como
2
mi
2
i 2
2
i 1
2
i
... h l l l + + + = , a i-
sima comunalidade a soma de quadrados dos carregamentos na i-sima varivel dos m
fatores comuns. Portanto, a varincia de qualquer varivel do modelo composta de duas
partes: a comunalidade e a varincia especfica. Em particular, para uma varivel i tem-
se:
Var(X
i
) = (comunalidade i) +(varincia especfica i) (138)
Como a i-sima comunalidade a soma dos quadrados dos carregamentos da i-
sima varivel nos m fatores comuns, ou seja,
2
im
2
2 i
2
1 i
2
i
... h l l l + + + = (139)
e
ii i
) X ( Var = , ento a relao resumida
i
2
i ii
2
i
h + = = com i = 1, 2, ...,p.
61
O Modelo Fatorial assume que
2
) 1 p ( p
2
) 1 p ( p
p
2
p
p
+
=

+ =
|
|
.
|

\
|
+ varincias e
covarincias de X podem ser reproduzidas pelos carregamentos fatoriais
ij
l e as p
varincias especficas
i
. Quando m=p, qualquer matriz de covarincia pode ser
reproduzida exatamente como LL, ento pode ser a matriz nula. Entretanto, a anlise
mais usada aquela em que m menor do que p. Neste caso, o Modelo Fatorial produz
uma simples explicao da covarincia em X com menos parmetros em relao aos
2
) 1 p ( p +
parmetros de .
Em alguns casos, quando se considera um Modelo Ortogonal Fatorial em que m
igual a 1, ou seja, tem-se apenas um fator, pode-se tambm obter uma nica soluo
numrica. Entretanto, esta soluo numrica pode no ser consistente com a interpretao
estatstica dos coeficientes, gerando, portanto, uma soluo imprpria. A inconsistncia
da soluo em relao aos coeficientes acontece quando no clculo dos carregamentos,
aparecem no modelo valores para varincias maiores que 1 em valor absoluto, ou at
mesmo valores negativos de varincias especficas.
Para m > 1, existe sempre uma ambigidade inerente associada com o Modelo
Fatorial. Para verificar isto suponha uma matriz T de ordem m x m ortogonal, ou seja,
TT=TT=I. Assim, o Modelo Fatorial Ortogonal poderia ser escrito como:
X - = LF +
X - = LTT. F +
X - = (L.T).(T. F ) +
fazendo L.T=L* e T. F = F * , tem-se
X -

= L* F * + (140)

E assim, preservam-se as suposies, mesmo com a transformao ortogonal.
E( F *) = E(T F ) = TE( F ) = T.0 = 0 (141)
e
Cov( F *) = Cov(T F ) = T.Cov( F ).T = T.I.T = T.T=I (142)
62
No modelo, no possvel distinguir os carregamentos de L dos carregamentos de
L*. Os carregamentos fatoriais de F e F* tm as mesmas propriedades estatsticas.
Mesmo que L e L* tenham diferentes carregamentos, ambos so gerados pela mesma
matriz de covarincia . Assim, no h diferena para o modelo entre L* = LT e L, pois
ambas tm a mesma representao. As comunalidades que so os elementos diagonais da
matriz LL = (L*).(L*) so invariantes pela escolha de T. Logo, pode-se escrever:
= LL+ = LTTL + = (L*).(L*) + (143)
Esta ambigidade produz a possibilidade de se estabelecer uma rotao fatorial.
Da lgebra Matricial, sabe-se que uma transformao ortogonal corresponde a uma
rgida rotao (ou reflexo) dos eixos coordenados. Mantendo inalteradas as
comunalidades e as varincias especficas, pode-se encontrar uma matriz ortogonal T de
rotao que estime a estrutura de covarincia da varivel X de uma forma mais simples.

2.3.4 Seleo do Nmero de Fatores.

A adequabilidade do modelo e a interpretao dos resultados dependem
significativamente do nmero de fatores adotado. Existem vrios critrios para se
determinar este valor.
O critrio de Kaiser seleciona o nmero de fatores escolhendo aqueles que
possuem os autovalores maiores que 1. Henry Kaiser, em trabalhos datados de 1960,
The application of eletronic computers to factor analysis, Educacional and
Psychological Measurement 20, p.141-151; e 1974, An index of factorial simplicity,
Psychometrika 39, p.31-36; prope que o nmero de fatores m igual ao nmero de
autovalores maiores que a mdia dos autovalores. A mdia dos autovalores para R 1 e
para S
p
p
1 i
i
=

. Assim como o critrio fundamentalmente heurstico e est presente em
vrios programas computacionais estatsticos existem boas razes para se confirmar a sua
confiabilidade, mostrando que funciona muito bem na prtica. Outras linhas de
pensamento surgiram posteriormente, mas desde que suposto que a anlise de
componentes principais sumariza um conjunto de dados, usar um componente que
63
explica menos que uma discrepncia de 1 algo que no faz muito sentido. Porm, a
justificativa principal de Kaiser para a regra foi que ele fez vrias simulaes com
nmeros diferentes de fatores, e viu que o critrio proposto fez sentido.
Um mtodo alternativo chamado Teste Scree foi sugerido por Raymond B. Cattell
no artigo The scree test for the number of factors em 1966 na Multivariate Behavioral
Research, 1(2), p.140-161. Em um grfico plota-se o nmero de autovalores no eixo
horizontal e a medida correspondente dos autovalores no eixo vertical. Escolhe-se o
nmero de fatores m igual ao nmero de autovalores que esto na primeira linha ngreme,
isto , descartam-se os autovalores que esto na linha mais prxima do eixo horizontal.
importante ressaltar que um modelo que apresente um nmero muito grande de pequenos
autovalores, segundo este critrio, pode apresentar baixa preciso.
Outro critrio, tambm bem parecido ao Teste Scree, mas envolve mais clculos e
menos grficos aquele que para cada autovalor , define-se um valor s como a soma de
todos os autovalores posterior a ele. Ento /s a proporo de discrepncia previamente
inexplicada por . Suponha um problema com 7 variveis e no 4
o
autovalor os valores
posteriores fossem 0,8; 0,2; 0,15; e 0,1. A soma s resulta em 1,25 e este valor a quantia
de discrepncia no explicada por um modelo de 3 fatores. Sendo 0,8/1,25=0,64;
acrescentando mais um fator ao modelo de 3 fatores explicariam 64% de discrepncia
previamente no explicada. Um clculo semelhante para o quinto autovalor resulta em
0,2 / (0,2+0,15+0,1) = 0,44, assim o quinto componente principal explica s 44% de
discrepncia previamente no explicada. (DARLINGTON em
http://comp9.psych.cornell.edu/Darlington/factor.htm consultado em setembro de 2004).
Existem outros critrios, alm dos j descritos, citados na pgina da internet de
GARSON (http://www2.chass.ncsu.edu/garson/pa765/factor.htm consultado em janeiro
de 2005), que so:
- Alguns investigadores usam a regra de manter mais fatores, que responderiam
simplesmente por 90% (s vezes 80%) da variao.
- Critrio de Joliffe: uma regra menos usada, mais liberal que pode resultar no
dobro de fatores obtidos no critrio de Kaiser. A regra de Joliffe escolher todos os
componentes com autovalores acima de 0,7.
64
2.3.5 Mtodos de Estimao do Modelo Fatorial

Dadas as observaes x
1
, x
2
,...,x
n
do vetor X formado por p variveis, geralmente
correlacionadas a Anlise Fatorial procura verificar se o modelo fatorial representar os
dados adequadamente com um nmero baixo de fatores. Dado que a matriz de
covarincia amostral S um estimador da matriz de covarincias populacional
desconhecida e se os elementos fora da diagonal de S so baixos ou equivalentemente
na matriz de correlao amostral R so praticamente nulos e as variveis no so
relacionadas ento a Anlise Fatorial no til. Caso contrrio, o modelo fatorial pode
ser usado e o problema inicial estimar os carregamentos l
ij
e as varincias
especficas
i
. Nessas circunstncias, os fatores especficos realizam uma importante
funo na Anlise Fatorial, j que a proposta principal determinar poucos, mas
importantes, fatores comuns.
Os mtodos mais populares de estimao dos carregamentos so: o Mtodo das
Componentes Principais e o Mtodo da Mxima Verossimilhana, apresentados a seguir.

2.3.5.1- Mtodo das componentes principais

Seja a matriz de covarincias de X, ento, dado que positiva definida, pode-
se decomp-la, segundo o Teorema da Decomposio Espectral, na forma a seguir:

+ + + =
'
p p p
'
2 2 2
'
1 1 1
e e .... e e e e (144)
ou na forma matricial
(
(
(
(
(

'
'
2 2
'
1 1
2 2 1 1
...
]. ... [
p p
p p
e
e
e
e e e

=
pxp
L L se m = p e
i
= 0
i
(145)

Assim, se = LL + tem-se
p

p
=
p
0
p
no ajuste do modelo fatorial. Exceto
pelo escalar
j

,

os carregamentos no j-simo fator so os coeficientes populacionais na
j-sima componente principal. Embora a representao de = LL + 0 = LL seja exata,
ela no particularmente til (tem muitos fatores comuns). prefervel um modelo que
65
explique a estrutura de covarincia em termos de poucos fatores comuns, isto , m<p. Se
p - m autovalores so baixos, possvel negligenciar a contribuio de
m+1
e
m+1
e
m+1
+

m+2
e
m+2
e
m+2
+ ... +
p
e
p
e
p
para na decomposio espectral. Assim, tem-se,
(
(
(
(
(

m
m
m m
e
e
e
e e e


...
]. ... [
2
2
1
1
2 2 1 1
= LL de ordem pxp (146)

Esta representao aproximada assume que os fatores especficos so de menor
importncia e podem tambm ser ignorados na fatorizao de . Se os fatores especficos
so includos no modelo, suas varincias so os elementos da diagonal da matriz
diferena - LL e conseqentemente i
=
ii
-

=
m
1 j
2
ij
l para i = 1,2, .... ,p.
Na prtica utilizada uma amostra das observaes e possvel padronizar as
variveis. Para que isto ocorra a cada vetor de observaes amostradas x
1
, x
2
, ..., x
n
so
subtrados o vetor mdio amostral x divididos pelos seus respectivos desvios padres.
Assim tem-se a forma das variveis padronizadas
j
z .
z
j
=
(
(
(
(
(
(
(
(
(

pp
p
pj
s
x x
s
x x
s
x x
...
22
2
21
11
1
11
onde j = 1,2, ....., n (147)
Para variveis padronizadas, a matriz S que estima a matriz de covarincia ,
trocada pela matriz de correlao amostral R, que estima a matriz de correlao
populacional . Uma vez que a matriz de correlao a matriz de covarincia de
variveis padronizadas.
A Anlise de Componentes Principais de uma matriz de covarincia amostral S
realizada em funo de seus pares de autovalor-autovetor ( )
1 1
e ,

( )
2 2
e ,

,..., ( )
p p
e ,

, onde
66
p 2 1

...

. Sendo m o nmero de fatores comuns, a matriz dos carregamentos
fatoriais estimados }

{
ij
l dada por:
| |
m m
e .

e .

e .

M L M M
2 2 1 1
= (148)
As varincias especficas estimadas so produzidas pelos elementos diagonais da
matriz ' L

S , ento
(
(
(
(
(

=
^
p
2
1

0 0
0

0
0 0

L
M O M M
L
L
com

=
=
m
1 j
ij ii i

l (149)
e as comunalidades so estimadas atravs de
2
im
2
2 i
2
1 i
2
ij

...

h

l l l + + + = .
A anlise de componentes principais da matriz de correlao amostral obtida
substituindo R no lugar de S.
No estudo do Mtodo de Coeficientes Principais, os primeiros coeficientes
ponderados das componentes principais amostrais so os carregamentos fatoriais. Por
esse fato, que se denomina o modelo descrito como Modelo de Componentes
Principais.

2.3.5.2 Mtodo da mxima verossimilhana.

Segundo JOHNSON & WICHERN (1992, p. 392-394), na Anlise Fatorial, se os
fatores comuns F e fatores especficos so considerados normalmente distribudos,
ento as estimativas dos carregamentos fatoriais e varincias especficas podem ser
obtidas pelo Mtodo da Mxima Verossimilhana. Quando F
j
e
j
so conjuntamente
normais, as observaes X
j
- = LF
j
+
j
so tambm normais. Assim sendo, da
verossimilhana de populaes normalmente distribudas demonstradas pelos autores no
resultado 4.9 nas pginas 137 a 139, tem-se:
) x ( )' x ( .
2
n
)' x x )( x x ( tr .
2
1
2 / n 2 / np
1
n
1 j
j j
1
e .
| |
1
.
) 2 (
1
) , ( L



+
(
(

|
|
|
.
|

\
|


=

= (150)
67
Desmembrando as somas nos expoentes em produtos de potncias na mesma base,
tem-se:
) x ( )' x (
2
n
2
1
2
p )' x x )( x x ( tr
2
1
2
) 1 n (
2
p ) 1 n ( 1
n
1 j
j j
1
e . | | . ) 2 .( e . | | . ) 2 ( ) , ( L


|
.
|

\
|

(
(

|
|
|
.
|

\
|
|
.
|

\
|

= (151)
J que = LL + , a funo de verossimilhana depende de L e . Pela
multiplicidade das escolhas de L, possveis por transformaes ortogonais, conveniente
impor uma condio de singularidade computacional. A condio de singularidade que
L
--1
L = (152)
seja uma matriz diagonal.
O Mtodo da mxima verossimilhana estima L

e maximizando a equao
(144), pela propriedade da invarincia de estimadores de mxima verossimilhana. Desta
forma, as comunalidades estimadas so:
2
im
2
2 i
2
1 i
2
i

...

h

l l l + + + = para i = 1, 2, ..., p (153)


assim
pp 22 11
2
pj
2
j 2
2
j 1
s ... s s

...

fator simo j ao atribuda amostral
incia var da total do Poro
+ + +
+ + +
=
|
|
.
|

\
|

l l l
(154)
Da mesma forma, como foi usada a matriz de covarincia para estimar a matriz de
carregamentos e a matriz de varincias especficas, poderia se usar a matriz de correlao.
Para tanto, bastava que as variveis fossem padronizadas.
As variveis padronizadas Z tem a forma Z = V
-1/2
( X - ). Da relao entre as
matrizes de correlao e covarincia pode-se escrever:
=
2 / 1 2 / 1


V V (155)
Substituindo = LL + na equao anterior:
= (V
-1/2
L)(V
-1/2
L) + V
-1/2
V
-1/2
(156)
Assim, pode ser de maneira anloga ao Modelo Fatorial Ortogonal da matriz
de covarincia. Com matriz de carregamentos L
z
= V
-1/2
L e matriz de varincia especfica

z
= V
-1/2
V
-1/2
. Pela propriedade da invarincia dos estimadores de mxima
verossimilhana, o estimador de mxima verossimilhana de
( )( )
2 / 1 2 / 1
'
2 / 1 2 / 1


+ = V V L V L V (157)
68
ou
z z z

' L

+ = (158)
Como conseqncia desta fatorao, sempre que a anlise de mxima
verossimilhana aplicada matriz de correlao, a importncia dos fatores avaliada
com base nos elementos da matriz de carregamentos padronizada
z
L

. Desta forma, a
poro da varincia atribuda a um fator dada por:
p

...

fator simo j ao atribuda a padronizad
amostral incia var da total do Poro
2
pj z
2
j 2 z
2
j 1 z
l l l + + +
=
|
|
.
|

\
|

(159)
onde
ij z

l representam os carregamentos de
z
L

.
Ordinariamente as observaes so padronizadas e a matriz de correlao
amostral fatorada e analisada. A matriz de correlao amostral R, trocada por [(n
1)/n]S na funo de verossimilhana (144), e as estimativas de mxima verossimilhana
z
L

e
z

so obtidas usando mtodo de numricos de maximizao. Embora a


verossimilhana seja apropriada para S, no R, surpreendentemente, esta prtica
equivalente a obter as estimativas de mxima verossimilhana L

baseadas na matriz
de covarincia amostral S, fixando L

2 / 1
s

= e
2 / 1 2 / 1


= V V
s
. Neste caso,
2 / 1
V



a matriz diagonal, cuja diagonal principal formada pelo inverso dos desvios padres
amostrais, computados com o divisor n .
Por outro lado, dados os carregamentos estimados
s
L

e as varincias especficas
s
obtidas da matriz de correlao amostral R, as estimativas resultantes de mxima
verossimilhana para a anlise fatorial da matriz de covarincia [(n 1)/n]S so
s
2 / 1
L


= e
2 / 1
s
2 / 1
V


= , ou
2


ij
ij
s ij
l l = e
2

ij i z i
= onde
2

ij
a varincia
amostral calculada com divisor n. A distino entre divisores pode ser ignorada na
soluo de componentes principais.





69
2.3.6 Rotao de Fatores

A rotao fatorial uma ferramenta importante e necessria para facilitar a
interpretao dos fatores. O objetivo principal simplificar a estrutura fatorial e deix-la
teoricamente mais clara.
A rotao fatorial significa girar os eixos de referncia dos fatores em torno da
origem at que alguma posio mais adequada seja alcanada para que oferea a
interpretao mais adequada das variveis examinadas. Dado que o primeiro fator explica
a quantia maior da varincia e os demais correspondem, na maioria dos casos, a quantia
residual da varincia; o efeito final de fazer a rotao redistribuir a varincia dos
primeiros fatores para os ltimos com o objetivo de atingir um padro fatorial mais
simples e teoricamente mais significativos. O caso mais simples, segundo HAIR,
ANDERSON, TATHAM & BLACK (2005, p.105-106 ) a rotao ortogonal, na qual os
eixos so mantidos a 90 graus. Caso a rotao tenha outra angulao ter-se- uma rotao
oblqua.
A maioria dos autores pesquisados neste trabalho reconhece que fazer rotao dos
fatores melhora a interpretao e que a melhor opo escolher um mtodo ortogonal por
duas razes. Primeiro porque os pacotes computacionais com anlise fatorial contm na
sua maioria somente rotaes ortogonais e segundo devido aos procedimentos analticos
para rotaes oblquas no serem bem desenvolvidos e ainda esto sujeitos a
controvrsias, segundo HAIR, ANDERSON, TATHAM & BLACK (2005, p.106).
Embora j tenha passado sete anos nada foi encontrado que contradiga as duas afirmaes
no decorrer deste estudo, alm disso, nenhuma regra especfica foi desenvolvida para
orientar o pesquisador na escolha de uma tcnica ortogonal ou oblqua, no entanto se o
objetivo da pesquisa reduzir o nmero de variveis originais, independente de quo
significativos possam ser os fatores resultantes ou ele quer reduzir um nmero maior de
variveis a fim de obter um nmero menor de variveis no-correlacionadas para serem
usadas em tcnicas de previso s rotaes ortogonais so mais apropriadas. Porm, se o
objetivo da anlise for obter diversos fatores teoricamente significativos, a soluo
oblqua a recomendada.
70
Para rotaes ortogonais trs abordagens principais foram desenvolvidas que so
os mtodos Quartimax, Varimax e Equimax.
O mtodo de rotao Quartimax foi o primeiro critrio analtico para a
determinao psicolgica de fatores interpretveis e devido a Carrol e citado por Henry
Kaiser em um trabalho intitulado Note on Carrols analytic simple structure,
Psychometrika, 21, p.89-92 em 1953. O mtodo fundamenta-se em rotacionar o fator
inicial de modo que uma varivel tenha carga alta em um fator e cargas to baixas quanto
possveis em todos os outros, assim muitas variveis podem ter carga alta no mesmo
fator. O mtodo no foi bem sucedido na produo de estruturas mais simples.
O mtodo Varimax tem sido muito bem sucedido como uma abordagem analtica
para obteno de uma rotao ortogonal. Por esta razo e por estar de acordo com o
propsito deste trabalho, foi o mtodo escolhido e ser detalhado a seguir.

2.3.6.1 Mtodo de rotao Varimax

O mtodo Varimax de rotao ortogonal foi proposto por Kaiser em 1958. Este
nome se deve ao fato de que o mtodo busca a mxima varincia das variveis. Por isso,
o nome Varimax. Kaiser props por meio de sua tese de doutoramento intitulada The
varimax method of factor analysis, que isto pode ser conseguido, a partir de uma
maximizao iterativa de uma funo de carregamentos quadrados. A descrio do
mtodo feita a seguir.
Os carregamentos obtidos a partir dos carregamentos iniciais, mediante uma
transformao ortogonal tm a mesma habilidade para reproduzir a matriz de covarincia
ou de correlao. Da lgebra matricial, ns sabemos que uma transformao ortogonal
corresponde a uma rotao rgida dos eixos coordenados.
Sendo L uma matriz (pxm) de carregamentos no rotacionados, e seja T uma
matriz ortogonal (mxm), a matriz de carregamentos quadrados L* = L.T, ou seja, l
ij
*
representa os carregamentos rotacionados da i-sima varivel no j-simo fator.
Segundo, FURTADO (1999, p. 85), a funo que o critrio Varimax maximiza
a soma das varincias dos carregamentos quadrados dentro de cada coluna da matriz de
71
carregamentos, onde cada linha dos carregamentos normalizada pela comunalidade, ou
seja,
( )

= = = = =
= =
m
1 j
m
1 j
p
1 i
m
1 j
2
j
4
ij
p
1 i
2
j
2
ij
d . p d d d (160)
onde
i
ij
ij
h
*
d
l
= e

=
p
1 i
2
ij
1
j
d . p d
Na funo , considerando-se todas as variveis,
j
d representa a mdia dos
quadrados dos carregamentos normalizados de cada fator j;
2
ij
d representa todos os
quadrados dos carregamentos normalizados. Quando se toma o mximo de , impe-se a
condio de que o quadrado dos desvios em relao mdia de cada fator seja o maior
valor possvel. Com isso se consegue carregamentos extremos, ou seja, ou muito alto ou
muito baixo. E assim, obtem-se a mxima varincia.
No Critrio Varimax uma funo de T, e o algoritmo iterativo encontra uma
matriz T que maximiza .
No caso onde m=2 fatores, os clculos so simplificados. A matriz T dada por
(

=


cos sen
sen cos
T
que faz a rotao dos eixos coordenados no sentido horrio de um ngulo de medida .
Assim, considerando-se apenas 2 fatores (m=2), a matriz de carregamentos
rotacionados ficaria:
2 x 2 2 px 2 px
T . L * L = (161)
ou seja;
=
(
(
(
(
(

* *
* *
* *
2 p 1 p
22 21
12 11
l l
M M
l l
l l
(

(
(
(
(
(



cos sen
sen cos
.
2 p 1 p
22 21
12 11
l l
M M
l l
l l
(162)
assim,
sen cos *
2 i 1 i 1 i
l l l = e cos sen *
2 i 1 i 2 i
l l l + = para i = 1, 2, ..., p

72
e dividindo pelas razes quadradas das correspondentes comunalidades, isto ,
normalizando as linhas, tem-se:
i
2 i 1 i
i
1 i
1 i
h
sen cos
h
*
d
l l l
= = e
i
2 i 1 i
i
2 i
2 i
h
cos sen
h
*
d
l l l +
= = , i = 1, 2, ..., p (163)
de onde se obtm a matriz D(px2) dada por,
(

+
= )
h
cos . sen .
( )
h
sen . cos .
( D
i
2 i 1 i
i
2 i 1 i
l l l l
, i = 1, 2,..., p. (164)
Seja
b , a
G uma funo dos carregamentos no rotacionados e das comunalidades
definida por:

=
+
=
p
1 i
b a
i
b
2 i
a
1 i
b , a
h
.
G
l l
(165)
Se a equao (160) para m=2

= = =
=
2
1 j
p
1 i
2
1 j
2
j
4
ij
d . p d (166)
ento,
) d d .( p ) d ... d d ( ) d ... d d (
2
2
2
1
4
2 p
4
22
4
12
4
1 p
4
21
4
11
+ + + + + + + + = (167)
substituindo (163) em (160), vem

(
(

|
|
.
|

\
| +
+
|
|
.
|

\
|
=

=
p
1 i
4
i
2 i 1 i
4
i
2 i 1 i
h
cos sen
h
sen cos

l l l l

(
(

|
|
.
|

\
| +
+
(
(

|
|
.
|

\
|

p
1 i
2
2
i
2 i 1 i 1
2
2
i
2 i 1 i 1
h
cos sen
. p
h
sen cos
. p . p
l l l l
(168)
Desenvolvendo a equao (168) e levando-se em conta os resultados da lgebra, e
agrupando em funo de (166), a funo ficaria:
| | C B ). 4 ( sen A ). 4 cos( .
4
1
+ + =
ou C B ). 4 ( sen A ). 4 cos( 4 + + = (169)
onde
) G 4 G G 2 G G G 6 G G ( A
2
1 , 1 0 , 2 2 , 0
2
0 , 2
2
2 , 0 2 , 2 0 , 4 4 , 0
+ + + = (170)
73
) G G G G G G ( 4 B
0 , 2 1 , 1 2 , 0 1 , 1 1 , 3 3 , 1
+ = (171)
]) G 4 G G 2 G 3 G 3 [ ] G G [ 3 ( p C
2
1 , 1 0 , 2 2 , 0
2
0 , 2
2
2 , 0
2
2 , 0 0 , 2
+ + + + = (172)
Multiplicando e dividindo os 2 primeiros termos do segundo membro de (169)
por ( ) 0 B A
2 / 1
2 2
+ , tem-se:
( )
( ) ( )
C
B A
B
). 4 ( sen
B A
A
). 4 cos( . B A 4
2 / 1
2 2
2 / 1
2 2
2 / 1
2 2
+
(
(

+
+
+
+ = (173)
fazendo
( )
2 / 1
2 2
B A
A
cos
+
= e
( )
2 / 1
2 2
B A
B
sen
+
= , e substituindo em (173), vem :
( ) | | C sen ). 4 ( sen cos ). 4 cos( . B A 4
2 / 1
2 2
+ + + = =( ) C ) 4 cos( . B A
2 / 1
2 2
+ + (174)
O mximo valor de obtido para 4 = . O valor de obtido de
A
B
tan =
e, ainda, para localizar o quadrante, consideram-se os sinais do seno e co-seno da
seguinte forma:
se A > 0 e B > 0, ento pertence ao 1

quadrante;
se A < 0 e B > 0, ento pertence ao 2

quadrante;
se A < 0 e B < 0, ento pertence ao 3

quadrante;
se A > 0 e B < 0, ento pertence ao 4

quadrante.
No caso em que m>2 (mais do que 2 fatores), uma soluo iterativa para a rotao
usada. Nessa soluo os fatores so rotacionados aos pares, como no mtodo
anteriormente descrito. Assim, o primeiro e segundo fatores so rotacionados de um
ngulo . O novo primeiro fator ento rotacionado com o terceiro fator original, e assim
por diante, at que todos os
2
) 1 m ( m
2
m

=
|
|
.
|

\
|
pares de fatores tenham sido rotacionados.
Esta seqncia de rotaes chamada ciclo. Desta forma, cada ciclo rene todos os
passos do Mtodo Varimax para 2 fatores apenas. Estes ciclos so repetidos at que se
tenha satisfeito algum critrio de convergncia predeterminado. A convergncia se dar
aos pares. Quando praticamente no houver mais diferena nos carregamentos de um
74
ciclo para o outro, a soluo tima estar prxima. Pode-se estabelecer tambm o nmero
de iteraes como critrio de parada.
Existem outras variaes do mtodo Varimax, que esto explicadas e
demonstradas por FURTADO (1999 p.87-109).
O Mtodo Equimax uma espcie juno dos dois primeiros mtodos o
Quartimax e Varimax, porm no tem obtido ampla aceitao e pouco usado (HAIR,
ANDERSON, TATHAM & BLACK, 2005, p.106).
Um mtodo de rotao oblqua a chamada Rotao Obliqua Direta, que um
mtodo padro quando se deseja uma soluo no ortogonal, ou seja, quando permitido
que os fatores sejam correlacionados. Isto resultar em autovalores mais altos, porm,
com interpretabilidade diminuda. Outro mtodo oblquo a Rotao de Promax que
um mtodo alternativo e computacionalmente mais rpido que o mtodo de Rotao
Obliqua Direta, por esta razo s vezes usado para conjuntos de dados muito grandes.

2.3.7 Escores Fatoriais

Na Anlise Fatorial, segundo CHAVES NETO (2004, p. 29), o interesse est
usualmente centrado nos parmetros do modelo. Entretanto, em determinados problemas,
os valores estimados dos fatores comuns, denominados escores fatoriais, podem tambm
ser requeridos. Essas quantidades so freqentemente usadas para propsitos de
diagnsticos como tambm para introduzir uma anlise posterior.
Escores fatoriais so estimativas dos valores para os vetores fatoriais aleatrios
no observveis F
j
, j = 1, 2, ..., n. Assim, os escores fatoriais (
^
j
f ) so estimativas dos
valores
j
f , obtidos de
j
F (j-simo caso).
A estimao complicada pelo fato de que as quantidades f
j
e
j
no so
observadas como x
j
. Para resolver este problema, mtodos heursticos foram pesquisados
e vrias aproximaes tm sido obtidas da estimao dos valores fatoriais. Nesta tese,
dois mtodos de estimao sero descritos: o Mtodo dos Mnimos Quadrados
Ponderados e o Mtodo da Regresso.
75
Os dois mtodos tm dois pontos em comum na estimao: tratam os
carregamentos fatoriais estimados
ij

l , e as varincias especficas
i
, como se fossem os
verdadeiros valores e envolvem transformaes lineares dos dados originais, muitas vezes
centrados ou padronizados.
Tipicamente, os carregamentos fatoriais rotacionados estimados so mais usados
do que os carregamentos fatoriais no rotacionados. As frmulas apresentadas aqui no
diferenciam o uso de cada um. Assim sendo, tanto os carregamentos fatoriais
rotacionados quanto os no rotacionados podem ser usados. Apresenta-se a seguir o
Mtodo dos Mnimos Quadrados Ponderados.

2.3.7.1 Mtodo dos mnimos quadrados ponderados

FURTADO (1999, p.114) lembra que para este modelo a mdia , a matriz de
carregamentos fatoriais L, e a matriz de varincia especfica , so conhecidas do
modelo fatorial
) 1 px ( ) 1 mx (
) pxm (
) 1 px (
F . L X + = (175)
e que os fatores especficos = [
1
,
2
, ...,
p
] so erros. Desde que Var(
i
) no
precise ser igual a
i
, i = 1, 2, ..., p, Bartlett, citado por JOHNSON e WICHERN (1992,
p.410), sugeriu que os valores fatoriais comuns sejam estimados pelo Mtodo dos
Mnimos Quadrados Ponderados.
Seja a soma dos erros quadrados, ponderada pelos inversos de suas varincias,
dada por:
) f L x ( )' f L x ( '
1
p
1 i
1
i
2
i
= =

=

(176)
A proposta a escolha de estimadores f

no intuito de minimizar a expresso


anterior. Pode-se demonstrar que a soluo para o estimador do Mtodo de Mnimos
Quadrados Ponderados
( ) ) .( '. . . '.

1
1
1
=

x L L L f (177)
76
Dado que o menor erro quadrado zero, deve-se igualar a zero a ltima parte da
expresso da soma dos erros quadrados. Assim,
0 )

( )'

(
1
=

f L x f L x (178)
A nulidade s ocorre quando:
0 f

L x = (179)
logo = x f

L e multiplicando os dois lados da expresso por L


-1
tem-se que :
( ) ) x ( L f

L L =
1 1
(180)
isolando f

na expresso obtm-se:
) x ( L f

=
1
= ( ) ) x ( L
1 1
= ( ) ( ) ) x ( ) ' L ' L ( L
1 1 1
(181)
pela associatividade do produto matricial, pode-se escrever :
( ) ) x ( ' L ) ' L L ( f

=
1 1 1
(182)
Portanto,
( ) ) x ( ' L L ' L f

1
1
1
(183)
que a soluo para o estimador do Mtodo de Mnimos Quadrados Ponderados.
Tomando L

, e x = para valores amostrais, o j-simo caso fica:


( ) ) x x ( ' L

' L

j j
=

1
1
1
(184)
Quando L

e so determinados pelo Mtodo da Mxima Verossimilhana, estas


estimativas devem satisfazer a condio de singularidade, isto ,

' L

1
=

deve ser
uma matriz diagonal.
Sendo assim, para os carregamentos estimados pelo Mtodo da Mxima
Verossimilhana, pode-se montar o Modelo de Mnimos Quadrados Ponderados como:
( ) ) x x ( ' L

) x ( ' L

' L

j
1 1
j
1
1
1
j
= =

, j = 1, 2, ..., n (185)
ou se a matriz de correlao for fatorada,
( )
j
1
z
'
z
1
z j
1
z
'
z
1
z
1
z
'
z
j
z L

z L

= = , j = 1, 2, ..., n (186)

77
no qual ) x x ( D z
j
2 / 1
j
=

e
z z z
L L

'
+ = .
Os escores anteriores podem ser obtidos aps uma rotao de fatores. Em vez de
j
f

seria
*
j
f

, j = 1, 2, ..., n.
Caso os carregamentos fatoriais fossem estimados pelo Mtodo de Componentes
Principais, para generalizar os escores fatoriais, comum o uso de um procedimento de
mnimos quadrados sem ponderao. Implicitamente assume-se que
i
igual ou quase
igual ao valor verdadeiro. Os escores fatoriais seriam, ento, dados por:
( ) ) x x ( ' L

' L

j
1
j
=

ou, para dados padronizados ( )
j z
1
z z
j
z ' L

' L


= .
Desde que,
(

=
m m
e e e L .

.

2 2 1 1
L (187)
tem-se:
(
(
(
(
(
(
(
(
(

=
) x x ( ' e

1
) x x ( ' e

1
) x x ( ' e

1
f

j m
m
j 2
2
j 1
1
j

M
(188)
Para estes escores fatoriais,

=
=
n
1 j
j
0 f

n
1
(mdia amostral)
e

=
=

n
1 j
j j
I ' f

1 n
1
(covarincia amostral)

2.3.7.2 Mtodo da regresso

Considerando o Modelo Fatorial Ortogonal X - =L F + , neste mtodo,
novamente as matrizes de carregamentos L e de varincias especficas sero tratadas
78
como conhecidas. Quando os fatores comuns F e os fatores especficos (ou erros) so
conjuntamente normalmente distribudos com as suposies do Modelo Fatorial
Ortogonal, a combinao linear X - =L F + tem uma distribuio N
p
(0, LL+ ). O
resultado do Apndice 4 pode comprovar isto. Alm disso, a distribuio conjunta de
( X- ) e F N
m+p
(0, *), na qual

(
(
(
(

+ =
=
+ +
) mxm ( ) mxp (
) pxm ( ) pxp (
) p m ( x ) p m (
*
I ' L
L ' LL
M
M
M
M
M
L L M L L L L L L L
M
(189)
e 0 um vetor nulo de dimenso (mxp). Usando o resultado do Apndice 5, a
distribuio condicional de F | x multivariada normal com
E( F | x ) = L
-1
( x - ) = L(LL + )
-1
( x - ) (190)
e
Cov( F | x ) = I L
-1
L = I L(LL + )
-1
L (191)
As quantidades L(LL + )
-1
da equao (190) so os coeficientes na regresso
multivariada dos fatores nas variveis. Estimativas destes coeficientes produzem escores
fatoriais que so anlogos s estimativas dos valores mdios condicionados na anlise de
regresso multivariada. Conseqentemente, dado qualquer vetor de observaes x
j
e
tomando as estimativas de mxima verossimilhana L

e como verdadeiros valores, o


j-simo escore fatorial dado por
( ) ) x x ( ' L

' L

) x x (

' L

j
1
j
1
j
+ = =

, j = 1, 2, ..., n (192)
Nos Apndices 6 e 7 encontram-se as provas dos resultados a seguir.

1 1 1 1 1
) L

' L

I ( I L

' L

) L

' L

I (

+ = + (193)

1 1 1 1 1 1
' L

) L

' L

I ( L ) ' L

(

+ = + (194)
Utilizando os resultados no clculo de
j
f

na equao (184) tm-se que:


1 1 1 1 1 1
' L

) L

' L

I ( L ' L

' L

) ' L

( ' L


+ = +
] ) L

' L

I ( L ' L

I [ ' L

) ' L

( ' L

1 1 1 1 1
+ = +
79
]} ) L

' L

I ( I [ I { ' L

) ' L

( ' L

1 1 1 1
+ = +
) pxp (
1
) mxp (
1 1
) mxp (
1
) pxp ( ) mxp (
' L

) L

' L

I ( ) ' L

( ' L


+ = + (195)
Esta identidade ajuda a comparar os escores fatoriais em (184), gerados por
regresso, com aqueles gerados pelo Mtodo dos Mnimos Quadrados Ponderados.
Assim, denotando
R
j
f

como o escore fatorial pelo Mtodo da Regresso, e


LS
j
f

como o
escore fatorial pelo Mtodo dos Mnimos Quadrados Ponderados, por (187) tem-se:
( ) ( ) ( ) ( )
R
j
1
1
R
j
1
1
1
LS
j
f

' L

I f

' L

I L

' L

+ = + = (196)
Para as estimativas de mxima verossimilhana, ( )
1
1
1

' L

= , e se os
elementos desta matriz diagonal esto prximos de zero, o Mtodo da Regresso e o de
Mnimos Quadrados Generalizados resultaro em escores fatoriais muito prximos.
Na tentativa de reduzir os possveis efeitos da incorreta determinao do nmero
de fatores, prticas tendem a calcular os escores fatoriais de (188) pelo uso de S, a matriz
de covarincia amostral original, em vez de ' L

L

+ = . Pode-se, assim, montar o
Modelo para o clculo dos escores fatoriais por regresso da seguinte maneira.
) x x ( S ' L

j
j
=
1
, j = 1, 2, ..., n (197)
ou, se a matriz de correlao fatorada,

j
1 '
z
j
z R L


= , j = 1, 2, ..., n (198)
onde
) x x ( D z
j
2 / 1
j
=

e
z z z
' L

+ =
Caso os carregamentos rotacionados T L

*
= sejam usados no lugar dos
carregamentos originais, os subseqentes escores fatoriais
*
j
f

so relacionados a
j
f

por
*
j
f

= T
j
f

, j = 1, 2, ..., n (199)
Uma medida numrica em concordncia entre os escores fatoriais dos dois
diferentes mtodos de clculo produzida pelo coeficiente de correlao amostral entre
80
escores do mesmo fator. Dos mtodos apresentados at aqui, nenhum deles
recomendado como uniformemente superior.

2.3.8 Consideraes Adicionais

Segundo JOHNSON & WICHERN (1992, p.415), existem muitas decises a
serem tomadas num estudo analtico de fatores. A deciso mais importante a escolha do
nmero de fatores m. Em seguida vem a escolha do mtodo e do tipo de rotao. Na
prtica, as anlises fatoriais que apresentam um bom ajuste dos dados so aquelas nas
quais as rotaes so aplicadas a mais de um mtodo, e todos os resultados
substancialmente confirmam a mesma estrutura fatorial.
Pela complexidade com que se estabelece a estrutura fatorial considerando todos
os parmetros envolvidos, dispondo de diferentes mtodos, analisando significativamente
os resultados e, ainda, levando em conta a subjetividade das interpretaes, pode-se
adotar um procedimento estratgico para uma melhor anlise da estrutura de dados.
A escolha da Anlise Fatorial de Componentes Principais particularmente
apropriada como primeiro passo na anlise dos dados. Principalmente porque no requer
que a matriz de correlao R ou a matriz de covarincia S sejam no singulares. Em
seguida, examinar-se as observaes mais importantes e cria-se grficos a fim de
relacionar os escores fatoriais. Alm disso, calcular-se os escores padronizados fatoriais
para cada observao, estabelecendo o relacionamento entre as distncias quadradas.
Optar por uma Rotao Varimax.
Sendo | |
P 2 1
x x x X L = um vetor aleatrio cujas componentes so variveis
aleatrias dicotmicas, a matriz de correlao mais recomendvel a composta por
coeficientes de correlao tetracrico. Este coeficiente de correlao foi introduzido por
Karl Pearson e um estimador do Coeficiente Linear de Pearson onde se supe a
existncia de uma varivel latente subjacente quela observada, onde em algumas
situaes s possvel medir a varivel observvel.
Existem duas restries quanto a sua utilizao. Uma delas consiste que as
variveis latentes sejam normalmente distribudas e a outra se refere as variveis
observadas que devem ser dicotomizadas o mais prximo possvel da mediana. Ento,
81
sendo o Coeficiente de Correlao Tetracrico um estimador do Coeficiente de
Correlao Linear de Pearson o qual considera as variveis latentes
1 L
x e
2 L
x (ambas
contnuas e normais), subjacentes s variveis dicotmicas
1
x e
2
x efetivamente
observadas.
A idia de Karl Pearson foi medir a associao de variveis contnuas normais
bivariadas e transform-las em tabela 2x2. A demonstrao para a obteno da equao
tetracrica, parte da transformao da distribuio normal bivariada em variveis
dicotmicas.
A equao tetracrica de transformao obtida aps a dicotomizao das
variveis
1
x e
2
x como mostra a Tabela 3.

TABELA 3- ASSOCIAO DAS VARIVEIS OBSERVVEIS X
1
e X
2

X
1

Variveis Observveis
0 1
Total
0 a B a+b
X
2

1 c D c+d
Total a+c b+d n

onde:
a,b,c,d so as freqncias observadas;
n = a + b + c + d (total de observaes).
A equao tetracrica dada por:
( )( ) ( )( ) ( )( )
( ) ( ) ( )( )
...
5040
15 z 45 z 15 z 15 z 45 z 15 z

720
15 z 10 z z 15 z 10 z z

120
3 z 6 z 3 z 6 z

24
3 z 3 z z

6
1 z 1 z

2
z z

n y y
bc ad
2 4 6 2 4 6
7
t
2 4 2 4
6
t
2 4 2 4
t
2 2
4
t
2 2
3
t
2
t t 2
5
+
+ + +
+
+ +
+
+
+ +
+

+

+

+ =



(200)
sendo que:
p 1
n
d) (c
q e
n
b) (a
p =
+
=
+
=
;
FONTE: A AUTORA
82
p' 1
n
d) (c
q' e
n
b) (a
' p =
+
=
+
=
;
z o escore normal padro correspondente rea menor ou igual a p. Por
exemplo, se p = 0,50, ento se tem que z = 0 (tabela de reas sob a curva
normal);
z o escore normal padro correspondente rea menor ou igual a p . Se
p = 0,50, ento se tem que z = 0;
y o valor da ordenada no ponto p e pode ser obtida fazendo-se
2
e
f(z) y
2
Z
2

= = . Para o exemplo citado, se z = 0, ento


39894 , 0
2
e
) 0 ( f y
0
= = =

(tabela de ordenadas da curva normal);


y o valor da ordenada no ponto p e pode ser obtida fazendo-se
2
2
2
Z
e
) z ( f y

= = .
Uma soluo aproximada do clculo do Coeficiente de Correlao Tetracrico
ignorar-se os termos de grau superior a 2:
2
2
2
z z

n y y
bc ad
t t

+ =


(201)
onde:
t

o estimador do Coeficiente de Correlao Tetracrico;


a,b,c,d so as freqncias da tabela 2x2;
z o escore normal padro correspondente rea menor ou igual a p;
z o escore normal padro correspondente rea menor ou igual a p ;
y o valor da ordenada no ponto p;
y o valor da ordenada no ponto p ;
( ) d c b a n + + + = o nmero de observaes da amostra.
83
Chamando o primeiro termo da expresso de c; o coeficiente de
t

de b ; e
2
z z
de a, tem-se uma equao do 2. grau:
0 c b a
t
2
t
= + +
que poder ser resolvida atravs de:
a 2
ac 4 b b
2
t


=
Conforme demonstrado em WONNACOTT e WONNACOTT (1978, p.424),
existe uma relao entre o Coeficiente de Correlao e o cos , cos = e
1 cos 1 + . Outra expresso apresentada por GUILFORD (1950, p.605),
utilizando o cosseno, dada por:

|
|
.
|

\
|
+
=
bc ad
bc
cos
t

180
(202)
Quando o produto bc igual a ad, o ngulo
o
90 e o cosseno igual a zero,
conseqentemente 0
t

= .
O erro padro aproximado do estimador do Coeficiente de Correlao
Tetracrico dado por:
( )
(
(

|
|
.
|

\
|



=

2
1
2
90
1 1
o
t
t


sen
n y y
q p q p
t

(203)
onde:
t

o erro padro do estimador;



t
o estimador do Coeficiente de Correlao Tetracrico;

t
1

sen

o arco seno de
t

;
( ) d c b a n + + + = o nmero de observaes da amostra.

84
Para testar a hiptese de que 0
t
= , possvel utilizar a estatstica
t

= . O erro
padro poder ser calculado considerando apenas a primeira parte da expresso:

n y y
q p q p
t



=
(204)
O Coeficiente de Correlao Tetracrico menos confivel que o de Pearson,
sendo que sua variabilidade cerca de 50% maior, quando 0 = . Para obter a mesma
confiabilidade
1
para o Coeficiente de Correlao Tetracrico que a obtida no Coeficiente
de Correlao de Pearson, necessrio o dobro do tamanho da amostra.
Para obteno dos escores por Anlise Fatorial com Componentes Principais
utilizando a matriz de correlao tetracrico (R
tetra
) necessrio que a amostra seja
grande, e os escores fatoriais so dados por:

j
1
tetra
'
z
jtetra
z R L


= , j = 1, 2, ..., n (205)
Caso os carregamentos rotacionados T L

*
= sejam usados no lugar dos
carregamentos originais, os subseqentes escores fatoriais
*
jtetra
f

so relacionados a
jtetra
f

por
*
jtetra
f

= T
jtetra
f

, j = 1, 2, ..., n (206)
Utiliza-se os escores fatoriais na obteno do chamado escore final com intuito de
fazer o ranqueamento dos vetores dos indivduos. Assim, tomando-se a mdia dos escores
fatoriais ponderada pelos seus autovalores e tm-se o escore final para cada indivduo.
Costuma-se colocar estes escores finais numa escala de zero a cem para uma melhor
anlise dos resultados.



85
2.4 RECONHECIMENTO DE PADRES E CLASSIFICAO
2.4.1 Introduo

Reconhecimento de Padres e Classificao so tcnicas ou procedimentos que
visam reconhecer e classificar objetos ou indivduos em grupos com base em medidas
observadas dos mesmos. As tcnicas de Reconhecimento de Padres, segundo CHAVES
NETO (2003, p.4), representam um importante componente dos sistemas artificialmente
inteligentes e so utilizadas para pr-processamento dos dados e tomada de deciso.
Assim, o objetivo fundamental do Reconhecimento de Padres e Classificao num
primeiro estgio categorizar este objeto (indivduo) segundo suas caractersticas. A
caracterstica definida como um vetor de medidas do padro a ser classificado. Por
exemplo, quando se deseja distinguir a letra A da letra E possvel comparar o nmero
de traos inclinados, horizontais e verticais dos caracteres.
Historicamente as principais abordagens de Reconhecimento de Padres so a
estatstica e a sinttica (estrutural). Depois, surgiram a tecnologia de Redes Neurais e
tambm mtodos de Programao Matemtica.
O Reconhecimento de Padres e Classificao, em estatstica, baseia-se na
atribuio de classes para indivduos atravs do processo denominado de Anlise
Discriminante. Segundo JOHNSON & WICHERN, 1992, p.470, Anlise Discriminante
so tcnicas multivariadas interessadas com a separao de uma coleo de indivduos
distintos e que alocam novos indivduos em grupos previamente definidos.
Discriminaes podem ser feitas atravs de processos com padres conhecidos
(tambm chamados de supervisionados) e no conhecidos (no supervisionados). Nos
processos com padres conhecidos so tomadas amostras de cada padro e se definem
critrios ou funes discriminantes para poder diferenci-los. Nos processos que no
possuem um padro conhecido so feitos procedimentos que agrupam os dados em
padres que tenham caractersticas semelhantes (similaridades), chamadas tcnicas de
agrupamento (Cluster). Os principais objetivos da Anlise Discriminante, descritos por

1
A confiabilidade, aqui, usada como sinnimo de erro padro.
86
HAIR, ANDERSON, TATHAM & BLACK (2005, p.32-33), que podem ajudar a
resolver problemas em pesquisa so:
- Estabelecer a existncia de diferenas estatsticas significantes entre os escores mdios
de dois ou mais grupos de indivduos previamente definidos.
- Indicar quais so as variveis independentes que explicam o mximo de diferenas
entre os grupos de modo que os grupos possam ser separados tanto quanto for possvel.
- Definir procedimentos para classificar novos indivduos em grupos que melhor se
assemelham, com base nos seus escores em um conjunto de variveis independentes.
- Estabelecer o nmero e a composio das dimenses de discriminao entre os grupos
formados a partir do conjunto de variveis independentes.
As tcnicas estatsticas de reconhecimento de padres e classificao tm como
base estimao de funes obtidas de observaes amostrais a partir de algumas
suposies (independncia entre variveis, linearidade de relaes, igualdade de
varincias, etc.) que resultam em regras que possibilitem a separao e alocao de
objetos (indivduos ou empresas utilizados no contexto desta tese).
Na prtica as duas suposies citadas, freqentemente, sobrepem-se e a distino
entre separao e alocao torna-se confusa. Uma funo que separa, pode servir como
alocadora (classificadora), e da mesma forma uma regra alocadora, pode sugerir um
procedimento discriminatrio. A terminologia de discriminar e classificar foi
introduzida por Fischer em 1936 (S. E. FIENBERG apud JOHNSON & WICHERN,
1992 p. 471) no primeiro tratamento moderno dos problemas de separao.

2.4.2 Conceitos Gerais de Reconhecimento e Classificao

Com intuito de ilustrar e explicar os conceitos, JOHNSON & WICHERN (1992,
p.481-482), considerou dois grupos em uma cidade, famlias proprietrias de certo
equipamento e famlias no-proprietrias desse equipamento. A fim de identificar o
melhor tipo de campanha de vendas, o fabricante do equipamento est interessado em
classificar famlias como futuros compradores do equipamento ou no, com base em x
1
=
renda e x
2
= tamanho do lote de moradia. Amostras aleatrias de n
1
= 12 famlias
proprietrias e n
2
= 12 famlias no-proprietrias produziram os dados abaixo.
87
TABELA 4- AMOSTRAS DE FAMLIAS PROPRIETRIAS E NO PROPRIETRIAS DE
CERTO EQUIPAMENTO COM BASE NA RENDA E TAMANHO DO LOTE DE SUAS
MORADIAS

1
= Proprietrios

2
= No Proprietrios
Renda(x
1
) Tamanho do Lote (x
2
) Renda(x
1
) Tamanho do Lote (x
2
)
20.0 9.2 25.0 9.8
28.5 8.4 17.6 10.4
21.6 10.8 21.6 8.6
20.5 10.4 14.4 10.2
29.0 11.8 28.0 8.8
36.7 9.6 16.4 8.8
36.0 8.8 19.8 8.0
27.6 11.2 22.0 9.2
23.0 10.0 15.8 8.2
31.0 10.4 11.0 9.4
17.0 11.0 17.0 7.0
27.0 10.0 21.0 7.4
FONTE: ADAPTADO DE JOHNSON & WICHERN

FONTE: ADAPTADO DE JOHNSON & WICHERN

FIGURA 12- GRFICO DAS AMOSTRAS DE FAMLIAS
PROPRIETRIAS E NO-PROPRIETRIAS
COM BASE NA RENDA E TAMANHO DOS
LOTES DE SUAS MORADIAS

7 8 9 10 11 12
Tamanho do Lote
11
16
21
26
31
36
41
R
e
n
d
a
Famlia
NoProp
Prop
88
O grfico da Figura 12 mostra que os proprietrios tendem a ter maiores rendas e
tambm maiores lotes, porm renda parece discriminar melhor que lote. Existe uma
regio onde os grupos se misturam que conseqentemente ir gerar classificaes erradas,
assim pode-se criar uma regra (regies R
1
e R
2
) que minimize a chance de classificaes
erradas. Alm disso, pode existir um grupo ou populao com maior probabilidade de
ocorrncia do que de o outro. Uma regra de classificao tima deve levar em conta estas
duas possibilidades, isto , as probabilidades de ocorrncia a priori e o custo de
classificao errada (classificar um indivduo em
1
quando na verdade ele pertencente a

2
pode representar um erro mais srio do que classificar em
2
quando o indivduo
pertencente a
1
).
Sejam as funes densidade de probabilidade f
1
( x ) e f
2
( x ) associadas ao vetor
aleatrio X de dimenso p (nmero de variveis analisadas) das populaes
1
e
2
,
respectivamente. Um indivduo, com as medidas x , deve ser reconhecido como de
1
ou
de
2
. Seja o espao amostral, isto , o conjunto de todas as possveis observaes x .
Considerando R
1
o conjunto de valores x para os quais se classifica o indivduo como
1
e R
2
= - R
1
os remanescentes valores x para os quais se classifica os indivduos como

2
. Os conjuntos R
1
e R
2
so mutuamente exclusivos. Supondo p igual a 2, pode-se
visualizar isto na Figura 13 que segue.









FONTE: A AUTORA

FIGURA 13- REGIES DE CLASSIFICAO PARA DUAS POPULAES

2
x
1
x
2
=
1

2
89
A probabilidade de classificar um indivduo em
2
quando na verdade ele de
1

um probabilidade condicional dada por:

=
= =
1 2
R R
1 1 2
x d ) x ( f ) | R X ( P ) 1 | 2 ( P

(207)
Da mesma anloga a probabilidade de classificar um indivduo em
1
quando na
verdade ele de
2
ser:

= =
1
R
2 2 1
x d ) x ( f ) | R X ( P ) 2 | 1 ( P (208)
Assim, P(2|1) representa o volume formado pela f.d.p. f
1
( x ) na regio R
2
. Se o
caso fosse univariado, isto , p = 1 (uma varivel sendo observada) poderia ser observado
como mostra a Figura 14 a seguir.


R
1
R
2
Classific ado como Classif ic ado como
P f x dx
R
( | ) ( ) 1 2
2
1
=

P f x dx
R
( | ) ( ) 2 1
1
2
=

f
1
(x)
f
2
(x)

1

2

FONTE: ADAPTADO DE JOHNSON & WICHERN
FIGURA 14- CLASSIFICAO DAS REGIES PARA DUAS POPULAES

2.4.2.1 Custo esperado de erro de classificao (ECM)

Seja p
1
a probabilidade a priori de
1
e p
2
a probabilidade a priori de
2
,
onde p
1
+ p
2
= 1. As probabilidades de reconhecer corretamente ou incorretamente so
dadas por:
P( X
1
e reconhecido corretamente como
1
) = P( X R
1
|
1
).P(
1
) = P(1|1)p
1

P( X
2
e reconhecido incorretamente como
1
) = P( X R
1
|
2
).P(
2
) = P(1|2)p
2

P( X
2
e reconhecido corretamente como
2
) = P( X R
2
|
2
).P(
2
) = P(2|2)p
2

90
P( X
1
e reconhecido incorretamente como
2
) = P( X R
2
|
1
).P(
1
) = P(2|1)p
1

As regras de classificao geralmente so avaliadas em termos destas
probabilidades, mas ignora o custo de erro de classificao o que pode em alguns casos
causar problemas. A Tabela 5 representa uma matriz de custo de reconhecimento.

TABELA 5- MATRIZ DO CUSTO DE CLASSIFICAO
Classificado como:
Especificao

1

2

1
0 c(2|1)
Populao verdadeira

2
c(1|2) 0
FONTE: ADAPTADO DE JOHNSON & WICHERN

Um bom procedimento seria fazer com, a mdia, ou o custo esperado de erro de
classificao ECM (Expected Cost of Misclassification), que dado pela soma dos
produtos dos elementos fora da diagonal principal pelas respectivas probabilidades, seja
mnimo.
ECM = c(2|1)P(2|1)p(1) + c(1|2)P(1|2)p(2) (209)
Resultado 1:
As regies
1
e
2
que minimizam o ECM so definidas pelos valores de x tal
que valem as desigualdades:
(

=
1 p
p
) 1 | 2 ( c
) 2 | 1 ( c
) x ( f
) x ( f
2
2
1
1
(210)

(

priori ades probabilid


das o a
~
Raz
custos
dos o a
~
Raz
densidades
das o a
~
Raz

(

< =
1 p
p
) 1 | 2 ( c
) 2 | 1 ( c
) x ( f
) x ( f
2
2
1
2
(211)

(

<
(

priori ades probabilid


das o a
~
Raz
custos
dos o a
~
Raz
densidades
das o a
~
Raz

Sendo,
2 1
)p 2 | 1 )P( 2 | 1 + c( )p 1 | 2 )P( 1 | 2 ECM = c(
91

+ =
1 2
x d ) x ( f p ) 2 | 1 ( c x d ) x ( f p ) 1 | 2 ( c ECM
2 2 1 1


e como =
1

2
tem-se:

+ = =
2 1
x d ) x ( f x d ) x ( f x d ) x ( f 1
1 1 1


pode-se escrever:

+
(
(

=
1 1
x d ) x ( f p ) 2 | 1 ( c x d ) x ( f 1 p ) 1 | 2 ( c ECM
2 2 1 1

(212)
e das propriedades de integral (volume)
1 1 1 2 2
p ) 1 | 2 ( c x d )] x ( f p ) 1 | 2 ( c ) x ( f p ) 2 | 1 ( c [ ECM
1
+ =

(213)
e p
1
, p
2
, c(1|2), e c(2|1) so no-negativos, e ainda f
1
( x ) e f
2
( x ) como tambm so
no-negativos e so as nicas quantidades de ECM que dependem de x . Assim ECM
minimizado se
1
inclui esses valores x tal que [c(1|2) p
2
f
2
( x ) - c(2|1) p
1
f
1
( x )] 0 e
exclui aqueles para os quais esta quantidade positiva. Isto ,
1
deve ser o conjunto de
pontos tal que:
c(1|2) p
2
f
2
( x ) c(2|1) p
1
f
1
( x )
(

1 p
p
) 1 | 2 ( c
) 2 | 1 ( c
) x ( f
) x ( f
2
2
1
(214)
e dado que
2
o complemento de
1
em ,
2
deve ser o conjunto de pontos x para os
quais:
(

<
1 p
p
) 1 | 2 ( c
) 2 | 1 ( c
) x ( f
) x ( f
2
2
1
(215)
Casos Especiais de Regies de ECM:
a) Probabilidades a priori iguais: 1 =
p
p
1
2

) 1 | 2 ( c
) 2 | 1 ( c
) x ( f
) x ( f
;
) 1 | 2 ( c
) 2 | 1 ( c
) x ( f
) x ( f
2
1
2
2
1
1
< = = (216)
b) Custos de erro de reconhecimento iguais: 1
1) | c(2
2) | c(1
=
1
2
2
1
2
1
2
2
1
1
p
p
) x ( f
) x ( f
;
p
p
) x ( f
) x ( f
< = = (217)
92
c) Probabilidades a priori iguais e custos de reconhecimento errado iguais:
1
) 1 | 2 ( c
) 2 | 1 ( c
p
p
1
2
= = ou
) 1 | 2 ( c / ) 2 | 1 ( c
1
p
p
1
2
=
1
) x ( f
) x ( f
; 1
) x ( f
) x ( f
2
1
2
2
1
1
< = = (218)
Obs: 1) Quando as probabilidades a priori so desconhecidas, elas so freqentemente
tomadas como iguais (0,5) e a razo das funes densidade de probabilidade
(f.d.ps) comparada com a razo de custos de reconhecimento errado.
2) Se a razo de custo de reconhecimento errado indeterminada, ela usualmente
tomada como 1 e a razo das f.d.ps comparada com a razo de probabilidades
a priori.
3) Finalmente, quando ambas: razes das probabilidades a priori e razes de
custos so unitrios ou uma razo recproca do outro, ento as regies de
reconhecimento (classificao) timo so determinadas comparando-se os
valores das f.d.ps.
Assim, se
0
x uma nova observao e f
1
(
0
x )/f
2
(
0
x ) 1 f
1
(
0
x ) f
2
(
0
x ),
assumimos que
0
x
1
.

2.4.2.2. Probabilidade total de erro de classificao

Outro critrio, alm do ECM (Expected Cost of Misclassification), pode ser usado
para construir procedimentos timos. Assim, pode-se ignorar o custo de classificao
errada escolher R
1
e R
2
que minimizam a probabilidade total de erro de classificao
denominado de TPM (Total Probability of Misclassification).
TPM = P( x
1
e classificada errada) + P( x
2
e classificada errada)
TPM =

+
1 2
R
2 2
R
1 1
x d ) x ( f p x d ) x ( f p
Matematicamente, isto equivalente a minimizar ECM quando os custos de
classificao errada so iguais. Assim, podemos alocar uma nova observao
o
x para a
populao com a maior probabilidade a posteriori P(
i
|
0
x ), onde
93
) x se - observa ( P
) x se - observa e ocorre ( P
) x | ( P
0
0 1
0 1

= =
) ( p ) | x se - observa ( P ) ( p ) | x se - observa ( P
) ( P ) | x se - observa ( P
=
2 2 0 1 1 0
1 1 0


+
=
) x ( f p ) x ( f p
) x ( f p
=
0 2 2 0 1 1
0 1 1
+
(219)
e
) x ( f p ) x ( f p
) x ( f p
) x | ( P 1 ) x | ( P
0 2 2 0 1 1
0 2 2
0 1 0 2
+
= = (220)
A regra de classificao dada por:
- classifica-se
0
x em
1
quando P(
1
|
0
x ) > P(
2
|
0
x )
- classifica-se
0
x em
2
quando P(
1
|
0
x ) P(
2
|
0
x ).

2.4.3 Reconhecimento e Classificao para Duas Populaes
2.4.3.1 Funo de classificao de Anderson populaes gaussianas e matrizes de
correlao iguais.

Para o caso de duas populaes gaussianas multivariadas assume-se que f
1
( x ) e
f
2
( x ) so suas respectivas funes densidades multivariadas, onde a primeira com vetor
de mdia
1
e matriz de varincia
1
e a segunda com
2
.e
2
, ento supondo
1
=
2
=
e a regra de classificao feita com base no critrio ECM.
Seja

X = [ X
1
, X
2
, ...., X
p
] para populaes
1
e
2
e
( )
( ) ( )
(


i
1 '
i
2
1
2
p
i
x x
2
1
exp
2
1
: ) x ( f

para i=1,2 (221)


Suponha que os parmetros
1
e
2
e , so conhecidos, tem-se as regies de
mnimo ECM.

94

1
:
(

) ( )' (
2
1
exp
) 2 (
1
) ( )' (
2
1
exp
) 2 (
1
) (
) (
2
1
2
2
1
2
1
1
1
2
1
2
2
1




x x
x x
x f
x f
p
p
=
= ( ) ( ) ( ) ( )
( )
( )
(

+

1
2
2
1
2 1
1
1
p
p
1 2 c
2 1 c
x ' x
2
1
x ' x
2
1
exp (222)

2
:
) x ( f
) x ( f
2
1
= ( ) ( ) ( ) ( )
( )
( )
(

<
(

+

1
2
2
1
2 1
1
1
p
p
1 2 c
2 1 c
x ' x
2
1
x ' x
2
1
exp (223)
O procedimento de reconhecimento que minimiza ECM obtido aps logaritmar e
fazer algumas simplificaes na expresso acima e dado por:
- reconhecer
0
x como sendo de
1
se :
( ) ( ) ( )
2 1
1
2 1
0
1
2 1
'
2
1
x ' +


( )
( )
(
(

|
|
.
|

\
|
|
|
.
|

\
|
1
2
p
p
1 2 c
2 1 c
ln (224)
ou como sendo de
2
se:
( ) ( ) ( )
2 1
1
2 1
0
1
2 1
'
2
1
x ' +

<
( )
( )
(
(

|
|
.
|

\
|
|
|
.
|

\
|
1
2
p
p
1 2 c
2 1 c
ln (225)
Em situaes em que
i
i=1,2 so desconhecidas e tambm, a regra deve ser
modificada. A regra do ECM mnimo para duas populaes normais (regra amostral)
dada por:
Alocar
0
x em
1
se ( ) ( ) ( )
( )
( )
(

+

1
2
2 1
1
p 2 1 0
1
p 2 1
p
p
1 | 2 c
2 | 1 c
ln x x S ' x x
2
1
x S ' x x
Alocar
0
x em
2
se ( ) ( ) ( )
( )
( )
(

< +

1
2
2 1
1
p 2 1 0
1
p 2 1
p
p
1 | 2 c
2 | 1 c
ln x x S ' x x
2
1
x S ' x x
O primeiro termo da regra de classificao e reconhecimento, ( ) x S ' x x
1
p 2 1

, a
funo linear obtida por Fisher que maximiza a variabilidade univariada entre as amostras
relativamente variabilidade dentro das amostras. A expresso inteira
95
( ) ( ) ( ) ( ) ( )] x x
2
1
x [ S ' x x x x S ' x x
2
1
x S ' x x w
2 1
1
p 2 1 2 1
1
p 2 1
1
p 2 1
+ = + =


conhecida como Funo de Classificao de Anderson.

2.4.3.2. Classificao quadrtica populaes no necessariamente gaussianas e matrizes
de correlao diferentes.

No caso de duas populaes com varincias diferentes (
1

2
)
,
, tem-se segundo
JOHNSON & WICHERN (1992, p.492-493) a Classificao Quadrtica.
Sejam as matrizes de covarincia
1
para x
1
e
2
para x
2
onde
1

2
,
as regras de reconhecimento de padres tornam-se mais complicadas.
Ento para ) , ( N ~ x
i
i
p
, i=1,2 tem-se que
2 1
2 1
e . A
probabilidade total de erro de classificao (TPM) e o custo esperado de erro de
classificao dependem da razo das funes densidades
(

) x ( f
) x ( f
2
1
ou, equivalentemente,
do logaritmo das razes das densidades | | | | ) x ( f ln ) x ( f ln
) x ( f
) x ( f
ln
2 1
2
1
=
(


Sejam as populaes
1
e
2
descritas por densidades normais multivariadas
) , ( N e ) , ( N
2
2
p 1
1
p
. Ento a regra de reconhecimento que minimiza o ECM
dada por:
( )
(

|
|
.
|

\
|
|
|
.
|

\
|
|
.
|

\
|


1
2
0
1
2
2
1
1
1
0
1
2
1
1
0
1
p
p
) 1 | 2 ( c
) 2 | 1 ( c
ln k x x x
2
1
: (226)
onde ( )
2
1
2
'
2 1
1
1
'
1
2
1
2
1
ln
2
1
k

+
|
|
.
|

\
|

=
( )
(

|
|
.
|

\
|
|
|
.
|

\
|
< |
.
|

\
|


1
2
0
1
2
2
1
1
1
0
1
2
1
1
0
2
p
p
) 1 | 2 ( c
) 2 | 1 ( c
ln k x x x
2
1
: (227)
Na prtica, a regra de reconhecimento estabelecida implementada substituindo-
se os parmetros
2 1
2 1
e , , pelas suas estimativas
2 1 2 1
S e S , x , x , tal que:
96
Alocamos
0
x em
1
se:
( ) ( )
( )
( )
(
(

|
|
.
|

\
|
|
|
.
|

\
|
+


1
2
0
1
2 2
1
1 1 0
1
2
1
1
0
1 2
2 1
2
1
p
p
c
c
ln k x S ' x S ' x x S S x (228)
Alocamos
0
x em
2
se:
( ) ( )
( )
( )
(
(

|
|
.
|

\
|
|
|
.
|

\
|
< +

1
2
0
1
2 2
1
1 1 0
1
2
1
1 0
1 2
2 1

2
1
p
p
c
c
ln k x S ' x S ' x x S S x
,
(229)

2.4.3.3. Mtodo discriminante linear de Fischer populaes no necessariamente
gaussianas e matrizes de covarincias iguais

Sejam p variveis aleatrias associadas a um vetor ( )
2
2
X E = , onde as
observaes de valores de X diferem de uma populao
1
para outra
2
. Considerem-se
os valores da primeira classe como sendo a populao de X valores para
1
e para a
segunda classe com populao de X valores para
2
. Ento, descrevem-se funes
densidades de probabilidade ( ) x f
1
e ( ) x f
2
para as duas populaes .
A idia de Fisher, segundo JOHNSON & WICHERN (1992, p.471), era a
transformao de observaes multivariadas x para observaes univariadas Y, e que uma
das funes Y derivadas das populaes
1
e
2
sejam to separveis quanto possvel.
Fisher sugeriu que os valores de y sejam combinaes lineares, pois estas so
funes de fcil manuseio matemtico.
Definindo
y 1
a mdia da combinao linear de x pertencente a
1
e
y 2
a
2
,
Fisher selecionou as combinaes lineares que maximizam a distncia (quadrtica) entre
y 1
e
y 2
relativa a variabilidade dos valores de Y.
Seja Y a combinao linear de X dado por X ' Y l = onde ' l corresponde ao vetor
de coeficientes.
Tem-se que:

y 1
( ) ( ) ( )
1 1 1
X E ' X ' E Y E l l = = = (230)

y 2
( ) ( ) ( )
2 2 2
X E ' X ' E Y E l l = = = (231)
97
fazendo:
( )
1
1
X E =
e ( )
2
2
X E =
tem-se:

y 1

1
' l = (232)

y 2

2
' = l (233)
A matriz de covarincia considerada a mesma para as duas populaes dada por:
( ) ( ) l l l l l = = = ' X Cov ' X ' Var
2
y
(234)
onde
( )( )

=
i i
X X E , = i 1,2. (235)
A melhor combinao linear obtida da razo entre o quadrado da distncia entre
as mdias e a varincia de Y assim:

( )
( ) ( )( )
( )
l l
l
l l
l l
l l
l l

'
'
'
'
'
' '
Y
Y Y
2
2 1 2 1
2
2 1
2
2
2 1


(236)
onde o vetor de diferena dos valores mdios, isto :
( )
2 1
=
Note que a matriz ( )( )

=
2 1 2 1
' contm os quadrados dos produtos
cruzados dos diferentes componentes entre as mdias das populaes
1
e
2
.
Os coeficientes da combinao linear de Fisher | |
p 2 1
,..., , ' l l l l = so aqueles que
maximizam a razo
( )
l l
l
'
'
2

:
( )
2 1
1 1
c c = =

l para 0 c (237)
Escolhendo l = c obtem-se:
( ) X X ' Y
1
2 1

= = l (238)
que conhecida como Funo Discriminante Linear de Fisher e o mximo da razo
obtido por:
98

( )

1
2
'
'
MAX

=
l l
l
l
(239)
Sendo a matriz de covarincia uma matriz positiva definida, a prova da
maximizao da razo feita aplicando a Lemma da Maximizao, baseado na
desigualdade de Cauchy-Schwarz (JOHNSON & WICHERN, 1992, p.473).
A Funo Linear Discriminante converte as populaes
1
e
2
que so
multivariadas em populaes univaridadas de maneira que as mdias das populaes
univariadas correspondentes so separadas tanto quanto possvel.
A equao ( ) X Y
1
2 1

= tambm pode ser empregada como um dispositivo
de classificao (classificador). Para alocar uma nova observao
0
X , tem-se
( )
0
1
2 1
0
X Y

= como o valor da funo discriminante e ainda:
( ) ( )
2 1 Y 2 Y 1
' '
2
1
2
1
m l l + = + =
ou
( ) ( )
2 1
1
2 1 2
1
m +

=

(240)
que o ponto mdio entre as duas mdias populacionais univariadas. Assim pode-se
mostrar que:
( ) 0
1 0
m Y e ( ) 0 m Y
2 0
< (241)
Desta maneira se
0
X for oriundo de
1
, a esperana de
0
Y maior ou igual ao
ponto mdio. Caso
0
X for oriundo de
2
, a esperana de
0
Y menor que o ponto mdio.
Ento, a regra de classificao dada por:
alocar
0
X em
1
se ( ) m X Y
0
2 1
0

=
ou
alocar
0
X em
2
se ( ) m X Y
0
2 1
0
<

=
Sabendo-se que as quantidades populacionais so raramente conhecidas, a regra
acima no pode ser implementada a no ser que l e m possam ser estimados por
observaes que j tenham sido corretamente classificadas.
99
Suponha que se tenha
1
n observaes da varivel aleatria multivariada
1
X de

1
e
2
n observaes de
2
. Os vetores de dados respectivos a
1
e
2
so:
| |
1
n 1 12 11 1
X ,..., X , X ' X =
| |
2
2 22 21 2 n
X ,..., X , X ' X =
Para estes dados, os vetores amostrais de mdias e as matrizes amostrais de
covarincia so dadas por:

=
=
1
n
1 j
j 1
1
1
x
n
1
x
( )( )

=

=
1 j 1
n
1 j
1 j 1
1
1
x x x x
1 n
1
S
1

=
=
1
n
1 j
j 2
2
2
x
n
1
x
( )( )

=

=
2 j 2
n
1 j
2 j 2
2
2
x x x x
1 n
1
S
1

Como foi assumido que as populaes tm a mesma matriz de covarincia , as
matrizes de covarincia
1
S e
2
S podem ento ser combinadas para se obter uma nica
estimativa no tendenciosa de , dada pela matriz de covarincia conjunta:

( ) ( )
( ) 2 n n
S 1 n S 1 n
S
2 1
2 2 1 1
c
+
+
=
Substituindo as quantidades
1
,
2
e por respectivamente,
1
x ,
2
x e
c
S , tem-
se que a Funo Discriminante Linear Amostral de Fisher para duas populaes dada
por:
( ) x S ' x x x '

y
1
c 2 1

= = l (242)
A estimativa do ponto mdio entre duas mdias amostrais univariadas,
1 1
x '

y l = e
2 2
x '

y l = dada por:
( ) ( ) ( )
2 1
1
2 1 2 1
x x S ' x x
2
1
y y
2
1
m + = =

(243)
E a regra de classificao mostra que se deve:
- alocar
0
x em
1
se:
100
( ) m x S x x y
0
1
c 2 1 0
)

=

ou 0 m y
0

)

- alocar
0
x em
2
se:
0 m y
0
<
)

2.4.3.4. Regresso logstica: modelo para variveis dicotmicas.
2.4.3.4.1. Introduo

A regresso logstica, consiste em relacionar, atravs de um modelo, uma varivel
resposta Y, dicotmica, com os fatores (X
1
, X
2
,..., X
p-1
) que influenciam as ocorrncias de
determinado evento. Por exemplo, em um estudo para se quantificar a influncia de certos
fatores na ocorrncia de doenas do fgado (colestase), a varivel resposta Y ser
dicotmica, isto , presena de cncer (Y=1) ou presena de clculo (Y=0) e os fatores
sero, por exemplo, x
1
= bilirrubina total, x
2
= fosfatase alcalina, etc. Os fatores so as
covariveis do modelo e correspondem aos nveis quantitativos obtidos nos exames
bioqumicos, etc. (CHAVES NETO, 2004 p.61-64).
Quando a varivel resposta dicotmica (Y = 1 ou 0) o Modelo Linear Geral no
deve ser aplicado principalmente por duas razes:
1. produzir valores fora do intervalo [0,1]
2. as varincias das observaes no sero constantes

2.4.3.4.2. Modelo logstico linear simples

Seja o modelo linear logstico simples (uma covarivel) derivado da funo
matemtica chamada de sigmide
y
e 1
1
) y ( f

+
= , yR. (244)
que varia monotonicamente de 0 a 1 medida que y cresce, sendo simtrica em torno de
y = 1/2.
claro que:
y
y
y
e 1
e
e 1
1
) y ( f
+
=
+
=

(245)
101

e ainda a transformao LOGIT
(

+
+
=
(

=


1 y
1 y
) e 1 ( 1
) e 1 (
ln
)) y ( f 1 (
) y ( f
ln ) y ( f
LOGIT
(

+
+
+
=
(

+
=

y
y
y y y
e 1
1 e 1
e 1
1
ln )
e 1
1
1 (
e 1
1
ln ) y ( f
)) e 1 ln( ( ) y ( ) e 1 ln(
e 1
e
/
e 1
1
ln
y y
y
y
y

+ + =
(

+ +
=
) e 1 ln( y ) e 1 ln(
y y
+ + + + = y = (246)
Ento, impondo um Modelo de regresso logstico linear para estimar P(Y=1) =
p(x) (tratando o caso linear simples, somente com uma varivel explicativa), tem-se o
modelo dado por:
LOGIT p(x) = =
0
+
1
x que o nosso y.
A aplicao desse modelo para x = 0 resulta:
y
y
0
0
e 1
e
forma da
e 1
e
e 1
e
) 0 x | 1 Y ( P ) 0 ( p
0
0
1 0
1 0
+ +
=
+
= = = =
+
+



. (247)

2.4.3.4.3. Modelo logstico linear mltiplo

Quando o interesse est em se estabelecer a relao entre a varivel resposta Y e as
diversas covariveis (variveis explicativas) X
1
, X
2
,...,X
p-1
que podem representar fatores
de interesse, o modelo logstico linear mltiplo tem a forma:
LOGIT p(x) =
0
+
1
x
1
+
2
x
2
+ ...+
p-1
x
p-1
=
ou
) e 1 (
1
) e 1 /( e ) x ,... x , x ( p ) x ( p
u
u u
1 p 2 1

+
= + = = (248)
onde =
0
+
1
x
1
+
2
x
2
+ ...+
p-1
x
p-1
= x .
O mtodo de estimao de mais indicado, segundo MARQUES & LIMA
(2002, p.55) o estimador de mxima verossimilhana atravs do mtodo de Levenberg-
Marquart. Este mtodo aplica-se nos extremos dos mtodos de Newton e do gradiente,
isto , utiliza gradiente quando se est longe do mnimo e distante da soluo caso
102
contrrio usa o mtodo de Newton. Combina os dois mtodos atravs da alterao dos
elementos da diagonal principal da matriz hessiana. O processo iterativo e ser
finalizado quando dois critrios de parada so satisfeitos. O primeiro obtido analisando-
se as derivadas parciais da funo de logverossimilhana, sendo que a soma dos valores
observados deve ser igual soma dos valores estimados. O segundo est relacionado com
o fato de que uma nova soluo no deve ser alterada no valor da funo de
logverossimilhana.
Estimados os parmetros a regra de classificao dada a seguir.
Seja duas populaes
1
e
2
, a probabilidade de um indivduo pertencer a
1

P(Y=0)=1- ) x ( p e a
2
P(Y=1)= ) x ( p . A alocao de um novo indivduo poder ser
feita calculando

x
'
0 0
= e determinando a funo distribuio da logstica, obtem-se
probabilidade dada por

) e 1 (
1
) x ( p
0
u
0

+
= (249)
que corresponde um valor entre 0 e 1. Portanto a regra de alocao dada por:
- para ) x ( p
0
0,5 alocar o indivduo em
1
(Y=0)
- para ) x ( p
0
> 0,5 alocar o indivduo em
2
(Y=1)

2.4.4. Reconhecimento e Classificao para Vrias Populaes.
2.4.4.1. Introduo

Segundo CHAVES NETO (2003, p.43), a generalizao de procedimentos
estatsticos de reconhecimento de padres classificao, na teoria, de 2 ou g 2 grupos
direta. Contudo, no se conhece muito sobre as propriedades das funes amostrais e em
particular, suas taxas de erro no foram totalmente investigadas.
A robustez da funo de reconhecimento de padres linear para 2 grupos, por
exemplo, em matrizes de covarincias diferentes e distribuies no-normais pode ser
estudada atravs de experimentos gerados por meio de computador. Para mais que duas
populaes esta abordagem no leva a concluses gerais, porque as propriedades
103
dependem de onde os grupos esto localizados e existem muitas configuraes para
serem estudadas convenientemente.

2.4.4.2 Mtodo de mxima verossimilhana para vrias populaes populaes
gaussianas e matrizes de covarincias diferentes

O desenvolvimento do mtodo deriva da funo penalidade, que avalia as
decises incorretas (MLLER, 1997, p.14).
Seja x um vetor de variveis aleatrias pertencentes a uma classe
k
(no caso
cores); ( )
k
x p a probabilidade condicional de x ocorrer nessa classe (ou populao) e
( )
k
p a probabilidade "a priori" da classe.
Ento, ( ) k i a funo perda, funo penalidade que designa a perda de
alocao na classe
i
quando de fato ( ) k i pertence a
k
. Sendo, ( ) k i uma varivel
do tipo dicotmica, temos:
( )

=
k i , 1
k = i , 0
k i m , 1,2, = k i, L
Determinando-se a mdia de ( ) k i e considerando todas as possibilidades de
k
,
obtem-se a perda mdia condicional apresentada abaixo para o caso multivariado, onde
foi aplicado a esta varivel aleatria discreta a definio de esperana matemtica.
( ) ( ) ( ) x p .
k
m
k i

1 = k
i x
k i = L
(250)
Esta funo se refere a uma perda acumulada decorrente de valores observados de
x que venham de algumas das classes avaliadas, de maneira que se pode relacionar as
funes de perda avaliadas de todas as classes para a classe
i
. Ento, a regra de deciso
que minimiza a perda mdia condicional chamada de "Classificador timo",
"Classificador Bayesiano" (MOIKE,1980) ou "Otimizao de Bayes" (RICHARDS;1986)
autores citados em MLLER (1997, p.15) dada por:
104

( ) ( )
i k
m ..., 2, 1, = i
m , 2, 1, = k , x L se x
i i

< L
k
, x L
(251)
Geralmente, ( ) x p
k
dita probabilidade "a posteriori" e pode-se determin-la
em termos das funes distribuio de probabilidade das classes ( )
k
x p , utilizando o
Teorema de Bayes como segue:
( )
( ) | |
( ) x p
p . x p
x p
k k
k

= (252)
Aplicando o teorema acima na equao da perda mdia condicional tem-se:
( )
( )
( ) ( ) ( )
k k
m
k
i x
p x p
x p
L . . k i
1
=
1

=
(253)
fazendo:
( ) ( ) ( ) ( )
k k
m
k
i x
p x p . . k i =
1

=
l (254)
fica-se com a expresso:
( )
( )
( )
i x i x
x p
L l .
1
= (255)
Dado que ( ) x p comum para todas as classes, a deciso pode ser tomada
somente com base em ( )
i x
l .
Para este caso pode-se definir a funo de perda como ( )
ik
- 1 k i = com 1 =
ik

e
ik
com k i . Assim pode-se expressar:
( ) ( ) ( ) ( ) ( )
k k
m
k
ik k
m
k
k i x
p . x p . p . x p

= =
=
1 1
l (256)
sabendo ser : ( ) ( )
k
m
k
k
p . x p ) x ( p

=
=
1
, pelo teorema da probabilidade total e fazendo:
( ) ( )
k k
m
k
ik i
p . x p . ) x ( g

=
=
1
tem-se que:
( ) ( ) ( ) x g x p
i i x
= l
Novamente, pode-se retirar a probabilidade ( ) x p comum para todas as classes no
afetando na classificao, fica-se com a igualdade:
105
( ) ( ) x g
i i x
= l
Sabendo-se que ( )
i x
l procede da expresso ( )
i x
L e que representa a perda
mdia condicional, assim o sinal negativo da expresso acima nos indica que quanto
maior for ( ) x g
i
menor ser a perda, ento:
( ) ( ) i j se
i
> x g x g x
j i
(257)
conveniente, segundo MLLER (1997, p. 16), fazer
ik ik
= que a funo
delta de Kroneker definida por:

=
k i para 0
k = i para 1
ik

(258)
Nestas condies a expresso de ( ) x g
i
fica:
( ) ( ) ( )
i i i
p . x p x g = (259)
e a regra de deciso :
( ) ( ) ( ) ( ) i p . x p p . x p x
j j i i
> j se
i
(260)
Esta regra mais aceitvel desde que ( )
k
x p sejam conhecidos atravs do
treinamento dos dados.
Assumindo que as distribuies de probabilidade de cada classe so da forma
gaussiana multivariada, tem-se que:
( ) ( )
( )
( ) ( ) { }
i
i i
n
i
x x exp . x p

1
1
2
1
2
2
1
2 (261)
Onde
i
e
i
so respectivamente o vetor mdio e a matriz de covarincia dos
dados da classe
i
que geralmente so desconhecidos, ento a partir de uma amostra de
tamanho
i
n da populao
i
pode-se obter as respectivas estimativas :

=
=
i
n
r
ir
i
i
x
n
x
1
1
(262)
( )( )

= =

=
m
i
n
r
i ir i ir i
i
x x x x S
1 1
(263)
Ainda, sabendo ser o resultado ( ) 2 ln
2
n
comum para todos ( ) x g
i
, tem-se a
expresso:
106
( ) ( ) ( ) ( )
i i i i i i
x x S x x S ln p ln x g

=
1
2
1
2
1
(264)
Como ( )
i
p suposta desconhecida, assume-se que todas as classes tenham
igual probabilidade de ocorrer; pode-se ento retirar esse fator, o que resultar em mais
um fator comum a ser eliminado (
1
2
), pois estes no afetam na deciso para a
classificao. Assim a funo discriminante amostral de mxima verossimilhana dada
por:
( ) ( ) ( )
i i i i i
x x S x x S ln x g

=
1
(265)
E a regra de deciso fica:
( ) ( ) ( ) ( )
j j j j i i i
x x S x x S ln x x S x x x

>


1 1
i i
S ln - se (266)

2.4.4.3 Mtodo linear de Fisher para vrias populaes populaes no necessariamente
gaussianas e matrizes de covarincias iguais

O mtodo discriminante de Fisher para vrias populaes uma extenso do
mesmo mtodo para duas populaes. Portanto, esta regra pode ser estendida para vrias
populaes que no necessariamente tenham a mesma distribuio de probabilidade,
entretanto necessita-se da suposio de que as matrizes das diversas populaes sejam
iguais; isto , = = = =
g 2 1
... .
Seja o vetor mdio combinado dos grupos e
0
B a soma dos produtos cruzados
"entre" os grupos populacionais, tais que:

=
=
g
i
i
g
1
1

(267)
( )( )

=
g
i
i i
B
1
0
(268)
onde se considera a combinao linear X ' Y l = e obtem-se o valor esperado que se
segue:
( ) ( )
i
i
' X ' Y l l = = (269)
para a populao
i
e a varincia:
107
( ) ( ) l l l l = = ' X Cov ' Y Var (270)
para todas as populaes
Ento, a mdia global para todas as populaes dada por:
' '
g g
g
i
i
g
i
iY
y
l l = = =

= = 1 1
1 1
(271)
e a razo entre a soma dos quadrados das distncias de todas as populaes para a mdia
global de Y e a varincia de Y dada por:
( ) ( )
( )( )
l l
l l
l l
l l
l l
l l

|
|
.
|

\
|


=



=
= =
'
B '
'
'
'
' '
g
i
i i
g
i
i
Y
g
i
y
iY
0
1
1
2
2
2
1


(272)
Essa razo mede a variabilidade "entre" os grupos de valores relativos Y com a
variabilidade comum "dentro" dos grupos.
Analogamente para o caso de 2 populaes, pode-se selecionar l para maximizar
a razo acima. Para tanto conveniente normalizar l de tal maneira que 1 = l l' .
Seja 0 ...
s 2 1
> , tal que ( ) p , 1 g min s autovalores no nulos de
0
1
B

e
s
e ,..., e , e
2 1
os autovetores correspondentes normalizados, tal que 1 = e e .
Ento o vetor dos coeficientes l que maximiza a razo:

( )( )
l l
l l
l l
l l


=
'
'
'
B '
g
i
i i
1
0

(273)
dado por
1 1
e = l . A combinao linear X '
1
l chamada de 1.discriminante.O valor
2 2
e = l maximiza a razo anterior, sujeito a covarincia ( ) 0
2 1
= X ' , X ' Cov l l e a
combinao linear X '
2
l chamada de 2o.discriminante. Continuando, tem-se que
k k
e = l maximiza a razo sujeita a ( ) 0 = X ' , X ' Cov
i k
l l , para todo k i < . Aqui
=
2
1
2
1
chamado de k-simo determinante e para todos os discriminante a
varincia igual a unidade.
A prova desse resultado dado pelo Teorema da Decomposio Espectral, onde
temos que P P = onde P o vetor de autovalores e uma matriz diagonal com
elementos positivos,
i

.
108
Sabendo que :
P P
2
1
2
1

=
uma matriz raiz quadrada simtrica e que sua inversa dada por:
P P
2
1
2
1

=
satisfaz as propriedades,
1. =
2
1
2
1

2.
2
1
2
1
2
1
2
1
= =


3.
1
2
1
2
1


=
Fazendo l
2
1
= a ento:
l l l l = = ' ' a a
2
1
2
1

e
l l l l
0
2
1
2
1
0
2
1
2
1
2
1
0
2
1
B ' B ' a B a = =


Conseqentemente, o problema se reduz a maximizao expressa em a:

a a
a B a
2
1
0
2
1



(274)
Pelo teorema de maximizao de formas quadrticas para pontos em uma unidade
esfrica, tem-se o mximo da razo em
1
que o maior autovalor de
2
1
0
2
1
B

.
Este mximo ocorre quando
1
e a = ,o autovetor normalizado associado com
1
. Porque
se:
1
2
1
1 1
2
1
1
e a e = = = l l
ento:
( ) 1
1 1
2
1
2
1
2
1
2
1
1 1
2
1
2
1
1 1 1 1
= = = = =

e e e e e e ' ' X ' Var l l l
Sabendo-se ser a perpendicular a
1
e e que maximiza a razo
a a
a B a
2
1
0
2
1



.
Ento quando
2
e a = este ser o autovetor normalizado correspondente para
2
. Assim:

109
2
2
1
2
e = l
( ) 0
1 2 1
2
1
2
1
2 1 2 1 2
= = = = e e e e ' X ' , X ' Cov l l l l
desde que
1 2
e e .
Similarmente teremos ( ) 1
2 2 2 2 2
= = = e e ' ' Var l l l e continuando neste mesmo
raciocnio temos que
k
e a = maximiza a razo
a a
a B a
2
1
0
2
1



sendo
1 2 1

k
e , , e , e a L e
k k
e
2
1

= l satisfaz:
( )

= = = =

k = i se 1
k < i se 0
2
1
2
1
i k i k i k i k
e e e e ' X ' , X ' Cov l l l l
Ento, se e e so respectivamente autovalores e autovetores de
2
1
0
2
1
B
,tem-se:
e . e . B =

2
1
0
2
1

e multiplicando os dois termos por
2
1

fica:
e e B
2
1
2
1
0
2
1
2
1

=
Ento,
0
1
B

tem os mesmos autovalores que


2
1
0
2
1
B

, mas os
correspondentes autovetores so proporcionais a l =

e
2
1
, como se afirmou.
Assim, 1
2
1
2
1
= = =

e e e e ' l l e as combinaes lineares
X ' , , X ' , X '
s
l L l l
2 1
, correspondem a autovalores no nulos de
0
1
B

, formando uma
srie de discriminantes com :
( ) 1 = X ' Var
i
l
( ) k i X ' , X ' Cov
k i
= para 0 l l
Sabendo que
i
e so geralmente desconhecidos, pode-se ento treinar uma
srie de observaes corretamente classificadas. Supondo ser a srie treinada uma
amostra aleatria de tamanho
i
n da populao
i
, onde g ,..., 2 , 1 i = , tem-se o vetor de
mdia amostral dado por:
110

=
=
i
n
j
ij
i
i
x
n
x
1
1

e o vetor de mdia global definido abaixo, oriundo do vetor mdio obtido de todas as
observaes de uma srie treinada.

=
= =
=
=
= =
g
i
i
g
i
n
j
ij
g
i
i
g
i
ij i
n
x
n
x n
x
i
1
1 1
1
1

A matriz
0
B que corresponde a matriz soma dos produtos cruzados "entre" os
grupos populacionais pode ser estimada por:
( )( )

=
g
i
i i
x x x x B
1
0
)

A estimativa de se baseia na matriz de soma dos produtos cruzados "dentro"
dos grupos amostrais apresentada abaixo, onde
i
S a matriz de covarincia de cada
grupo:
( ) ( )( )

= = =

= =
g
i
n
j
i ij i ij
g
i
i i
i
x x x x S n W
1 1 1
1
Ento a estimativa de chamada de matriz de covarincia conjunta dada por:

( ) g n ... n n
W
S
g 2 1
c
+ + +
= =
)

Tendo em vista que o mesmo l

que maximiza
l l
l l

S '

'

'

c
0
tambm maximiza
l l
l l

W '

'

0
, ento se pode apresentar a otimizao de '

l na forma de autovetores,
i
e de
0
1
B

W

porque se e .

e B

W =

0
1
ento:
( )e . g n ... n n . e B

S
g c
+ + + =

2 1 0
1

)

Portanto o discriminante amostral de Fisher para vrias populaes pode ser
definido como:
Seja 0 .

, , .

, .

s 2 1
> L os autovalores no nulos de
0
1
B

W

e
s
e , , e , e L
2 1
os
correspondentes autovetores.
111
Ento, o vetor de coeficientes '

l que maximiza a razo


l l
l l

W '

'

0
dado por
1 1
e

= l e a combinao linear x e x '

2 1
= l chamada de 1
o
. Discriminante Amostral;
2 2
e

= l produz o 2
o
.Discriminante Amostral x e x '

2 2
= l , generalizando tem-se que
x e x '

k k
= l o k-simo Discriminante Amostral para s k .
O resultado fornece subsdios para classificar novos valores a partir do clculo das
distncias euclidianas entre o valor da funo discriminante no ponto selecionado e os
valores das funes discriminantes dos valores mdios dos grupos (populaes), ento a
populao escolhida a que tenha menor distncia. Para tanto, segue a regra:
Alocar x na populao
k
se:
( ) ( ) | | ( ) | | k i
2
1
2
1
2
1
=

= = =
r
j
i j
r
j
k j
r
j
kj j
x x '

x x '

y y l l (275)
onde: x

y
j j
l = e
k j kj
x

y l = com s r

2.4.4.4 Mtodo distncia mnima populaes no necessariamente gaussianas e
matrizes de covarincias iguais

O mtodo de distncia mnima classifica um indivduo de uma classe em
particular com base na classe de mdia mais prxima.
Este mtodo um caso particular do mtodo de mxima verossimilhana descrito
na seo 2.3.4.1, este considera as matrizes de covarincia de todas as classes como
diagonais e iguais e ainda as varincias de cada componente como idnticas ou
relativamente prximas, assim tem-se que:
I
2
i
= para o caso populacional
I s S
2
i
= para o caso amostral
onde:
i
= matriz de covarincia populacional da classe i

i
S = matriz de covarincia amostral da classe i

2
= varincia populacional

2
S = varincia amostral
112
I = matriz identidade
Dada a funo discriminante de mxima verossimilhana amostral tem-se:
( ) ( ) ( )
i i i i i
x x S x x S ln x g

=
1
(276)
onde
i
x = mdia amostral da classe i, pode-se substituir S
i
por s
2
I para todo i e
tem-se:
( ) ( ) ( )
i i i
x x I s x x I s ln x g

=
2 2
(277)
Sendo s
2
I constante para todas as classes e um fator que no discrimina, pode
assim ser eliminada da funo gerando o que se chama de distncia quadrtica que dada
pela expresso:
( ) ( )
i i i
x x . x x ) x , x ( d

=
2
(278)
Desta maneira a classificao pode ser feita com base na regra:
( ) ( ) ( ) ( ) j i , se

<


j j i i i
x x x x x x x x x
ou
( ) ( ) j i , x , x d < x , x d se
2
j
2
i

i
x (279)
Quando se deseja alocar um novo ponto, conclui-se que este deve ser classificado
na classe que possua a menor distncia quadrtica euclidiana.

2.4.4.5 Mtodo distncia Mahalanobis populaes no necessariamente gaussianas e
matrizes de covarincias iguais

Dada a expresso ( ) ( )
i
i
1
i
i
i
Q
i
p ln x x
2
1
ln
2
1
) x ( d +

=

, g , 2, , 1 i L = ,
assume-se varincias iguais para as vrias populaes. Deve-se reconhecer x como
i
se
( ) ( )
i
i
i
i
p ln x x +




1
2
1
tiver o maior valor para i. Se as probabilidades a priori
so desconhecidas assume-se p
i
= 1/g. A expresso ( ) ( )
2
i
1
i
i
D x x =


conhecida
113
como distncia de Mahalanobis do vetor x ao vetor
i
. Ento para o caso real (amostral)
0
x ser reconhecido como de
k
se
i 0
2
i
p ln ) x ( D
2
1
+ for o maior i.

2.4.5. Avaliao de Desempenho de Classificao

Segundo MLLER (1997, p.30), a classificao constituda de duas etapas,
primeiramente se faz uma amostragem de dados para as vrias classes de interesse, ento se
determina atravs de funes discriminantes os limites que as separam. Este processo
conhecido na rea computacional como de treinamento e aprendizado, mas na realidade
trata-se do ajuste de um modelo.
A tcnica mais comumente usada retirar uma parte da amostra para treinamento
e outra para testar o discriminante. Elabora-se uma tabela de contingncia, denominada
de Tabela de Classificao e tambm chamada de matriz de erro de classificao ou
matriz de confuso (CHAVES NETO, 2003 p. 40), porm a ideal a de Lachenbruch.
Esta tabela ou matriz, verifica o relacionamento entre os dados de referncia, previamente
conhecidos, com os dados obtidos pelo classificador, onde as linhas dessa matriz
representam os dados de referncia e as colunas os mesmos dados treinados e
classificados pelo mtodo escolhido.
Para que se possa entender melhor esta tabela, selecionou-se, como exemplo, uma
amostra composta de trs grupos distintos (1, 2 e 3) e aplicou-se o mtodo de Fisher, cujo
resultado aparece na Tabela 6 que segue:

TABELA 6- TABELA DE CLASSIFICAO USANDO O MTODO DE FISHER
GRUPOS CLASSIFICADOS PELOS MTODO GRUPOS DE
REFERNCIA 1 2 3 Total
1 15(28,85%) 0(0,00%) 0(0,00%) 15
2 5(9,62%) 20(38,46%) 0(0,00%) 25
3 0(0,00%) 0(0,00%) 12(23,08%) 12
TOTAL 15 20 12 52
Fonte: Resultados obtidos no programa SIAVAL 1.0
Na matriz de erro, obtida da Tabela 6, as colunas se referem ao nmero de
amostras classificadas pelo mtodo e as linhas indicam os dados nos grupos referncia,
114
com isto os valores apresentados na diagonal principal mostra a quantidade de dados
corretamente classificados.
Desta maneira a tabela ou a matriz permitem retirar vrias concluses sobre a
performance, tais como o total de classificao correta para cada grupo, observado na
diagonal principal da tabela e fora desta pode-se obter os erros de excluso e incluso
como mostra a primeira linha da tabela onde o grupo 1 no foi classificada corretamente,
sendo considerada pelo classificador como grupo 2 em uma das amostras, caracterizando
um erro de excluso do grupo 1 e erro de incluso no grupo 2.
Somando-se os elementos da diagonal principal, correspondente ao total de
classificao correta, e dividindo pelo nmero total de amostras observados, ter-se- um
valor do percentual de acerto do classificador. Que no caso do exemplo dado por:
Percentual de Classificao Correta = % , x 38 90 = 100
52
12 + 20 + 15

A taxa de erro obtida dessa forma chama-se Taxa Aparente de Erro (CHAVES
NETO, 2003 p. 40). No a mais indicada para se avaliar o desempenho do modelo, pois
utiliza os mesmos dados usados no ajuste para fazer a avaliao. Um modo mais seguro
de se medir a eficincia de qualquer mtodo de reconhecimento e classificao o
Procedimento de Reteno de Lachenbruch.
O Procedimento de Reteno de Lachenbruch segundo JOHNSON & WICHERN
(1992 p. 498) retm uma observao das n disponveis e utiliza todas as restantes na
obteno das equaes do mtodo proposto. Classifica-se essa observao num dos
grupos propostos e anota-se este resultado. Repete-se este procedimento at que todas as
observaes forem retidas e a seguir coloca-se os resultados na tabela de classificao.
Para entender melhor o procedimento apresenta-se a seguir o algoritmo descrito
em MARQUES & LIMA (2002, p.56) para dois grupos de classificao e extendida aqui
para vrios grupos.
- Passo 1: Inicie com as observaes do grupo 1, omita uma observao desse grupo e
construa as funes de classificao usando as (n
1
1) restantes do grupo 1
acrescidas das n
p
observaes dos p grupos que compes a anlise, .
- Passo 2: Classifique a observao retida, usando as funes construdas no passo 1.
115
- Passo 3: Repita os passos 1 e 2 at que todas as observaes de todos os grupos sejam
classificadas e construa a tabela de classificao.
Como exemplo, utilizou-se os mesmos dados da Tabela 6 e fez-se a tabela de
classificao pelo Procedimento de Reteno de Lachenbruch apresentado na Tabela 7 a
seguir.

TABELA 7- TABELA DE CLASSIFICAO USANDO O MTODO DE FISHER E
PROCEDIMENTO DE RETENO DE LACHENBRUCH
GRUPOS CLASSIFICADOS PELOS MTODO GRUPOS DE
REFERNCIA 1 2 3 Total
1 15(28,85%) 0(0,00%) 0(0,00%) 15
2 4(7,69%) 20(38,46%) 1(1,92%) 25
3 0(0,00%) 2(3,85%) 10(19,23%) 12
TOTAL 19 24 11 52
Fonte: Resultados obtidos no programa SIAVAL 1.0
O percentual de classificao correta encontrado foi de 86,54%, que segundo
CHAVES NETO (2003, p.41) um percentual mais confivel e realista, dado que quando
as observaes foram classificadas elas no faziam parte do modelo ajustado.

116
3 MATERIAIS E MTODOS
3.1 INTRODUO

O programa computacional de avaliao proposto neste trabalho de fcil execuo
e possibilita fazer a anlise de itens de instrumentos, ranqueamento dos indivduos e
reconhecimento de novos destes indivduos em padres pr-estabelecidos. Este programa
um sistema integrado de metodologias estatsticas que so: Teoria de Resposta ao Item,
Anlise Fatorial e Reconhecimento de Padres e Classificao.
Com o intuito de mostrar o potencial de aplicao do programa foi proposto, neste
trabalho, uma avaliao na rea de educao (candidatos ao vestibular da Universidade X
e alunos do curso de Estatstica da Universidade Federal do Paran) e na rea de
Engenharia de Produo (fornecedores de empresas).
A metodologia utilizada no programa, a coleta de dados e a construo do programa
sero detalhadas nas prximas sees deste captulo.

3.2 MTODOS ESTATSTICOS DE ANLISE

O programa foi concebido com intuito de facilitar o trabalho de pesquisadores na
parte de estatstica e por isso os mtodos foram selecionados so os que apresentam
melhores resultados prticos e esto relacionados a seguir

3.2.1. Teoria Clssica dos Testes

A Teoria Clssica dos Testes foi introduzida no programa para anlise dos itens
do instrumento, descritas nos itens 2.1.3 e 2.1.4. Utilizou-se o coeficiente de correlao
de Kunder-Richardson para verificar a confiabilidade do instrumento e as correlaes
bisserial e bisserial por ponto que medem a capacidade de discriminao do item em
relao ao resultado do teste. Alm disso, outras estatsticas descritivas foram includas
no programa como mdias, desvio padres, quartis, etc.


117
3.2.2. Teoria da Resposta ao Item

O programa foi feito para analisar somente variveis dicotmicas ou com
possibilidade de serem dicotomizadas, por isso foram utilizados os Modelos Logsticos
de Dois e Trs Parmetros Unidimensionais Dicotmicos.
Selecionou-se para estimar os parmetros dos itens o Mtodo de Mxima
Verossimilhana Marginal com algoritmo EM, e a o Mtodo de Estimao Bayesiana da
Mdia a Posteriori ou Expected a Posteriori (EAP) para aferir as habilidades dos
respondentes. As habilidades so estimadas aps a retirada dos itens ruins, isto , que no
se ajustam ao modelo e destes foram calculados os escores verdadeiros dos respondentes,
conforme metodologia descrita no item 2.1.3.4.4, com os quais se proceder
classificao dos mesmos.
Aps a estimao dos parmetros pode-se obter no programa SIAVAL 1.0 os
grficos da Curva Caracterstica e a Funo de Informao dos itens.

3.2.2 Anlise Fatorial

A anlise fatorial que usada neste programa principalmente no caso de
ranqueamento de dados no dicotmicos. Portanto, utiliza a matriz de correlao de
Pearson e no a tetracrica, como seria o caso dicotmico.
Assim, no sistema de classificao, cada indivduo (empresa) representado por
um conjunto de respostas dos itens analisados, vetor do tipo X
j

| |
I
X X X L
2 1
=
com j = 1, 2, ..., n, onde I o nmero de itens e n o nmero de indivduos analisados.
As respostas aos itens do instrumento de cada indivduo (empresa) so
automaticamente armazenadas em um vetor X
j
, que posteriormente podero ser
sumarizadas na matriz de correlao (denotada por R) refletindo a estrutura do
relacionamento das componentes do vetor. Cada vetor (indivduo ou empresa) ser um
ponto no sistema cartesiano com I eixos.
A metodologia utilizada identifica novas variveis, chamadas de fatores, os quais,
se encontram em outro sistema de eixos ortogonais nas direes de maior variabilidade
dos dados, como se pode observar na Figura 15 a seguir.
118










FONTE: A AUTORA
FIGURA 15- ROTAO DOS FATORES

Os pesos
ij
l

sero obtidos dos autovetores da matriz de correlao e sero
considerados os k < I fatores que realmente tiverem importncia, medidos pelos
autovalores da matriz de correlao R ou seja aqueles com autovalores
i
> 1.
Cada vetor tem um escore em cada fator e que corresponde a sua posio no novo
sistema de eixos [f
1

f
2
... f
k
].
O ranqueamento do vetor (indivduo ou empresa) foi feito atravs do escore final
que corresponde mdia dos escores fatoriais, ponderada pelos autovalores que ditam a
importncia dos fatores, obtido atravs da equao que segue.
E
j
= (
1
f
1
+
2
f
2
+ ..... +
k
f
k
)/(
1
+
2
+ ...+
k
) (280)
Uma vez que um indivduo (empresa) deve ser avaliado, atribudo a cada
indivduo (empresa), um escore final para que todos os indivduos (empresas) avaliados
sejam, ento, classificados segundo uma escala de zero a cem que contenda todos os
escores, permitindo assim, uma completa avaliao sob os mais variados ngulos de
anlise.





Y
1
Y
2
X
1
X
2
119
3.2.3 Reconhecimento de Padres e Classificao

A alocao de um novo indivduo em um dos g grupos pr-definidos conhecido
como classificao e fundamenta-se na atribuio de classes para estes indivduos atravs
do processo denominado de Reconhecimento de Padres.
A Classificao se refere aos mtodos de atribuio de classes a determinados
conjuntos de dados atravs dos mtodos estatsticos e o Reconhecimento de Padres se
refere a alocao de um conjunto de variveis observveis nas suas devidas classes
correspondentes, feitas neste trabalho atravs de regras definidas para um do mtodo
citado a seguir.
O Mtodo Linear de Fisher foi deduzido com o propsito de separar vrias
populaes (classes) tanto quanto possvel, no sendo necessrio assumir que as
populaes sejam normais multivariadas; no entanto deve-se assumir que suas matrizes
de covarincia sejam iguais. A idia principal deste mtodo de transformar observaes
multivariadas ] X X X [ X
I
L
2 1
= ( I o nmero de itens) em combinaes lineares
univariadas Y
k
( k o nmero de classes), com intuito de reduzir a dimenso de um grande
nmero de caractersticas para relativamente poucas combinaes lineares.
Seja 0 .

, , .

, .

s 2 1
> L os autovalores no nulos de
0
1
B

W

e
s
e , , e , e L
2 1
os
correspondentes autovetores. Ento, o vetor de coeficientes '

l que maximiza a razo


l l
l l

W '

'

0
dado por
1 1
e

= l e a combinao linear x e x '

1 1
= l chamada de 1
o
.
Discriminante Amostral;
2 2
e

= l produz o 2
o
.Discriminante Amostral x e x '

2 2
= l ,
generalizando tem-se que x e x '

k k
= l o k-simo Discriminante Amostral para s k .
A regra de alocar x na populao
k
na menor distncia euclidiana dada por:
( ) ( ) | | ( ) | | k i
2
1
2
1
2
1
=

= = =
r
j
i j
r
j
k j
r
j
kj j
x x '

x x '

y y l l (281)
onde, x

y
j j
l = ,
k j kj
x

y l = e
j

l so os autovetores correspondentes aos autovalores


no-nulos da matriz
0
1
B

W

, onde
1
W

a matriz da soma de produtos cruzados dentro
120
dos grupos amostrais e
0
B

a matriz soma dos produtos cruzados entre os grupos


amostrais
Geralmente, quando se trabalha com reconhecimento de padro considera-se
algumas suposies acerca das populaes (grupos a serem discriminados).
Primeiramente, deve-se certificar se as populaes seguem uma distribuio gaussiana e,
a seguir, verificar se as varincias destas populaes so iguais. Neste trabalho os dados
supostamente so provenientes de uma nica populao, ento, as varincias entre os
grupos discriminados sero consideradas iguais. O mtodo no necessita que se trabalhe
com populaes gaussianas, isto facilita ao usurio, pois no necessita de nenhuma
interveno, basta que ele aplique o mtodo.

3.3 COLETA DE DADOS

A coleta dos dados para verificar a eficincia do programa ser apresentada nas
sees que seguem, detalhadas a cada um dos campos de estudo utilizados nesta tese.

3.3.1 Avaliao de Candidatos ao Vestibular e Evaso de Alunos do curso de Estatstica
da UFPR.
3.3.1.1 Coleta de dados

A partir de dados de uma Universidade U foi selecionada para anlise um teste da
matria M, dado que tem um nmero grande de respondentes (20.550) e itens (60), sendo
que cada item possui 5 alternativas.
Para determinar a evaso de alunos foram coletados dados de 163 ex-alunos
(sendo 155 para classificao e 8 de controle aleatoriamente escolhidos) do curso de
Estatstica da UFPR que iniciaram o curso atravs do vestibular nos anos de 1998, 1999 e
2000. O dados se referem s notas de trs disciplinas obtidas no primeiro semestre
cursado, escores no vestibular, dados scio econmicos e outras questes que se tinha
disponvel sobre os ex-alunos. As variveis analisadas esto descritas no Apndice 8.


121
3.3.1.2 Procedimentos de avaliao

Para a anlise dos itens do teste da matria M, aplicada na Universidade U, foi
usado o Modelo Logstico de Trs Parmetros Unidimensional, determinando os seus
parmetros (discriminao, dificuldade e acerto ao acaso), a funo de informao dos
itens e a funo de informao do instrumento. O coeficiente de confiabilidade e as
correlaes oriundas da Teoria Clssica so includos alm das estatsticas descritivas dos
itens. O ranqueamento dos candidatos foi feito utilizando a estimativa das habilidades dos
mesmos aps a retirada dos itens considerados ruins.
Na anlise de evaso foi utilizada a tcnica de Reconhecimento de Padres e
Classificao denominada Funo Discriminante Linear de Fisher para vrias populaes
(grupos). Os dados foram classificados em trs grupos: no terminaram o curso (evaso),
terminaram o curso com atraso e terminaram o curso no tempo certo.

3.3.2 Avaliao de Fornecedores
3.3.2.1 Procedimentos de avaliao.

O programa SIAVAL 1.0 desenvolvido neste trabalho possibilita o ranqueamento
das empresas fornecedoras, pois algumas empresas que avaliam seus fornecedores
costumam divulgar e premiar os melhores fornecedores e seria interessante que elas
conhecessem estas tcnicas estatsticas, caso elas no a utilizem.
Alm disso, pode-se verificar se um fornecedor recentemente includo no quadro
corresponderia s expectativas da empresa a longo prazo, para tanto as tcnicas de
Reconhecimento de Padres e Classificao descritas neste trabalho foram aplicadas.
A avaliao de fornecedores , hoje, uma atividade necessria s empresas e se
tornar rotineira, com o tempo e a facilidade de tcnicas.

3.4 ELABORAO DO PROGRAMA

O programa SIAVAL 1.0 foi elaborado em ambiente Windows, linguagem
computacional Visual Basic e de forma completamente genrica, ou seja, de tal modo que
122
um usurio leigo possa analisar instrumentos, ranquear e alocar novos indivduos
(empresas) com as variveis de seu interesse. Assim, pesquisadores e profissionais de
todas as reas que necessitem fazer avaliao possam facilmente manusear os programas.
A entrada de dados tem um formato da planilha Excel o que possibilidade uma
cpia dos dados diretamente de uma planilha Excel feita pelo usurio.
O fluxograma do programa, que a princpio denomina-se SIAVAL 1.0 (Sistema
Integrado de Avaliao, verso 1.0), apresenta-se na Figura 16 a seguir.
Os relatrios de sada so apresentados em grficos e em planilhas Excel para
facilitar o relatrio da anlise feita pelo usurio (pesquisador), exemplificados nas
Figuras 17 e 18.





















123



































FIGURA 16- FLUXOGRAMA DO PROGRAMA SIAVAL 1.0
A Figura 17 mostra parte do relatrio de sada da Anlise Fatorial do programa.
ABRIR O PROGRAMA
ESCOLHER ANLISE
ANALISAR
INSTRUMENTO
ANLISE FATORIAL
RANQUEAMENTO
ENTRADA DOS DADOS
RECONHECIMENTO
DE PADRES
ENTRADA DOS DADOS

ESCOLHER ANLISE
ENTRADA DOS DADOS
CONFIABILIDADE
ESTATSTICA ESCORES
3 PARM. 2 PARM.
SIM
TRI
ESTIMAR
HABILIDADES ?
NO
SAIR DO PROGRAMA
RELATRIO SADA
PARMETROS DOS
ITENS
RELATRIO
DE SADA
VER GRFICO DOS
ITENS?
SIM
NO
124

FIGURA 17- RELATRIO DE SADA DA ANLISE FATORIAL
Visualiza-se na Figura 18 um grfico tpico de sada da anlise de itens, a Curva
Caracterstica e a Funo de Informao de um item.

FIGURA 18- RELATRIO DA CURVA CARACTERSTICA E FUNO
DE INFORMAO DO ITEM NA TEORIA DA RESPOSTA
AO ITEM
Todas as telas do programa SIAVAL 1.0 podem ser vistas no Apndice 11.
125
4- RESULTADOS E DISCUSSO
4.1- AVALIAO DO INSTRUMENTRO DO TESTE DA MATRIA M DO
VESTIBULAR DA UNIVERSIDADE U E RANQUEAMENTO DOS ESCORES
VERDADEIROS DOS CANDIDATOS UTILIZANDO A TEORIA DA
RESPOSTA AO ITEM
4.1.1- Anlise do Teste da Matria M

Esse teste apresentou um ndice de confiabilidade de 89,20%, calculado pelo
programa SIAVAL 1.0, que utiliza a correlao de Kunder-Richardson, dada pela
equao 282 a seguir, j comentada na seo 2.1.3 deste trabalho. Essa confiabilidade
pode ser considerada boa, porm o ideal segundo a literatura um valor acima de 90%
(CHAVES & TURIN, p.51). Este valor da confiabilidade indica que nos 60 itens que
compem o teste existem poucos traos significativos de ambigidade e de textos que
conduzam a interpretaes diferentes, por partes dos candidatos, quanto soluo dos
itens (questes), ou seja:
)
s
) p 1 ( p
1 (
1 n
n
2
n
1 i
i i
KR

= (282)
onde:
n = nmero de itens do teste
p
i
= proporo dos respondentes que acertaram o item i
s
2
= varincia dos escores do teste com base nos N escores dos respondentes.
Observa-se na Tabela 8, que descreve o nmero de acertos dos candidatos nos 60
itens propostos no teste, que o nmero mdio de acertos resultou em 30,39 com um
desvio padro de 8,75. O nmero mnimo de acertos foi 0 (zero) e o mximo de 57.
Apresenta-se, tambm nessa tabela os quartis, sendo que o primeiro quartil (24) expressa
o mximo alcanado por 25% dos candidatos que tiveram menor nmero de acertos. J
nmero mximo alcanado pela metade dos candidatos (50%) o valor observado no 2.
Quartil, que corresponde tambm a mediana, e de 30 acertos. O terceiro quartil resultou
no valor 37 acertos representa o mximo alcanado por 75% dos candidatos, isto significa
dizer que apenas 25% dos candidatos acertaram mais de 37 dos itens aplicados.
126

TABELA 8- ESTATSTICAS DESCRITIVAS NMERO DE ACERTO DOS CANDIDATOS
ESTATSTICA NMERO DE ACERTOS
MDIA ARITMTICA 30,39
DESVIO PADRO 8,75
VALOR MNIMO 0
VALOR MXIMO 57
1. QUARTIL 24
2. QUARTIL 30
3. QUARTIL 37
FONTE: RESULTADO SIAVAL 1.0

A Figura 19 a seguir mostra o histograma do nmero de acertos dos respondentes.

FONTE: RESULTADO SIAVAL 1.0
FIGURA 19- HISTOGRAMA DO NMERO DE ACERTOS DOS CANDIDATOS

Observa-se no histograma do nmero de acerto dos candidatos que a distribuio
dos mesmos pode ser considerada aproximadamente normal e isto indica que o
instrumento utilizado no teste considerado bom, pois em geral espera-se que a varivel
do nmero de acertos siga a curva normal.



127
4.1.2- Anlise dos Itens do Teste da Matria M

Atravs do programa SIAVAL 1.0 estimou-se os parmetros de discriminao,
dificuldade e acerto aleatrio dos 60 itens do teste da matria M aplicada na Universidade
U. O mtodo de estimao utilizado pelo programa o de Mxima Verossimilhana
Marginal com algoritmo EM (Esperana e Maximizao) descrito na seo 2.1.3.4.2
deste trabalho. Esse mtodo ajusta o Modelo Logstico de Trs Parmetros
Unidimensional Dicotmico apresentado a seguir pela equao 283. Utilizou-se um
critrio de convergncia de 0,01 com restrio de parada em 10 ciclos, apresentadas na
Tabela 9 a seguir.

( )
i j i
b Da i i j ji
e
) c ( c ) / U ( P
+ 1
1
1 + = 1 =

(283)
onde:
P(U
ji
=1|
j
) = probabilidade do respondente j acertar o item i dado que ele possui uma
habilidade
j
.
U
ji
= resposta dada pelo respondente j ao item i.

j
= habilidade ou trao latente do respondente j.
a
i
= parmetro de discriminao do item i.
b
i
= parmetro de dificuldade do item i.
c
i
= parmetro de acerto casual do item i.
D = fator de escala geralmente igual a 1,7 para que a funo logstica fornea resultados
semelhantes ao da distribuio normal.









128
TABELA 9- ANLISE DOS ITENS DO TESTE DA MATRIA M DO VESTIBULAR DA
UNIVERSIDADE U
CORRELAO
ITEM
DISCRIMI-
NAO
a
i
DIFICUL-
DADE
b
i
ACERTO
CASUAL
c
i
CONVER-
GNCIA
PERCENTUAL
DE ACERTOS
BISSERIAL
BISSERIAL
POR PONTO
1 1,2286 -0,1069 0,1870 0,0009 61,05 0,4393 0,3457
2 1,1872 -1,6010 0,2299 0,0071 76,02 0,4192 0,3053
3 1,5358 -0,7153 0,1880 0,0037 67,45 0,5256 0,4062
4 0,9458 2,6094 0,1764 0,0172 29,27 0,3531 0,2657
5 0,9120 3,6437 0,0440 0,0174 20,09 0,3088 0,2158
6 0,8254 2,2867 0,2310 0,0117 38,67 0,3015 0,2358
7 1,1550 0,0691 0,1902 0,0014 59,38 0,4094 0,3240
8 0,9276 -1,3386 0,3360 0,0262 75,53 0,3191 0,2359
9 0,9922 1,9018 0,2253 0,0005 40,45 0,3649 0,2872
10 1,4814 2,3644 0,2154 0,0043 35,82 0,5230 0,4040
11 1,2302 -2,1218 0,1636 0,0072 80,21 0,4315 0,3033
12 0,8219 -0,2200 0,1908 0,0025 62,29 0,2918 0,2292
13 0,4749 4,9791 0,0594 0,0105 10,21 0,1574 0,0913
14 0,5943 3,1761 0,1417 0,0328 30,48 0,2337 0,1765
15 1,1335 -0,3450 0,1852 0,0013 63,52 0,4035 0,3165
16 0,8149 3,1050 0,0599 0,0118 24,26 0,2635 0,1911
17 1,2821 3,7364 0,0430 0,0042 22,22 0,4605 0,3280
18 0,5340 3,2066 0,2726 0,0416 36,99 0,1611 0,1248
19 0,7396 1,7136 0,2102 0,0116 45,11 0,2688 0,2138
20 1,6177 -1,0255 0,2021 0,0039 70,39 0,5539 0,4219
21 1,7545 -0,9772 0,1941 0,0050 69,82 0,5873 0,4513
22 1,3890 -1,1935 0,1878 0,0083 71,91 0,4788 0,3646
23 1,5136 -2,9674 0,1829 0,0096 87,88 0,5670 0,3674
24 1,4582 -0,7928 0,2035 0,0055 68,31 0,5075 0,3901
25 1,3597 -1,3977 0,1832 0,0048 73,85 0,4723 0,3553
26 0,6612 2,2794 0,2031 0,0048 39,33 0,2392 0,1879
27 1,1874 -3,2474 0,1900 0,0228 86,55 0,4440 0,2897
28 1,2560 1,9739 0,2251 0,0067 39,46 0,4390 0,3446
29 0,8330 -3,2420 0,1658 0,0099 37,21 0,2932 0,2290
30 1,4567 -1,4620 0,1959 0,0038 74,92 0,4988 0,3733
31 1,8022 -0,6938 0,1416 0,0026 65,97 0,6104 0,4772
32 1,4029 -0,8494 0,2257 0,0098 69,06 0,4908 0,3746
129
33 1,6737 -2,0020 0,1518 0,0073 79,22 0,5770 0,4098
34 1,4068 -0,5598 0,1868 0,0021 65,76 0,4887 0,3815
35 1,6889 -0,5465 0,1861 0,0021 65,39 0,5763 0,4488
36 0,1413 3,3797 0,0350 5,6791 18,51 -0,0090 -0,0061
37 0,4167 4,7241 0,0508 0,0206 12,76 0,1322 0,0793
38 0,8822 -4,7017 0,1929 0,0282 93,67 0,4288 0,2365
39 1,4506 -1,6100 0,1576 0,0071 74,77 0,5005 0,3738
40 0,7896 2,0443 0,3052 0,0111 41,92 0,2334 0,1839
41 1,5962 -0,0701 0,1943 0,0010 60,77 0,5415 0,4285
42 0,7435 3,0217 0,1872 0,0046 30,23 0,2780 0,2105
43 0,2515 -1,5133 0,2153 0,3438 64,92 0,0508 0,0398
44 1,3537 2,8778 0,2118 0,0041 30,60 0,4881 0,3683
45 0,9969 -0,8188 0,1888 0,0018 68,23 0,3522 0,2705
46 1,2654 0,2733 0,1926 0,0008 57,32 0,4469 0,3549
47 1,5721 -2,8195 0,1680 0,0097 86,25 0,5891 0,3807
48 0,0343 4,4643 0,0490 0,0535 18,36 0,1635 0,1108
49 1,7870 2,2875 0,2128 0,0023 36,85 0,6097 0,4729
50 0,7024 -0,0471 0,1794 0,0012 60,28 0,2457 0,1940
51 1,3711 1,3466 0,2245 0,0051 46,10 0,4747 0,3779
52 1,0106 1,9800 0,2378 0,0049 39,08 0,3716 0,2923
53 1,5110 4,1329 0,0356 0,0034 18,36 0,5569 0,3774
54 0,3018 4,6801 0,0970 0,0382 22,22 0,1142 0,0813
55 0,2895 1,4521 0,1848 0,0068 51,20 0,1106 0,0883
56 0,5317 3,9798 0,1578 0,0079 23,97 0,1412 0,1004
57 1,4515 2,6285 0,2146 0,0043 33,17 0,5131 0,3946
58 1,3373 -0,6675 0,1891 0,0016 66,73 0,4630 0,3600
59 0,5249 3,8475 0,1842 0,0237 25,73 0,1726 0,1255
60 0,0188 4,7582 0,0431 0,1070 13,27 -0,0484 -0,0302
FONTE: RESULTADO DA ANLISE FEITA NO SIAVAL 1.0

Apresenta-se, tambm nessa tabela o percentual de acertos observados em cada
item e as correlaes bisserial e bisserial por ponto com intuito de auxiliar a anlise dos
itens. Alm disso, consta no Apndice 9 os grficos da Curva Caracterstica e da Funo
de Informao de cada item.
130
O parmetro ndice de discriminao do item, em termos prticos, varia de 0 a 2.
Assim interpretou-se um baixo ndice de discriminao um valor menor de 0,5.
Considerou-se no parmetro de dificuldade, um intervalo prtico de -4 a +4 na sua
estimao. Portanto, quanto mais prximo de -4 mais fcil o item e de +4 mais difcil e
conseqentemente os valores em torno de zero representam um item de mdia
dificuldade. Como o parmetro de acerto aleatrio depende do nmero de alternativas dos
itens, o valor ficou em torno de 0,20, dado que cada item possibilitou 5 alternativas de
resposta.
Observa-se que os itens 13, 36, 37, 43, 48, 54, 55 e 60 apresentaram
discriminao abaixo de 0,50, cujos valores so respectivamente 0,4749; 0,1413; 0,4167;
0,2515; 0,0343; 0,3018; 0,2895 e 0,0188. Desses tm-se que os itens 36, 43 e 60 no se
ajustaram ao modelo,pois que no convergiram corretamente. Dado que o critrio de
convergncia foi de 0,01 os itens 36, 43 e 60 no apresentaram convergncia e obtiveram
um valor de respectivamente de 5,6791; 0,3438 e 0,1070. Na Teoria Clssica dos Testes,
citada na seo 2.1.4, quando um item tem discriminao baixa possui correlao
bisserial e bisserial por ponto tambm baixa, assim constata-se isso nos itens citados o
que d uma consistncia a estimao dos parmetros dos itens feita pelo programa
SIAVAL 1.0.
Examinando os grficos, expostos nas Figuras 20 a 27 correspondentes aos itens 13,
36, 37, 43, 48, 54, 55 e 60 percebe-se que no so itens bons e afetam negativamente o
desempenho do instrumento.
131

FIGURA 20- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 13
O item 13 alm de apresentar o parmetro de discriminao 0,4749 considerado neste
trabalho como baixo tem um ndice de dificuldade 4,9791, conseqentemente um item
difcil evidenciado pelo menor percentual de acertos dos itens de 10,21% e o acerto
casual foi baixo (0,0594). Olhando a Figura 20 percebe-se que a Funo de Informao
do Item no apresenta o formato de uma distribuio normal.

FIGURA 21- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 36
132
A Figura 21, mostra claramente que o item 36 no se ajustou ao modelo, pois
apresenta a Curva Caracterstica do Item e a Funo de Informao do Item como retas,
assim deve-se desconsiderar os resultados obtidos no ajuste dos seus parmetros.

FIGURA 22- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 37
Apresentando parmetro de discriminao igual a 0,4167, de dificuldade igual a
4,7241 e de acerto casual igual a 0,0508, nota-se na Figura 22 que o item 37 muito
difcil e apresenta pouca discriminao, portanto no considera um bom item.

FIGURA 23- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 43
133

Apesar do item 43 ser um item relativamente fcil, dado que seu parmetro de
discriminao igual a -1,5133, apresentou pouca discriminao (0,2515) com
probabilidade de acerto casual alta (0,2153). Na Figura 23, observa-se que a Funo de
Informao do Item no apresenta o formato de uma distribuio aproximadamente
normal, portando considera-se que o item pode prejudicar o julgamento dos candidatos.


FIGURA 24- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 48

Os Grficos apresentados na Figura 24 referente ao item 48 no apresentam bom
comportamento e isso se verifica dado que esse item difcil (b
48
= 4,4643) com pouca
discriminao (a
48
= 0,0343) e possibilidade de acerto aleatrio baixa (c
48
= 0,0490).
134

FIGURA 25- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 54

O item 54, caracterizado pelos grficos da Figura 25, apresenta parmetro de
discriminao igual a 0,3018, de dificuldade igual a 4,6801 e de acerto casual de 0,0970.
um item difcil com discriminao baixa e possibilidade de acerto aleatrio baixa,
consequentemente no um item considerado bom.


FIGURA 26- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 55

135
Apesar do item 55 possuir um parmetro de dificuldade razovel (b
55
= 1,4521)
um idem de pouca discriminao (a
55
= 0,2895), de modo que a sua respectiva Funo de
Informao no se ajustou corretamente a uma distribuio gaussiana, portanto que esse
item afeta desfavoravelmente o instrumento.


FIGURA 27- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 60

A Figura 27 representa a Curva Caracterstica e Funo de Informao do item 60.
Observa-se que ele no se ajustou ao modelo, dado que no apresentou convergncia,
portanto deve ser retirado do instrumento para estimao do escores verdadeiros dos
candidatos.
A ttulo de exemplificao, do que seria um item de desempenho mdio e bom no
teste, apresenta-se a seguir as anlises dos itens 57 e 35 acompanhadas seus dos grficos.

136

FIGURA 28- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 57

O item 57 apresentou um parmetro de discriminao 1,4515, de dificuldade igual
a 2,62858 e acerto aleatrio igual a 0,2146. Apesar apresentar boa discriminao o item
relativamente difcil e tm alto percentual de acerto aleatrio, portanto o item possui
mdio desempenho.


FIGURA 29- GRFICO DA CURVA CARACTERSTICA E FUNO DE
INFORMAO DO ITEM 35
137

O parmetro de discriminao do item 35 possui um valor alto de 1,6889, mdia
dificuldade (-0,5465) e acerto aleatrio de 0,1861. Observando os grficos da Figura 29,
pode-se observar que a Curva Caracterstica configura um curva logstica perfeita e a
Funo Caracterstica uma normal leptocrtica significando que as habilidades so bem
representadas pelo seu valor mdio e o desvio padro pequeno, portanto esse item
considerado bom.
Para o clculo das habilidades dos respondentes foram retirados os itens 13, 36, 37,
43, 48, 54, 55 e 60. A partir deste clculo obtem-se os escores verdadeiros e foi feito o
ranqueamento dos candidatos descrito na seo 4.1.3 a seguir.

4.1.3- Ranqueamento dos Candidatos utilizando Escores Verdadeiros

Os escores verdadeiros (colocados numa escala de 0 a 100) foram calculados
utilizando os conceitos apresentados na seo 2.2.4, que consiste na soma dos itens certos
de cada candidato considerando a probabilidade de acerto dos itens utilizando as
habilidades obtidas pelo Mtodo de Estimao Bayesiana da Mdia a Posteriori descrito
na seo 2.2.3.4.3.3. O ranqueamento feito pelo programa SIAVAL 1.0 e parte dele
apresentado na Tabela 10 a seguir, dado que seria invivel colocar a classificao de
todos os 20.550 candidatos.









138

TABELA 10- RANQUEAMENTO DOS ESCORES VERDADEIROS
RANQUEAMENTO CANDIDATO ESCORE VERDADEIRO
1 9730 85,67595
2 9923 85,60762
3 6665 85,44853
4 8393 84,22240
5 3773 83,56939
6 15646 83,06105
7 8821 82,94101
... ... ...
20543 18107 3,3166
20544 14347 3,1507
20545 15595 3,0599
20546 15158 2,9072
20547 13413 2,7333
20548 3729 0,9485
20549 9299 0,8884
20550 3089 0,0000
FONTE: RESULTADO DA ANLISE OBTIDA NO SIAVAL 1.0

O histograma dos escores verdadeiros feito no SIAVAL 1.0 pode ser visto na
Figura 29 que segue.


FONTE: RESULTADOS DO SIAVAL 1.0
FIGURA 30- DESCRIO DOS ESCORES VERDADEIROS
139

Observa-se na Figura 30 que os dados encontram-se concentrados esquerda o
que indica que o escore mdio baixo. As estatsticas descritiva dos escores verdadeiros
so apresentados a seguir na Tabela 11.

TABELA 11- ESTATSTICAS DESCRITIVAS DOS ESCORES VERDADEIROS DOS
CANDIDATOS
ESTATSTICA ESCORES VERDADEIROS
MDIA ARITMTICA 33,6204
DESVIO PADRO 14,6820
VALOR MNIMO 0
VALOR MXIMO 85,6759
1. QUARTIL 22,4760
2. QUARTIL 33,7776
3. QUARTIL 43,1724
FONTE: RESULTADO SIAVAL 1.0

O valor mximo que poderia ser alcanado nos escores verdadeiros seria de 1,
obteve-se, porm que o valor mximo alcanado no teste foi de 85,6759 e mnimo de 0. A
mdia dos escores verdadeiros foi de 33,6204 e o desvio padro de 14,6820. Quando aos
quartis tm-se 25% dos candidatos tiveram escores abaixo de 22,4760, 50% abaixo de
33,7776 e apenas 25% acima de 43,1724.

4.2- EVASO DE ALUNOS DO CURSO DE ESTATSTICA DA UFPR

No processo educacional o fenmeno de evaso extremamente preocupante, tanto
no ensino mdio, quanto no ensino superior. Nas universidades brasileiras esse fenmeno
atinge um ndice alto nos cursos da rea de Cincias Exatas. Isto ocorre em IES pblicas
e em IES privadas.
Segundo alguns pesquisadores do fenmeno evaso, a perspectiva de alcanar a
formao superior se mantm presente na maioria dos evadidos (POLYDORO, 1995,
2000; AZZI, MERCURI e MORAN, 1996). Tambm, grande o interesse da instituio
em manter o aluno no curso, pois a evaso representaria uma perda social, de recursos e
140
de tempo de todos os envolvidos. A identificao de um aluno com chances de se evadir,
logo que ele ingressa no curso, permite que a instituio promova estratgias garantindo a
permanncia do aluno.
Este trabalho demonstra que possvel detectar uma futura evaso a partir do trmino
do primeiro semestre do curso freqentado. Para tanto, foi aplicado o Mtodo Linear de
Fisher para Vrias Populaes, como apresentado na seo 2.3.3.3.
A amostra estudada consistiu de 163 ex-alunos ingressos nos anos de 1999, 2000 e
2001, destes usou-se 155 ex-alunos para classificao e 6 para teste, Eles estavam
agrupados da seguinte maneira: 92 no terminaram o curso (3 usados para teste), 56
terminaram o curso com atraso ( 3 usados para teste) e 15 terminaram no prazo certo (2
usados para teste),
As variveis estudadas foram coletadas nos arquivos cedidos pelo Ncleo de
Concurso da UFPR e nos dirios de classe das disciplinas de Estatstica Geral I, Clculo
de Probabilidade I e Clculo com Geometria Analtica I, O conjunto das 45 variveis
(Apndice 8) analisadas entraram variveis scio-econmicas, formao de grau mdio,
escores no vestibular, notas e freqncia nas disciplinas citadas,
O desempenho do classificador apresentado na tabela de classificao obtida do
mtodo linear de Fisher apresentado na Tabela 12, a seguir.

TABELA 12- TABELA DE CLASSIFICAO FEITA PELO MTODO LINEAR DE FISHER
Grupos Classificados pelo Mtodo
Grupos de Referncia
Abandonaram
ou Trancaram o
Curso
No concluram o
Curso no Tempo
Certo
Concluram o
Curso no Tempo
Certo
Total
Abandonaram ou
Trancaram o Curso
75(48,39%) 10(6,45%) 4(2,58%) 89
No concluram o Curso
no Tempo Certo
6(3,87%) 40(25,81%) 7(4,52%) 53
Concluram o Curso no
Tempo certo
0(0,00%) 1(0,64%) 12(7,74%) 13
Total 81 53 21 155
Percentual de Classificao Correta: 81,94%

141
A soma dos valores obtidos na diagonal da tabela indica o total de ex-alunos do
grupo de anlise que foram classificados corretamente, Dividindo este valor pelo total
(155) obteve-se um percentual de classificao correta 81,94% significando que as
equaes apresentadas subseqentes classificam o grupo de teste com esta probabilidade
de acerto,

Y
1
= -0,09202X
1
- 0,28175X
2
- 0,07758X
3
- 0,02018X
4
+ 0,04222X
5
- 0,03868X
6
+ 0,04829X
7
+
0,09409X
8
+ 0,21174X
9
+ 0,09102X
10
+ 0,03199X
11
+ 0,06741X
12
+ 0,04501X
13
+ 0,00802X
14
-
0,03996X
15
- 0,30428X
16
+ 0,20738X
17
+ 0,17139X
18
- 0,16212X
19
- 0,01622X
20
- 0,37201X
21
-
0,05958X
22
+ 0,15912X
23
+ 0,02403X
24
+ 0,04107X
25
+ 0,05589X
26
- 0,09056X
27
+ 0,01441X
28
-
0,12039X
29
- 0,04309X
30
- 0,00371X
31
- 0,00019X
32
- 0,00442X
33
+ 0,00046X
34
- 0,00213X
35
- 0,00063X
36

- 0,00219X
37
- 0,00011X
38
- 0,00187X
39
+ 0,00082X
40
- 0,00283X
41
+ 0,00191X
42
- 0,01378X
43
+
0,03926X
44
+ 0,00369X
45

Y
2
= + 0,4194X
1
+ 0,32911X
2
- 0,12859X3 + 0,06805X
4
+ 0,10594X
5
- 0,05845X
6
+ 0,08985X
7
-
0,18337X
8
+ 0,12003X
9
+ 0,04305X
10
+ 0,25476X
11
+ 0,0654X
12
+ 0,00266X
13
- 0,01012X
14
- 0,27692X
15

- 0,01517X
16
- 0,0928X
17
+ 0,11045X
18
- 0,04492X
19
+ 0,0629X
20
+ 0,12851X
21
- 0,22944X
22
+
0,01865X
23
- 0,0248X
24
+ 0,10266X
25
+ 0,06032X
26
- 0,03355X
27
- 0,18576X
28
+ 0,07316X
29
+
0,01435X
30
+ 0,00068X
31
- 0,00057X
32
+ 0,00041X
33
- 0,00222X
34
+ 0,00055X
35
+ 0,0011X
36
+
0,00104X
37
+ 0,00043X
38
- 0,00168X
39
+ 0,00683X
40
- 0,00162X
41
- 0,00654X
42
+ 0,02439X
43
-
0,00828X
44
+ 0,02536X
45

A Tabela 13 a seguir mostra o resultado alcanado com os 8 ex-alunos utilizados
para teste, sendo que foi considerado grupo 1 os que evadiram(abandonaram ou
trancaram o curso), grupo 2 os que no se formaram no tempo certo e grupo 3 os que
concluram o curso normalmente.
142
TABELA 13- CLASSIFICAO DO GRUPO DE TESTE
Ex-Aluno Grupo
Mtodo de
Fisher
1 1 2
2 1 1
3 1 1
4 2 3
5 2 2
6 2 2
7 3 3
8 3 2
% de Acerto - 62,5%
FONTE: Resultado da Anlise feita no SIAVAL 1.0

Esta sistemtica, de identificar alunos com alta probabilidade de evaso, pode ser
muito til instituio, desde que se tenha uma poltica de acompanhamento e orientao
desses alunos.
Para verificar a qualidade dos resultados encontrados no programa utilizou-se o
programa STATGRAPHICS para comparar o mtodo de Fisher com o mtodo
discriminante quadrtico (com probabilidades a priori iguais e proporcionais ao grupo de
classificao) e com redes neurais (com probabilidades a priori iguais e proporcionais ao
grupo de classificao. A comparao dos resultados pode ser vista na Tabela 14 e no
Apndice 10 tm-se os resultados obtido no programa STATGRAPHICS.
143

TABELA 14- COMPARAO ENTRE OS MTODOS DE FISHER, DISCRIMINANTE
QUADRTICO E REDES NEURAIS.
Mtodo
Percentual
Discriminante
de Fisher
Discriminante
Quadrtico
(Prob.a priori
iguais)
Discriminante
Quadrtico
(Prob.a priori
proporcionais
ao grupo de
classificao)
Redes
Neurais
(Prob.a
priori
iguais)
Redes Neurais
(Prob.a priori
proporcionais
ao grupo de
classificao)
Acertos no
Grupo de
Classificao
81,94% 81,94% 85,16% 54,19% 60,65%
Acertos no
Grupo de
Teste
62,50% 37,50% 37,50% 25,00% 50,00%
FONTE: RESULTADOS OBTIDOS NOS PROGRAMA SIAVAL 1.0 E STATGRAPHICS

Os resultados apresentados na Tabela 14 indicam que o mtodo de Fisher
apresentou 81,94% acertos no grupo de classificao e 62,50% acertos no grupo de teste.
O mtodo discriminante quadrtico com probabilidade a priori proporcionais ao grupo de
classificao apesar de apontar melhor desempenho no grupo classificao (85,16%) no
apresentou resultado razovel no grupo de teste (37,50%). Portanto, o mtodo de Fisher
foi uma boa escolha.

4.3- ANLISE DE FORNECEDORES

A avaliao de fornecedores uma atividade que vem preocupando as empresas
industriais e de servios, desde que foi intensificada a competio pelos mercados
globalizados. De um modo geral, todas as empresas fazem avaliao dos seus
fornecedores, seja informalmente com base na experincia do comprador ou
formalmente e neste caso com base em um instrumento de avaliao cientificamente
elaborado.
144
Essa atividade procura assegurar empresa uma melhoria substancial no seu
processo de produo, principalmente uma melhor qualidade dos insumos alm da
reduo nos prazos de entrega. Um dos propsitos desse trabalho facilitar a anlise e
interpretao de dados coletados por empresas na avaliao de seus fornecedores. O
programa desenvolvido inclui tcnicas de anlise multivariada, tais como, anlise
fatorial (descritos na seo 2.2) que usada no ranqueamento das empresas
fornecedoras, e tambm, faz o reconhecimento e classificao de novas empresas, que
venham a integrar a lista de fornecedores, utilizando o Mtodo de Fisher para vrias
populaes (grupos) apresentado na seo 2.3.3.3.
Trabalhou-se com dados reais de 52 fornecedores de uma empresa de grande porte
que ser chamada de Empresa X. Esta empresa possui procedimentos de ranqueamento e
seleo de fornecedores que foram construdos ao longo de muitos anos de experincia.
Os procedimentos feitos em um departamento da empresa abrangeram quatro
caractersticas: suprimentos (1), qualidade (2), logstica (3) e tecnologia (4). O conjunto
de dados inserido num sistema e a anlise feita de forma subjetiva.
No reconhecimento de padres foram usadas as 52 empresas fornecedoras
pesquisadas para estimar as funes discriminantes. A empresa forneceu os dados
segundo seus critrios e aps ser feito o ranqueamento dividiram-se os fornecedores em
bom (parceiros), regular e ruim.
O programa desenvolvido, neste trabalho, est em forma genrica, ou seja, de tal
modo que um usurio leigo possa fazer o ranqueamento e alocar novos fornecedores
utilizando os dados obtidos no instrumento proposto pela empresa. A entrada dos dados
pode ser feita por meio de uma planilha Excel.
No relatrio de sada do ranqueamento apresentada uma listagem ordenada dos
fornecedores analisados com a classificao e o escore obtido. Adiante, tm-se os
detalhes numricos. A classificao e alocao de novos fornecedores (empresas) foram
feitas na mesma pgina onde so anexados os dados de entrada (em reconhecimento de
padres). Alm disso, as funes lineares de classificao so apresentadas numa janela
na mesma pgina e numa pgina a parte aparece a tabela de classificao.
A Tabela 15, adiante, resume os resultados obtidos com a aplicao do programa
aos dados. Observa-se pelos valores das comunalidades que todas as variveis do
145
questionrio so importantes na anlise. Trs fatores resumem 92,77% das informaes
contidas na matriz de correlao. Porm apenas dois resumem 67,48% das informaes e
poderia, tambm, ser utilizado esse nvel, isto , utilizar os dois primeiros fatores.
interessante observar que no primeiro fator (F1) as variveis qualidade e tecnologia so as
predominantes, o que significa que essas variveis so as mais importantes no
desempenho dos fornecedores. O segundo fator (F2) dominado pela varivel
suprimentos e o terceiro fator (F3) por logstica.
Uma empresa fornecedora qualquer pode ter a sua avaliao quantitativa nos trs
fatores ou, isoladamente, em cada um dos fatores. Assim, pode-se classificar uma
empresa de forma global nas trs dimenses fatoriais ou em qualquer das trs dimenses:
tecnologia e qualidade, suprimento e logstica. Essa informao muito importante
para a empresa manter ou substituir um fornecedor.

TABELA 15- ANLISE FATORIAL MTODO DAS COMPONENTES PRINCIPAIS
Pesos (Carregamentos) Estimados
Variveis
F
1
F
2
F
3
Comunalidades h
2
i

Varincias Esp.

i
1. Suprimentos 0,120464 0,969454 0,102161 0,964790 0,035202
2. Qualidade 0,938372 -0,001173 0,143983 0,901274 0,098725
3. Logstica 0,108815 0,093268 0,988694 0,998057 0,001942
4. Tecnologia 0,798869 0,453515 0,054077 0,846792 0,153207
Autovalores (
j
) 1,545085 1,154219 1,011610
Proporo Acum. 38,63% 67,48% 92,77%
Fonte: Resultado da Anlise

Os valores das comunalidades mostram que todas s variveis so importantes
na anlise. Portanto, o instrumento de avaliao de fornecedores, construdo pela
Empresa X, merece confiana.
A classificao das 52 empresas fornecedoras analisadas foi baseada nos escores finais
colocados na escala de 0 a 100 e o resultado est na Tabela 16, adiante.

146

TABELA 16- CLASSIFICAO DAS EMPRESAS FORNECEDORAS
Ranking Fornecedor Escore Final Ranking Fornecedor Escore Final
1 16
93,783
27 41
80,118
2 5
93,462
28 37
79,285
3 12
92,736
29 43
77,635
4 25
92,647
30 35
76,981
5 17
92,064
31 13
74,891
6 50
92,043
32 38
74,097
7 45
91,934
33 26
73,600
8 20
91,765
34 46
73,560
9 14
90,992
35 21
73,143
10 24
90,713
36 44
71,899
11 1
90,293
37 49
69,394
12 27
89,977
38 47
69,196
13 39
89,915
39 19
68,597
14 33
89,509
40 4
67,474
15 52
89,497
41 51
66,940
16 10
88,810
42 6
66,664
17 32
88,704
43 30
60,395
18 2
87,982
44 7
55,026
19 34
87,396
45 22
54,023
20 31
87,232
46 3
53,697
21 8
86,738
47 42
52,122
22 9
85,275
48 29
50,302
23 18
85,039
49 48
47,783
24 40
84,564
50 36
34,720
25 15
82,768
51 11
31,515
26 28
80,311
52 23
23,988
Fonte: Resultados da Anlise.

O ajuste do modelo de reconhecimento de padres foi feito com base nas 52
empresas escolhidas classificadas em trs grupos: Bom, Regular e Ruim. As equaes
obtidas do modelo linear de Fisher so apresentadas a seguir.
Y
1
= +0.06016 X
1
+0.05165 X
2
+0.07782 X
3
+0.11007 X
4

147
Y
2
= +0.07989 X
1
-0.01333 X
2
+0.0233 X
3
-0.11395 X
4

Considerou-se um fornecedor do grupo 1 como bom quando seu escore ficou
acima de 85, grupo 2 como regular entre 85 e 70 e grupo 3 como ruim abaixo de 70. O
programa SIAVAL 1.0 forneceu a tabela de classificao (Tabela 17) que mostra os
acertos e erros de classificao dos dados analisados. Esta classificao foi feita
utilizando o Procedimento de Reteno de Lachenbruch descrito na seo 2.3.5. Deve-se
observar que os valores da diagonal so o das observaes onde foi classificada
corretamente.

TABELA 17- TABELA DE CLASSIFICAO USANDO O PROCEDIMENTO DE
RETENO DE LACHENBRUCH
Grupos Classificados pelo Mtodo
Grupos de Referncia
1- Bom 2- Regular 3- Regular
Total
1- Bom 22(42,31%) 1(1,92%) 0(0,00%) 23
2- Regular 2(3,85%) 11(21,15%) 0(0,00%) 13
3- Regular 1(1,92%) 6(11,54%) 9(17,31%) 16
Total 25 18 9 52
FONTE: RESULTADO OBTIDO NO SIAVAL 1.0

Totalizando os dados observados na diagonal e dividindo pelo total de
observaes obtem-se o percentual de acerto de classificao que resultou um percentual
de 80,77%, significando que o classificador estatisticamente bom.
O programa pode ser uma ferramenta muito importante na anlise e ranqueamento
de fornecedores, principalmente para as empresas que venham iniciar a anlise, pois
bastaria entrar com dados que a empresa julga importante no processo e automaticamente
obteria o ranqueamento dos fornecedores. Alm disso, pode-se obter a classificao (por
exemplo: bom, regular e ruim) de um fornecedor que tenha recentemente sido includo no
quadro de fornecedores da empresa. Outros fatores importantes a serem considerados so:
o tempo para anlise e a no existncia de experincia do aplicador do mtodo.

148
5. CONCLUSO E RECOMENDAES

Algumas aplicaes inditas foram desenvolvidas. Construiu-se, neste trabalho,
um sistema integrado para o ranqueamento de fornecedores feito por Anlise Fatorial e
que pode facilitar muito as empresas que j fazem ranqueamento. No caso de empresas
que desejam iniciar a avaliao de fornecedores o programa poderia ajudar na escolha das
variveis importantes de um instrumento feito pela empresa.
Outra aplicao importante o procedimento de detectar alunos com possibilidade
de evaso. Muitas instituies de ensino e rgos governamentais buscam as causas de
evaso para poder enfrent-las, porm no procedimento apresentado neste trabalho,
indicou-se um meio de detectar a evaso antes que ela acontea e assim seja possvel
trabalhar somente com os alunos que possuem esta possibilidade. O fator mais importante
do procedimento que a anlise pode ser feita sem que o aluno perceba que est sendo
avaliado neste item, pois a instituio pode obter as variveis de interesse na sua entrada
na instituio, como por exemplo com os dados scio-econmicos do vestibular e ainda
atravs de notas e freqncias nas disciplinas do primeiro semestre.
Quando se escolheu a anlise de itens de uma prova de vestibular pretendeu-se
incentivar instituies de ensino que analisassem os itens de suas provas e que o
ranqueamento dos candidatos pudessem ser feitos utilizando escores verdadeiros. Este
seria o meio mais justo de avaliar candidatos, pois itens ruins no entrariam no escores
ficando somente os itens bem formulados.
Este trabalho forneceu como produto o programa SIAVAL 1.0 que uma
ferramenta muito til para a anlise de desempenho, vrias reas do conhecimento fazem
este tipo de anlise e no utilizam as estatsticas utilizadas no programa, principalmente
no Brasil.
Como o programa possui uma comunicao facilitada com o usurio, como, por
exemplo, entrada e sada de dados atravs de uma planilha Excel, espera-se que a
comunidade de pesquisadores e analistas de desempenho tenha maior acesso a estas
estatsticas e possa melhor analisar seus dados, visto que os programas encontrados no
mercado so de lngua estrangeira, caros e de difcil manuseio.
149
No entanto, o programa desenvolvido atende as pesquisas de desempenho no que
se refere Anlise de Itens, visto que est operando somente com itens que possuam
respostas dicotmicas ou possveis de serem dicotomizadas. Portanto, para uma verso
2.0 poderia ser programada com o Modelo Nominal na Teoria da Resposta ao Item, de
modo que o programa se tornaria mais generalista.
Verificou-se tambm a necessidade de construir um programa de uso nacional que
contivesse todas os modelos da Teoria da Resposta ao Item com intuito de que a anlise
de desempenho escolar pudesse ser feita por instituies de ensino, municpios, regies,
etc.
Entende-se, portanto, que os objetivos do trabalho foram alcanados, mostrando a
viabilidade e aplicaes das metodologias apresentadas.
150

REFERNCIAS

ALEXANDRE, J.W.C., ANDRADE, D.F., VASCONCELOS,A.P. e ARAJO, A.M.S.
Uma Proposta de Anlise de um Construto para a Medio dos Fatores Crticos da
Gesto pela Qualidade atravs da Teoria da Resposta ao Item. Gesto & Produo,
v.9, n.2, p.129-141, 2002.
ALVAREZ, M. P. & QUEIROZ, A. A. Aproximaes dos Laos de Parcerias entre
Fornecedor-Cliente na Cadeia de Suprimentos como Fonte de Competitividade.
XXIII ENEGEP, Ouro Preto, outubro 2003.
ANDERSEN, Erling B.& OLSEN, Lin W. The Life of Georg Rasch as a Mathematician
and as a Statistician. Essays on Item Response Theory. New York: Lecture Notes in
Statistics, p.3-24, 2001.
ANDRADE, Dalton F.; TAVARES Hliton R. & VALLE, Raquel C. Teoria da
Resposta ao Item: Conceitos e Aplicaes. Caxambu-MG: 14
a.
SINAPE-ABE, 2000.
AZZI, R. G.; MERCURI, E.; MORAN, R. C. Fatores que interferem na deciso de
desistncia de curso no primeiro ano de graduao. Campinas (Mimeogr.), 1996.
BAKER, Frank B. & KIM, Seock-Ho. Item Response Theory: Parameter Estimation
Techniques. 2 ed. Lisboa: Marcel Dekker, 2004.
BOCK, R. Darrell & AITKIN, Murray. Marginal Maximum Likelihood Estimation of
Item Parameters: Application of an EM Algorithm. Psychometrika, v. 46, n. 4, 443-
459, December 1981
BROWN, J. Dean. Point-biserial correlation coefficients. JALT Testing & Evaluation
SIG Newsletter, v. 5, n. 3, 12-15, October 2001
BURDEN, R. L. & FAIRES, J.D. Numerical Analysis. 6 ed. California: Books/Cole
PublishingCompany, 1997
COSTA, M.B.F. Tcnica Derivada da Teoria da Resposta ao Item Aplicada ao Setor
de Servios. Curitiba: Dissertao (Mestrado em Mtodos Numricos em
Engenharia), 2001 Setor de Tecnologia e Cincias Exatas, Universidade Federal do
Paran.
151
CHAVES NETO,A. Anlise Multivariada Aplicada Pesquisa. Curitiba: UFPR, 2004,
74 p. (notas de aula).
CHAVES NETO,A. Introduo ao Reconhecimento de Padres. Curitiba: UFPR,
2003, 61 p. (notas de aula).
CHAVES NETO, A. & TURIM M. E. Introduo s Teorias da Avaliao. Minicurso,
Semana da Matemtica UNICENTRO. Guarapuava, 2003.
DARLINGTON RICHARD B. Factor Analysis. Disponvel em <http://comp9.psych.
cornell.edu/Darlington/factor.htm>. Acesso em setembro de 2004.
DeROOS, Y., ALLEN-MEARES, P. Application of the Rasch Analysis: exploring
differences in depression between african-american and white children. Journal of
Social Service Research, v. 23, n. 3 e 4, 93-107, 1998.
DOWNIE, N. M. & HEATH, R. W. (1959) Basic Statistical Methods, Harper &
Brothers, Publishers, N.Y.
ELECTRONIC STATISTICS TEXTBOOK. Principal Components and Factor
Analysis. Disponvel em < http://www.statsoft.com/textbook/stfacan.html>. Acesso
feito em abril de 2005
FURTADO, E. M.. Automao do Ranqueamento Qualitativo de reas
Especialmente Protegidas do Estado do Paran atravs da Anlise Fatorial.
Curitiba: Dissertao (Mestrado em Mtodos Numricos em Engenharia), 1999
Setor de Tecnologia e Cincias Exatas, Universidade Federal do Paran.
GARSON DAVE . Factor Analysis. Disponvel em <http://www2.chass.ncsu.edu/
garson/pa765/factor.htm>. Acesso feito em janeiro de 2005.
GUILFORD, J. P. Fundamental statistics in psychology and education. 4.ed. New
York: McGraw-hill Book, 1950. 605p.
HAIR, J. F; ANDERSON, R. E.; TATHAM, R. L. & BLACK, W. C. Anlise
Multivariada de Dados. .; Traduo:. Adonay S.Santanna e Anselmo Chaves Neto.
5

ed Porto Alegre:Bookman, 2005.
HAMBLETON, Ronald K.; SWAMINATHAN H. & Rogers, H. Jane. Fundaments of
Item Response Theory. USA: Sage Publications, 1991.
HISTORY OF ITEM RESPONSE THEORY < http://www.uic.edu/classes/ot/ot540/
history.html> . Acesso feito em abril de 2005.
152
HWANG, Dae-Yeop. Classical Test Theory and Item Response Theory: Analytical and
Empirical Comparisons. Annual Meeting of Southwest Educational Research
Association, 27 p.,2002.
JOHNSON R. A.; WICHERN, D. W. Applied Multivariate Statistical Analysis.2.ed.
New Jersey: Prentice Hall International,1992.
LINDEN, Wim J. van der & HAMPLETON, Ronald K. Handbook of Modern Item
Response Theory. USA: Springer, 1996.
LORD, Frederic M. & NOVIK, Melvin R. Statisyical Theories of Mental Test Scores.
USA e Canad: Addison-Wesley Publishing Company, 1968.
MARQUES, J. M. & LIMA, J. D. A Estatstica Multivariada na Anlise Econmica-
Financeira de Empresas. Revista da FAE, v. 5, n. 3, 51-59, Setembro 2002.
MOOD, Alexander M.; GRAYBILL, Franklin A. & BOES, Duane C. Introduction to
The Theory of Statistics. International Student Edition. USA: McGraw-Hill, 1974.
MLLER, S.I.M.G. Comparao entre os Mtodos de Mxima Verossimilhana,
Distncia Mnima e Mtodo de Fisher para Reconhecimento de Padro em
Imagens Coloridas. Curitiba: Dissertao (Mestrado em Cincias Geodsicas), 1997-
Setor de Tecnologia, Universidade Federal do Paran.
POLYDORO, S. A. J. Evaso em uma instituio de ensino superior: desafio para a
psicologia escolar (Dissertao de Mestrado). Campinas, SP: PUCCAMP, 1995.
POLYDORO, S. A. J. O Trancamento de matrcula na trajetria acadmica do
universitrio: condies de sada e de retorno instituio (Tese de Doutorado).
Campinas, SP: UNICAMP, 2000
SOARES, T. Machado. Utilizao da teoria da resposta ao item na produo de
indicadores scio-econmicos. Pesquisa Operacional, v. 25, n. 1, 83-112. Rio de
Janeiro, Jan./Abr. 2005.
SWAMINATHAN, Hariharan; HAMBLETON, Ronald K.; SIRECI, Stephen G.; XING
Dehui & RIZAVI, Saba M. Small Sample Estimation in Dichotomous Item Response
Models: effect of priors based on judgmental information on the accuracy of item
parameter estimates. Applied Psychological Measurement, v. 27, n. 1, 2751,
January 2003.
153
TAVARES, H.R., ANDRADE, D.F. and PEREIRA, C.A.B. Detection of Determinant
Genes and Diagnostic via Item Response Theory. Genetics and Molecular Biology,v
27, n.4, 679-685, 2004. TAVARES, H. R. Teoria da Resposta ao Item para Dados
Longitudinais. So Paulo, 2001 Tese (Doutorado em Estatstica) Instituto de
Matemtica e Estatstica Universidade de So Paulo.
WIKIPEDIA. Factor analysis.< http://en.wikipedia.org/wiki/Factor_analysis >.
Acesso feito em Abril de 2005.
WONNACOTT, Ronald J.; WONNACOTT, Thomas H. Econometria. 2. ed. So Paulo:
Livros Tcnicos e Cientficos, 1978. 424 p.

154












APNDICES


155
APNDICE 1
DERIVADAS DO ML-3 EM RELAO AO PARMETRO DE DISCRIMINAO
( )
( )
i k i
b Da
i i ki
e 1
1
c 1 c P

+
+ =
( )
i k i
b Da
*
ki
e 1
1
P

+
=
( )
( )
( )
( )
( )
i k i
i k i
i k i
i k i
i k i
b Da
b Da
b Da
b Da
b Da
*
ki
e 1
e
e 1
1 e 1
e 1
1
1 Q





+
=
+
+
=
+
=
( )( )
( )
( )
| |
( )( )
*
ki
*
ki i k i 2
b Da
b Da
i k i
i
ki
Q P b c 1 D
e 1
e b c 1 D
a
P
i k i
i k i
=
+

=




( )( )
i
*
ki
*
ki
i k i 2
i
ki
2
a
Q P
b c 1 D
a
P


onde
( )
( )
| |
( )
| | ( )( )
( )
( )
| |
( )
( )( )
( )
( )( )
( )
| |
( )
| |
( )( )
( )
( )
| |
( )
( ) ( ) ( )
( )
( )
| |
=
+
+
+
+

=
=
+
+
+
+
=
(
(











4
b Da
b Da 2 b Da b Da
i k
2
b Da
b Da
i k
4
b Da
b Da 2
i k
b Da
i k
b Da
4
b Da
b Da
i k
2
b Da
2
b Da
b Da
i i
*
ki
*
ki
i k i
i k i i k i i k i
i k i
i k i
i k i
i k i i k i i k i
i k i
i k i i k i
i k i
i k i
e 1
e e e b D 2
e 1
e b D

e 1
e b D 2 e b D 2 e

e 1
e b D e 1
e 1
e
a a
Q P
( ) ( ) ( )
( ) ( )
( ) ( ) ( ) | |
( ) ) P 2 1 ( P Q b D
P P 2 1 2 P P 1 2 1 P Q b D
Q 2 P Q 2 1 P Q b D
P Q P Q Q b D 2 P Q b D
*
ki
*
ki
*
ki i k
* 2
ki
*
ki
*
ki
*
ki
*
ki
*
ki i k
* 2
ki
*
ki
*
ki
*
ki
*
ki i k
*
ki
* 2
ki
* 2
ki
*
ki
*
ki i k
*
ki
*
ki i k
=
= + + + =
= + + =
= + + =

ento:
( )( ) ( )
*
ki
*
ki
*
ki
2
i k i
2
2
i
ki
2
P 2 1 Q P b c 1 D
a
P
=


156
APNDICE 2
DERIVADAS DO MODELO ML-3 EM RELAO AOS PARMETROS DE
DIFICULDADE E ACERTO CASUAL
( )
( )
i k i
b Da
i i ki
e 1
1
c 1 c P

+
+ =
( )
i k i
b Da
*
ki
e 1
1
P

+
=
( )
( )
( )
| |
( )
*
ki
*
ki i i 2
b Da
b Da
i i
i
ki
Q P c 1 Da
e 1
e c 1 Da
b
P
i k i
i k i
=
+

=




( )
i
*
ki
*
ki
i i 2
i
ki
2
b
Q P
c 1 Da
b
P


onde
( )
( )
| |
( )
| |
( )
( )
| |
( ) ( ) ( )
| |
( )
| |
( )
( )
| |
( ) ( ) ( )
( )
( )
| |
=
+
+

+
=
=
+
+
+
+
=
(
(











4
b Da
b Da 2 b Da b Da
i
2
b Da
b Da
i
4
b Da
b Da 2
i
b Da
i
b Da
4
b Da
b Da
i
2
b Da
2
b Da
b Da
i i
*
ki
*
ki
i k i
i k i i k i i k i
i k i
i k i
i k i
i k i i k i i k i
i k i
i k i i k i
i k i
i k i
e 1
e e e Da 2
e 1
e Da

e 1
e Da 2 e Da 2 e

e 1
e Da e 1
e 1
e
b b
Q P

( )
| |
( ) ( ) | |
) P 2 1 ( P Q Da
P P 2 1 2 P P 1 2 1 P Q Da
Q 2 P Q 2 1 P Q Da
P Q P Q Q Da 2 P Q Da
*
ki
*
ki
*
ki i
* 2
ki
*
ki
*
ki
*
ki
*
ki
*
ki i
* 2
ki
*
ki
*
ki
*
ki
*
ki i
*
ki
* 2
ki
* 2
ki
*
ki
*
ki i
*
ki
*
ki i
+ =
= + =
= =
= + =

ento:
( ) ( ) ( ) ( )
*
ki
*
ki
*
ki i
2
i
2 *
ki
*
ki
*
ki i
2
i
2
i
2
ki
2
P 2 1 Q P c 1 a D P 2 1 Q P c 1 a D
b
P
= + =


( )
*
ki
*
ki
b Da
i
ki
Q P 1
e 1
1
1
c
P
i k i
= =
+
=



0
c
P
i
2
ki
2
=


157
APNDICE 3
DERIVADA DA FUNO DE VEROSSIMILHANA EM RELAO AOS
PARMETROS DE HABILIDADE
( )
( )
( )
( )
=
(
(

=
I
1 i
j
ji
ji
j
ji
ji
j
Q log
u 1
P log
u
L log

=
( )
( )
( )
=
(
(

=
I
1 i
j
ji
ji
ji
j
ji
ji
ji
P
Q
1
u 1
P
P
1
u
= ( )
( )
=
|
|
.
|

\
|

(
(

=
I
1 i
j
ji
ji
ji
ji
ji
P
Q
1
u 1
P
1
u
=
( )
=
|
|
.
|

\
|

(
(

=
I
1 i
j
ji
ji ji
ji ji
P
Q P
P u

= ( )
( )

=
|
|
.
|

\
|

(
(

I
1 i
j
ji
*
ji
*
ji
ji
ji ji
P
Q P
W
P u
fazendo,
( )
( )
( )
( )
( )
( )
( )
( )
( )
*
ji
*
ji i i
b Da
b Da
b Da
i i
2
b Da
b Da
i
i
j
ji
Q P c 1 Da
e 1
e
e 1
1
c 1 Da
e 1
e Da
c 1
P
i j i
i j i
i j i
i j i
i j i
=
+ +
=
+
=







ento temos que:
( )
=


j
L log
( ) ( )

=

(
(

I
1 i
*
ji
*
ji i i *
ji
*
ji
ji
ji ji
Q P c 1 Da
Q P
W
P u
e finalmente
( )
=


j
L log
( )( ) | |

=

I
1 i
ji ji ji i i
W P u c 1 a D
158
APNDICE 4
PARMETROS DA NORMAL MULTIVARIADA PARA COMBINAES
LINEARES

Resultado:
Se X tem distribuio N
p
(, ), as q combinaes lineares
(
(
(
(
(

+ +
+ +
+ +
=
p qp 1 1 q
p p 2 1 21
p p 1 1 11
) 1 px (
) qxp (
X a ... X a
X a ... X a
X a ... X a
X A
M

tm distribuio N
q
(A, AA). Alm disso, se d um vetor de constantes, ento
) 1 px ( ) 1 px (
d X + tem distribuio N
p
( + d, ).
Prova:
Dadas as combinaes lineares Z = AX tm

Z
= E(X) = E(AX) = A
X

e

Z
= Cov(X) = Cov(AX) = A
X
A.
Qualquer combinao linear b(AX) uma combinao linear de X, da forma
aX com a = Ab. Se X normalmente distribudo com N
p
(, ), ento qualquer
combinao linear das variveis aX = a
1
X
1
+ a
2
X
2
+ ... + a
p
X
p
tem distribuio
N(a, a a). Alm disso, se aX tem distribuio N
p
(a, a a) a
p
IR , ento X
tem distribuio N
p
(, ). Desta forma, as concluses de A
~
X esto satisfeitas.
A segunda parte da prova pode ser obtida considerando a(X+d) = aX +(ad),
onde aX tem distribuio N(a, a a). Sabe-se do caso univariado que a adio de uma
constante ad varivel aX translada a mdia para a + a d = a( + d), sem alterar a
varincia. J que a arbitrrio, X + d tem distribuio N
p
( +d, ).
159
APNDICE 5
PARMETROS DA DISTRIBUIO NORMAL MULTIVARIADA DA VARIVEL
CONDICIONADA
Resultado:
Seja
(
(
(

=
2
1
X
X
X M com distribuio N
p
(, ) na qual
(

=
2
1
,
(
(
(



=
22 21
12 11
M
L M L
M
M
M
, e
0
22
> . Ento a distribuio condicional de X
1
, dado X
2
= x
2
, normal com
Mdia = ) x (
2 2
1
22 12 1
+

e
Covarincia =
21
1
22 12 11



Assim, a covarincia independe do valor de x
2
da varivel condicionada.
Prova:
Seja
(
(
(
(

) q p ( x ) q p ( xq ) q p (
) q p ( qx
1
22 12
) qxq (
) pxp (
I 0
I
A
M
M
M
L M L
M

(
(
(


=
(
(
(

=

2 2
2 2
1
22 12 1 1
2 2
1 1

X
) X ( X
X
X
A ) X ( A L L L L L L L L L L L L L
normal conjuntamente com matriz de covarincia AA dada por
(
(
(


=
(
(
(


(
(
(



(
(
(

22
21
1
22 12 11
1
22 12 22 21
12 11
1
22 12
0
' 0
I ) (
' 0 I
. .
I 0
I
M
M
M
M
M
M
M
M
M
L M L L L L L
M
M
L M L L L
M
M
L M L
M
M
L L L M L
M

Como ) X ( X
2 2
1
22 12 1 1


e
2 2
X tem covarincia zero, so
independentes. Alm disso, ) X ( X
2 2
1
22 12 1 1


tem distribuio
) , 0 ( N
21
1
22 12 11 q


. Dado
2 2
X = , ) x (
2 2
1
22 12 1
+

uma constante. A
distribuio condicionada de ) x ( X
2 2
1
22 12 1 1


a mesma da distribuio no
condicionada ) X ( X
2 2
1
22 12 1 1


, pois ) X ( X
2 2
1
22 12 1 1


e
2 2
X so
independentes. J que a quantidade ) X ( X
2 2
1
22 12 1 1


tem
160
distribuio ) , 0 ( N
21
1
22 12 11 q


, ela o vetor aleatrio ) x ( X
2 2
1
22 12 1 1


, no
qual
2
X assume o valor particular
2
x . De forma equivalente, dado que
2
X =
2
x ,
1
X tem
distribuio ). ), x ( ( N
21
1
22 12 11 2 2
1
22 12 1 q
+


161
APNDICE 6
RESULTADO USADO NO MTODO DE REGRESSO PARA DETERMINAR OS
ESCORES FATORIAIS
Resultado:
Supondo no singulares as matrizes e possveis as operaes, ento
(I + L
-1
L)
-1
L
-1
L = I (I + L
-1
L)
-1

Prova:
Partindo da igualdade entre matrizes identidades de mesma ordem
I = I
multiplicando membro a membro por L
-1
L, vem
L
-1
L = L
-1
L
somando e subtraindo a identidade ao segundo membro
L
-1
L = I + L
-1
L I
L
-1
L = (I + L
-1
L) (I + L
-1
L).(I + L
-1
L)
-1

fatorando a expresso :
L
-1
L = (I + L
-1
L). [ I (I + L
-1
L)
-1
]
pr-multiplicando membro a membro por (I + L
-1
L)
-1
, tem-se
(I + L
-1
L)
-1
(L
-1
L) = (I + L
-1
L)
-1
. (I + L
-1
L). [ I (I + L
-1
L)
-1
]
como (I + L
-1
L)
-1
. (I + L
-1
L) = I, pode-se escrever
(I + L
-1
L)
-1
(L
-1
L) = I (I + L
-1
L)
-1

162
APNDICE 7
RESULTADO USADO NO MTODO DE REGRESSO PARA DETERMINAR OS
ESCORES FATORIAIS
Resultado:
Supondo no singulares as matrizes e possveis s operaes, ento:
(LL + )
-1
=
-1
-
-1
L.(I + L
-1
L)
-1
L
-1

Prova:
Partindo da igualdade entre matrizes identidades de mesma ordem I = I
somando e subtraindo expresses ao segundo membro, tem-se:
I = I +
-1
LL -
-1
LL +
-1
L. (I + L
-1
L)
-1
L -
-1
L. (I + L
-1
L)
-1
L
I = I +
-1
LL -
-1
L.[ I - (I + L
-1
L)
-1
]L -
-1
L.(I + L
-1
L)
-1
L
e substituindo I =
-1
, tem-se
I =
-1
+
-1
LL -
-1
L.(I + L
-1
L)
-1
L
-1
LL -
-1
L.(I + L
-1
L)
-1
L
Fatorando
I =
-1
( LL+ ) -
-1
L. [(I + L
-1
L)
-1
L
-1
LL + (I + L
-1
L)
-1
L]
Fatorando novamente temos:
I =
-1
( LL+ ) -
-1
L. [(I + L
-1
L)
-1
L
-1
](LL+ )
Aps multiplicar membro a membro por (LL+ )
-1
, tem-se
(LL + )
-1
=
-1
-
-1
L.(I + L
-1
L)
-1
L
-1

163
APNDICE 8
VARIVEIS UTILIZADAS NA ANLISE DE EVASO DE ALUNOS DO CURSO
DE ESTATSTICA DA UFPR
1- GENERO: 1-Masculino; 2- Feminino
|1| Masculino
|2| Feminino

2- ESTADO CIVIL:
|1| Solteiro(a)
|2| Casado(a)
|3| Outro

3- SITUAO DE MORADIA:
|1| Mora em casa dos pais, quitada ou financiada
|2| Mora em casa dos pais, alugada
|3| Mora em casa prpria, quitada ou financiada
|4| Mora em casa alugada, paga por voc
|5| Mora em repblica, casa de estudante, penso ou pensionato
|6| Mora em casa de parentes ou amigos
|7| Mora em casa alugada para voc, paga por seus pais

4- NVEL DE INSTRUO DO PAI:
|1| Sem escolaridade
|2| Ensino fundamental incompleto
|3| Ensino fundamental completo
|4| Ensino mdio incompleto
|5| Ensino mdio completo
|6| Superior incompleto
|7| Superior completo
|8| No sei informar

164
5- NVEL DE INSTRUO DA ME:
|1| Sem escolaridade
|2| Ensino fundamental incompleto
|3| Ensino fundamental completo
|4| Ensino mdio incompleto
|5| Ensino mdio completo
|6| Superior incompleto
|7| Superior completo
|8| No sei informar

6- OCUPAO DO PAI:
|1| Funcionrio pblico do governo Federal, Estadual ou Municipal
|2| Empregado de empresa
|3| Scio ou proprietrio de empresa
|4| Trabalho remunerado por conta prpria, com auxlio de parentes e/ou de familiares
|5| Trabalho remunerado por conta prpria, com empregados
|6| Artista (pintor, escultor, msico, cantor, ator etc.)
|7| Trabalha em entidade, organizao ou instituio no-governamental de cunho
filantrpico, assistencial, religioso, de lazer ou outro
|8| Parlamentar ou cargo eleitoral, diplomata, militar
|9| Atleta profissional
|10| Trabalha em casa e/ou no tem atividade remunerada
|11| No trabalha
|12| Outros

7- OCUPAO DA MAE:
|1| Funcionrio pblico do governo Federal, Estadual ou Municipal
|2| Empregado de empresa
|3| Scio ou proprietrio de empresa
|4| Trabalho remunerado por conta prpria, com auxlio de parentes e/ou de familiares
|5| Trabalho remunerado por conta prpria, com empregados
165
|6| Artista (pintor, escultor, msico, cantor, ator etc.)
|7| Trabalha em entidade, organizao ou instituio no-governamental de cunho
filantrpico, assistencial, religioso, de lazer ou outro
|8| Parlamentar ou cargo eleitoral, diplomata, militar
|9| Atleta profissional
|10| Trabalha em casa e/ou no tem atividade remunerada
|11| No trabalha
|12| Outros

8- RENDA FAMILIAR:
|1| At R$ 300,00
|2| De R$ 301,00 a R$ 500,00
|3| De R$ 501,00 a R$ 1.000,00
|4| De R$ 1.001,00 a R$ 1.500,00
|5| De R$ 1.501,00 a R$ 2.000,00
|6| De R$ 2.001,00 a R$ 3.000,00
|7| De R$ 3.001,00 a R$ 4.000,00
|8| De R$ 4.001,00 a R$ 5.000,00
|9| Acima de R$ 5.001,00

9- NMERO DE PESSOAS QUE CONTRIBUEM RENDA FAMILAR:
|1| Uma |4| Quatro
|2| Duas |5| Cinco
|3| Trs |6| Seis ou mais

10- NMERO PESSOAS SUSTENTADAS RENDA FAMILIAR:
|1| Uma |4| Quatro
|2| Duas |5| Cinco
|3| Trs |6| Seis ou mais


166
11- IDADE COMEOU EXERCER ATIVIDADE REMUNERADA
|1| Antes dos 14 anos |4| Aps 18 anos
|2| Entre 14 e 16 anos |5| Nunca trabalhei
|3| Entre 16 e 18 anos

12- DURANTE O CURSO VOC TER OBRIGATORIAMENTE QUE TRABALHAR
|1| Sim, mas apenas nos ltimos anos
|2| Sim, desde o primeiro ano, em tempo parcial
|3| Sim, desde o primeiro ano, em tempo integral
|4| No sei
|5| No

13- ESTUDO DE 1
O
.GRAU:
|1| Todos em escola pblica
|2| Todos em escola particular
|3| Maior parte em escola pblica
|4| Maior parte em escola particular
|5| Em escolas comunitrias/CNEC ou outro

14- ANO DE CONCLUSO DO 2. GRAU:

15- ESTUDO 2. GRAU:
|1| Integralmente em escola pblica
|2| Integralmente em escola particular
|3| Maior parte em escola pblica
|4| Maior parte em escola particular
|5| Em escolas comunitrias/CNEC ou outro

16- RELAO ENTRE FORMAO DE 2. GRAU E ATIVIDADE ATUAL:
|1| Concluiu o curso de magistrio
|2| Concluiu curso tcnico (agrcola, contbil, mecnico etc.)
167
|3| No se enquadra nas alternativas anteriores

17- TURNO DO 2
O
. GRAU:
|1| Todo diurno |4| Maior parte noturno
|2| Todo noturno |5| Outro
|3| Maior parte diurno

18- CURSO PREPARATRIO PARA O VESTIBULAR:
|1| Fiz apenas o "terceiro"
|2| Fiz apenas cursinho
|3| Fiz "terceiro" e cursinho
|4| No fiz nem "terceiro" nem cursinho


19- MOTIVO DO CURSO PREPARATRIO:
|1| Para atualizar meus conhecimentos, porque parei de estudar h muito tempo
|2| Para aprender "macetes"
|3| Para complementar os conhecimentos adquiridos no colgio
|4| Por outro motivo
|5| No fiz cursinho

20- NMERO DE VEZES QUE PRESTOU VESTIBULAR:
|1| Uma vez
|2| Duas vezes
|3| Trs vezes
|4| Quatro vezes
|5| Cinco ou mais
|6| Nenhuma

21- NMERO DE VESTIBULARES QUE FEZ NO ANO DE INGRESSO:
|1| Um
168
|2| Dois
|3| Trs
|4| Quatro
|5| Cinco ou mais


22- INICIOU OUTRO CURSO SUPERIOR :
|1| Sim, mas no conclu |3| Sim, mas j conclu
|2| Sim, estou cursando |4| No

23- MOTIVO DE TER PRESTADO VESTIBULAR NA UFPR:
|1| Por se tratar de universidade pblica e gratuita
|2| Pela qualidade do ensino
|3| Pelo horrio do curso que pretendo fazer
|4| Pela localizao
|5| Por ser a nica na cidade que oferece o curso que desejo
|6| Outro motivo

24- MOTIVO DE ESCOLHA DO CURSO
|1| Mercado de trabalho e possibilidades salariais
|2| Possibilidade de contribuir para a sociedade
|3| Possibilidade de cursar algo de que gosta
|4| Por ter habilidades relacionadas ao curso
|5| Gosto pelas matrias do curso
|6| Baixa concorrncia pelas vagas
|7| Permite conciliar aula e trabalho
|8| Outro motivo

25- FATOR QUE TER QUE ENFRENTAR DURANTE O CURSO QUE
CONSIDERA IMPORTANTE:
|1| Habilidades especficas exigidas pelo curso
169
|2| Relacionamentos
|3| Persistncia e hbitos de estudo
|4| Informaes da profisso
|5| Conciliar estudos com vida pessoal e familiar
|6| No se enquadra nas alternativas anteriores

26- O QUE ESPERA EM 1. LUGAR DE UM CURSO UNIVERSITRIO:
|1| Aquisio de cultura geral ampla
|2| Formao profissional, voltada para o trabalho
|3| Formao terica, voltada para a pesquisa
|4| Formao acadmica para melhorar a atividade prtica que j estou desempenhando
|5| Aquisio de conhecimentos que me permitam compreender melhor o mundo em que
vivemos
|6| Aquisio de conhecimentos que permitam melhorar meu nvel de instruo
|7| Diploma de nvel superior

27- ATIVIDADE DE LAZER:
|1| TV
|2| Religio
|3| Teatro
|4| Cinema
|5| Msica
|6| Dana
|7| Artesanato
|8| Leitura
|9| Esporte
|10| Outra
|11| Nenhuma

28- QUE MEIO QUE MAIS UTILIZA PARA SE MANTER INFORMADO:
|1| Jornal escrito
170
|2| TV
|3| Rdio
|4| Revistas
|5| Outros
|6| Nenhum

29- NO SE INSCREVEU PELA INTERNET...
|1| Por no ter acesso a ela
|2| Por no ter conhecimento do perodo de inscrio
|3| Por outro motivo
|4| Me inscrevi pela Internet em outro lugar
|5| Me inscrevi pela Internet em casa

30- CLASSIFICAO NO VESTIBULAR
31- ESCORE NO VESTIBULAR EM PORTUGUS
32- ESCORE NO VESTIBULAR EM MATEMTICA
33- ESCORE NO VESTIBULAR EM BIOLOGIA
34- ESCORE NO VESTIBULAR EM QUMICA
35- ESCORE NO VESTIBULAR EM GEOGRAFIA
36- ESCORE NO VESTIBULAR EM FSICA
37- ESCORE NO VESTIBULAR EM HISTRIA
38- ESCORE NO VESTIBULAR EM LINGUA ESTRANGEIRA MODERNA
39- ESCORE NO VESTIBULAR EM REDAO
40- FREQNCIA NA DISCIPLINA DE ESTATSTICA GERAL I:
DE 0 A 60 HORAS
41- NOTA NA DISCIPLINA DE ESTATSTICA GERAL I:
DE 0 A 100
42- FREQNCIA NA DISCIPLINA DE CLCULO DE PROBILIDADE I:
DE 0 A 60 HORAS
43- NOTA NA DISCIPLINA DE CLCULO DE PROBABILIDADE I:
DE 0 A 100
171
44- FREQNCIA NA DISCIPLINA DE CLCULO COM GEOMETRIA:
ANALTICA I:
DE 0 A 60HORAS
45- NOTA NA DISCIPLINA DE CLCULO COM GEOMETRIA ANALTICA I:
DE 0 A 100

172
APNDICE 9
GRFICOS DA CURVA CARACTERSTICA E FUNO DE INFORMAO DOS
ITENS 1 A 60





173







174




175




176




177




178




179




180




181




182




183




184




185




186




187




188




189




190




191




192




193




194




195




196




197




198





199




200





201








202
APNDICE 10


TABELA DE CLASSIFICAO FEITA PELO MTODO DISCRIMINANTE QUADRTICO
USANDO PROBABILIDADE A PRIORI IGUAIS PARA OS GRUPOS DE CLASSIFICAO
Grupos
Grupos
Abandonaram
ou Trancaram o
Curso
No concluram o
Curso no Tempo
Certo
Concluram o
Curso no Tempo
Certo
Total
Abandonaram ou
Trancaram o Curso
78 9 2 89
No concluram o Curso
no Tempo Certo
8 37 8 53
Concluram o Curso no
Tempo certo
0 1 12 13
Total 86 47 22 155
Percentual de Classificao Correta: 81,94%


TABELA DE CLASSIFICAO FEITA PELO MTODO DISCRIMINANTE QUADRTICO
USANDO PROBABILIDADE A PRIORI DIFERENTES, PROPORCIONAIS AOS GRUPOS DE
CLASSIFICAO
Grupos
Grupos
Abandonaram
ou Trancaram o
Curso
No concluram o
Curso no Tempo
Certo
Concluram o
Curso no Tempo
Certo
Total
Abandonaram ou
Trancaram o Curso
81 8 0 89
No concluram o Curso
no Tempo Certo
9 41 3 53
Concluram o Curso no
Tempo certo
0 3 10 13
Total 90 52 13 155
Percentual de Classificao Correta: 85,16%


203
TABELA DE CLASSIFICAO FEITA POR REDES NEURAIS USANDO PROBABILIDADE A
PRIORI IGUAIS PARA OS GRUPOS DE CLASSIFICAO
Grupos
Grupos
Abandonaram
ou Trancaram o
Curso
No concluram o
Curso no Tempo
Certo
Concluram o
Curso no Tempo
Certo
Total
Abandonaram ou
Trancaram o Curso
53 26 10 89
No concluram o Curso
no Tempo Certo
13 27 13 53
Concluram o Curso no
Tempo certo
1 8 4 13
Total 67 61 27 155
Percentual de Classificao Correta: 54,19%


TABELA DE CLASSIFICAO FEITA POR REDES NEURAIS USANDO PROBABILIDADE A
PRIORI DIFERENTES, PROPORCIONAIS AOS GRUPOS DE CLASSIFICAO
Grupos
Grupos
Abandonaram
ou Trancaram o
Curso
No concluram o
Curso no Tempo
Certo
Concluram o
Curso no Tempo
Certo
Total
Abandonaram ou
Trancaram o Curso
84 5 0 89
No concluram o Curso
no Tempo Certo
43 10 0 53
Concluram o Curso no
Tempo certo
6 7 0 13
Total 133 22 0 155
Percentual de Classificao Correta: 60,65%







204
TABELA DE COMPARAO ENTRE OS MTODOS NA CLASSIFICAO DO GRUPO DE
TESTE
Mtodo
Alunos do
Grupo de
Teste
Fisher
Discr.
Quadrtico(P
rop. a priori
iguais)
Discr.
Quadrtico
(Prop. a priori
diferentes)
Redes
Neurais(Pr
op. a priori
iguais)
Redes
Neurais
(Prop. a
priori
iguais)
Classificao
Correta
1 2 1 1 2 1 1
2 1 1 1 1 1 1
3 1 2 2 1 1 1
4 3 1 1 1 1 2
5 2 1 1 1 1 2
6 2 2 2 3 2 2
7 3 1 1 2 1 3
8 2 2 2 2 1 3
Percentual de
Acertos
62,50% 37,50% 37,50% 25,00% 50,00% -

205
APNDICE 11

1. TELA INICIAL


2. TELA DE ESCOLHA DE MTODOS

206

3. TELA DE ENTRADA DE DADOS PARA ANLISE DO INSTRUMENTO


4. TELA DE OPES DE ANLISE DO INSTRUMENTO

207
5. TELA RESULTADOS DAS ESTATSTICAS DO INSTRUMENTO

6. TELA DE RESULTADOS DAS ESTATSTICAS DESCRITIVAVAS DO
NMERO DE ACERTOS DOS RESPONDENTES

208
7. TELA DE RESULTADO DA TRI PARA DOIS E TRS PARMETROS

8. TELA DO GRFICO DA CURVA CARACTERSTICA DO ITEM E DA
FUNO DE INFORMAO DO ITEM


209
9. TELA DO RANQUEAMENTO FEITO POR ESCORES VERDADEIROS

10. TELA DOS RESULTADOS DAS ESTATSTICAS DOS ESCORES
VERDADEIROS


210
11. TELA DE ENTRADA DE DADOS PARA ANLISE FATORIAL

12. TELA DA TABELA DE RESULTADOS DA ANLISE FATORIAL



211
13. TELA DO RANQUEAMENTO FEITO POR ANLISE FATORIAL

14. TELA DE ENTRADA DE DADOS PARA RECONHECIMENTO DE
PADRES E CLASSIFICAO

212
15. TELA DE SADA DE DADOS PARA RECONHECIMENTO DE PADRES E
CLASSIFICAO

16. TELA DE RESULTADO DA TABELA DE CLASSIFICAO