Você está na página 1de 9

Revista da

FAE

A estatstica multivariada na anlise econmico-financeira de empresas

Jair Mendes Marques* Jos Donizetti de Lima**

Resumo
O presente estudo teve como objetivo analisar o desempenho de empresas para fins de concesso de crdito, atravs das variveis contbeis. A metodologia do estudo props uma anlise estatstica dos dados (teste T2 de Hotelling e descartes de outliers e variveis), seguida dos mtodos discriminantes: Funo Discriminante Linear de Fisher (FDLF) e Modelo do Regresso Logstico Mltiplo (MRLM). Na avaliao dos modelos foi utilizado o mtodo de Lachenbruch. A implementao de funes no software MATLAB possibilitou a determinao dos resultados necessrios. Considerase como resultados importantes encontrados: os descartes terem sido de fundamental importncia e, principalmente, a eficincia dos modelos para o objetivo proposto, pois resultados promissores foram encontrados: MRLM (93,18%) e FDLF (91,67%). Palavras-chave: reconhecimento de padres; anlise de crdito; anlise multivariada.

Abstract
The aim of the present paper is to analyze the performance of companies of credit concession, through accounting variables. The methodology of the study proposes, firstly, a statistical analysis of the data (T2 test of * Doutor em Cincias Geodsicas pela Universidade Federal do Hotelling and discarded outliers and variables) and then discriminatory Paran (UFPR). Professor da methods: Fisher Discriminating Linear Function (FDLF) and Lachenbruch Universidade Federal do Paran, Professor da FAE Business School Multiple Logistic Regression Model. An implementation of functions in e de ps-graduao da UniversiMATLAB software provided the establishment of the needed results. It is dade Tuiuti do Paran (UTP) considered as important results found: the discards having been of E-mail: jair.marques@utp.br fundamental importance and, most of all, the efficiency of models for the pre-set aim. As promising results it was found: MRLM (93.18%) and ** Mestre em Mtodos Numricos em Engenharia pela Universidade FDLF (91.67%). Key words: pattern precognition; credit analysis; multivariate analysis.
Federal do Paran (UFPR). Professor do CEFET-Pato Branco, PR. E-mail: donizetti@pb.cefetpr.br

Rev. FAE, Curitiba, v.5, n.3, p.51-59, set./dez. 2002

|51

Introduo
No atual contexto da economia brasileira figuram os juros altos (uma das maiores taxas de juros do Mundo Ocidental), o aumento do desem prego e uma pesada carga tributria. Na vizinha Argentina, aumento drstico da situao de risco. Na economia americana, principalmente no segundo semestre de 2001, ocorre um declnio forado. Todos esses fatores concorrem para um crescimento mais modesto da economia brasileira e para a reduo da oferta de crdito. A falta de crdito um dos principais obstculos para a gerao de novos empregos. Por outro lado, a existncia de crdito a uma taxa de juros aceitvel proporcionaria mais empregos e melhores condies de crescimento econmico ao pas. Dessa forma, percebe-se a grande responsabilidade social em torno da questo. A inadimplncia o principal fator que aflige qualquer instituio financeira. Afinal, a aprovao dos crditos e a definio das taxas a serem cobradas so decorrentes dos riscos que envolvem a carteira de operaes (portflios). Para Steiner et al. (1999), qualquer erro na deciso de concesso de crdito pode significar que em uma nica operao haja a perda do ganho obtido em dezenas de outras bem-sucedidas, visto que o no recebimento representa a perda do montante emprestado. Assim, importante prever a inadimplncia, pois os prejuzos com operaes malsucedidas provavelmente sero cobertos com a cobrana de uma sobretaxa a novos crditos, ou seja, encarecem-se as operaes futuras. Segundo Matarazzo (1998), comum dois analistas de balanos chegarem a concluses diferentes a respeito de balanos de uma mesma empresa. Logo, um processo decisrio, sem se basear no feeling do tomador de decises, tornase de fundamental importncia.
52 |

1 Metodologia
O objetivo deste estudo , atravs de ndices econmico-financeiros coletados dos demonstrativos contbeis de empresas Balano Patrimonial (BP) e Demonstrao do Resultado do Exerccio ( DRE ) , classific-las como adimplentes ou inadimplentes, visando diminuir o risco de inadimplncia. Para alcanar tais obje-tivos, so propostas tcnicas estatsticas multivariadas, a citar: Funo Discriminante Linear de Fisher (FDLF), Modelo de Regresso Logstico Mltiplo (MRLM) e, ainda, um mtodo de avaliao desses procedimentos (abordagem de Lachenbruch metodologia jacknife). Consideram-se tambm como objetivos: a validade do tratamento estatstico dos dados, preliminar aplicao dos mtodos discriminatrios propostos; e a construo de um programa computacional, no software MATLAB , para determinar os resultados dos testes estatsticos e estimar os parmetros dos modelos discriminatrios propostos, alm da avaliao de preciso desses modelos construdos. No finalidade deste trabalho prever o custo de inadimplncia, ou mesmo o lucro gerado por uma empresa adimplente. Assumiuse, como adimplncia ou inadimplncia, a capacidade ou incapacidade de a empresa pagar as obrigaes financeiras quando elas vencem. Parte-se do pressuposto da veracidade das informaes contidas nos indicadores contbeis. A partir da seleo de alguns ndices considerados relevantes pela literatura, utilizamse escores das duas primeiras Componentes Principais padronizadas para o descarte de observaes (outlier), caso existam. Salienta-se, ainda, que os ndices selecionados sero submetidos eventual necessidade de reduo do nmero de variveis (via Componentes

Revista da

FAE

Principais), ou seja, consideram-se diversas variveis e reduz-se, caso necessrio, o conjunto de variveis para um subconjunto que possua maior preciso, atravs dos autovalores e autovetores da matriz de correlao. O teste de hiptese, T 2 de Hotelling, aplicado com a finalidade de verificar se as duas populaes representadas por suas amostras so provenientes de populaes distintas, ou seja, se existe diferena nas suas vrias caractersticas mdias.

1.1 Caracterizao da amostra


A amostra caracteriza-se por empresas saudveis e empresas com problemas. Os dados de empresas, utilizados neste trabalho, foram selecionados dos arquivos do Banco Regional de Desenvolvimento do Extremo Sul (BRDE), sediado em Curitiba-PR, de forma aleatria, contendo

informaes de empresas solventes e empresas insolventes. A amostra foi tomada de maneira sistemtica, com intervalo padronizado por um funcionrio do banco, resguardando-se os nomes das empresas, por exigncia do prprio banco. Dadas as caractersticas das empresas analisadas, e sendo as mesmas potenciais tomadoras de recurso junto ao BRDE, h uma grande concentrao de empresas consideradas saudveis (de um total de 136 empresas, escolhidas aleatoriamente, h 118 empresas adimplentes e apenas 18 empresas inadimplentes).

1.2 Indicadores econmico-financeiros


O quadro a seguir apresenta os indicadores (financeiros e econmicos) e as 8 variveis utilizadas inicialmente para o tratamento estatstico dos dados.

Rev. FAE, Curitiba, v.5, n.3, p.53-59, set./dez. 2002

|53

Tomando como ponto de partida os dados das 136 empresas (fornecidos pelo BRDE) contendo os valores para as variveis apresentadas anteriormente e aplicando o descarte de outlier (via componentes principais), verificou-se que 4 empresas possuam valores discrepantes (ponto de vista contbil) em alguns ndices, sendo as mesmas descartadas do banco de dados. De posse das 132 empresas restantes, aplicou-se o descarte de variveis (tambm utilizando-se de Componentes Principais) para verificar a necessidade de reduo do nmero de variveis, tendo como resultado a possibilidade de se trabalhar apenas com as seguintes variveis: MG, IPL, LS e RPL. Logo, a matriz inicial, de ordem 136x8, foi reduzida a uma matriz cujas dimenses passaram a ser 132x4, reduzindo significati-vamente o banco de dados. A aplicao da Funo Discriminante Linear de Fisher e do Modelo de Regresso Logstico Mltiplo se deu a esse banco de dados. Portanto, os mtodos de anlise discriminante multivariada foram aplicados a duas populaes munidas de uma partio definida

objetos ou fixar um novo objeto em uma das duas classes. Ao definir a FDLF, comum denominar as classes (populaes) de 1 e 2, e os objetos, separados ou classificados com base nas medidas de p variveis aleatrias so associados com vetores do tipo X = [X1, X2,..., Xp]. O objetivo de Fisher, ao criar essa regra de reconhecimento de padres e classificao, foi transformar as observaes multivariadas Xs nas observaes univariadas Ys, tal que os Ys das populaes 1 e 2 fossem separados em relao s mdias das duas populaes tanto quanto possvel. Fisher teve a idia de tomar combinaes lineares de X para criar os Ys, dado que essas combinaes so funes de X e, por outro lado, so facilmente calculveis ( ZUGE e CHAVES NETO, 1999). Seja 1Y a mdia dos Ys obtidos dos Xs pertencentes a 1 e 2Y a mdia dos Ys obtidos dos Xs pertencentes a 2 e, considerando a matriz de covarincia, , como sendo a mesma para ambas populaes, ento Fisher selecionou a combinao linear que maximiza a razo entre o quadrado da distncia entre as mdias e a varincia de Y, ou seja:

a priori, descritas por 4 variveis explicativas (ou


preditoras), e o objetivo principal foi construir uma regra de deciso utilizando uma amostra constituda de 132 empresas descritas pelas 4 variveis, sendo conhecido o grupo a priori a que pertenciam.

Essa razo maximizada por: e, assim, tem-se: conhecida como FDLF populacional.

, , que

1.3 Funo Discriminante Linear de Fisher (FDLF)


Segundo Johnson e Wichern (1998), a FDLF, basicamente, consiste em separar duas classes de
54 |

Como, na realidade, os parmetros no so conhecidos, devem-se usar seus estima , estima 2 estimadores, ou seja, e a matriz de covarincia conjunta (estimada) dada por:

Revista da

FAE

Dessa forma, a FDLF amostral fica determinada por:

pode-se escrever o Modelo de Regresso Logstica Mltiplo na forma: , para

A estimativa do ponto mdio amostral dada por:

Obtm-se, desta forma, a seguinte regra de classificao: Alocar ou Alocar se , se

1.4 Modelo de regresso logstico mltiplo (MRLM)


O Modelo de Regresso Logstico Mltiplo uma tcnica estatstica comumente usada para a anlise de dados com resposta binria (dicotmica) e consiste em relacionar, atravs de um modelo, a varivel resposta com os fatores que influenciam a ocorrncia de um determinado evento. Por exemplo, o quanto os ndices de estrutura de capitais, liquidez e rentabilidade explicam o risco de inadimplncia. Como no presente estudo a varivel resposta dicotmica, o modelo de regresso linear no deve ser utilizado, pois poder-se- obter valores de resposta estimada fora do intervalo [0,1], no sendo neste caso compatvel com a natureza do fenmeno estocstico. Alm disso, facilmente se mostra que a condio de varincia constante para os resduos no se verifica. Sejam uma varivel aleatria Y (dicotmica, ou seja, assumindo apenas os valores 0 ou 1) e X = [X1, X2,..., Xp] um vetor de dimenso p, composto de variveis aleatrias independentes, e ainda tomando-se n observaes independentes,
Rev. FAE, Curitiba, v.5, n.3, p.55-59, set./dez. 2002

Este modelo o mais apropriado no caso de a varivel dependente ser dicotmica, pois a Regresso Logstica estima diretamente a probabilidade de ocorrncia de um evento. Salientase tambm que a estimao dos parmetros deve ser feita pelo mtodo de mxima verossimilhana, sendo o mais recomendado quando se dispem de observaes individuais da ocorrncia ou no de determinado evento. Esse mtodo fornece estimativas para os parmetros que maximizam a probabilidade de obter o conjunto observado de dados. Assim, tomando uma amostra aleatria composta de n pares de observaes (Xi,Yi) com i = 1, 2,..., n, onde os Ys represen-tam os valores observados de uma varivel dicotmica e os Xs representam os valores observados de p variveis independentes. Uma forma conveniente para expressar a contribuio da funo de verossimilhana para os pares (Xi, Yi) atravs da frmula:

Desde que assumido que as observaes so independentes, a funo de verossimilhana obtida como o produto dos termos dados na equao anterior:

Assim, a funo de log-verossimilhana fica determinada por:

|55

Desta forma, estimar-se-o (p+1) equaes de verossimilhana, as quais so obtidas por derivadas da funo de log-verossimilhana com respeito a (p+1) coeficientes. As equaes de verossimilhana resultantes podem ser representadas como: e para j =1, 2,..., p. o que reflete no fato de a soma dos valores observados de Y ser igual soma dos valores esperados (preditos), mediante a aplicao do modelo obtido. Esta propriedade importante, pois ajuda a avaliar o ajuste do modelo. A estimao dos parmetros para o MRLM foi feita com base nos estimadores de Mxima Verossimilhana, e o seu clculo foi obtido atravs do mtodo de Levenberg-Marquardt. Em termos da aferio da qualidade global do modelo logstico, foi utilizado o critrio baseado nos resultados de classificao obtidos com esse modelo. O mtodo de Levenberg-Marquardt foi utilizado para determinar os estimadores de mxima verossimilhana do modelo de regresso logstico mltiplo. Esse mtodo trabalha com uma variao suave entre os extremos dos mtodos de Newton e do Gradiente, sendo que se utiliza este ltimo quando se est longe do mnimo, visto que o mtodo de Newton pode no convergir nesta situao. Por outro lado, quando se est distante da soluo usa-se o mtodo do Gradiente. Esse mtodo combina os mtodos do Gradiente e de Newton atravs da alterao dos elementos da diagonal principal da matriz hessiana. No presente estudo, o critrio de parada foi estabelecido a partir de duas consideraes: a primeira se relaciona ao fato de que, analisando as derivadas parciais da funo de logverossimilhana, tem-se que a soma dos valores

observados deve ser igual soma dos valores preditos, e a segunda est baseada no fato de uma nova soluo no trazer alterao no valor da funo objetivo (log-verossimilhana). Assim, o processo iterativo suspenso apenas quando as duas condies descritas anteriormente forem satisfeitas.

1.5 Avaliao da funo de classificao: A abordagem de Lachenbruch


O mtodo de Lachenbruch, segundo Johnson e Wichern (1998), uma abordagem estatstica empregada para avaliar o desempenho da regra de reconhecimento de padres e estimar a probabilidade de classificao correta e incorreta em cada grupo, ou seja, uma forma de avaliar a eficincia da regra de classificao. O algoritmo do referido procedimento descrito a seguir: Passo 1: Inicie com as observaes do grupo 1, omita uma observao desse grupo e construa uma funo de do grupo 1 acrescidas das n2 observaes do grupo 2. classificao usando as (n11) restantes

Passo 2: Classifique a observao retida, usando a funo construda no passo 1. Passo 3: Repita os passos 1 e 2 at que todas as observaes de 1 sejam classificadas. Seja n2/1 o nmero de observaes reconhecidas erroneamente nesse grupo.

Passo 4: Repita os passos de 1 a 3 para as n2 observaes do grupo 2. Seja n1/2 o nmero de observaes reconhecidas erroneamente nesse grupo.

Assim, as estimativas das probabilidades de classificao incorreta so dadas por:

56 |

Revista da

FAE

(classificar em 2, quando a observao pertence a 1)

A probabilidade de classificao correta para a FDLF de 91,67%, avaliada pelo mtodo de Lachenbruch. Veja demais detalhes na tabela 2.

(classificar em 1, quando a observao pertence a 2)

Desta forma, a proporo esperada de erro dada por:

Resultados

Na tabela 1, a seguir, so apresentados os principais resultados obtidos para a anlise da Funo Discriminante Linear de Fisher.

Salienta-se que o resultado encontrado para a FDLF melhor do que o resultado que inclui as 132 empresas com suas 8 variveis, ou seja, sem efetuar o descarte de variveis. Assim, considerase de grande utilidade o descarte de variveis, desde que bem fundamentado, pois neste estudo o nmero de medidas (variveis) foi reduzido em 50% e resultados promissores foram encontrados.

Assim, a aplicao da metodologia FDLF, na amostra em estudo, resultou na seguinte funo de classificao:
Y = 0.0828*MG - 0.0235*IPL + 0.3004*LS + 0.0522*RPL

A tabela a seguir apresenta os coeficientes e os erros padres estimados para o Modelo de Regresso Logstico Mltiplo, tendo por base os estimadores de mxima verossimilhana obtidos atravs do mtodo de Levenberg-Marquardt.

Desta forma, ao multiplicar esse vetor C de dimenso quatro (4 indicadores) pelos valores de uma nova observao, tem-se um escore. Se esse for maior que o ponto mdio ( ), classificar-se- na populao das empresas adimplentes; caso contrrio, deve ser classificado no grupo das empresas inadimplentes. O ponto mdio a ser utilizado para fazer a deciso de classificao foi estimado por: .
|57

Rev. FAE, Curitiba, v.5, n.3, p.57-59, set./dez. 2002

Assim a aplicao do MRLM, na amostra em estudo, resultou no seguinte modelo:

O valor obtido por P(X) representa a probabilidade de a empresa ser adimplente. O valor cut off score, o qual maximiza a probabilidade de acerto, foi igual a 0.5. A tabela a seguir apresenta os resultados de classificao para o MRLM, avaliado pela abordagem de Lachenbruch.

Concluso
As tcnicas abordadas neste trabalho, se empregadas corretamente, constituem-se em eficientes ferramentas auxiliares dos gestores de crdito, ou seja, os modelos desenvolvidos podero auxiliar os analistas de crditos bancrios no processo de tomada de decises e previso do comportamento de futuras empresas. Salientam-se, como primeira concluso importante, os resultados positivos encontrados com a estimao dos parmetros aps a anlise preliminar dos dados (T 2 de Hotelling e os descartes de outlier e variveis). Portanto, relevante uma anlise estatstica rigorosa antes da aplicao dos mtodos de discriminao. O MRLM foi o que apresentou melhor desempenho, quando analisado em relao ao percentual de classificao correta em cada um dos itens avaliados (erros tipo I e tipo II, e acerto global). Por outro lado, a FDLF apresentou um percentual de classificao correta inferior ao MRLM, mas esta tcnica bastante eficiente, pois sua percentagem de classificao correta foi superior a 91%. Para a presente amostra, conclui-se que a FDLF e o MRLM so duas tcnicas eficientes na discriminao das empresas adimplentes e inadimplentes, evidenciando certa melhora para

De acordo com as tabelas 2 e 4, observa-se uma porcentagem de classificao correta superior, atravs do Modelo de Regresso Logstico Mltiplo, em todos os quesitos avaliados. Salienta-se que a taxa de erro tipo II teve uma reduo significativa, pois esse tipo de erro passou de 29,41% para 23,52%, o que relevante, pois est se concedendo emprstimo a uma empresa que no vai pagar, ocasionando a perda dos juros e do montante emprestado. Um resultado comparativo entre os mtodos propostos ( FDLF e MRLM ), obtido atravs da abordagem de Lachenbruch, apresentado no quadro a seguir. A notao POP(i|j) representa o nmero de elementos da populao j que foi classificado na populao i, estando os mesmos corretamente classificados quando i = j, e incorretamente, caso contrrio.
58 |

Revista da

FAE

a segunda tcnica em relao primeira. Apesar desta evidncia, no se pode contestar a eficincia das referidas tcnicas para o objetivo proposto. A diferena verificada em relao eficincia dos dois procedimentos desenvolvidos no constitui empecilho sua utilizao. Ao contrrio, possibilita ao tomador de decises a escolha da tcnica que apresente uma maior probabilidade de classificao correta, o que fortalece o fator

segurana, tendo em vista o montante de recursos envolvidos nas operaes de crditos s empresas. O desenvolvimento do programa computacional foi importante, pois possibilitou a anlise preliminar dos dados, a estimao dos parmetros para ambos os modelos construdos (FDLF e MRLM), a avaliao da eficincia dos mesmos e, ainda, a classificao de uma nova empresa solicitadora de crdito.

Referncias
ALTMAN, E. L. Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. Journal of Finance, Pittsburgh, PA, v. 23, n. 4, p. 589-609, sept. 1968. JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. 4. ed. Nova Jersey: PrenticeHall, inc., 1998. MARION, J. C. Contabilidade empresarial. 8. ed. So Paulo: Atlas, 1998. MATARAZZO, D. C. Anlise financeira de balanos: abordagem bsica e gerencial. 5. ed., So Paulo: Atlas, 1998. STEINER, M. T. A.; CARNIERI, C.; STEINER NETO, P. J.; KOPITTKE, B. Sistemas especialistas probabilstico e redes neurais na anlise do crdito bancrio. Revista de Administrao, So Paulo, v. 34, n. 3, p. 56-67, jul./set. 1999. ZGE, M.; CHAVES NETO, A. Utilizao dos mtodos estatsticos multivariados na avaliao do desempenho empresarial. Revista Paranaense de Desenvolvimento, Economia e Sociedade, Curitiba, n. 97, p. 101-112, set./dez. 1999.

Rev. FAE, Curitiba, v.5, n.3, p.59-59, set./dez. 2002

|59