Você está na página 1de 4

O QUE SO GRAUS DE LIBERDADE?

Eric Batista FERREIRA / Marcelo Silva de OLIVEIRA

st atstica

O QUE SO GRAUS DE LIBERDADE? WHAT ARE DEGREES OF FREEDOM?


Eric Batista FERREIRA
Tcnico em Laticnios pelo Instituto Cndido Tostes, Engenheiro Agrnomo pela Universidade Federal de Lavras (UFLA), Mestre e Doutor em Estatstica e Experimentao Agropecuria pela UFLA, Professor Adjunto I do Departamento de Cincias Exatas da UFAL-MG. Bolsista CNPq. Contato: eric@unifal-mg.edu.br.

Marcelo Silva de OLIVEIRA


Engenheiro Agrcola pela Universidade Federal de Lavras (UFLA), Mestre em Estatstica pela Universidade Estadual de Campinas (Unicamp), Doutor em Engenharia de Produo pela Escola Politcnica da Universidade de So Paulo (USP), Professor Associado do Departamento de Cincias Exatas da UFLA. Bolsista CNPq. Contato: marcelo.oliveira@ufla.br.

RESUMO Tanto para profissionais de Estatstica quanto para usurios, a compreenso clara do termo graus de liberdade se faz necessria. Por isso uma reviso foi feita na literatura especializada. Identificou-se a carncia de clareza desse tema e propuseram-se definies em diferentes nveis de profundidade para atender a cada tipo de leitor. Palavras-chave: Estatstica. Graus de liberdade. ABSTRACT For both Statisticians and users of Statistics, the clear comprehension of the term degrees of freedom is useful and necessary. Therefore, it was made a review in the specialized literature. It was identified the lack of clearness on this topic and some definitions were proposed for different levels, for several kinds of readers. Keywords: Statistics, Degrees of freedom. 1 INTRODUO A compreenso clara do significada do termo graus de liberdade (gl) essencial no estudo de Estatstica. Pode-se dizer que, sem esse conhecimento, o profissional desse ramo das Cincias Exatas se torna limitado e passa a atuar de forma mecnica em problemas tericos ou de cunho aplicado. Contudo, o conhecimento de como determinar os graus de liberdade parece ser mais comumente explorado dentre os estatsticos em detrimento do conhecimento de sua origem, ou seja, porque eles so calculados de tal forma. Talvez isso se deva ao fato de que uma nica e completa definio de graus de liberdade seja dificilmente encontrada na literatura, possivelmente devido sua natureza relativamente complexa e/ou abstrata. Na Estatstica Experimental, os graus de liberdade so constantemente usados para a determinao de Quadrados Mdios, para a realizao de testes de hipteses, construo de intervalos de confiana etc. E para o clculo
72 Revista Cientfica Symposium, Lavras, v. 6, n. 1, p. 72-75, jan./jun. 2008

de estatsticas de maneira consciente e crtica que se faz fundamental a compreenso do termo graus de liberdade. Esta breve reviso sobre graus de liberdade visa esclarecer o seu significado, focando, sob o ponto de vista de vrios autores, este tema fundamental para a compreenso das teorias estatsticas. 2 DESENVOLVIMENTO surpreendente constatar que livros importantes para a Estatstica Experimental como, por exemplo, Fisher (1990), Kempthorne (1973), no trazem uma definio clara do termo graus de liberdade. De acordo com Cochran & Cox (1992), os graus de liberdade (gl) associados com um componente so o nmero de parmetros independentes necessrios para descrever aquele componente no modelo. No caso de tratamentos, o nmero de gl sempre o nmero de tratamentos menos 1 (um), sendo tambm dessa forma para blocos. Para a soma de quadrados total, o gl o nmero de observaes menos 1,

O QUE SO GRAUS DE LIBERDADE?

Eric Batista FERREIRA / Marcelo Silva de OLIVEIRA

representando a contribuio da mdia. Os gl tm dois usos principais. Primeiramente, quando se subtrai os graus de liberdade dos efeitos dos graus de liberdade totais, tem-se os graus de liberdade do erro ou resduo:
GL erro= GL total- GL efeitos

fato de que a varincia calculada de n desvios da mdia e apenas (n-1) desses desvios podem ser escolhidos livremente. O outro desvio determinado pelo fato de que os n desvios devem somar zero. Portanto, uma definio abstrata de graus de liberdade seria: Grau de liberdade a liberdade que se tem para variar, ou quantos elementos podem variar livremente sem que estejam atrelados a uma restrio. Os gls representam a medida da preciso de S2 como 2 um estimador de s .
n

. Esse o divisor necessrio para se estimar a varincia do erro (erro experimental) usando a Soma de Quadrados do Erro (SQE). Segundo, os gl de Tratamentos so usados no teste F, que testa a hiptese nula de que todos os tratamentos produzirem os mesmos efeitos. Apesar de incompleta, a definio dada por Cochran & Cox (1992), demonstra os principais usos dos gl na Estatstica Experimental e fala rapidamente do seu clculo no caso do mais simples delineamento experimental, o Delineamento Inteiramente Casualizado (DIC), aquele que possui apenas tratamentos e erro como fontes de variao. Uma definio muito mais rebuscada pode ser encontrada na Encyclopedia of Statistical Science (1981), que diz que os gl so usados em diferentes ramos da cincia e tm significados variados. Em Estatstica, mais usado como um parmetro da distribuio de qui-quadrado e em distribuies relacionadas, tais como t e F centrais e nocentrais. Embora o nmero de graus de liberdade seja geralmente um inteiro positivo, nmeros fracionrios ocorrem em algumas aproximaes, e, pode-se, por exemplo, ter uma distribuio qui-quadrado no centrada com zero gl, obtida tomando-se esse valor para o parmetro de graus de liberdade. Essa uma mistura de (a) uma 1 l distribuio degenerada P(X = 0) = 1, com peso exp 2 ,e (b) distribuies qui-quadrado centrais com graus de liberdade 2, 4,... e pesos iguais a probabilidades Poisson 1 l1 l sendo o parexp - , 2 2 metro de no centralidade. Em outra conotao, os gl de um modelo para valores esperados de variveis aleatrias so o excesso do nmero de variveis no nmero de parmetros em um modelo. No caso geral de modelos lineares com resduos independentes e homocedsticos, o valor esperado da soma de quadrados de diferenas entre valores observados e valores esperados correspondentes, ajustados por quadrados mnimos (nmero de graus de liberdade) x (varincia residual). Esse apanhado de usos dos gl esto reunidos de maneira brusca e no representam propriamente uma definio, o que para um leigo no traria nenhum esclarecimento. Por sua vez, Mead & Curnow (1993) dizem apenas que (n-1) o nmero de graus de liberdade do estimador da varincia, a varincia amostral (S2). Esse nome se deve ao

lim S 2 = lim

x x ()
i i= 1

n n

2 = s n1

e ento as vrias formas da distribuio t so caracterizadas pelos gl em que S2 baseada (Figura 1).

( )
FIGURA 1: Densidade de probabilidade da distribuio t de Student com 5 (? ), 20 (---) e 50 () graus de liberdade. Assim como os gl determinam vrias formas diferentes para distribuies t e F, a distribuio quiquadrado tambm pode apresentar muitas formas diferentes (Figura 2). Por exemplo: uma tabela de contingncia, com duas linhas e duas colunas, que contm os totais das linhas e das colunas em suas margens possui apenas um grau de liberdade. Isso se deve ao fato de que, com os totais marginais fixados, com a escolha de um valor para uma clula da tabela os outros valores j esto automaticamente escolhidos. Essa definio j mais interessante, mas ainda assim, pouco abrangente.

(( ))

Revista Cientfica Symposium, Lavras, v. 6, n. 1, p. 72-75, jan./jun. 2008

73

O QUE SO GRAUS DE LIBERDADE?

Eric Batista FERREIRA / Marcelo Silva de OLIVEIRA

FIGURA 2 Densidade de probabilidade da distribuio Quiquadrado com 5 (? ), 10 (---) e 15 () graus de liberdade. Mood et al. (1974) dizem que, quando se define uma distribuio Qui-quadrado com k graus de liberdade, k tambm um parmetro dessa distribuio e dever ser um valor positivo e inteiro. Mas, depois complementa com uma nota: O termo graus de liberdade pode se referir ao nmero de quadrados independentes na soma de quadrados. Por m X exemplo, a soma de quadrados de desvios de tem , s n quadrados independentes, mas na soma que representa o desvio de observaes de uma mesma populao normal em X () Z - Z = relao mdia X apenas n-1 termos , tem s independentes, uma vez que um termo fica automaticamente determinado quando so dados n-1 deles. Um aspecto importante pode ser encontrado em Steel & Torrie (1980), que afirmam que para testar a igualdade de mdias de populaes que possuem varincias 2 2 diferentes ( s por meio do teste t, os graus de liberda) s 1 2 de devem ser calculados pelo nmero de graus de liberdade efetivos ou combinados. Na anlise de varincia com sub-amostras e diferentes nmeros de sub-amostras, o nmero aproximado de gls efetivos para a aproximao qui-quadrado dado pela frmula de Satterthwaite:
n 2 i i i= 1 i

torno da mdia precisa de n-1 partes independentes (dos nmeros Y1 - Y ,..., Yn - n-1 so independentes , Y , Y2 - Y apenas j que todos n nmeros somam zero pela definio de mdia). Pode-se computar a soma de quadrados devida a regresso de uma funo simples de Y1 , Y2 ,..., Yn , nomeada b1 (j que 2 2 Y) (=X i Yi - 12 () b X ), e ento essa soma de quadrados tem 1 grau de liberdade. Por subtrao, a soma de quadrados de regresso, soma de quadrados residual ( i - n-2 graus Y Yi ) tem de liberdade. Isso reflete o fato dos resduos virem de um ajuste de uma reta, cujo modelo requer dois parmetros. Em geral, a soma de quadrados residual baseada em (nmero de observaes nmero de parmetros estimados) graus de liberdade n -(n - quase 1 = 2) . Mas, 1+ no final do livro, esses autores revelam uma das mais interessantes definies. Eles dizem que toda tabela de anlise de varincia vinda de uma regresso ou de um delineamento de experimentos uma aplicao do Teorema de Pitgoras: o quadrado da hipotenusa de um tringulo retngulo igual soma dos quadrados dos outros dois catetos. Geralmente, repetidas aplicaes do resultado de Pitgoras so necessrias (Figura 3).

i i= 1

i= 1

FIGURA 3 Tringulo retngulo dos vetores Y, Xb e e=YXb


Y Xb () () YY + YIsso implica que: YY =- Xb . A equao dos graus de liberdade correspondente n = p + (n-p), , corresponde partio dimensional de S em dois espaos ortogonais de dimenso p e n-p, respectivamente. A ortogonalidade de Y e e essencial para uma clara partio da soma de quadrados total. Poderia ser feita, nesse ponto, uma abordagem do ponto de vista de espaos vetoriais. O vetor de informaes Y est localizado no espao n-dimensional, considerando-se n observaes. O vetor Y se encontra em um subespao de dimenso p, formado pelas colunas linearmente independentes da matriz X; e a isso se d o nome de graus de liberdade. No caso de regresso, esse espao tem dimenso igual ao nmero de parmetros do modelo, ou seja, todas as colunas de X so linearmente independentes. No caso de um delineamento experimental, podem existir colunas linearmente dependentes e isso depende do modelo considerado. Como pode-se perceber pela Figura 2, o vetor de resduos ortogonal a Y e ao subespao que este se encontra. Portanto, o vetor e est em um subespao de dimenso (n - p), pois possui uma base de tamanho mnimo

Glefetivos

k ci MSi i= 1 = 2 k ci MSi () i = gli 1

sendo ci MSi uma funo linear de k quadrados mdios independentes; e gli seus respectivos graus de liberdade. Por sua vez, Draper & Smith (1998) comeam definindo gl no contexto de regresso e explicam que qualquer soma de quadrados tem um nmero de graus de liberdade associado. Esse nmero indica quantas partes independentes de uma informao envolvendo n nmeros independentes Y1 , Y2 ,..., Yn so necessrias para formar uma soma de quadrados. Por exemplo, a soma de quadrados em

74 Revista Cientfica Symposium, Lavras, v. 6, n. 1, p. 72-75, jan./jun. 2008

O QUE SO GRAUS DE LIBERDADE?

Eric Batista FERREIRA / Marcelo Silva de OLIVEIRA

igual a (n p). Sob esta abordagem, o nmero de gl igual dimenso do (sub) espao vetorial em que cada vetor se encontra.

Essa situao aconteceu dessa forma porque o

7,0 ). Se professor colocou apenas uma restrio ( x = ele colocasse uma segunda restrio, por exemplo, S = 2, dois alunos poderia deixar de fazer prova. Os outros teriam liberdade para tirar a nota que quisessem, ou melhor, para tirar a nota que fossem capazes.
3 CONCLUSES O termo graus de liberdade admite vrias definies corretas, deixando a cargo do leitor procurar aquela que mais atenda a suas necessidades. Contudo, no explorado de forma completa e satisfatria. De uma forma mais geral: seja uma seqncia de X1, X2, ..., Xn variveis aleatrias independentes. Quando estas X = b , etc ficam sujeitas a q restries, etc. - apenas n-q n variveis aleatrias podem sero realmente independentes. As q variveis aleatrias restantes sero variveis condicionais ou condicionadas s q restries. Diz-se que foram gastos q graus de liberdade para calcular as restries. Portanto, apenas n-q tm liberdade para variar, ou seja, assumir qualquer valor permitido pelo seu domnio. Alm disso, graus de liberdade podem ser definidos como o nmero de colunas linearmente independentes da matriz X de um modelo linear, como o nmero de parmetros de um modelo de regresso, alm de ser o denominador que tornar no viesado o estimador de verossimilhana da varincia (S2).

FIGURA 4 Esquema de vetores (Y, Y e e) em (sub)espaos seus vetoriais.

No sitio http://davidmlane.com/hyperstat/ A42408.html, pode-se encontrar uma definio bem mais formal (mas, essencialmente a mesma j mencionada) de graus de liberdade. Nesse sitio o autor diz que estimativas de parmetros podem ser baseadas em diferentes quantidades de informao. E que o nmero de pedaos independentes de informao que entram na estimativa de um parmetro so chamados de graus de liberdade (gl). Em geral, os graus de liberdade de uma estimativa so iguais ao nmero de dados que entram na estimativa menos o nmero de parmetros estimados como passos intermedirios na estimao do prprio parmetro. Por exemplo, se a varincia, 2 , for estimada de uma amostra aleatria de N dados independentes, ento o nmero de graus de liberdade igual ao nmero de dados independentes (N) menos o nmero de parmetros estimados em passos intermedirios (por exemplo m por x ) e , portanto, igual a N1. , estimado 4 REFERNCIAS Por fim, uma explicao simples do significado do Cochran, W.G.; Cox, G.M. Experimental designs. 2a. ed. John Wiley, termo graus de liberdade proposta por meio de um 1992, 617 p. exemplo. Seja uma sala de aula de 30 estudantes que Draper, N.R.; Smith, H. Applied regression analysis. 3a. ed. John Wiley precisam fazer a avaliao final de Estatstica. O professor, & Sons, Inc. 1998. 713 p. por ter grande afinidade por 5 desses alunos, diz que garante Encyclopedia of statistical science vol 2. Kotz, S.; Johnson, N.L. Editors-in-chief. 1981. 613 p. que a mdia dos cinco ser 7,0. Apesar de animados, eles Fisher, R.A. Statistical methods for research workers. Oxford Univ. recebem a notcia que, com isso, um deles no poder (no Press. 1990. precisar) fazer prova porque sua nota j estar Kempthorne, O. The design and analysis of experiments. Robert E. automaticamente determinada. A vem a pergunta cabal: Krieger Pub. Co., 1973. Quem de vocs deseja no fazer prova. O silncio geral e Mead, R.; Curnow, R.N. Statistical methods in agriculture and experimental biology. 2a ed. Chapman and Hall, 1993. eles no sabem o que escolher. A princpio, no fazer prova Mood, A.M.; Graybill, F.A.; Boes, D.C. Introduction to the theory of parece uma deciso acertada, mas isso no statistics. 3a ed. McGraw-Hill. 1974. 564p. necessariamente verdade! A resposta certa seria: depende. Steel, R.G.D.; Torrie, J.H. Principles and procedures of statistics A Cada aluno deve pensar da seguinte maneira: se os outros 4 biometrical approach. 2a ed. McGraw-Hill. 1980. 633p. forem bons alunos, eu quero fazer prova! A explicao simples, se 4 alunos tirarem notas altas, para a mdia ser 7,0 necessrio que a quinta nota seja fatalmente baixa. Agora, se os outros 4 estudantes forem fracos, vantagem no fazer a prova. Porque 4 notas baixas exigem uma quinta nota bem alta para que a mdia continue sendo 7,0. Ou seja, se 4 x x + x + x + x x + 7,0 , e 35 x = 1 2 3 4 5 = ento x5 = xi . =
5 5
i= 1

Revista Cientfica Symposium, Lavras, v. 6, n. 1, p. 72-75, jan./jun. 2008

75

Você também pode gostar