Escolar Documentos
Profissional Documentos
Cultura Documentos
com
Erros tipográficos:
(1) Na seção sobret-distribuição (a 7ª dessas notas) a última frase deve ser “A curva é sempre
simétrica, mas émenosatingiu o pico do que o normal quando n é pequeno”.
(2) Na seção “(b) Variação dos Valores Regressados sobre a Média Total” (a 12ª página do
s
estas notas)sxesyestão invertidos na expressãoS% -My=rx(X−M) x . Deveria
sy
s
lerS% -M=ryy(X−M x )
sx
(3) Na seção “Testes Baseados na Razão de Duas Variações” (a 14ª página destes
s2(1-r) r2(N−2)
2
s2r2
notas), a segunda frase, “podemos dividir por obtendo .”
1 N−2 1-r2
s2r2 s2(1-r2) r2(N−2)
deve ler-se “podemos dividir por obtendo .”
1 N−2 1-r2
Outra possível confusão para os ouvidos modernos pode vir na seção intitulada "F-
distribuição ez-distribuição." Oz-distribuição mencionada NÃO é a distribuição normal
padronizada, mas é uma distribuição conhecida como "Fisher'szdistribuição."
Um problema potencial na leitura deste arquivo (além de não ter o Word!) é --[que]-- as
equações, que foram inseridas usando MathType da Design Science. Chris usou o Math
Type 4.0 e, se você tiver menos, pode ser um problema. Um programa de leitura Math
Type pode ser baixado da web. --[www.mathtype.com. Siga os caminhos para
“suporte.”]--
Graus de liberdade.Revista de Psicologia Educacional . 31(4) (1940) 253-269
GRAUS DE LIBERDADE
HELENA M. WALKER
Um conceito de importância central para a teoria estatística moderna que poucos livros
didáticos tentaram esclarecer é o de "graus de liberdade". Para o matemático que lê os
artigos originais nos quais a teoria estatística está agora fazendo avanços tão rápidos, o
conceito é familiar e não precisa de explicação particular. Para quem não conheceN
geometria tridimensional ou quem sabe as contribuições para a teoria moderna de
amostragem apenas de fontes de segunda mão, como livros didáticos, esse conceito muitas
vezes parece quase místico, sem significado prático.
Tippett, um dos poucos escritores de livros didáticos que tentam fazer qualquer explicação geral
do conceito, começa seu relato (p. 64) com a frase: "Esta concepção degraus de liberdadenão é
totalmente fácil de alcançar, e não podemos tentar uma justificação completa disso aqui; mas
mostraremos sua razoabilidade e o ilustraremos, esperando que, como resultado da familiaridade
com seu uso, o leitor o aprecie." Não apenas a maioria dos textos omite todas as menções ao conceito,
mas muitos realmente fornecem fórmulas e procedimentos incorretos por ignorarem isto.
Onderé o número de
N−r
parâmetros a serem estimados a partir dos dados.
O presente artigo é uma tentativa de preencher a lacuna entre a teoria matemática e a prática
comum, para afirmar da forma mais simples possível quais graus de liberdade representam, por que o
conceito é importante e como o número apropriado pode ser prontamente determinado. O
tratamento foi feito o mais não técnico possível, mas este é um caso em que a noção matemática é
mais simples do que qualquer interpretação não matemática dela. O papel
será desenvolvido em quatro seções: (I) A liberdade de movimento de um ponto no espaço
quando sujeito a certas condições limite, (II) A representação de uma amostra estatística
por um único ponto noNespaço tridimensional, (III) A importância do conceito de graus de
liberdade, e (IV) Ilustrações de como determinar o número de graus de liberdade
apropriados para uso em certas situações comuns.
Como introdução preliminar à ideia, pode ser útil considerar a liberdade de movimento possuída
por certos objetos familiares, cada um dos quais é tratado como se fosse um mero ponto móvel sem
tamanho. Uma gota de óleo deslizando ao longo de uma mola helicoidal ou uma conta em um fio tem
apenas um grau de liberdade, pois só pode se mover em um caminho unidimensional, não importa
quão complicada seja a forma desse caminho. Uma gota de mercúrio em uma superfície plana tem
dois graus de liberdade, movendo-se livremente em uma superfície bidimensional. Um mosquito
movendo-se livremente no espaço tridimensional tem três graus de liberdade.
Considerado como um ponto em movimento, um trem se move para trás e para frente em um
caminho linear que é um espaço unidimensional situado em um espaço bidimensional, a superfície da
Terra, que por sua vez está dentro de um universo tridimensional. Uma única coordenada, distância
de alguma origem, é suficiente para localizar o trem em qualquer momento. Se considerarmos um
universo quadridimensional em que uma dimensão é de tempo e as outras três dimensões de espaço,
serão necessárias duas coordenadas para localizar o trem, distância em unidades lineares de uma
origem espacial e distância em unidades de tempo de uma origem de tempo . A trajetória do trem que
tinha apenas uma dimensão em um universo espacial tem duas dimensões em um universo espaço-
tempo.
Uma canoa ou um automóvel se move sobre uma superfície bidimensional que se encontra sobre
um espaço tridimensional, é uma seção de um espaço tridimensional. A qualquer momento, a posição
da canoa, ou auto, pode ser dada por duas coordenadas. Referido a um universo espaço-tempo
quadridimensional, três coordenadas seriam necessárias para dar sua localização, e seu caminho seria
um espaço de três dimensões, repousando sobre uma das quatro.
No mesmo sentido, um avião tem três graus de liberdade no universo usual do espaço, e só pode
ser localizado se três coordenadas forem conhecidas. Estes podem ser latitude, longitude e altitude;
ou pode ser altitude, distância horizontal de alguma origem e um ângulo; ou pode ser uma distância
direta de alguma origem e dois ângulos de direção. Se considerarmos um dado instante de tempo
como uma seção através do universo espaço-tempo, o avião se move em uma trajetória
quadridimensional e pode ser localizado por quatro coordenadas, as três anteriormente nomeadas e
uma coordenada de tempo.
Se você for solicitado a escolher um par de números (x, y) aleatoriamente, você tem total
liberdade de escolha em relação a cada um dos dois números, tem dois graus de liberdade. O
par de números pode ser representado pelas coordenadas de um ponto localizado nax, y plano,
que é um espaço bidimensional. O ponto é livre para se mover em qualquer lugar na direção
horizontal paralela àxx'eixo, e também é livre para se mover em qualquer lugar na direção
vertical, paralela àaa'eixo. Existem duas variáveis independentes e o ponto tem dois graus de
liberdade.
Agora suponha que você seja solicitado a escolher um par de números cuja soma seja 7. É
evidente que apenas um número pode ser escolhido livremente, sendo o segundo fixado assim
que o primeiro for escolhido. Embora existam duas variáveis na situação, há apenas uma
variável independente. O número de graus de liberdade é reduzido de dois para um pela
imposição da condiçãox + y = 7. O ponto não está agora livre para se mover em qualquer lugar
noxyplano, mas é constrangido a permanecer na linha cujo gráfico éx + y = 7, e esta linha é um
espaço unidimensional situado no espaço bidimensional original.
Suponha que você seja solicitado a escolher um par de números tal que a soma de seus
quadrados seja 25. Novamente, é evidente que apenas um número pode ser escolhido
arbitrariamente, sendo o segundo fixado assim que o primeiro for escolhido. O ponto
representado por um par de números deve estar em um círculo com centro na origem e raio 5.
Este círculo é um espaço unidimensional situado no plano bidimensional original. O ponto pode
se mover apenas para frente ou para trás ao longo desse círculo e tem apenas um grau de
liberdade. Havia dois números a serem escolhidos (N =2) sujeito a uma relação limitante (r =1) e o
número resultante de graus de liberdade éN−r=2 − 1 = 1.
Considere agora um ponto (x, y, z) no espaço tridimensional (N = 3). Se nenhuma restrição for colocada
em suas coordenadas, ele pode se mover com liberdade em cada uma das três direções, tem três graus de
liberdade. Todas as três variáveis são independentes. Se definirmos a restrição x+y+z=c,Ondecé qualquer
constante, apenas dois dos números podem ser escolhidos livremente, apenas
duas são observações independentes. Por exemplo, deixex−y−z= Se agora escolhermos,
10 . dizer,x=7 ey=9, entãozé forçado a ser - 12.A equação x−y−z=cé o
equação de um plano, um espaço bidimensional cortando o espaço tridimensional original.
b
despaço imensional, e um ponto situado neste espaço tem dois graus de liberdade. N−r=3 −
1 = 2.gSe as coordenadas do (x, y, z) são feitos para estar em conformidade com o
doençax2+y2+z2=k,o ponto será forçado a repousar sobre a superfície de uma esfera cuja
centro está na origem e cujo raio é k.A superfície de uma esfera é um
espaço dimensional. (N =3, r =1, N−r=3 − 1 = 2.).
Caso existamNnúmeros podem ser representados por um único ponto em um espaço deNdimensões,
obviamente uma amostra estatística deNcasos podem ser assim representados por um único ponto amostral.
Este dispositivo, empregado pela primeira vez por RA Fisher em 1915 em um artigo célebre (“Frequency
distribuição dos valores do coeficiente de correlação em amostras de uma população
indefinidamente grande”) tem sido extremamente frutífera e deve ser compreendida por aqueles
que esperam acompanhar os desenvolvimentos recentes.
Consideremos um espaço amostral deNdimensões, com a origem tomada na
verdadeira média populacional, que chamaremos de µ para queX1−µ=x1,X2−µ=x2, etc., onde
X1,X2,...XNsão as pontuações brutas doNindivíduos da amostra. DeixarMseja o meio
eso desvio padrão de uma amostra deNcasos. Qualquer conjunto deNobservações determina
um único ponto de amostra, como S. Este ponto temNgraus de liberdade se nenhuma condição
for imposta às suas coordenadas.
Todas as amostras com a mesma média serão representadas por pontos de amostra
situados no hiperplano(X1−µ)+(X2−µ)+ ... +(XN−µ)=N(M−µ), ou∑X=NM,um espaço
doN−1 dimensões.
Se todos os casos em uma amostra fossem exatamente uniformes, o ponto amostral estaria sobre a linha
(X1−µ)=(X2−µ)=(X3−µ)= ... =(XN−µ)=M−µque é a linha OR na Fig. 1, um
linha fazendo ângulos iguais com todos os eixos coordenados. Esta linha corta o plano
∑X=NMem ângulos retos em um ponto que podemos chamarUMA. Portanto,UMAé um ponto cuja
coordenadas são cada uma igual aM−µ.Por uma relação geométrica bem conhecida,
Figura 1
)2
2
SO=(X1−µ) 2 +(X2−µ) 2 + ... +(X N−µ
OA2=N(M−µ)
2
SO2=OA2+COMO2
OUMA M−µ
Portanto,OA=(M−µ)NeCOMO=s N. A proporção é assim eé
SO s
proporcional à razão entre a quantidade pela qual uma média amostral se desvia da média
populacional para seu próprio erro padrão. A flutuação dessa razão de amostra para
amostra produz o que é conhecido comot-distribuição.
Para calcular a variabilidade das pontuações em uma amostra em torno de uma média
populacional que é conhecidaa priori,estão disponíveisNgraus de liberdade porque o ponto
S se move emNespaço dimensional sobreO; mas para calcular a variabilidade desses
mesmos escores sobre a média de sua própria amostra, estão disponíveis apenasN−1 grau
de liberdade, porque um grau foi gasto no cálculo dessa média, de modo que o pontoSse
move sobreUMAem um espaço de apenasN−1dimensões.
Fisher usou esses conceitos espaciais para derivar a distribuição amostral do coeficiente de
correlação. A derivação completa está fora do escopo deste artigo, mas alguns aspectos são de
interesse aqui. quando temosNindivíduos cada um medido em dois traços, é costume
representar oNpares de números por um diagrama de correlação deNpontos no espaço
bidimensional. Os mesmos dados podem, no entanto, ser representados por dois pontos em N
espaço tridimensional, um ponto representando oNvalores deXe o outro oNvalores deS. Neste
quadro de referência o coeficiente de correlação pode ser mostrado como sendo igual ao
cosseno do ângulo entre os vetores para os dois pontos, e terN−2 graus de liberdade.
Vejamos agora algumas dessas equações para ver o papel desempenhado nelas pelo
número de graus de liberdade. Nas fórmulas a seguir,Crepresenta uma constante cujo valor
é determinado de forma a tornar a área total sob a curva igual à unidade. Embora essa
constante envolva o número de graus de liberdade, ela não precisa ser considerada na
leitura de tabelas de probabilidades, pois, sendo um multiplicador constante, não afeta a
proporção de área sob determinado segmento da curva, mas serve apenas para alterar a
escala de toda a figura.
Curva Normal.
- x2 -
---
- 2σ2--
y=C e1- -
Qui-quadrado.
n−2 x2
y=C2( χ2 )
−
2 e 2
t-distribuição
(n+1)
- t2- − 2
y=C3-1+ -
- n-
Para uma curva normal, a proporção da área em ambas as caudas da curva além de 3s é
. 0027. Para umt-distribuição a proporção é a seguinte:
n 1 2 5 10 20
p . 204 . 096 . 030 . 014 . 007
Novamente, para uma curva normal, o ponto tal que 0,01 da área está nas caudas está a
2,56 s da média.
n 1 2 3 5 10 20 30
x/σ 63,6 9,9 5,8 4,0 3.2 2,8 2,75
Distribuição F e distribuição z
n1- 2
F2 en1z
y=C4 n1+n2
e y=C5 n1+n2
(n1F+n) 2 2
(n e
1 2z+ 2 n ) 2
Em cada uma dessas equações, que fornecem as tabelas utilizadas nos problemas de
análise de variância, ocorre não apenas o valor calculado deF(ou dez), mas também os dois
parâmetrosn1en2,n1sendo o número de graus de liberdade para o quadrado médio em
o numerador deFen2o número de graus de liberdade para isso no denominador.
Como uma tabela de probabilidade deve ser inserida com todos os três, essa tabela geralmente
mostra os valores apenas para valores de probabilidade selecionados. As tabelas publicadas por
Fisher fornecem valores para p= .05,p= .01, ep= .001; os da Snedecor dãop= .05 ep=01.
Distribuição de Amostragem de r.
Sem qualquer referência à geometria, pode ser mostrado por uma solução algébrica
que s NBσN−1. (O símboloBdeve ser lido "tende a igual" ou "aproximado".)
À primeira vista, parece haver nove relacionamentos, mas é imediatamente aparente que
(c) não é novo, pois pode ser obtido somando as três (a) equações ou as cinco (b) equações. Além
disso, qualquer um dos oito restantes pode ser obtido pela manipulação apropriada dos outros
sete. Existem, então, apenas sete relações independentes necessárias impostas às frequências
das células, exigindo que elas somem os totais marginais observados. Desta forman=15 − 7 = 8 e
se calcularmos o Qui-quadrado, devemos entrar na tabela do Qui-quadrado com oito graus de
liberdade. O mesmo resultado pode ser obtido observando que duas entradas em cada linha e
quatro em cada coluna podem ser escolhidas arbitrariamente e não há liberdade de escolha para
as entradas restantes.
∑f(S−S%)=0
e
∑f(S−S%)=Ns
2
2 y (1-r 2 xy ).
Assim existemN−2 graus de liberdade disponíveis.
(d)Variação das pontuações sobre as médias das colunas.--Se de cada pontuação não subtrairmos o
valor de regressão, mas a média da coluna em que se encontra, a variância do
( )
os resíduos assim obtidos serãos2y 1-E2 onde E é a razão de correlação obtida de
a amostra. HáNtais resíduos. Para cada coluna temos a restrição
neu
∑fY=n eu meu,fazercrestrições em tudo. O número de graus de liberdade para
1
variância dentro das colunas é, portanto,N−c.
(e)Variação das médias da coluna sobre a média total--Para calcular esta variância temos
cobservações,ou seja, os meios deccolunas, restritas pela relação única
c
NM=∑neumeu,e por isso temc−1 grau de liberdade. A própria variação pode ser
1
(f)Variação das Médias da Coluna sobre a Linha de Regressão.--Se para cada coluna encontramos o
diferençameu−S%euentre a média da coluna e o valor de regressão e, em seguida, encontre
1c
∑ ) , o resultado serás2(y E−2r)que
2
f (m − Seu
2
eu% eu é uma variação que representa a
N 1
afastamento dos meios da linearidade. Existe uma diferença para cada coluna,
dando-noscobservações, e essas observações são restritas pelas duas relações
c c
∑ feu(meu−S%eu
)=0 e∑fm− % ( )=Ns (E−r).
2
2 2
eu S
eu eu 2 y Portanto, temosc−2
1 1
graus de liberdade.
É evidente que essas variâncias têm relações aditivas e que seus respectivos graus de
liberdade têm exatamente as mesmas relações aditivas.
Testes baseados na razão de duas variações.--De qualquer par dessas variâncias aditivas,
podemos fazer um teste estatístico importante. Assim, para testar se existe correlação linear
s2(1-r) r2(N−2)
2
s2r2
na população ou não, podemos dividir por obtendo . Para
1 N−2 1-r2
testar se existe uma relação mensurável pela razão de correlação na população,
s2E2 s2(1-E2) E2 N−c
podemos dividir por obtendo ⋅ . Para testar se
c−1 N−c 1-E2 c−1
s2(E2−r2) s2r2 E2−r2
correlação é linear, podemos dividir por obtendo ou pode
c−2 1 r2(c−2)
s2(E2−r2) s2(1-E2) E2−r2 N−c
dividir por obtendo ⋅ . Em cada caso, o resultado
c−2 N−c 1-E2 c−2
O valor é referido à tabela F da Snedecor que deve ser inserida com o número apropriado de
graus de liberdade para cada variação. Ou podemos encontrar o logaritmo da razão para a base
e, pegue a metade dele e refira o resultado ao teste de Fisherz-tabela, que também deve ser
inserida com o número apropriado de graus de liberdade para cada variância.