Você está na página 1de 6

Uma grande quantidade de dados so freqentemente comprimidos em resumos assimilveis mais facilmente, os quais fornecem ao usurio um sentido do contedo,

sem sobrecarreg-lo com nmeros por demais da conta. Existem vrias maneira nas quais os dados podem ser apresentados. Uma aproximao quebra os nmeros em valores individuais (ou intervalos de valores) e fornece as probabilidades para cada intervalo. Isto chamado de uma "distribuio". Uma outra aproximao estimar os "sumrios estatsticos" para os dados. Para uma srie de dados, X1, X2, X3, ....Xn, onde n o nmero de observaes na srie, os sumrios estatsticos mais largamente usados so como segue a mdia ( ) , que a mdia de todas as observaes na srie de dados

a mediana, que o ponto mdio da srie; metade dos dados na srie maior do que a mediana e metade menor. a varincia, que uma medida do espalhamento da distribuio ao redor da mdia, e calculada primeiro pela soma dos desvios quadrados da mdia, e dividindo-a pelo nmero de observaes (se os dados representam a populao toda) ou por este nmero, reduzido por um (se os dados representam uma amostra)

Quando existirem duas sries de dados, existiro vrias medidas estatsticas que podem ser usadas para capturar como as duas sries se movem juntas atravs do tempo. As duas mais largamente usadas so a correlao e a covarincia. Para duas sries de dados, X (X1, X2,.) and Y(Y,Y... ), a covarincia fornece uma medida no padronizada do grau

no qual elas se movem juntas, e estimada tomando o produto dos desvios da mdia para cada varivel em cada perodo.

O sinal na covarincia indica o tipo de relao que as duas variveis tem. Um sinal positivo indica que elas movem juntas e um negativo que elas movem em direes opostas. Enquanto a covarincia cresce com o poder d o relacionamento, ainda relativamente difcil fazer julgamentos sobre o poder do relacionamento entre as duas variveis observando a covarincia, pois ela no padronizada. A correlao a medida padronizada da relao entre duas variveis. Ela pode ser calculada da covarincia

A correlao nunca pode ser maior do que 1 ou menor do que menos 1. Uma correlao prxima a zero indica que as duas variveis no esto relacionadas. Uma correlao positiva indica que as duas variveis movem juntas, e a relao forte quanto mais a correlao se aproxima de um. Uma correlao negativa indica que as duas variveis movem-se em direes opostas, e que a relao tambm fica mais forte quanto mais prxima de menos 1 a correlo ficar. Duas variveis que esto perfeitamente correlacionadas positivamente (r=1) movem-se essencialmente em perfeita proporo na mesma direo, enquanto dois conjuntos que esto perfeitamente correlacionados negativamente movem-se em perfeita proporo em direes opostas. Uma regresso simples uma extenso do conceito correlao/covarincia. Ela tenta explicar uma varivel, a qual chamada varivel dependente, usando a outra varivel,

chamada varivel independente. Mantendo a tradio estatstica, seja Y a varivel dependente e X a varivel independente. Se as duas variveis so plotadas uma contra a outra num grfico de espalhamento, com Y no eixo vertical e X no eixo horizontal, a regresso tenta ajustar uma linha reta atravs dos pontos de tal modo que minimiza a soma dos desvios quadrados dos pontos da linha. Conseqentemente, ela chamada de regressso ordinria dos mnimos quadrados (OLS). Quando tal linha ajustada, dois parmetros emergem - um o ponto em que a linha corta o eixo Y, chamado de intercepo da regresso, e o outro a inclinao da linha de regresso.

Regresso OLS: Y = a + b X A inclinao (b) da regresso mede ambas a direo e a magnitude da relao. Quando as duas variveis esto correlacionadas positivamente, a inclinao tambm ser positiva, enquanto quando as duas variveis esto correlacionadas negativamente, a inclinao ser negativa. A magnitude da inclinao da regresso pode ser lida como segue - para cada acrscimo unitrio na varivel (X), a varivel dependente mudar por b (inclinao). A ligao estreita entre a inclinao da regresso e a

correlao/covarincia no seria surpreendente desde que a inclinao estimada usando a covarincia

A intercepo (a) da regresso pode ser lida de vrias maneiras. Uma interpretao que ela o valor que Y ter quando X zero. Uma outra mais direta, e est baseada em como ela calculada. a diferena entre o valor mdio de Y, e o valor ajustado da inclinao de X.

Os parmetros da regresso so sempre estimados com algum ruido, parcialmente porque o dado medido com rro e parcialmente porque os estimamos de amostra de dados. Este ruido capturado numa dupla de estatsticas. Um o R-quadrado da regresso, que mede a proporo da variabilidade em Y que explicada por X. uma funo direta da correlao entre as variveis

Um valor de R-quadrado muito prximo de um indica uma forte relao entre as duas variveis, apesar da relao poder ser positiva ou negativa. Uma outra medida do ruido numa regresso o rro padro, que mede o "espalhamento" ao redor de cada um dos dois parmetros estimados - a intercepo e a inclinao. Cada parmetro tem um rro padro associado, que calculado dos dados

rro Padro da Intercepo = SEa =

Se fizermos uma suposio adicional de que a estimativa da intercepo e a inclinao so normalmente distribudas, a estimativa do parmetro e o rro padro podem ser combinados para obter uma "estatstica t" que mede se a relao estatsticamente significante.

Estatstica T para a intercepo = a/SEa Estatstica T da inclinao = b/SEb Por exemplo com mais do que 120 observaes, uma estatstica t maior do que 1,66 indica que a varivel significativamente diferente de zero com 95% de certeza, enquanto uma estatstica maior do que 2,36 indica o mesmo com 99% de certeza . Para amostra menores, a estatstica t tem de ser maior para ter significado estatstico. [1] A regresso que mede a relao entre duas variveis torna-se uma regresso mltipla quando ela extendida para incluir mais do que uma varivel independente (X1,X2,X3,X4..) na tentativa de explicar a varivel dependente Y. Enquanto as apresentaes grficas tornam-se mais difcil, a regresso mltipla conduz a uma forma que uma extenso da regresso simples. Y = a + b X1 + c X2 + dX3 + eX4 O R-quadrado mede ainda a fora da relao, mas uma estatstica adicional do Rquadrado chamada de R-quadrado ajustado calculada para contar a tendncia que induziria o R-quadrado a manter crescente quando as variveis independentes so adicionadas regresso. Se existem k variveis independentes na regresso, o Rquadrado ajustado calculado como segue

Na teoria, as variveis independentes numa regresso precisam estar no correlacionadas uma com a outra. Na prtica, elas so freqentemente, e esta correlao cruzada das variveis independentes chamada multi-colinearidade. Quando existe multi-colinearidade,

Os coeficientes sobre cada uma das variveis independentes tornam-se muito mais difceis para ler isolados, pois as variveis comeam a procurar uma s outras. A estatstica-t relatada tende a exagerar a significncia da relao. Existem aproximaes estatsticas disponveis para se tratar com a multi-colinearidade. A regresso ainda tem poder de previso. Ambas regresses, a simples e a mltipla, esto baseadas numa relao linear entre a varivel dependente e a varivel independente. Quando a relao no-linear, o uso de uma regresso linear conduzir predies incorretas. Em tais casos, as variveis independentes precisaro ser transformadas para tornar a relo mais linear.

Você também pode gostar