Você está na página 1de 5

ANALISES DE REGRESSO

As analises de Regresso uma equao matemtica que descreve uma relao funcional
entre variveis, geralmente entre duas ou mais variveis, dessa maneira a Regresso
uma tcnica estatstica de interpretao de variaes quantitativas e tem como objetivo
identificar modelos funcionais que descreva como varia uma varivel dependente (Y)
frente mudana da varivel Independente (X) (DI RIENZO et al., 2008; MATUS et al.,
2010).

A equao de Regresso utilizada para explicar os valores de uma varivel em trminos


da outra varivel, ou seja, a causa e efeito das variveis, mas tambm, pode ser utilizada
para realizar predies dos valores de uma varivel com base a uma resposta de correlao
e validar modelos propostos e/ou hipteses sobre o comportamento dos parmetros de um
modelo (LVAREZ, 1994).

As anlises de Regresso podem ser de vrios tipos, dependendo do nmero de variveis


independentes e das funes ou modelos, se o nmero de variveis 1 a regresso
simples e se o nmero de varveis maior do que uma a regresso mltipla; a
classificao da regresso tambm depende da funo, ou seja, se a dependncia funcional
da varivel resposta com a varivel Independente equivalente, ento a regresso linear,
embora se no existir uma relao linear, ento a regresso denominada no linear
(DI RIENZO et al., 2008; LVAREZ, 1994).

Analises de Regresso Linear Simples

Para estudar o comportamento de duas variveis existem muitos modelos que podem ser
construdos para descrever as variaes das variveis, mas o modelo que poderia ser mais
explicativo o modelo linear simples, que segundo Guerra (2009), o modelo se baseia
num conjunto de supostos:

a) A varivel independente (Y) depende de certo grau da varivel dependente (X)


embora, a varivel X aleatria, mas so quantidades fixas que o pesquisador
seleciona e controla.
b) A relao mdia entre X e Y pode ser descrita por uma equao linear cuja
representao geomtrica uma linha reta.

Matus et al., (2010) e Martinz (2011), anotam a equao linear na forma algbrica da
seguinte maneira: = +
Onde, Y e X so as variveis dependente e independentes respetivamente, a indica a altura
da reta (X= 0) ou o coeficiente de posio de origem nas ordenadas e b o seu pendente
ou coeficiente angular que indica o acrscimo ou decrscimo de Y por cada valor de X.

Matus et al. (2011) fez a seguinte representao da regresso linear na seguinte figura:

Figura 1. Representao da Regresso Linear

Analises de Regresso No Linear Simples

Os modelos no lineais no tm os parmetros no encontrassem multiplicando s


variveis independentes, este fato impede estimar o modelo atravs de um sistema de
equaes lineais, por exemplo os parmetros podem estar expressados como exponenciais
das variveis independentes (DI RIENZO et al., 2008)0000000.

A principal vantagem do modelo no linear sobre o linear que 1) sua escolha est
associada conhecimento prvio sobre a relao a ser modelada e 2) geralmente apresenta
interpretao prtica para os parmetros (ZEVIANI; JNIOR; BONAT; 2013).

Regresso Linear Mltipla

A regresso mltipla conceptualmente diferente da simples o nmero de variveis


independentes, ou seja, a regresso mltipla tem mais de 1 varivel independente, nesse
caso o modelo matemtico o seguinte:

= + +, , +

Onde, Bi o coeficiente de regresso correspondente isima varivel; indica o


crescimento da varivel da varivel dependente por aumento unitrio da isima varivel
dependente, suponha-se fixas o restante das variveis (LVAREZ, 1994).
ANALISES DE NORMALIDADE

Existem dois tipos bsicos de distribuio dos dados: Normal ou Anormal, tambm
conhecida como distribuio livre. A distribuio normal ou Gaussiana (relativo Carl
Gauss) apresenta uma forma semelhante a uma curva em sino quando os dados contnuos
esto dispostos em uma curva de distribuio (NORMANDO; TJADERHANE;
QUINTO, 2010).

Pode ser visto que os dados se concentram em torno de uma mdia e se dispersam
simetricamente a partir desse ponto central (SHEATS; PANKRATZ, 2002). Visto de
outra maneira so os erros produzem ao medir uma repetida vezes uma mesma magnitude
e que provoquem uma distribuio (COLEGIO, 2004).

A distribuio Normal uma das mais importantes distribuies de probabilidades da


estatstica, conhecida tambm como Distribuio de Gauss ou Gaussiana. Pode ser
descrito pela funo densidade de probabilidade (Equao 1). Esta equao especificada
por dois parmetros: a mdia populacional, R, e o desvio padro populacional, >0,
ou o equivalente a varincia populacional, . Quando a distribuio dos dados Normal,
a mdia se encontra no centro da distribuio e esta possui o mesmo valor da mediana e
da moda, devido simetria da curva (LOPES et al., 2013).

Tipos de testes de normalidade

Os testes a seguir so os tipos de testes de normalidade que podem ser usados para avaliar
normalidade (MINITAB, 2016).

I. Teste de Anderson-Darling

Este teste compara a ECDF (funo de distribuio cumulativa emprica) dos dados
amostrais distribuio esperada se os dados forem normais. Se a diferena observada
for adequadamente grande, voc rejeita a hiptese nula de normalidade da populao.

II. Teste de normalidade Ryan-Joiner

Este teste avalia a normalidade calculando a correlao entre os dados e as pontuaes


normais dos dados. Se o coeficiente de correlao estiver prximo de 1, a populao
provavelmente normal. A estatstica de Ryan-joiner avalia a fora dessa correlao; se
for menor que o valor crtico apropriado, voc rejeita a hiptese nula de normalidade da
populao. Este teste similar ao teste de normalidade Shapiro-Wilk.
III. Teste de normalidade Kolmogorov-Smirnov

Este teste compara a ECDF (funo de distribuio cumulativa emprica) dos dados
amostrais distribuio esperada se os dados forem normais. Se a diferena observada
for adequadamente grande, o teste rejeita a hiptese nula de normalidade da populao.
Se o valor p deste teste for menor que o alfa escolhido, voc pode rejeitar a hiptese nula
e concluir que a populao no normal.

CONCEITO DE SEMIVARIOGRAMA

Semivariograma a parte central dos estudos geoestatsticos, sendo capaz de descrever


tanto qualitativa quanto quantitativamente a variao espacial, segundo McBratney e
Webster (1986), capaz de descrever a estrutura de dependncia espacial, alm de ser o
ponto chave na determinao do preditor geoestatstico (krigagem) e definir o modelo
que melhor descreve o comportamento dos dados no espao.

A estimativa da dependncia entre amostras vizinhas no espao pode ser realizada atravs
da autocorrelao que de grande utilidade quando se est fazendo amostragem em uma
direo. Quando a amostragem envolve duas direes (x, y) o instrumento mais indicado
na estimativa da dependncia entre amostras o semivariograma (Silva, 1988).

O variograma a ferramenta bsica, que permite descrever quantitativamente a variao


no espao de um fenmeno regionalizado (Huijbregts, 1975). A natureza estrutural de um
conjunto de dados (assumido pela varivel regionalizada) definida a partir da
comparao de valores tomados simultaneamente em dois pontos, segundo uma
determinada direo.

No comportamento tpico de um semivariograma ajustado, o valor de semivarincia


aumenta medida que aumenta a distncia de separao entre os pontos, at estabilizar-
se, ou seja, atingir um patamar (Vieira, 2000). O patamar ("sill") atingido quando a
varincia dos dados se torna constante com a distncia entre as amostras. O valor da
semivarincia nesse ponto aproximadamente igual a varincia total dos dados. Isto
permite a determinao da distncia limite entre dependncia e independncia entre das
amostras (Silva, 1988).

Analisando a expresso da funo semivarincia, pode-se imaginar que quanto mais


prximos estiverem os pontos amostrados, maior ser a semelhana entre eles e, portanto,
menor a semivarincia; e quanto mais distantes estiverem os pontos amostrados menor
ser a semelhana e, consequentemente, maior a disperso (varincia) (GUIMARES,
2004).

Para Guimares (2004) o semivariograma pela sua capacidade de encontrar a relao


intrnseca entre variveis considerado entre os mtodos geoestatsitcos como a
ferramenta para determinar a dependncia espacial. Para cumprir este objetivo alguns
autores recomendam que seja utilizado pelo menos 100 pontos amostrais, entretanto isso
no regra e sim recomenndao, existem trabalhos com bons resultados de ajuste de
semivariogramas usando 45 pontos de amostragem. sabido que quanto maior o nmero
de pontos, maior ser o nmero de pares para o clculo das semivarincias e, teoricamnte,
maior ser a preciso das estimativas, na seguintes Figuras apresentam-se o
comportamento ideal de um semivariograma e tambm so amostrados os parmetros de

Figura 2. Semivariogramas: (A) sem efeito pepita; (B) com efeito pepita
dependncia:

At a dcada de 80, o ajuste do modelo espacial ao semivariograma experimental, era


usualmente feito de forma visual, posteriormente outros ajustes forma desenvolvidos,
dentre estes mtodos, destacam-se os Mtodos dos Quadrados Mnimos Ordinrios,
Ponderados e o Mtodo da Mxima Verossimilhana (MELLO et al., 2005).

Você também pode gostar