Você está na página 1de 16

Respostas e comentários da sabatina

Questão Resposta Comentário Nota

3.1. Qual "Em se tratando de seleção de modelos de regressão, critério: refere-se a escolha da variável que se quer trabalhar. E a estratégia, está relacionada à como cuidado com a linguagem, 2
a chegar aos números, ou seja, aos valores. " porque variável é o que você
diferenç mede no experimento
a entre
critério e
estratégi
a para
seleção
de
modelos
de
regressã
o?
Na seleção do modelo de regressão, deve-se levar em consideração a técnica de seleção para que não se tenha aumento de chances de ocorrer o erro tipo I. está tão confuso que não 1,5
Para isso, dentre outros, dois fatores tornam-se importantes na seleção, e são; o critério de escolha e a estratégia de escolha. O primeiro avalia que modelo é estou com certeza do que
mais apropriado, por exemplo, se utilizará modelo único ou modelos aninhados, levando em consideração os valores do R2 e do F; para ver a questão da disse, embora pareça estar
significância do modelo. O segundo fornecerá um parâmetro de qual modelo escolher, indicará um caminho que a comparação vai fazer para calcular o correto
modelo.
O critério refere-se ao fator escolhido para comparação dos modelos de regressão e desta forma escolher o melhor modelo, como exemplo o coeficiente de ok 2
determinação. Enquanto que a estratégia é como vou fazer a avaliação do critério escolhido dos modelos de regressão.
Na natureza, os fenômenos nem sempre são bem explicados por funções simples, de uma só variável. Nele, é comum se encontrarem eventos dependentes de bastava ter colocado a última 2
duas, três ou mais variáveis significativas. Por exemplo: a produção agrícola depende da fertilidade do solo, do índice das chuvas que caem e da temperatura frase...
da região. Assim, o número de variáveis avaliadas no modelo de estudo é importante, uma vez que as deletadas podem reduzir a precisão das estimativas.
Então, na seleção de modelos, são passos essenciais as especificações do critério e da estratégia de escolha de modelos de regressão. A diferença básica entre
critério e estratégia está no fato de que o critério diz respeito ao porque (razão/motivos) da escolha de um dado modelo de regressão enquanto que, a
estratégia diz respeito ao como se chega ao modelo de regressão, ou seja, qual o processo utilizado para tal.
"Quando são realizados muitos testes sequências aumenta-se a chance de cometer um erro, (num conjunto todo do experimento . Para reduzir isso uma das ok 2
recomendação é começar com um modelo, onde todas as variáveis estão juntos tendo todas as variáveis de uma vez só, e definir: qual o critério, como é que
eu faço a escolha do modelo, (sendo a diferença entre critério e estratégia), o critério é (definido), a estratégia seria como eu chego lá, como é que devo
aplicar realizando a análise e ver se dá para confiar.Critério seria a escolha do modelo, qual o valor que eu vou avaliar. E a estratégia seria como é que eu faço
essa avaliação, o que eu vou observar para fazer a comparação do meu critério. O critério de avaliação do R2 é utilizado como critério de comparação de F é
mais quantitavo. "
Se faz necessário seguir os procedimentos de seleção de modelo, que consiste em especificar um modelo máximo, com todas as variáveis, definir o critério de ok 2
escolha adotado (ex: r2, valor do teste f) e as estratégias (ex: eliminação para traz, seleção para frente, etc.), e conduzir a análise levando em consideração
esses critérios e estratégias adotados para selecionar as variáveis que irão compor o modelo através dos testes. O critério está relacionado com a definição de
quais as variáveis irão compor o modelo adotado, ou seja, como escolher o melhor modelo para avaliação de um conjunto de dados. Já a estratégia se trata de
como é que vou fazer esta avaliação, para chegar aos números necessários ou os melhores números a serem trabalhados.

sábado, 17 de abril de 2010 Página 1 de 16


Questão Resposta Comentário Nota

3.1. Qual 3-1 Dois fatores se tornam importantes e devem ser levados em consideração quanto a seleção do modelo de regressão, permitindo a diminuição das chances ok 2
a de ocorrer o erro tipo I, o critério e a estratégia. O critério consiste caracteristicamente no fator escolhido, avaliando qual modelo é apropriado para realização
diferenç das comparações dos modelos de regressão e posterior escolha do melhor modelo, como o coeficiente de determinação, do valor de F, entre outros. Já a
a entre estratégia, permite realizar avaliações frente a escolha anterior, do critério escolhido dos modelos de regressão.
critério e
estratégi
a para
seleção
de
modelos
de
regressã
o?
O critério esta relacionado com as escolhas das variáveis, tendo como base R2, Fs e nível de significância entre outros parâmetros, respondendo quais as ok 2
variáveis entraram no modelo de regressão, para avaliação de um conjunto de dados a serem feitas as regressões. Já a estratégia, esta relacionada como é que
vou fazer esta avaliação, para chegar aos números desejados, ou os melhores modelos a serem trabalhados.
A diferença entre critério e estratégia será a forma como o experimentador irá avaliar seus dados, a maneira pela qual irá examinar suas hipóteses e a ok 2
estratégia será a maneira pela qual ele irá empregar seus critérios. Sendo assim o critério faz referencia a escolha dos modelos de análise e a estratégia como
ele empregara seu critério. Depois de escolhido o modelo de teste (critério), seja uma regressão ou correlação o passo seguinte será a escolha de como
(estratégia), seja procedendo com stepwise por exemplo.
O critério e a estratégia de escolha do modelo são imprescindíveis para que a chance de ocorrer o Erro tipo 1 seja minimizada. O critério refere-se ao fator que ok 2
será observado para escolher o modelo; enquanto a estratégia refere-se a como será aplicado um determinado critério para chegar ao melhor modelo (único
ou aninhado) para uma dada regressão.
"3.1. Qual a diferença entre critério e estratégia para seleção de modelos de regressão? O critério são condições, são regras, que permitem rejeitar ou não ok 2
hipóteses. Ele possibilita a comparação entre as variáveis. Defini quais as variáveis irão compor o modelo adotado. A estratégia é a definição de como serão
desenvolvidos os critérios. É como se chega aos números, que podem ser consequidos testando todas as regressões possíveis, eliminando para trás ou fazendo
a seleção para frente. "
Critério consiste em escolher, por exemplo, R2 ou o valor do teste f para tomá-los como valores “guias”, que serão utilizados para fazer comparação entre as ok 2
variáveis. Diferentemente de estratégia que consiste em como vou chegar a esses números, que os mesmos podem, por exemplo, ser obtidos testando todas
as regressões possíveis, eliminando para trás ou fazendo a seleção para frente.
Para avaliar modelos de regressão é necessário lançar mão de algumas técnicas para verificar se o modelo é ideal para uma determinada regressão ou não, e ok 2
para isso se determina critérios e estratégias que serão usados para essa avaliação. O critério nada mais é do que, determinar como será feita essa analise
como, por exemplo, observar os valores do R2 e do F, onde F dá uma idéia da relação entre a variação devida ao resíduo e ao acaso. Na estratégia deve-se
testar todas as regressões possíveis, o qual pode gerar um grande número de combinações, sendo que é o único algoritmo que garante uma solução para
qualquer conjunto de variáveis e assim decidir por qual caminho se vai realizar a avaliação da regressão, a partir dai será conduzida a análise de regressão e
com base nesta, verificar se a regressão está confiável ou não de maneira a poder ser utilizada posteriormente.
"Critério é a seleção de variáveis, normalmente, através do seu valor de R2, que é o mais importante, como também através de F, onde este baseia-se na ok, mas o r2 é meio 2
relação entre a variação devida ao resíduo e ao acaso, dentre outros, para entrar no modelo. Estratégia é a forma como irá fazer para chegar nesse valor de complicado... Sugiro F ou
R2, testando as regressões possíveis, e assim, fazer a avaliação de acordo com o maior valor de R2, por exemplo. " prob>f
Critério é qual fator que eu vou utilizar para a escolha do modelo, como por exemplo, pode ser o valor de r2 (apesar de não ser um bom fator), o valor de r, o ok 2
valor de F, entre outros, depende do bom senso da escolha pessoal. Já a estratégia é como será feita a avaliação dos fatores com bases nos critérios
anteriormente escolhidos.

sábado, 17 de abril de 2010 Página 2 de 16


Questão Resposta Comentário Nota

3.2. Diferentemente do modelo linear, os modelos não lineares são baseados em processos biológicos, por isso eles são tão complexos. Fazem uma curva de você explicou o que é um 0,5
Explique Gompertz, representando padrões biológicos, por tanto padrões de modelagem mecanicista, por isso que são padrões interativos. Vai se começar estimando processo interativo, mas não o
porque valores em que os valores iniciais são estimados, e a partir desses valores se estimam outros valores, o computador vai modificando os valores até se obter porque de ser um processo
diferent duas ou três seqüências seguidas dos mesmos valores, até que a função fique paralisada. Também sabemos que todas as causas de interferência são interativo...
emente conhecidas, não há variação do acaso e grande parte dos parâmetros tem significado biológico.
dos
modelos
lineares
os não
lineares
são
baseado
s em
processo
s
interativ
os.
Os modelos lineares, parte do princípio de ajustamento de qualquer conjunto de dados pelo processo de linearização, para que seus coeficientes resultem das ok 2
equações definidas para as relações lineares. Nos modelos lineares, o problema de estimação dos parâmetros, cai no problema de resolver um sistema de
equações lineares com relação aos coeficientes de regressão desconhecidos. Existe uma solução única e, portanto, se obtem uma forma analítica de estimação
dos parâmetros. Esta forma é a mesma para qualquer modelo e qualquer conjunto de dados. Além disso, como os coeficientes são combinações lineares das
observações, pela teoria estatística, demonstra-se que a distribuição amostral dos coeficientes de regressão segue uma distribuição t, assim, podem-se realizar
os testes de hipóteses, calcularem os intervalos de confiança para esses coeficientes. No entanto, esses modelos lineares as vezes nem sempre são necessários
e tendem a apresentar imprecisões significativas, especialmente quando envolve a logaritmização de grande quantidade de dados. Todavia, se o ajustamento
é insatisfatório, convém tentar as funções não-lineares, de grau maior que um. Onde, nos modelos não-lineares, ao invés de se fazer uma descrição puramente
empírica do fenômeno em estudo, pode-se, a partir de suposições importantes sobre o problema (freqüentemente dadas através de uma ou mais equações
diferenciais), trabalhar no sentido de se obter uma relação teórica entre as variáveis observáveis de interesse. O problema, diferentemente do caso linear, é
que os parâmetros entram na equação de forma não linear, assim, nós não podemos simplesmente aplicar fórmulas para estimar os parâmetros do modelo.
Outra vantagem dos modelos não lineares é obter parâmetros que são facilmente interpretáveis. Em muitas situações, necessitam-se de menos parâmetros
nos modelos não lineares do que nos lineares, isto simplifica e facilita a interpretação. Então se percebe que os modelos não-lineares são usualmente
resultantes de processos interativos, porque são frequentemente derivados de modelagem mecanicista, onde todas as causas possíveis sejam conhecidas. São
bons modelos descritores de fenômenos biológicos, pois grande parte dos parâmetros tem significado biológico. Por exemplo, o desenvolvimento de modelos
matemáticos não-lineares (Gompertz), para relacionar peso e idade de um dado organismo animal tem-se mostrado adequados para descrever a curva de
crescimento. Esses modelos permitem que conjuntos de informações em séries de peso por idade, sejam condensados num pequeno número de parâmetros,
para facilitar a interpretação e o entendimento do fenômeno.
Porque nos modelos lineares é feita apenas a avaliação de duas variáveis, uma dependente e outra independente, já nos modelos não lineares a avaliação é não respondeu a pergunta, e 0
feita dos valores variáveis com os valores gerais, observando qual a influência de uma variável específica nos valores gerais, e se esta variável está ou não as não-lineares são
interferindo nestes valores. Os modelos não lineares são bons descritores de fenômeno biológico, químico e físico. univariáveis, enquanto os
lineares podem ter mais de
uma variável independente

sábado, 17 de abril de 2010 Página 3 de 16


Questão Resposta Comentário Nota

3.2. " Para os modelos não lineares o processo tem início quando estima-se alguns valores, e a partir desses vão sendo estimados novos valores, então observa-se excelente, em particular a 3
Explique se foi bom ou ruim, desde de que vai se modificando os valores até que essa seqüência de valores se estabilize. Em até duas, ou três seqüências seguidas parte que eu coloquei
porque temos os mesmos valores.Todos esses modelos não lineares são baseados em processos biológicos. Por isso eles são bastantes complexos. Uma curva de entre<marca> , que é
diferent gompertz, representam padrões biológicos, por tanto padrões mecanificados, por isso que são padrões interativos, onde inicia-se com a estimação de valores realmente a justificativa. Ou
emente sendo complexos. Uma das grandes vantagens deste modelo é que cada um dos parâmetros tem algum significado biológico. Ex: Um parâmetro é avaliado seja, as diferentes constantes
dos sendo a mortalidade, e outro sendo a taxa de crescimento, podemos consegui olhar para o modelo e observar o que ocorre. A exemplos de Gompertz: do modelo afetam os
modelos apresenta uma curva de crescimento com fases inicial e final lenta (pode representar qualquer fenômeno biológico relativamente comum; ex.: altura da resultados umas das outras
lineares planta), outro seria quando “a” é a assíntota do crescimento, onde a assíntota: é o valor que o crescimento vai pender mais não vai chegar nunca, ou seja, é
os não definido como crescimento maximo, “c” é a taxa de crescimento, que esta em função do tempo. Quanto maior c, mais a planta cresci ao longo do tempo e por
lineares fim “b” e “c” constantes negativas.<marca> Não deve-se calcular separadamente o valor de a, b e c, por isso por isso o processo é interativo, se observarmos
são na (na sua fórmula)<marca>. O modelo linear podemos ter o y que contém um vetor de variável aleatória observável, valores de resposta, com a linha
baseado correspondente ao assunto. Por sua vez, o X contém valores fixos, a saber constantes com uma linha por assunto. Cada coluna de X contém os valores para
s em uma variável prognostica. Além disso, B contém os parâmetros, que são fixas, constantes desconhecidas. Cada elemento da linha pares B com uma coluna na
processo variável X. Cada linha e contém uma variável observáveis aleatório “e” capta o desvio de assunto específico da síntese valores . O esperado de Y, X, “e”
s correspondência de amostragem e assuntos, enquanto as colunas de Y, B, e estão associadas com a resposta. Além disso, as linhas de B e colunas de X
interativ correspondem aos seus predizentes. Em muitos contextos os valores da X representam variáveis aleatórias. Primeiro os resultados para X fixos devem possuir
os. dependente de uma escolha particular de X. Por outro lado, as linhas de X devem ser independentes, com distribuições que não dependem dos parâmetros do
modelo.(Y = XB + e) "
"Considerando-se que modelo é igual a regressão. A regressão linear estima o resultado de uma variável dependente a partir de outra variável independente. a pergunta foi sobre o 1,5
Ou seja, determina a relação existente entre uma característica qualquer de interesse experimental, dependente, e uma outra característica independente, porque...
tomadas juntas. Já a regressão não linear, ou seja, nos modelos não lineares, os parâmetros entram na equação de forma não linear, como o próprio nome já
diz, assim nós não podemos simplesmente aplicar fórmulas para estimar os parâmetros do modelo. Já que, este modelo é baseado em processos interativos,
onde joga-se os valores, com base em alguma coisa, e os valores variam de acordo com os valores iniciais. Este modelo descreve bem fenômenos biológicos. "
Porque os modelos não lineares levam em consideração a interação entre as variáveis independentes, explicando melhor os fenômenos biológicos, enquanto deondeéquesaiu esta 0
que os modelos lineares, tanto simples quanto múltiplo, apresenta apenas a interação da variável dependente com a independente. interação? Interação tem
significado específico, e no
mínimo exige duas variáveis...
Como o não-linear de modo
geral tem apenas uma
variável, como fica esta
explicação?}
"A regressão não linear se baseia em processos interativos onde dois ou mais fatores se modificam, pois diferentemente dos modelos lineares a resposta para desde quando os não lineares 1
cada fator tende a ser diferente, considerando o que acontece com cada fator. Esse processo começa estimando alguns valores, e a partir desses vão sendo são pouco usados? Além disto,
estimados novos valores, e ai vê se melhorou ou não, caso não tenha modificado estima se valores até se estabilizar essa seqüência sendo feita duas, ou três eu não encontrei a
seqüências seguidas se ter os mesmos valores. O processo é interativo pois há uma relação entre as variáveis independente – dependente, podendo ser uma comparação entre lineares e
regressão não linear ou RLM mas na regressão múltipla essa relação não é afetada por uma outra variável independente. Devido os modelos não lineares não lineares que justificasse a
serem complexos estes são pouco utilizados, apesar de apresentarem a vantagem de cada parâmetro ter algum significado biológico. " resposta
3-2 Observa-se que nos modelos lineares (simples e múltiplo) a variável dependente (y) é expressa de acordo com o comportamento da variável independente os modelos não lineares têm 0
(x), ou seja, existe uma ligação direta entre essas, além de serem levadas em consideração as variações ao acaso. Nos modelos não lineares, percebe-se que há somente uma variável
interação entre todas as variáveis independentes. Acontece que neste processo, a partir de valores iniciais, é possível encontrar valores estabilizados. Dessa independente... Além disto, do
forma, constata-se o uso do método da tentativa-erro. Esta, não lineares, explica melhor os fenômenos biológicos. mesmo modo que na
linear/linear múltipla a
regressão indica a existência
de relação entre x e y

sábado, 17 de abril de 2010 Página 4 de 16


Questão Resposta Comentário Nota

3.2. "3.2. Explique porque diferentemente dos modelos lineares os não lineares são baseados em processos interativos. Os modelos não lineares são baseados em mais ou menos por aí... 2
Explique padrões biológicos, grande parte dos parâmetros têm significado biológico. Os valores influem em outros, mexendo em um valor o outro é afetado. Se
porque acontecer isso, vai acontecer aquilo outro. "
diferent
emente
dos
modelos
lineares
os não
lineares
são
baseado
s em
processo
s
interativ
os.
Uma regressão linear múltipla é um processo de interação que há entre uma a variável dependente e as variáveis independentes. Já as relações não lineares interação é uma palavra com 0
estabelecem a criação de uma variável adicional para representar a variação do coeficiente angular da relação ao longo do intervalo da variável independente. significado específico. É bom
Esse aspecto se reúne sobre a relação ao longo do intervalo da variável independente. Essa representação de efeitos se concentra sobre a relação entre uma sempre lembrar que a
única variável independente e a variável dependente. O chamado efeito de interação ocorre quando uma relação independente-dependente é afetada por linguagem técnica é precisa, e
uma outra variável independente. Essa segunda variável independente, muda a forma da relação entre uma outra variável independente e a dependente. que as palavras devem ser
Modelos lineares são bons descritores de fenômenos biológicos, torna-se um processo interativo, pois os valores são inicialmente estimados, a principal usadas apenas nos seus
característica desse modelo é que a parte fixa, em geral, decorre de um processo determinístico deduzido a partir de suposições teóricas, ou seja, baseados na significados exatos. De onde
experiência, sendo os parâmetros resultantes interpretáveis e a parte aleatória definida de erros homogêneos. diabos saiu a sua segunda
afirmativa, com relação à
variação do coeficiente
angular, que sequer existe em
uma não linear, já que é uma
característica da linear? Veja
sua frase sobre modelos
lineares...
São baseados em processos interativos por construírem modelos teóricos com uma ampla variedade de interações e interpretações, comumente empregado nos modelos não lineares 1,5
para construção de modelos biológicos onde o numero de parâmetros é bastante grande ou onde as variáveis são dependentes entre si. Por outro lado os normalmente temos apenas
modelos lineares são constituídos por variáveis independentes entre si, representando razões entre as duas variáveis. uma independente...
Os modelos não lineares avaliam a interação existente entre uma variável dependente e duas ou mais independentes, podendo haver ou não interação entre mais atenção à pergunta... Eu 0
as variáveis independentes. Nestes modelos, os valores iniciais são admitidos (adotados como padrão) e durante a análise estatística sofrem alterações perguntei sobre não lineares,
(através da utilização de um programa estatístico), até que os valores estabilizem. que têm apenas uma
independente, além disto,
você somente definiu o que é
processo interativo...

sábado, 17 de abril de 2010 Página 5 de 16


Questão Resposta Comentário Nota

3.2. Os modelos não lineares são testados baseados no método tentativa-erro, onde os valores iniciais são lançados, e são modificados até seus valores se de onde você tirou que o 0
Explique estabilizarem. As variáveis e o modelo permanecem, apenas os parâmetros da equação que mudam de valor. Diferente dos modelos lineares, os não lineares modelo não linear não admite
porque levam em consideração a interação entre as variáveis dependentes e para serem baseados nestes processos, os modelos não lineares devem assumir que variação do acaso? Além disto,
diferent todas as causas do fenômeno biológico são conhecidas, ou seja, não se considera a variação do acaso. Enquanto que nas lineares, a única variação considerando que a regressão
emente apresentada é a da variável dependente (y) com a independente (x) e leva em consideração a variação do acaso. é feita para uma única
dos dependente, pelo menos até
modelos onde eu sei, como apareceu
lineares esta história de interação
os não entre variáveis dependentes?
lineares
são
baseado
s em
processo
s
interativ
os.
Os processos interativos vão e vem, até chegar num determinado ponto que não tem mais nenhuma modificação, vai paralisar o crescimento da curva de cheque a pergunta 0
forma ascendente, continuando seu crescimento de forma continua ou descendente, dependendo do que se estar avaliando. Por isso são bons descritores de
fenômenos biológicos, e existe relação entre as variáveis dependentes e as variáveis independentes.
Porque nos modelos lineares é feita apenas a avaliação de duas variáveis, uma dependente e a outra independente, por exemplo, produção de matéria seca na-na-ni-na-não... Nos não 0
em função da aplicação de doses de nitrogênio no solo. Já nos modelos não lineares a avalia é feita dos valores variáveis com os valores gerais, observando lineares há somente uma
qual a influência de uma variável especifica nos valores gerais, e se esta variável esta ou não interferindo nestes valores. Este modelo (não lineares) são bons independente, enquanto os
descritores de fenômenos biológicos, químicos e físicos. Como exemplo, podemos citar a adubação NPK (três variáveis) em função da produção de matéria lineares podem ter uma ou
seca, ou seja, qual a influencia destas variáveis na produção de matéria seca, podemos neste caso avaliar oito formas de interações distintas (0, N, P, K, NPK, mais... Além disto, não vi
NP, NK, PK). patavina de explicação
3.3. Podemos considerar as regressões polinomiais como um caso especial da regressão linear múltipla, porque é praticamente impossível antever visualmente as rodou, rodou e disse muito 1,5
Discuta relações entre a variável dependente e as independentes. Isso porque, além de só ser possível traçar gráficos de funções de no máximo duas variáveis pouco... Começa logo pela
a frase independentes, as funções associadas aos diagramas de dispersão só são fáceis de identificar para relações simples. Os modelos de regressão polinomial primeira frase, que mistura
"Podem caracterizam-se por considerar que as variáveis explanatórias devem ser quantitativas; servem para representar modelos com resposta curvilínea e são fáceis dificuldade de visualização,
os de serem ajustados, pois são um caso especial do modelo de regressão linear múltipla. O uso dos modelos polinomiais prescinde algumas condições, tais que não é verdade para a
consider como: (a) quando a função de resposta curvilínea verdadeira é realmente uma função polinomial e (b) quando a função de resposta curvilínea verdadeira é polinomial, com caso especial.
ar as desconhecida (ou complexa), porém, uma função polinomial é uma boa aproximação para a verdadeira função. Exemplo: produção em resposta a aplicação de Pelo que consegui entender,
regressõ adubação. No entanto, o principal problema com o uso de modelos polinomiais é com a extrapolação. Deve-se considerar ainda que a determinação de um só foi responder a pergunta no
es modelo polinomial se dá por etapas. Avalia-se o modelo mais simples, considerando a variável preditora mais significativa. Sendo a precisão insatisfatória, finalzinho.
polinomi acrescenta-se nova variável e faz-se nova avaliação. Se ainda é insatisfatória, repete-se o processo. A repetição pára quando uma precisão satisfatória –
ais como medida pelo valor r2 ou de r – é atingida. Outro aspecto a observar é que, se a explicação dada por uma função mais complexa é a mesma de outra mais
um caso simples – por exemplo, a correlação da função em x é a mesma da função em x e y -, adota-se a mais simples no caso, a função em x é preferível à função em x
especial e y). Assim, percebe-se que na implementação de um modelo polinomial, adota-se uma abordagem hierárquica para o ajuste do modelo. Geralmente, ajusta-
da se um modelo de segunda ou terceira ordem e, então, procura-se estudar se um modelo de menor ordem é adequado.
regressã
o linear
múltipla
".

sábado, 17 de abril de 2010 Página 6 de 16


Questão Resposta Comentário Nota

3.3. Esta frase é afirmativa, pois a regressão polinomial pode ser considerada um caso especial da linear múltipla, pois também é uma regressão linear que utiliza ok 2
Discuta potências para criar estimativas, e a múltipla é uma extensão da linear simples, com mais variáveis independentes.
a frase
"Podem
os
consider
ar as
regressõ
es
polinomi
ais como
um caso
especial
da
regressã
o linear
múltipla
".
Deve-se resaltar que as lineares não são as polinomiais. A polinomial funciona como se fosse uma linear múltipla, em que a primeira variável, a segunda ok, mas lembre que a 2
variável são os efeitos quadráticos e cúbicos de x, mais para todos os fins ela funciona definitivamente como uma linear múltipla polinomial não precisa ser
somente até a cúbica...
3-3 Avaliando as regressões, conclui-se que essa afirmativa é verdadeira. Observa-se na Regressão polinomial a presença de termos polinomiais, porém porque? 2
persistindo o modelo básico da regressão linear, podendo dessa forma, ser um caso especial de regressão linear múltipla
"Na regressão polinomial, têm-se duas variáveis, sendo uma dependente e uma independente. Onde, a variável independente é expandida num polinômio, ok 2
como já diz o próprio nome, até o décimo grau, com geração de novas variáveis, como por exemplo, x2 = x*x; x3= x2*x e daí por diante. Logo, consideramos
como um caso especial da regressão linear múltipla, onde esta envolve também três ou mais variáveis. Sendo, uma única variável dependente, porém duas ou
mais variáveis independentes. Já que, a regressão polinomial tem a princípio duas variáveis apenas, e passa a expandir-se e obter mais variáveis. "
Sim, a polinomial funciona como a regressão linear múltipla, em que a segunda variável e terceira variável são de efeitos quadráticos e cúbicos de X. polinomial só pode ser até 2
cúbica?
Diante dessa frase a regressão polinomial pode ser considerada uma linear múltipla, onde a segunda e a terceira variáveis são os efeitos quadráticos e cúbicos ok, mas lembre que a 2
de x, ou seja, para todos os fins ela funciona como uma linear múltipla. A regressão polinomial não tem significado biológico, mais pode ser usada como polinomial não se restringe até
aproximação, já que nada biológico se comporta como uma parábola, mas a polinomial é usada por ser de fácil resolução. cúbica
"3.3. Discuta a frase “Podemos considerar as regressões polinomiais como um caso especial da regressão linear múltipla”. Podemos considerar. A polinomial ok 2
funciona como se fosse uma linear múltipla, em que a primeira variável, a segunda variável são os efeitos quadráticos e cúbicos de x, “como se fosse outra
variável”. "
A partir da análise da equação da regressão polinomial, pode-se considerar que a afirmação é verdadeira. A polinomial ocorre quando se adicionam termos ok 2
polinomiais ao modelo básico da regressão linear, contendo termos quadráticos e de maior ordem nas variáveis independentes. Pode-se incluir qualquer
número de termos; se for na segunda variável independente será de primeira ordem, e é idêntica a uma linha reta, já se o termo estiver na terceira será uma
equação quadrática, ou ainda se estiver na quarta variável será do tipo cúbica. Portanto, a equação polinomial não é estritamente uma equação não-linear.
Fixando valores de X e os demais parâmetros constantes, um gráfico de qualquer parâmetro (A, B, C ...) versus Y seria linear. Do ponto de vista matemático, a
equação polinomial é linear. Na polinomial tem-se (Y = a + b1X1 + b2X22 + ... + bnXn + εi), matematicamente ela é um acaso especial da regressão linear
múltipla, uma vez que a equação da linear múltipla é (Yi = a + b1X1i + b2X2i + ... + bnXni + εi ), e tendo os valores de X iguais, ou seja, (Xi = X1i e X2 = X2i); então
(Y = a + b1X1 + b2Xi + εi).

sábado, 17 de abril de 2010 Página 7 de 16


Questão Resposta Comentário Nota

3.3. A linear raramente representa bem toda uma série de dados, no entanto, costuma representar bem faixas de valores. Tem –se duas independentes para 1 cheque a pergunta de novo 0
Discuta dependente com processos interativos. Já na polinomial temos 1 dependente para 1 independente, cuja a equação com dois ou mais (x) sendo que a medida por favor... Eu esta
a frase que (x) aumenta os dados se tornam mais detalhados. Regressões polinomiais não têm interpretação biológica válida para os parâmetros mas são úteis como comparando as lineares
"Podem simplificação de situação real. múltiplas com a polinomial
os
consider
ar as
regressõ
es
polinomi
ais como
um caso
especial
da
regressã
o linear
múltipla
".
Considerando que as regressões polinomiais levam em consideração uma variável independente e outra variável dependente, porém estas não consideram as na linear múltipla não há 0
interações entre estas variáveis. Além disso, as regressões polinomiais não têm uma boa resposta biológica aos fenômenos ocorridos. Enquanto na regressão interação entre variáveis. Elas
linear múltipla existe um processo interativo entre as variáveis. Neste tipo de regressão temos uma variável dependente e duas ou mais variáveis atuam conjuntamente para
independentes, onde ao invés de estarmos avaliando y e x, (regressões lineares e polinomiais), estamos avaliando y (variável dependente), e x, z e w (variáveis explicar o que acontece com a
independentes). dependente, mas cada uma
com seu efeito específico, que
não é afetado pelas demais
variáveis. Além disto, não vi
nada sobre a pergunta
propriamente dita
r sem comentários 0
Podem ser consideradas por empregar uma ampla série de parâmetros, porem sua descrição para fatores biológicos tem muitas limitações. A utilização de a justificativa não está 0,5
vários parâmetros nesse caso possibilita a construção de modelos simplificados, bons representantes de faixas de eventos mas são ruins para modelagem de centrada no ponto principal da
cenários reais. semelhança entre eles...
Podemos considerar a afirmação verdadeira, pois comparando os dois tipos de regressões observa-se que a regressão polinomial é uma linear múltipla com a ok 2
adição de termos polinomiais.
"Sim. A regressão linear múltipla possuir uma variável dependente e variáveis independentes. Já a regressão linear polinomial possui apenas uma variável ok 2
dependente e uma independente; porém como já foi comentado a variável independente pode ser expandida num polinômio até o décimo grau com geração
de novas variáveis. Diante disto, podemos considerar que a regressão polinomial e a regressão linear múltipla, apesar de terem algumas diferenças, possuem
similaridades, pois a regressão polinomial funciona na realidade como se fosse uma linear múltipla, em que a primeira variável, a segunda variável são os
efeitos quadráticos e cúbicos de x. "

sábado, 17 de abril de 2010 Página 8 de 16


Questão Resposta Comentário Nota

3.4. "3.4. Discuta as principais vantagens e desvantagens do processo stepwise para seleção do modelo linear múltiplo a ser empregado. Vantagens: • Possibilita ok 2
Discuta a seleção das variáveis que o teste demonstra não representar importância ou significância entre o máximo ou o mínimo de variáveis. • A mistura de técnicas
as permite a seleção de variáveis que determinam valores de importância e significância relevantes para a amostra, podendo-se eliminar aqueles que não são
principai representativas no modelo. Desvantagens: • A variável pode ser avaliada duas vezes. • É difícil a interpretação do modelo em casos onde o número de
s variáveis é muito grande, com isso, o número de combinações possíveis torna o modelo muito complexo. • A geração de modelos conflitantes aumentando ou
vantage diminuindo a eficiência de uma variável gerando modelos desordenados. • A escolha de uma variável pode modificar completamente a interpretação dos
ns e resultados por esse modelo alterando ou induzindo a intervenção em determinada situação. "
desvanta
gens do
processo
stepwise
para
seleção
do
modelo
linear
múltiplo
a ser
emprega
do.
O processo stepwise é uma estratégia usada para analisar os dados partindo do principio que ao seguir-se adiante na seleção é necessário que se retorne ao outra desvantagem é que o 2
ponto anterior de forma a resultar na possibilidade de retirada de uma das variáveis analisadas presente. Os programas que realizam este procedimento modelo final pode não ser
permitem selecionar valores de probabilidade para uma variável entrar ou sair, desta forma recomenda-se usar para entrar 0,99999 ou 1 dependendo da igual para diferentes análises
situação e para sair 0,0000001 ou de preferência 0. A stepwise apresenta a vantagem de maior confiabilidade na análise de um número maior de variáveis em do mesmo conjunto de dados,
relação à análise menos variáveis, já que ela testa todas as variáveis, porém a stepwise apresenta como desvantagem o erro cumulativo maior já que toda devido às escolhas iniciais de
variável testada tem uma erro incorporado. variáveis
Stepwise é a mistura das estratégias, a eliminação para trás e seleção para frente, só que diferentemente das técnicas isoladas, as variáveis saem e entram do além destas desvantagens, o 2
modelo, tendo isso como vantagem, pois possibilita a variável independente que tenha saído, por não ter feito boa combinação com determinadas variáveis, resultado final vai depender
ser testada novamente, agora com outras variáveis, e voltar para o sistema por ter feito boa combinação. Quanto maior a quantidade de variáveis melhor, em das escolhas iniciais, com
termo de confiabilidade. A desvantagem está no erro que acompanha as variáveis, o erro acumulativo, testes sequenciais aumenta a chance de erro, e por ser possíveis regressões diferentes
mais difícil de sair, e mais fácil de entrar, deixa o modelo mais próximo de pecar todos os modelos. do mesmo conjunto de dados
O processo stepwise se baseia em uma mistura de técnicas, onde estas servem de estratégia para analisar dados. Você começa com um passo para frente e realmente uma variável 1,5
pode dar um passo para trás, para retirar umas das variáveis já presentes. Ou seja, você vai para frente e para trás, pode entrar e sair. Os programas permitem selecionada pelo stepwise,
selecionar valores de probabilidade para uma variável entrar ou sair, onde se recomenda 1 ou 0,99999 para entrar e 0 ou 0,0000001 para sair. Este processo adequadamente feito,
apresenta como vantagem a certeza dos resultados das suas variáveis, pois você só assume este valor se realmente apresentar melhor resultado, caso normalmente é importante,
contrário o programa descarta automaticamente. E quanto mais variáveis, melhor, em relação à confiabilidade. Quanto à desvantagem, temos um processo mas o problema, que não foi
demorado. mencionado, é que o erro é
cumulativo, lembra. Além
disto, tempo hoje não tem
importância com a velocidade
dos computadores

sábado, 17 de abril de 2010 Página 9 de 16


Questão Resposta Comentário Nota

3.4. O processo stepwise tem por objetivo ver a contribuição de cada variável independente para o modelo, quando a maior contribuição é acrescentada. É uma a colinearidade é um 2
Discuta estratégia para a seleção do modelo linear múltiplo, que tem como vantagens a possibilidade de analisar a resposta para cada variável em cada passo, problema em qualquer análise
as permitindo avaliar se a entrada desta variável obteve ou não melhor resultado do que a anterior. Pode ser utilizada para avaliar um grande número de de regressão linear múltipla
principai variáveis, pois se torna mais confiável e as variáveis que não apresentarem resposta melhor que a anterior - de acordo como o critério de avaliação escolhido -
s podem ser retiradas, depois de serem feitas todas as combinações possíveis. Já em relação as desvantagens, a colinearidade é uma delas, que se forem
vantage incluídas variáveis semelhantes, as respostas podem ser influenciadas,podendo haver uma superestimação dos fatores da relação; outra desvantagem é que se
ns e uma variável for retirada , esta não poderá mais voltar para a análise, também não pode ser aplicado para poucas variáveis, pois a confiabilidade diminui e as
desvanta probabilidades do teste F são problemáticas.
gens do
processo
stepwise
para
seleção
do
modelo
linear
múltiplo
a ser
emprega
do.
"Vantagens: • A mistura de técnicas possibilita a seleção de variáveis que determinem valores de importância e significância relevantes para sua amostra, ok 2
podendo-se eliminar aqueles que não são representativas no seu modelo, dessa forma aumentando a confiabilidade dos critérios. • Possibilita a seleção ou
exclusão dos parametros que o teste demonstra não representar importância ou significância entre o máximo ou o mínimo de variáveis. Desvantagens: • Umas
das desvantagens do stepwise é a geração de modelos conflitantes aumentando ou diminuindo a eficiência de uma variável gerando modelos desordenados. •
Outra desvantagem do processo de stepwise é repetição de uma variável ou seja ela pode ser avaliada duas vezes pelo seu modelo. • Difícil interpretação do
modelo em casos onde o numero de variáveis é muito grande, dessa forma o numero de combinaçãoes possíveis torna o modelo muito complexo e pouco
representativo de um cenário real. • A escolha equivocada de uma variável pode modificar completamente a interpretação dos resultados por esse modelo,
alterando ou induzindo a intervenção em determinada situação. "
"Vantagens: • Na mistura de técnicas, em cada passo dado para frente você pode retirar variáveis que já estavam presentes, podendo assim deletar aquela a principal desvantagem é a 2
que não aumentou significativamente a soma dos quadrados dos resíduos (discrepância entre os dados e um modelo de estimativa). • Eliminar as que se segunda na sua resposta
verificou não terem importância, ou que é inadequada; • Você pode escolher o máximo de variáveis, ou o mínimo, sabendo-se que quando mais variáveis
melhor em termo de confiabilidade; • Permite o uso de probabilidades para uma variável entrar ou sair. • Essa estratégia vai facilitar a realização ao modelo
linear múltiplo, e dar mais confiabilidades ao mesmo. Desvantagens: • Aumento da possibilidade de erro, pois todas as variáveis vão ser testadas por uma
mistura de técnicas e algumas se possível retiradas; • Processo complexo de difícil interpretação dos n-valores obtidos e que estão associados a este teste, o
resultado final depende dos testes anteriores de inclusão e exclusão de variáveis. "
No processo de stepwise ocorre uma mistura de técnicas iniciada com um passo de seleção para frente (sendo que para cada passo para frente pode-se retirar esqueceu uma das principais 1,5
uma das variáveis já presentes). A eliminação para trás inicia-se com todas as variáveis, testando-se todos os modelos com retirada de uma variável e para desvantagens, que é o fato do
cada modelo testa-se o efeito da retirada da última variável, posteriormente seleciona a variável com menor efeito de retirada. A seleção para frente inicia-se modelo final depender dos
do zero e posteriormente adicionam-se as variáveis. Este processo pode ser feito através de dois métodos: backward (eliminação de variáveis que apresentam passos anteriores, podendo
efeitos não significativos) e forward. As vantagens de se utilizar o processo de stepwise é que além de termos um menor número de combinações de ser diferente de acordo com a
regressões a testar, podemos eliminar as variáveis que não tenham significância ou que pouco alterem a regressão. Bem como uma maior confiabilidade escolha de caminhos
devido ao grande número de variáveis. A desvantagem é que pelo fato de trabalhar com muitas variáveis independentes, o erro pode ser cumulativo.

sábado, 17 de abril de 2010 Página 10 de 16


Questão Resposta Comentário Nota

3.4. 3-4 O processo Stepwise possibilita verificar as interferências de cada variável independente utilizada no modelo, possibilitando avaliar as entradas de novas colinearidade é problema por 2
Discuta variáveis e possíveis resultados favoráveis ou não. Mesmo apresentando certo nível de complexidade, permite testar muitas combinações, consistindo numa qualquer caminho que se
as das vantagens, por apresentar maior confiança dos dados da análise, fruto das várias regressões obtidas neste processo. Como desvantagem constata-se que a avalie a RLM.
principai retirada de variáveis pode ser decisiva quanto aos resultados; a colinearidade no que se refere ao uso de variáveis semelhantes, possibilitando dessa forma
s resultados superestimados devido principalmente por resultados influenciados por este; o uso de poucas variáveis, que pode diminuir a confiabilidade
vantage podendo ocorrer problemas quando ao teste F.
ns e
desvanta
gens do
processo
stepwise
para
seleção
do
modelo
linear
múltiplo
a ser
emprega
do.
"O Stepwise é um processo complexo que testa todas as regressões possíveis analisando, desta forma um grande número de combinações. É vantajoso porque o stepwise NÃO testa todos os 2
parte da premissa que a eleição de variáveis deve satisfazer ao princípio de máxima relação causal. Este é um método que se atem em elevar a eficiência modelos possíveis...
média do modelo. No stepwise é possível examinar a contribuição de cada variável independente para o modelo. A variável independente com maior
contribuição é acrescentada em um primeiro momento. Variáveis independentes são então selecionadas para inclusão, com base em sua contribuição
incremental, sobre os já presentes na equação. Nele observa-se a vantagem de oferecer maior fiabilidade na análise, de um número maior de variáveis em
relação à análise de um número menor de variáveis; uma vez que todas as regressões possíveis são testadas. Tem a grande vantagem de manter relações
causais, elevando ao máximo o poder de previsão incremental da variável adicional. Em contrapartida, o emprego de muitas variáveis regressoras implica num
grande número de interações. E, assim, dá-se a desvantagem do método de stepwise, pois a colinearidade pode existir entre algumas das variáveis
explanatórias e algumas das interações. A colinearidade entre variáveis independentes pode ter um substancial impacto sobre a especificação final do modelo.
Primeiro, ela limita o tamanho do coeficiente de determinação e fica cada vez mais difícil acrescentar uma única previsão explanatória a partir de variáveis
adicionais. Em segundo ela torna a determinação da contribuição de cada variável independente mais complicada porque o efeito das variáveis está mais
complexo. Resulta em partes maiores de variância partilhadas e níveis mais baixos de variância única. Além dos efeitos na explicação, a multicolineridade pode
ter grandes implicações na estimação dos coeficientes de regressão e em seus testes de significância estatística. O critério para admissão ou exclusão nessa
abordagem é maximizar o poder preditivo incremental da variável adicional. Se uma dessas variáveis entrar no modelo de regressão será muito provável que a
outra variável também entre, pois essas são altamente correlacionadas e existe pouca variância individual para cada variável separadamente. Portanto, avaliar
os efeitos da colinearidade na interpretação do modelo e examinar as correlações diretas de todas as variáveis independentes potenciais; ajuda a evitar
concluir que as variáveis independentes que não entram no modelo não têm importância quando na realidade elas estão altamente relacionadas com a
variável dependente, mas também correlacionadas com as variáveis já presentes no modelo. Um outro problema do uso de testes seqüenciais, como no caso
do Stepwise, deve-se ao aumento da chance de cometer o erro tipo I, pois com o uso de muitas variáveis há aumento da chance de erro, uma vez que esse se
torna cumulativo. Por exemplo, para um nível de significância de 5% num experimento com 20 variáveis, o erro pode chegar a 100%. "

sábado, 17 de abril de 2010 Página 11 de 16


Questão Resposta Comentário Nota

3.4. "Equações de regressão linear múltipla podem ser calculadas pelo método Stepwise. Este é mais problemático, é todo o procedimento contra. Como podemos ok 2
Discuta escolher, é melhor que coloque-se valores que te dêem pouca margem para erro, os valores só entram com 100% de certeza para entrar, e só sai se realmente
as não tiver chance nenhuma de ser importante. Deve-se utilizar valores mais próximos de 0,999( entrar), coloca-se o valor mais alto possível que o progama
principai aceite, não é o valor hum, mais está perto e para sair deve-se utilizar (0,0000001), assim podendo testar todos os modelos. A desvantagem seria a
s possibilidade do descarte de alguns valores que poderiam ser importantes. Ele só vai tirar ou colocar se o grau de confiança for grande e de que aquela variável
vantage vai entrar ou sair, independente de ficar com mais variáveis. O modelo que ele vai criar é o maior do que menor possível. Ele demora mais para descartar, mas
ns e por outro lado se tem a confiança que é para descartar realmente sendo uma vantagem. Isto é um teste seqüencial ainda aumenta a chance de erro, sendo
desvanta acumulativo, sendo uma desvantagem . Quando se faz muitos testes seqüenciais se coloca um nível de segurança muito exigente para ter chance muito
gens do pequena de ter erros. "
processo
stepwise
para
seleção
do
modelo
linear
múltiplo
a ser
emprega
do.
O processo stepwise, permite testar combinações entre as variáveis, se mostrando a mais interessante para a seleção do modelo. Estas combinações como A pergunta foi 2
estratégias para a seleção do modelo indicam o processo utilizado na escolha do modelo. Pode-se testar todas as regressões possíveis de um modo que 2 seja especificamente sobre o
um número de variáveis possíveis. Entretanto isso garante um grande número de combinações, tanto maior quanto forem as variáveis. Por isso é um processo stepwise... Aparentemente
demorado. Este é um modelo algaritmo (modelo matemático) que garante uma solução para qualquer conjunto de variáveis. A eliminação para trás consiste você preferiu garantir e falar
em obter o menor conjunto de dados que expliquem melhor o que acontece. Inicia-se com todas as p variáveis e testa todos os modelos com p-1 variáveis, de sobre todos eles
modo que para cada modelo testa-se o efeito da retirada da última variável para que sejam selecionadas para frente, pode ser definido como o oposto da
“para trás”, dado que ao invés da retirada, são adicionadas as variáveis até que se obtenha um conjunto de dados que expliquem bem o que ocorre. Como o
processo stepwise se caracteriza por uma mistura de técnicas, onde se começa com um passo de seleção para frente e para cada passo para frente, pode
retirar uma das variáveis já presentes, ou seja, uma forma de testar combinações, onde ao adicionar uma variável a outra, depois se retira alguma das duas e
se verifica o que interferiu e se verifica a que responde melhor. Quanto à decisão de qual é a melhor, cabe ao pesquisador. Portanto, trata-se de um
procedimento automático para fins estatísticos de seleção de modelos em casos onde há um grande número de variáveis explicativas potenciais, e nenhuma
teoria subjacente sobre a qual basear a escolha do modelo. O procedimento é utilizado principalmente na análise de regressão, embora a abordagem básica é
aplicável em muitas formas de seleção de modelos. Esta é uma variação sobre a seleção para a frente. Em cada etapa do processo, após uma nova variável é
adicionada, é feito um teste para verificar se algumas variáveis podem ser deletadas sem aumentar significativamente a soma dos quadrados dos resíduos
(RSS). O processo termina quando a medida é (localmente) maximizada, ou quando a melhoria disponível cai abaixo de um valor crítico. Algumas desvantagens
são apontadas na manipulação de dados através dos procedimentos de regressão stepwise que são controversos. Algumas críticas são feitas, a saber: as
probabilidades de F raramente são adequadas, ou seja, uma sequência de testes – F é frequentemente usada para controlar a inclusão ou a exclusão de
variáveis onde muitos critérios de correção tem sido desenvolvidos; é difícil a interpretação dos p-valores associados a estes testes, pois cada um está
dependente dos testes anteriores de inclusão e exclusão; se os testes são baseados nos mesmos dados eles são tendenciosos e podem induzir a erros de nível
de significância, ou seja, um coeficiente de correlação múltipla pode evidenciar um F significativo a 0,1% quando foi de fato a apenas 5%.

sábado, 17 de abril de 2010 Página 12 de 16


Questão Resposta Comentário Nota

3.4. Stepwise é a estratégia que analisa os dados partindo do principio que ao seguir-se adiante na seleção é necessário um retorno ao ponto anterior de forma a esqueceu uma desvantagem 2
Discuta resultar na possibilidade de retirada de uma das variáveis analisadas presente. Os programas que realizam este procedimento estratégico permitem selecionar muito importante que é que o
as valores de probabilidade para uma variável entrar ou sair, desta forma, recomenda-se usar para entrar 0,99999 ou 1 dependendo da situação e para sair modelo selecionado pode ser
principai 0,0000001 ou de preferência 0. Na Stepwise observa-se maior confiabilidade na análise de um número maior de variáveis em relação a análise de um número afetado pelos passos iniciais
s menor de variáveis e Raramente deve-se utilizar as probabilidades de F. Essa mistura das técnicas (Stepwise), apresenta a vantagem de se testar todas as
vantage variáveis além de possuir alta precisão onde as probabilidades de acertos e erros são bem definidas no processo, porém a desvantagem é que o erro
ns e cumulativo é maior.
desvanta
gens do
processo
stepwise
para
seleção
do
modelo
linear
múltiplo
a ser
emprega
do.
Como vantagens têm a alta precisão do método, uma vez que as probabilidades de acertos e erros são bem definidas no processo. Outra vantagem é que o stepwise NÃO testa todas as 1
todas as possíveis regressões são testadas neste modelo, porém este mesmo fato pode ser uma desvantagem, devido ao grande número de regressões possíveis regressões. A
regadas. Outra desvantagem é o custo elevado devido à necessidade de um estudo confirmatório. Ainda temos outras desvantagens como o processo não necessidade de confirmação é
permitir colinearidade de dados, como por exemplo, CTC e soma de bases. Além de termos que checar as premissas da análise de variância (Homocedase, independente do processo
distribuição normal e independência dos tratamentos). Outra desvantagem é porque o erro é acumulativo, ou seja, a cada avaliação se tem um erro que vai se escolhido para determinar a
acumulando a cada análise. regressão, portanto não é
aumentado pelo stepwise. A
colinearidade deve ser evitada
independemente do
procedimento de seleção do
modelo, e o principal
problema é que o modelo
selecionado pode ser afetado
pela escolha inicial do
caminho do stepwise
O processo stepwise é uma estratégia de avaliação de modelos, apresentando como vantagem o fato de trabalhar com todas as possíveis combinações das o stepwise Não testa todas as 1,5
variáveis independentes, avaliando se a entrada de uma nova variável independente conferiu ou não melhores resultados que a variável anterior, sendo uma combinações...
boa estratégia para trabalhos com grande número de variáveis independentes, desta forma apresenta maior confiabilidade. E como desvantagens pode-se
citar: o fato de que quando uma variável é retirada, não voltará mais para análise; apresenta probabilidades de F inadequadas; e a colinearidade, que pode
levar a superestimação dos fatores da relação.

sábado, 17 de abril de 2010 Página 13 de 16


Questão Resposta Comentário Nota

3.5. É necessário que se tenha duas ou mais variáveis independentes e apenas uma variável dependente, onde o valor de (b) vai ter um significado para cada (x) tudo bem que só posso fazer o 0
Quais diferente. múltiplo quando tenho mais
seriam de um x, mas estava pensando
os mais em termos de
requisito colinearidade, normalidade,
s para o etc
emprego
adequad
o de
uma
regressã
o linear
múltipla,
a seu
ver?
Empregaria adequadamente uma regressão múltipla quando as variáveis analisadas forem quantitativas; quando as variáveis necessitarem de uma interação esqueceu os pontos mais 0,5
para melhor explicarem os dados; quando tiver uma variável dependente e variáveis independentes, na qual esta ultima vai ter para cada x um b. Por exemplo: importantes como
usaria esta regressão para analisar os dados de um experimento em que utilizei N, P e k para a adubação, pois assim conseguiria entender a interação desses colinearidade, distribuição
elementos e a diferença entre ambos. normal dos resíduos, etc, etc
A equação deve apresentar pelo menos duas variáveis independentes quantitativas explicativas, que tenham respostas diferentes e que não apresentem nenhum detalhe como 1,5
colinearidade, e onde pelo menos uma das variáveis tenham importância. normalidade, etc?
"Certas exigências devem ser satisfeitas para se realizarem inferências válidas sobre o coeficiente de regressão linear múltipla, tais como: (a) A variável tudo bem que os requisitos 1
dependente (y) deve ter distribuição normal ou aproximadamente normal; (b) A variação de y deve ser a mesma em cada valor das variáveis independentes xs para uma linear simples
(homocedasticidade). Se não houver homocedasticidade, será necessário transformar os dados; (c) Os pontos no gráfico devem apresentar uma tendência também são aplicáveis à
linear. Caso contrário, a equação que melhor representará o fenômeno não será uma reta, mas outra linha qualquer. Se os pontos se apresentarem em curva, múltipla, mas será que
pode-se tentar transformar os dados de forma a obter uma reta, ou ajustar uma curva, o que não é difícil com os modernos programas para computadores; (d) custaria muito ver o que
Os valores de y foram obtidos ao acaso da população e são independentes uns dos outros; (e) As variáveis independentes (xs) foram medidas sem erro. estava escrevendo? Dê uma
Satisfazer esta exigência, na prática, é muito difícil. Por isso, o que se faz é pressupor que os erros ocorridos ao medir x são desprezíveis ou, pelo menos, olhada na sua letra c... Além
menores dos que os que estão associados à mensuração de y. " disto, não falou nem de
passagem em colinearidade
que é uma consideração muito
importante no RLM
A meu ver, a RLM deve primeiramente ter variáveis quantitativas explicativas que não apresentem colinearidade entre elas, já que para se ter uma RLM normalidade? 1,5
precisa-se de no mínimo duas variáveis independentes onde estas variáveis têm que se relacionar entre si e apresentar efeito significativo no que se estar
estudando, além disso, deve-se evitar a presença de duas variáveis, que tenham respostas parecidas, em uma mesma equação, devendo-se escolher apenas
uma.
"3.5. Quais seriam os requisitos para o emprego adequado de uma regressão linear múltipla, a seu ver? Que o fenômeno a ser testado seja causado por um realmente só faz sentido usar 1
conjunto de variáveis independentes entre si, cujo teste com regressão linear simples não corresponda ao modelo teórico idealizado. Outra forma de decisão é a RLM neste caso, mas mesmo
o teste de eficiência de seu modelo. " assim é importante checar
itens como colinearidade,
normalidade, etc
Que a dinâmica do fenômeno testado seja causado por um conjunto de variáveis independentes entre si e que o teste da hipótese estudada com regressão esqueceu colinearidade, 1,5
linear simples não corresponda ao modelo teórico idealizado. Outra fator de escolha do modelo múltiplo deve ter como critério de decisão o teste de distribuição normal do
eficiencia de seu modelo. Que não ocorra hipótese nula onde todos os β sejam iguais a zero não prevendo a variável Y. resíduo, etc

sábado, 17 de abril de 2010 Página 14 de 16


Questão Resposta Comentário Nota

3.5. A regressão linear múltipla devera ter duas ou mais variáveis que sejam quantitativas e explicativas, rejeitando a hipótese nula, quer dizer que alguma variável só foi responder a pergunta no 1,5
Quais não é igual a zero, e assim, ter efeito, devera medir a contribuição de todas as variáveis e a contribuição de uma única variável, mostrar como Y se comporta fim... Além disto, não citou
seriam com o X, como também, avaliar a confiabilidade do modelo escolhido e observar se possui colinearidade entre as variáveis independentes, pois, se tiver não normalidade, etc
os fará sentido.
requisito
s para o
emprego
adequad
o de
uma
regressã
o linear
múltipla,
a seu
ver?
Para que uma regressão linear múltipla seja utilizada, é necessário que haja mais de duas variáveis independentes e que haja colinearidade entre estas, ou cumequeé? A colinearidade é 0
seja, que uma seja função da outra. Este modelo de regressão é utilizado apenas para fatores quantitativos. INDESEJÁVEL, não desejável...
Duas variáveis colineares não
devem ser usadas
"A regressão linear múltipla envolve três ou mais variáveis, portanto, estimadores. Ela nada mais é, do que a extensão da linear simples, com mais variáveis você discutiu as vantagens, 0,5
independentes. Ou seja, ainda uma única variável dependente, porém duas ou mais variáveis independentes (explanatórias). Onde, a finalidade destas não os requisitos... Pena que
variáveis independentes é justamente melhorar a capacidade de predição em confronto com a regressão linear simples. Quando temos, por exemplo, dois não tenha seguido com a linha
modelos com número diferente de parâmetros, é mais vantagem utilizar o que têm mais parâmetros na regressão linear múltipla. Já que esta regressão reduz da extensão da linear simples,
os resíduos estocásticos. Pois, reduzindo-se a variância residual, aumenta-se a força dos testes de significância. E podemos com ela também eliminar a que já indicaria também os
tendenciosidade que poderia resultar se simplesmente ignorássemos uma variável que afeta Y substancialmente. " requisitos
A regressão linear múltipla é praticamente a mesma coisa de regressão linear, só que ao invés de termos apenas uma variável dependente e uma variável a analogia foi boa, mas não 1,5
independente, teremos neste caso na (RLM) uma variável dependente e duas ou mais variáveis independentes. Assim em cada uma dessas variáveis nós seguiu até o ponto lógico que
teremos um “B”, onde seria o coeficiente angular, aonde teremos a resposta à aquele “x”. No caso a (RLM), se utilizarmos as variáveis X e Z, é diferente de é o fato da linear múltipla ter
quando colocamos numa RLM, (X,Z,K) ou ( X, K),( Z,K), deve- se testar quais dessas minhas produções é a mais elevada. Um bom exemplo seria a produtividade os mesmos requisitos da linear
de uma determinada cultura em função do p H solo , (S,P,N,P,K, Cu), teor de argila, será que o teor de Cu iria afetar assim a minha produtividade? Ou vai afetar simples, mais a avaliação de
a ponto de uma forma que seja importante suficiente? Acredito que não! Pois o Cu sendo um micronutriente o qual é absorvido em pequenas quantidades, colinearidade
pela planta. A RLM, só poderá ser utilizada para valores quantitativos, ela seria várias regressões lineares realizadas na mesma hora. Assim é necessário que se
tenha 2 variáveis quantitativas e equitativa, porque se temos 1 variável quantitativa que explica, não precisamos usar a RLM. Se eu tenho 2 variáveis onde a
análises de variância apresenta comportamentos completamente diferentes (separadas), onde N não tem nada a haver com a resposta do Cu, eu posso fazer
neste caso também a RLM.
Para a aplicação adequada de uma regressão linear múltipla, é necessário atender a casos básicos, o primeiro refere-se a trabalhar com a regressão padrão, ou foi pelo caminho certo ao 1,5
seja, a regressão somente é válida para parâmetros quantitativos. O segundo aspecto a ser levado em consideração, é a análise de variância, uma das mais estender da linear simples
importantes aplicações da análise de regressão múltipla é a escolha, entre diversas variáveis independentes, daquelas mais úteis na previsão de Y. Examina-se para a múltipla. Só esqueceu
o papel desempenhado por cada variável independente na previsão da medida dependente. Por fim analisa-se a presença de colinearidade entre as variáveis. de usar isto para indicar os
requisitos da RLM -
normalidade, etc
3-5 Inicialmente, escolhendo as variáveis dependentes e independentes, caracterizada por no mínimo duas, preferencialmente aquelas variáveis quantitativas esqueceu os requisitos da 1,5
explicativas que sejam diferentes em suas respostas; evitar a colinearidade entre as variáveis; que as variáveis não apresentem colinearidade entre elas; não linear simples, que também se
apresentem semelhanças, caso positivo, excluir uma delas. aplicam

sábado, 17 de abril de 2010 Página 15 de 16


Questão Resposta Comentário Nota

3.5. Quando tivermos mais de uma variável independente (duas ou mais variáveis), e uma variável dependente. Neste caso empregaremos a regressão linear alguns pequenos detalhes 0
Quais múltipla. Por exemplo: a adubação NPK, em função da produção de cana-de-açúcar (tonelada por hectare), pode ser aplicada a regressão linear múltipla, em como avaliação de
seriam função de produtividade. Porém fazer os gráficos é complicado. Por isto se usa a superfície de resposta para melhor representar graficamente os resultados, colinearidade, normalidade da
os fixando uma das variáveis. variação do acaso, etc não
requisito deveriam ser mencionados?
s para o
emprego
adequad
o de
uma
regressã
o linear
múltipla,
a seu
ver?
Para o emprego adequado da regressão linear múltipla deve-se ter no mínimo duas variáveis quantitativas explicativas; que as variáveis não apresentem ok, mas faltou lembrar de 2
colinearidade entre elas; e que as variáveis independentes apresentem respostas diferentes, não semelhantes, caso aconteça elimina-se uma delas, se resíduo com distribuição
estivéssemos trabalhando com duas variáveis independentes. normal, etc

sábado, 17 de abril de 2010 Página 16 de 16

Você também pode gostar