Você está na página 1de 3

Resumo Anlise Multivariada G1

Termos e definies: Anlise multivariada = mtodo que permita a anlise simultnea de duas ou mais variveis pode ser consider ado como multivariado. Anlise fatorial = tcnica que cria novas tabelas apenas com variveis que possuem maior influncia sobre a varivel dependente. Os fatores so extrados na ordem do mais explicativo para o menos explicativo. Depois de fazer AF, voc busca de cara ver a qualidade (KMO) e significncia (SIG do TESTE BARTLETT) da nova tabela.
Os fatores so variveis hipotticas que explicam partes da variabilidade dos dados. X fatores explicam % da varincia total.

Boxplot = Max, Min, Q1, Q3, Mdia, Mediana Simetria (boxplot) = o Positiva = mdia maior que mediana o Simtrica = mdia igual mediana o Negativa = mdia menor que mediana Ramo e folha = o Ver unidades (stem width) o Ver min e max (sempre o menor nmero para min e o maior para max) o Ver nmero de outliers e a partir de que nmero eles so outliers o Valor real sempre o nmero x o stem width Correlao (Pearson Correlation) = grau de influncia entre variveis KMO (Kaiser-Meyer-Olink MEasure of Sampling Adequacy) = Ele descreve a qualidade da Anlise Fatorial que foi realizada. Se ele for abaixo de 0,05 isso significa que a AF no descreve satisfatoriamente a variao dentro os dados. o Abaixo de 0,5 = no d para fazer anlise o Entre 0,5 e 0,6 = razovel qualidade o Acima de 0,6 = boa qualidade (Quanto maior de 1, melhor a qualidade) Teste Bartlett (Bartletts Test of Sphericity) = Indica se existe RELAO suficiente entre as variveis para fazer-se a AF. Se chama Teste Bartlett, mas voc est buscando o SIG. SIG tem que ser menor que 0,05 se rejeitar a hiptese nula (Voc quer provar que matriz de correlaes no a matriz de identidade... uma matriz de identidade prova que duas matrizes so inversas uma da outra e voc quer provar exatamente o oposto. Voc quer provar que elas so correlacionadas positivamente.) MSA (Tabela Measure of Sampling Adequacy Anti-image CORRELATION) = adequao da amostra o Abaixo de 0,5 = no adequada e deve ser eliminada o Acima de 0,5 = adequada e deve ser mantida o Igual a 0,5 = ver se a comunalidade alta para mant-la. Comunalidade (Communalities) =so quantidades das varincias (correlaes) de cada varivel explicada pelos fatores. Quanto maior a comunalidade, maior ser o poder de explicao daquela varivel pelo fator. sempre comea em 1 e depois o 2 valor mostrar a correlao com os demais fatores retidos. Tem que ser acima de 0,5 para ser RAZOVEL e acima de 0,7 para ser BOA. .

Teste de normalidade = determina se um conjunto de dados de uma dada varivel aleatria, bem modelada por uma distribuio normal ou no. Estamos predispostos a querer que ela seja normal. Shapiro = tamanho da amostra (df) menor de 30 para escolher a tabela Shapiro no teste de normalidade Regresso = estuda o relacionamento entre uma varivel chamada a varivel dependente e outras variveis chamadas variveis independentes. o Varivel dep + 1 varivel independente = regresso simples o Varivel dep + 2 ou mais variveis independentes = regresso mltipla Coef correlao (R) = mede o grau da correlao entre duas variveis Coef determinao (R Square) = varia entre 0 e 1, indicando, em percentagem, o quanto o modelo consegue explicar os valores observados. Quanto maior o R, mais explicativo modelo, melhor ele se ajusta amostra. Por exemplo, se o R de um modelo 0,8234, isto significa que 82,34% da varivel dependente consegue ser explicada pelos regressores presentes no modelo. Soma dos quadrados total (SQT ou Total Sum of Squares) = o resduo quadrado que ocorreria se utilizasse apenas a mdia (da varivel) para fazer a previso. o SQR = Regression = soma do quadrado da regresso (do modelo) o SQE = Residual = soma do quadrado dos resduos (utilizando a varivel independente) o SQT = SQR + SQE o Total = Regression + Residual Pegadinhas = 1) KMO = queremos que seja acima de 0,5 para ser BOM... SIG = queremos que seja abaixo de 0,05 para ser BOM (na maioria dos casos), pois na maioria dos casos queremos REJEITAR a Hiptese Nula. 2) 3 motivos pelos quais a regresso mltipla apresenta resultados melhores que a simples: a. Aumenta r2... que o coeficiente de determinao b. Abaixa o erro padro (Std Error of the Estimate de uma tabela para outra) c. Abaixa a soma dos quadrados dos resduos (Residual) 3) Achar x fatores que explicam % da varincia total = Extractions sums of Squarod Somar % of Varianco OU ltimo dado do Cumulativo% 4) Em Regresso, o R Square tambm fala o % da varincia na varivel independente que so explicadas. 5) Regresso equao quer tirar? sim, as que tem sig abaixo de 0,05. 6) A anti-imagem mostra o MSA e ajuda ajuda a retirar algumas variveis para obter-se uma AF mais precisa. Tira-se eles indo diagonalmente a partir da primeira varivel. MAS abaixo de 0,5... rodou! Ao menos que... a. Se comunalidade for alta formar novo fator s da varivel b. Se comunalidade for baixa excluir
7) Na matriz de componente a soma dos quadrados por linha dar a comunalidade e por coluna dar a ordenada (y) do valor prprio no grfico de sedimentao. Tipo de pergunta que pode rolar: dar o grfico de sedimentao, uma matriz e perguntar para botar quais so os valores dos pontos no grfico. Eleva ao quadrado, soma os valores na vertical e diz os valores.

8) Dvida = como determinar a varivel dependente?

- os fatores so conjuntos de variveis... juntar variveis parecidas. - KMO entre 0,5 - 0,6 pode-ser fazer uma anlise, mas ela apenas considerada de boa qualidade acima de 0,6 - Checar no anti-image correlation e fazer a diagonal principal. Todos os nmeros abaixo de 0,5 devem ser excludos. Se o KMO subir, fizemos bem. Se o KMO descer, fizemos mal. obs: Na prova no precisa tirar, apenas explicar se deve retirar e porque. O porque ser sempre porque aumentou o KMO. Lista 5: - #2 as variveis possuem MSA abaixo de 0,5 o que as tornam candidatas a serem excludas ou formarem um novo fator. - #3 KMO virou de boa qualidade - #4 - extrao: o quanto ela est sendo explicada pelos fatores. As variveis com comunalidade abaixo de 0,5 significa que ela no esto sendo bem explicadas pelos fatores retidos. Nenhum grupo quer ela, nenhum fator explica bem a varivel. - #5 diferena entre aas tabelas matriz de componente e matriz de componente rotativa. A matriz de componente rotativa serve apenas para que se escolha os variveis que compoem cada fator. Para essa escolha, observem em cada linha em mdulo. Na matriz de componente a soma dos quadrados por linha dar a comunalidade e por coluna dar a ordenada (y) do valor prprio no grfico de sedimentao. Tipo de pergunta que pode rolar: dar o grfico de sedimentao, uma matriz e perguntar para botar quais so os valores dos pontos no grfico. Eleva ao quadrado, soma os valores na vertical e diz os valores.