Escolar Documentos
Profissional Documentos
Cultura Documentos
OD 15.25
SOD
15.15
HPA 6
SIGMA_T 15.05
4C 4B
PO4 14.95
NO3
14.85
NIT
5
SIO4
PT 4D 4A
PPART 3A
NH4
CLOR 3B
NO2 2
NO2NO3
1
0 10 20 30 40 50
N
Programa:
2- Medidas de Semelhança
2.1- Euclidianas e não-euclidianas
2.2 - Paramétricas e não-Paramétricas
2.3 - Testes de Mantel e aplicações
3- Métodos de Classificação
3.1 - Classificação Hierárquica
3.2 - Classificação não-hierárquica (K-means)
3.3 - Modo Q e modo R (Análise Nodal)
3.4 - Interpretação e Significância dos agrupamentos (Métodos de bootstraping e permutação)
3.5 - Testes e aplicações
Estratégias Gerais:
Análise exploratória. Etapa Inicial (explorar
padrões, gerar hipóteses novas)
3. Ordinais (ranking);
Independent Variable
Dependent Variable
Continuous Categorical
Continuous Regression ANOVA
Categorical Logistic Regression Tabular
REVISÃO
CORRELAÇÃO
REGRESSÃO
CORRELAÇÃO
Varia ente -1 a 1
Mede o grau de associação linear entre duas
variáveis
Valores próximos de 1 = forte correlação
positiva
Valores próximos de -1 = forte correlação
negativa
Valores próximos de 0 = pouca ou nenhuma
associação.
Largura do corpo
Comprimento do corpo
( X X ) 2
Variância X = s 2 i 1
n 1
n
( X X )(Y Y )
Covariância = cov XY
i 1
n 1
Cov( xy)
rx , y
Correlação Var ( x).Var ( y )
Exemplo de Cálculo:
X Y
P
4 7
1
16
2 8
2 14
8
5 12 12 3
3 10 6
8 2 4
6 8 5 1
4 6
4 7
3 7
5 2
7 10 0
6 0 2 4 6 8 10
1 4
7
8 5
Tendência linear?
8
S 36 71
X Y
Ponto X-Xm (X-Xm)2 Y-Ym (Y-Ym)2 (X-Xm)(Y-Ym)
1 4 7 -0,50 0,25 -1,88 3,52 0,94
2 2 8 -2,50 6,25 -0,88 0,77 2,19
3 5 12 0,50 0,25 3,13 9,77 1,56
4 6 8 1,50 2,25 -0,88 0,77 -1,31
5 3 7 -1,50 2,25 -1,88 3,52 2,81
6 7 10 2,50 6,25 1,13 1,27 2,81
7 1 4 -3,50 12,25 -4,88 23,77 17,06
8 8 15 3,50 12,25 6,13 37,52 21,44
soma 36 71 0 42 0 80,875 47,5
Média 4,5 8,875 6 11,55357 6,79
r= 0,8150 excel
Caso a relação não seja linear utilizar
outra medida de associação (ou
transformar dados)
-Correlação
phi (dados binários) = o
mesmo que aplicar Pearson para dados
binários
Outros Coeficientes
Regressão Linear
1
Y
1.0
o
X
Log10(Number of Species) VARIÁVEL DEPENDENTE
Log10(Island area)
ε
Ajustando os dados a um modelo linear
Yi o 1 X i i
= ŷ, valor previsto
= y i , valor observado
ε = resíduo (erro)
r = Correlação de Pearson
R2 = (0,815)2 = 0,664
Densidade de semente
Desndiade de
Roedores
Densidade de Sementes
Regressão – pontos importantes
Seed density
Seed density
Premissas da Regressão
Seed density
Testes diagnósticos para Regressão
Distribuição de residuos experada para um
modelo linear com distribuição normal de
resíduos
i
Yi
Y = a + bx (exemplo)
Y = 3,785 + 1,131x
X Y
Ponto Y(est) erro
4 7
1 8,30 -1,30951
2 8
2 6,04 1,953
5 12
3 9,44 2,56
6 8
4 10,57 -2,571
3 7
5 7,178 -0,178
7 10
6 11,70 -1,702
1 4
7 4,91 -0,916
8 15
8 12,83 2,167
4
2
erro
0
-2 0 5 10 15
-4
Y(est)
Correlação Cruzada
-Exemplo:
Reamostragem:
Permutação = teste de hipótese
Boostraping = intervalos de confiança
Exemplos