Você está na página 1de 82

SCUOLA DI DOTTORATO DI RICERCA IN BIOLOGIA ANIMALE

Dipartimento di Biologia Animale e dell’uomo


Università di Roma ‘La Sapienza’

barinens Las_Mat 1 53 20 15.8 24.5 11 20.2 44.3


barinens Las_Mat 1 58.7 21.8 18 26.9 11.9 21.5 49.3
barinens Las_Mat 0 57.8 20.6 17.9 22.4 11.5 22 48.8
barinens Las_Mat 0 51 17.9 15.1 24.9 10.7 20.8 43.5
barinens Las_Mat 0 58.2 21.9 17.2 27.9 13.1 22.4 48.4
barinens Las_Mat 0 57.9 21.4 17 26.9 12 20.8 48.8
barinens Las_Mat 0 58.8 22.4 17.6 27.2 12.4 21.8 48.8
barinens Las_Mat 0 55.1 19.5 17 26.7 11.7 21.7 47.2
canicoll Rio_Cac 0 55.6 20.8 16.4 22.6 12.1 20.9 46.7
canicoll Rio_Cac 0 54.5 21.9 15.8 25.8 12.6 20.1 44.5
canicoll Rio_Cac 0 54.1 20.9 16.5 26.7 11.6 20.7 46.2
canicoll Rio_Cac 0 52.6 19.8 16.4 26.3 12.1 21.2 46
canicoll Rio_Cac 0 53.5 19.8 16 26.8 12.3 21.1 44.8
canicoll Rio_Cac 0 54.9 19.8 15.8 27.5 11.6 21.4 46.6

Analisi dei dati tramite l’uso del sistema SAS

Applicazioni in zoologia ed ecologia

Marco Corti

Carlo Rondinini

Il documento è reperibile presso:


http://dipbau.bio.uniroma1.it/web/Docenti/Docente373/analisi-dei-dati/index.htm

Roma, Gennaio 2005


Indice

1. Introduzione ......................................................................................................................................................................... 1
1.1. Una breve introduzione al sistema SAS ......................................................................................................................... 2
1.2. I comandi del SAS ....................................................................................................................................................... 3
2. Il materiale in esame ............................................................................................................................................................. 3
2.1. Il problema biologico ................................................................................................................................................... 3
2.2. I dati .......................................................................................................................................................................... 4
3. L’analisi dei dati .................................................................................................................................................................... 5
3.1. La struttura dei dati ..................................................................................................................................................... 5
3.2. Importazione dei dati in SAS ........................................................................................................................................ 5
3.2.1. Programma UNO ............................................................................................................................................... 5
3.2.2. Alternativa al programma UNO tramite menu ...................................................................................................... 6
3.3. Manipolazione delle tabelle ........................................................................................................................................ 10
3.3.1. Programma DUE.............................................................................................................................................. 10
3.3.2. Alternativa al programma DUE tramite menu .................................................................................................... 11
3.3.2.1. Duplicazione delle tabelle............................................................................................................................ 11
3.3.2.2. Cambiamento del nome e della codifica delle variabili ................................................................................... 12
3.3.2.3. Ordinamento della tabella ........................................................................................................................... 15
3.3.2.4. Salvataggio in un file esterno ...................................................................................................................... 16
3.3.2.5. Tabelle riassuntive...................................................................................................................................... 17
3.4. Esplorazione grafica dei dati....................................................................................................................................... 18
3.4.1. Programma TRE .............................................................................................................................................. 18
3.4.2. Alternativa al programma TRE tramite menu ..................................................................................................... 19
3.4.2.1. Selezione di un sottoinsieme di dati ............................................................................................................. 19
3.4.2.2. Grafici a barre ............................................................................................................................................ 20
3.4.2.3. Grafici a dispersione ................................................................................................................................... 22
3.5. Statistiche descrittive................................................................................................................................................. 23
3.5.1. Programma QUATTRO ..................................................................................................................................... 23
3.5.2. Alternativa al programma QUATTRO tramite menu ............................................................................................ 24
3.6. Trasformazione dei dati ............................................................................................................................................. 25
3.6.1. Programma CINQUE ........................................................................................................................................ 25
3.6.2. Alternativa al programma CINQUE tramite menu ............................................................................................... 26
3.7. Analisi della varianza ................................................................................................................................................. 27
3.7.1. Programma CINQUE A ..................................................................................................................................... 27
3.7.2. Alternativa al programma CINQUE A tramite menu ............................................................................................ 28
3.8. Generalized linear models .......................................................................................................................................... 29
3.8.1. Programma CINQUE B ..................................................................................................................................... 29
3.8.2. Alternativa al programma CINQUE B tramite menu ............................................................................................ 29
3.9. Test post hoc ............................................................................................................................................................ 30
3.9.1. Programma CINQUE B 1 .................................................................................................................................. 30
3.9.2. Alternativa al programma CINQUE B 1 tramite menu ......................................................................................... 31
3.10. Analisi della varianza multivariata (MANOVA) ......................................................................................................... 31
3.10.1. Programma CINQUE C ..................................................................................................................................... 31
3.10.2. Alternativa al programma CINQUE C tramite menu ............................................................................................ 32
3.10.3. Programma CINQUE D ..................................................................................................................................... 32
3.10.4. Alternativa al programma CINQUE D tramite menu ........................................................................................... 33
3.11. Analisi delle componenti principali (PCA) ................................................................................................................ 34
3.11.1. Programma SEI ............................................................................................................................................... 34
3.11.2. Alternativa al programma SEI tramite menu ...................................................................................................... 35
3.11.3. Programma SEI A ............................................................................................................................................ 36
3.11.4. Alternativa al programma SEI A tramite menu ................................................................................................... 38
3.11.5. Programma SEI B ............................................................................................................................................ 40
3.11.6. Alternativa al programma SEI B tramite menu ................................................................................................... 40
3.12. Analisi discriminante e delle variate canoniche ....................................................................................................... 40
3.12.1. Programma SETTE .......................................................................................................................................... 40
3.13. Calcoli matriciali: linguaggio IML ........................................................................................................................... 41
3.13.1. Programma SETTE A ....................................................................................................................................... 41
3.14. ENTERPRISE GUIDE ............................................................................................................................................. 44
4. Risorse in linea.................................................................................................................................................................... 46
Appendice 1: output completo dell’analisi........................................................................................................................................ 47
1. Introduzione

Questo seminario è rivolto agli studenti della Scuola di Dottorato di Ricerca in Biologia Animale. L’intento è di
proporre all’attenzione degli studenti un sistema professionale di analisi dei dati che può essere utilizzato per
la soluzione di problemi di carattere statistico di livello avanzato. La scelta del sistema SAS deriva dalla
completezza delle procedure statistiche disponibili, dalla adattabilità alle diverse problematiche, dalla
presenza di un linguaggio di programmazione interno. Il sistema SAS è scalabile e modulare, e questo
consente di accedere agli strumenti di analisi statistica attraverso una varietà di interfacce disponibili, dai
menu a tendina agli script di programma. Queste caratteristiche non sono tuttavia disponibili solo nel SAS,
ma anche in altri sistemi di analisi statistica inclusi S-plus ed R (disponibile liberamente e gratuitamente on
line). Il sistema SAS è disponibile per dottorandi e docenti della Sapienza con licenza campus.

I menu a tendina e gli script di programma rappresentano sono due strumenti in apparenza molto distanti
tra loro, che rispecchiano due differenti filosofie di approccio alla manipolazione dei dati. I menu a tendina
semplificano notevolmente l’accesso agli strumenti messi a disposizione da un programma (ad esempio, in
questo caso, importazione ed esportazione dei dati, test statistici, diverse tipologie di grafici). Questi d’altro
canto impediscono di tenere traccia del lavoro svolto sui dati e, spesso, compiono implicitamente delle
operazioni che, pur risultando trasparenti all’utente, influenzano il risultato ottenuto (ad esempio questo
accade frequentemente con le analisi della varianza). Al contrario, l’adozione di script di programma
rappresenta un massiccio ostacolo iniziale all’utilizzo di un software, in quanto utilizzano sintassi rigorose e
raramente intuitive. Tuttavia l’uso degli script si rivela immancabilmente più proficuo nel lungo termine,
perché fornisce i seguenti vantaggi:

1. maggiore controllo sull’elaborazione dei dati. Quando si produce uno script è necessario definire
TUTTI i paramentri e le opzioni di un’analisi;
2. realizzazione di analisi complesse e/o personalizzate. I menu a tendina non sono MAI in grado di
replicare tutte le funzionalità disponibili tramite la programmazione, mentre l’analisi di dati scientifici
che si affronta in un dottorato di ricerca molto spesso richiede l’applicazione di metodologie ad hoc;
3. replicabilità delle analisi. Quando uno script è stato messo a punto, è possibile ripetere esattamente
la stessa analisi su un dataset differente. Inoltre, se ci si accorge di un errore commesso
precocemente nel processo di analisi è possibile correggerlo nello script e ripetere tutta l’analisi in
modo automatico (usando i menu a tendina, è necessario ripetere manualmente tutta l’analisi);
4. applicazione delle analisi a grandi moli di dati. Introducendo dei cicli negli script di programma è
possibile eseguire automaticamente la stessa analisi su un grande numero di elementi del campione.

Il seminario ed il presente documento non intendono rappresentare una introduzione esauriente alla
statistica: per questo si rimandano i partecipanti alla lettura di manuali e testi dedicati.

1
1.1. Una breve introduzione al sistema SAS

Lanciando il sistema SAS compare la seguente finestra iniziale:

3
4

La finestra iniziale contiene quattro sottofinestre e una serie di barre degli strumenti:

1) La finestra dell’EDITOR. Qui vanno scritte o richiamate le istruzioni per l’esecuzione dei programmi (File:
apri).

2) La finestra del LOG. In questa finestra compare l’esecuzione di ciascuna linea di programma, con i
commenti. Vengono riportati gli errori (sottolineati in rosso).

3) La finestra dell’OUTPUT. In questa finestra vengono riportati tutti i vostri risultati (per i grafici si apre una
finestra ad hoc).

4) Finestra di a) RISULTATI e b) EXPLORER. Con RISULTATI potete accedere a ogni sezione delle analisi e a
ogni grafico prodotto. In EXPLORER con “collegamenti di file” potete inserire una lista di routines (o
programmi) SAS già pronti e richiamarli di volta in volta; in “librerie” trovate diverse opzioni, tra cui ‘work’
che contiene tutti i SAS datafiles che avete creato e aperto durante la sessione di lavoro (questi saranno
cancellati quando chiudete il SAS).

5) Premendo sull’icona definite la cartella di default per il lavoro del SAS. Questa può contenere i vostri dali,
le routines e qui vengono salvati output e grafici.

2
1.2. I comandi del SAS

1) Ogni programma o routine, ad esempio quelli utilizzati in questo seminario e che terminano con
l’estensione *.sas, iniziano con la dichiarazione di un SAS data file che contiene i dati fintanto che la
sessione rimane aperta.
2) I dati vengono letti con la istruzione “infile” da un file memorizzato su disco (in questo caso
cranio.txt). Notate che il nome del file fisico deve essere incluso tra due apici.
3) L’istruzione “input” definisce il numero delle variabili. Notate che se queste sono alfanumeriche
devono essere seguite dal segno $, ma questo non è necessario per le variabili numeriche. Se il file
di dati è di tipo ASCII (o TXT) tra variabili basta uno o più spazi e non è necessario che queste siano
incolonnate.
4) L’istruzione “proc” identifica la procedura scelta di volta in volta (ovvero l’analisi, dalla più semplice
alla più complessa.
5) L’istruzione “run” conclude il programma e consente la sua esecuzione.
6) Ogni riga di comando deve terminare obbligatoriamente con “;”.

Esempio di programma:

data UNO;
infile 'cranio.txt';
input spe$ loc$ cat$ sex$ TL NL FL BZW CW MLOW CBL BL IZL PL PLL IML;
Proc print;
run;

2. Il materiale in esame

I dati qui utilizzati (vedi oltre) devono essere intesi unicamente come esempio. Le tabelle ad essi relative
potrebbero rappresentare un problema biologico comune in sistematica, ecologia, genetica di popolazione o
altro. Di seguito è illustrato brevemente il problema biologico al solo scopo di facilitare una eventuale
interpretazione dei risultati.

2.1. Il problema biologico

I dati che ci apprestiamo a esaminare derivano da uno studio di morfometria multivariata tradizionale sul
complesso di specie e sottospecie del roditore Venezuelano Proechimys, presente nella foresta a galleria
della cordigliera andina e della cordigliera della costa a altitudini di 1.000 m slm circa (Fig. 1).

Figura 1 – Località di cattura, taxa e numero diploide

3
Le specie sono caratterizzate da riordinamenti cromosomici. Lo studio è stato pubblicato in passato
(Aguilera and Corti, 1994; Corti and Aguilera, 1995) e ha mostrato una differenziazione nella forma del
cranio e processi di allometria statica congruenti con un modello di speciazione cromosomica e di isolamentio
geografico.
L’elenco delle specie e delle località, il numero diploide, la loro localizzazione geografica, e il numero
di individui analizzato sono riportati in tabella 1.

Specie popolazione 2n Lat. – Long. ♂♂ ♀♀ Tot.

P. canicollis Rio Cachirì 24 10°50'N -72°13'O 3 14 17


P. poliopus Kasmera, Los Angeles del Tucuco 42 09°53'N- 72°43'O 19 20 39
P. guairae “Falcon” La Trilla 46 10°24'N-67°45'O 12 9 21
P. g. guairae El Limon 48 10°19'N-67°38'O 20 3 23
P. g. guairae Turiamo 48 10°27'N-67°50'O 12 12 24
P. guairae“Llanos” Palmero 50 09°44'N-68°34'O 6 6 12
P. guairae“Llanos” Turén 50 09°16'N-69°04'O 7 7 14
P. guairae“Oriente” Cueva de Agua 52 10°10'N-64°35'O 8 10 18
Proechimys sp. Guaquitas 62 07°27'N-71°20'O 12 9 21
Proechimys sp. Tierra Buena - Las Matas 62 09°13'N-69°35'O 14 11 25
Proechimys sp. La Nulita 62 07°19'N-71°55'O 7 9 16
P. trinitatis Cueva del Guacharo 62 10°10'N-63°33'O 13 12 25

Tabela 1 – Specie, località, numero diploide, latitudine e longitudine, numero di maschi e femmine, numero
totale.

Aguilera M. and Corti M. 1994 - Craniometric differentiation and chromosomal speciation of the genus
Proechimys (Rodentia: Echimyidae). Z. Saug., 59: 366-377

Corti M. and M. Aguilera. 1995 - Allometry and chromosomal speciation of the casiraguas Proechimys
(Mammalia, Rodentia). J. Zool. Syst. Evol. Res, 33: 109-115

2.2. I dati

Sono state rilevate sul cranio le seguenti 17 misure con un calibro alla precisione di 0.01 mm: TL (lunghezza
totale), NL (lunghezza dei nasali), FL (lunghezza dei frontali), BZW (larghezza bizigomatica), CW (larghezza
del cranio), MLOW (larghezza minima interorbitaria), CBL (dal condilo occipitale all’alveolo dell’incisivo), BL
(dal forame magnum all’alveolo dell’incisivo), IZL (distanza incisivo-zigomatica), PL (lunghezza palatale), PLL
(lunghezza dei palatini), IML (dall’ultimo molare all’incisivo), IFL (lunghezza del forame incisivo), UAL
(lunghezza della fila dei molari all’alveolo), FMW (larghezza del rostro), IFW (larghezza del forame palatino)
CH (altezza del cranio) (Fig. 2).

Figura 2 – Le misurazioni rilevate sul cranio

4
3. L’analisi dei dati

3.1. La struttura dei dati

Il file contenente i dati è di tipo ASCII (volgarmente conosciuto e confuso anche come “txt”). SAS può
importare files di diverso formato (ad esempio Excel, dbase, Access) ma, in caso di file ASCII, si deve essere
certi che questo non contenga caratteri nascosti (es. tabulazioni) che vengono interpretati come variabili. E’
bene utilizzare un buon file editor per preparare e controllare i dati.
I dati utilizzati in questo seminario sono esemplificati di seguito (per i primi record):

1 101 39 1 61.9 22.8 19 27.7 12.7 21.5 51.4 44.2 38 8.7 20.7 26.2 8 9.8 10.8 3.7 13.5
1 101 41 1 52.1 18.3 16.5 25.8 11.9 20.9 43.3 36.6 22.6 8.6 16.7 22.9 5.4 9.2 9 3.2 12.8
1 101 46 1 55.8 19.2 18.3 26.7 12.3 21.7 40.9 38.8 33.9 9.2 18.6 24 6.4 9.5 9.2 2.9 13
1 101 48 1 57 20.6 18.2 28.7 13 22.4 48.3 42 35.5 8.8 19 24.2 6.7 8.7 9.6 3.1 13.6
1 101 54 1 50.2 15.8 17.8 25.1 12.2 20.8 43.2 36.5 22.3 7.9 16.7 22.5 6 9 8.6 2.9 12.5
1 101 42 0 54.4 18.8 17.8 26.6 12 21.4 46.3 39.7 34.6 7.7 18.2 22.8 7.1 8.7 9.6 3.5 13

Notare che il file è scritto “a bandiera”, ovvero non è necessario che le variabili siano incolonnate in
modo preciso. E’ necessario solo lasciare uno spazio o più tra une variabile e l’altra. Ogni record contiene 21
campi o variabili. Sarà quindi necessario indicare il numero di variabili e come leggerle. Queste possono
essere numeriche (solo numeri) o alfanumeriche (numeri e altri caratteri testuali, o solo caratteri testuali).

3.2. Importazione dei dati in SAS

3.2.1. Programma UNO

Questo semplice programma legge il file di dati “cranio.txt” presente su disco e crea il SAS datafile “UNO”, in
cui sono contenuti i dati, e assegna un nome alle variabili. Assegna anche il tiolo “Dati Proechimys” per
l’output e quindi effettua una stampa a video dei dati letti seguendo le istruzioni.
Da un veloce esame del listato si nota che la variabile PL dell’osservazione (o record) 14 ha un
valore (84) che è 10 volte circa superiore rispetto ai valori della variabile nelle altre osservazioni. Si tratta di
un errore di battitura (8.4 -> 84) che va corretto prima di procedere oltre. Vi sono due modi: A) utilizzare un
editor esterno per correggere i dati originali; o B) utilizzare l’editor del SAS. In questo caso optiamo per la
seconda soluzione: 1) utilizzando explorer, apriamo le librerie e nella libreria work troviamo il SAS datafile
“UNO”. Apriamolo e, utilizzando la modalità “Edit” nel menù “modifica”, correggiamo semplicemente il dato e
salviamo.

/*********************************************************************
PROGRAMMA UNO
Questo è un box di commento delimitato da slash-asterisco all'inizio e
arterisco-slash alla fine. Questo è il primo programma SAS che utilizziamo
ed è breve e semplice. Illustra come caricare i dati, assegnare nomi
alle variabili, cambiare i nomi, ordinare i dati secondo un criterio e,
infine, produrre una tabella semplice.
tutto ciò che è compreso tra slash-asterisco e arterisco-slash costituisce
un commento e non viene eseguito
Notate che tutti i comandi SAS terminano con un punto e virgola;;;;;;;;;
RUN; è l'ultimo comando necessario per far girare la routine
**********************************************************************/
data UNO; /* nome arbitrario assegnato a un SAS file che conterrà i dati */
infile 'cranio.txt'; /* il nome del file originale che contiene i dati */
input /* definisce come leggere i dati*/
spe$ loc$ cat$ sex$ /* i nomi delle variabili:
le alfanumeriche sono seguite dal carattere $ */
TL NL FL BZW CW MLOW /* le variabili numeriche sono descritte */
CBL BL IZL PL PLL IML /* semplicemente con il loro nome */
IFL UAL FMW IFW CH;
TITLE 'Dati Proechimys'; /* mette il titolo su tutte le pagine di output */
Proc print; /* la procedura stampa (nell'output) i dati */
run;

5
3.2.2. Alternativa al programma UNO tramite menu

La stessa procedura di importazione dei dati può essere effettuata utilizzando i comandi da menu. Prima di
iniziare è necessario assegnare i nomi alle variabili nel file di testo:

1. copiare “cranio.txt” in “cranio_1.txt”


2. aprire il “cranio_1.txt” con un editor di testo (UltraEdit, Notepad, Wordpad o altro)
3. aggiungere una prima riga contenente i nomi delle variabili: “spe loc cat sex TL NL FL BZW CW MLOW
CBL BL IZL PL PLL IML IFL UAL FMW IFW CH”
4. chiudere “cranio_1.txt”.

Selezionare “Import data”:

6
Dalla tendina, selezionare “Delimited file (*.*)”, quindi premere “Next”:

Premere il pulsante “Browse” per navigare fino al file “cranio_1.txt”:

7
Dopo aver aperto “cranio_1.txt”, premere “Options”, accertarsi che il tipo di separatore dei valori sia lo
spazio, quindi selezionare “Get variable names from first row” (il file “cranio_1.txt” contiene i nomi delle
variabili). Premere “Ok”:

Nella library “WORK” creare la tabella membro “UNO_1”, quindi premere “Next”:

8
Come ultimo passo, è possibile salvare la procedure di importazione come script: navigare fino alla cartella
del corso SAS, quindi nominare lo script “uno_1.sas”. Premere “Finish”:

Verificare le differenze tra “uno.sas” e “uno_1.sas”, aprendo i due script in un editor di testo.

Ora fare doppio click su “UNO_1” nella finestra di explorer per aprire la tabella:

9
Se è necessario modificare dei dati, è possibile farlo dopo aver premuto il pulsante “Edit”. ATTENZIONE:
dato che SAS lavora su una copia dei dati mantenuta nella memoria RAM, i dati del file di origine
“cranio_1.txt” non saranno modificati.

3.3. Manipolazione delle tabelle

3.3.1. Programma DUE


Questo programma è più lungo del precedente e essenzialmente esegue un lavoro di editing. Viene creato il
nuovo SAS data set “DUE” a partire da “UNO” ma con le seguenti modifiche: 1) vengono assegnati dei valori
alfanumerici (nomi di specie e nomi di località) in modo da rendere il lavoro più facile; 2) i dati vengono
ordinati in modo decrescente a seconda delle specie; 3) vengono prodotte tabelle riassuntive con il numero
di individui per specie e località; 4; infine viene salvato su disco il file “dati nuovi.txt” contenente i nuovi
valori.

/*********************************************************************
PROGRAMMA DUE
Con questa routine creiamo il nuovo SAS data set 'DUE', in cui
specifichiamo meglio il nome di due variabili: spe e loc.
Quindi, creiamo una tabella riassuntiva con il numero di individui
per specie e località.
Infine, ordiniamo i dati in modo crescente per specie e salviamo
su disco il file con i nuovi codici
**********************************************************************/

data DUE; set UNO; /* creiamo un nuovo SAS datafile, che si chiama "DUE"
e che legge i dati da "UNO". In questo file viene cambiato il
valore e il nome di due variabili
notate che i nomi delle variabili non possono
contenere più di 8 caratteri */
if spe=1 then specie='poliopus'; /*la variabile spe diventa specie */
if spe=2 then specie='falcon' ; /* e il suo valore numerico */
if spe=3 then specie='miranda' ; /* diviene il nome della specie */
if spe=4 then specie='miranda' ;
if spe=5 then specie='llanos' ;
if spe=6 then specie='llanos' ;
if spe=7 then specie='barinens';
if spe=8 then specie='barinens';
if spe=9 then specie='trinitat' ;
if spe=10 then specie='oriente' ;
if spe=11 then specie='canicoll';
if spe=12 then specie='barinens';
if loc=101 then local= 'Kasmera'; /* la variabile loc diventa localita */
if loc=202 then local= 'La_Tril'; /* e il suo valore numerico */
if loc=303 then local= 'Turiamo'; /* diviene il nome della località */
if loc=304 then local= 'El_Limo';
if loc=405 then local= 'Palmero';
if loc=406 then local= '406';
if loc=507 then local= 'LA' ;
if loc=408 then local= 'La_Nuli';
if loc=508 then local= 'Las_Mat';
if loc=609 then local= 'Guachar';
if loc=710 then local= 'C_Agua' ;
if loc=811 then local= 'Rio_Cac';
proc sort; by specie; /* questa routine ordina i record in base alla specie */
data TRE; set DUE;
file 'dati nuovi.txt'; /* salviamo su disco un nuovo file con */
/* questi nuovi valori e */
put specie local sex /* le variabili numeriche sono descritte */
TL NL FL BZW CW MLOW /* semplicemente con il loro nome */

10
CBL BL IZL PL PLL IML
IFL UAL FMW IFW CH;
proc tabulate; /* procedura per creare tabelle */
class specie local; /* le tabelle sono per specie e località */
table specie; /* crea una tabella per specie */
table specie*local; /* crea una tabella per specie e località */
TITLE 'Tabelle Proechimys';
Run;

3.3.2. Alternativa al programma DUE tramite menu

3.3.2.1. Duplicazione delle tabelle

Con un click sul tasto destro del mouse far comparire il menu a tendina sul dataset UNO, e selezionare
“Duplicate”:

Assegnare al nuovo dataset il nome “DUE” e premere “Ok”:

11
3.3.2.2. Cambiamento del nome e della codifica delle variabili

Lanciare l’appplicazione SAS Analyst:

Dal menu accessibile con un click del tasto destro del mouse, aprire il dataset “DUE”:

12
Dal menu del tasto destro, abilitare le modifiche al dataset:

Dal menu del tasto destro, selezionare “Recode values”:

Selezionare la colonna da ricodificare (“spe”) e assegnarle il nuovo nome “specie”. Assegnare il tipo di dati
“character” e premere “Ok”:

13
Ricodificare i valori della variabile:

Notare che l’operazione ha generato un nuovo oggetto di nome “Code”:

Questo oggetto contiene il codice generato dall’operazione di ricodifica, e può essere salvato come script
utilizzando il comando “Save as” dal menu “File”.

È ora possibile ripetere la procedura per la variabile “loc” seguendo le specifiche dello script.

14
3.3.2.3. Ordinamento della tabella

Dal menu del tasto destro selezionare “Sort”:

Scegliere l’ordinamento ascendente “(A)” per la variabile “specie”:

15
3.3.2.4. Salvataggio in un file esterno

Dal menu del tasto destro selezionare “Save as”:

È possibile salvare in diversi formati inclusi Access e dbase: in questo caso scegliamo il formato ASCII
“Delimited file” per replicare il risultato dello script “due.sas”. Salvare il file con il nome “dati nuovi_1.txt”:

16
3.3.2.5. Tabelle riassuntive

Dal menu del tasto destro selezionare “Summarize by group”:

Inserire “specie” e “local” come gruppi, e una variabile per cui non esistano missing values (in questo caso
abbiamo selezionato “TL”) come variabile da riassumere. Tra le statistiche descrittive proposte, selezionare
“N”,quindi premere “Ok”:

17
In questo caso l’aspetto della tabella riassuntiva ottenuta è leggermente differente da quella derivata dallo
script, ma il contenuto è analogo:

3.4. Esplorazione grafica dei dati

3.4.1. Programma TRE


Il programma crea un nuovo SAS datafile “QUATTRO” leggendo da disco il file “dati nuovi.txt”. Estrae quindi
il sottoinsieme relativo alla specie “barinensis” che viene utilizzato sulle variabili TL e CG per 1) produrre
istogrammi che ne rappresentano la distribuzione dei valori e 2) un grafico a dispersione con i due sessi
evidenziati. Notiamo una distribuzione che si avvicina alla normalità per le due variabili e una certa
segregazione di valori tra i due sessi.

/*********************************************************************
PROGRAMMA TRE
Questo programma illustra come estrarre un sottoinsieme di dati
per una specie;
quindi produce un grafico a barre (GCHART) per una variabile
e un grafico a dispersione (GPLOT) per due variabili
**********************************************************************/
DATA QUATTRO; /* nuovo SAS datafile */
infile 'dati nuovi.txt'; /* il file nuovo creato precedentemente */
input specie$ local$ sex$
TL NL FL BZW CW MLOW
CBL BL IZL PL PLL IML
IFL UAL FMW IFW CH;
IF specie='barinens'; /* estrae il sottoinsieme per la specie barinensis */
PROC GCHART; VBAR TL ; /* produce un istogramma a barre */
TITLE 'Istogramma della variabile TL per la specie barinensis';
PROC GCHART; VBAR CH ; /* istogramma per la variabile CG */
TITLE 'Istogramma della variabile CH per la specie barinensis';
PROC GPLOT; PLOT CH*TL=SEX ; /* i due caratteri per il grafico a dispersione */
TITLE 'Grafico a dispersione per la specie barinensis';
RUN;

18
3.4.2. Alternativa al programma TRE tramite menu

3.4.2.1. Selezione di un sottoinsieme di dati

Dal menu del tasto destro selezionare “Subset data”:

In “Available columns” selezionare “specie”, quindi scegliere l’operatore “EQ” (equals):

19
Selezionare “LOOKUP distinct values”, quindi “barinens”:

Premere “Ok”.

3.4.2.2. Grafici a barre

Dal menu del tasto destro selezionare “Bar chart” “Vertical”:

20
Inserire la variabile “TL” nel box “Chart”; premere “Title” per scrivere “Istogramma della variabile TL per la
specie barinensis”, quindi premere “Ok” per produrre il grafico:

21
3.4.2.3. Grafici a dispersione

Dal menu del tasto destro selezionare “Scatterplot” “Two dimensional”:

Scegliere “TL” come variabile X,”CH” come Y, “sex” per dividere in classi. Premere “Titles” per scrivere
“Grafico a dispersione per la specie barinensis” nel titolo, quindi “Ok” per produrre il grafico:

22
Il grafico che si ottiene è meno leggibile di quello ottenuto con lo script, perché i due sessi sono identificati
dalla forma e non dal colore dei simboli.

3.5. Statistiche descrittive

3.5.1. Programma QUATTRO


Utilizziamo ora la Procedura “UNIVARIATE” per le stesse variabili, TL e CH. La procedura produce un
sommario con la statistica descrittiva delle due variabili:
1) Momenti.
2) Misure statistiche di base.
3) Test di locazione; il test di Student per verificare l’ipotesi che la media sia Mu0.
4) test di normalità; i test di Shapiro-Wilk e Kolmogorov verificano che i dati abbiano una distribuzione
normale; viene anche mostrata la probabilità.
5) Quantili; 100% Max – Il valore Massimo di una variabile. 95% - il 95% di tutti i valori sono uguali
o minori di questo valore. 75% Q3 – Questo è il terzo quantile; il 75% dei valori sono uguali o
inferiori. 50% Mediana - La mediana. 25% Q1 – Il primo quantile; il 25% dei valori sono uguali
o inferiori. 0% Min – Il valore minimo; lo 0% dei valori sono inferiori.
6) Osservazioni estreme. A) Il grafico “stem-and-leaf” visualizza la distrubuzione; lo “stem” (stelo)
costituisce la porzione di valore a sinistra e il leaf (foglia) la porzione a destra. I numeri a destra
corrispondono al numero di “foglie” per ciascun stelo. Ad esempio, per lo stelo 140 vi sono 5 foglie
(5 casi con valore compreso tra 140 e 141. Il grafico “box plot” costituisce una rappresentazione
grafica dei quantili; si basa sui quartile di una variabile. Il “box” rettangolare corrisponde al quartile
minore e a quello superiore, la linea centrale alla mediana, il segno “+” alla media. Il paragone dei
segmenti inferiori e superiori ci una visualizzazione dell’asimmetria delle code. B) Un grafico di
probabilità normale. Questo grafico verifica la normalità della distribuzione; i segni “+” indicano una
distribuzione normale (e costituiscono una linea retta) e i segni “*” i valori reali dei dati. Se i valori si
approssimano alla normalità, allora anche gli asterischi si devono collocare lungo la linea definite dai
“+” coprendoli.

23
/*********************************************************************
PROGRAMMA QUATTRO
Utilizziamo la PROC UNIVARIATE per le variabili TL e CH per una statistica
descrittiva e grafica
**********************************************************************/
PROC UNIVARIATE PLOT normal DATA=QUATTRO;
VAR TL CH; /* INSERIRE QUI LE VARIABILI SCELTE */
Title; /* Title da solo cancella il title precedente */
run;

3.5.2. Alternativa al programma QUATTRO tramite menu


Dal menu del tasto destro selezionare “Distributions”:

Selezionare TL e CH come variabili per l’analisi:

24
Premere “Plots” e scegliere i grafici che si vuole disegnare:

Premere “Ok” per eseguire l’analisi. Notare che rispetto al risultato ottenuto con lo script mancano i test di
normalità. Inoltre i grafici non sono nella finestra dei risultati numerici, ma si trovano nella finestra “Results”
sotto “Univariate” e “Boxplot”.

3.6. Trasformazione dei dati

3.6.1. Programma CINQUE


La statistica descrittiva ci suggerisce l’opportunità di una trasformazione logaritmica dei dati. Ci aspettiamo
che la trasformazione “linearizzi” l’andamento della serie e renda omogenea la varianza fra i gruppi (presto
effettueremo test tra gruppi).
La proc PRINT ci offre una visualizzazione su schermo della trasformazione (è sempre meglio
controllare i dati). Quindi salviamo i dati così trasformati su disco nel file “logcranio.txt”.
Ripetiamo infine la stessa operazione condotta con il “PROGRAMMA QUATTRO” e osserviamo i
risultati per evidenziare differenze.

/*********************************************************************
PROGRAMMA CINQUE
Le variabili originali vengono trasformate in logaritmi.
Questi nuovi dati sono contenuti nel SAS datafile LOGCINQUE.
Le vecchie variabili vengono cancellate dal file.
Per semplicità analizziamo le variabili TL e CH dopo solo per
la specie barinensis dopo che sono state trasformate
in logaritmi, ora LnTL e LnCH.
A tal fine, utilizziamo la routine del programma
precedente PROC UNIVARIATE e osserviamo cosa avviene dopo la
trasformazione logaritmica
**********************************************************************/
DATA CINQUE; SET TRE; /* un nuovo SAS datafile */

LnTL=LOG(TL); /* si creano qui le nuove variabili */


LnNL=LOG(NL); /* logaritmiche */
LnFL=LOG(FL);
LnBZW=LOG(BZW);
LnCW=LOG(CW);
LnMLOW=LOG(MLOW);
LnCBL=LOG(CBL);
LnBL=LOG(BL);
LnIZL=LOG(IZL);
LnPL=LOG(PL);
LnPLL=LOG(PLL);
LnIML=LOG(IML);
LnIFL=LOG(IFL);
LnUAL=LOG(UAL);
LnFMW=LOG(FMW);
LnIFW=LOG(IFW);
LnCH=LOG(CH);

25
DROP TL NL FL BZW CW MLOW CBL BL IZL PL PLL IML IFL UAL FMW IFW CH; /* cancella le vecchie
variabili */
proc print;
/* salviamo su disco le variabili trasformate in logaritmi
incluse specie local sex per un utilizzo successivo */
data SEI; set CINQUE;
file 'logcranio.txt';
put specie local sex
LnTL LnNL LnFL LnBZW LnCW
LnMLOW LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL
LnFMW LnIFW LnCH;
/****** questa routine è uguale a quella di quattro.sas ******/
DATA LOGCINQUE;SET CINQUE;
IF SPECIE='barinens';
TITLE ;
/*********************************************************************
esattamente la stessa di quattro.sas eccetto per LnTL e LnCH
**********************************************************************/
PROC UNIVARIATE PLOT NORMAL DATA=LOGCINQUE; /* DATA=LOGCINQU per esser sicuri
che usi il datafile corretto */
VAR LnTL LnCH; /****** notare che usa le variabili logaritmiche logs *****/
run;

3.6.2. Alternativa al programma CINQUE tramite menu


Dal menu del tasto destro selezionare “Transform” “Compute”:

26
Assegnare alla nuova variabile trasformata il nome “LnTL”. Scegliere la categoria di funzioni “Mathematical”,
quindi la funzione “Log” e la variabile “TL”. Premere “Ok” per eseguire la trasformazione:

Procedere con le altre variabili, quindi ripetere l’analisi trattata al punto 4.5. In questa situazione si può
cominciare ad apprezzare il vantaggio di utilizzare degli script!

3.7. Analisi della varianza

3.7.1. Programma CINQUE A


Entriamo ora nell’analisi del confronto tra gruppi. In questo caso eseguiamo l’analisi della varianza (proc
ANOVA) per i due sessi, separatamente per ogni specie e per la variabile LnTL. La domanda è la seguente:
esiste dimorfismo sessuale?

/*********************************************************************
PROGRAMMA CINQUE A
Questo programma esegue un'analisi della varianza sulla variabile
LnTL (logaritmo della lunghezza totale) per verificare se,
in ogni specie, i due sessi sono diversi, ovvero se esiste un
dimorfismo sessuale
**********************************************************************/
Title 'Analisi della Varianza per sessi';
data logsei;
infile 'logcranio.txt';
input specie$ local$ sex$
LnTL LnNL LnFL LnBZW LnCW
LnMLOW LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL
LnFMW LnIFW LnCH;;
proc anova; /* la procedura ANOVA esegue l'analisi della varianza */
class specie sex; /* i due fattori sono 'specie' e 'sex' */
model LnTL= sex; by specie; /* esegue l'analisi tra i due sessi */
/* separatamente tra le due specie */
run;

27
3.7.2. Alternativa al programma CINQUE A tramite menu
Dal menu del tasto destro, aprire il file “logsei” in Analyst:

Dal menu del tasto destro, scegliere “One way ANOVA”:

Scegliere “LnTL” come variabile dipendente, “sex” come indipendente. Premere “Variables” e quindi scegliere
“specie” come “By group”. Premere “Ok” per eseguire l’analisi:

28
3.8. Generalized linear models

3.8.1. Programma CINQUE B


L’esame della finestra LOG dopo l’esecuzione del programma precedente ci mostra che, sebbene l’ANOVA sia
stata eseguita (i risultati sono riportati nella finestra dell’output), le osservazioni contenute in ogni cella non
sono eguali e è suggeribile utilizzare la procedura GLM invece della procedura ANOVA. La complessità
associata a campionamenti zoologici comporta spesso notevoli difficoltà nel raccogliere set bilanciati di dati
appropriati per l’elaborazione con i metodi classici dell’analisi della varianza. I Generalized Linear Models
(procedura GLM) permettono di utilizzare dati non bilanciati sia con varianze eterogenee che con errori non
normali o correlati alle medie.
Notate che nell’output vi vengono proposte due soluzioni: Type I e Type III. L’errore del Type I può
essere quello di rigettare una vera ipotesi nulla. Questo può dipendere dal fatto che si ipotizzi una relazione
tra due variabili quando questa è assente. In altre parole, costituisce è il tasso di falso allarme o di falsa
positività, in dipendenza del fatto che la relazione è casuale. Al contrario, il test Type III è considerato da
molti come ottimale. In questo caso, le ipotesi per un effetto non dipendono dai parametri di un altro
effetto, non dipendono dall’ordine degli effetti nel modello (vedremo questo aspetto più avanti) e, infine,
l’ipotesi da verificare è la stessa di quella in cui non ci sono celle mancanti.
Notate che per le specie “barinens”, “canicoll”, “poliopus” non vi è significatività per la variabile LnTL
(il test andrebbe ripetuto per le altre variabili). Anche se in modo non chiaro, potremmo assumere che vi è
un effetto relativo del dimorfismo sessuale su questa variabile.

/*********************************************************************
PROGRAMMA CINQUE B
Poiché il numero di osservazioni presenti in ogni cella non è
eguale, è più appropriato utilizzare un modello lineare.
Anche questo programma esegue un'analisi della varianza sulla variabile
LnTL, ma utilizzando la progedura GLM invede della ANOVA
**********************************************************************/
proc glm; /* utilizziamo la procedura GLM e non ANOVA */
class specie sex; /* il modello è uguale al precedente */
model LnTL= sex; by specie;
run;

3.8.2. Alternativa al programma CINQUE B tramite menu


Dal menu del tasto destro selezionare “Linear models”:

29
Scegliere “LnTL” come variabile dipendente e “sex” come indipendente; in “Variables” selezionare “specie”
come “BY group”. Premere “Ok” per eseguire l’analisi:

3.9. Test post hoc

3.9.1. Programma CINQUE B 1


Assumendo che non esista dimorfismo apprezzabile per la variabile LnTL, il problema che ora ci poniamo è
quali sono le differenze significative tra le specie.
L’ANOVA da sola non può dare questa risposta quando si trattano più di due gruppi. Utilizziamo
allora un test di confronto tra le medie; in questo caso, la scelta cade sul test di Tukey che è un test
decisamente conservativo, che tende cioè a “rimanere dell’idea” che le medie sono uguali. Si può applicare
sia a set di dati di uguale misura, sia quando il numero dei dati è diverso (in tal caso si parla di test di
Tukey-Kramer e il procedimento di calcolo è leggermente diverso). In questo ultimo caso il test è ancora più
conservativo.
Osserviamo i risultati (tralasciamo l’analisi della varianza) e ci accorgiamo che alcuni dei confronti
sono significativi. Anche questa routine potrebbe essere ripetuta per tutte le variabili cambiando
semplicemente, di volta in colta, il nome della variabile (ma vedi più avanti).

/*********************************************************************
PROGRAMMA CINQUE B 1
Questo programma conduce l'analisi della varianza e aggiunge però
un test tra le medie. Questo al fine di avere un confronto a coppie
per tutti i gruppi. Il test utilizzato è quello di Tukey
**********************************************************************/
proc glm; /* si utilizza la procedura GLM */
class specie; /* il modello è uguale alle specie */
model LnTL= specie; /* per la variabile LnTL */
means specie/tukey alpha= 0.05; /* test di Tukey fra le medie */
/* ALTRE OPZIONI PER TEST FRA LE MEDIE: */
/* sostituire a "tukey" "LSD" per il test 'Least square significance' */
/* oppure "GT2" o, per altre opzioni, consultare la guida */
run;

30
3.9.2. Alternativa al programma CINQUE B 1 tramite menu
Seguire i passi esposti al punto 4.8.2. Nella finestra “Linear models” selezionare “LnTL” come variabile
dipendente e “specie” come indipendente. Accertarsi che in “Variables” il campo “BY groups” sia vuoto: in
caso contrario rimuovere “specie”. Nella finestra “Linear models” premere “Means”. Selezionare “Tukey’s
HSD” come metodo di confronto; accettare il livello di significatività 0.05 proposto; aggiungere (pulsante
“Add”) “specie” alla lista di “Effect / methods”. Premere “Ok” per eseguire l’analisi:

3.10. Analisi della varianza multivariata (MANOVA)

3.10.1. Programma CINQUE C


Questo programma estende le domande poste nei due programmi precedenti in un contesto multivariato:
non è solo un carattere singolo (tutti i caratteri esaminati indipendentemente) che può mostrarci l’esistenza
di un dimorfismo sessuale, ma è il suo contesto multidimensionale (dove il numero di dimensioni è dato dal
numero dei caratteri) che può rappresentare meglio il problema. A tal fine, utilizziamo sempre la procedura
GLM; inseriamo però un’istruzione che blocchi l’ANOVA e un’istruzione che esegua l’analisi multivariata della
varianza (MANOVA) dove il fattore (in questo programma) è il sesso.
In questo caso (come, in generale, per tutti i modelli multivariati) l’output è particolarmente ricco e
bisogna effettuare una cernita attenta dei risultati. Sinteticamente, per ogni specie si devono osservare i
risultati dei test riportati sotto:

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall sex Effect
H = Type III SSCP Matrix for sex

Questi comprendono Wilk’s L, Pillai's Trace, Hotelling-Lawley Trace e Roy's Greatest Root; sono tutti
test multivariati di significatività per il cui significato si rimanda a testi che trattano questi argomenti. Notate
che l’errore è quello del Type III.
Notate come siano tutti non significativi, eccetto che per “barinens”. Secondo questi risultati, c’è un
effetto appezzabile di dimorfismo sessuale solo in questa specie.

/*********************************************************************
PROGRAMMA CINQUE C
Poiché in questo caso il dimorfismo sessuale è relativo a tutte
le variabile registrate, eseguiamo un'analisi della varianza
multivariata (MANOVA) su tutte le variabili utilizzando sempre
la procedura GLM
**********************************************************************/

31
title 'MANOVA dimorfismo sessuale';
proc glm;
class specie sex;
model LnTL LnNL LnFL LnBZW LnCW LnMLOW /* vengono incluse tutte le variabili */
LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL
LnFMW LnIFW LnCH= sex / nouni; by specie; /* l'istruzione 'nouni' fa si' che non
vengano stampati i risultati relativi
all'analisi della varianxa su ogni variabile */
manova h=sex ; /* questa istruzione richiama la MANOVA */
run;

3.10.2. Alternativa al programma CINQUE C tramite menu


Seguire i passi esposti al punto 4.8.2. Nella finestra “Linear models” selezionare tutte le variabili numeriche
come dipendenti e “sex” come indipendente. In “Variables” selezionare “specie” come “BY group”. Nella
finestra “Linear models” premere “Tests”. Nella sottofinestra “Multivariate” aggiungere “sex” agli effetti
(selezionare “sex” in “Effects” e premere “Add”: nel riquadro di destra appare “H=sex E=Residual error
matrix”). Premere “Ok” per eseguire l’analisi:

Notare che, essendo impossibile evitare che il programma esegua i test univariati, l’output è molto più
prolisso del necessario.

3.10.3. Programma CINQUE D


I risultati precedenti hanno lasciato un margine di incertezza: esiste il dimorfismo sessuale, ma questo è
apprezzabile in un solo gruppo su otto (l’analisi potrebbe essere estesa alle popolazioni e, in questo caso, il
numero di gruppi aumenterebbe); può questo effetto (dimorfismo sessuale) intervenire quando vogliamo
indagare sulle differenze tra i gruppi? Se la risposta fosse positiva, allora dovremmo eseguire analisi separate
per maschi e femmine.
Per risolvere il problema, utilizziamo la stessa procedura GLM con l’istruzione MANOVA; costruiamo
però un modello più complesso: i fattori a questo punto sono 3, il sesso, la specie e la loro interazione.
L’analisi ci dirà se ci sono differenze significative tra le specie, tra i sessi (tutti i maschi contro tutte le
femmine) e se esiste un’interazione significativa tra i due fattori.
L’esame dell’output (valutare, come nel caso precedente, gli effetti per i due fattori e la loro
interazione) ci rivela che c’è un effetto significativo del sesso (si ricordi che i due sessi sono cumulati per
tutte le specie), un effetto significativo della specie e assenza di significatività per l’interazione specie*sesso
(a eccezione del test Roy's Greatest Root; questo è un test particolarmente stringente e potremmo
ignorarlo). Potremmo concludere che non esiste un forte e apprezzabile dimorfismo sessuale e, d’ora in poi,
analizzeremo i dati senza tenerne conto.

32
/*********************************************************************
PROGRAMMA CINQUE D
Questo programma esegue una MANOVA con un modello più complesso.
La domanda è la seguente: il dimorfismo sessuale è tale da
compromettere la distinzione tra le specie?
Il modello indaga: 1) differenze tra i due sessi
2) differenze tra le specie
2) l'interazione tra il fattore 'sex' e il fattore 'specie'
**********************************************************************/
title 'MANOVA dimorfismo sessuale, differenze tra specie e interazione degli effetti';
proc glm;
class specie sex; /* i due fattori: 'sex' e 'specie' */
model LnTL LnNL LnFL LnBZW LnCW LnMLOW
LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL
LnFMW LnIFW LnCH = sex specie specie*sex/ nouni; /* il modello prevede lo studio */
/* dei due fattori e della */
manova h=sex specie specie*sex ; /* loro interazione */
run;

3.10.4. Alternativa al programma CINQUE D tramite menu


Seguire i passi esposti al punto 4.8.2. Nella finestra “Linear models” selezionare tutte le variabili numeriche
come dipendenti, “sex” e “specie” come indipendenti. Nella finestra “Linear models” premere “Model”.
Premere “Standard models” e elezionare “Effects up to 2-way interactions”. Premere “Ok” per uscire:

Nella finestra “Linear models” premere “Tests”. Nella sottofinestra “Multivariate” aggiungere “sex”, “specie” e
“sex*specie” agli effetti. Premere “Ok” per eseguire l’analisi:

33
Notare che, essendo impossibile evitare che il programma esegua i test univariati, l’output è molto più
prolisso del necessario.

3.11. Analisi delle componenti principali (PCA)

3.11.1. Programma SEI


Addentriamoci ulteriormente nei modelli multivariati. Questo programma esegue l’analisi delle componenti
principali (PCA) a partire dalla matrice di varianza-covarianza.
L’output è ricco ma quello che ci interessa è:

1)
Eigenvalues of the Covariance Matrix
Autovalore Differenza Proporzione Cumulata

Con gli autovalori, la percentuale di varianza spiegata e la porzione di varianza cumulata. Notate che
il primo autovalore spiega il 50.95% della varianza, il secondo il 14.50% e assieme il 65.45%.

2)

Eigenvectors

Gli autovettori per ogni variabile e per ogni componente (dal primo al 17°). Notate che, in questo
caso, i valori degli autovettori del primo autovalore (primo vettore, primo PC, primo asse ….) sono diversi da
tutti gli altri: hanno infatti tutti lo stesso segno (sono tutti positivi) e valori più o meno simili (tranne LnCH).
Grossolanamente, il primo autovalore può essere considerato un “growth factor”, indipendentemente dal
fatto che ci stiamo occupando di reali forme biologiche soggette a crescita, dove il “growth factor” esprime
realmente un’allometria. Casi in cui tutti gli autovettori del primo autovalore sono simili per segno e
dimensioni sono comuni al di fuori della morfometria; questo vettore spiega quindi un processo o direzione
dal “più piccolo” al “più grande”.

***************************************************************
PROGRAMMA SEI
ANALISI DELLE COMPONENTI PRINCIPALI
Questa routine esegue l'analisi delle componenti principali a partire
dalla matrice di covarianza dei dati trasformati in logaritmi
(le 17 variabili originali).
L'opzione COV fa sì che autovalori e autovettori siano estratti
dalla matrice di varianza-covarianza
******************************************************************/
data PCA;
infile 'logcranio.txt'; /*utilizziamo il file salvato in precedenza */
input specie$ local$ sex$
LnTL LnNL LnFL LnBZW LnCW
LnMLOW LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL
LnFMW LnIFW LnCH;
proc princomp COV; /* proc PRINCOMP esegue l'analisi delle PCA */
run;

34
3.11.2. Alternativa al programma SEI tramite menu
Per eseguire questa analisi delle componenti principali si utilizzerà un modulo SAS di nome ASSIST. Questo
modulo permette di eseguire in modo assistito delle analisi molto semplici (come quella qui considerata).
Nell’esercizio successivo, in cui sarà necessario produrre un output più ricco, l’analisi sarà eseguita tramite il
consueto modulo SAS Analyst. Per richiamare ASSIST, attivare una finestra a scelta tra “Results”. “Log”,
“Output” o “Editor” (con un singolo click del mouse); scegliere “Solutions” “Assist” dalla barra degli strumenti
in alto; accettare i default della finestra successiva premendo “Continue”. Nella nuova finestra scegliere
“Data analysis” “Multivariate” “Principal components”:

Nella nuova finestra:


1. premere “Table”, scegliere il dataset “LOGSEI” nella libreria “WORK”, quindi “Ok”;
2. premere “Columns to be analyzed”, scegliere tutte le variabili numeriche, quindi “Ok”;
3. premere “Additional options”:

35
In “Other options” selezionare “Compute components from covariance matrix”, quindi “Ok”:

Per eseguire l’analisi premere il pulsante “Run” ( ) che normalmente si utilizza per eseguire gli script.
Notare che il modulo ASSIST costituisce una via alternativa (assistita) alla creazione di scritp. È possibile
salvare lo script generato dal modulo attraverso il menu “File” “Save as source”.

3.11.3. Programma SEI A


L’output del programma precedente è molto scarno e, come abbiamo visto, vi sono tre parti realmente
importanti da osservare. Il programma SEI A arricchisce di contenuti la routine precedente utilizzando un
semplice linguaggio matriciale nel seguente modo (si noti che le prime righe sono identiche):

1) vengono creati due nuovi files, a) OUT=DIVSCRES e b) OUTSTAT=TEMP. In TEMP salviamo autovettori e
autovalori; in DIVRESC sono salvati tutti gli elementi dell’analisi, compresi i punteggi di ciascun
individuo (PRIN1 – PRIN17) rispetto a ogni componente principale.
2) Viene utilizzata la procedura TRANSPOSE; le matrici dei vettori vengono trasposte.
3) Viene prodotto un “grafico a cascata” per i 17 autovalori; è possibile osservare come la varianza
spiegata da ciascun componente principale decresca rapidamente dal primo al secondo e, quindi, dal
5° al 17° sia notevolmente bassa.
4) I tre grafici successivi mostrano, a titolo esemplificativo, i coefficienti degli autovettori per i primi tre
componenti. Viene mostrato in modo grafico quanto detto in precedenza, ovvero che i valori degli
autovettori del primo autovalore hanno infatti tutti lo stesso segno (sono tutti positivi) e valori più o
meno simili (tranne LnCH), mentre gli altri variano per segno e dimensioni.
5) L’ordinamento grafico relativamente al primo e al secondo componente, e al primo e al terzo. E’
stata utilizzata l’opzione “SYMBOL” par assegnare simboli e colori diversi alle specie in modo da
renderle più riconoscibili.
6) Infine, vengono salvati sul file “punteggi PCA.txt” i valori di ogni individuo rispetto ai primi tre PC,
unitamente ai codici di specie, località e sesso.

Notate che nel primo grafico a dispersione (PC1 e PC2) vi sono due individui fortemente devianti.
Avremmo dovuto riconoscerli prima durante le analisi esplorative. Per individuarli, utilizziamo il modulo
“analisi interattiva dei dati”. Vi si accede dal menu, premendo su “soluzioni”, quindi su “analisi”. Sulla finestra
che si apre scegliamo la libreria “WORK” (che contiene tutti i SAS datafiles aperti) e quindi su “DIVRESK”
(apre la finestra che contiene i dati originali più i punteggi dei componenti principali, PNIN1 – PRIN17). Dal
menù in alto “Analyze” apriamo “Scatter Plot (X Y)”. Sulla finestrella evidenziamo PRIN1 e inseriamolo nella
casella “X” e PRIN 2 nella casella “Y”; quindi, premiamo su “OK”. Il grafico che compare è lo stesso di quello
precedente, tranne per i colori e i simboli delle specie. Premiamo con il mouse sui due individui devianti:
appariranno i numeri 85 e 86, che corrispondono all’85° e 86° record (o individuo) nel file. Si suggerisce
crudemente di eliminarli. Una strada è quella di aprire con un text editor il file “punteggi PCA.txt”.
Notate che il modulo “analisi interattiva dei dati” offre numerose altre possibilità.

/*****************************************************************
PROGRAMMA SEI A
ANALISI DELLE COMPONENTI PRINCIPALI
Questa routine esegue l'analisi delle componenti principali a partire

36
dalla matrice di covarianza dei dati trasformati in logaritmi
(le 17 variabili originali). I punteggi degli individui sulle
componenti principali sono salvati nel SAS datafile DIVSCRES
in modo tale da poter essere utilizzate per grafici.
I risultati (piuttosto estesi) dell'analisi sono presentati
nella finestra di output.
Il SAS datafile OUTSTAT contiene tutti i risultati dell'analisi.
I componenti principali sono chiamati PRIN1-PRIN17 in OUTSTAT.
Viene prodotto un grafico a cascata degli autovalori,
dei grafici con i coefficienti degli autovettori 1 - 17
per i primi tre componenti principali e il grafico a dispersione degli
individui rispetto ai primi tre componenti principali (vengono
assegnati colori diversi alle specie)
Infine, vengono salvati sul file 'punteggi PCA.txt' i punteggi
degli individui rispetto ai primi tre componenti principali.
Questo file può essere utilizzato come input per programmi di
grafica scientifica
******************************************************************/
data pippo;
infile 'logcranio.txt';
input specie$ local$ sex$
LnTL LnNL LnFL LnBZW LnCW
LnMLOW LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL
LnFMW LnIFW LnCH;
PROC PRINCOMP COV OUT=DIVSCRES OUTSTAT=TEMP;
data tempo; set temp; /* salva solo gli autovettori e i vettori */
if _TYPE_='EIGENVAL' OR _TYPE_='SCORE';
if _NAME_=' ' then _NAME_='EIGEN';
proc transpose;
data;set;i+1; /* crea una variabile indicizzata i per gli autovalori */
options pagesize=66;
proc print;var EIGEN _NAME_ PRIN1-PRIN17;
SUM EIGEN;
/* notare che la somma degli autovalori è la traccia della matrice di varianza-covarianza */
title 'Grafico a cascata degli autovalori 1 - 17';
proc gplot;
plot eigen*i;
symbol1 I=JOIN;
proc gplot;
title1 'Coefficienti degli autovettori 1 - 17';
title2 ' per i primi tre componenti principali';
plot prin1*i prin2*i prin3*i ;
proc gplot data=divscres;plot prin2*prin1=specie; plot prin3*prin1=specie;
symbol1 c=green i=none v=circle; /* il comando symbol consente simboli grafici a piacimento */
symbol2 c=blue i=none v=triangle;
symbol3 c=blue i=none v=square;
symbol4 c=black i=none v=square;
symbol5 c=red i=none v=square;
symbol6 c=yellow i=none v=circle;
title 'Proechimys, analisi delle componenti principali’;
title2 'Grafico a dispersione dei primi tre componenti pincipali';
data pluto; set divscres;
file 'punteggi PCA.txt';
PUT specie local sex
PRIN1-PRIN3;
run;

37
3.11.4. Alternativa al programma SEI A tramite menu
Tornare al modulo SAS Analyst e aprire la tabella “LOGSEI” (se non è già attiva). Dal menu del tasto destro
scegliere “Principal components”:

Specificare tutte le variabili numeriche come variabili da analizzare, quindi premere “Statistics”:

Specificare che si intende analizzare le covarianze, quindi premere “Ok”:

38
Premere “Plots”. Specificare che si vuole lo scree plot per tutti gli autovalori…

… e il component plot per le prime tre componenti principali, assegnando i simboli in base alla specie di
appartenenza del punto:

Infine, premendo “Save data” è possibile scegliere di salvare sia i punteggi individuali rispetto a ogni
componente principale, sia tutte le statistiche.

Notare che i grafici a dispersione prodotti sono meno facilmente interpretabili di quelli ottenuti tramite script:
infatti qui non è possibile scegliere i simboli dei punti né gli intervalli di valori sugli assi. Inoltre non è
possibile generare i grafici dei componenti degli autovettori per i primi tre autovalori. Per manipolare più
agevolmente questi grafici è possibile esportare le tabelle “Temp” e “Divscres” in un file Excel. Per compiere
questa operazione, selezionare la tabella nella finestra di Explorer, e dal menu del tasto destro scegliere
“Export”. Seguire la procedura guidata.

39
3.11.5. Programma SEI B
Corretti i dati, eseguiamo questo programma che produce i due grafici con la dispersione degli individui
rispetto ai primi tre PC, con colori e simboli diversi per ogni specie. Notiamo che c’è una leggera
segregazione delle specie rispetto ai tre assi. Questo dipende dalla forte somiglianza tra i caratteri, anche se
con la ANOVA, il test di Tukey e la MANOVA avevamo mostrato differenze significative. D’altra parte, il caso
in esame è costituito da specie sorelle e criptiche e non ci possiamo aspettare forti evidenze apprezzabili da
un’analisi di questo tipo.

/*****************************************************************
PROGRAM SEI B

Questa routine produce semplicemente un grafico a dispersione


Il file 'punteggi PCA.txt' contiene i punteggi sui primi
tre componenti principali
******************************************************************/
data paperino;
infile 'punteggi PCA.txt';
input specie$ local$ sex$ PRIN1-PRIN3;
proc gplot;
plot prin2*prin1=specie; plot prin3*prin1=specie;
symbol1 c=green i=none v=circle;
symbol2 c=blue i=none v=triangle;
symbol3 c=blue i=none v=square;
symbol4 c=black i=none v=square;
symbol5 c=red i=none v=square;
symbol6 c=yellow i=none v=circle;
title1 'Grafico a dispersione dei primi tre componenti pincipali';
run;

3.11.6. Alternativa al programma SEI B tramite menu


Ripetere le procedure adottate al punto 4.11.4, dopo aver rimosso i record 85 e 85 della tabella “DIVSCRES”.

3.12. Analisi discriminante e delle variate canoniche

3.12.1. Programma SETTE

Dopo aver cancellato anche dal file 'logcranio.txt' l’85° e 86° record, procediamo a un altro modello di
analisi multivariata: l’analisi discriminante e l’analisi della variate canoniche.
Il programma SETTE esegue l’analisi producendo:
1) Le distanze di Mahalanobis al quadrato tra i gruppi (qualora queste distanze venissero utilizzate per
modelli di analisi dei grappoli o altro sarebbe bene farne prima la radice quadrata).
2) La statistica di F associata a queste distanze e le probabilità.
3) L’ANOVA per ogni variabile.
4) La MANOVA e i test di significatività associati.
5) I valori di correlazione canonica di ciascun vettore (più si approssimano a 1, più sono dei buoni
descrittori del fenomeno).
6) Gli autovalori (vettori discriminanti o canonici) e la percentuale di varianza spiegata.
7) I valori dei centroidi (la media di ciascun gruppo) relativamente a ciascun vettore (le distanza
euclidee tra i centroidi corrispondono alle distanze di Mahalanobis).

Per questo programma e per il successivo (SETTE A) non è praticabile nel sistema SAS un’alternativa tramite
menu.

/**********************************************************************
PROGRAMMA SETTE

Eseguiamo ora l'analisi delle variate canoniche su tutte le variabili


in base alle specie utilizzando la procedura 'CANDISC'. Questa procedura

40
calcola le distanze di Mahalanobis (avvertenza: sono distanze quadratiche),
la statistica di F associata e la probabilità, la statistica per ogni variabile,
la MANOVA tra gruppi.
Inoltre, segnala i valori di correlazione canonica, gli autovalori e
la varianza spiegata da ogni vettore e la varianza cumulata.
***********************************************************************/
data discimina;
infile 'logcranio.txt';
input specie$ local$ sex$
LnTL LnNL LnFL LnBZW LnCW
LnMLOW LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL
LnFMW LnIFW LnCH;
title 'analisi delle variate canoniche';
proc candisc anova distance; /* l'opzione DISTANCE calcole le distanze_2 */
class specie; /* di Mahalanobis e la statistica associata */
/* l'opzione ANOVA la anova per ogni variabila */
run;

3.13. Calcoli matriciali: linguaggio IML

3.13.1. Programma SETTE A

Il programma SETTE A è decisamente il più complicato. Il fine è quello di calcolare le distanze di


Mahalanobis distorte e non-distorte, un problema che generalmente non viene affrontato dai software
statistici, di aggiungere (tramite la procedura DISCRIM) altri risultati interessanti, e di produrre grafici a
dispersione per le medie canoniche (centroidi dei gruppi) e per tutti gli individui (i due files con i rispettivi
dati vengono salvati su disco per essere utilizzati da programmi di grafica scientifica.
In questa routine viene utilizzato il linguaggio IML (richiamato con proc IML), un linguaggio
simbolico matriciale interno al SAS la cui sintassi è molto simile a quella utilizzata da altri software scientifici
(ad es. MATHLAB) e non. L’intento è anche quello di mostrare come possono essere costruite routines ad
hoc per esigenze di analisi particolari.
Nell’output sono presenti risultati già prodotti dal programma SETTE e in più:

1) Le distanze di Mahalanobis distorte e non-distorte.


2) I valori di F e le probabilità associate. Questi corrispondono al test di Hotelling T2 per confronti
multivariati a coppie tra medie; in questo caso, il test è tra i centroidi delle specie.
3) Il test di attribuzione corretta a posteriori per ogni individuo. Questo è effettuato verificando le
distanze di Mahalanobis di ogni individuo dal proprio centroide e dall’altro e poi assegnando
l’individuo al gruppo rispetto a cui presenta la distanza minima; viene indicata la percentuale di
classificazione corretta.
4) I grafici a dispersione per i centroidi e tutti gli individui (primi tre assi canonici).

/**********************************************************************
PROGRAMMA SETTE A
Questo programma costituisce un'estensione del PROGRAMMA SETTE. Viene
utilizzato un linguaggio interno al SAS e viene richiamata
la procedura IML che consente una programmazione utilizzando un
linguaggio simbolico matriciale.
Il programma:
1) Esegue nuovamente l'analisi discriminante ma l'istruzione NOPRIN fa si'
che non vengano stampati i risultati; questi (vettori, ecc) vendono salvati
nei SAS datafile "OCH" e "CANOUT".
2) La procedura IML esegue istruzioni per manipolare le matrici
3) viene prodotta la matrice delle distanze di Mahalanobis distorte
e la matrice delle distanze di Mahalanobis non distorte; viene prodotta una
matrice con i valori F e le probabilità (corrispondono al test T2 di Hotelling)
tra i centroidi.
3) vengono calcolate le medie (proc MEANS) dei valori degli individui
rispetto a ogni asse canonico e prodotto un grafico a dispersione

41
per i centroidi di ciascuna specie per i primi tre assi. Questi dati
vengono salvati sul file 'punteggi medie canoniche.txt'.
4) Si inizia una analisi discriminante (proc DISCRIM) che arricchisce i
risultati. I valori di ogni individuo sugli assi discriminanti vengono
salvati (anche nel file 'punteggi canonici.txt') e quindi posti
in grafico.
NOTA BENE: i segni #### indicano dove eventualmente dovete apportare semplici modifiche
per adattare questo programma ai vostri dati
***********************************************************************/
data discimina; /* come in PROGRAMMA SETTE */
infile 'logcranio.txt';
input specie$ local$ sex$
LnTL LnNL LnFL LnBZW LnCW
LnMLOW LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL
LnFMW LnIFW LnCH;
title 'analisi delle variate canoniche';
proc candisc out=och outstat=canout noprint;
class specie;
data freq;set canout; if _type_='N'; keep LnTL specie;
data canmn;set canout;
if _type_='CANMEAN' ;
keep specie _NAME_ LnTL;
data temp;set freq;
i+1;
if i>1;
PROC IML ; /* INIRIA LA PROCEDURA IML */
reset nolog;
USE temp;
READ ALL INTO NSIZE[rowname=specie]; /* ##### cambiare con la vostra variabile */
NS=NSIZE[,1];
print ns[rowname=specie] ; /* ##### cambiare con la vostra variabile */
CONFCOE=.01; /* ##### coefficienti di confidenza */
FND=PROBIT(CONFCOE);
NUM= NROW(nsize); /* il numero di "SPECIE" */
NTOT=nsize[+,]; /* il numero totale di individui */
use canmn; /* utilizza le medie canoniche */
read all into xtemp;
NCMS=nrow(xtemp);
P=NCMS/NUM;
X=SHAPE(xtemp,num);
CONFLIM=J(NUM,NUM,0); /* queste sono tre matrici in cui */
FLAST=J(NUM,NUM,0); /* salva i risultati */
FDIST=J(NUM,NUM,1);
NUM1=NUM-1;
WORK=X*X`;
DIAG= VECDIAG(WORK); /* le prossime linee calcolano */
COLDIAG=DIAG* J({1},NUM); /* le distanze distorte e non distorte */
ROWDIAG= J(NUM,{1})*DIAG`;
DSQMAT=COLDIAG+ROWDIAG-{2}*WORK;
NTOTAL=NS[+,1]; /* il numero totale di individui */
PRINT NTOTAL;
DO I1=1 TO NUM1; /* loop sui valori delle distanze di Mahalanobis */
DO J1= I1+1 TO NUM;
N1=NS[I1,1];N2=NS[J1,1];M=P;
DSQ=DSQMAT[I1,J1];
UDSQ=(NTOTAL-NUM-p-1)*DSQ/(NTOTAL-NUM)-(N1+N2)*P/(N1*N2); /* distanze non distorte */
FLAST[I1,J1]=DSQ; /* le formule per correggere le distanze */
FLAST[J1,I1]=UDSQ;
F=N1*N2*(NTOTAL-NUM-P+1)*DSQ/(N1+N2)/(NTOTAL-NUM)/M; /* i valori di F */
FDIST[I1,J1]=F;
FDIST[J1,I1]=1-PROBF(F,P,NTOTAL-NUM-P+1); /* le probabilità per F */
N=N1+N2-M-1;

42
END;END;
/* I valori sopra la diagonale sono le distanze di Mahalanobis distorte */
print 'La matrice contiene le distanze di Mahalanobis distorte sopra la diagonale';
print ' e quelle non distorte sotto';
print flast[FORMAT=7.4 rowname=specie colname=specie];
print 'I valori sopra la diagonale sono i valori di F e sotto le probabilità';
print FDIST[FORMAT=7.4 rowname=specie colname=specie];

proc means data=och noprint; /* vengono calcolate le medie (centroidi) */


/*dal file 'och' e salvate nel file 'ochmns'
(il comando NOPRINT omete l'output dell'analisi canonica) */
output out=ochmns mean = mn1-mn11;
var can1-can11;
class specie;

/* esegue un grafico a dispersione dei centroidi sui primi */


/* tre assi canonici */

proc gplot data=ochmns; plot mn2*mn1=specie; plot mn3*mn1=specie;


title 'Plot medie canoniche per specie';
symbol2 c=green i=none v=circle; /* il comando symbol consente simboli grafici a piacimento */
symbol3 c=blue i=none v=triangle;
symbol4 c=red i=none v=triangle;
symbol5 c=black i=none v=triangle;
symbol6 c=yellow i=none v=triangle;
symbol7 c=black i=none v=square;
symbol8 c=red i=none v=square;
symbol9 c=blue i=none v=circle;

data mediecan; set ochmns; /* salva nel file 'punteggi medie canoniche.txt' */
file 'punteggi medie canoniche.txt'; /* i valoridei centroidi sui primi tre assi canonici */
put specie mn1 mn2 mn3; /* per programmi di grafica scientifica */

/* esegue un grafico a dispersione degli individui */


/* sui primi tre assi canonici */
proc gplot data=och; plot Can2*Can1=specie; plot Can3*Can1=specie;
title 'Plot variate canoniche per specie';
proc discrim data=discimina canonical manova short pool=yes out=disc; /* inizia l'analisi
discriminante */
class specie;
title 'Analisi discriminante';
data canonic; set och; /* salva nel file 'punteggi canonici.txt' i valori sui */
file 'punteggi canonici.txt'; /* primi tre assi canonici per programmi di grafica scientifica */
put specie can1 can2 can3;
run;

43
3.14. ENTERPRISE GUIDE

Enterprise guide costituisce un’interfaccia grafica con qui è possibile eseguire le analisi dei dati (non quelle
particolarmente complesse) tramite un sistema di menù a tendina che lo rendono molto simile a altri sotware
statistici. L’esecuzione delle analisi avviene in batch, ossia è necessario avere installato sul vostro PC il
sistema SAS in modo che le sue diverse routines possano venire richiamate e eseguite senza che voi ve ne
rendiate conto.
Enterprise è costituito da due moduli: uno e Enterprise guide, l’altro Enterprise guide administrator.
E’ necessario che configuriate semplicemente il vostro Enterprise guide administrator indicando che
l’esecuzione avviene con una macchina in modalità “local” (il SAS può anche essere utilizzano in rete,
installato su un server remoto).
Enterprise guide sia su SAS datafiles che avete salvato da una precedente sessione o importando
files in diverso formato.

3
1 2

Enterprise guide è organizzato in finestre, nel modo seguente:

1) La finestra contiene il progetto e i diversi elementi dei files e dell’analisi che, di volta in volta,
eseguite. Il progetto può essere nuovo o potete richiamare un progetto che avete creato in
precedenza. Il progetto contiene inizialmente un SAS datafile; in questo caso, è contenuto “uno”,
creato con la sessione SAS precedente, e “dati importati da cranio$”. Quest’ultimo file è stato
importato utilizzando il comando ‘strumenti’, ‘importa dati’.
2) La finestra contiene tutti i vostri dati e l’output delle analisi. Qui viene mostrato il file importato “dati
importati da cranio$” (il file di dati iniziale “cranio.txt”).
3) Finestra con le “librerie”, i “cubi” e la cartella dati “file” presenti sul vostro PC local, in questo caso
chiamato “topo2”. Potete richiamare tutti i files presenti in questi elementi.
4) La finestra vi elenca i processi che potete eseguire. Potete scegliere direttamente qui le analisi o i
grafici che volete eseguire o utilizzare il menù a tendina in alto, sotto la barra.

44
Eseguiamo ora qualche semplice analisi descrittiva, similmente a quanto abbiamo fatto in precedenza con il
sistema tradizionale tramite inserimento di comandi.

1) Selezionare ”statistiche di riepilogo“ in “processi per categoria” (la stessa scelta può essere fatta
utilizzando il menù a tendina. Si apre la finestra:
2) In cui definite A) le variabili dell’analisi (F5, un nome assegnato alla variabile ‘TL’, in modalità edit
potete cambiare a piacimento il nome delle vostre variabili), la variabile di classificazione (specie); B)
le statistiche descrittive di vostra scelta (media, deviazione standard, ecc); C) l’eventuale grafico (in
questo esempio scegliamo un “box and wisker”; D) risultati e E) eventuali titoli. Con “fine” eseguite il
programma. L’output compare nella finestra interna.

I risultati vi verranno mostrati in formato HTML nella finestra centrale. Potete effettuare una quantità
notevole di grafici e parte delle analisi condotte precedentemente con le routines, da PROGRAMMA UNO in
poi.

Notate che, dopo aver effettuato una qualsiasi analisi, nella finestra del progetto appare anche l’icona del
“LOG”. Questa contiene la routine di esecuzione. La potete salvare in un editor, importarla nell’editor del SAS
e modificarla ulteriormente per le vostre necessità.

45
4. Risorse in linea

Sito del SAS Institute in Italia


http://www.sas.com/offices/europe/italy/

Manuali del SAS Institute


http://www.sas.com/offices/europe/italy/servizi/pubblicazioni/manuali.html

Manuali ondine del SAS presso il CASPUR (tutta la documentazione con esempi; CONSIGLIATO)
http://www.caspur.it/risorse/softappl/doc/sas_docs/main.htm

Alcuni collegamenti utili con esempi e espedienti (trovati tramite un motore di ricerca. La documentazione in
linea con programmi di esempio è ricchissima):

http://www.unt.edu/rss/class/sas1/ (Introduzione al SAS)


http://www.pauldickman.com/teaching/sas/index.php
http://www.ats.ucla.edu/stat/sas/
http://www.uni-bonn.de/~umt70e/soft.htm (routines da scaricare in formato zip)
http://www.winchendon.com/bootstrap.html (bootstrap con SAS)
http://home.nc.rr.com/schabenb/SASTips.htm#Descriptive%20Statistics (Common Tasks With The SAS
System)
http://www.stat.ncsu.edu/~st733_info/oldindex.html (Applied Spatial Statistics)

Supporto tecnico

Come utenti SAS, potete in qualsiasi momento utilizzare il supporto tecnico per risolvere malfunzionamenti o
quesiti (evidentemente, non per le analisi!). Il supporto è ben organizzato e il personale è competente e
gentile.

tel. 02 574851
tel. 02 23950460

I manuali cartacei di SAS sono reperibili presso il responsabile dell’installazione per il Dipartimento BAU.

46
Appendice 1: output completo dell’analisi

______________________________________________________________________________________
PROGRAMMA UNO
_______________________________________________________________________________________

Dati Proechimys 11:56 Saturday, February 5, 2005 1

Oss spe loc cat sex TL NL FL BZW CW MLOW CBL

1 1 101 39 1 61.9 22.8 19.0 27.7 12.7 21.5 51.4


2 1 101 41 1 52.1 18.3 16.5 25.8 11.9 20.9 43.3
3 1 101 46 1 55.8 19.2 18.3 26.7 12.3 21.7 40.9
4 1 101 48 1 57.0 20.6 18.2 28.7 13.0 22.4 48.3
5 1 101 54 1 50.2 15.8 17.8 25.1 12.2 20.8 43.2
6 1 101 42 0 54.4 18.8 17.8 26.6 12.0 21.4 46.3
7 1 101 43 0 55.1 19.8 17.2 26.6 13.6 21.7 45.6
8 1 101 44 0 52.0 18.6 16.4 25.5 11.9 20.9 43.4
9 1 101 45 0 56.3 20.4 18.2 25.6 12.4 20.9 47.5
10 1 101 49 0 53.7 19.1 17.2 25.8 12.7 20.4 44.6
11 1 101 52 0 55.0 19.2 18.0 25.9 12.0 21.0 46.6
12 1 101 369 0 50.1 17.1 16.7 24.2 12.3 20.2 41.8
13 1 101 667 0 51.9 18.1 16.2 26.1 12.2 20.9 43.3
14 1 101 485 0 54.5 19.5 17.8 26.9 12.6 21.4 45.2
15 1 101 54 1 50.2 16.1 17.5 25.0 11.8 20.4 41.9
16 1 101 904 0 56.9 21.0 16.9 26.7 12.7 22.0 43.7
17 1 101 905 1 51.0 15.9 18.3 24.3 11.8 20.5 42.9
18 1 101 764 1 51.2 18.0 16.5 25.9 10.9 21.5 42.8
19 1 101 1153 1 53.5 18.3 17.9 25.2 12.5 20.7 40.7
20 1 101 1172 1 57.9 21.0 18.0 26.3 12.6 21.2 46.0
21 1 101 240 1 51.7 18.1 17.7 24.8 12.0 20.4 42.6
22 1 101 1826 0 52.5 17.7 17.3 25.4 11.6 20.6 43.4
23 1 101 1821 0 53.1 19.2 17.8 25.9 11.9 20.2 43.6

Oss BL IZL PL PLL IML IFL UAL FMW IFW CH

1 44.2 38.0 8.7 20.7 26.2 8.0 9.8 10.8 3.7 13.5
2 36.6 22.6 8.6 16.7 22.9 5.4 9.2 9.0 3.2 12.8
3 38.8 33.9 9.2 18.6 24.0 6.4 9.5 9.2 2.9 13.0
4 42.0 35.5 8.8 19.0 24.2 6.7 8.7 9.6 3.1 13.6
5 36.5 22.3 7.9 16.7 22.5 6.0 9.0 8.6 2.9 12.5
6 39.7 34.6 7.7 18.2 22.8 7.1 8.7 9.6 3.5 13.0
7 39.0 33.8 8.4 18.2 23.6 6.5 9.0 9.1 3.5 13.8
8 36.8 32.6 8.2 17.1 22.8 5.6 9.1 9.0 3.1 12.8
9 40.2 35.8 8.8 18.3 24.6 6.1 9.1 9.9 3.7 13.1
10 38.1 33.3 8.8 17.9 23.2 6.0 9.0 9.5 3.4 12.6
11 39.0 34.4 9.3 18.4 23.8 6.2 8.9 8.8 3.0 12.9
12 35.4 31.2 8.0 16.7 21.9 5.7 8.6 8.8 3.0 12.5
13 36.8 31.9 8.2 17.1 22.6 6.0 9.5 9.7 3.0 13.1
14 40.0 34.3 84.0 18.5 24.1 6.7 9.9 8.8 3.6 12.8
15 35.9 30.8 8.1 18.5 22.3 6.3 9.0 8.3 2.7 13.5
16 39.6 34.5 9.5 19.7 24.0 5.2 9.3 9.7 3.3 14.3
17 36.9 31.1 7.6 17.0 21.9 5.8 9.5 8.0 3.2 12.7

…………………………………………………… non è riportata l’intera tabella

47
______________________________________________________________________________________
PROGRAMMA DUE
_______________________________________________________________________________________

Tabelle Proechimys 11:56 Saturday, February 5, 2005 9

„ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ†
‚ specie ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ barinens ‚ canicoll ‚ falcon ‚ llanos ‚ miranda ‚ oriente ‚ poliopus ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ N ‚ N ‚ N ‚ N ‚ N ‚ N ‚ N ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ 57.00‚ 17.00‚ 21.00‚ 24.00‚ 43.00‚ 18.00‚ 39.00‚
Šƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒŒ

„ƒƒƒƒƒƒƒƒƒƒƒƒ†
‚ specie ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ trinitat ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ N ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ 19.00‚
ŠƒƒƒƒƒƒƒƒƒƒƒƒŒ

Tabelle Proechimys 11:56 Saturday, February 5, 2005 11

„ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ†
‚ specie ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ barinens ‚ canicoll ‚ falcon ‚ llanos ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ local ‚ local ‚ local ‚ local ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ LA ‚ La_Nuli ‚ Las_Mat ‚ Rio_Cac ‚ La_Tril ‚ 406 ‚ Palmero ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ N ‚ N ‚ N ‚ N ‚ N ‚ N ‚ N ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ 16.00‚ 16.00‚ 25.00‚ 17.00‚ 21.00‚ 13.00‚ 11.00‚
Šƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒŒ

Tabelle Proechimys 11:56 Saturday, February 5, 2005 12

„ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ†
‚ specie ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ miranda ‚ oriente ‚ poliopus ‚ trinitat ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ local ‚ local ‚ local ‚ local ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒ…ƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ El_Limo ‚ Turiamo ‚ C_Agua ‚ Kasmera ‚ Guachar ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ N ‚ N ‚ N ‚ N ‚ N ‚
‡ƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒ‰
‚ 20.00‚ 23.00‚ 18.00‚ 39.00‚ 19.00‚
Šƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒ‹ƒƒƒƒƒƒƒƒƒƒƒƒŒ

48
______________________________________________________________________________________
PROGRAMMA TRE
_______________________________________________________________________________________

49
______________________________________________________________________________________
PROGRAMMA QUATTRO
_______________________________________________________________________________________

11:56 Saturday, February 5, 2005 20

La procedura UNIVARIATE
Variabile: TL

Momenti

N 57 Somma dei pesi 57


Media 56.3105263 Somma delle osservazioni 3209.7
Deviazione Std 3.536124 Varianza 12.5041729
Skewness -0.0879683 Kurtosis -0.6276023
SS non corretta 181440.13 SS corretta 700.233684
Coeff di var 6.27968558 Errore std media 0.46837107

Misure statistiche di base

Posizione Variabilità

Media 56.31053 Deviazione Std 3.53612


Mediana 56.50000 Varianza 12.50417
Moda 56.50000 Intervallo 14.00000
Intervallo interquartile 5.00000

Test di locazione: Mu0=0

Test -Statistica- -----Valore p-----

T di Student t 120.2263 Pr > |t| <.0001


dei segni M 28.5 Pr >= |M| <.0001
dei segni per ranghi S 826.5 Pr >= |S| <.0001

Test di normalità

Test --Statistica-- -----Valore p-----

Shapiro-Wilk W 0.982597 Pr < W 0.5822


Kolmogorov-Smirnov D 0.084254 Pr > D >0.1500
Cramer-von Mises W-Sq 0.03781 Pr > W-Sq >0.2500
Anderson-Darling A-Sq 0.234795 Pr > A-Sq >0.2500

Quantili (Definizione 5)

Quantile Stima

100% Max 63.3


99% 63.3
95% 62.5
90% 60.7

Variabile: TL

Quantili (Definizione 5)

Quantile Stima

75% Q3 58.7
50% Mediana 56.5
25% Q1 53.7
10% 51.2
5% 50.0
1% 49.3
0% Min 49.3

Osservazioni estreme

---Inferiori--- ---Superiori---

Valore Oss Valore Oss

49.3 48 60.8 24
49.4 33 62.2 37
50.0 32 62.5 25
50.4 43 63.2 2
51.0 53 63.3 8

50
Stem Foglia # Boxplot
63 23 2 |
62 25 2 |
61 |
60 0678 4 |
59 15577 5 |
58 01246678 8 +-----+
57 899 3 | |
56 003555699 9 *--+--*
55 1277 4 | |
54 0367 4 | |
53 011478 6 +-----+
52 245 3 |
51 029 3 |
50 04 2 |
49 34 2 |
----+----+----+----+

Variabile: TL

Grafico di probabilità normale


63.5+ *++ *
| * *+
| +++
| ****
| *+*
| ****
| **+
56.5+ ****
| **++
| ***
| ****
| +**
| +***
| *+*
49.5+ * +*+
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2

Variabile: CH

Momenti

N 57 Somma dei pesi 57


Media 13.9298246 Somma delle osservazioni 794
Deviazione Std 0.56819417 Varianza 0.32284461
Skewness 0.30748912 Kurtosis -0.5453587
SS non corretta 11078.36 SS corretta 18.0792982
Coeff di var 4.07897576 Errore std media 0.07525916

Misure statistiche di base

Posizione Variabilità

Media 13.92982 Deviazione Std 0.56819


Mediana 13.90000 Varianza 0.32284
Moda 13.30000 Intervallo 2.40000
Intervallo interquartile 0.80000

Test di locazione: Mu0=0

Test -Statistica- -----Valore p-----

T di Student t 185.0914 Pr > |t| <.0001


dei segni M 28.5 Pr >= |M| <.0001
dei segni per ranghi S 826.5 Pr >= |S| <.0001

51
Test di normalità

Test --Statistica-- -----Valore p-----

Shapiro-Wilk W 0.977412 Pr < W 0.3620


Kolmogorov-Smirnov D 0.07388 Pr > D >0.1500
Cramer-von Mises W-Sq 0.057955 Pr > W-Sq >0.2500
Anderson-Darling A-Sq 0.390898 Pr > A-Sq >0.2500

Quantili (Definizione 5)

Quantile Stima

100% Max 15.3


99% 15.3
95% 15.0
90% 14.7

Variabile: CH

Quantili (Definizione 5)

Quantile Stima

75% Q3 14.3
50% Mediana 13.9
25% Q1 13.5
10% 13.3
5% 13.1
1% 12.9
0% Min 12.9

Osservazioni estreme

---Inferiori--- ---Superiori---

Valore Oss Valore Oss

12.9 41 14.8 25
12.9 40 14.8 31
13.1 33 15.0 1
13.1 16 15.0 26
13.2 39 15.3 49

La procedura UNIVARIATE
Variabile: CH

Stem Foglia # Boxplot


153 0 1 |
152 |
151 |
150 00 2 |
149 |
148 00 2 |
147 00 2 |
146 0000 4 |
145 0 1 |
144 0 1 |
143 000 3 +-----+
142 00 2 | |
141 0000 4 | |
140 00000 5 | |
139 000 3 *--+--*
138 0000 4 | |
137 000 3 | |
136 000 3 | |
135 00000 5 +-----+
134 0 1 |
133 000000 6 |
132 0 1 |
131 00 2 |
130 |
129
00 2 |
----+----+----+----+
Moltiplica Stem.Leaf per 10**-1

52
Variabile: CH

Grafico di probabilità normale


15.35+ * +
| ++
| ++
| * *+
| +
| **++
| **++
| ***++
| * +
| *++
| **+
| **
14.15+ ***
| ***
| *+
| **
| **
| **
| ***
| +*
| *****
| * +
| * *++
| ++
12.95+ * *++
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2

53
______________________________________________________________________________________
PROGRAMMA CINQUE
_______________________________________________________________________________________

11:56 Saturday, February 5, 2005 27

Oss spe loc cat sex specie local LnTL LnNL LnFL LnBZW LnCW LnMLOW LnCBL

1 7 507 179 1 barinens LA 4.05872 3.09104 2.85071 3.31782 2.60269 3.11352 3.85862
2 7 507 182 1 barinens LA 4.14630 3.20275 2.94969 3.34990 2.60269 3.10906 3.97968
3 7 507 186 1 barinens LA 4.07073 3.06339 2.81541 3.33577 2.54945 3.14415 3.89589
4 7 507 187 1 barinens LA 4.09434 3.11795 2.91777 3.34990 2.54160 3.14415 3.93183
5 7 507 188 1 barinens LA 4.07923 3.10906 2.86220 3.37417 2.51770 3.15274 3.92790
6 7 507 190 1 barinens LA 4.06044 3.03495 2.91235 3.29584 2.45101 3.07269 3.88362
7 7 507 193 1 barinens LA 4.08598 3.08649 2.86790 3.29584 2.47654 3.13549 3.89589
8 7 507 196 1 barinens LA 4.14789 3.23868 2.93916 3.35690 2.61007 3.19048 3.98155
9 7 507 197 1 barinens LA 4.03601 3.02529 2.88480 3.29953 2.47654 3.10009 3.87120
10 7 507 178 0 barinens LA 4.02535 2.97041 2.86220 3.28091 2.50960 3.10906 3.83298
11 7 507 180 0 barinens LA 3.97781 2.97553 2.85071 3.26576 2.45101 3.03495 3.82428
12 7 507 181 0 barinens LA 4.08933 3.04452 2.93386 3.36730 2.48491 3.15700 3.90801
13 7 507 183 0 barinens LA 4.08598 3.10459 2.94444 3.28466 2.50144 3.06339 3.91999
14 7 507 189 0 barinens LA 4.10594 3.15274 2.90142 3.34990 2.52573 3.09558 3.93964
15 7 507 202 0 barinens LA 4.07073 3.06339 2.85647 3.28840 2.53370 3.07269 3.88362
16 7 507 203 0 barinens LA 4.01096 3.00072 2.85071 3.23868 2.40695 3.05871 3.82864
17 12 408 15352 0 barinens La_Nuli 3.98341 2.99072 2.84491 3.28466 2.49321 3.07731 3.81331
18 12 408 15358 1 barinens La_Nuli 3.98898 2.90690 2.79728 3.25037 2.49321 3.10009 3.80888
19 12 408 15351 0 barinens La_Nuli 4.02535 3.04452 2.85647 3.28840 2.45101 3.05400 3.87743
20 12 408 15350 1 barinens La_Nuli 3.96081 2.88480 2.82731 3.25810 2.44235 3.05400 3.80221
21 12 408 15349 1 barinens La_Nuli 4.03424 3.05871 2.85071 3.26194 2.38876 3.05871 3.85015
22 12 408 15348 0 barinens La_Nuli 4.04130 3.01062 2.82731 3.30689 2.43361 3.13114 3.85015

Oss LnBL LnIZL LnPL LnPLL LnIML LnIFL LnUAL LnFMW LnIFW LnCH

1 3.67630 3.57235 2.23001 2.99573 3.21888 1.94591 2.28238 2.29253 1.09861 2.70805
2 3.81551 3.67630 2.29253 3.10459 3.30689 2.01490 2.30259 2.37955 1.22378 2.60269
3 3.72086 3.58074 2.20827 2.96527 3.19867 1.84055 2.23001 2.28238 1.22378 2.68102
4 3.75887 3.62167 2.27213 3.03495 3.28091 1.96009 2.28238 2.40695 1.25276 2.68785
5 3.74005 3.60550 2.17475 3.00072 3.23080 1.97408 2.26176 2.42480 1.36098 2.68785
6 3.72328 3.57515 2.16332 2.99072 3.23080 1.93152 2.25129 2.33214 0.95551 2.58776
7 3.73767 3.58352 2.18605 3.00072 3.23475 1.94591 2.26176 2.30259 1.06471 2.64617
8 3.80666 3.66356 2.20827 3.08191 3.28840 2.04122 2.25129 2.36085 1.22378 2.60269
9 3.69387 3.56671 2.10413 2.93916 3.21084 1.94591 2.24071 2.23001 1.25276 2.63906
10 3.66099 3.54385 2.07944 2.91777 3.18635 1.90211 2.21920 2.21920 0.95551 2.65324
11 3.63495 3.52342 2.12823 2.93386 3.17388 1.90211 2.19722 2.27213 1.13140 2.58776
12 3.72328 3.59457 2.21920 3.00072 3.23868 1.88707 2.27213 2.42480 1.28093 2.61007
13 3.74242 3.61899 2.21920 2.99573 3.23475 1.88707 2.34181 2.39790 1.19392 2.58776
14 3.77506 3.64545 2.10413 3.05400 3.28091 2.10413 2.29253 2.48491 1.38629 2.58776
15 3.72086 3.59457 2.24071 3.02042 3.23475 1.91692 2.28238 2.37024 1.28093 2.60269
16 3.64284 3.54096 2.23001 2.93916 3.17805 1.82455 2.28238 2.23001 0.95551 2.57261
17 3.65325 3.51750 2.23001 2.91235 3.13549 1.80829 2.21920 2.15176 0.95551 2.64617
18 3.63495 3.50856 2.24071 2.92316 3.16969 1.82455 2.27213 2.11626 0.99325 2.66026
19 3.71113 3.57795 2.18605 2.97553 3.19458 1.93152 2.26176 2.16332 0.99325 2.60269
20 3.63759 3.50255 2.14007 2.90690 3.15700 1.87180 2.28238 2.16332 1.09861 2.60269
21 3.72328 3.55249 2.10413 2.96011 3.19458 1.97408 2.21920 2.18605 0.99325 2.63189
22 3.69138 3.54096 2.20827 2.97553 3.19458 1.94591 2.23001 2.30259 1.19392 2.62467

……………………………. Viene omessa la parte dell’output con le restanti osservazioni

Variabile: LnTL

Momenti

N 57 Somma dei pesi 57


Media 4.02892864 Somma delle osservazioni 229.648932
Deviazione Std 0.06319525 Varianza 0.00399364
Skewness -0.2138307 Kurtosis -0.6065856
SS non corretta 925.462804 SS corretta 0.22364381
Coeff di var 1.5685373 Errore std media 0.00837042

Misure statistiche di base

Posizione Variabilità

Media 4.028929 Deviazione Std 0.06320


Mediana 4.034241 Varianza 0.00399
Moda 4.034241 Intervallo 0.24996
Intervallo interquartile 0.08903

54
Test di locazione: Mu0=0

Test -Statistica- -----Valore p-----

T di Student t 481.3296 Pr > |t| <.0001


dei segni M 28.5 Pr >= |M| <.0001
dei segni per ranghi S 826.5 Pr >= |S| <.0001

Test di normalità

Test --Statistica-- -----Valore p-----

Shapiro-Wilk W 0.97982 Pr < W 0.4559


Kolmogorov-Smirnov D 0.09254 Pr > D >0.1500
Cramer-von Mises W-Sq 0.049749 Pr > W-Sq >0.2500
Anderson-Darling A-Sq 0.298 Pr > A-Sq >0.2500

Quantili (Definizione 5)

Quantile Stima

100% Max 4.14789


99% 4.14789
95% 4.13517
90% 4.10594

Variabile: LnTL

Quantili (Definizione 5)

Quantile Stima

75% Q3 4.07244
50% Mediana 4.03424
25% Q1 3.98341
10% 3.93574
5% 3.91202
1% 3.89792
0% Min 3.89792

Osservazioni estreme
----Inferiori---- ----Superiori----

Valore Oss Valore Oss

3.89792 48 4.10759 24
3.89995 33 4.13035 37
3.91202 32 4.13517 25
3.91999 43 4.14630 2
3.93183 53 4.14789 8

La procedura UNIVARIATE
Variabile: LnTL

Stem Foglia # Boxplot


414 68 2 |
413 05 2 |
412 |
411 |
410
468 3 |
409
4 1 |
408
6699 4 |
407
11249 5 +-----+
406
0247 4 | |
405
799 3 | |
404
11 2 | |
403
14446 5 *-----*
402
0055 4 | + |
401
1 1 | |
400
029 3 | |
399
5 1 | |
398
359 3 +-----+
397
0228 4 |
396
1 1 |
395
59 2 |
394
9 1 |
393
26 2 |
392
0 1 |
391
2 1 |
390
0 1 |
389
8 1 |
----+----+----+----+
Moltiplica Stem.Leaf per 10**-2

55
Variabile: LnTL

Grafico di probabilità normale


4.145+ +* *
| *+*
| +
| ++
| ***
4.095+ +*
| ***
| ***
| **+
| **+
4.045+ **+
| ***
| **+
| *+
| **+
3.995+ +*
| **
| ***
| *
| +**
3.945+ ++*
| +**
| ++
| +* *
| ++
3.895+ * + *
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2

Variabile: LnCH

Momenti

N 57 Somma dei pesi 57


Media 2.63321991 Somma delle osservazioni 150.093535
Deviazione Std 0.04060588 Varianza 0.00164884
Skewness 0.22679638 Kurtosis -0.6019737
SS non corretta 395.32162 SS corretta 0.09233488
Coeff di var 1.54206174 Errore std media 0.00537838

Misure statistiche di base

Posizione Variabilità

Media 2.633220 Deviazione Std 0.04061


Mediana 2.631889 Varianza 0.00165
Moda 2.587764 Intervallo 0.17063
Intervallo interquartile 0.05757

Test di locazione: Mu0=0

Test -Statistica- -----Valore p-----

T di Student t 489.5935 Pr > |t| <.0001


dei segni M 28.5 Pr >= |M| <.0001
dei segni per ranghi S 826.5 Pr >= |S| <.0001

Test di normalità

Test --Statistica-- -----Valore p-----

Shapiro-Wilk W 0.980189 Pr < W 0.4717


Kolmogorov-Smirnov D 0.073426 Pr > D >0.1500
Cramer-von Mises W-Sq 0.049388 Pr > W-Sq >0.2500
Anderson-Darling A-Sq 0.340118 Pr > A-Sq >0.2500

Quantili (Definizione 5)

Quantile Stima

100% Max 2.72785


99% 2.72785
95% 2.70805
90% 2.68785

56
Variabile: LnCH

Quantili (Definizione 5)

Quantile Stima

75% Q3 2.66026
50% Mediana 2.63189
25% Q1 2.60269
10% 2.58776
5% 2.57261
1% 2.55723
0% Min 2.55723

Osservazioni estreme

----Inferiori---- ----Superiori----

Valore Oss Valore Oss

2.55723 41 2.69463 25
2.55723 40 2.69463 31
2.57261 33 2.70805 1
2.57261 16 2.70805 26
2.58022 39 2.72785 49

Stem Foglia # Boxplot


272 8 1 |
271 |
270 88 2 |
269 55 2 |
268 111188 6 |
267 4 1 |
266 0007 4 +-----+
265 33 2 | |
264 6666 4 | |
263 22299999 8 *--+--*
262 5555 4 | |
261 000777 6 | |
260 33333 5 +-----+
259 5 1 |
258 0888888 7 |
257 33 2 |
256 |
25577 2 |
----+----+----+----+
Moltiplica Stem.Leaf per 10**-2

Variabile: LnCH

Grafico di probabilità normale


2.725+ +*
| +++
| *+*
| **+
| ****+
| * ++
| ***+
| **
| +***
| ***
| +**
| ***
| ***
| ++*
| **+**
| * *+
| +++
2.555+ * +*
+----+----+----+----+----+----+----+----+----+----+
-2 -1 0 +1 +2

57
_______________________________________________________________________________________

PROGRAMMA CINQUE A
_______________________________________________________________________________________

commenti della finestra LOG:

………………..

222 proc anova; /* la procedura ANOVA esegue l'analisi della varianza */

223 class specie sex; /* i due fattori sono 'specie' e 'sex' */

224 model LnTL= sex; by specie; /* esegue l'analisi tra i due sessi */
225 /* separatamente tra le due specie */
226 run;

NOTE: Interactivity disabled with BY processing.


WARNING: PROC ANOVA has determined that the number of observations in each cell is not equal.
PROC GLM may be more appropriate

………………

La finestra dell’output:

Analisi della Varianza per sessi 45


11:56 Saturday, February 5, 2005

----------------------------------------- specie=barinens -----------------------------------------

The ANOVA Procedure

Class Level Information

Class Levels Values


specie 1 barinens
sex 2 0 1
Number of observations 57

Analisi della Varianza per sessi 46

----------------------------------------- specie=barinens -----------------------------------------

The ANOVA Procedure


Dependent Variable: LnTL
Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.00456532 0.00456532 1.15 0.2890
Error 55 0.21907849 0.00398325
Corrected Total 56 0.22364381

R-Square Coeff Var Root MSE LnTL Mean


0.020413 1.566495 0.063113 4.028929

Media Valore
Origine DF Anova SS quadratica F Pr > F

sex 1 0.00456532 0.00456532 1.15 0.2890

Analisi della Varianza per sessi 47

----------------------------------------- specie=canicoll -----------------------------------------

The ANOVA Procedure


Class Level Information
Class Levels Values
specie 1 canicoll
sex 2 0 1
Number of observations 17

Analisi della Varianza per sessi 48

The ANOVA Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.00000913 0.00000913 0.00 0.9549
Error 15 0.04139462 0.00275964
Corrected Total 16 0.04140375

58
R-Square Coeff Var Root MSE LnTL Mean
0.000220 1.324687 0.052532 3.965637

Media Valore
Origine DF Anova SS quadratica F Pr > F
sex 1 9.1293491E-6 9.1293491E-6 0.00 0.9549

------------------------------------------ specie=falcon ------------------------------------------

The ANOVA Procedure


Class Level Information
Class Levels Values
specie 1 falcon
sex 2 0 1
Number of observations 21

The ANOVA Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.01914162 0.01914162 6.66 0.0184
Error 19 0.05464394 0.00287600
Corrected Total 20 0.07378556

R-Square Coeff Var Root MSE LnTL Mean


0.259422 1.349934 0.053628 3.972664

Media Valore
Origine DF Anova SS quadratica F Pr > F

sex 1 0.01914162 0.01914162 6.66 0.0184

------------------------------------------ specie=llanos ------------------------------------------

The ANOVA Procedure


Class Level Information

Class Levels Values


specie 1 llanos
sex 2 0 1
Number of observations 24

The ANOVA Procedure


Dependent Variable: LnTL
Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.02297850 0.02297850 8.60 0.0077
Error 22 0.05881392 0.00267336
Corrected Total 23 0.08179242

R-Square Coeff Var Root MSE LnTL Mean


0.280937 1.287255 0.051705 4.016652

Media Valore
Origine DF Anova SS quadratica F Pr > F
sex 1 0.02297850 0.02297850 8.60 0.0077

----------------------------------------- specie=miranda ------------------------------------------

The ANOVA Procedure


Class Level Information
Class Levels Values
specie 1 miranda
sex 2 0 1

Number of observations 43

The ANOVA Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.03046085 0.03046085 6.83 0.0125
Error 41 0.18287708 0.00446042
Corrected Total 42 0.21333793

59
R-Square Coeff Var Root MSE LnTL Mean
0.142782 1.674918 0.066786 3.987440

Media Valore
Origine DF Anova SS quadratica F Pr > F
sex 1 0.03046085 0.03046085 6.83 0.0125

Analisi della Varianza per sessi 55

----------------------------------------- specie=oriente ------------------------------------------

The ANOVA Procedure


Class Level Information
Class Levels Values
specie 1 oriente
sex 2 0 1

Number of observations 18

The ANOVA Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.02653291 0.02653291 6.60 0.0206
Error 16 0.06434658 0.00402166
Corrected Total 17 0.09087949

R-Square Coeff Var Root MSE LnTL Mean


0.291957 1.585937 0.063417 3.998681

Media Valore
Origine DF Anova SS quadratica F Pr > F
sex 1 0.02653291 0.02653291 6.60 0.0206

Analisi della Varianza per sessi 57

----------------------------------------- specie=poliopus -----------------------------------------

The ANOVA Procedure


Class Level Information

Class Levels Values


specie 1 poliopus
sex 2 0 1

Number of observations 39

The ANOVA Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.00277995 0.00277995 1.13 0.2956
Error 37 0.09139595 0.00247016
Corrected Total 38 0.09417590

R-Square Coeff Var Root MSE LnTL Mean


0.029519 1.246168 0.049701 3.988283

Media Valore
Origine DF Anova SS quadratica F Pr > F
sex 1 0.00277995 0.00277995 1.13 0.2956

60
Analisi della Varianza per sessi 59

----------------------------------------- specie=trinitat -----------------------------------------

The ANOVA Procedure

Class Level Information


Class Levels Values
specie 1 trinitat
sex 2 0 1

Number of observations 19

The ANOVA Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.00957717 0.00957717 5.09 0.0376
Error 17 0.03201700 0.00188335
Corrected Total 18 0.04159417

R-Square Coeff Var Root MSE LnTL Mean


0.230253 1.093336 0.043398 3.969285

Media Valore
Origine DF Anova SS quadratica F Pr > F

sex 1 0.00957717 0.00957717 5.09 0.0376

61
_______________________________________________________________________________________

PROGRAMMA CINQUE B
_______________________________________________________________________________________

Analisi della Varianza per sessi 61


11:56 Saturday, February 5, 2005

----------------------------------------- specie=barinens -----------------------------------------

The GLM Procedure

Class Level Information


Class Levels Values
specie 1 barinens
sex 2 0 1

Number of observations 57

The GLM Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.00456532 0.00456532 1.15 0.2890
Error 55 0.21907849 0.00398325
Corrected Total 56 0.22364381

R-Square Coeff Var Root MSE LnTL Mean


0.020413 1.566495 0.063113 4.028929

Media Valore
Origine DF Type I SS quadratica F Pr > F
sex 1 0.00456532 0.00456532 1.15 0.2890

Media Valore
Origine DF Type III SS quadratica F Pr > F
sex 1 0.00456532 0.00456532 1.15 0.2890

Analisi della Varianza per sessi 63

----------------------------------------- specie=canicoll -----------------------------------------

The GLM Procedure


Class Level Information
Class Levels Values
specie 1 canicoll
sex 2 0 1
Number of observations 17

The GLM Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.00000913 0.00000913 0.00 0.9549
Error 15 0.04139462 0.00275964
Corrected Total 16 0.04140375

R-Square Coeff Var Root MSE LnTL Mean


0.000220 1.324687 0.052532 3.965637

Media Valore
Origine DF Type I SS quadratica F Pr > F
sex 1 9.1293491E-6 9.1293491E-6 0.00 0.9549

Media Valore
Origine DF Type III SS quadratica F Pr > F
sex 1 9.1293491E-6 9.1293491E-6 0.00 0.9549

62
Analisi della Varianza per sessi 65

------------------------------------------ specie=falcon ------------------------------------------

The GLM Procedure

Class Level Information


Class Levels Values
specie 1 falcon
sex 2 0 1
Number of observations 21

The GLM Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 1 0.01914162 0.01914162 6.66 0.0184
Error 19 0.05464394 0.00287600
Corrected Total 20 0.07378556

R-Square Coeff Var Root MSE LnTL Mean


0.259422 1.349934 0.053628 3.972664

Media Valore
Origine DF Type I SS quadratica F Pr > F
sex 1 0.01914162 0.01914162 6.66 0.0184

Media Valore
Origine DF Type III SS quadratica F Pr > F
sex 1 0.01914162 0.01914162 6.66 0.0184

Analisi della Varianza per sessi 67

------------------------------------------ specie=llanos ------------------------------------------

The GLM Procedure

Class Level Information

Class Levels Values


specie 1 llanos
sex 2 0 1
Number of observations 24

The GLM Procedure

Dependent Variable: LnTL

Somma dei Media Valore


Origine DF quadrati quadratica F Pr > F
Model 1 0.02297850 0.02297850 8.60 0.0077
Error 22 0.05881392 0.00267336
Corrected Total 23 0.08179242

R-Square Coeff Var Root MSE LnTL Mean


0.280937 1.287255 0.051705 4.016652

Media Valore
Origine DF Type I SS quadratica F Pr > F
sex 1 0.02297850 0.02297850 8.60 0.0077

Media Valore
Origine DF Type III SS quadratica F Pr > F
sex 1 0.02297850 0.02297850 8.60 0.0077

63
Analisi della Varianza per sessi 69

----------------------------------------- specie=miranda ------------------------------------------

The GLM Procedure


Class Level Information
Class Levels Values
specie 1 miranda
sex 2 0 1

Number of observations 43
The GLM Procedure

Dependent Variable: LnTL

Somma dei Media Valore


Origine DF quadrati quadratica F Pr > F
Model 1 0.03046085 0.03046085 6.83 0.0125
Error 41 0.18287708 0.00446042
Corrected Total 42 0.21333793

R-Square Coeff Var Root MSE LnTL Mean


0.142782 1.674918 0.066786 3.987440

Media Valore
Origine DF Type I SS quadratica F Pr > F
sex 1 0.03046085 0.03046085 6.83 0.0125

Media Valore
Origine DF Type III SS quadratica F Pr > F
sex 1 0.03046085 0.03046085 6.83 0.0125

Analisi della Varianza per sessi 71

----------------------------------------- specie=oriente ------------------------------------------

The GLM Procedure

Class Level Information

Class Levels Values


specie 1 oriente
sex 2 0 1

Number of observations 18

The GLM Procedure

Dependent Variable: LnTL

Somma dei Media Valore


Origine DF quadrati quadratica F Pr > F
Model 1 0.02653291 0.02653291 6.60 0.0206
Error 16 0.06434658 0.00402166
Corrected Total 17 0.09087949

R-Square Coeff Var Root MSE LnTL Mean


0.291957 1.585937 0.063417 3.998681

Media Valore
Origine DF Type I SS quadratica F Pr > F
sex 1 0.02653291 0.02653291 6.60 0.0206

Media Valore
Origine DF Type III SS quadratica F Pr > F
sex 1 0.02653291 0.02653291 6.60 0.0206

64
Analisi della Varianza per sessi 73

----------------------------------------- specie=poliopus -----------------------------------------

The GLM Procedure

Class Level Information

Class Levels Values


specie 1 poliopus
sex 2 0 1

Number of observations 39

The GLM Procedure

Dependent Variable: LnTL

Somma dei Media Valore


Origine DF quadrati quadratica F Pr > F
Model 1 0.00277995 0.00277995 1.13 0.2956
Error 37 0.09139595 0.00247016
Corrected Total 38 0.09417590

R-Square Coeff Var Root MSE LnTL Mean


0.029519 1.246168 0.049701 3.988283

Media Valore
Origine DF Type I SS quadratica F Pr > F
sex 1 0.00277995 0.00277995 1.13 0.2956

Media Valore
Origine DF Type III SS quadratica F Pr > F
sex 1 0.00277995 0.00277995 1.13 0.2956

Analisi della Varianza per sessi 75

----------------------------------------- specie=trinitat -----------------------------------------

The GLM Procedure

Class Level Information

Class Levels Values


specie 1 trinitat
sex 2 0 1

Number of observations 19

The GLM Procedure

Dependent Variable: LnTL

Somma dei Media Valore


Origine DF quadrati quadratica F Pr > F
Model 1 0.00957717 0.00957717 5.09 0.0376
Error 17 0.03201700 0.00188335
Corrected Total 18 0.04159417

R-Square Coeff Var Root MSE LnTL Mean


0.230253 1.093336 0.043398 3.969285

Media Valore
Origine DF Type I SS quadratica F Pr > F
sex 1 0.00957717 0.00957717 5.09 0.0376

Media Valore
Origine DF Type III SS quadratica F Pr > F
sex 1 0.00957717 0.00957717 5.09 0.0376

65
_______________________________________________________________________________________

PROGRAMMA CINQUE B 1
_______________________________________________________________________________________

Analisi della Varianza per sessi 81


11:56 Saturday, February 5, 2005

The GLM Procedure

Class Level Information

Class Levels Values


specie 8 barinens canicoll falcon llanos miranda oriente poliopus trinitat

Number of observations 238

The GLM Procedure

Dependent Variable: LnTL


Somma dei Media Valore
Origine DF quadrati quadratica F Pr > F
Model 7 0.11807435 0.01686776 4.51 <.0001
Error 230 0.86061303 0.00374180
Corrected Total 237 0.97868738

R-Square Coeff Var Root MSE LnTL Mean


0.120646 1.530403 0.061170 3.997000

Media Valore
Origine DF Type I SS quadratica F Pr > F
specie 7 0.11807435 0.01686776 4.51 <.0001

Media Valore
Origine DF Type III SS quadratica F Pr > F
specie 7 0.11807435 0.01686776 4.51 <.0001

Tukey's Studentized Range (HSD) Test for LnTL

NOTE: This test controls the Type I experimentwise error rate.

Alpha 0.05
Error Degrees of Freedom 230
Error Mean Square 0.003742
Critical Value of Studentized Range 4.32616

Comparisons significant at the 0.05 level are indicated by ***.

Difference
specie Between Simultaneous 95%
Comparison Means Confidence Limits

barinens - llanos 0.01228 -0.03326 0.05781


barinens - oriente 0.03025 -0.02034 0.08084
barinens - poliopus 0.04065 0.00176 0.07953 ***
barinens - miranda 0.04149 0.00369 0.07929 ***
barinens - falcon 0.05627 0.00850 0.10403 ***
barinens - trinitat 0.05964 0.01007 0.10921 ***
barinens - canicoll 0.06329 0.01158 0.11500 ***
llanos - barinens -0.01228 -0.05781 0.03326
llanos - oriente 0.01797 -0.04038 0.07632
llanos - poliopus 0.02837 -0.02018 0.07692
llanos - miranda 0.02921 -0.01847 0.07689
llanos - falcon 0.04399 -0.01193 0.09990
llanos - trinitat 0.04737 -0.01010 0.10483
llanos - canicoll 0.05101 -0.00830 0.11033
oriente - barinens -0.03025 -0.08084 0.02034
oriente - llanos -0.01797 -0.07632 0.04038
oriente - poliopus 0.01040 -0.04292 0.06372
oriente - miranda 0.01124 -0.04129 0.06377
oriente - falcon 0.02602 -0.03409 0.08612
oriente - trinitat 0.02940 -0.03215 0.09094
oriente - canicoll 0.03304 -0.03024 0.09633
poliopus - barinens -0.04065 -0.07953 -0.00176 ***
poliopus - llanos -0.02837 -0.07692 0.02018
poliopus - oriente -0.01040 -0.06372 0.04292

66
poliopus - miranda 0.00084 -0.04054 0.04222
poliopus - falcon 0.01562 -0.03503 0.06627
poliopus - trinitat 0.01900 -0.03335 0.07135
poliopus - canicoll 0.02265 -0.03174 0.07703
miranda - barinens -0.04149 -0.07929 -0.00369 ***
miranda - llanos -0.02921 -0.07689 0.01847
miranda - oriente -0.01124 -0.06377 0.04129
miranda - poliopus -0.00084 -0.04222 0.04054
miranda - falcon 0.01478 -0.03504 0.06459
miranda - trinitat 0.01816 -0.03339 0.06970
miranda - canicoll 0.02180 -0.03181 0.07541
falcon - barinens -0.05627 -0.10403 -0.00850 ***
falcon - llanos -0.04399 -0.09990 0.01193
falcon - oriente -0.02602 -0.08612 0.03409
falcon - poliopus -0.01562 -0.06627 0.03503
falcon - miranda -0.01478 -0.06459 0.03504
falcon - trinitat 0.00338 -0.05587 0.06263
falcon - canicoll 0.00703 -0.05402 0.06808
trinitat - barinens -0.05964 -0.10921 -0.01007 ***
trinitat - llanos -0.04737 -0.10483 0.01010
trinitat - oriente -0.02940 -0.09094 0.03215
trinitat - poliopus -0.01900 -0.07135 0.03335
trinitat - miranda -0.01816 -0.06970 0.03339
trinitat - falcon -0.00338 -0.06263 0.05587
trinitat - canicoll 0.00365 -0.05882 0.06612
canicoll - barinens -0.06329 -0.11500 -0.01158 ***
canicoll - llanos -0.05101 -0.11033 0.00830
canicoll - oriente -0.03304 -0.09633 0.03024
canicoll - poliopus -0.02265 -0.07703 0.03174
canicoll - miranda -0.02180 -0.07541 0.03181
canicoll - falcon -0.00703 -0.06808 0.05402
canicoll - trinitat -0.00365 -0.06612 0.05882

67
_______________________________________________________________________________________

PROGRAMMA CINQUE D
_______________________________________________________________________________________

MANOVA dimorfismo sessuale, differenze tra specie e interazione degli effetti 85


11:56 Saturday, February 5, 2005

The GLM Procedure

Class Level Information


Class Levels Values
specie 8 barinens canicoll falcon llanos miranda oriente poliopus trinitat
sex 2 0 1

Number of observations 238

The GLM Procedure


Multivariate Analysis of Variance

Characteristic Roots and Vectors of: E Inverse * H, where


H = Type III SSCP Matrix for sex
E = Error SSCP Matrix

Characteristic Characteristic Vector V'EV=1


Root Percent LnTL LnNL LnFL LnBZW LnCW
LnMLOW LnCBL LnBL LnIZL LnPL
LnPLL LnIML LnIFL LnUAL LnFMW
LnIFW LnCH

0.23948621 100.00 -1.38358206 -0.19486403 0.02991286 0.11530302 -0.28011788


-0.42987485 0.39927254 0.01043346 0.55881205 0.55774587
-0.42658813 -0.82907276 0.21033173 0.39088390 0.26601356
0.22009576 0.00480522
0.00000000 0.00 -1.58147946 0.41669883 1.29264540 -0.00049084 0.00119245
0.00182997 -0.00169969 -0.00004441 -0.00237885 -0.00237431

…………………………… OMESSO IL RESTO DELLA MATRICE PERCHE’ NON INTERESSANTE

The GLM Procedure


Multivariate Analysis of Variance

MANOVA Test Criteria and Exact F Statistics for the Hypothesis of No Overall sex Effect
H = Type III SSCP Matrix for sex
E = Error SSCP Matrix

S=1 M=7.5 N=102


Valore
Statistica Valore F Num DF Den DF Pr > F

Wilks' Lambda 0.80678590 2.90 17 206 0.0002


Pillai's Trace 0.19321410 2.90 17 206 0.0002
Hotelling-Lawley Trace 0.23948621 2.90 17 206 0.0002
Roy's Greatest Root 0.23948621 2.90 17 206 0.0002

…………………………… OMESSO IL RESTO DELLA MATRICE PERCHE’ NON INTERESSANTE

MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall specie Effect
H = Type III SSCP Matrix for specie
E = Error SSCP Matrix

S=7 M=4.5 N=102

Valore
Statistica Valore F Num DF Den DF Pr > F

Wilks' Lambda 0.08105340 5.35 119 1353.1 <.0001


Pillai's Trace 1.96535483 4.87 119 1484 <.0001
Hotelling-Lawley Trace 3.34443829 5.75 119 963.7 <.0001
Roy's Greatest Root 1.15050682 14.35 17 212 <.0001

NOTE: F Statistic for Roy's Greatest Root is an upper bound.

…………………………… OMESSO IL RESTO DELLA MATRICE PERCHE’ NON INTERESSANTE

68
The GLM Procedure
Multivariate Analysis of Variance

MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall specie*sex Effect
H = Type III SSCP Matrix for specie*sex
E = Error SSCP Matrix

S=7 M=4.5 N=102

Valore
Statistica Valore F Num DF Den DF Pr > F

Wilks' Lambda 0.52706033 1.17 119 1353.1 0.1061


Pillai's Trace 0.59763912 1.16 119 1484 0.1171
Hotelling-Lawley Trace 0.68843763 1.18 119 963.7 0.0998
Roy's Greatest Root 0.23853919 2.97 17 212 0.0001

NOTE: F Statistic for Roy's Greatest Root is an upper bound.

69
_______________________________________________________________________________________

PROGRAMMA SEI
_______________________________________________________________________________________

Analisi delle componenti principali 98


11:56 Saturday, February 5, 2005

The PRINCOMP Procedure

Observations 238
Variables 17

Simple Statistics

LnTL LnNL LnFL LnBZW LnCW LnMLOW

Mean 3.996999851 2.984925772 2.817472208 3.265952954 2.483025405 3.049442130


StD 0.064261050 0.090841307 0.077135290 0.053918969 0.063772995 0.057309458

LnCBL LnBL LnIZL LnPL LnPLL LnIML

Mean 3.821287799 3.660930552 3.515225926 2.145761696 2.908005223 3.157056986


StD 0.067171996 0.070738603 0.077748299 0.083048912 0.084578147 0.065314048

LnIFL LnUAL LnFMW LnIFW LnCH

Mean 1.861167313 2.220689139 2.246666005 1.170780356 2.630705188


StD 0.132438080 0.071457908 0.103329939 0.105788378 0.133212364

Covariance Matrix

LnTL LnNL LnFL LnBZW LnCW LnMLOW

LnTL 0.0041294826 0.0052325649 0.0034035157 0.0026394663 0.0022012289 0.0022568051


LnNL 0.0052325649 0.0082521431 0.0035655033 0.0035019697 0.0028177848 0.0026401498
LnFL 0.0034035157 0.0035655033 0.0059498530 0.0022429409 0.0021161706 0.0020226619
LnBZW 0.0026394663 0.0035019697 0.0022429409 0.0029072552 0.0019502080 0.0020055031
LnCW 0.0022012289 0.0028177848 0.0021161706 0.0019502080 0.0040669948 0.0018225223
LnMLOW 0.0022568051 0.0026401498 0.0020226619 0.0020055031 0.0018225223 0.0032843740

……………… OMESSA LA RESTANTE PARTE DELLA MATRICE DI COVARIANZA PERCHE’ NON INTERESSANTE

Total Variance 0.1247273064

Eigenvalues of the Covariance Matrix


Autovalore Differenza Proporzione Cumulata
1 0.06354827 0.04546239 0.5095 0.5095
2 0.01808589 0.00655308 0.1450 0.6545
3 0.01153280 0.00294634 0.0925 0.7470
4 0.00858646 0.00427215 0.0688 0.8158
5 0.00431431 0.00052889 0.0346 0.8504
6 0.00378542 0.00015851 0.0303 0.8807
7 0.00362692 0.00081153 0.0291 0.9098
8 0.00281538 0.00046839 0.0226 0.9324
9 0.00234699 0.00055890 0.0188 0.9512
10 0.00178809 0.00060379 0.0143 0.9656
11 0.00118430 0.00019119 0.0095 0.9750
12 0.00099312 0.00014467 0.0080 0.9830
13 0.00084845 0.00026801 0.0068 0.9898
14 0.00058044 0.00030147 0.0047 0.9945
15 0.00027898 0.00003263 0.0022 0.9967
16 0.00024635 0.00008123 0.0020 0.9987
17 0.00016511 0.0013 1.0000

Eigenvectors
Prin1 Prin2 Prin3 Prin4 Prin5 Prin6 Prin7 Prin8 Prin9

LnTL 0.232816 0.004905 0.119860 -.093231 0.116443 0.005886 -.077217 -.100298 0.129843
LnNL 0.313240 0.030385 0.179898 -.034994 0.095054 -.311573 -.106870 -.208531 0.456948
LnFL 0.206746 -.019975 -.012137 -.212139 0.376398 0.580984 -.256576 -.173457 -.459451
LnBZW 0.173775 0.012018 0.085365 0.008728 0.013599 0.099918 -.073605 0.075834 0.190854
LnCW 0.152194 0.028276 0.045077 0.101857 0.116786 0.333436 0.009560 0.703164 0.292932
LnMLOW 0.147368 0.008130 0.062732 0.010887 -.047803 0.307484 -.072532 0.196306 0.294650
LnCBL 0.253590 0.000148 0.080595 -.034611 0.047721 -.004836 -.053537 -.085484 0.039784
LnBL 0.266598 -.001122 0.071961 -.043081 0.131254 -.038431 -.049051 -.088842 0.009319
LnIZL 0.271569 0.020262 0.101683 -.042745 0.125718 -.079670 -.078065 -.258049 0.176990
LnPL 0.186518 -.092993 0.484214 -.119785 0.013359 -.344474 0.198912 0.429962 -.403135
LnPLL 0.299754 0.003205 0.102637 -.160937 0.012927 -.186153 0.044148 0.054061 -.289887
LnIML 0.242805 -.034261 0.021392 -.056892 0.078059 0.074447 0.186726 -.080226 0.041703
LnIFL 0.388593 0.017369 -.740443 -.353678 -.246069 -.178439 -.021144 0.200883 -.047079

70
LnUAL 0.162523 -.096173 -.043168 0.028951 -.040037 0.265599 0.878087 -.208285 0.058479
LnFMW 0.312764 -.006408 0.190858 0.346672 -.768072 0.219002 -.185717 -.127869 -.167235
LnIFW 0.248770 0.063491 -.286098 0.797931 0.353792 -.179130 0.009041 0.039038 -.189333
LnCH 0.000438 0.986801 0.063265 -.057815 -.024839 0.022314 0.110503 -.003690 -.058768

Prin10 Prin11 Prin12 Prin13 Prin14 Prin15 Prin16 Prin17

LnTL -.079810 0.180387 -.046749 -.023943 -.202495 0.861079 0.228174 -.006860


LnNL -.383824 0.423136 -.089442 -.108574 0.261445 -.274868 -.086534 0.001153
LnFL -.176023 0.178964 0.095582 -.045075 0.199336 -.098111 -.040021 0.018240
LnBZW 0.205626 -.150527 -.045627 0.759669 0.497226 0.078579 0.076455 -.034040
LnCW -.407016 -.256925 -.065516 -.117937 -.077216 -.011763 -.049504 0.006781
LnMLOW 0.717439 0.364993 -.017793 -.301183 0.014132 -.075990 -.041935 0.003988
LnCBL 0.065654 -.056653 0.033773 0.259026 -.445299 -.127937 -.205394 0.762457
LnBL 0.090684 -.092359 -.004999 0.209101 -.436510 -.057795 -.516309 -.609788
LnIZL 0.150653 -.637533 0.428144 -.366179 0.194368 0.021101 0.048396 0.020150
LnPL 0.059396 0.190284 0.393840 0.019353 0.080180 0.000747 0.017516 -.001775
LnPLL 0.139480 -.252024 -.775046 -.205879 0.143004 -.003706 -.013477 0.057248
LnIML 0.017551 -.015720 -.032001 0.119040 -.349141 -.362799 0.759008 -.190090
LnIFL -.015979 0.075879 0.173767 0.010541 0.050413 0.030253 -.012682 -.002433
LnUAL -.059928 0.043492 0.010938 -.021047 0.130804 0.084150 -.198846 0.043289
LnFMW -.153040 -.009325 0.030712 -.033612 -.006938 0.005034 0.014648 -.054367
LnIFW 0.082859 0.089550 0.015559 -.015002 0.048596 0.037876 0.033839 0.023101
LnCH 0.002768 0.024165 0.034426 0.012012 -.007730 -.005525 0.006811 -.005197

71
_______________________________________________________________________________________

PROGRAMMA SEI A
_______________________________________________________________________________________

Analisi delle componenti principali 102


11:56 Saturday, February 5, 2005

The PRINCOMP Procedure

Observations 238
Variables 17

Simple Statistics

LnTL LnNL LnFL LnBZW LnCW LnMLOW

Mean 3.996999851 2.984925772 2.817472208 3.265952954 2.483025405 3.049442130


StD 0.064261050 0.090841307 0.077135290 0.053918969 0.063772995 0.057309458

……………… OMESSA LA RESTANTE PARTE DELL’OUTPUT PERCHE’ UGUALE AL PRECEDENTE

72
_______________________________________________________________________________________

PROGRAMMA SEI B
_______________________________________________________________________________________

73
_______________________________________________________________________________________

PROGRAMMA SETTE
_______________________________________________________________________________________

analisi delle variate canoniche 117


11:56 Saturday, February 5, 2005

The CANDISC Procedure

Observations 238 DF Total 237


Variables 17 DF Within Classes 230
Classes 8 DF Between Classes 7

Class Level Information


Variable
specie Name Frequency Weight Proportion

barinens barinens 57 57.0000 0.239496


canicoll canicoll 17 17.0000 0.071429
falcon falcon 21 21.0000 0.088235
llanos llanos 24 24.0000 0.100840
miranda miranda 43 43.0000 0.180672
oriente oriente 18 18.0000 0.075630
poliopus poliopus 39 39.0000 0.163866
trinitat trinitat 19 19.0000 0.079832

Pairwise Squared Distances Between Groups

2 _ _ -1 _ _
D (i|j) = (X - X )' COV (X - X )
i j i j

Squared Distance to specie

From
specie barinens canicoll falcon llanos miranda oriente poliopus trinitat

barinens 0 13.04782 6.73884 5.01657 4.79069 5.72273 8.11145 15.02271


canicoll 13.04782 0 6.14420 10.77361 7.27901 6.44208 10.40421 13.41962
falcon 6.73884 6.14420 0 3.71163 5.09133 5.52180 7.39495 16.04493
llanos 5.01657 10.77361 3.71163 0 3.79304 6.41422 7.45133 19.36620
miranda 4.79069 7.27901 5.09133 3.79304 0 2.63458 3.79180 10.99300
oriente 5.72273 6.44208 5.52180 6.41422 2.63458 0 3.65065 10.11593
poliopus 8.11145 10.40421 7.39495 7.45133 3.79180 3.65065 0 14.88561
trinitat 15.02271 13.41962 16.04493 19.36620 10.99300 10.11593 14.88561 0

F Statistics, NDF=17, DDF=214 for Squared Distance to specie

From
specie barinens canicoll falcon llanos miranda oriente poliopus trinitat

barinens 0 9.35119 5.66007 4.63708 6.42655 4.28476 10.28025 11.71656


canicoll 9.35119 0 3.15927 5.86779 4.85373 3.08260 6.74173 6.58988
falcon 5.66007 3.15927 0 2.27520 3.93166 2.92917 5.52465 8.75967
llanos 4.63708 5.86779 2.27520 0 3.19764 3.61090 6.05907 11.24030
miranda 6.42655 4.85373 3.93166 3.19764 0 1.82961 4.24426 7.92836
oriente 4.28476 3.08260 2.92917 3.61090 1.82961 0 2.46076 5.11761
poliopus 10.28025 6.74173 5.52465 6.05907 4.24426 2.46076 0 10.40864
trinitat 11.71656 6.58988 8.75967 11.24030 7.92836 5.11761 10.40864 0

Prob > Mahalanobis Distance for Squared Distance to specie

From
specie barinens canicoll falcon llanos miranda oriente poliopus trinitat

barinens 1.0000 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001


canicoll <.0001 1.0000 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001
falcon <.0001 <.0001 1.0000 0.0036 <.0001 0.0002 <.0001 <.0001
llanos <.0001 <.0001 0.0036 1.0000 <.0001 <.0001 <.0001 <.0001
miranda <.0001 <.0001 <.0001 <.0001 1.0000 0.0261 <.0001 <.0001
oriente <.0001 <.0001 0.0002 <.0001 0.0261 1.0000 0.0015 <.0001
poliopus <.0001 <.0001 <.0001 <.0001 <.0001 0.0015 1.0000 <.0001
trinitat <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 1.0000

74
Univariate Test Statistics

F Statistics, Num DF=7, Den DF=230

Total Pooled Between


Standard Standard Standard R-Square Valore
Variable Deviation Deviation Deviation R-Square / (1-RSq) F Pr > F

LnTL 0.0643 0.0612 0.0238 0.1206 0.1372 4.51 <.0001


LnNL 0.0908 0.0870 0.0322 0.1106 0.1244 4.09 0.0003
LnFL 0.0771 0.0724 0.0314 0.1454 0.1701 5.59 <.0001
LnBZW 0.0539 0.0510 0.0209 0.1325 0.1527 5.02 <.0001
LnCW 0.0638 0.0556 0.0348 0.2614 0.3538 11.63 <.0001
LnMLOW 0.0573 0.0526 0.0261 0.1824 0.2231 7.33 <.0001
LnCBL 0.0672 0.0634 0.0265 0.1368 0.1584 5.21 <.0001
LnBL 0.0707 0.0691 0.0205 0.0735 0.0793 2.61 0.0132
LnIZL 0.0777 0.0747 0.0268 0.1046 0.1169 3.84 0.0006
LnPL 0.0830 0.0793 0.0300 0.1143 0.1291 4.24 0.0002
LnPLL 0.0846 0.0779 0.0379 0.1767 0.2147 7.05 <.0001
LnIML 0.0653 0.0606 0.0282 0.1632 0.1951 6.41 <.0001
LnIFL 0.1324 0.1181 0.0675 0.2283 0.2959 9.72 <.0001
LnUAL 0.0715 0.0650 0.0339 0.1973 0.2458 8.07 <.0001
LnFMW 0.1033 0.0877 0.0605 0.3010 0.4307 14.15 <.0001
LnIFW 0.1058 0.0996 0.0423 0.1405 0.1634 5.37 <.0001
LnCH 0.1332 0.1280 0.0458 0.1039 0.1159 3.81 0.0006

Average R-Square

Unweighted 0.158416
Weighted by Variance 0.1630089

Multivariate Statistics and F Approximations

S=7 M=4.5 N=106

Valore
Statistica Valore F Num DF Den DF Pr > F

Wilks' Lambda 0.08210856 5.52 119 1405.3 <.0001


Pillai's Trace 1.95137134 5.00 119 1540 <.0001
Hotelling-Lawley Trace 3.33462937 5.95 119 1002.4 <.0001
Roy's Greatest Root 1.16703187 15.10 17 220 <.0001

NOTE: F Statistic for Roy's Greatest Root is an upper bound.

analisi delle variate canoniche 120

The CANDISC Procedure

Correlazione Errore Correlazione


Correlazione canonica standard canonica
canonica corretta approssimato quadratica

1 0.733852 0.693204 0.029975 0.538539


2 0.677379 0.639309 0.035152 0.458842
3 0.625042 0.599928 0.039580 0.390677
4 0.470547 0.400002 0.050575 0.221415
5 0.417568 0.379785 0.053631 0.174363
6 0.301043 . 0.059070 0.090627
7 0.277322 . 0.059961 0.076908

Autovalori di Inv(E)*H
= CanRsq/(1-CanRsq)

Autovalore Differenza Proporzione Cumulata

1 1.1670 0.3191 0.3500 0.3500


2 0.8479 0.2067 0.2543 0.6042
3 0.6412 0.3568 0.1923 0.7965
4 0.2844 0.0732 0.0853 0.8818
5 0.2112 0.1115 0.0633 0.9451
6 0.0997 0.0163 0.0299 0.9750
7 0.0833 0.0250 1.0000

Test di H0: Le correlazioni canoniche nella riga corrente


e in tutte le successive sono uguali a zero

75
Rapporto di Valore F
verosimiglianza approssimato Num DF Den DF Pr > F

1 0.08210856 5.52 119 1405.3 <.0001


2 0.17793187 4.55 96 1224.9 <.0001
3 0.32879865 3.62 75 1038.8 <.0001
4 0.53961298 2.60 56 846.26 <.0001
5 0.69306866 2.18 39 646.29 <.0001
6 0.83943541 1.67 24 438 0.0255
7 0.92309238 1.67 11 220 0.0825

Total Canonical Structure

Variable Can1 Can2 Can3 Can4 Can5 Can6 Can7

LnTL 0.397000 -0.196822 -0.121760 -0.024628 -0.090743 0.159820 0.328810


LnNL 0.356672 -0.208355 0.187926 0.002327 -0.120140 0.008392 0.276003
LnFL 0.327638 -0.022682 -0.450135 -0.073018 -0.037211 0.032624 0.294445
LnBZW 0.415023 0.038935 0.107219 0.081741 0.206711 0.218119 0.526274
LnCW 0.494670 0.510167 -0.023347 0.124808 -0.137737 -0.062557 0.191772
LnMLOW 0.570653 -0.017275 -0.021849 -0.089368 -0.039117 0.199916 0.117862
LnCBL 0.463076 -0.153072 0.065812 0.101195 -0.050575 0.147584 0.232636
……………… OMESSA LA RESTANTE PARTE DELLA MATRICE DI COVARIANZA PERCHE’ NON INTERESSANTE

Between Canonical Structure

Variable Can1 Can2 Can3 Can4 Can5 Can6 Can7

LnTL 0.838772 -0.383839 -0.219108 -0.033364 -0.109090 0.138517 0.262527


LnNL 0.787012 -0.424366 0.353183 0.003292 -0.150840 0.007596 0.230145
LnFL 0.630568 -0.040295 -0.737873 -0.090108 -0.040750 0.025757 0.214150
LnBZW 0.836741 0.072458 0.184115 0.105671 0.237138 0.180398 0.400965
LnCW 0.710082 0.675971 -0.028545 0.114876 -0.112503 -0.036838 0.104029
LnMLOW 0.980489 -0.027398 -0.031975 -0.098458 -0.038243 0.140908 0.076528

……………… OMESSA LA RESTANTE PARTE DELLA MATRICE DI COVARIANZA PERCHE’ NON INTERESSANTE

Pooled Within Canonical Structure

Variable Can1 Can2 Can3 Can4 Can5 Can6 Can7

LnTL 0.287592 -0.154402 -0.101356 -0.023174 -0.087928 0.162525 0.336888


LnNL 0.256915 -0.162525 0.155548 0.002177 -0.115754 0.008486 0.281184
LnFL 0.240756 -0.018049 -0.380088 -0.069695 -0.036574 0.033653 0.306016
LnBZW 0.302693 0.030752 0.089858 0.077439 0.201660 0.223319 0.542871
LnCW 0.390990 0.436673 -0.021205 0.128138 -0.145622 -0.069412 0.214382
LnMLOW 0.428721 -0.014055 -0.018862 -0.087211 -0.039309 0.210840 0.125236
LnCBL 0.338577 -0.121198 0.055293 0.096106 -0.049461 0.151478 0.240568
LnBL 0.245906 -0.051090 -0.005743 0.035549 -0.012671 0.111780 0.241212
LnIZL 0.268627 -0.116320 0.066402 -0.069671 -0.048352 0.195228 0.390196

……………… OMESSA LA RESTANTE PARTE DELLA MATRICE DI COVARIANZA PERCHE’ NON INTERESSANTE

Total-Sample Standardized Canonical Coefficients

Variable Can1 Can2 Can3 Can4

LnTL -0.364641057 -0.667023512 -1.646333468 -0.395445675


LnNL 0.087165373 -0.304616828 1.218039634 -0.065223691
LnFL 0.103630839 0.027850290 -0.438509818 -0.175625806
LnBZW -0.182719779 0.305507717 0.168059245 0.305272568
LnCW 0.359205967 0.989404414 -0.087342883 0.148433557
LnMLOW 0.491291820 -0.225862106 0.049826753 -0.198435387
LnCBL 0.801203223 -1.669457146 1.614054984 1.533850223
LnBL -2.199302348 1.712057928 -0.197509617 -0.768553951

……………… OMESSA LA RESTANTE PARTE DELLA MATRICE DI COVARIANZA PERCHE’ NON INTERESSANTE

Pooled Within-Class Standardized Canonical Coefficients

Variable Can1 Can2 Can3 Can4

LnTL -0.347102536 -0.634940986 -1.567148051 -0.376425512


LnNL 0.083445024 -0.291615325 1.166051873 -0.062439846
LnFL 0.097248452 0.026135054 -0.411503001 -0.164809414
LnBZW -0.172756043 0.288848337 0.158894950 0.288626010
LnCW 0.313380155 0.863180840 -0.076200087 0.129497100
……………… OMESSA LA RESTANTE PARTE DELLA MATRICE DI COVARIANZA PERCHE’ NON INTERESSANTE

76
Raw Canonical Coefficients

Variable Can1 Can2 Can3 Can4

LnTL -5.67437125 -10.37990365 -25.61946090 -6.15373811


LnNL 0.95953455 -3.35328538 13.40843354 -0.71799595
LnFL 1.34349451 0.36105769 -5.68494416 -2.27685416
LnBZW -3.38878474 5.66605266 3.11688538 5.66169150
LnCW 5.63257173 15.51447315 -1.36959042 2.32752997
LnMLOW 8.57261329 -3.94109654 0.86943334 -3.46252424
LnCBL 11.92763762 -24.85346949 24.02868884 22.83466803
LnBL -31.09055397 24.20259745 -2.79210515 -10.86470359

……………… OMESSA LA RESTANTE PARTE DELLA MATRICE DI COVARIANZA PERCHE’ NON INTERESSANTE

Class Means on Canonical Variables

specie Can1 Can2 Can3 Can4

barinens 1.183316226 -1.034229750 -0.132148153 -0.361490964


canicoll -1.321725402 0.729269771 1.602378369 -0.760172040
falcon 0.251430461 0.640400502 1.216474950 -0.258563621
llanos 1.101670364 0.538355979 0.617479626 0.839857327
miranda -0.158921464 0.220730228 -0.144918060 0.712962626
oriente -0.539183000 0.182502477 -0.219328704 -0.309630927
poliopus -0.328950729 1.070406566 -1.248067037 -0.324023515
trinitat -2.491148740 -1.807249729 -0.064182362 0.334423721

specie Can5 Can6 Can7

barinens -0.113006685 -0.076896397 0.008184575


canicoll -0.710409644 -0.279577439 0.319886187
falcon 0.851849562 0.012321231 -0.537487765
llanos 0.349724510 0.125999718 0.533928848
miranda -0.517416489 -0.120356596 -0.298589181
oriente -0.304568337 1.030414869 -0.038390543
poliopus 0.250989393 -0.166552700 0.096485651
trinitat 0.535719406 -0.053863512 0.122936257

77
_______________________________________________________________________________________

PROGRAMMA SETTE A
_______________________________________________________________________________________

In questo output vengono mantenuti solo gli elementi nuovi dei risultati rispetto all’output del PROGRAMMA SETTE

analisi delle variate canoniche 1


13:13 Saturday, February 5, 2005

NS

barinens 57
canicoll 17
falcon 21
llanos 24
miranda 43
oriente 18
poliopus 39
trinitat 19

NTOTAL

238

La matrice contiene le distanze di Mahalanobis distorte sopra la diagonale


e quelle non distorte sotto
FLAST
barinens canicoll falcon llanos miranda oriente poliopus trinitat

barinens 0.0000 13.0478 6.7388 5.0166 4.7907 5.7227 8.1115 15.0227


canicoll 12.0594 0.0000 6.1442 10.7736 7.2790 6.4421 10.4042 13.4196
falcon 6.0483 5.1854 0.0000 3.7116 5.0913 5.5218 7.3950 16.0449
llanos 4.4276 9.6954 2.9575 0.0000 3.7930 6.4142 7.4513 19.3662
miranda 4.3385 6.4513 4.4181 3.2067 0.0000 2.6346 3.7918 10.9930
oriente 5.0120 5.4174 4.6075 5.5106 1.9913 0.0000 3.6506 10.1159
poliopus 7.5270 9.4511 6.6249 6.7210 3.3176 2.9553 0.0000 14.8856
trinitat 14.0090 12.1727 14.7851 18.0325 10.0794 9.0068 13.8199 0.0000

I valori sopra la diagonale sono i valori di F e sotto le probabilità


FDIST
barinens canicoll falcon llanos miranda oriente poliopus trinitat

barinens 1.0000 23.7713 14.3882 11.7877 16.3367 10.8921 26.1330 29.7842


canicoll 0.0000 1.0000 8.0310 14.9162 12.3384 7.8361 17.1379 16.7518
falcon 0.0000 0.0000 1.0000 5.7837 9.9945 7.4461 14.0440 22.2676
llanos 0.0000 0.0000 0.0000 1.0000 8.1286 9.1791 15.4025 28.5735
miranda 0.0000 0.0000 0.0000 0.0000 1.0000 4.6510 10.7891 20.1543
oriente 0.0000 0.0000 0.0000 0.0000 0.0001 1.0000 6.2554 13.0093
poliopus 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1.0000 26.4593
trinitat 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1.0000

Multivariate Statistics and F Approximations

S=7 M=4.5 N=106


Valore
Statistica Valore F Num DF Den DF Pr > F

Wilks' Lambda 0.08210856 5.52 119 1405.3 <.0001


Pillai's Trace 1.95137134 5.00 119 1540 <.0001
Hotelling-Lawley Trace 3.33462937 5.95 119 1002.4 <.0001
Roy's Greatest Root 1.16703187 15.10 17 220 <.0001

NOTE: F Statistic for Roy's Greatest Root is an upper bound.

78
The DISCRIM Procedure
Classification Summary for Calibration Data: WORK.DISCIMINA
Resubstitution Summary using Linear Discriminant Function

Generalized Squared Distance Function

2 _ -1 _
D (X) = (X-X )' COV (X-X )
j j j

Posterior Probability of Membership in Each specie

2 2
Pr(j|X) = exp(-.5 D (X)) / SUM exp(-.5 D (X))
j k k

Number of Observations and Percent Classified into specie

From
specie barinens canicoll falcon llanos miranda oriente poliopus trinitat Total

barinens 43 2 0 5 1 3 1 2 57
75.44 3.51 0.00 8.77 1.75 5.26 1.75 3.51 100.00
canicoll 0 15 0 1 1 0 0 0 17
0.00 88.24 0.00 5.88 5.88 0.00 0.00 0.00 100.00
falcon 1 1 11 2 4 1 1 0 21
4.76 4.76 52.38 9.52 19.05 4.76 4.76 0.00 100.00
llanos 1 0 3 16 3 1 0 0 24
4.17 0.00 12.50 66.67 12.50 4.17 0.00 0.00 100.00
miranda 4 1 3 7 16 6 4 2 43
9.30 2.33 6.98 16.28 37.21 13.95 9.30 4.65 100.00
oriente 1 1 0 1 2 12 1 0 18
5.56 5.56 0.00 5.56 11.11 66.67 5.56 0.00 100.00
poliopus 1 0 2 1 4 1 30 0 39
2.56 0.00 5.13 2.56 10.26 2.56 76.92 0.00 100.00
trinitat 0 0 0 0 0 1 0 18 19
0.00 0.00 0.00 0.00 0.00 5.26 0.00 94.74 100.00
Total 51 20 19 33 31 25 37 22 238
21.43 8.40 7.98 13.87 13.03 10.50 15.55 9.24 100.00
Priors 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125

Analisi discriminante 13:13 Saturday, February 5, 2005 7

The DISCRIM Procedure


Classification Summary for Calibration Data: WORK.DISCIMINA
Resubstitution Summary using Linear Discriminant Function

Error Count Estimates for specie

barinens canicoll falcon llanos miranda oriente poliopus trinitat Total

Rate 0.2456 0.1176 0.4762 0.3333 0.6279 0.3333 0.2308 0.0526 0.3022
Priors 0.1250 0.1250 0.1250 0.1250 0.1250 0.1250 0.1250 0.1250

79
80

Você também pode gostar