Escolar Documentos
Profissional Documentos
Cultura Documentos
I compiti del chimico analista vanno oltre la I compiti del chimico analista vanno oltre la
corretta esecuzione di una metodica analitica.
Sono altrettanto importanti i passi successivi: p p
Registrazione accurata dei dati sperimentali e corretta
esecuzione dei calcoli esecuzione dei calcoli
Scelta del valore migliore qualora la stessa determinazione sia
stata eseguita piu volte g p
Valutazione dei risultati ottenuti e calcolo dei limiti probabili
dellerrore che poi vanno indicati insieme al risultato
Elaborazione di una strategia per controllare le fonti di errore e
migliorare cos la qualit delle prestazioni analitiche
COSA VUOL DIRE FARE
STATISTICA
Quando si fanno affermazioni del tipo:
il profitto di questa classe in media il profitto di questa classe in media
sufficiente;
questanno sono di moda le vacanze di q
tipo agrituristico
si fanno affermazioni di tipo statistico.
STATISTICA STATISTICA
La statistica si occupa della
-raccolta,
-classificazione
-analisi dei dati
che esprimono aspetti di fenomeni collettivi scelti
come oggetto di studio e che si manifestano negli gg g
elementi di un determinato insieme.
Scopo della statistica quello di descrivere questi Scopo della statistica quello di descrivere questi
fenomeni o di individuare regolarit di
comportamento in essi. p
Indagine statistica Indagine statistica
Raccolta dei dati
Spoglio e p g
trascrizione dei dati
Elaborazione dei
d ti dati
Elaborazione dei dati Elaborazione dei dati
i d i d i Rappresentazione dei dati
(grafici) (grafici)
perch con limmagine si riesce a dare
un quadro generale della situazione un quadro generale della situazione
indagata riuscendo a dare informazioni
facilmente rapidamente comprensibili facilmente, rapidamente comprensibili.
Quali grafici?
Istogrammi, diagrammi a torta, grafici
cartesiani, cartogrammi, ecc.
Istogramma
1^A
1^B
Diagramma a torta
Matem
7,5
1^C
Matem
Italiano
Inglese
Scienze
7
24%
28%
Scienze
6,5
6
22%
5,5
Matem. Ingl ese
26%
Cartogramma
Diagramma cartesiano
6,8
7
6,4
6,6
6
6,2
1 2 3 4 1 2 3 4
Anno scolastico
Indici Statistici Indici Statistici
Per sintetizzare i dati ed evidenziare
una certa caratteristica:
I di i di t d t l Indici di tendenza centrale
Indici di dispersione Indici di dispersione
La media La media
Non esiste una sola media buona per
ogni occasione, ma esistono pi g , p
medie e verr scelta la pi adatta a
mettere in evidenza la situazione mettere in evidenza la situazione
cercata.
La media
Gli obiettivi che ci si prefigge nel calcolo di
di i l d una media sono sostanzialmente due:
1) sostituire a pi dati rilevati un solo
numero che dia per una efficace
rappresentazione del fenomeno dato;
esprimere lordine di grandezza o
tendenza centrale dellinsieme dei dati
relativi a un fenomeno. Tale ordine di
grandezza pu a volte sfuggire perch i g p gg p
dati sono spesso differenti fra loro.
La Media La Media
A questo punto bisogna dare dei criteri q p g
pratici per calcolare tale valor medio; i pi
importanti, quindi quelli pi usati, sono i
ti seguenti:
a) si pu calcolare il valor medio come
funzione matematica dei dati rilevati e
i t l i l di di liti in tal caso si parla di media analitica;
si possono ordinare i dati rilevati e
tt l di i l i ll ottenere la media in relazione alla
posizione che occupa fra essi e in tal caso
si parla di media di posizione si parla di media di posizione.
La media aritmetica La media aritmetica
La media aritmetica semplice M di n valori La media aritmetica semplice M di n valori
il rapporto fra la loro somma e il loro numero n:
x =
E
i=1
N
x
i
n
( )
...
2 1
+ + + x x x
M
n
n
( )
6 5 8 5
,..., ,
2 1
2 1
=
l i ti i D ti
n
x x x M
n
n
24 6 5 8 5
6 , 5 , 8 , 5 :
+ + +
valori seguenti i Dati
6
4
24
4
6 5 8 5
= =
+ + +
= M
La media aritmetica ponderata La media aritmetica ponderata
Quando ciascuna modalit si presenta con una certa
frequenza o peso, pi vantaggioso calcolare la
media aritmetica considerando le frequenze (assolute
o relative): in tal caso si parla di media aritmetica o relative): in tal caso si parla di media aritmetica
ponderata perch ogni valore entra nella media con il
suo peso, cio la sua frequenza. suo peso, o a sua eque a
La media aritmetica ponderata M di n valori :
( )
n n
n x n x n x
x x x M
+ + +
=
...
2 2 1 1
( )
n
n n n n dove
n
x x x M
+ + + =
= ,..., ,
2 1
n
n n n n dove + + + = ...
2 1
Calcolo della media
ponderata
Voto Allievi
6
24
3 8 5 7 8 6 5 5 3 4
=
+ + + +
= M
(modalit) (frequenza)
4 3
24
4 3
5 5
6 8
7 5 7 5
8 3
Attenzione! Attenzione!
Non sempre il calcolo della media aritmetica
rappresenta in modo significativo linsieme dei
valori a cui si riferisce. Per esempio, assegnati
i l i i valori:
6
48 6 7 5 5 6 7 6 5
6 7 6 5 6 7 6 5 )
+ + + + + + +
M
48 10 10 9 9 2 3 3 2
6
8 8
6 , 7 , 6 , 5 , 6 , 7 , 6 , 5 )
+ + + + + + +
= = = M a
24 13 2 1 1 3 1 2 1
6
8
48
8
10 10 9 9 2 3 3 2
10 , 10 , 9 , 9 , 2 , 3 , 3 , 2 )
+ + + + + + +
= =
+ + + + + + +
= M b
3
8
24
8
13 2 1 1 3 1 2 1
13 , 2 , 1 , 1 , 3 , 1 , 2 , 1 ) = =
+ + + + + + +
= M c
opportuno allora definire altri valori medi opportuno allora definire altri valori medi
che non siano frutto di calcolo matematico,
ma che siano individuati in base alla loro ma che siano individuati in base alla loro
posizione nella sequenza dei valori
osservati osservati.
Tali medie si dicono medie di posizione le
pi utilizzate sono: pi utilizzate sono:
La moda
La mediana
La MODA La MODA
Moda di un
fenomeno la
Voto
(modalit)
Allievi
(frequenza) fenomeno la
modalit con
f i
(modalit) (frequenza)
4 3
frequenza pi
elevata.
5 5
6 8
Mo 6
6 8
7 5
Mo = 6
7 5
8 3
La MEDIANA La MEDIANA
di l l d Mediana: il valore divisorio in quanto
bipartisce la successione dei dati in due
l l l gruppi ugualmente numerosi; il valore
che taglia in due parti uguali la
di ib i d i d i di i i il distribuzione dei dati ordinati, cio il
termine preceduto e seguito dallo stesso
di d i numero di dati.
Mediana Me di n valori ordinati
i d d t in modo non decrescente :
Esempio: dati i valori ordinati:
1, 2, 2, 3, 4, 5, 6 Me = 3
Se n dispari la mediana il valore centrale
Se n pari la mediana la media dei due Se n pari la mediana la media dei due
valori centrali
La variabilit
Il calcolo della media ci permette di sintetizzare p
una quantit di dati, ma dallaltro riduce
linformazione racchiudendo tanti valori in un
solo dato, rende simili situazioni che proprio
simili non sono.
1^prova 2^prova 3^prova 4^prova 5^prova MEDIA
Allievo 1 3 4 5 9 9 6
Allievo 2 6 6 6 6 6 6
Allievo 3 2 4 7 8 9 6
Per ridurre la perdita di informazioni, si ricorre Per ridurre la perdita di informazioni, si ricorre
allo studio della variabilit del fenomeno.
Variabilit la tendenza di un fenomeno ad
assumere modalit diverse fra loro. assu e e oda t d e se a o o
La variabilit pu essere rappresentata
graficamente mediante il diagramma di g a a d a d g d
dispersione.
Diagramma di dispersione Diagramma di dispersione
9
6
7
8
Allievo 1
3
4
5
6
Allievo 2
Allievo 3
2
3
0 1 2 3 4 5
Prove
Indici statistici di
variabilit
Campo di variazione o range R
Varianza
Scarto quadratico medio Scarto quadratico medio
.
Permettono di valutare le disuguaglianze Permettono di valutare le disuguaglianze
dei dati rilevati in relazione al loro
scostamento o dispersione da una media scostamento o dispersione da una media.
Campo di variazione o range R di
un insieme di valori osservati la un insieme di valori osservati la
differenza fra il valore massimo e il
l i i valore minimo:
R= x
max
- x
min
Attenzione tale indice presenta due grossi difetti:
1) dipende esclusivamente dai valori massimo e
minimo registrati, senza considerare i valori minimo registrati, senza considerare i valori
intermedi;
2) su di esso influisce pesantemente la presenza
anche di un solo valore anomalo.
2 5 7 6 7 6 5 6 7 6 5 ) R a
8 2 10 10 , 10 , 9 , 9 , 2 , 3 , 3 , 2 )
2 5 7 6 , 7 , 6 , 5 , 6 , 7 , 6 , 5 )
= =
= =
R b
R a
12 1 13 13 , 2 , 1 , 1 , 3 , 1 , 2 , 1 )
, , , , , , , )
= = R c
Altri indici di variabilit, pi raffinati, si
possono trovare utilizzando un altro
criterio,cio la variabilit rispetto a un centro
che pu essere la media.
La varianza La varianza
La varianza la media aritmetica degli scarti
dalla media al quadrato
2
(sigma quadrato) dalla media al quadrato, o
2
(sigma quadrato).
( ) ( ) ( )
2 2
2
2
1
2
+ + + M x M x M x ( ) ( ) ( )
2 2 2 2
...
2 1
2
+ + +
= o
n
M x M x M x
n
( ) ( ) ( ) ( )
8
5
2
2
6 9
2
6 5
2
6 4
2
6 3
2
: allievo 1 Es. =
+ + +
= o
5
1^prova 2^prova 3^prova 4^prova 5^prova MEDIA Vari anza 1 prova 2 prova 3 prova 4 prova 5 prova MEDIA Vari anza
Allievo 1 3 4 5 9 9 6
8
Allievo 2 6 6 6 6 6 6
0
Allievo 2 6 6 6 6 6 6
0
Allievo 3 2 4 7 8 9 6
8,5
Scarto quadratico medio Scarto quadratico medio
Lo scarto quadratico medio o o deviazione
standard la radice quadrata (positiva) della standard la radice quadrata (positiva) della
varianza.
( ) ( ) ( )
n
M x M x M x
n
2 2
2
2
1
2
... + + +
= = o o
n
sqm o
1^prova 2^prova 3^prova 4^prova 5^prova
MEDIA Vari anza
sqm o
Devi azi one
standard
Allievo 1
3 4 5 9 9 6
8 2 83
e o
3 4 5 9 9 6
8 2,83
Allievo 2
6 6 6 6 6 6
0 0,00
Allievo 3
2 4 7 8 9 6
8,5 2,92
Normalizzazione
La normalizzazione unoperazione statistica
che permette di mettere a confronto distribuzioni p
diverse.
Avendo due prove il cui punteggio grezzo Avendo due prove il cui punteggio grezzo
massimo raggiungibile dagli studenti diverso,
30 nella prima prova e 45 nella seconda prova, 30 nella prima prova e 45 nella seconda prova,
non permette di confrontare i risultati ottenuti.
Per superare questo inconveniente ricorro alla p q
normalizzazione.
Essa si basa su una proporzione: Essa si basa su una proporzione:
( Punti studente) : ( p.ti totali) = ( P.ti studente normalizzati) : 100
Normalizzazione
Allievi
Punti 1^
prova
Punti 1^
prova
P.ti 1^p
normalizzati
P.ti 2^p
normalizzati
A1 25 40 83,3 88,9
A2 15 43 50,0 95,6
A3 28 38 93 3 84 4 A3 28 38 93,3 84,4
A4 19 33 63,3 73,3
A5 22 31 73,3 68,9
A6 30 20 100,0 44,4
A7 27 26 90,0 57,8
A8 18 45 60 0 100 0 A8 18 45 60,0 100,0
Per A1 I p 25 : 30 = x : 100 x = 25/30x100 = 83 3 Per A1 I p. 25 : 30 = x : 100 x = 25/30x100 = 83,3
II p. 40 : 45 = x : 100 x = 40/45x100 = 88,9
Come leggere i risultati gg
Nella tabella successiva sono riportati i dati Nella tabella successiva sono riportati i dati
relativi alla media, alla deviazione
standard, al valore minimo e massimo, alla , ,
mediana e alla moda. Vediamo come
leggere questi dati aiutandoci con le
definizioni di tali valori statistici ed un
esempio di risultati ottenuti da una scuola.
I t i li ti 100 l I punteggi sono normalizzati a 100: la
scala di riferimento ha come valore minimo
0 (le risposte a tutti i quesiti della prova 0 (le risposte a tutti i quesiti della prova
sono errate) e come valore massimo 100
(le risposte a tutti i quesiti della prova sono (le risposte a tutti i quesiti della prova sono
corrette).
Media
Dev.
standard
Min. Max. Moda
Mediana
20 0 98 2 73 3
scuola 59,3 16,9
20,0 98,2 73,3
61,3
-Media (o punteggio medio) Media (o punteggio medio)
la somma dei punteggi ottenuti dagli studenti diviso il numero
totale degli stessi. Una media elevata indica la presenza nella
scuola di elevate competenze al contrario una media bassa scuola di elevate competenze, al contrario una media bassa
indica la presenza di scarse competenze nella scuola.
Nell'esempio la Media (o punteggio medio) 59,3;
Moda -Moda
il punteggio ottenuto pi frequentemente dagli studenti,
nell'esempio la scuola ha ottenuto come valore modale 73,3.
O b l 0 00 l Ovvero tra tutti i punteggi possibili tra 0 e 100, tale punteggio
quello ottenuto da pi studenti.
-Mediana
il punteggio in corrispondenza del quale gli studenti vengono
esattamente divisi in due parti uguali. Nell'esempio la mediana
corrisponde a 61,3 e indica che il 50% degli studenti ha ottenuto o po d a 6 ,3 d a 50 d g ud a o u o
un punteggio inferiore a 61,3% e che il restante 50% ha ottenuto
un punteggio superiore al 61,3;
Media
Dev.
standard
Min. Max. Moda
Mediana
standard
scuola 59,3 16,9
20,0 98,2 73,3
61,3
-Minimo
E' il punteggio pi basso ottenuto dagli studenti. Nell'esempio il
punteggio minimo 20,0; punteggio minimo 20,0;
-Massimo
E' il punteggio pi alto ottenuto dagli studenti. Nell'esempio il
punteggio massimo 98,2; p gg , ;
-Deviazione standard
una misura della dispersione del punteggio intorno al punteggio
medio. Un basso valore della deviazione standard indica che
i punteggi sono concentrati intorno alla media e che le
competenze degli studenti sono omogenee; al contrario
una deviazione standard alta indica che le competenze
degli studenti sono disomogenee. Nel nostro esempio,
aggiungendo e sottraendo al punteggio medio (59,3) la
deviazione standard (16,9) si ottiene un intervallo (42,4 - 76,2) in
i i t il 68% d li t d ti A l t i d cui si trova il 68% degli studenti. Analogamente aggiungendo e
sottraendo 2 volte la deviazione standard si ottiene un intervallo
(25,5 - 93,1) in cui si trova il 95% degli studenti.
Confronto con il campione
nazionale
Nel confronto tra i dati della scuola e
quelli del campione nazionale si dovr
tener conto dellerrore di campionamento. p
Esempio: se la scuola ha M = 80 e la
media del campione M 70 con un media del campione M
c
= 70 con un
errore di 10, il dato della scuola non si
discosta significativamente dal dato del discosta significativamente dal dato del
campione
80 70 10
Coefficiente di variazione Coefficiente di variazione
Il coeff.di variazione dato dal
rapporto tra deviazione standard e pp
media moltiplicato per 100.
Se supera una certa percentuale %
indica una variablit eccessiva, fuori
ai parametri di normalita. ai parametri di normalita .
Lerrore sperimentale e la sua valutazione nelle determinazioni analitiche L errore sperimentale e la sua valutazione nelle determinazioni analitiche
Ogni misura presenta una qualche incertezza, chiamata errore sperimentale
Risultati di 6 determinazioni replicate del ferro in campioni acquosi di una
soluzione standard contenente 20,00 ppm di Fe(III).
GLI ERRORI NELLANALISI CHIMICA GLI ERRORI NELLANALISI CHIMICA
Ogni analisi chimica (ogni misurazione!) affetta da errori sperimentali.
35
Ogni analisi chimica (ogni misurazione!) affetta da errori sperimentali.
Gli errori sperimentali si combinano tra loro in modo da rendere ogni nuova misura
pi o meno diversa dalla precedente.
Lincertezza della misura sperimentale non pu mai essere eliminata completamente
perci il valore vero di una quantit sempre sconosciuto.
Tuttavia, spesso pu essere valutata l'entit probabile dell'errore.
possibile definire i limiti entro cui il valore vero di una quantit misurata cade con
un dato livello di probabilit un dato livello di probabilit.
E sempre indispensabile effettuare una stima dellaffidabilit dei dati sperimentali
anche se la stima dellaccuratezza dei dati sperimentali non sempre facile
Ogni volta che collezioniamo i risultati di unanalisi necessario
stimarne precisione ed accuratezza
Una delle domande a cui rispondere prima di cominciare un'analisi : "qual il
stimarne precisione ed accuratezza
Dati con precisione ed accuratezza ignote sono privi di significato
massimo errore tollerabile nel risultato. La risposta a questo quesito determina il
tempo richiesto per il lavoro: nessuno pu permettersi di produrre dati che siano
pi accurati di quanto occorra.
DEFINIZIONI
36
Sia dato un insieme di misure x
1
, x
2
,x
N
.
Media:
N
x
x
i
i
=
Mediana: avendo ordinato le misure in ordine crescente o decrescente
N
N pari la mediana la media della coppia centrale dei valori
N dispari la mediana il valore centrale
Nel caso delle misure: 10, 10, 12, 13, 13, 13, 15, 18, 25, 26, 26, 27,
28, 28, 35
la media 19,93 e la mediana 18.
Media aritmetica o media
x
N
di N valori
sperimentali
x
x
i
i
=1
sperimentali
N
x
i
=
1
x
1 18,45 E 111,52
media
, ,
2 18,53
N
6
3 18,58 media 18,59
media
4 18,63
5 18,65 18,30 18,40 18,50 18,60 18,70
6 18,68
Mediana
Il risultato centrale dei dati replicati ordinati
Nel caso di un numero pari di dati replicati si calcola la
media della coppia centrale media della coppia centrale
x
1 18,45 E 111,52
mediana
2 18,53
N
6
3 18,58 media 18,59
media
4 18,63 mediana 18,61
5 18,65
6 18 68
18,30 18,40 18,50 18,60 18,70
6 18,68
Precisione
La dispersione dei valori misurati
intorno al valore medio
Descrive il grado di riproducibilit delle misure ed Descrive il grado di riproducibilit delle misure ed
una valutazione dell accordo dei dati ottenuti.
Grandezze utilizzate per indicare la precisione di una
serie di dati replicati (MISURANO la dispersione dei dati
ottenuti e permettono di definire i limiti probabili
dellerrore associato al risultato):
d i i d d deviazione standard
varianza
coefficiente di variazione
Accuratezza
Rappresenta lo scostamento tra il valore misurato ed il
valore vero o accettato
I lt i t i i i d ll b t d ll d t il In altri termini una misura della bont dellaccordo tra il
risultato, x
i
, o il valore medio dei risultati di unanalisi, ed il
valore vero o supposto tale, x
t
.
X
t
= valore vero. Risultato che possiede un certo numero di cifre significative
E espressa in termini di errore assoluto o errore relativo
Errore assoluto: oppure
t i
x x E =
t
x x E =
Errore relativo: oppure
t
t
r
x
x x
E
= 100
x
x x
E
t
t
r
=
t t
41
Precisione: bont dellaccordo tra i risultati di misurazioni
successive.
Accuratezza: bont dellaccordo tra il risultato, x
i
, o il valore medio
dei risultati di unanalisi, ed il valore vero o supposto tale, x
t
.
-
N Non
-
-
-
N
accurato
n
preciso
- -
-
-
Non
accurato
ma
preciso
-
p p
Accurato
- -
-
-
ma
non
preciso
-
-
-
-
Accurato
e
preciso
Tipi di errori nei dati Tipi di errori nei dati
sperimentali p
Errore sistematico o errore determinato: un errore ricorrente (riproducibile) che pu
essere rivelato e corretto (strumentazione non tarata, errori di metodo, errore personali) e
influenza laccuratezza dei risultati ACCURATEZZA: indica la vicinanza della misura al influenza l accuratezza dei risultati ACCURATEZZA: indica la vicinanza della misura al
valore vero (accettato)
Errore casuale o indeterminato: deriva dalleffetto prodotto da una serie di variabili
i ll ( l l i ll bili i i i i l i ib i i) incontrollate (e talvolta incontrollabili: variazioni temperatura e tensione elettrica, vibrazioni)
e influenza la precisione di una misura PRECISIONE: descrive la riproducibilit delle
misurazioni
Errore grossolano: si presenta occasionalmente, spesso elevato e fa s che un singolo
dato si discosti da tutti gli altri dati di una serie di misure replicate
ERRORE SISTEMATICO
44
Gli errori sistematici hanno un valore definito ed una Gli errori sistematici hanno un valore definito ed una
causa identificabile.
Per misure replicate effettuate nello stesso modo
hanno lo stesso ordine di grandezza e generalmente
influenzano tutti i risultati di un set di misura allo
stesso modo stesso modo.
Provocano uno scostamento unidirezionale dal valore
vero che pu essere costante o proporzionale e che e o c e pu esse e costa te o p opo o a e e c e
pu assumere valore sia positivo che negativo.
Gli errori sistematici introducono un bias nella tecnica
di misura.
Bias: misura dellerrore sistematico associato
d li i ad una analisi.
Pu avere segno positivo o negativo.
Errore sistematico (o determinato)
Causa lo scostamento della media di un set di dati
sperimentali dal valore vero (o accettato)
Influenza laccuratezza di una misura
x
0
x
m
18 30 18 40 18 50 18 60 18 70 18,30 18,40 18,50 18,60 18,70
Cause degli errori sistematici
Errori strumentali: dovuti a imperfezioni e
malfunzionamento degli strumenti di misura malfunzionamento degli strumenti di misura
Variazioni di temperatura
Contaminazione dellequipaggiamento
Fluttuazioni nella tensione di alimentazione
Guasto o malfunzionamento di componenti
Errori di metodo: dovuti a comportamento
chimico o fisico non ideale dei reagenti e delle g
reazioni utilizzate in un procedimento analitico
E i li ti d l t i i Errori personali: causati da valutazioni
personali dellanalista nel corso del
procedimento analitico adottato procedimento analitico adottato
Rivelazione e correzione degli errori sistematici
Gli errori sistematici possono essere identificati ed annullati mediante
analisi di campioni standard, se disponibili;
li i d l i di t t d i di d t h
Gli errori sistematici possono essere identificati ed annullati mediante
analisi del campione mediante un metodo indipendente, ovvero che
prevede l'utilizzo di strumentazione di provata affidabilit o di
riferimento;;
analisi del bianco, cio di una soluzione contenente tutti i
componenti presenti nel campione in esame eccetto l'analita di p p p
interesse; il bianco ideale costituito dalla stessa matrice in cui
contenuto l'analita di interesse; l'analisi del bianco nelle titolazioni
volumetriche consente, per esempio, di correggere l'errore
connesso al volume di titolante necessario per far virare l'indicatore
colorimetrico stesso; colorimetrico stesso;
analisi di campioni contenenti un diverso ammontare della variabile
misurata (per es si pensi alla perdita connessa alla solubilit misurata (per es. si pensi alla perdita connessa alla solubilit
durante il lavaggio con volumi diversi di acque di lavaggio).
Rivelazione e correzione degli errori sistematici Rivelazione e correzione degli errori sistematici
x
0
x
m
0
Analisi di
18,30 18,40 18,50 18,60 18,70
standard
x
0
x
m
Calibrazione
0
18,30 18,40 18,50 18,60 18,70
Errore sistematico o determinato
Lerrore sistematico viene rivelato utilizzando opportuni std. di riferimento (analita a
concentrazione nota) e calcolando laccuratezza
Laccuratezza di una misura il grado di accordo tra essa e il valore vero e viene
espressa dallerrore (assoluto o relativo) espressa dall errore (assoluto o relativo)
Errore assoluto = valore osservato valore vero
valore osservato valore vero
E l ti 100 Errore relativo =
valore vero
x100
Determinazioni dell azoto in due composti puri con il metodo di Kjeldahl
I punti mostrano gli errori assoluti dei risultati (X X) replicati ottenuti da 4 analisti I punti mostrano gli errori assoluti dei risultati (X
i
-X
t
) replicati ottenuti da 4 analisti
Linea blu rappresenta la deviazione media assoluta dei dati dal valore vero (X
m
-X
t
)
Analista 1 accurato e preciso Analista 2 accurato ma poco preciso
Analista 3 preciso ma poco accuratoAnalista 4 poco accurato e poco preciso Analista 3 preciso ma poco accurato Analista 4 poco accurato e poco preciso
Errore casuale (o indeterminato)
Provoca la dispersione dei dati sperimentali intorno p p
al valore medio. Riflette la precisione di una misura
x
t
x
t
x
m
x
m
18,30 18,40 18,50 18,60 18,70
18,30 18,40 18,50 18,60 18,70
Errore casuale o indeterminato
( Lerrore casuale ha pari probabilit di essere positivo o negativo (dispersione dei dati pi o
meno simmetrica intorno al valore medio) e non pu essere corretto.
-4piccoli errori si combinano per dare le deviazioni indicate
dal valore medio.
Ciascunerrore ha la stessa probabilit di verificarsi e -Ciascunerrore ha la stessa probabilit di verificarsi e
la somma finale sia >o <di una quantit fissa U
-intabella tutte le possibili combinazioni e la frequenza
relativa con cui avvengono.
Distribuzione teorica relativa per
4 incertezze
Distribuzione teorica relativa per 10
incertezze. La deviazione pi frequente
dalla media 0, mentre la deviazione max ,
10U si verifica una volta ogni 500 misure
Distribuzione teorica relativa ad un numero
molto grande di incertezze ne risulta una
curva Gaussiana o curva normale dell
errore.
Distribuzione dei risultati sperimentali
Nella maggior parte degli esperimenti analitici
tit ti i l di t ib i d i d ti li ti quantitativi la distribuzione dei dati replicati
simile a quella di una curva Gaussiana e
questo perch la deviazione dalla media
conseguente allerrore casuale co segue te a e o e casuae
L esperimento di calibrazione di una pipetta da 10 ml prevede che un recipiente con tappo venga pesato
vuoto, nel recipiente si trasferiscano 10 ml di acqua con la pipetta da 10 ml, e il tutto venga ripesato. Si
misuri la temperatura dell acqua per stabilirne la densit, quindi si faccia la differenza tra le due masse misuri la temperatura dell acqua per stabilirne la densit, quindi si faccia la differenza tra le due masse
e si calcolino i ml dividendo la massa per la densit. L esperimento viene ripetuto per 50 volte.
La media si calcola con la funzione =MEDIA(B3:B19; E3:E19; H3:H18)
La mediana si calcola con la funzione =MEDIANA(B3:B19; E3:E19; H3:H18) La mediana si calcola con la funzione =MEDIANA(B3:B19; E3:E19; H3:H18)
La deviazione standard con opportuna funzione.
Il valore max si calcola con la funzione =MAX(B3:B19; E3:E19; H3:H18)
Il valore min si calcola con la funzione =MIN(B3:B19; E3:E19; H3:H18) Il valore min si calcola con la funzione MIN(B3:B19; E3:E19; H3:H18)
La dispersione la differenza tra valore max e minimo, e corrisponde alla
Sommatoria di tutte le incertezze dell esperimento.
1) I dati si possono riorganizzare in gruppi di distribuzione di frequenza ovvero
numero di dati che rientrano in una serie di celle adiacenti di ampiezza p
0.003 ml.
2) Si calcolano le % di misure contenute in ogni cella (3/50 x 100)=6.
Si nota che il 26% dei Risultati si trova nell intervallo 9.981-9.983.
Questo il gruppo che contiene media e mediana. Pi di meta dei risultati
contenuto in un intervallo di 0.004 ml rispetto al valore medio.
Con questi dati costruiamo un istogramma (A). Con l aumentare del numero
delle misure listogramma assumer una forma simile alla curva (B) che delle misure l istogramma assumer una forma simile alla curva (B) che
una Gaussiana o curva normale dell errore che deriva da un insieme infinito
dei dati. La Gaussiana ha la stessa media, la precisione e la stessa area
Sottesa alla curva dell istogramma Sottesa alla curva dell istogramma.
Il trattamento statistico dellerrore casuale
In uno studio scientifico deduciamo informazioni su una popolazione mediante
le osservazioni acquisite su un sottoinsieme o campione.
Popolazione: linsieme di tutte le misure di interesse
Campione: sottoinsieme della popolazione selezionato per lanalisi e rappresentativo p p p p pp
della popolazione stessa
CCurva normale di errore di una popolazione
-(x - )
2
/2o
2
Equazione della curva Gaussiana
y =
o 2t
e
-(x - ) /2o
2 curve Gaussiane che riportano la frequenza relativa y
di varie deviazioni dalla media in funzione della
deviazione dalla media. Queste curve vengono g
descritte da un equazione che contiene solo due
parametri: =media della popolazione e o =deviazione
standard della popolazione
La deviazione standard per la curva B doppia rispetto a p pp p
quella di A.
Media: Deviazione standard:
N N
60
x
X
N
1 i
i
=
=
( ) x x
s
N
1 i
2
i
=
=
necessario sapere che la media e la deviazione standard sopra
N
X
1 N
s
=
p p
definite, essendo valutate sulla base di un numero finito, e normalmente
molto basso, di misurazioni, cio di un campione delle infinite
misurazioni che costituiscono lintera popolazione delle misurazioni, sono
solo stime della media e della deviazione della popolazione. Per un
numero molto alto di misurazioni si pu scrivere:
N
x
N
1 i
i
( ) x
N
2
i
N
1 i=
=
( )
N
1 i
i
=
= o
Normalmente, queste due ultime equazioni valgono per N > 20.
La deviazione std. di un campione
La media di un campione la media aritmetica di un campione p p
limitato preso da una popolazione di dati ed indicata con x e la ds con s
N
s
=
E
i=1
(x
i
- x)
2
N-1
(N-1)= gradi di libert ovvero il
problema inizia con N dati
Indipendenti Dopo a er calcolato Indipendenti. Dopo aver calcolato
la media rimangono solo N-1 dati
indipendenti perch se si conoscono
N-1 dati e la media possibile
La varianza = s
2
p
calcolare lN-esimo dato.
deviazione std. relativa = s / x
Coefficiente di variazione (CV%) = (s / x) -100
62
Distribuzione normale o di Gauss
Nel caso sia effettuato un numero di misurazioni sufficientemente
elevato, spesso possibile verificare che i valori sperimentali
sono rappresentati da una distribuzione continua di tipo sono rappresentati da una distribuzione continua di tipo
Gaussiano (calcolo della frequenza relativa per ogni dato
sperimentale)
o
e
) (
2
2
2
) x x (
t o
=
2
e
) x ( y
La distribuzione Gaussiana simmetrica intorno alla media
(media e mediana coincidono) ed essendo una distribuzione di
probabilit racchiude un'area unitaria.
Se vale lipotesi che gli errori indeterminati seguano una
distribuzione Gaussiana possiamo usare le propriet di distribuzione Gaussiana, possiamo usare le propriet di
questultima per stimarne i parametri caratteristici, ovvero media
e deviazione standard.
Distribuzione normale o di Gauss
( )
( )
2
2 / 2
2
1
,
o
o
=
x
e N( )
2
,
t o
N
x
Il t di Student lo strumento statistico usato per esprimere gli p p g
intervalli di fiducia e confrontare i risultati di diversi esperimenti.
Es. confronto tra le medie di due popolazioni di dati.
Trovare lintervallo di fiducia quando o non nota
Intervallo di fiducia di =
x
t
-
s
N
N
zz
Esempio di calcolo degli intervalli di fiducia
Si considerino i seguenti risultati relativi al contenuto di alcol etilico in un campione di
sangue: 0.084%, 0.089%, 0.079%.
C l l li t ll di fid i l di l 95% d h Calcolare lintervallo di fiducia per la media al 95% assumendo che
a) dalle esperienze precedenti acquisite su un centinaio di campioni, si sa che la
deviazione std. del metodo s=0.005% una buona stima di o
b) I tre risultati ottenuti rappresentano il solo modo per valutare le precisione del metodo ) pp p p
Caso A
z
-
o
1.96
-
0.005
Intervallo di fiducia (95%) =
N
x
3
0.084
= =
0.084 0.006%
0.078 0.09
t
-
s
N
x
4.303
-
0.005
3
0.084
= =
0.084 0.012%
0 072 0 096 0.072 0.096
m i m i
y y x x
( )
=
2
m i
i
x x
m
m m
x m y b =
I calcoli sono normalmente eseguiti per mezzo di software commerciali.
i
COEFFICIENTE DI DETERMINAZIONE R
2
Per stabilire fino a che punto lequazione di Per stabilire fino a che punto l equazione di
regressione calcolata con il metodo dei minimi
quadrati pu essere usata al fine di prevedere un
valore di y conoscendo un determinato valore di x,
si calcola il parametro R
2
mediante la relazione:
[xy
-
(x)(y)
]
2
n
R
2
=
R
2
pu assumere valori tra 0 e 1
che indicano la bont
dellequazione calcolata
[x
2
-
(x)2
] [y
2
-
(y)2
]
2
n n
R
q
Es:
R
2
= 0 non ce alcuna relazione
tra le variabili x e y
R
2
= 1 perfetta relazione
tra le variabili x e y, quindi ad un
determinato valore di x esiste
l l d solo un valore di y
Accuratezza e Precisione!
RIASSUMENDO:
Selettivit
Sensibilit Sensibilit
Precisione
Accuratezza
ATTENDIBILITA
DI UN DATO
ANALITICO ANALITICO
Selettivit: indica la capacit per un metodo
analitico di riconoscere e/o quantificare una
i hi i i di lt h specie chimica in presenza di altre, che sono
potenzialmente in grado di falsare i risultati delle
analisi (interferenti). ( )
Sensibilit: la pendenza della curva di calibrazione in uno
specifico intervallo di concentrazione. Se la calibrazione
lineare la sensibilit il coefficiente angolare della retta di
l
e
lineare, la sensibilit il coefficiente angolare della retta di
calibrazione.
d
s
e
g
n
a
l
metodo a
metodo b
concentrazione
Errori casuali: controllo della precisione
La diminuzione della precisione viene segnalata dallaumento della La diminuzione della precisione viene segnalata dall aumento della
dispersione dei dati attorno al valore medio.
La distribuzione che generalmente rappresenta il risultato della
determinazione analitica quella gaussiana (o normale).
z
a
f
r
e
q
u
e
n
z
distribuzione
GAUSSIANA
di
y
=
f
= media
o
2
= varianza
o = dev. standard
x = risultato
(
(
=
2
2
) (
exp
2
1
) (
2
x
x f
funzione di
distribuzione
(
o
t o
2
2
2
normale
stima della media
=
n
i
i n x x /
i
stima della
varianza
) 1 /( ) (
2 2
=
n x x s
n
i
i
stima della stima della
deviazione
standard
) (
2
s s =
d i i d d l i deviazione standard relativa
percentuale (RSD%) o
coefficente di variazione
100 RSD% = x s
percentuale (CV%)
curva a:
media = 3.0
s 0 5
a
s = 0.5
RSD% = 10%
risultato = 3.0
0.5
curva b:
media = 3.0
b
media 3.0
s = 1.0
RSD% = 33%
risultato 3
1 risultato = 3
1
La precisione della stima a superiore a quella della stima b,
quindi il metodo che ha fornito il risultato a il pi preciso.
Controllare: Controllare:
precisione contenitori e distributori di volume
St bilit hi di i Stabilit apparecchi di misura
Eventuali contaminazioni dei reattivi e contenitori
Errori sistematici: esattezza (accuratezza)
Oltre agli ineludibili errori casuali, possono essere presenti errori
riproducibili che determinano uno scarto tra il valore vero della
quantit di analita presente ed il valore stimato espresso dalla
media=perdita di accuratezza quando viene denunciato uno
i i d i l i i ll di spostamento sistematico dei valori rispetto alla media.
Errori strumentali (errata calibrazione o taratura)
Errori operativi (utilizzo scorretto della strumentazione e delle
apparecchiature di laboratorio) pp )
Errori metodologici (procedure di analisi non adeguate)
Verifica periodica delle calibrazioni
Esperienza nella pratica di laboratorio
Utilizzo di materiali certificati