Escolar Documentos
Profissional Documentos
Cultura Documentos
Z- DISTRIBUCIJA
0.8
pnorm ( x 2 1)
dnorm ( x 2 1)
0.6
y
y 0.4
y
0.2
0
1 0 1 2 3 4
x x a b c
Distribution
Density
75%-tile
90%-tile
95%-tile
0.4
0.3
0.2
0.1
-3 -2 -1 1 2 3
KORELACIJA i REGRESIJA
i xi yi xi * yi xi 2 yi
2
0
1
...
n
in
i 1
y ax b
2
yi * xi xi * xi * yi
b
n * xi xi
2 2
n * xi * yi xi * yi
a
n* x x
i
2
i
2
1 r 1
Objašnjeno...odstupanje
R2
Ukupno...odstupanje
n- broj uređenih parova
r – koeficijent korelacije
n * xi * yi xi * yi
r
n * x x * n * y y
i
2
i
2
i
2
i
2
2 2 2
n
n ^ n ^
y y y y y y
i 1 i 1 i 1
SS(UKUPNO) = SS(NEOBJAŠNJENO )+SS(OBJAŠNJENO)
Napomene:
yˆ korelacijska...izracunata....vrijednost
y i tablicne...ili ...empirijske...vrijednosti
y prosjecna...vrijednost
INTERVALI POUZDANOSTI
S S
X Z / 2 * X Z / 2 *
n 1 n 1
S S
X t / 2 * X t / 2 *
n 1 n 1
pˆ * qˆ N n pˆ * qˆ N n
pˆ Z / 2 * * p pˆ Z / 2 * *
n N 1 n N 1
x x
X Z / 2 * X Z / 2 * ............. x S
n n
ANOVA
H 0 : 1 2 ...k
H1 : barem jedan i ; i 1,2,...k je različit
ANOVA
E
O-promatrana frekvencija
E – očekivana frekvencija
t
x1 x2 1 2
n1 1*S12 n2 1*S22 1 1
n1 n2 2
n1 n2
Testiranje proporcija
Napomene :
H 0 : p1 p 2 ..............H 1 : p1 p 2
p1 p2 ................. p1 p2
p1 p2 ................. p1 p2
xA x
ˆA
p ˆB B
............. p
nA nB
x A xB
p .......q 1 p
n1 n2
1 1
pˆ p
ˆB p * q *
n1 n2
A
z
ˆ
p A p
ˆ B p
A
0
pB
pˆ A p
ˆB
Napomene :
H0: = k H1 k
Napomene:
n 30
H 0 : A B ..............................................H1 : A B ................ A B ........ A B
A..........................................B........................................................... A B ....... A B
n A ....................................nB ........................................
x A ....................................xB ........................................
A ............ili ....S A ......... B .......................ili ............S B ...................
x A xB A B
z .................................x A xB ............( A B ) 0
X AXB
A2S1 B2S2
X AXB ......................................................................................
nA nB
A2 B2
2
X AXB
2
XA
2
XB
n1 n2
NUMERATOR df
1
DENOMINATOR df 2
df1 n1 1
S12
df 2 n2 1...............F 2
S2
H 0 : A2 B2 ................................H 1 : A2 B2
S12
F 2 .......U ..brojnik ...ide...onaj...koji... je...veci
S2
S 2 m2 m12 ...................df1 n1 1.........df 2 n2 1
t
xA xB 1 2
n1 1 * S A2 n2 1 * S B2 * 1 1
n1 n2 2 n1 n2
PRILOG ANOVA
ANOVA-1
H 0 : 1 2 ...... k
H 1 : i j .....za...najmanje... jedan... par... i , j
ni K ni K
xij K xij n i * xi
...........i 1,2,..., K ...............n ni ..............x
j 1 I 1 j 1
xi ......x i 1
ni i 1 n n
j 1 j 1
K
SSG ni * xi x .....SST SSW SSG
2
i 1
Zadatak-1.
U gornjem prozoru mišem selektiramo žuta polja u tablici 1. , čekiramo opciju Columns, čekiramo
polje Labels in first row, upišemo alfa 0,01 i dadnemo izlaz rezultata u New Worksheet Ply.
Pritisnemo gumb OK. Slijedi izlaz dolje u zelenom i plavom okviru Excela.
Tablica 1.
Izvršimo izračunavanja kalkulatorom1 da bi dobili izlaze u zelenom i plavom okviru tablice 1..
Tip A= 146,30/ 7 = 20,9..(D15) : Tip B=162,4/ 7 = 23,2...(D16) Tip: C= 137,4/ 6 = 22,9..(D17)
7 * 20,9 7 * 23,2 6 * 22,9
x 22,305
20(7 7 6)
SS1 22,2 20,9 19,9 20,9 ... 20,30 20,9 3,76
2 2 2
1
Oznake u zagradama su polja Excela
Za polazni primjer K=3 ;(Tip A , Tip B, i Tip C) razreda i n = 20 ; (7+7+6) vozača.Matrica ima 17
jer je zadnje polje matrice D8=0.df1=(K-1) = 2 ; df2= (n-K)= 20-3 = 17 (plava tablica 1.) .
Signifikantnost je 1% i to je unešeno u prozor Anova:Single Factor(Alpha:0,01).
Iz tablica u knjizi na str. 873 nalazimo; kolona 2, red 17, očitavamo 6,11.
Kako je MSG/MSW=15,04 > 6,11 odbacujemo nultu hipotezu.
Riječima bi rekli da se odbacuje hipoteza o tome da je potrošnja goriva za sva tri tipa automobila
jednaka.
Napomena:
Ako želimo tocniji rezultata za F-DISTRIBUCIJU možemo to očitati u Excelu.(iako već postoji na
plavoj podlozi Tablice 1. Fcrit..(G22))
Komanda: Insert/ Function ... i otvara se istoimeni prozor.
U padajućoj listi: Or select a category: stavimo Statistical
U polju:Select a function: kliknemo na FINV i gumb OK
Otvara se prozor: Function Arguments gdje unesemo u polja:0,01 : 2 ; 17, slijedi očitanje funkcije u
prozoru: 6,112113716
Zadatak-2. Četiri različite vrste pšenice su posijane na osam parcela zemljišta- svaka vrsta na po
dvije parcele.Prinosi u tonama su bili sljedeći:
A B C D
1 2 1 2
3 4 5 6
z časopisa: Priroda i društvo , Lutrijski vjesnik , i Turistički oglasnik uzeti su slučajni uzorci
I reklamnih tekstova, po njih 6 iz svakoga. U donjoj tablici daje se indeks „maglovitosti“
(nerazumijevanja ).
Trebamo još uraditi grafički prikaz standardnih devijacija. Standardna devijacija se računa preko
varijanse po formuli:
N
x x
2
i
i 1
ili je korijen iz varijance .Napomena : Ovo se racuna preko regresije.
N
35,023
Varijanca 7,0046
6 1
7,0046 2,6466 2,647
Analogno se računaju standardne devijacije i za ostala dva časopisa
1,44504 1,202
1,99364 1,412
Grafički prikaz pripadnih standardnih devijacija:
Grupa
Blok 1 2 ... K
n K *H
Ukupna : SST x ji x
K H
2
i 1 i 1
K
Medjugrupna : SSG H * ( xi x ) 2
i 1
H
Medjublocna : SSB K * xi x
2
j 1
i 1 j 1
Selektiramo mišem žuta polja u Excelu, čekiramo Labels, unesemo Alpha 0,05 , čekiramo
23,9 24,6 23,7 24,6 24,4 24,6 23,3 24,6 23,6 24,6 24,5 24,6
2 2 2 2 2 2
26 24,6 25,4 24,6 25,8 24,6 24,4 24,6 24,2 24,6 25,4 24,6 11,88
2 2 2 2 2 2
2 2 2
SSG 6 * 24,7 24,6 23,9 24,6 25,2 24,6 5,16....( B 47)
Primjetimo da se ova suma računa preko zelenih polja Awerage za klase A, B i C sa po 6 opažanja.
25,0 24,62 24,6 24,62 25,4 24,62 24,0 24,62 23,9 24,62
SSB 3 *
24,7 24,6 4,98
2
1,74
Se 0,4171
2*5
Može se nacrtati dijagram :Individual 95% Cis For Mean Based on Pooled StDev.(Automobili)
Automobila
Tip
Dijagram vozača;
Zapažanja kompjuterske obrade; MS = SS/ df
Sredine vozača date su u poljima Awerage zelene tablice.
Tako je za drugoga vozača Mean (24,7 23,7 25,4) / 3 24,6 ...(D33)
Varijanca prvoga vozača je izračunata.
Varijanca drugoga vozača je:
2 2 2
V 24,7 24,6 23,7 24,6 25,4 24,6 / 2 0,73 ...(E33)
Varijanca klase A je izračunata a slično dobivamo i za klasu B=0,22 (Stupac Variance,zelena tab.)
Sredina opažanja svih uzoraka uzetih zajedno:
x 25,0 24,6 25,4 24,0 23,9 24,7 / 6 24,6........... preko...Blokova
Se
25 24,62 24,6 24,62 25,4 24,62 24 24,62 23,9 24,62 24,7 24,62
6
S e 0,5259
Dijagram Individual 95% CIs For Mean Based on Pooled StDev. – Vozači
MSG = (SSG/K-1)=5,16/3-1=2,58
MSB = (SSB/H-1)= 4,98/6-1=0,996
MSE = (SSE/(K-1)*(H-1))=0,174
b) F-stupac
Napišimo usporednu tablicu i po pravilu ljevorukih (kod njih je lijeva ruka jača) odbacujemo
H0 i po redovima i po kolonama u komparaciji F i Fcrit.(Fcrit = F-Distribucija- tablična).
F P-value F crit
5,724138 0,009489 3,325835
14,82759 0,00102 4,102821
Zadatak 5. (ANOVA-1) Četiri servisa automobila na području županije tvrde da su jednako efikasna
u servisiranju vozila.Da bi provjerili tvrdnju, korisnici svakog servisa izabrani su nasumice i
priupitani o broju dana čekanja na servisu.Dobivena je sljedeća ANOVA tablica:
Source of variation df SS MS F p-value
Between Groups ? 23,37321 ?? ??? 0,001632
Within Groups 12 ? ??? 0,810514
Total ??????
Postoji li dokaz o razlici u prosječnom vremenu čekanja na servis? Razina signifikantnosti 5%.
Riješenje:
Zadatak 6.(ANOVA-1) Proizvođač žitnih pahuljica razmatra tri moguće boje za paketiće svojih
proizvoda- crvenu , žutu i plavu.Da bi utvrdio utječe li izbor boje na prodaju on je izabrao 16
trgovina približno jednake veličine.Paketići crvene boje poslani su u 6 od tih trgovina, žute u njih 5
i pleve u ostalih 5. Nakon nekoliko dana provjerene su prodane količine paketića pahuljica u svakoj
trgovini. Rezultati izraženi desecima paketića, prikazani su u pridruženoj tablici.
ANOVA-A, Sheet 1 .
Anova: Single
Factor
SUMMARY
Groups Count Sum Average Variance
Crveni 6 372 62 205,6
Zuti 5 265 53 261
Plavi 5 260 52 384
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 340,9375 2 170,46875 0,61421667 0,55604603 3,805565253
Within Groups 3608 13 277,5384615
Total 3948,9375 15
Rješenje
SS 2 52 53 37 53 38 53 64 53 74 53 1044
2 2 2 2 2
SS3 61 52 29 52 38 52 53 52 79 52 1536
2 2 2 2 2
Zadatak 7.(ANOVA-2) Vrednovana su četiri tipa gnojiva. Svaki tip primjenjen je na šest parcela
različitog sastava tla. Zatim je za 24 kombinacije tipa gnojiva i sastava tla mjeren postotak porasta
uroda kukuruza. Dobiveni rezultati sumirani su u pridruženoj tablici.
a) Sastav tla
Gnojivo A B C D E F
1 1 1 1 1 1 1
2 2 2 2 2 2 2
3 3 3 3 3 3 3
4 4 4 4 4 4 4
b) ??? 45,20 / 7,42 = 6,0916;gnojivo FK-1, (K-1)*(H-1) , 0.01 = F3,15,0.01=5,4169 (Odbaciti H0)
c) ????? 16,34 / 7,42 = 2,0222; tlo FK-1, (K-1)*(H-1) , 0.01=F5,15 0.05 =2,90129 ( Prihvatiti H0)
Napomena; Test gnojiva se odbacuje i za = 0,01 pa ga za = 0,05 ne treba ni isticati.
Zadatak 8. (ANOVA-2, jer se traže dva testiranja) Predavač kolegija iz ekonomije koristi tri
uđžbenika.On također provodi tri tipa ispita-test s više ponuđenih odgovora i eseja. Tijekom godine
on izlaže devet cjelina kolegija i svakoj slučajnim načinom pridružuje kombinaciju uđžbenik-ispit.
Na kraju on dobiva ocjene studenata za svaku cjelinu. One su prikazane u pridruženoj tablici.
Uđžbenik
Ispit A B C
Test s više odgovora 4,8 5,3 4,9
Esej 4,6 5,0 4,3
Mješoviti test 4,6 5,1 4,8
A 3 14 4,66666667 0,013333333
B 3 15,4 5,13333333 0,023333333
C 3 14 4,66666667 0,103333333
ANOVA
Source of Variation SS df MS F P-value F crit
Rows 0,202222222 2 0,10111111 5,2 0,07716 6,94427191
Columns 0,435555556 2 0,21777778 11,2 0,022957 6,94427191
Error 0,077777778 4 0,01944444
Total 0,715555556 8
MSG= SSG/(K-1)=0,21778
MSB=SSB/(H-1)=0,2022255/2 =0,101112
MSE= SSE/(K-1)*(H-1)=0,071711/4= 0,017928
Napomena:Ovdje postoje neslaganja zbog periodičnih brojeva, u odnosu na Excel.
Ovaj model daje dopunske informacije koje se ne mogu dobiti u rutinskim izračunavanjima
jer se neki interesantni momenti pod kvadratom okreći uvijek u pozitivu.
X ij Gi ij
je sredina opažanja svih uzoraka ( ne ovisi o indeksu)
Gi odstupanje između sredine populacije i-te grupe i ukupne sredine
ij slučajna varijabla sa sredinom nula.
SUMMARY
Groups Count Sum Average Variance
Priprema d.o. 6 62,41 10,40167 5,14181667
Pozor 6 42,27 7,045 4,76083
Sad 6 40,66 6,776667 8,12250667
ANOVA
Source of
Variation SS df MS F P-value F crit
Between Groups 48,95967778 2 24,47984 4,07427972 0,038614878 3,68232034
Within Groups 90,12576667 15 6,008384
Total 139,0854444 17
Nastavak zadatka;
a) Procijenite
b) Procijenite Gi za svaki od tri časopisa
c) Procijenite 13 faktor pogreške koji odgovara trećem opažanju(11,15) za časopis
Priprema (zapis je u matričnom elementu- prvi stupac, treći red)
Riješenje(zelena tablica)
a) je sredina opažanja svih uzoraka
=(10,40167+7,045+6,776667)/3= 8,07444
b) Priprema x 62,41 / 6 10,40167 Gˆ 1 10,40167 8,07444 2,3272
Pozor x 42,27 / 6 7,045 Gˆ 7,045 8,07444 1.0294
2
Zadatak 10. Ilustrirajte populacijski model za ANOVA-1 za zadatak 1.(potrošnja goriva za tri
različita automobila). Slijedi Excelovo izvješće.
Anova: Single
Factor
SUMMARY
Groups Count Sum Average Variance
Tip A 7 146,3 20,9 0,626666667
Tip B 7 162,4 23,2 0,826666667
Tip C 6 137,4 22,9 0,692
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 21,5495 2 10,77475 15,03864943 0,0001737 6,11211372
Within Groups 12,18 17 0,71647059
Total 33,7295 19
Zadatak 11. (ANOVA-2) Za uzorak podataka iz zadatka 8.(ANOVA-2) procjenite svaki faktor na
desnoj strani jednadžbe iz prethodnog zadatka za kombinaciju uđžbenika C i testa s više
ponuđenih odgovora.
Za bolju točnost krenut ćemo od rezultata Excelovog izvješća. MS = SS/ df
A 3 14 4,66666667 0,013333333
B 3 15,4 5,13333333 0,023333333
C 3 14 4,66666667 0,103333333
ANOVA
Source of Variation SS df MS F P-value F crit
Rows 0,202222222 2 0,10111111 5,2 0,07716 6,94427191
Columns 0,435555556 2 0,21777778 11,2 0,022957 6,94427191
Error 0,077777778 4 0,01944444
Total 0,715555556 8
MS = SS/ df ; F(Rows) = MS ( Rows) / MS (Error)
Za dvofaktorsku analizu varijance model populacije glasi (uz jasno definiranu desnu stranu) ;
H ij Gi j ij
U odnosu na jednofaktorsku anovu dodaje se parametar j koji predstavlja blokove.
Svi odgovori leže u zelenoj tablici.
31 4,9
4,8 5,3 4,9 / 3 4,9 4,3 4,8 / 3 0,0667
2
Zadatak 12. Pozovite se na zadatak WW i razmotrite opažanje koje uključuje grupu sa srednjim
primanjima i viskokim rezultatima testa TMS ( x22 = 3,5 ).
a) Procijenite
b) Procijenite i interpretirajte G2
c) Procijenite i interpretirajte 1
d) Procijenite 21
Signifikantnost je = 5%.
H0 bi prihvatili na Columns a odbacili na Rows.
Da bi odgovorili na zadatak potrebna nam je izlazna zelena tablica i postavljena tablica analize sa
usidrenim matričnim elementom ( x22 = 3,5). Kako se radi o ANOVA-2 , ili dvofaktorskoj analizi to
se usidrenom matričnom elementu dodaju analize po drugom stupcu i drugom redu , koje su radi
isticanja i kolorisane.
ANOVA
Source of
Variation SS df MS F P-value F crit
Rows 0,826666667 2 0,413333333 24,8 0,005569169 6,94427191
Columns 0,006666667 2 0,003333333 0,2 0,826446281 6,94427191
Error 0,066666667 4 0,016666667
Total 0,9 8
SSE
Se Error
K 1 * H 1 Se
3 1 * 3 1
0,06666666 / 4 0,1291
SSE SST SSG SSB
SSG 3 * 3,633333 3,3 3,366666 3,3 2,9 3,3
2 2 2
0,8266666 (Rows H=3)
3,7 3,4 2,9 3,6 3,2 3
2 2
SSB 3 * 3,3 3 * 0 3 * 3,3 0,0066666 (Columns K=3)
3 3
Provjera zadatka; 380+232+387 989 već 999. Radit ćemo kako gore stoji?
Riješenje ;
F6, 30, 0.05 = 2,421 F6, 30,0.01 = 3,473 Klase ; Ho odbacujemo za =1% i za =5%
Unutar grupa (klasa) postoji bitno neslaganje sredina po analizi varijance, dok unutar blokova
prihvaćamo Ho za 1% jer je tada 3,597 < 3,699 .
SLIKA
EXCEL
Komanda
Insert
Chart
Stand.Types
XY(Scatter)
Add
Trendline...
Standard
Coefficients Error t Stat
Intercept 4,8 2,297825059 2,088931871
x 2,8 0,692820323 4,041451884
x 5..........13,2 20 46,24
2
x 1
Ovaj rezultat je u tablici ANOVA , kolona SS .
OBJAŠNJENO ODSTUPANJE REGRESIJSKO
x 3....13,2 13,2 0
2
x 1
ObjasnjenoOdstupanje
Koeficijent determinacije R 2 78,4 / 92,8 0,844827
UkupnpOdstupanje
Nalazi se u tablici Regression Statistics, R Square.
Objašnjava da je 84,48 % totalnog odstupanja protumačeno regresijskom jednadžbom.
SS MS F
78,4 78,4 16,33333333=78,4/4,8
14,4 4,8= 14,4/3
Izračunajmo još regresijsku jednadžbu što je možda trebalo dati kao prvo;pogledajmo ulaznu žutu tablicu;
y ax b
2
yi * xi xi * xi * yi
b
n * xi xi
2
2
n * xi * yi xi * yi
a
n* x x i
2
i
2
Testiranje Regresije
Data je ulazna tablica za linearnu regresiju (žuta polja ) .Izračunati koeficijent korelacije r= ? ,
regresijsku jednadžbu ( a= ? i b = ? ) i testirati regresiju.
Standard
Coefficients Error t Stat P-value
Intercept 10,49877 2,406890767 4,361962 0,012044
x -0,17997 0,060006853 -2,99911 0,039977
Riješenje ;
n * xi xi
uređenih parova ulazne tablice ,
2 2
to jest na distribuciju „ n „ –a
koji izaziva najviše pogrešaka.
Potrebno je nadalje pravilno
razvrstati sume apscisa x na
kvadrat i sume apscisa već
n * xi * yi xi * yi
kvadrirane.Ako je negativan
koeficijent smijera pravca ( sa
a
x x
porastom x opada y ) tada se
2 2 koeficijent korelacije „ r “
n* i i tadođer uzima kao negativna
vrijednost jer dolazi ispod
drugoga korijena determinacije.
K renimo u proračun „ ab initio „ . U gornjoj tablici već je Excel poslao izvješće koje
praktično trebamo potvrditi računanjem pomoću kalkulatora. Prikazan je i graf tabličnih podataka i
regresijske jednadžbe i uočavamo da je koeficijent korelacije slabiji nego u prethodnom primjeru.
t 6-2, 0.0 05 = 4,604 pa se Ho odbacuje, na razini signifikantnosti 0,5% , jer postoji korelacija. iako su
neobjašnjena rezidualna odstupanja 30,7819 %.(1-0,692181)
Napomena; t-Distribucija2 se očita u Excelu preko komande ; Insert/Function.../Statistical/ TINV.
2
Obratite pažnju na ovu notu
F62, 0.01 4,60409 , Knjiga daje „VRŠNE TOČKE“ .Tablice su jače od računatoga.
d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano
0,1 0,05 0,025 0,01 0,005 Jednostrano
1 3,078 6,314 12,706 31,821 63,657
2 1,886 2,920 4,303 6,965 9,925
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
t- Stat je omjer
između Coefficients Studentovo obilježje t b1 Standardna pogreška procjene Se = 4,8 =2,19089023
i Standard Error
Signifance F = P- value ; Ako je ova vrijednost veća od 0,05
s b1 tada Pearsonov koeficijent linerne korelacije nije značajan
y 4.8 2,8 * x Standardna pogreška koeficijenta nagiba
( slab je ).Ovdje je P-value 0,027 a r = 0,919 (jaka korel.)
Koeficijent nagiba (tangens kuta ili prva derivacija ) , također se u zadacima testira.
Ako je koeficijent nagiba >0 (pozitivan) nezavisno promjenljiva na apscisi pozitivno utječe na zavisno promjenljivu ordinatu . To je
MS SS / df trend porasta u regresijskoj analizi bila ona linearna ili kvadratna.
Ako je koeficijent nagiba < 0 (negativan) , situacija je obrnuta. Napr. Sa povećanjem troškova na jedinicu proizvoda ( apscisa ) umanjuje
se i dobit na ordinati. Višestruka regresija ima više koeficijenata koji mogu biti i pozitivni i negativni.Ovdje je b=2,8
Zadatak III. Pretpostavimo da smo u sklopu jednostavne regresijske analize dobili ugođeni3
regresijski model.
yˆ i 22 8 * xi i da je tadođer
n
S e 3,45........x 11.......n 22.......... xi x 400 ( Napomena (Se)2=11.9025 )
2
i 1
Nađite 95%-tni prognostički interval pouzdanosti i 95% prognostički interval za točku za koju je
x= 17.
Riješenje:
a) 95% prognostički interval:
n 22. S 11.9025
2
1 1 ( 17.000 11.) S ( 2.086) 7.6686386798090595890
n 400.
n 22. S 11.9025
2
0 1 ( 17.000 11.) S ( 2.086) 2.6486842604326466538
n 400.
n 22. S 21806.
2
1 ( 12.000 10.799)
1 S 154.01065498729382175
n 34.110178
321
95% prognostički interval 6,501 6,180 6,822
1000
3
Postoje i robusni linearni modeli
Uradit ćemo t- test za 90% interval pouzdanosti. tn-2 , /2 = t3, 0.05 = 2,353
2,8-2,353*0,6928<1< 2,8+2,353*0,6928
1,169 < 1 < 4,431
Slijedi dijagramski prikaz: sb * t n 1, / 2
Grafički prikaz linearne regresije (kliknite mišem lijevo od slike kada se pojavi bijela
strelica)
VIŠESTRUKA REGRESIJA
Izlazni rezultata Excela za primjer višestruke regresije (Ulazna tablica je žuta boja )
Godina Prihod Br.Poslovnica Margina profita
1 3,92 7,298 0,75
2 3,61 6,855 0,71
3 3,32 6,636 0,66
4 3,07 6,506 0,61
5 3,06 6,45 0,7
6 3,11 6,402 0,72
7 3,21 6,368 0,77
8 3,26 6,34 0,74
9 3,42 6,349 0,9
10 3,42 6,352 0,82
11 3,45 6,361 0,75
12 3,58 6,369 0,77
13 3,66 6,546 0,78
14 3,78 6,672 0,84
15 3,82 6,89 0,79
16 3,97 7,115 0,7
17 4,07 7,327 0,68
18 4,25 7,546 0,72
19 4,41 7,931 0,55
20 4,49 8,097 0,63
21 4,7 8,468 0,56
22 4,58 8,717 0,41
23 4,69 8,991 0,51
24 4,71 9,179 0,47
25 4,78 9,318 0,32
SUMMARY OUTPUT 16,86
Regression Statistics
Napomena ; X1 = godišnji neto
Multiple R 0,930212915
prihod po euru depozita
R Square 0,865296068
Adjusted R X2 = broj kreditno-
Square 0,853050256 štednih poslovnica u tisućama
Standard Error 0,053302217 Y = godišnja margina
Observations 25 profita u tisućama
ANOVA
df SS MS F
Regression 2 0,40151122 0,20075561 70,66057082
Residual 22 0,06250478 0,002841126
Total 24 0,464016
Standard
Coefficients Error t Stat P-value
Intercept 1,564496771 0,079395981 19,70498685 1,81733E-15
Prihod 0,237197475 0,055559366 4,269261695 0,000312567
Br.Poslovnica -0,249079284 0,032048496 -7,771949195 9,50879E-08
Rješenje;
e) Svako jedinično povećanje prihoda ( X1) rezultira povećanjem stope profita za 0,237 ,
dok jedinično povećanje broja kreditno- štednih poslovnica ( X2), profit umanjuje za
0,000249.
f) Za X1 = 0 odrezak na osi Y , je 1,5645 uz uvijet da je X2 nepromijenjen.
g) Yˆ 1,5645 0,23719 * 3,20 0,2491 * 6,30 0,754
Od više izlaznih dijagrama koje nudi Excel predstavljen je sljedeći.Margina profita u ovisnosti o
broju poslovnica u tisućama.
4
U okviru prozora Anova; Two-Factor With Replication ... U polje Rows per sample: upišite broj 4, Alpha = 0.05
SUMMARY M Ž Total
Visoka sp.
Count 4 4 8
Sum 155 175 330
Average 38,75 43,75 41,25
Variance 8,916666667 7,58333333 14,21428571
Srednja sp.
Count 4 4 8
Sum 162 99 261
Average 40,5 24,75 32,625
Variance 9,666666667 16,9166667 82,26785714
Total
Count 8 8
Sum 317 274
Average 39,625 34,25
Variance 8,839285714 113,642857
ANOVA
Source of
Variation SS df MS F P-value F crit
Sample 297,5625 1 297,5625 27,626692 0,000202 4,747225
Columns 115,5625 1 115,5625 10,729207 0,006635 4,747225
Interaction 430,5625 1 430,5625 39,974855 3,82E-05 4,747225
Within 129,25 12 10,77083333
Total 972,9375 15
1) P-value iznosi 0,000202 (<0.05) pa zaključujemo da postoji statistički značajan utjecaj
stupnja obrazovanja na bodovni izvještaj ne uzimajući u obzir Spol već samo stručnu
spremu.Ispitanici visoke stručne spreme postigli su 330 bodova a srednje stručne
spreme 261 bod.(To je utjecaj BLOKOVA)
2) P-value iznosi 0,006635 (<0.05) što znači da postoji značajan utjecaj spola na bodove
informiranosti.
Muški su postigli 317 bodova a ženske 274 boda.(To je utjecaj KLASA- ne ovisi o
stupnju obrazovanja)
ANOVA
Source of Variation SS df MS F P-value F crit
Rows 316,4375 7 45,20536 1,400553 0,333933 3,787044
Columns 430,5625 1 430,5625 13,3397 0,008152 5,591448
Error 225,9375 7 32,27679
Total 972,9375 15
est bez utjecaja interakcije ( nema ni ponavljanja istih bodova unutar klasa) potvrđuje da nema
T nikakve statističke značajnosti između Rows ( P-value = 0.333933 a to je veće od 0,05 ), ili
bolje rečeno cure su za koplje ispred muškaraca po inteligenciji(ljepoti), pa nema nikakve
interakcije koja je već i u statističkome prilazu analize odbačena, za slučaj da je tablica drugačije
složena.
Zadatak.Daju se podaci o prosječnoj ocjeni na kraju studija ( plava polja ).Dva žuta ulaza su:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,682939609
R Square 0,466406509
Adjusted R Square 0,426881066
Standard Error 0,422281589
Observations 30
ANOVA
Significance
df SS MS F F
Regression 2 4,208449675 2,1042248 11,80016 0,000207655
Residual 27 4,814686991 0,1783217
Total 29 9,023136667
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
-
Intercept -2,990604458 1,538973446 -1,943246 0,062479 6,148317103 0,167108188
Prijemni na faksu 1,00635361 0,288877357 3,4836708 0,001703 0,413626239 1,59908098
Ocjena SR. Skola 0,498393135 0,434366897 1,1474013 0,261282 -0,39285411 1,389640379
MARKERI
1) Crveno – ocijene
studenata na
izlazu sa studija
između 4,0 i 5,0
2) Zeleno- ocijene
studenata na
izlazu sa studija
između 3,0 i 4,0
3) Plavo- ocijene
studenata na
(4,73:4,9:3,6) izlazu sa studije
između 2,0 i 3,0
(3,12:4.95:3,65) 4) Žuto – ravnina
regresijskog
polinoma u 3D .
5) Podaci triju
ulaznih varijabli
(x,y,z) još se
mogu u 3-D
vizuelizirati , ali
(2,84:4,7:3,45) ako su 4 ulaza u
Excelu, nema više
dijagramskih
prikaza u 3-D.
6) Pogled se još
mogao doraditi da
crvena kuglica ne
ostane među
zelenima
3-D pogled kroz ravninu regresijskog polinoma, kojeg ne može dati Excel.(Pogledajte stranu 114.)
Odgovori :
a) jednadžba višestruke regresije glasi: Yˆ 2,9906 1,0063 * X 1 0,4983 * X 2
gdje je X1-> prijemni na faksu ; X2-> ocijena iz srednje škole
b) Yˆ b0 b1 * X 1 b2 * X 2
I) b0 = Intercept = -2,990604458 ;Ako bi bilo X1=0 , tada bi student sa negativnom ocijenom završio
fakultet ili bolje rečeno ne bi završio studij.
II) b1 = 1,00635361 povećanjem broja bodova na razredbenom ispitu povećava se i broj bodova na
kraju studija.( b1>0 )- Ako se na razredbenom ispitu poveća broj bodova za 1 tada se završna ocijena na
kraju studija poveća za 1,006.( uz nepromijenjen b2 uz X2) (1*1,0063 1,0)
e) P(b1) = 0,001703 , što je manje od 0,01 , pa X1 značajno utječe na završnu ocjenu studija
P(b2) = 0,261282 , što je veće od 0,05 , pa X2 ne utječe značajno na završnu ocjenu studija
f) očekivana prosječna ocjena studenta koji je na razredbenom ispitu skupio 5,5 bodova a
iz srednje škole došao sa prosjekom ocjena 3,80 iznosi ;
Yˆ 2,9906 1,0063 * 5,5 0,4983 * 3,80 4,438
Uz pouzdanost 99% očekujemo da se ukupna težina gipsa u svih 2000 kutija zajedno kreće između
999,5 i 1000,5 kilograma5.
5
Gornji ispis ističe matematičke funkcije pa je tako vidljiv log to jest logaritam.
f
Yˆ 1,56449 0,23719 * X 1 0,24908 * X 2
Višestruka regresija u 3-D je ravnina.
U gornjrm zapisu
1.
ostoji zabrinutost u pogledu brzine automobila na određenom dijelu autoceste. Za slučajni
P uzorak od sedam automobila radar je utvrdio sljedeće brzine, mjerene u kilometrima na sat:
79 73 68 77 86 71 69
6241 5329 4624 5929 7396 5041 4761
x xi 2 245,428
DopPogr 2,447 * n 1 2,447 * 6 5,9150
7 7
c1= 74,7143- 5,9150 = 68,7993 c2 = 74,7143+ 5,9150 = 80,6293
Varijanca uzorka
e) 245,428/6 = 40,90476 standardna devijacija uzorka= 40,90476 6,395
Varijanca populacije
e) VAR = 5617,286 74,7143 35,0593
2
2.
olitičar želi procijeniti proporcijski udio birača koji bi podržali kontroverzni zakonski
P prijedlog. Pretpostavimo da se zahtijeva 99% interval pouzdanosti koji se na svaku stranu od
proporcijskog udjela u uzorku prostire za najviše 0,05. Koliko opažanja mora sadržavati uzorak da
bi se to osiguralo?
a) (99/2*100) = 0,495 u tablicama nalazimo
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
Interpolacija
(0,4951 0,4949) * x 0,07 0,02 * 0,07 0,0001
0,495 0,4949 odakle....x 0,075
0,08 0,07 0,02
3.
ačunovođa neke tvrtke je utvrdio da prosječni iznos kratkoročnih obveza tvrtke po
R računu iznosi 125,32 EURA. Revizor je provjerio slučajni uzorak od 16 računa.
Njegova sredina je iznosila 131,78 EURA, a standardna devijacija 25,41 EURO.
Pretpostavite da je distribucija populacije normalna. Uz razinu signifikantnosti od 5%
testirajte nultu hipotezu koja kaže da sredina populacije iznosi 125,32 EURA, nasuprot
njezinoj dvosmjernoj alternativnoj hipotezi.
H0 = MI = 125,32
H1 = MI nije jednako 125,32
Alfa = 0,05
t* = 1,017 racunato
t15,0,025 = 2,131 tablica
Tablica> racunato Ho se ne odbacuje !
=0,05
t* =
131,78 125,32 1,0169 racunato
25,41 * 16
Tablica t-Distribucije t0,05 ; 16-1= t0,05 ; 15 = 2,131
0,05
n1 14.....................n2 15.....................H 0 : 1 2 .......................H 1 : 1 2
x1 200..................x 2 180....................H 0 : 12 22 ......................H 1 : 12 22
S1 30...................S 2 50
S 22 50 2 x1 x2 0
Ftest 2,7.............t test 1.3
S12 30 2 n1 1S12 n2 1S 22 1 1
n1 n2 2 n1 n2
Vidjeti..Slike..Tablicne..Vrijednosti..vece..od ..racunatih... Pr ihvaca..se..H 0 .
Pr osjecna.. prodaja..igracaka..u..dvije..smjene..se..ne..razlikuje.
= 0,025
Funkcija gustoce vjerojatnosti
df = 14+15 -2 = 27 ; = 0,025
Funkcija gustoce vjerojatnosti
4.
oduzeće je ocijenilo funkciju potražnje za svojim proizvodom: ovisno o njegovoj cijeni i
P dohotku potencijalnih kupaca, na uzorku prodaja u zadnjih 20 godina. Excel ispis rezultata
regresije je prikazan u sljedećoj tablici:
a) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku obje nezavisne
(egzogene) varijable objašnjavaju potražnju za proizvodom promatranog poduzeća?
b) Ispišite regresijsku jednadžbu i interpretirajte koeficijente!
c) Interpretirajte pokazatelj Multiple R iz ANOVA tablice!
d) Možete li na temelju t-statistike koeficijenata smjera ustanoviti da obje egzogene varijable,
na razini značajnosti od 5%, pridonose očekivanoj potražnji za proizvodom ovog poduzeća.
Objasnite !
e) U ANOVA tablici interpretirajte razinu signifikantnosti (p-vrijednost) za F statistiku.
Napišite odgovarajuće hipoteze. Odgovor potkrijepite grafički!
Regression Statistics
Multiple R 0,98
R Square 0,97
Adjusted R Square 0,96
Standard Error 7,20
Observations 20,00
ANOVA
df SS MS F Significance F
Regression 2,00 26884,30 13442,15 258,94 0,00
Residual 17,00 882,50 51,91
Total 19,00 27766,80
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
Intercept 114,07 29,93 3,81 0,0014 50,92 177,22
X Variable 1 -9,47 1,82 -5,20 0,0001 -13,31 -5,63
X Variable 2 0,03 0,01 4,51 0,0003 0,02 0,04
c) iznosi 0,98 pa je korelacija izuzetno jaka , ili korigirani koeficijent multiple determinacije je
0,97-0,96 = 0,01 .
Adjusted R Square = 0,96 ; 96% varijance protumaceno je regresijskim modelom
d) ) Lower 95%, sto znaci da je = 0,05 .Pokazatelji P- value su gore markirani crvenom bojom.
Oni trebaju biti manji od 0,05 da bi znacajno utjecali statisticki na regresijsku analizu to jest na zavisnu varijablu.
Prema tome nezavisne varijable X1 i X2 znacajno utjecu na zavisnu varijablu .0,0001<0,05 I 0,0003<0,05
Pripreme za ispit
1.
retpostavimo da Ministarstvo zdravstva vjeruje da će epidemija gripe biti manjeg intenziteta
P nego li u istom lanjskom razdoblju. Stanovništvo grada Zagreba je pitano hoće li ta novost
utjecati na njih da odustanu od cijepljenja protiv gripe. Ako je samo 40 ljudi iz slučajno odabranog
uzorka od njih 246 izjavilo da sada više ne bi htjeli biti cijepljeni protiv gripe, procijenite 98%-tnom
pouzdanošću proporcijski udio svih stanovnika grada Zagreba koji cijepljenje smatraju
nepotrebnim.
n= 246
p "kapa" = 0,1626
z0,01 = 2,3263
SG = 0,0235
c1 = 0,1079 c2 = 0,2173
98/(2*100) = 0,490
z 0,00 0,01 0,02 0,03
2,3 0,4893 0,4896 0,4898 0,4901
Interpolacija
2,3+0,0267 = 2,3267
SG
1 0,1626 * 0,1626 0,0235
246
2.
nedavnoj anketi potpora unutarnjoj politici premijera iznosila je 65%. Dopuštena pogreška
U iznosila je 0,035. Kolika veličina uzorka je korištena ako smo pretpostavili 95%-tnu razinu
pouzdanosti?
z0,025 = 1,9600
n= 713,4138 Slijedi n = 714
95/(2*100) = 0,475
TABLICA
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2
1,960
n = 0,65 * 1 0,65 * 713,44 714 zaokruzuje se na prvi cijeli broj čovjeka.
0,035
3.
vrtka koja prodaje programski paket iz domene e-poslovanja reklamira se tvrdnjom da će
T tvrtke koje taj paket koriste ostvariti prve godine prinos od najmanje 10% na svoju inicijalnu
investiciju. Slučajni uzorak od 10 tvrtki iskazao je sljedeće postotne povrate inicijalne investicije
nakon prve godine korištenja programa:
6,1 9,2 11,5 8,6 12,1 3,9 8,4 10,1 9,4 8,9
Zadatak 3 1 6,1
H0 = MI >= 10,00 2 9,2
H1 = MI < 10,00 3 11,5
Alfa = 0,10 4 8,6
t* = -1,554 racunato 5 12,1
t 9 ,0,05 = 1,833 Tablicno 6 3,9
Ho se ne odbacuje ! 7 8,4
8 10,1
9 9,4
10 8,9
Prosjek = 8,82
SD uzorka = 2,4013
6 ,1 9 , 2 11, 58, 6 12,1 3, 9 8, 4 10,1 9 , 4 8, 9
Prosjek = 10 8,82
SD uzorka =
8,82 6,12 0,1444 7,1824 0,0484 10,7584 24,2064 0,1764
1,6384 0,3364
2,4012
10 1
t*=
8,82 10 * 10
0,1554 racunato za 10 tvrtki
2,4012
Tablicno ocitavanje t 9 ; 0.05
d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano
0,1 0,05 0,025 0,01 0,005 Jednostrano
9 1,383 1,833 2,262 2,821 3,250
4.
oduzeće je ocijenilo funkciju potražnje za svojim proizvodom: ovisno o njegovoj cijeni,
P dohotku potencijalnih kupaca i cijeni povezanog dobra, na uzorku prodaja u zadnjih 20 godina.
Excel ispis rezultata regresije je prikazan u sljedećoj tablici6:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,9844
R Square 0,9691
Adjusted R Square 0,9633
Standard Error 7,3216
Observations 20
ANOVA
df SS MS F Significance F
Regression 3 26909,11666 8969,71 167,33 2,72842E-12
Residual 16 857,6833356 53,6052
Total 19 27766,8
f)Da .Sa 96,91% su objasnjena odstupanja potrazivanja u odnosu na sve tri nezavisne
varijable.
6
Za opširnu diskusiju pogledajte Elaborat na stranicama 51-53.
i) Lower 95%, sto znaci da je = 0,05 .Pokazatelji P- value su gore markirani crvenom bojom.Oni trebaju biti
manji od 0,05 da bi znacajno utjecali na regresijsku analizu to jest na zavisnu varijablu. Prema tome nezavisne varijable
X1 i X2 znacajno utjecu na zavisnu varijablu , dok varijabla X3 nema statisticki znacajan utjecaj na zavisnu varijablu.
F
8969,74 167,33..............F ?
j) 1, n 4, 0.05
53,6052
Tablice F1, n-4 0,05 = 4,49 to jest F1, 16 0,05 = 4,49 (20 observacija umanjene za 4 i to ;
Intercept , X Variable 1 , X Variable 2 , X Variable 3 )
Pripreme za ispit
1.
oznato je da je standardna devijacija volumena vode za piće u bocama od 710-ml, koje puni
P određena tvrtka, jednaka 6 ml. Slučajno je izabran uzorak od devedeset boca i izmjeren
volumen u njima:
a) Nađite vrijednost z-statistike (zα/2) za 90% interval pouzdanosti za sredinu volumena boca
u cijeloj populaciji.
b) Izračunajte standardnu pogrešku za sredinu volumena boca
c) Izračunajte širinu 90%-nog intervala pouzdanosti za sredinu volumena boca vode u
populaciji.
d) Izračunajte donju i gornju granicu intervala pouzdanosti.
Rijesenja;
Interpolacija7
(0,4505 0,4495) * x 0,04 0,0005 0,004
0,450 0,4495 odakle....x 0,045
0,05 0,04 0,1
b) 90 6 / 90 0,63246
2.
1,96 0,09 2
a) N = 97563, pq = 0,09, d = 0,025, z0,025 = 1,96 n0 = [ ] = 553 f0 = 553/97563 =
0,025
0,00555<0,05, n = n0 velicina uzorka za statisticku obradu = 553
7
Gornja z vrijednost je izracunata u Excelu pa zato nije ni data sirina intervala koja može proizaći i iz interpolacije
b) p
65
, p 0,11754 , q 1 pˆ 0,88246 ,
pq = 0,01371
553 p n0 1
P( - z0,025 ) < p < P( + z0,025 ) P(0,09067<p<0,14441) = 0,95 !
p p p p
pˆ z 0,025 * pˆ p pˆ z0,025 * pˆ
Granice prihoda od 906,7 eura do 1444 eura. (Pomnozene sa 10 000 ).
Interpolacija u tablici :Segmenti povrsina ispod Normalne krivulje
y x
0,0 0,5
0,09067 x=!
0,10 0,4602
(0,10 0,0) * x 0,5 1,2563 0,09067
0,09067 0,0 odakle....x 2 * 0,4639 0,9278
0,4602 0,5 2,51256
3.
a) Uz 1%-tnu razinu signifikantnosti testirajte nultu hipotezu koja kaže da sredina populacije
iznosi 4, nasuprot njezinoj dvosmjernoj alternativnoj hipotezi.
b) Uz razinu8 signifikantnosti od 1% nađite vjerojatnost prihvaćanje nulte hipoteze u slučaju da
je stvarna sredina odgovora jednaka 3,95.
a)
x4
-2,576 < < 2,576 => DKG = 3,914; GKG = 4,086, Prihvaća se H1 hipoteza
1,32 / 1562
3,914 4,086
3,914<4<4,086.......... 4,0
2
8
To je zapravo “ snaga testa“, knjiga strana 356.
y x
1,0 0,8413
1,08 x=!
1,1 0,8643
y2 y1
y y1 * x x1
x2 x1
4.
F = 7,85 R2 = 09052
gdje su: C – potrošnja kućanstava, DIH – raspoloživi dohodak kućanstava, M – oročeni depoziti
kućanstava u poslovnim bankama. Brojevi u zagradama su standardne greške koeficijenata regresije
a) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku obje nezavisne
varijable: DIH i M objašnjavaju potrošnju kućanstava?
b) Možete li na razini signifikantnosti od 5% utvrditi da obje varijable: i DIH i M, doista,
utječu na potrošnju kućanstava (C)?
c) Što u smislu snage objašnjavanja potrošnje kućanstava, dvjema gore ispitivanim nezavisnim
varijablama, govori empirijska F statistika: uz pretpostavljenu razinu signifikantnosti od
95%?
d) Ako raspoloživi dohodak kućanstava iznosi 200 milijardi EURA, a oročeni depoziti
kućanstava 50 milijardi EURA, koliko bi (prema gornjoj jednadžbi) trebala iznositi
potrošnja kućanstava?
ANOVA i REGRESIJA
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,7304
R Square 0,5335
Adjusted R Square 0,5001
Standard Error 1,8164
Observations 16
ANOVA
Significance
df SS MS F F
Regression 1 52,8118 52,8118 16,0076 0,0013
Residual 14 46,1882 3,2992
Total 15 99
Standard Upper
Coefficients Error t Stat P-value Lower 95% 95%
Intercept 11,90 0,9525 12,4934 0,0000 9,8571 13,9429
X Variable 1 0,394 0,0985 4,0010 0,0013 0,1828 0,6054
Primjedba : 4,0010 ^2 = 16,0076 (pogledajte žuta polja)
k) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku varijabla
vrijeme, iskazana u tromjesečjima, objašnjava prodaju električne energije u GWh ?
l) Ispišite regresijsku jednadžbu i interpretirajte koeficijente!
m) Interpretirajte pokazatelj Multiple R iz ANOVA tablice!
n) Možete li na temelju t-statistike koeficijenta smjera ustanoviti da vrijeme, na razini
značajnosti od 5%, pridonosi očekivanoj prodaji električne energije. Objasnite !
o) U ANOVA tablici interpretirajte razinu signifikantnosti (p-vrijednost) za F statistiku.
Napišite odgovarajuće hipoteze. Odgovor potkrijepite grafički!
Za opširnu diskusiju pogledajte Elaborat na stranicama 51-53. kao i tablicu na str. 41.
F14, 0.05 = 2,145 , Tablična vrijednost manja od računate, H0 se odbacuje , što znači da se
može prihvatiti činjenica da vrijeme utječe na prodaju električne energije.
d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano
0,1 0,05 0,025 0,01 0,005 Jednostrano
14 1,345 1,761 2,145 2,624 2,977
3,2992
F1, 14 , 0.05 = 4,60 pa se H0 odbacuje a prihvaća hipoteza o već spomenutom statičkom
utjecaju .(16 observacija -2 zbog linearnosti = 14 redova u F-tablicama sa 1 stupcem).
Priprema za ispit
1.
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
9
Dolazak do povrsina razlicitim metodama
2.
/ 2V 1,96*1
2
2
z 6147
n 0,025
, n0 = 6147, f0 = =0,09811
62653
dr
0
f0 > 0,05, n= n 0
=
6147
=5598.
1 0,09811
1 n 0
10
To je zapravo jednadžba pravca kroz dvije točke
3.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
0,45 0,4495
0,4505 0,4495 * x 0,04 ....x 0,0005 0,004 0,045
0,05 0,04 0,1
Z0,05 = 1,6+0,045 = 1,645; tablična vrijednost
50 / 150 0,25
Računata vrijednost z =2,356 => H0 se odbija.
0,25 * 0,75 / 150
4.
F = 8,25 R2 = 09137
gdje su: I – bruto investicije poduzeća, QGP– kvartalni BDP-ovi, i – prosječni dugoročni
kamatnjaci u poslovnim bankama. Brojevi u zagradama su standardne greške koeficijenata regresije
e) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku obje nezavisne
varijable: QGP i i objašnjavaju bruto investicije poduzeća?
f) Možete li na razini signifikantnosti od 5% utvrditi da obje varijable: i QGP i i, doista, utječu
na bruto investidije poduzeća (I) ?
11
To je zapravo jednadžba pravca kroz dvije točke
g) F = 8,25 ( treba biti veći od jedan) i na njega u nazivniku utječe rezidual obrnuto proporcionalno
, što je vidljivo i u F-statistici , da je jedna nezavisna varijabla blizo granice statističkog utjecaja a
druga nezavisna varijabla izvan dosega statističkog utjecaja za signifikantnost 5%., Ako se misli na
snagu testa :
I) Snaga testa je veća što je stvarna sredina udaljenija od hipotetske sredina
II) Što je razina singnifiksntnodti testa () manja (Snaga = 1- )
xC
P * z
/ n
III) Što je varijanca populacije veća
IV)Što je uzorak veći
12
Ne zaboravite iznad I staviti znak ^ koji interpretira regresijsku jednadžbu
ANOVA i REGRESIJA
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,9226
R Square 0,8512
Adjusted R
Square 0,8326
Standard Error 2,8607
Observations 10
ANOVA
Significance
df SS MS F F
Regression 1 374,533 374,533 45,768 0,000
Residual 8 65,467 8,183
Total 9 440,000
Standard Upper
Coefficients Error t Stat P-value Lower 95% 95%
Intercept 7,60 6,33 1,20 0,26440 -7,00 22,20
X Variable 1 3,53 0,52 6,77 0,00014 2,33 4,74
Primjedba; 6,77^2 = 45,768 , Pogledajte žuta polja ( to je uvijek za linearnu regresiju)
a) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku izdaci za
reklamu objašnjavaju visinu prodaje (prihoda poduzeća),
b) Ispišite regresijsku jednadžbu i interpretirajte koeficijente!
c) Interpretirajte pokazatelj Multiple R iz ANOVA tablice!
d) Možete li na temelju t-statistike koeficijenta smjera ustanoviti da izdaci za reklamu
značajno, na razini značajnosti od 5%, pridonose prodaji. Objasnite !
e) U ANOVA tablici interpretirajte razinu signifikantnosti (p-vrijednost) za F statistiku.
Napišite odgovarajuće hipoteze. Odgovor potkrijepite grafički!
(Pogledati stranice 38, 41 - 43, i 53)
a) Da. R2 = 0,8512 što govori u prilog daj e 85,12 % objašnjeno regresijsko odstupanje, ili da je
sa istim postotkom obuhvaćeno obješnjenje o utjecaju reklama na prihod poduzeća.
b) yˆ 7,60 3,53 * X 1 u ;gdje je „u “ rezidualno odstupanje. Varijabla X1 , izdaci za
reklame , utječe upravo proporcionalno na prihod poduzeća , to jest povećanim ulaganjem u
reklame možemo očekivati i povećanje prihoda poduzeća.
r* n2
t .......r 0,8512 0,9226.........n 10
1 r2
d) + jer je tg ispred X1 pozitivan(3,53)
0,9226 * 10 2
t 6,765
1 0,8512
2 2
Iskustveno pravilo r 0,63245
n 10
Tablična vrijednost je: F8, 0.05 = 2,306 pa se prihvaća H1 (Tablice jače od računatog)
Nultu hipotezu možemo odbaciti jer postoje čvrsti dokazi o linearnosti veze X1 i Y.
2 DISTRIBUCI JA
A
nalizira se uspjeh studenata na ispitu iz matematike u ovisnosti o predznanju
algebre.Studenti iz dvije grupe se analiziraju; oni koji su slušali matematiku do jedne
godine i oni koji su slušali dvije i više godine. = 5%.Rezultati su predstavljeni u tablici.
20 * 75 30 * 75 75 * 75 75 * 75
E11 6......E12 9....E13 22,5....E14 22,5, , , , , , ,
250 250 250 250
20 *175 30 *175 75 *175 75 * 75
E 21 14..E 22 21..E 23 52,5..E 24 52,5, , , , , ,
250 250 250 250
2
5 6
2
20 9
2
35 22,5
2
10 22,5
2
5 15
2
6 9 22,5 22,5 15
15 142 10 212 40 52,52 65 52,52 45 352 48,809
14 21 52,5 52,5 35
Chi 2 Distribucija
Kritične vrijednosti - Desnostrani test
- razina signifikantnosti
d.f. 0,10 0,05 0,025 0,02 0,01 0,005
,,, ,,, ,,, ,,, ,,, ,,, ,,,
4 7,7794 9,4877 11,1433 11,6678 13,2767 14,8603
Kako je tablična vrijednost 9,4877 manja od računate 48,809 , prihvaćamo hipotezu da postoji
zavisnost između bodova i godina učenja algebre (H1).Pogledajte dolje očitavanje funkcije i grafički
prikaz .(1-0.05 = 0.95).
0.8
Probability = 0,995
alfa = 0,005
0.6
Degrees of freedom = 4
Tab. vrijed.=14,860
0.4
0.2
0
0 5 10 15 20 25
0.15
Probability = 0,995
alfa = 0,005
0.1 Degrees of freedom = 4
Tab. vrijed.= 14,8603
Density = 0,0022034
0.05
0
0 5 10 15 20 25
0.2
0.05
0
0 5 10 15 20 25
F DISTRIBUCI JA
nvestitor prosuđuje istinitost informacije da su dionice ALB i SEP jednake rizičnosti. U tu svrhu
I izabran je slučajni uzorak od 17 prosječnih zaključanih ocjen dionica ALB na burzi koje je
rezultirao prosječnom zaključnom cijenom od 12,5 E s prosječnim odstupanjem od 2,5 E. U uzorku
26 prosječnih zaključnih cijena dionice SEP ustanovljena je prosječna zaključna cijena od 14 E , s
prosječnim odstupanjem od 2,2 E. Do kojeg je zaključka došao na razini signifikantnosti od 10%.
= 10% /2 = 5%
ALB SEP
n1 17 n2 26
x1 12,5E x 2 14 E
S1 2,5 S 2 2,2
10% 10%
/ 2 5% / 2 5%
df1 17 1 16 df 2 26 1 25
Columns Rows
2
S 2 2,5
F 12 1,29 Računata
S 2 2,2
Alfa = 0,05
Broj stupnjeva slobode df1 (Deg_freedom1- Columns)
,,,,,,,,,,,,, ,,,,,,,, 12 15 16 20 ,,,,,,,,,,,,,,
25 ,,,,,,,, 2,16 2,09 x=? 2,01 ,,,,,,,,,,,,,,,
,,,,,,,,,,,,, ,,,,,,,, Točka 1 Točka 2 ,,,,,,,,,,,,,,,
F(16, 25) 2,09 ; već ova poredba govori o prihvaćanju H0 (tablična vrijednost veća od računate)
Ako želimo interpolaciju, koja ovdije nije potrebna:
16 15
20 15 * x 2,09........x 1 130,625 2,074
2,01 2,09 62,5
Excel daje rezultat; Komanda;
Postavite Hipotezu
I II III
H 0 : P P0 H 0 : P P0 H 0 : P P0
H 1 : P P0 H 1 : P P0 H 1 : P P0
Zadajte
1 P0 * P0
pˆ
n
I Tip III
Hipoteze
II
Toolboxes / Statistics
Probability / Distributions
Uzmite: x2 2 / n DA NE Uzmite: s x2 s 2 / n
2 poznato ?
Standardna normalna distribucija Z Studentova t- Distribucija
II II
Izračunajte Izračunajte Izračunajte Izračunajte Izračunajte Izračunajte
kritične kritičnu kritičnu kritične kritičnu kritičnu
vrijednosti vrijednost vrijednost vrijednosti vrijednost vrijednost
xU 0 z / 2 * x xCrit 0 z * x xCrit 0 z * x xU 0 t / 2 * sx xCrit 0 t * s x xCrit 0 t * s x
x L 0 z / 2 * x xL 0 t / 2 * sx
Pravilo
Pravilo odlučivanja
odlučivanja Pravilo odlučivanja Pravilo odlučivanja Pravilo odlučivanja Pravilo odlučivanja Pravilo odlučivanja
AkojejexxxxUiliili
Ako Ako je x xCrit Ako je x xCrit Ako je x xU ili Ako je x xCrit Ako je x xCrit
U
xxL
xx x xL
L
Odbaciti HH00 Odbaciti H0 Odbaciti H0 Odbaciti H0 Odbaciti H0 Odbaciti H0
Odbaciti Prihvatiti H1 Prihvatiti H1 Prihvatiti H1 Prihvatiti H1
PrihvatitiHH11
Prihvatiti Prihvatiti H1
a qnorm(0.75 2 1) a 2.674
b qnorm(0.9 2 1) b 3.282
c qnorm(0.95 2 1) c 3.645
y 0 1
z-Distribucija
0.8
pnorm ( x 2 1)
dnorm ( x 2 1)
0.6
y
y 0.4
y
0.2
0
1 0 1 2 3 4
x x a b c
Distribution
Density
75%-tile
90%-tile
95%-tile
<<Statistics`ANOVA`
onewaydata = {{1,15.75}, {1,11.55}, {1,11.16}, {1,9.92},
{1,9.23}, {1,8.20}, {2,12.63}, {2,11.46}, {2,10.77}, {2,9.93},
{2,9.87}, {2,9.42}, {3,9.27}, {3,8.28}, {3,8.15}, {3,6.37},
{3,6.37}, {3,5.66}};
ANOVA[onewaydata]
ANOVA
DF SumOfSq MeanSq FRatio PValue
Model 2 48.5287 24.2644 6.97021 0.00723432
,
Error 15 52.2173 3.48115
Total 17 100.746
All 9.66611
Model 1 10.9683
CellMeans
Model 2 10.68
Model 3 7.35
SUMMARY
Groups Count Sum Average Variance
Priroda i drustvo 6 65,81 10,96833 7,004777
Lutrijski 6 64,08 10,68 1,44504
Turisricki 6 44,1 7,35 1,99364
ANOVA EXCEL
Source of
Variation SS df MS F P-value F crit
Between Groups 48,52874 2 24,26437 6,970213 0,007234 3,68232
Within Groups 52,21728 15 3,481152
Total 100,746 17
ANOVA- prvi metod
ANOVA
DF SumOfSq MeanSq FRatio PValue
Model 2 48.5287 24.2644 6.97021 0.00723432
,
Error 15 52.2173 3.48115
Total 17 100.746
All 9.66611
Model 1 10.9683
CellMeans
Model 2 10.68
Model 3 7.35
ANOVA –drugi metod
15.75 12.63 9.27
11.55 11.46 8.28
D 11.16
D 10.77
D 8.15
0 9.92 1 9.93 2 6.37
9.23 9.87 6.37
8.20 9.42 5.66
ANOVA D n total 0
SX 0
SX2 0
T0
for i 0 last ( D)
SDi Di
nDi length D i
SX SX SDi
SX2 SX2 D D
i
i
2
SDi
TT
nDi
n total n total nDi
2
SX
SSfactor T
n total
SSerror SX2 T
2
SX
SStotal SX2
n total
dffactor length ( D) 1
dftotal n total 1
SSfactor
SSfactor dffactor
dffactor
Analysis SSerror
0 SSerror dferror
dferror
SS
total dftotal 0
Analysis 00 2
Analysis
1
Analysis 01 2
Analysis qF 1 dffactor dferror
2
Analysis Analysis Analysis
3 1 2
Analysis
48.528744 2 24.264372
ANOVA D 0 52.217283 15 3.481152
100.746028 17 0
ANOVA EXCEL
Source of
Variation SS df MS F P-value F crit
Between Groups 48,52874 2 24,26437 6,970213 0,007234 6,3588735
Within Groups 52,21728 15 3,481152
Total 100,746 17
{3,3}
ANOVA D 6.970213 The observed F statistic
6.358873 The critical F quantile
0
ANOVA D 1 6.970213
ANOVA D 2 6.358873 Excel F(2,15, 0.01)=6,358873481
ANOVA D 3 0
Gamma funkcija
1 2.6372245085205841239 Pi 8.2850851418352201651
4.251 x 585 2
2
x e dx
256 3
0
4
1
2.
585 2
2.6372245085205841239
256. 3
4.
10
8.13 (4.25,0)
6.25
4.38
( z) 2.5
0.63
1.25
3.13
5
4 2.63 1.25 0.13 1.5 2.88 4.25 5.63 7
z
<<Statistics`LinearRegression`
data = {{0.055, 90}, {0.091, 97}, {0.138, 107},
{0.167, 124}, {0.182, 142}, {0.211, 150},
{0.232, 172}, {0.248, 189}, {0.284, 209},
{0.351, 253}};
(regress = Regress[data, {1, x}, x];
Chop[regress, 10^(-6)])
225
200
175
150
125
100
0.05 0.15 0.2 0.25 0.3 0.35
Graphics
EXCEL X Y Alpha =0,05
0,055 90 Estimate
0,091 97 Coefficients
0,138 107 39,64838733
0,167 124 580,1511622
0,182 142
0,211 150
0,232 172
0,248 189
0,284 209
0,351 253
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,980069373
R Square 0,960535976
Adjusted R 0,955602973
Square
Standard Error 11,10165039
Observations 10
ANOVA
Significance
df SS MS F F
Regression 1 23998,12687 23998,13 194,7163 6,73964E-07
Residual 8 985,9731308 123,2466
Total 9 24984,1
Upper
Coefficients Standard Error t Stat P-value Lower 95% 95%
Intercept 39,64838733 8,869081922 4,470405 0,002082 19,19624776 60,10053
X 580,1511622 41,57574504 13,95408 6,74E-07 484,2773223 676,025
300,0
y = 580,15x + 39,648
R2 = 0,9605 0,284; 209,000
200,0
0,248; 189,000
0,232; 172,000
0,138; 107,000
100,0 0,091; 97,000
0,055; 90,000
50,0
0,0
0,0000 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000
Primjer sa vježbi;
ontrolom težine 100 paketića maslaca marke A, pakiranog po 250 grama, tržišni inspektor
K
grama.
je utvrdio prosječnu težinu paketića maslaca 2478,5 grama s prosječnim odstupanjem od 10
Nelinearna regresija
<<Statistics`LinearRegression`
data = {{0.055, 90}, {0.091, 97}, {0.138, 107},
{0.167, 124}, {0.182, 142}, {0.211, 150},
{0.232, 172}, {0.248, 189}, {0.284, 209},
{0.351, 253}};
(regress = Regress[data, {1, x^2}, x];
Chop[regress, 10^(-6)])
dplot=ListPlot[data]
250
225
200
175
150
125
100
0.05 0.15 0.2 0.25 0.3 0.35
Graphics
5
Sredina= 5 Varijanca 0.0625
4
f(x)
0-1
0
1 4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4
Funkcija gustoce vjerojatnosti normalne distribucije
Primjer:
lijent raspolaže investicijskim portfeljom čija sredina iznosi 500 kuna, a standardna
K devijacija 15 kuna. On je zatražio da se utvrdi vjerojatnost da vrijednost portfelja bude
između 485 i 530 kuna.
485 500 530 500
z 485 15 1...........z 530 2
15
P485 X 530 P 1 Z 2 1 PZ 1 PZ 2 1 0,1587 0,0228 0,8185
Grafička ilustracija: Zbog simetriönosti : 2 2 : 0,0228
-3 -2 -1 0 1 2 3
f(X)
0.8
P(-1< Z < +2 ) = 1- 0,1587 - 0,0228 = 0,8185
Normalna distribucija
P(Z>+2) = 0,0228
0.4
0.2
0
Portfelj 485 kuna 530kuna Z
Postavite hipotezu:
I II III
H 0 : p 1 p 2 0.....H 0 : p 1 p 2 0.....H 0 : p 1 p 2 0
H 1 : p 1 p 2 0....H 1 : p 1 p 2 0......H 1 : p 1 p 2 0
Zadajte
Izračunajte:
p̂ p̂1 p̂ 2
I III
. p1 * (1 p1 ) p 2 * (1 p 2 )
p̂
n1 n2
TIP
HIPOTEZE
II
Izračunajte kritične vrijednosti: Izračunajte kritičnu vrijednost: Izračunajte kritičnu vrijednost:
P̂U z / 2 * P̂ P̂Crit z * P̂
P̂Crit z * P̂
P̂L z / 2 * P̂
Ispravke :(Ako ima grešaka, ispravite, Statistika nas podučava da se ništa ne može uraditi bez greške)
Str. Primjedba Napomena
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998
4,0 0,5000
4,5 0,5000
5,0 0,5000
Chi 2 Distribucija
Kritične vrijednosti - Desnostrani test
razina signifikantnosti
d.f. 0,10 0,05 0,025 0,02 0,01 0,005
1 2,7055 3,8415 5,0239 5,4119 6,6349 7,8794
2 4,6052 5,9915 7,3778 7,8240 9,2103 10,5966
3 6,2514 7,8147 9,3484 9,8374 11,3449 12,8382
4 7,7794 9,4877 11,1433 11,6678 13,2767 14,8603
5 9,2364 11,0705 12,8325 13,3882 15,0863 16,7496
6 10,6446 12,5916 14,4494 15,0332 16,8119 18,5476
7 12,0170 14,0671 16,0128 16,6224 18,4753 20,2777
8 13,3616 15,5073 17,5345 18,1682 20,0902 21,9550
9 14,6837 16,9190 19,0228 19,6790 21,6660 23,5894
10 15,9872 18,3070 20,4832 21,1608 23,2093 25,1882
11 17,2750 19,6751 21,9200 22,6179 24,7250 26,7568
12 18,5493 21,0261 23,3367 24,0540 26,2170 28,2995
13 19,8119 22,3620 24,7356 25,4715 27,6882 29,8195
14 21,0641 23,6848 26,1189 26,8728 29,1412 31,3193
15 22,3071 24,9958 27,4884 28,2595 30,5779 32,8013
16 23,5418 26,2962 28,8454 29,6332 31,9999 34,2672
17 24,7690 27,5871 30,1910 30,9950 33,4087 35,7185
18 25,9894 28,8693 31,5264 32,3462 34,8053 37,1565
19 27,2036 30,1435 32,8523 33,6874 36,1909 38,5823
20 28,4120 31,4104 34,1696 35,0196 37,5662 39,9968
21 29,6151 32,6706 35,4789 36,3434 38,9322 41,4011
22 30,8133 33,9244 36,7807 37,6595 40,2894 42,7957
23 32,0069 35,1725 38,0756 38,9683 41,6384 44,1813
24 33,1962 36,4150 39,3641 40,2704 42,9798 45,5585
25 34,3816 37,6525 40,6465 41,5661 44,3141 46,9279
26 35,5632 38,8851 41,9232 42,8558 45,6417 48,2899
27 36,7412 40,1133 43,1945 44,1400 46,9629 49,6449
28 37,9159 41,3371 44,4608 45,4188 48,2782 50,9934
29 39,0875 42,5570 45,7223 46,6927 49,5879 52,3356
30 40,2560 43,7730 46,9792 47,9618 50,8922 53,6720
Alfa = 0,05
BROJ SUPNJEVA SLOBODE U BROJNIKU v1
s.s. 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 1000000
1 161,45 199,5 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 243,91 245,95 248,01 249,05 250,10 251,14 252,20 253,25 254,31
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
1000000 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
Formula11.11
2
S 2 S 2y
x
n x n y
x y
S 2 2
x
n x
x
( n x
1 )
S 2 2
y
n y
y
( n 1)
y
x U z / 2 x (II)x Crit z x (I) x U t / 2Sx (II) x Crit t Sx
x L z / 2 x (III)x Crit z x (I) x L t / 2Sx (III) x Crit t Sx
Ako je: Ako je: Ako je:
x x U (II)x x Crit
Ako je : (II) x x Crit Dijagram za izbor
x x U odgovarajućeg testa za
x x L (III)x x Crit (III) x x Crit testiranje hipoteze o
x x L sredinama populacija
Odbaciti H0 Odbaciti H0 Odbaciti H0 Odbaciti H0
Napomena: Da bi jasnije pročitali zelenu tablicu , postavite pokazivač miša na poziciju 1 i kada bijela strelica
pokazuje kut u prvom kvadrantu (Šiljati) kliknite lijevi taster miša. Dobit će te donju sliku.Kad god napuštate
dokument iziđite bez snimanja promijena.
0.711 0.58
0.701 0.63
0.706 0.603
0.67 0.615
0.898 0.855
0.821 0.810
0.872 0.799
0
FLEX 0.874 0.834 x FLEX
0.848 0.791
0.853 0.81 n rows x
0.67 0.615
0.905 0.916 1
y FLEX
0.887 0.87
0.742 0.73
0.79
0.696
last ( x)
yi yhatx yi
2
SSE
i 0
last ( x)
yhatx yi meany
2
SSR
i 0
last ( x)
yi meany
2
SST
i 0
SSE
DF_RESID n 2 MSE
DF_RESID
SSR
DF_REG 1 MSR
DF_REG
MSR
F n1 DF_REG n2 DF_RESID
MSE
R_square corr x y
2
DF SS MS F
A B
0,711 0,58
0,701 0,63 ANOVA
Significance
0,706 0,603
df SS MS F F
0,67 0,615
Regression 1 0,16029483 0,160294833 138,1415279 2,6798E-08
0,898 0,855
Residual 13 0,01508477 0,001160367
0,821 0,81
Total 14 0,1753796
0,872 0,799
0,874 0,834
0,848 0,791
0,853 0,81
0,67 0,615
0,905 0,916
0,887 0,87
0,742 0,73
0,79 0,696
Regression Statistics
Multiple R 0,956027145
R Square 0,913987901
Adjusted R
Square 0,907371586
Standard Error 0,034064156
Observations 15
ANOVA
df SS MS F Significance F
Regression 1 0,160294833 0,160294833 138,1415279 2,6798E-08
Residual 13 0,015084767 0,001160367
Total 14 0,1753796
<<Statistics`LinearRegression`
data = {{0.711, 0.58}, {0.701, 0.63}, {0.706, 0.603},
{0.67, 0.615}, {0.898, 0.855}, {0.821, 0.810},
{0.872, 0.799}, {0.874, 0.834}, {0.848, 0.791},
{0.853, 0.81}, {0.67, 0.615}, {0.905, 0.916}, {0.887, 0.87},
{0.742, 0.73},{0.79, 0.696}};
(regress = Regress[data, {1, x^1}, x];
Chop[regress, 10^(-6)])
Residual Plot
0,06
Točka A (0,742 = 0,052820466 )
0,04
0,02
Residuals
0
0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95
-0,02
-0,04
Točka B (0,790 = - 0,039642536 )
-0,06
-0,08
Opažene frekvencije
Sadržaj i predgovor
Autor ove Scripte je dugi niz godina ( više decenija ) dajući instrukcije iz STATISTIKE
srednješkolcima i studentima iz sačuvanog materijala složio istu. Obrađena je ANOVA i
REGRESIJA dok se ARIMA može koristiti samo primjenom računara.
Na pocetku Scripte daje se Uvod u bitne formule koje se obimno mogu pronaći:
Zahvala