Você está na página 1de 118

۞ 1/118

(Objasnjenja su na stranici 115 / 117 )

Z- DISTRIBUCIJA

0.8
pnorm ( x  2  1)
dnorm ( x  2  1)
0.6
y
y 0.4
y
0.2

0
1 0 1 2 3 4
x x a b c
Distribution
Density
75%-tile
90%-tile
95%-tile

Crvena linija- Kumulativna funkcija


Plava linija - Funkcija gustoće

0.4

0.3

0.2

0.1

-3 -2 -1 1 2 3

Rafinirano sakupljeni primjeri sa instrukcija


۞ 2/118

KORELACIJA i REGRESIJA

i xi yi xi * yi xi 2 yi
2

0
1
...
n
in

i 1

y  ax  b
 2
 yi *   xi    xi *  xi * yi 
b  

n *  xi   xi 
2 2

n *  xi * yi    xi *  yi 
a
n*  x   x 
i
2
i
2

1  r  1
Objašnjeno...odstupanje
R2 
Ukupno...odstupanje
n- broj uređenih parova
r – koeficijent korelacije

Rafinirano sakupljeni primjeri sa instrukcija


۞ 3/118

 
n *  xi * yi     xi  *  yi 
r  
n *  x   x  * n *  y   y  
i
2
i
2
i
2
i
2

2 2 2
n
  
   n ^ n ^ 
  y  y     y  y     y y 
i 1   i 1   i 1  
SS(UKUPNO) = SS(NEOBJAŠNJENO )+SS(OBJAŠNJENO)

Napomene:
yˆ  korelacijska...izracunata....vrijednost
y i  tablicne...ili ...empirijske...vrijednosti
y  prosjecna...vrijednost

INTERVALI POUZDANOSTI
S S
X  Z / 2 *    X  Z / 2 *
n 1 n 1
S S
X  t / 2 *    X  t / 2 *
n 1 n 1

pˆ * qˆ N n pˆ * qˆ N n
pˆ  Z / 2 * *  p  pˆ  Z / 2 * *
n N 1 n N 1

x x
X  Z / 2 *    X  Z / 2 * ............. x  S
n n

Rafinirano sakupljeni primjeri sa instrukcija


۞ 4/118

ANOVA

H 0 : 1  2  ...k
H1 : barem jedan i ; i  1,2,...k je različit
ANOVA

SOURCE of variation df SS MS F p-value


Betwen of Groups k-1 SS / df MS / df
Within Groups n-k SS / df mora biti >1
Ako ne,
Reciprocna
Vrijednost
Total n-1
O  E 2
p-value >   H0  2

E
O-promatrana frekvencija
E – očekivana frekvencija

F < CV  H0 df = n-1 df = (r-1)*(c-1)


r = rows c = columns

Rafinirano sakupljeni primjeri sa instrukcija


۞ 5/118

n<30 Varijance se pretpostavljaju nejednakima H1 : 21  22



t
 x1  x2   1   2 
S12 S 22
 df1= n1-1 df2 = n2-1
n1 n2
Varijance se pretpostavljaju jednakima H 0 : 21  22 df= n1+n2-2 , ovisi o S1
df1= n1 – 1 ; df2= n2 – 1
a) H 0 :  A  B H1 :  A   B
S12
b) H0 :  2
A
2
B H1 :   
2
A
2
B
F 2 veći kroz manji
S2

t
x1  x2   1  2 
 n1 1*S12 n2 1*S22 1 1
n1  n2 2  
n1 n2
Testiranje proporcija

Napomene :

Rafinirano sakupljeni primjeri sa instrukcija


۞ 6/118

H 0 : p1  p 2 ..............H 1 : p1  p 2
p1  p2 ................. p1  p2
p1  p2 ................. p1  p2
xA x
ˆA 
p ˆB  B
............. p
nA nB
x A  xB
p .......q  1  p
n1  n2
1 1 
 pˆ p
ˆB   p * q  *   
 n1 n2 
A

z
 ˆ
p A p  
ˆ B  p
A
0
 pB 
 pˆ A p
ˆB

Napomene :

Rafinirano sakupljeni primjeri sa instrukcija


۞ 7/118

p- vrijednost (signifikantnost – samo za z-distribuciju) p-vrijednost>   H0


p-vrijednost<  H1

H0:  = k H1 k

Napomene:

Rafinirano sakupljeni primjeri sa instrukcija


۞ 8/118

n  30
H 0 :  A   B ..............................................H1 :  A   B ................ A   B ........ A   B
A..........................................B........................................................... A   B ....... A   B
n A  ....................................nB  ........................................
x A  ....................................xB  ........................................
 A  ............ili ....S A  ......... B  .......................ili ............S B  ...................
x A  xB    A   B 
z  .................................x A  xB  ............(  A   B )  0
 X AXB

 A2S1  B2S2
 X AXB    ......................................................................................
nA nB
 A2  B2
 2
X AXB
 2
XA
  2
XB
n1 n2

Rafinirano sakupljeni primjeri sa instrukcija


۞ 9/118

Testiranje razlike između dvije varijance

F- distribucija , ne može biti negativna

NUMERATOR df
 1
DENOMINATOR df 2
df1  n1  1
S12
df 2  n2  1...............F  2
S2

H 0 :  A2   B2 ................................H 1 :  A2   B2
S12
F  2 .......U ..brojnik ...ide...onaj...koji... je...veci
S2
S 2  m2  m12 ...................df1  n1  1.........df 2  n2  1

t
xA  xB   1  2 
n1  1 * S A2  n2  1 * S B2 * 1 1

n1  n2  2 n1 n2

Rafinirano sakupljeni primjeri sa instrukcija


۞ 10/118

PRILOG ANOVA

ANOVA-1

Opća forma tablice jednofaktorske analize varijance: ANOVA-1

Izvor varijacije Suma kvadrata Stupnjevi slobode Sredine kvadrata F-omjer


Između grupa SSG K-1 MSG = SSG / K-1 MSG / MSW
Unutar grupa SSW n-K MSW = SSW / n-K
Ukupno SST n-1

H 0 : 1   2  ...... k
H 1 :  i   j .....za...najmanje... jedan... par... i ,  j

ni K ni K
 xij K  xij n i * xi
...........i  1,2,..., K ...............n   ni ..............x 
j 1 I 1 j 1
xi  ......x  i 1

ni i 1 n n

SS1   x1 j  x1  .........SS 2   x2 j  x2  ........SSW  SS1  SS 2  ...  ...SS K


n1 n2
2 2

j 1 j 1

K
SSG   ni *  xi  x  .....SST  SSW  SSG
2

i 1

Postavljamo sljedeće dodatne pretpostavke:


1.Varijance populacija su jednake
2 Distribucije populacija su normalne

Test razine signifikantnosti  osigurava pravilo odlučivanja


Odbaciti H0 ako je MSG / MSW > FK-1, n-K,  gdje je
P(FK-1, n-K ) > (FK-1, n - K, ) = 

Zadatak-1.

P retpostavimo da je od ukupno 20 vozaca , njih 7 na probu dobilo automobil tipa A, isto


tako automobil tipa B, a preostalih 6 automobil tipa C. Potrosnja goriva za tri nezavisna
slucajna uzorka u kilometrima po litri goriva data je u tablici1. Žuta polja od B1 do D8. Napomena
ako se prilikom upisa brojeva u ćeliji pokazuju datumi , selektirajte potrebna polja za tablicu 1. i
pokrenite komandu:Format/Cells.../ polje Number i u prozoru Format Cells unesite kako stoji i OK.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 11/118

Nadalje pokrenimo komandu :


Tools/Data Analysis.../Anova:Single Factor/ OK

U gornjem prozoru mišem selektiramo žuta polja u tablici 1. , čekiramo opciju Columns, čekiramo
polje Labels in first row, upišemo alfa 0,01 i dadnemo izlaz rezultata u New Worksheet Ply.
Pritisnemo gumb OK. Slijedi izlaz dolje u zelenom i plavom okviru Excela.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 12/118

Tablica 1.

Izvršimo izračunavanja kalkulatorom1 da bi dobili izlaze u zelenom i plavom okviru tablice 1..
Tip A= 146,30/ 7 = 20,9..(D15) : Tip B=162,4/ 7 = 23,2...(D16) Tip: C= 137,4/ 6 = 22,9..(D17)
7 * 20,9  7 * 23,2  6 * 22,9
x  22,305
20(7  7  6)
SS1  22,2  20,9   19,9  20,9   ...  20,30  20,9   3,76
2 2 2

SS 2  24,60  23,20  23,10  23,20   ...  23,50  23,20   4,46


2 2 2

SS 3  22,70  22,90  21,90  22,90   ...  23,40  22,90   3,46


2 2 2

SSW  3,76  4,96  3,46  12,18


SSG  7 * 20,90  22,305  7 * 23,20  22,305  6 * 22,90  22,305  21,55
2 2 2

Total..............SST  12,18  21,55  33,73


MSW  12,18 /( 20  3)   0,7165........( D 23)..MSG  21,55 /(3  1)  10,78...( D 22)
F  10,78 / 0,7165  15,04......( E 22)

1
Oznake u zagradama su polja Excela

Rafinirano sakupljeni primjeri sa instrukcija


۞ 13/118

Za polazni primjer K=3 ;(Tip A , Tip B, i Tip C) razreda i n = 20 ; (7+7+6) vozača.Matrica ima 17
jer je zadnje polje matrice D8=0.df1=(K-1) = 2 ; df2= (n-K)= 20-3 = 17 (plava tablica 1.) .
Signifikantnost je 1% i to je unešeno u prozor Anova:Single Factor(Alpha:0,01).
Iz tablica u knjizi na str. 873 nalazimo; kolona 2, red 17, očitavamo 6,11.
Kako je MSG/MSW=15,04 > 6,11 odbacujemo nultu hipotezu.
Riječima bi rekli da se odbacuje hipoteza o tome da je potrošnja goriva za sva tri tipa automobila
jednaka.
Napomena:
Ako želimo tocniji rezultata za F-DISTRIBUCIJU možemo to očitati u Excelu.(iako već postoji na
plavoj podlozi Tablice 1. Fcrit..(G22))
Komanda: Insert/ Function ... i otvara se istoimeni prozor.
U padajućoj listi: Or select a category: stavimo Statistical
U polju:Select a function: kliknemo na FINV i gumb OK

Otvara se prozor: Function Arguments gdje unesemo u polja:0,01 : 2 ; 17, slijedi očitanje funkcije u
prozoru: 6,112113716

Rafinirano sakupljeni primjeri sa instrukcija


۞ 14/118

Zadatak-2. Četiri različite vrste pšenice su posijane na osam parcela zemljišta- svaka vrsta na po
dvije parcele.Prinosi u tonama su bili sljedeći:
A B C D
1 2 1 2
3 4 5 6

Izračunati preko ANOVA Single Factor tablicu i testirati je za  = 0,05 .


(Zadatak sa vježbi :2011 god.)
Po već opisanoj proceduri slijedi Excelovo izvješće:

U tablici uočavamo da je (F17) F=0,26666 < Fcrit=6,591 pa prihvaćamo nultu hipotezu.


K=4 ; četiri razreda (A,B,C,D) ; n= 4*2=8 (četiri razreda * po dva prinosa, n je matrica )

Rafinirano sakupljeni primjeri sa instrukcija


۞ 15/118

GRAFIČKI PRIKAZ : Zadatak 3.

z časopisa: Priroda i društvo , Lutrijski vjesnik , i Turistički oglasnik uzeti su slučajni uzorci
I reklamnih tekstova, po njih 6 iz svakoga. U donjoj tablici daje se indeks „maglovitosti“
(nerazumijevanja ).

Priroda i društvo Lutrijski vjesnik Turistički oglasnik


15,75 12,63 9,27
11,55 11,46 8,28
11,16 10,77 8,15
9,92 9,93 6,37
9,23 9,87 6,37
8,20 9,42 5,66

Uz signifikantnost 1% izvrsiti testiranje hipoteza.Ovdje je broj klasa K= 3 , dok je n po matricama


n= 3*6 = 18.(opažanja)
K-1 = 2
n-K = 15
Izlazni rezultati Excela daju : MS = SS/ df

Kako je F=6,970 > Fcrit = 2,695 ..(H20)odbacujemo nultu hipotezu.

Trebamo još uraditi grafički prikaz standardnih devijacija. Standardna devijacija se računa preko
varijanse po formuli:
N

 x  x
2
i
 i 1
ili  je korijen iz varijance .Napomena : Ovo se racuna preko regresije.
N

Rafinirano sakupljeni primjeri sa instrukcija


۞ 16/118

Tako je standardna devijacija za časopis Priroda i društvo jednaka :


Varijanca je
V  10,968  15,75  10,968  11,55  10,968  11,16  10,968  9,92  10,968  9,23 
2 2 2 2 2

 10,968  8,20  35,023


2

35,023
Varijanca   7,0046
6 1
  7,0046  2,6466  2,647
Analogno se računaju standardne devijacije i za ostala dva časopisa
  1,44504  1,202
  1,99364  1,412
Grafički prikaz pripadnih standardnih devijacija:

Vidljivo je da Turizam ima dodirnih tocaka sa Prirodom ali ne i sa Lutrijom.


Međutim ako prikažemo : Individual 95% Cis For Mean Based on Pooled StDev , gdje se u
odnosu na Mean uvijek nanosi „Udružena standardna devijacija“ od 1,866 dobiti će se
„maglovita“ ilustracija statističke obrade, koja se traži u analizama.

7,0047  1,44504  1,99364


PooledStDev   1,8657 (Ovako Ne i DA- zelena tablica)
K

SSE SST  SSG 100,7460278  48,528744


PooledStDEV     1,8657 (plava tablica)
nK 18  3 15

Rafinirano sakupljeni primjeri sa instrukcija


۞ 17/118

DVOFAKTORSKA ANOVA – ANOVA-2

Ova analiza dizajnirana je u blokovima. Shematski prikaz opažanja K grupa i H blokova.

Grupa

Blok 1 2 ... K

1 x11 x21 ... xK1

2 x12 x22 ... xK2


. . . .
. . . .
. . . .
H x1H x2H xKH

n  K *H

Ukupna : SST   x ji  x 
K H
2

i 1 i 1
K
Medjugrupna : SSG  H *  ( xi  x ) 2
i 1
H
Medjublocna : SSB  K *  xi  x 
2

j 1

Pogresaka : SSE   xij  xi  x j  x 


K H
2

i 1 j 1

SST  SSG  SSB  SSE


Testiranje Hipoteza
Broj stupnjeva slobode je(K-1)*(H-1)
Međugrupna: MSG = SSG / (K-1) ....Međubločna: MSB = SSB / (H-1)...
Pogreške: MSE = SSE / (K-1)*(H-1)
Odbaciti H0 ako je MSG/MSE > FK-1, (K-1)*(H-1), 
Odbaciti H0 ako je MSB/MSE> FH-1, (K-1)*(H-1), 

Rafinirano sakupljeni primjeri sa instrukcija


۞ 18/118

Opća forma dvofaktorske analize varijance: ANOVA-2

Izvor Suma Broj stupnjeva Sredine F-omjer


Varijacije Kvadrata Slobode Kvadrata

Između SSG K-1 MSG=SSG/K-1 MSG/MSE


Grupa

Između SSB H-1 MSB=SSB/H-1 MSB/MSE


Blokova

Pogresaka SSE (K-1)*(H-1) MSE=SSE/(K-1)*(H-1)

Ukupno SST N-1

Vidi Sheet 5. document ANOVA na Deskotopu.


Zadatak 1. U tablici se prikazuju rezultati eksperimenta koji ukljuöuju tri tipa automobila i šest
dobnih skupina vozača. Usporedba potrošnje goriva po tipovima automobila predstavlja primarni
interes , dok je dob vozača korištena kao blična varijabla.Ovakav dizajn se zove randomizirani
bločni dizajn. (Modificirani Zadatak 1. ANOVE-1. da se shvate blokovi i ANOVA-2.)

Razredi Dobna Tip automobila


Starosti Skupina Klase = (A+B+C)=(1+1+1)=3 , n=6*3=18 opažanja
(godine) vozača
Blokovi = 6 A B C Suma
25 ili manje 1 25.1 23.9 26.0 75.0
26-35 2 24.7 23.7 25.4 73.8
36-45 3 26.0 24.4 25.8 76.2
46-55 4 24.3 23.3 24.4 72.0
56-65 5 23.9 23.6 24.2 71.7
Iznad 65 6 24.2 24.5 25.4 74.1
SUMA 148.2 143.4 151.2 442.8
Gornju „efektivnu“ tablicu unosimo u Excel i radimo obradu po žutim poljima.
Komanda: Tools/Data Analisys.../Anova:Two-Factor Without Replication / OK

Selektiramo mišem žuta polja u Excelu, čekiramo Labels, unesemo Alpha 0,05 , čekiramo

Rafinirano sakupljeni primjeri sa instrukcija


۞ 19/118

New Worksheet Ply i OK.

ANOVA-2 ---ZELENA POLJA


Algoritam za dobnu skupinu vozača 1.Zelena tablica
(Klasa)K=3 , (Blokova) H=6.
Broj opažanja = 3*6 = 18 opažanja .10 = (H-1)*(K-1)

Sum = 25.1+23.9+26.0= 75.0....(C32)


Average=( 25.1+23.9+26.0)/3 =75/3=25.00
Variance= V  25,10  25,00  23,90  25,00  26,00  25,00 / 2  1,11 ..(E32)
2 2 2

Total Klasa A = 25,1+24,7+26,0+24,3+23,9+24,2=148,2


Average Klasa A = x1  148,2 / 6  24,7
24,7  25,12  0,0  24,7  26,02  24,7  24,32  
Variance Klasa A =   / 6  1  0,58
24,7  23,9 2
  24,7  24, 2 2


Sredina opažanja svih uzoraka uzetih zajedno:


x  TotalA  TotalB  TotalC   148,2  143,4  151,2 / 6 * K  442,8 / 18(opazanja)  24,6
x  24,7  23,9  25,2 / 3  24,6.......... preko...KLASA
x  25,0  24,6  25,4  24,0  23,9  24,7 / 6  24,6........... preko...Blokova
Pooled StDev= Se =???

Rafinirano sakupljeni primjeri sa instrukcija


۞ 20/118

Racuna se uvijek uz pripisani . , preko sredine opažanja svih uzoraka.


SSE
Se 
K  1 * H  1
SSE  SST  SSG  SSB
Sve tri vrijednosti predstavljene su u Excelu- kolona SS – plava tablica.
SST  25,1  24,6  24,7  24,6  26,0  24,6  24,3  24,6  23,9  24,6  24,2  24,6 
2 2 2 2 2 2

 23,9  24,6  23,7  24,6  24,4  24,6  23,3  24,6  23,6  24,6  24,5  24,6 
2 2 2 2 2 2

 26  24,6  25,4  24,6  25,8  24,6  24,4  24,6  24,2  24,6  25,4  24,6  11,88
2 2 2 2 2 2

 2 2 2

SSG  6 * 24,7  24,6  23,9  24,6  25,2  24,6  5,16....( B 47)
Primjetimo da se ova suma računa preko zelenih polja Awerage za klase A, B i C sa po 6 opažanja.

25,0  24,62  24,6  24,62  25,4  24,62  24,0  24,62  23,9  24,62 
SSB  3 *  
 24,7  24,6  4,98 
2

Primjetimo da SSB računa za tri klase preko sledećih vrijednosti:


1)- već objašnjena sredine opažanja svih uzoraka
Sum
2)- preko odnosa u zelenoj tablici imamo 6 sumanada za 6 blokova.
Count
SSE= 11,88-5,16-4,98 = 1,74....(B48)

1,74
Se   0,4171
2*5
Može se nacrtati dijagram :Individual 95% Cis For Mean Based on Pooled StDev.(Automobili)
Automobila
Tip

Rafinirano sakupljeni primjeri sa instrukcija


۞ 21/118

Dijagram vozača;
Zapažanja kompjuterske obrade; MS = SS/ df
Sredine vozača date su u poljima Awerage zelene tablice.
Tako je za drugoga vozača Mean  (24,7  23,7  25,4) / 3  24,6 ...(D33)
Varijanca prvoga vozača je izračunata.
Varijanca drugoga vozača je:
 2 2 2

V  24,7  24,6  23,7  24,6  25,4  24,6 / 2  0,73 ...(E33)
Varijanca klase A je izračunata a slično dobivamo i za klasu B=0,22 (Stupac Variance,zelena tab.)
Sredina opažanja svih uzoraka uzetih zajedno:
x  25,0  24,6  25,4  24,0  23,9  24,7 / 6  24,6........... preko...Blokova

Pooled StDev= Se =???


Ovaj dijagram vozača se praktično svodi na traženje varijance Se obilježja.
 N 2
   xi  x  
S e   i 1 
x
25  24,6  25,4  24  23,9  24,7
 24,6
N 6

Se 
25  24,62  24,6  24,62  25,4  24,62  24  24,62  23,9  24,62  24,7  24,62
6
S e  0,5259
Dijagram Individual 95% CIs For Mean Based on Pooled StDev. – Vozači

Rafinirano sakupljeni primjeri sa instrukcija


۞ 22/118

ANOVA 2--Plava tablica

a)Računanje stupaca MS ---(Ovdje je već sve pripremljeno za proračun)

MSG = (SSG/K-1)=5,16/3-1=2,58
MSB = (SSB/H-1)= 4,98/6-1=0,996
MSE = (SSE/(K-1)*(H-1))=0,174

b) F-stupac

MSG / MSE = 2,58/0,174 = 14,827...(E47)


MSB / MSE = 0,996/0,174 = 5,724...(E46)

c) Testiranje nulte hipoteze Fcrit ; Tablice F-Distribucije.

c1) Test u odnosu na Rows; F5,10,0,05 = 3,32534529 (FH-1 , (K-1)*(H-1) 0,05)...(G46)

c2) Test u odnosu na Columns ;F2,10,0,05 = 4,102821015 (FK-1 , (K-1)*(H-1) 0,05)....(G47)

Napišimo usporednu tablicu i po pravilu ljevorukih (kod njih je lijeva ruka jača) odbacujemo
H0 i po redovima i po kolonama u komparaciji F i Fcrit.(Fcrit = F-Distribucija- tablična).

F P-value F crit
5,724138 0,009489 3,325835
14,82759 0,00102 4,102821

Zadatak 4.(ANOVA-1) Neka je dana sljedeća tablica analize varijance:


Izvor varijacije Suma kvadrata Stupnjevi slobode

Između grupa 879 3


Unutar grupa 798 16
Ukupno 1,677 19
Izračunajte kvadratne sredine između grupa i unutar grupa. Izračunajte F-omjer i testirajte hipotezu
koja tvrdi da su sredine grupa jednake.

Riješenje:Preko stupnjeva slobode dobivamo;


K-1=3 K= 4; n-K=16 n= 20 ; n-1 = 19
MSG= SSG /K-1 = 879/3 = 293 ; MSW= SSW/ n-K = 798/16 = 49,875
F = MSG/ MSW = 293/49,875 = 5,8746
FK-1, n-K,  = F 3, 16 , 0.05 = 3,2388 ; F 3, 16, 0.01 = 5,29221

Vidljivo je da za  = 0,01 (1%) moramo odbaciti H0 , a za  = 0,05 (5%) i pogotovo.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 23/118

Zadatak 5. (ANOVA-1) Četiri servisa automobila na području županije tvrde da su jednako efikasna
u servisiranju vozila.Da bi provjerili tvrdnju, korisnici svakog servisa izabrani su nasumice i
priupitani o broju dana čekanja na servisu.Dobivena je sljedeća ANOVA tablica:
Source of variation df SS MS F p-value
Between Groups ? 23,37321 ?? ??? 0,001632
Within Groups 12 ? ??? 0,810514
Total ??????

Postoji li dokaz o razlici u prosječnom vremenu čekanja na servis? Razina signifikantnosti 5%.

Riješenje:

?. K = 4 (radionice) K-1 = 3 ; n-K = 12  n =12+ 4 = 16 , n-1 = 15


??. SSG= 23,37321 ; MSG = SSG/(K-1) ; MSG = 23,37321/3 = 7,79107
???. F= MSG / MSW = 7,79107/ 0,810514 = 9,612505

Testiranje H0 , FK-1 , n-K ,  = F3, 12, 0.05 = 3,490294 = Fcrit


H0 se odbacuje jer je F > F3 , 12 , 0.05 ( 9,612505 > 3,490294)

Zadatak 6.(ANOVA-1) Proizvođač žitnih pahuljica razmatra tri moguće boje za paketiće svojih
proizvoda- crvenu , žutu i plavu.Da bi utvrdio utječe li izbor boje na prodaju on je izabrao 16
trgovina približno jednake veličine.Paketići crvene boje poslani su u 6 od tih trgovina, žute u njih 5
i pleve u ostalih 5. Nakon nekoliko dana provjerene su prodane količine paketića pahuljica u svakoj
trgovini. Rezultati izraženi desecima paketića, prikazani su u pridruženoj tablici.

Crveni Žuti Plavi


43 52 61
52 37 29
59 38 38
76 64 53
61 74 79
81

a) Izračunajte unutargrupnu, međugrupnu i ukupnu sumu kvadrata


b) Kompletirajte tablicu analize varijanse i testirajte nultu hipotezu koja tvrdi da su srednji
iznosi prodaje za sve tri populacije paketića, neovisno o njihovoj boji, jednaki.

Excel šalje sljedeće izvješće;

ANOVA-A, Sheet 1 .

Rafinirano sakupljeni primjeri sa instrukcija


۞ 24/118

MS = SS/ df ; F(Between Groups) = MS (Between Groups) / MS (Within Groups)

Anova: Single
Factor

SUMMARY
Groups Count Sum Average Variance
Crveni 6 372 62 205,6
Zuti 5 265 53 261
Plavi 5 260 52 384

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 340,9375 2 170,46875 0,61421667 0,55604603 3,805565253
Within Groups 3608 13 277,5384615

Total 3948,9375 15

Odmah možemo zaključiti da se H0 prihvata.

Rješenje

a) crveni x  43  52  59  76  61  81 / 6  62


žuti x  52  37  38  64  74 / 5  53
plavi x  61  29  38  53  79 / 5  52
SSW  SS1  SS 2  SS 3 = 1028+1044+1536 = 3608
SS1  43  62  52  62  59  62  76  62  61  62  81  62  1028
2 2 2 2 2 2

SS 2  52  53  37  53  38  53  64  53  74  53  1044
2 2 2 2 2

SS3  61  52  29  52  38  52  53  52  79  52  1536
2 2 2 2 2

6 * 62  5 * 53  5 * 52


Ukupna sredina je ; x   56,0625
16
SSG  6 * 62  56,0625  5 * 53  56,0625  5 * 52  56,0625  340,9375
2 2 2

SST  SSW  SSG  3608  340,9375  3948,9375

b) MSW = SSW/n-K = 3608/(16-3) = 277,5384615


c) MSG = SSG / K-1 = 340,9375 / 3-1 = 170,46876
d) F = MSG / MSW = 170,46876 / 277,5384615 = 0.6142167
e) FK-1 , n-K, 0.05 = F2 , 16-3 , 0.05 = F2 , 13, 0.05 = 3,805565253

Rafinirano sakupljeni primjeri sa instrukcija


۞ 25/118

Zadatak 7.(ANOVA-2) Vrednovana su četiri tipa gnojiva. Svaki tip primjenjen je na šest parcela
različitog sastava tla. Zatim je za 24 kombinacije tipa gnojiva i sastava tla mjeren postotak porasta
uroda kukuruza. Dobiveni rezultati sumirani su u pridruženoj tablici.

Izvor varijacije Suma kvadrata


Između tipova gnojiva 135,6
Između tipova tla 81,7
Pogreška 111,3

a) Kompletirajte tablicu analize varijance.


b) Testirajte nultu hipotezu o tome da su sredine populacija porasta uroda jednake za sva četiri
tipova gnojiva
c) Testirajte nultu hipotezu o tome da su sredine populacije porasta uroda jednake za svih šest
tipova tla
Riješenje

a) Sastav tla
Gnojivo A B C D E F
1 1 1 1 1 1 1
2 2 2 2 2 2 2
3 3 3 3 3 3 3
4 4 4 4 4 4 4

Imamo četiri bloka H = 4 , i n = 6*4 = 24 opažanja i 6 klasa K = 6

Izvor Suma kvadrata Razlika Sredina kvadrata F-omjer


Varijacije df

Tipovi gnojiva 135,6 3? 45,20?? 6,0916???


Tipovi tla 81,7 5???? 16,34????? 2,2022??????
Pogreška 111,3 15??????? 7,42????????

Ukupno 328,6????????? 23??????????

? H-1 = 3 tipovi gnojiva


?? 135,6/3 = 45,2
???? K-1 = 5 tipovi tla
????? 81,7/ 5 = 16,34
??????? (K-1)*(H-1)= 5*3 = 15
???????? 111,3/15 = 7,42
????????? 135,6+81,7+111,3 = 328,6
?????????? 3+5+15 = 23

b) ??? 45,20 / 7,42 = 6,0916;gnojivo FK-1, (K-1)*(H-1) , 0.01 = F3,15,0.01=5,4169 (Odbaciti H0)
c) ????? 16,34 / 7,42 = 2,0222; tlo FK-1, (K-1)*(H-1) , 0.01=F5,15 0.05 =2,90129 ( Prihvatiti H0)
Napomena; Test gnojiva se odbacuje i za = 0,01 pa ga za = 0,05 ne treba ni isticati.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 26/118

Zadatak 8. (ANOVA-2, jer se traže dva testiranja) Predavač kolegija iz ekonomije koristi tri
uđžbenika.On također provodi tri tipa ispita-test s više ponuđenih odgovora i eseja. Tijekom godine
on izlaže devet cjelina kolegija i svakoj slučajnim načinom pridružuje kombinaciju uđžbenik-ispit.
Na kraju on dobiva ocjene studenata za svaku cjelinu. One su prikazane u pridruženoj tablici.

Uđžbenik
Ispit A B C
Test s više odgovora 4,8 5,3 4,9
Esej 4,6 5,0 4,3
Mješoviti test 4,6 5,1 4,8

a) Postavite tablicu za potrebe analize varijance.


b) Testirajte nultu hipotezu o tome da su sredine populacija ocjena studenata jednake za sva tri
uđžbenika
c) Testirajte nultu hipotezu o tome da su sredine populacija ocjena studenata jednake za sva tri
tipa ispita.
Riješenje
Excel šalje izvješće; MS = SS/ df ; F(Rows) = MS ( Rows) / MS (Error)

Anova: Two-Factor Without Replication

SUMMARY Count Sum Average Variance


Test 3 15 5 0,07
Esej 3 13,9 4,63333333 0,123333333
Mjesoviti 3 14,5 4,83333333 0,063333333

A 3 14 4,66666667 0,013333333
B 3 15,4 5,13333333 0,023333333
C 3 14 4,66666667 0,103333333

ANOVA
Source of Variation SS df MS F P-value F crit
Rows 0,202222222 2 0,10111111 5,2 0,07716 6,94427191
Columns 0,435555556 2 0,21777778 11,2 0,022957 6,94427191
Error 0,077777778 4 0,01944444

Total 0,715555556 8

a) H = 3 , K = 3 ; n = 9 (opažanja)- Zelena tablica, Error =(H-1)*(K-1) = 4

Test ; Average : (4,8+5,3+4,9)/3=5



Variance: V  ( 4,8  5) 2  5,3  5  4,9  5  0,07
2 2

Sredina opažanja svih uzoraka ;
x  4,66666  5,13333  4,66666 / 3  4,8222
x  4,8  4,6  4,6  5,3  5,0  5,1  4,9  4,3  4,8 / 9  4,8222

Rafinirano sakupljeni primjeri sa instrukcija


۞ 27/118

4,8  4,822222  4,6  4,82222  4,6  4,82222  5,3  4,82222  5  4,82222 


SST=
5,1  4,82222  4,9  4,82222  4,3  4,82222  4,8  4,82222  0,70950252

SSG  3 * 4,66666  4,82222  3 * 5,13333  4,82222  3 * 4,66666  4,82222  0,435567


2 2 2

Test – Zelena tablica; Average = 5,0


Esej- Average = 4,633333
Mjesoviti Average = 4,833333

SSB  3 * 5,0  4,82222  4,633333  4,822222  4,83333  4,82222  0,2022255
2 2 2

SSE  SST  SSG  SSB  0,709502  0,435567  0,202225  0,071711
Priprema za testiranje; Plava tablica

MSG= SSG/(K-1)=0,21778
MSB=SSB/(H-1)=0,2022255/2 =0,101112
MSE= SSE/(K-1)*(H-1)=0,071711/4= 0,017928
Napomena:Ovdje postoje neslaganja zbog periodičnih brojeva, u odnosu na Excel.

F=MSG/MSE = 0,21778 / 0,017928 = 12,14 H0 se odbacuje (12,14>6,9433


FK-1 ,(K-1)*(H-1), 0.05 = F2, 4, 0.05 = 6,9443

F= MSB/MSE = 0,101112/0,017928 = 5,639


FK-1 ,(K-1)*(H-1), 0.05 = F2, 4, 0.05 = 6,9443 H0 se prihvaća (5,639 < 6,9443)

Populacijski model za jednofaktorsku analizu varijance(ANOVA-1)

Ovaj model daje dopunske informacije koje se ne mogu dobiti u rutinskim izračunavanjima
jer se neki interesantni momenti pod kvadratom okreći uvijek u pozitivu.

Definira se jednađžbom (u kojoj parametri nisu pod kvadratima);

X ij    Gi   ij
 je sredina opažanja svih uzoraka ( ne ovisi o indeksu)
Gi odstupanje između sredine populacije i-te grupe i ukupne sredine
ij slučajna varijabla sa sredinom nula.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 28/118

Zadatak 9. U studiju je po šest slučajnih reklama u časopisima Priprema, Pozor i Sad.


Indeksi maglovitosti za te reklame dani su u pridruženoj tablici. Testirajte nultu hipotezu koja tvrdi
da je sredina populacija indeksa maglovitosti jednaka za sva tri časopisa.
Priprema Pozor Sad
12,89 9,50 10,21
12,69 8,60 9,66
11,15 8,59 7,67
9,52 6,50 5,12
9,12 4,79 4,88
7,04 4,29 3,12

Excel šalje izvješće;


MS = SS/ df ; F(Between Groups) = MS (Between Groups) / MS (Within Groups)

Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
Priprema d.o. 6 62,41 10,40167 5,14181667
Pozor 6 42,27 7,045 4,76083
Sad 6 40,66 6,776667 8,12250667

ANOVA
Source of
Variation SS df MS F P-value F crit
Between Groups 48,95967778 2 24,47984 4,07427972 0,038614878 3,68232034
Within Groups 90,12576667 15 6,008384

Total 139,0854444 17

H0 se odbacuje (4,0742>3,682) uz razinu signifikantnosti 5%.(plava tablica)

Nastavak zadatka;
a) Procijenite 
b) Procijenite Gi za svaki od tri časopisa
c) Procijenite 13 faktor pogreške koji odgovara trećem opažanju(11,15) za časopis
Priprema (zapis je u matričnom elementu- prvi stupac, treći red)
Riješenje(zelena tablica)
a)  je sredina opažanja svih uzoraka
=(10,40167+7,045+6,776667)/3= 8,07444
b) Priprema x  62,41 / 6  10,40167  Gˆ 1  10,40167  8,07444  2,3272
Pozor x  42,27 / 6  7,045  Gˆ  7,045  8,07444  1.0294
2

Sad x  40,66 / 6  6,776667  Gˆ 3  6,776667  8,07444  1,2977


c) x   Pr iprema / 6  62,41 / 6  10,40167 11,15-10,40167= 0,7483 = 13
i

Rafinirano sakupljeni primjeri sa instrukcija


۞ 29/118

Zadatak 10. Ilustrirajte populacijski model za ANOVA-1 za zadatak 1.(potrošnja goriva za tri
različita automobila). Slijedi Excelovo izvješće.

MS = SS/ df ; F(Between Groups) = MS (Between Groups) / MS (Within Groups)


Tip A Tip B Tip C
22,2 24,6 22,7
19,9 23,1 21,9
20,3 22 23,2
21,4 23,5 24,1
21,2 23,6 22,1
21 22,1 23,4
20,3 23,5

Anova: Single
Factor

SUMMARY
Groups Count Sum Average Variance
Tip A 7 146,3 20,9 0,626666667
Tip B 7 162,4 23,2 0,826666667
Tip C 6 137,4 22,9 0,692

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 21,5495 2 10,77475 15,03864943 0,0001737 6,11211372
Within Groups 12,18 17 0,71647059

Total 33,7295 19

Vidljivo je da se nulta hipoteza odbacuje jer je : 15,03864 > 6,11211


a)   20,9  23,2  22,9 / 3  22,23333 (Zelena tablica )

a)   20,6  23,2  22,9 / 3  22,23333 (sredina opažanja svih uzoraka)


1= 20,9
2= 23,2
3 = 22,9

b) Tip A ; 20,9-22,23333= -1,3333 = Ĝ1


Tip B ; 23,2-22,23333 = 0,96667 = Ĝ2
Tip C ; 22,9 – 22,23333 = 0,66667 = Ĝ3

Sledeća slika daje ilustraciju populacijskoga modela za jednofaktorsku analizu varijance


zadatka 1. (ANOVA-1 ) Predstavljena je sa normalnom distribucijom gdje sredine populacija
1 (tipA)... 2 (tipB)... 3 (tipC ) predstavljaju centre tih distribucija .

Rafinirano sakupljeni primjeri sa instrukcija


۞ 30/118

Zadatak 11. (ANOVA-2) Za uzorak podataka iz zadatka 8.(ANOVA-2) procjenite svaki faktor na
desnoj strani jednadžbe iz prethodnog zadatka za kombinaciju uđžbenika C i testa s više
ponuđenih odgovora.
Za bolju točnost krenut ćemo od rezultata Excelovog izvješća. MS = SS/ df

Anova: Two-Factor Without Replication

SUMMARY Count Sum Average Variance


Test 3 15 5 0,07
Esej 3 13,9 4,63333333 0,123333333
Mjesoviti 3 14,5 4,83333333 0,063333333

A 3 14 4,66666667 0,013333333
B 3 15,4 5,13333333 0,023333333
C 3 14 4,66666667 0,103333333

ANOVA
Source of Variation SS df MS F P-value F crit
Rows 0,202222222 2 0,10111111 5,2 0,07716 6,94427191
Columns 0,435555556 2 0,21777778 11,2 0,022957 6,94427191
Error 0,077777778 4 0,01944444

Total 0,715555556 8
MS = SS/ df ; F(Rows) = MS ( Rows) / MS (Error)

Rafinirano sakupljeni primjeri sa instrukcija


۞ 31/118

Za dvofaktorsku analizu varijance model populacije glasi (uz jasno definiranu desnu stranu) ;

H ij    Gi   j   ij
U odnosu na jednofaktorsku anovu dodaje se parametar j koji predstavlja blokove.
Svi odgovori leže u zelenoj tablici.

xO  5  4,63333  4,83333 / 3  4,82222


Gˆ 3  4,82222  4,66666  0,15556

1 veže prvi blok ;Test s više odgovora


Uđžbenik
Ispit A B C
Test s više odgovora 4,8 5,3 4,9
Esej 4,6 5,0 4,3
Mješoviti test 4,6 5,1 4,8

xH 1  4,8  5,3  4,9 / 3  5,0


1  x H 1  xO  5,0  4,82222  0,17778

Traži se promašaj na  31  4,9 .

 31  4,9 
4,8  5,3  4,9 / 3  4,9  4,3  4,8 / 3  0,0667
2

Zadatak 12. Pozovite se na zadatak WW i razmotrite opažanje koje uključuje grupu sa srednjim
primanjima i viskokim rezultatima testa TMS ( x22 = 3,5 ).
a) Procijenite 
b) Procijenite i interpretirajte G2
c) Procijenite i interpretirajte 1
d) Procijenite 21

Pripadna tablica iz zadatka WW glasi sa Excelovim izvješćem;

Signifikantnost je  = 5%.
H0 bi prihvatili na Columns a odbacili na Rows.

Da bi odgovorili na zadatak potrebna nam je izlazna zelena tablica i postavljena tablica analize sa
usidrenim matričnim elementom ( x22 = 3,5). Kako se radi o ANOVA-2 , ili dvofaktorskoj analizi to
se usidrenom matričnom elementu dodaju analize po drugom stupcu i drugom redu , koje su radi
isticanja i kolorisane.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 32/118

MS = SS/ df ; F(Rows) = MS ( Rows) / MS (Error)

Rezultati testa Visok Srednji Nizak


Vrlo visok 3,7 3,6 3,6
Visok 3,4 3,5 3,2
Umjeren 2,9 2,8 3

Anova: Two-Factor Without Replication

SUMMARY Count Sum Average Variance


Vrlo visok 3 10,9 3,633333333 0,003333333
Visok 3 10,1 3,366666667 0,023333333
Umjeren 3 8,7 2,9 0,01

ANOVA
Source of
Variation SS df MS F P-value F crit
Rows 0,826666667 2 0,413333333 24,8 0,005569169 6,94427191
Columns 0,006666667 2 0,003333333 0,2 0,826446281 6,94427191
Error 0,066666667 4 0,016666667

Total 0,9 8

a) x  3,633333  3,366666  2,9 / 3  3,299999 sredina opažanja svih uzoraka


1  3,6  3,5  2,8 / 3  3,3 Traže se sredine stupaca i redova
 2  3,4  3,5  3,2 / 3  3,366666   1   2  / 2  3,33333

Gˆ 22  3,33333  3,3  0,03333


b) Gˆ 2  (Gˆ 22  Gˆ 22 ) / 2  0
ˆ
G22  3,33333  3,36666  0,03333
(Opet se racuna za stupce i redove ponaosob pa onda ide aritmetička sredina )

  3,4  3,5  3,2   3,6  3,5  2,8  


  
c) 1  x    3   3    0,06667 Misli se na Blok Visok
 2 
 
 

 3,7  3,6  3,6 / 3  3,6  3,5  2,8 / 3 


d)  21  3,6     0,1333
 2

Dopuna zadatka WW.


Treba dati grafičke prikaze PooledStDev.
1) Grafički prikaz po blokovima

Rafinirano sakupljeni primjeri sa instrukcija


۞ 33/118

SSE
Se  Error
K  1 * H  1 Se 
3  1 * 3  1
 0,06666666 / 4  0,1291
SSE  SST  SSG  SSB

 3,7  3,6  3,6  3,4  3,5  3,2  2,9  2,8  3,0 


Da ponovimo Algoritam ; x     3,3
 9 
SST  3,7  3,3  3,6  3,3  3,6  3,3  3,4  3,3  3,5  3,3  3,2  3,3 
2 2 2 2 2 2

 2,9  3,3  2,8  3,3  3  3,3  0,9


2 2 2


SSG  3 * 3,633333  3,3  3,366666  3,3  2,9  3,3
2 2 2
  0,8266666 (Rows H=3)
 3,7  3,4  2,9  3,6  3,2  3
2 2
 
SSB  3 *   3,3  3 * 0  3 *   3,3  0,0066666 (Columns K=3)
 3   3 

2) Grafički prikaz po klasama

Rafinirano sakupljeni primjeri sa instrukcija


۞ 34/118

Zadatak 13.Razmotrite dvofaktorsku analizu varijance s jednim opažanjem po ćeliji i


randomiziranim blokovima sa sljedećim rezultatima;

Izvor Suma kvadrata Stupnjevi Sredine kvadrata F-omjer


Varijacije slobode

Između grupa 380 6 ? ??


Između blokova 232 5 ??? ????
Pogrešaka 387 30 ?????
Ukupno 989 41

Provjera zadatka; 380+232+387  989 već 999. Radit ćemo kako gore stoji?

Riješenje ;

?  380/6 = 63,333 ??? 232/5 = 46,4 ?????  387/30 = 12,9

??  63,333/12,9 = 4,91= 4,91 Klase ???? = 46,4/12,9 = 3,597 Blokovi


Testiranje hipoteza;

K-1 = 6  K = 7 ; H-1 = 5 H = 6 ; n-1 = 41  n = 42 opažanja


Provijera ; (K-1)*(H-1 ) = (6)*(5)= 30
K=7 FK-1 , (K-1)*(H-1) 0.05 = ? Klase
H=6

F6, 30, 0.05 = 2,421 F6, 30,0.01 = 3,473 Klase ; Ho odbacujemo za =1% i za =5%

FH-1 , (K-1)*(H-1) 0.05 = ? Blokovi


F5, 30, 0.05 = 2,534 F5, 30, 0.01 =3,699 Blokovi Ho prihvaćamo za 1%.

Unutar grupa (klasa) postoji bitno neslaganje sredina po analizi varijance, dok unutar blokova
prihvaćamo Ho za 1% jer je tada 3,597 < 3,699 .

Rafinirano sakupljeni primjeri sa instrukcija


۞ 35/118

KOMBINIRANJE ANOVE i REGRESIJE Excel ANOVA –A sheet 4


Linearna regresija ( ULAZ ) Racunamo Racunamo Racunamo Zadatak-I
x y x*y x*x y*y
1 10 10 1 100
2 8 16 4 64
3 12 36 9 144
4 16 64 16 256
5 20 100 25 400
15 66 226 55 964

SLIKA
EXCEL
Komanda
Insert
Chart
Stand.Types
XY(Scatter)
Add
Trendline...

TABLICE EXCEL Tools Data Analysis... Regression


SUMMARY OUTPUT RESIDUAL OUTPUT
Regression Statistics Observation Predicted y Residuals
Multiple R 0,91914503 1 7,6 2,4
R Square 0,844827586 2 10,4 -2,4
Adjusted R
Square 0,793103448 3 13,2 -1,2
Standard Error 2,19089023 4 16 1,77636E-15
Observations 5 5 18,8 1,2
66
ANOVA
df SS MS F
Regression 1 78,4 78,4 16,33333333
Residual 3 14,4 4,8
Total 4 92,8

Standard
Coefficients Error t Stat
Intercept 4,8 2,297825059 2,088931871
x 2,8 0,692820323 4,041451884

Interpretacija dobivenih rezultata


Napomena ; (4,041451884)^2 )= 16,3333333333

Rafinirano sakupljeni primjeri sa instrukcija


۞ 36/118

Regresijska jednađžba glasi yˆ  4,8  2,8 * x


Računamo rezidualno odstupanja ; za x=1 ; 4,8+2,8*1= 7,6 (10-7,6)*(10-7,6)= 5,76 i td...
Ovaj rezultat je u tablici RESIDUAL OUTPUT , kolona Predicted y.
Sumarno linearno rezidualno odstupanje je 66.

Računamo sredine ulaza x i y ;

x  1  2  3  4  5 / 2  15 / 2  7,5........... y  10  8  12  16  20 / 5  66 / 5  13,2


UKUPNO ODSTUPANJE
y  y  13,2  10  3,2........13,2  10   10,24
2

y  y  13,2  8  5,2..........5,2   27,04


2

x  3........13,2  12  1,2......1,2  1,44


2

Za x= 1.... x  4.........13,2  16   7,84


2

x  5..........13,2  20   46,24
2

 y  y  10,24  27,04  1,44  7,84  46,24  92,8


2

x 1
Ovaj rezultat je u tablici ANOVA , kolona SS .
OBJAŠNJENO ODSTUPANJE REGRESIJSKO

x  1....7,6  13,2  31,36


2

x  2....10,4  13,2   7,84


2

x  3....13,2  13,2   0
2

Za x = 1..... x  4....16  13,2  7,84


2

x  5....18,8  13,2  31,36


2

  yˆ  y   31,36  7,84  0  7,84  31,36  78,4


2

x 1

NEOBJAŠNJENO ODSTUPANJE ILI REZIDUALNO

x  1....10  7,6  5,76


2

x  2....8  10,4  5,76


2

x  3....12  13,2  1,44


2

Z x= 1....... x  4....16  162  0

x  5....20  18,8  1,44


2

  y  yˆ   5,76  5,76  1,44  0  1,44  14,4


x 1
92,8 = 78,4 + 14, 4

Rafinirano sakupljeni primjeri sa instrukcija


۞ 37/118

ObjasnjenoOdstupanje
Koeficijent determinacije R 2   78,4 / 92,8  0,844827
UkupnpOdstupanje
Nalazi se u tablici Regression Statistics, R Square.
Objašnjava da je 84,48 % totalnog odstupanja protumačeno regresijskom jednadžbom.

Drugi korijen iz koeficijenta determinacije zove se koeficijent korelacije.


r  0,844827  0,91914503
Vidljiv je u istoj tablici kao Multiple R.

Podsjetimo se u tablici ANOVA , kako se dolazi do F- omjera

SS MS F
78,4 78,4 16,33333333=78,4/4,8
14,4 4,8= 14,4/3

Izračunajmo još regresijsku jednadžbu što je možda trebalo dati kao prvo;pogledajmo ulaznu žutu tablicu;


y  ax  b
 2
 yi *   xi    xi *  xi * yi 

b  
n *  xi   xi 
2
 2

n *  xi * yi    xi *  yi 
a
n*  x   x i
2
i
2

5 * 226  15 * 66140 66 * 55  15 * 226 240


a  2,8 b 
   4,8
5 * 55  15 5 * 55  55
2 2
50 50
Ovi koeficijenti nalaze se u tablici ANOVA

Linerni regresijski koeficijenti Coefficients


Intercept ( odsječak na osi y za x = 0 ) 4,8
x koeficijent smijera pravca ( Prva derivacija ) 2,8

Rafinirano sakupljeni primjeri sa instrukcija


۞ 38/118

Testiranje Regresije
Data je ulazna tablica za linearnu regresiju (žuta polja ) .Izračunati koeficijent korelacije r= ? ,
regresijsku jednadžbu ( a= ? i b = ? ) i testirati regresiju.

Ulaz Ulaz Racunamo Racunamo Zadatak II


x y x*y x*x y*y
18 10 180 324 100
26 5 130 676 25
32 2 64 1024 4
38 3 114 1444 9
52 1,5 78 2704 2,25
59 1 59 3481 1
225 22,5 625 9653 141,25 Sumiramo

SUMMARY OUTPUT RESIDUAL OUTPUT

Regression Statistics Observation Predicted y Residuals


Multiple R 0,831974 1 7,259358 2,740642
R Square 0,692181 2 5,819622 -0,81962
Adjusted R
Square 0,615226 3 4,739819 -2,73982
Standard Error 2,09208 4 3,660016 -0,66002
Observations 6 5 1,140477 0,359523
6 -0,11929 1,119292
ANOVA 22,5
df SS MS F
Regression 1 39,36780132 39,3678 8,994655
Residual 4 17,50719868 4,3768
Total 5 56,875

Standard
Coefficients Error t Stat P-value
Intercept 10,49877 2,406890767 4,361962 0,012044
x -0,17997 0,060006853 -2,99911 0,039977

Rafinirano sakupljeni primjeri sa instrukcija


۞ 39/118

Riješenje ;

Računamo a i b u linearnoj regresiji preko dopunjene ulazne tablice.

Popunjavanje ulazne tablice


 odrđenim gore računatim
y  ax  b sumama , rutinski je posao koji
ne zahtijeva posebne pripreme.
Važna je nota da su nazivnici
 2
 yi *   xi    xi *  xi * yi 
kod izračunavanja koeficijenta
 b i tangensa kuta uz nezavisno
promjenljivu x , jednaki.Treba

b   pripaziti na položaj ukupnih

n *  xi   xi  
uređenih parova ulazne tablice ,
2 2
to jest na distribuciju „ n „ –a
koji izaziva najviše pogrešaka.
Potrebno je nadalje pravilno
razvrstati sume apscisa x na
kvadrat i sume apscisa već

n *  xi * yi    xi *  yi 
kvadrirane.Ako je negativan
koeficijent smijera pravca ( sa
a
 x   x 
porastom x opada y ) tada se
2 2 koeficijent korelacije „ r “
n* i i tadođer uzima kao negativna
vrijednost jer dolazi ispod
drugoga korijena determinacije.

K renimo u proračun „ ab initio „ . U gornjoj tablici već je Excel poslao izvješće koje
praktično trebamo potvrditi računanjem pomoću kalkulatora. Prikazan je i graf tabličnih podataka i
regresijske jednadžbe i uočavamo da je koeficijent korelacije slabiji nego u prethodnom primjeru.

22,5 * 9653  225 * 625


76567,5 6 * 625  225 * 22,5
b   10,49876 ; a   0,1799671
6 * 9653  225 6 * 9653  225
2 2
7293
Regresijska jednadžba glasi; yˆ  10,49876  0,1799671 * x
Odstupanja su detaljno objašnjena u prethodnom
ANOVA primjeru i nalazimo ih u tablici ANOVA. Tako
df SS je koeficijent determinacije ;
Regression 1 39,36780132 39,36780
Residual 4 17,50719868 R2   0,692181 (n = 6 ulaza )
Total 5 56,875
56 ,875

Dok je koeficijent korelacije


; r   0,692181  0,831974
r n  2  0,83219 * 6  2
F-test , testiranje hipoteze o korelaciji ; t     3,0007
1  r 
1  0,692181
2

t 6-2, 0.0 05 = 4,604 pa se Ho odbacuje, na razini signifikantnosti 0,5% , jer postoji korelacija. iako su
neobjašnjena rezidualna odstupanja 30,7819 %.(1-0,692181)
Napomena; t-Distribucija2 se očita u Excelu preko komande ; Insert/Function.../Statistical/ TINV.

2
Obratite pažnju na ovu notu

Rafinirano sakupljeni primjeri sa instrukcija


۞ 40/118

F62, 0.01  4,60409 , Knjiga daje „VRŠNE TOČKE“ .Tablice su jače od računatoga.
d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano
0,1 0,05 0,025 0,01 0,005 Jednostrano
1 3,078 6,314 12,706 31,821 63,657
2 1,886 2,920 4,303 6,965 9,925
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604

KNJIGA t-distribucija (vršne točke); očitavamo tn-2 , 


EXCEL- TINV ; očitavamo tn-2 , 2*
Primjer: očitaiti n=13 , =0,05
KNJIGA tn-2 ,  = t13-2 , 0.05 = t11 , 0.05 = 1,796
Excel tn-2 , 2* = t13-2 , 0.1 = t11 , 0.1 = 1,79558

Rafinirano sakupljeni primjeri sa instrukcija


۞ 41/118
Pogledajmo neka značenja statističke obrade u Excelu. Tako za Zadatak I potpuniji izlaz glasi ; ANOVA-1 i Linearna regresija
SUMMARY OUTPUT
MultipleR  RSquare r=1; potpuna korelacija Kažemo da nezavisna varijabla znatno
Regression Statistics 0,8 r< 1 jaka korelacija utječe na zavisnu varijablu, za r=1 taj
Multiple R 0,91914503 Koeficijent korelacije 0,5 r< 0,8 srednje jaka korelacija utjecaj je funkcijski
R Square 0,844827586 Koeficijent determinacije R Square je udio varijance zavisne varijable (ordinate) protumačene modelom u %
Adjusted R Korigirani primjenjuje se maloga N  30, sa većim nezavisnih
Square 0,793103448 koeficijent determinacije u slučaju uzorka brojem varijabli
Standard Error 2,19089023 Standardna pogreska procjene
Observations 5 Broj uređenih parova
SSR regresijska suma kvadrata
Pronađite relaciju i upamtite za linearnu
ANOVA SSE--Suma kvadrata pogrešaka
regresiju; 4,04145  16,333
2
Significance
df SS MS F F
Regression 1 78,4 78,4 16,33333333 0,027261854
Residual 3 14,4 4,8 Se- Varijanca pogreške modela
Total 4 92,8
Ovo je interval pouzdanosti modela određen obično preko t-Distribucije ,
Ovdije je  = 0.05 .
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
-
Intercept 4,8 2,297825059 2,08893187 0,12790722 2,512704867 12,11270487 -2,512704867 12,11270487
x 2,8 0,692820323 4,04145188 0,027261854 0,595136523 5,004863477 0,595136523 5,004863477

t- Stat je omjer
između Coefficients Studentovo obilježje t b1 Standardna pogreška procjene Se = 4,8 =2,19089023
i Standard Error
Signifance F = P- value ; Ako je ova vrijednost veća od 0,05
s b1 tada Pearsonov koeficijent linerne korelacije nije značajan
y  4.8  2,8 * x Standardna pogreška koeficijenta nagiba
( slab je ).Ovdje je P-value 0,027 a r = 0,919 (jaka korel.)

Koeficijent nagiba (tangens kuta ili prva derivacija ) , također se u zadacima testira.
Ako je koeficijent nagiba >0 (pozitivan) nezavisno promjenljiva na apscisi pozitivno utječe na zavisno promjenljivu ordinatu . To je
MS  SS / df trend porasta u regresijskoj analizi bila ona linearna ili kvadratna.
Ako je koeficijent nagiba < 0 (negativan) , situacija je obrnuta. Napr. Sa povećanjem troškova na jedinicu proizvoda ( apscisa ) umanjuje
se i dobit na ordinati. Višestruka regresija ima više koeficijenata koji mogu biti i pozitivni i negativni.Ovdje je b=2,8

Rafinirano sakupljeni primjeri sa instrukcija


۞ 42/118

Zadatak III. Pretpostavimo da smo u sklopu jednostavne regresijske analize dobili ugođeni3
regresijski model.
yˆ i  22  8 * xi i da je tadođer
n
S e  3,45........x  11.......n  22.......... xi  x   400 ( Napomena (Se)2=11.9025 )
2

i 1
Nađite 95%-tni prognostički interval pouzdanosti i 95% prognostički interval za točku za koju je
x= 17.

Riješenje:
a) 95% prognostički interval:

n  22. S  11.9025

 2 
 1  1  ( 17.000  11.)  S  ( 2.086)  7.6686386798090595890
 n 400. 

Pr ognostickiInterval  158  7,668  150,332165,668


b) 95% interval pouzdanosti :

n  22. S  11.9025
 2 
 0  1  ( 17.000  11.)  S  ( 2.086)  2.6486842604326466538
 n 400. 

IntervalPouzdanosti  158  2,649  155,351160,649

Riješenje u knjizi na strani 438.


n =22 , x  10,799  xi  x   34,110,178 S e2  21,806
2

n  22. S  21806.

2
1 ( 12.000  10.799)
1   S  154.01065498729382175
n 34.110178

( 154.0106 2.086)  321.2661116

 321 
95% prognostički interval 6,501     6,180 6,822
 1000 

3
Postoje i robusni linearni modeli

Rafinirano sakupljeni primjeri sa instrukcija


۞ 43/118

Interval pouzdanosti nagiba regresijskoga pravca (b1)- TESTIRANJE

Primjer ; Testirajmo b1 iz Zadatka I sa proširenim Excelovim izlazom

n = 5 ; b1 = 2,8 ; sb = 0,6928 yˆ  2,8 * x  4,8

Uradit ćemo t- test za 90% interval pouzdanosti. tn-2 , /2 = t3, 0.05 = 2,353

2,8-2,353*0,6928<1< 2,8+2,353*0,6928
1,169 < 1 < 4,431
Slijedi dijagramski prikaz: sb * t n 1, / 2

Rafinirano sakupljeni primjeri sa instrukcija


۞ 44/118

Grafički prikaz linearne regresije (kliknite mišem lijevo od slike kada se pojavi bijela
strelica)

VIŠESTRUKA REGRESIJA

Zadatak ; U sljedećej tablici daju se podaci o štednji i kreditima u 25 godina opažanja.


Treba razviti model regresije.

a) napisati regresijsku jednadžbu


b) protumačiti koeficijente regresije i determinacije
c) protumačiti model regresijske analize, ukupni P-value
d) protumačiti P-value za regresijske koeficijente
e) protumačiti koeficijente regresije
f) Kakav je odrezak na Y osi
g) Što možemo očekivati za X1= 3,2 i X2 = 6,3

Napomena ; X1 = godišnji neto prihod po euru depozita


X2 = broj kreditno štednih poslovnica u tisućama
Y = godišnja margina profita

Rafinirano sakupljeni primjeri sa instrukcija


۞ 45/118

Izlazni rezultata Excela za primjer višestruke regresije (Ulazna tablica je žuta boja )
Godina Prihod Br.Poslovnica Margina profita
1 3,92 7,298 0,75
2 3,61 6,855 0,71
3 3,32 6,636 0,66
4 3,07 6,506 0,61
5 3,06 6,45 0,7
6 3,11 6,402 0,72
7 3,21 6,368 0,77
8 3,26 6,34 0,74
9 3,42 6,349 0,9
10 3,42 6,352 0,82
11 3,45 6,361 0,75
12 3,58 6,369 0,77
13 3,66 6,546 0,78
14 3,78 6,672 0,84
15 3,82 6,89 0,79
16 3,97 7,115 0,7
17 4,07 7,327 0,68
18 4,25 7,546 0,72
19 4,41 7,931 0,55
20 4,49 8,097 0,63
21 4,7 8,468 0,56
22 4,58 8,717 0,41
23 4,69 8,991 0,51
24 4,71 9,179 0,47
25 4,78 9,318 0,32
SUMMARY OUTPUT 16,86

Regression Statistics
Napomena ; X1 = godišnji neto
Multiple R 0,930212915
prihod po euru depozita
R Square 0,865296068
Adjusted R X2 = broj kreditno-
Square 0,853050256 štednih poslovnica u tisućama
Standard Error 0,053302217 Y = godišnja margina
Observations 25 profita u tisućama

ANOVA
df SS MS F
Regression 2 0,40151122 0,20075561 70,66057082
Residual 22 0,06250478 0,002841126
Total 24 0,464016

Standard
Coefficients Error t Stat P-value
Intercept 1,564496771 0,079395981 19,70498685 1,81733E-15
Prihod 0,237197475 0,055559366 4,269261695 0,000312567
Br.Poslovnica -0,249079284 0,032048496 -7,771949195 9,50879E-08

Rafinirano sakupljeni primjeri sa instrukcija


۞ 46/118

Nastavak izlazne tablice desno od stupca P-value , za testiranje Coefficients.


Coefficients Standard Error Lower 95% Upper 95%
Intercept 1,564496771 0,079395981 1,399839584 1,729153958
Prihod 0,237197475 0,055559366 0,121974402 0,352420548
Br.Poslovnica -0,249079284 0,032048496 -0,315543797 -0,182614771
Prije nego počnemo objašnjavati izlazne rezultate Excela , pokažimo kako se testira Coefficients
Intercept u 95% intervalu pouzdanosti.

1,564496771  StError * t n3,0.025  Intercept  1,564496771  StError * t n3,0.025


StError * t n3,0.025  0,079395981 * 2,073873058  0,1646577185

Napomena; Ako idemo u knjigu tražimo tn-3, 0.025 = 2,074


Kako je izlazni rezultat Excela točniji to t-Distribuciju očitavamo u Excelu- kao TINV , čiji je
rezultat = 2,073873058 kao tn-3 , 0.05 . Kako se radi o kubnom polinomu to je n-3 = 25-3 = 22.

Lower 95% Intercept(Coefficients ) Upper 95%


1,399839585 1,729153957

Rješenje;

a) Yˆ  1,56449  0,23719 * X 1  0,24908 * X 2


b) r = 0,930212915 , radi se o jakoj regresiji ,
Adjusted R Square 0,853050256
Za višeparametarsku regresiju usporedba ide preko Adjusted R Square koji kaže da je
85,31% regresijske veze protumačeno regresijskom jednadžbom, a to je bilo i za očekivati
preko visoke vrijednosti koeficijenta korelacije.
c) Significance F = 0,000000000264962 što je mnogo manje od 0,01 pa zaključujemo
da je ukupni model jak.
d) P-value za X1 iznosi 0,0000312567 , što je mnogo manje od 0,01 pa je veza X1 sa Y
dosta jaka
P-value za X2 iznosi 0,0000000950879 što je mnogo manje od 0,01 te je veza X2 sa Y
još jača u regresiji od X1 i Y,

e) Svako jedinično povećanje prihoda ( X1) rezultira povećanjem stope profita za 0,237 ,
dok jedinično povećanje broja kreditno- štednih poslovnica ( X2), profit umanjuje za
0,000249.
f) Za X1 = 0 odrezak na osi Y , je 1,5645 uz uvijet da je X2 nepromijenjen.
g) Yˆ  1,5645  0,23719 * 3,20  0,2491 * 6,30  0,754

Rafinirano sakupljeni primjeri sa instrukcija


۞ 47/118

Od više izlaznih dijagrama koje nudi Excel predstavljen je sljedeći.Margina profita u ovisnosti o
broju poslovnica u tisućama.

Usporedba gornjega Excelovog izlaza sa crtežom u AutoCAD-u.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 48/118

ANOVA II , Složena dvofaktorska analiza varijance- ELABORAT


Zadatak;Na donjoj slici predstavljeni su rezultati bodova4 na testu za dva bloka:
Visoka stručna sprema i Srednja stručna sprema u odnosu na klase ; Spol.
1) Postoji li statistički utjecaj stupnja obrazovanja na bodovni izvještaj.
2) Postoji li utjecaj spola na bodovni izvještaj
3) Postoji li interakcija između spola na bodovni izvještaj

3-D varijanta ulaznih podataka za analizu ANOVA II.

Blokovi M Ž Anova II uvijek traži odgovor na tri pitanja:


Visoka sp. 40 45 1) Postoji li značajan statistički utjecaj prvoga
38 42 faktora na zavisnu varijablu (drugi faktor je
35 47 constantan )
42 41 2) Postoji li značajan statistički utjecaj
Srednja sp. 39 30 drugoga faktora na zavisnu varijablu ( prvi
40 25 faktor je constantan )
38 24 3) Postoji li statistička interakcija to jest utječu
45 20
li obadva faktora istovremeno na zavisno
promijenljivu varijablu.

Odgovori se daju preko izlazne tablice Excelovog izvješća

4
U okviru prozora Anova; Two-Factor With Replication ... U polje Rows per sample: upišite broj 4, Alpha = 0.05

Rafinirano sakupljeni primjeri sa instrukcija


۞ 49/118

Anova: Two-Factor With Replication

SUMMARY M Ž Total
Visoka sp.
Count 4 4 8
Sum 155 175 330
Average 38,75 43,75 41,25
Variance 8,916666667 7,58333333 14,21428571

Srednja sp.
Count 4 4 8
Sum 162 99 261
Average 40,5 24,75 32,625
Variance 9,666666667 16,9166667 82,26785714

Total
Count 8 8
Sum 317 274
Average 39,625 34,25
Variance 8,839285714 113,642857

ANOVA
Source of
Variation SS df MS F P-value F crit
Sample 297,5625 1 297,5625 27,626692 0,000202 4,747225
Columns 115,5625 1 115,5625 10,729207 0,006635 4,747225
Interaction 430,5625 1 430,5625 39,974855 3,82E-05 4,747225
Within 129,25 12 10,77083333

Total 972,9375 15
1) P-value iznosi 0,000202 (<0.05) pa zaključujemo da postoji statistički značajan utjecaj
stupnja obrazovanja na bodovni izvještaj ne uzimajući u obzir Spol već samo stručnu
spremu.Ispitanici visoke stručne spreme postigli su 330 bodova a srednje stručne
spreme 261 bod.(To je utjecaj BLOKOVA)

2) P-value iznosi 0,006635 (<0.05) što znači da postoji značajan utjecaj spola na bodove
informiranosti.
Muški su postigli 317 bodova a ženske 274 boda.(To je utjecaj KLASA- ne ovisi o
stupnju obrazovanja)

3) INTERAKCIJA – Utjecaj spola na stručnu spremu ili obrnuto. Testiranje ženskoga


spola visoke stručne spreme daje bolje rezultate od muške visoke stručne spreme.
Pogledajte dijagram.O tome govori i pokazatelj P-value = 0,0000382 << 0.05. Žene sa
srednjom stručnom spremom su manje informirane od muškaraca sa srednjom
stručnom spremom , dakle opet postoji interakcija. Da je P-value bio naprimjer 0.09
što je >0.05 tada bi i muškarci i ženske imali isti broj bodova bez obzira na stručnu
spremu pa bi zaključili da nema interakcije.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 50/118

Kada bi bodovanje složili ovako :


M Ž
Visoka sp. 40 45
38 42
35 47
42 41
Srednja sp. 30 39
25 40
24 38
20 45
Budući da nema ponavljanja, unutar klasa spola bodova, uzimamo analizu varijance :

Anova: Two-Factor Without Replication

SUMMARY Count Sum Average Variance


Visoka sp. 2 85 42,5 12,5
2 80 40 8
2 82 41 72
2 83 41,5 0,5
Srednja sp. 2 69 34,5 40,5
2 65 32,5 112,5
2 62 31 98
2 65 32,5 312,5

M 8 254 31,75 67,07143


Ž 8 337 42,125 10,41071

ANOVA
Source of Variation SS df MS F P-value F crit
Rows 316,4375 7 45,20536 1,400553 0,333933 3,787044
Columns 430,5625 1 430,5625 13,3397 0,008152 5,591448
Error 225,9375 7 32,27679

Total 972,9375 15
est bez utjecaja interakcije ( nema ni ponavljanja istih bodova unutar klasa) potvrđuje da nema
T nikakve statističke značajnosti između Rows ( P-value = 0.333933 a to je veće od 0,05 ), ili
bolje rečeno cure su za koplje ispred muškaraca po inteligenciji(ljepoti), pa nema nikakve
interakcije koja je već i u statističkome prilazu analize odbačena, za slučaj da je tablica drugačije
složena.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 51/118

VIŠESTRUKA REGRESIJA ELABORAT ( Moguć 3-D prikaz ).

Pros.ocjena Prijemni na Ocjena SR.


dipl.(Y) faksu (X1) Skola (X2)
5,00 6,00 3,90
4,92 5,85 3,75
4,87 5,40 3,60
4,85 5,70 3,50
4,80 5,50 3,75
4,73 4,90 3,60
4,70 5,40 3,90
4,65 5,60 3,40
4,65 5,50 3,75
4,52 5,20 3,60
4,40 6,00 3,85
4,38 5,30 3,65
4,35 5,20 3,60
4,35 5,35 3,50
4,24 5,20 3,70
4,18 5,60 3,85
4,12 5,65 3,75
4,05 5,70 3,80
4,00 5,40 3,25
3,95 5,30 3,05
3,92 5,30 3,35
3,90 5,25 3,65
3,85 5,00 3,40
3,85 5,20 3,45
3,72 5,10 3,40
3,65 5,25 3,40
3,57 5,10 3,30
3,20 5,00 3,40
3,12 4,95 3,65
2,84 4,70 3,45
125,33

Zadatak.Daju se podaci o prosječnoj ocjeni na kraju studija ( plava polja ).Dva žuta ulaza su:

1.) uspijeh na testu razredbenog ispita (prijemni ispit)-(X1).


2.) broj bodova na temelju ocijena iz srednje škole-(X2).

Za 30 studenata fakulteta odrediti  ;(protumačiti izlaz Excela )

a) Jednadžbu višestruke regresije


b) Elaborirati značenje parametara
c) Interpretirati koeficijente regresije i determinacije
d) Procijeniti statističku značajnost modela
e) Procijeniti statističku značajnost pojedinih regresijskih koeficijenata
f) Procjeniti prosječnu ocjenu studenata koji je na prijemnom ispitu postigao rezultat od 5,5
bodova a došao je iz srednje škole sa ocjenom od 3,8 bodova.

SUMMARY OUTPUT

Rafinirano sakupljeni primjeri sa instrukcija


۞ 52/118

Regression Statistics
Multiple R 0,682939609
R Square 0,466406509
Adjusted R Square 0,426881066
Standard Error 0,422281589
Observations 30

ANOVA
Significance
df SS MS F F
Regression 2 4,208449675 2,1042248 11,80016 0,000207655
Residual 27 4,814686991 0,1783217
Total 29 9,023136667

Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
-
Intercept -2,990604458 1,538973446 -1,943246 0,062479 6,148317103 0,167108188
Prijemni na faksu 1,00635361 0,288877357 3,4836708 0,001703 0,413626239 1,59908098
Ocjena SR. Skola 0,498393135 0,434366897 1,1474013 0,261282 -0,39285411 1,389640379
MARKERI
1) Crveno – ocijene
studenata na
izlazu sa studija
između 4,0 i 5,0

2) Zeleno- ocijene
studenata na
izlazu sa studija
između 3,0 i 4,0

3) Plavo- ocijene
studenata na
(4,73:4,9:3,6) izlazu sa studije
između 2,0 i 3,0
(3,12:4.95:3,65) 4) Žuto – ravnina
regresijskog
polinoma u 3D .
5) Podaci triju
ulaznih varijabli
(x,y,z) još se
mogu u 3-D
vizuelizirati , ali
(2,84:4,7:3,45) ako su 4 ulaza u
Excelu, nema više
dijagramskih
prikaza u 3-D.
6) Pogled se još
mogao doraditi da
crvena kuglica ne
ostane među
zelenima

3-D pogled kroz ravninu regresijskog polinoma, kojeg ne može dati Excel.(Pogledajte stranu 114.)

Rafinirano sakupljeni primjeri sa instrukcija


۞ 53/118

Odgovori :
a) jednadžba višestruke regresije glasi: Yˆ  2,9906  1,0063 * X 1  0,4983 * X 2
gdje je X1-> prijemni na faksu ; X2-> ocijena iz srednje škole

b) Yˆ  b0  b1 * X 1  b2 * X 2
I) b0 = Intercept = -2,990604458 ;Ako bi bilo X1=0 , tada bi student sa negativnom ocijenom završio
fakultet ili bolje rečeno ne bi završio studij.

II) b1 = 1,00635361 povećanjem broja bodova na razredbenom ispitu povećava se i broj bodova na
kraju studija.( b1>0 )- Ako se na razredbenom ispitu poveća broj bodova za 1 tada se završna ocijena na
kraju studija poveća za 1,006.( uz nepromijenjen b2 uz X2) (1*1,0063 1,0)

III) b2 = 0,498393135 , povećanjem za jedan srednješkolskog prosjeka ocjena , završna ocjena na


kraju studija poveća za 0,5 bodova (0,498) uz uvjet da se ne mijenja član b1 uz X1.

c) r = 0,6829 pa se radi o srednje jakoj korelaciji.


Koeficijent determinacije je R2 = 0,466406509 . 0,466406509  0,68298 = r
Adjusted R Square=0,426881066 , govori da je 42,69% varijance objašnjeno za 30 studenata
uspjehom na razredbenom ispitu i ocjenama iz srednje škole.

d) Significance F=0,000207655 ( to je manje od 0,01 ) pa uspijeh na razredbenom ispitu i srednješkolske


ocjene značajno utječu na završnu ocjenu studija.

e) P(b1) = 0,001703 , što je manje od 0,01 , pa X1 značajno utječe na završnu ocjenu studija
P(b2) = 0,261282 , što je veće od 0,05 , pa X2 ne utječe značajno na završnu ocjenu studija

f) očekivana prosječna ocjena studenta koji je na razredbenom ispitu skupio 5,5 bodova a
iz srednje škole došao sa prosjekom ocjena 3,80 iznosi ;
Yˆ  2,9906  1,0063 * 5,5  0,4983 * 3,80  4,438

Rafinirano sakupljeni primjeri sa instrukcija


۞ 54/118

Intervali pouzdanosti- procjene


proporcija. Zadatak-A ; Iz pošiljke
od 2000 kutija gipsa marke X ,
izabran je slučajan uzorak od 26
kutija.Prosječna težina punjenja kutija
izabranih u uzorak iznosi 498 grama s
prosječnim odstupanjem od 4 grama.
Procijenite ukupnu težinu punjenja
kutija u čitavij pošiljci.
Pouzdanost 99%.Smatra se da je
težina punjenja u populaciji normalno
distribuirana varijabla.Točnost na 3
decimale.
a) procjenite prosječnu težinu
kutije
b) procjenite ukupnu težinu
pošiljke. Shematski prikaz je na gornjoj slici.

99%  t  / 2  2,787.............df  n  1.........df  26  1  25............t  Distribuci ja


x  498.....S  4...............n  26  30............N  2000........n / N  26 / 2000  0,013  0,05.....
S S S
x  t / 2 *    x  t / 2 * ........................... x 
n 1 n 1 n 1
4 4
498  2,787 *    498  2,787 * ..............................................................................
25 25
495,77    500,22................ prosjecna..tezina..kutije......... puta....2000
991540,8    1000459,2......grama
991,5...........i....1000,5.............ukupna...tezina... posiljke........ki log rama

Uz pouzdanost 99% očekujemo da se ukupna težina gipsa u svih 2000 kutija zajedno kreće između
999,5 i 1000,5 kilograma5.

5
Gornji ispis ističe matematičke funkcije pa je tako vidljiv log to jest logaritam.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 55/118

Želim Vam uspješan rad!

f
Yˆ  1,56449  0,23719 * X 1  0,24908 * X 2
Višestruka regresija u 3-D je ravnina.
U gornjrm zapisu

Rafinirano sakupljeni primjeri sa instrukcija


۞ 56/118

1.
ostoji zabrinutost u pogledu brzine automobila na određenom dijelu autoceste. Za slučajni
P uzorak od sedam automobila radar je utvrdio sljedeće brzine, mjerene u kilometrima na sat:

79 73 68 77 86 71 69
6241 5329 4624 5929 7396 5041 4761

Pretpostavljajući normalnu distribuciju populacije, izračunajte 95% interval pouzdanosti za srednju


brzinu automobila koji voze tim potezom autoceste.
Prosjecna frekvencija
a) (6241+5329+4624+5929+7396+5041+4761)/ 7 = 39321/7 =5617,286
Aritmeticka sredina brzina
b) (79+73+68+77+86+71+69)/7 = 523/7 = 74,7143
c) Ocitavamo t-Distribuciju za n=7-1 =6 i =0,05/2=0,025 dakle t (6, 0.025)=2,447
Dopustena pogreska
d) 2,447*(245,428/7-1)^(0,5) / 7^0,5 = 5,9150

x  xi 2 245,428
DopPogr  2,447 * n 1  2,447 * 6  5,9150
7 7
c1= 74,7143- 5,9150 = 68,7993 c2 = 74,7143+ 5,9150 = 80,6293
Varijanca uzorka
e) 245,428/6 = 40,90476 standardna devijacija uzorka= 40,90476  6,395
Varijanca populacije
e) VAR = 5617,286  74,7143  35,0593
2

f) SDpopulacije = 35,0593  5,9211

2.
olitičar želi procijeniti proporcijski udio birača koji bi podržali kontroverzni zakonski
P prijedlog. Pretpostavimo da se zahtijeva 99% interval pouzdanosti koji se na svaku stranu od
proporcijskog udjela u uzorku prostire za najviše 0,05. Koliko opažanja mora sadržavati uzorak da
bi se to osiguralo?
a) (99/2*100) = 0,495 u tablicama nalazimo
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
Interpolacija
(0,4951  0,4949) * x  0,07  0,02 * 0,07  0,0001
0,495  0,4949   odakle....x   0,075
0,08  0,07 0,02

Rezultat je 2,5+ 0,075 = 2,575


Uzorak mora biti n = 0,25 * (2,575/0,05)2 = 663,0
Excel:Insert/Function/Statistical/NORMSINV/OK/Probability=0,995=2,575829304 .

Rafinirano sakupljeni primjeri sa instrukcija


۞ 57/118

3.
ačunovođa neke tvrtke je utvrdio da prosječni iznos kratkoročnih obveza tvrtke po
R računu iznosi 125,32 EURA. Revizor je provjerio slučajni uzorak od 16 računa.
Njegova sredina je iznosila 131,78 EURA, a standardna devijacija 25,41 EURO.
Pretpostavite da je distribucija populacije normalna. Uz razinu signifikantnosti od 5%
testirajte nultu hipotezu koja kaže da sredina populacije iznosi 125,32 EURA, nasuprot
njezinoj dvosmjernoj alternativnoj hipotezi.

H0 = MI = 125,32
H1 = MI nije jednako 125,32
Alfa = 0,05
t* = 1,017 racunato
t15,0,025 = 2,131 tablica
Tablica> racunato Ho se ne odbacuje !

=0,05
t* =
131,78  125,32  1,0169 racunato
25,41 * 16
Tablica t-Distribucije t0,05 ; 16-1= t0,05 ; 15 = 2,131

d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano


0,1 0,05 0,025 0,01 0,005 Jednostrano
15 1,341 1,753 2,131 2,602 2,947
Excel:Insert/Function/Statistical/TINV/OK/Probability=0,995, Deg_freedom=15
Forma result = 2,131449536
Kumulativna funkcija vjerojatnosti

Rafinirano sakupljeni primjeri sa instrukcija


۞ 58/118

Funkcija gustoce vjerojatnosti

Primjer sa vježbi-T-test (Usporedba sa F-testom )


roizvođač igrački želi ispitati isplativost prodaje u jutarnjoj smjeni.U uzorku od 14 prodavača
P u jutarnjoj smjeni, prosječna je prodaja je 200 kom. s prosječnim odsrupanjem 30 kom. Dok
je u takvom uzorku 15 radnika popodne prosječno prodalo 180 kom. S prosječnim odstupanjem 50
kom. Značajnost je 5%. Utvrditi da se prosječna količina igračaka u te dvije smjene ne razlikuje
bitno?.

  0,05
n1  14.....................n2  15.....................H 0 : 1   2 .......................H 1 : 1   2
x1  200..................x 2  180....................H 0 :  12   22 ......................H 1 :  12   22
S1  30...................S 2  50
S 22 50 2 x1  x2   0
Ftest    2,7.............t test   1.3
S12 30 2 n1  1S12  n2  1S 22 1 1
 
n1  n2  2 n1 n2
Vidjeti..Slike..Tablicne..Vrijednosti..vece..od ..racunatih... Pr ihvaca..se..H 0 .
Pr osjecna.. prodaja..igracaka..u..dvije..smjene..se..ne..razlikuje.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 59/118

Kumulativna funkcija vjerojatnosti

 = 0,025
Funkcija gustoce vjerojatnosti

Rafinirano sakupljeni primjeri sa instrukcija


۞ 60/118

Kumulativna funkcija vjerojatnosti

df = 14+15 -2 = 27 ;  = 0,025
Funkcija gustoce vjerojatnosti

Rafinirano sakupljeni primjeri sa instrukcija


۞ 61/118

4.
oduzeće je ocijenilo funkciju potražnje za svojim proizvodom: ovisno o njegovoj cijeni i
P dohotku potencijalnih kupaca, na uzorku prodaja u zadnjih 20 godina. Excel ispis rezultata
regresije je prikazan u sljedećoj tablici:

a) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku obje nezavisne
(egzogene) varijable objašnjavaju potražnju za proizvodom promatranog poduzeća?
b) Ispišite regresijsku jednadžbu i interpretirajte koeficijente!
c) Interpretirajte pokazatelj Multiple R iz ANOVA tablice!
d) Možete li na temelju t-statistike koeficijenata smjera ustanoviti da obje egzogene varijable,
na razini značajnosti od 5%, pridonose očekivanoj potražnji za proizvodom ovog poduzeća.
Objasnite !
e) U ANOVA tablici interpretirajte razinu signifikantnosti (p-vrijednost) za F statistiku.
Napišite odgovarajuće hipoteze. Odgovor potkrijepite grafički!

Excelovo izvješče je u sledecoj tablici.


SUMMARY OUTPUT

Regression Statistics
Multiple R 0,98
R Square 0,97
Adjusted R Square 0,96
Standard Error 7,20
Observations 20,00

ANOVA
df SS MS F Significance F
Regression 2,00 26884,30 13442,15 258,94 0,00
Residual 17,00 882,50 51,91
Total 19,00 27766,80

Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
Intercept 114,07 29,93 3,81 0,0014 50,92 177,22
X Variable 1 -9,47 1,82 -5,20 0,0001 -13,31 -5,63
X Variable 2 0,03 0,01 4,51 0,0003 0,02 0,04

Za opširnu diskusiju pogledajte Elaborat na stranicama 51-53.


a) 97% totalnog odstupanja protumaceno je ili objasnjeno regresijskom jednadžbom
b) yˆ  114,07  9,47 * X 1  0,03 * X 2 ; Ako je X1 cijena tada potraznja raste sa padanjem cijene, to je
obrnuta proporcionalnost
Ako je X2 dohodak potencijalnih kupaca tada potraznja ima blagi porast sa dohotkom ili kazemo da je to
upravna proporcionalnost.

c) iznosi 0,98 pa je korelacija izuzetno jaka , ili korigirani koeficijent multiple determinacije je
0,97-0,96 = 0,01 .
Adjusted R Square = 0,96 ; 96% varijance protumaceno je regresijskim modelom
d) ) Lower 95%, sto znaci da je  = 0,05 .Pokazatelji P- value su gore markirani crvenom bojom.
Oni trebaju biti manji od 0,05 da bi znacajno utjecali statisticki na regresijsku analizu to jest na zavisnu varijablu.
Prema tome nezavisne varijable X1 i X2 znacajno utjecu na zavisnu varijablu .0,0001<0,05 I 0,0003<0,05

Rafinirano sakupljeni primjeri sa instrukcija


۞ 62/118

Pripreme za ispit

1.
retpostavimo da Ministarstvo zdravstva vjeruje da će epidemija gripe biti manjeg intenziteta
P nego li u istom lanjskom razdoblju. Stanovništvo grada Zagreba je pitano hoće li ta novost
utjecati na njih da odustanu od cijepljenja protiv gripe. Ako je samo 40 ljudi iz slučajno odabranog
uzorka od njih 246 izjavilo da sada više ne bi htjeli biti cijepljeni protiv gripe, procijenite 98%-tnom
pouzdanošću proporcijski udio svih stanovnika grada Zagreba koji cijepljenje smatraju
nepotrebnim.

n= 246
p "kapa" = 0,1626
z0,01 = 2,3263
SG = 0,0235
c1 = 0,1079 c2 = 0,2173

p() = 40/246 = 0,1626

98/(2*100) = 0,490
z 0,00 0,01 0,02 0,03
2,3 0,4893 0,4896 0,4898 0,4901

Interpolacija

(0,4901  0,4898) * x  0,02 0,0002  0,0006


0,490  0,4898   odakle....x   0,0267
0,03  0,02 0,03

2,3+0,0267 = 2,3267

SG 
1  0,1626 * 0,1626  0,0235
246

c1 = 0,1623 – 2,3267*0,0235 = 0,1076


c2 = 0,1623 + 2,3267*0,0235 = 0,2169

Rafinirano sakupljeni primjeri sa instrukcija


۞ 63/118

2.
nedavnoj anketi potpora unutarnjoj politici premijera iznosila je 65%. Dopuštena pogreška
U iznosila je 0,035. Kolika veličina uzorka je korištena ako smo pretpostavili 95%-tnu razinu
pouzdanosti?

z0,025 = 1,9600
n= 713,4138 Slijedi n = 714

95/(2*100) = 0,475

TABLICA

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

Ne treba interpolacija i direktno ocitavamo 1,9 pod 0,06 = 1,96

2
 1,960 
n = 0,65 * 1  0,65 *    713,44  714 zaokruzuje se na prvi cijeli broj čovjeka.
 0,035 

Rafinirano sakupljeni primjeri sa instrukcija


۞ 64/118

3.
vrtka koja prodaje programski paket iz domene e-poslovanja reklamira se tvrdnjom da će
T tvrtke koje taj paket koriste ostvariti prve godine prinos od najmanje 10% na svoju inicijalnu
investiciju. Slučajni uzorak od 10 tvrtki iskazao je sljedeće postotne povrate inicijalne investicije
nakon prve godine korištenja programa:

6,1 9,2 11,5 8,6 12,1 3,9 8,4 10,1 9,4 8,9

Pretpostavljajući da je populacija postotaka povrata inicijalne investicije normalno


distribuirana, testirajte tvrtkinu tvrdnju uz 95%-tnu razinu signifikantnosti.

Zadatak 3 1 6,1
H0 = MI >= 10,00 2 9,2
H1 = MI < 10,00 3 11,5
Alfa = 0,10 4 8,6
t* = -1,554 racunato 5 12,1
t 9 ,0,05 = 1,833 Tablicno 6 3,9
Ho se ne odbacuje ! 7 8,4
8 10,1
9 9,4
10 8,9
Prosjek = 8,82
SD uzorka = 2,4013
6 ,1 9 , 2 11, 58, 6 12,1 3, 9 8, 4 10,1 9 , 4 8, 9
Prosjek = 10  8,82
SD uzorka =
8,82  6,12  0,1444  7,1824  0,0484  10,7584  24,2064  0,1764 
1,6384  0,3364
 2,4012
10  1

t*=
8,82  10 * 10
 0,1554 racunato za 10 tvrtki
2,4012
Tablicno ocitavanje t 9 ; 0.05
d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano
0,1 0,05 0,025 0,01 0,005 Jednostrano
9 1,383 1,833 2,262 2,821 3,250

Rafinirano sakupljeni primjeri sa instrukcija


۞ 65/118

4.
oduzeće je ocijenilo funkciju potražnje za svojim proizvodom: ovisno o njegovoj cijeni,
P dohotku potencijalnih kupaca i cijeni povezanog dobra, na uzorku prodaja u zadnjih 20 godina.
Excel ispis rezultata regresije je prikazan u sljedećoj tablici6:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,9844
R Square 0,9691
Adjusted R Square 0,9633
Standard Error 7,3216
Observations 20

ANOVA
df SS MS F Significance F
Regression 3 26909,11666 8969,71 167,33 2,72842E-12
Residual 16 857,6833356 53,6052
Total 19 27766,8

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 121,86 32,49708056 3,75 0,001748168 52,96973531 190,751201
X Variable 1 -9,47 1,849020544 -5,12 0,000102555 -13,38912042 -5,549623575
X Variable 2 0,04 0,018725665 2,18 0,044274838 0,001182764 0,080576038
X Variable 3 -2,21 3,245309816 -0,68 0,505961765 -9,087945995 4,671552867
f) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku sve tri nezavisne
(egzogene) varijable objašnjavaju potražnju za proizvodom promatranog poduzeća?
g) Ispišite regresijsku jednadžbu i interpretirajte koeficijente!
h) Interpretirajte pokazatelj Multiple R iz ANOVA tablice!
i) Možete li na temelju t-statistike koeficijenata smjera ustanoviti da sve tri egzogene varijable,
na razini značajnosti od 5%, pridonose očekivanoj potražnji za proizvodom ovog poduzeća.
Objasnite !
j) U ANOVA tablici interpretirajte razinu signifikantnosti (p-vrijednost) za F statistiku.
Napišite odgovarajuće hipoteze. Odgovor potkrijepite grafički!
(Pogledati stranice 38, 41 - 43)

f)Da .Sa 96,91% su objasnjena odstupanja potrazivanja u odnosu na sve tri nezavisne
varijable.

g) yˆ  121,86  9,47 * X 1  0,04 * X 2  2,21 * X 3


X1 je cijena koja pada , potraznja tada raste, obrnuta proporcionalnost
X2 je dohodak kupaca u blagom porastu , takva je i potraznja,upravno proporcionalni
X3 je cijena povezanog dobra opada , potraznja raste,obrnuta proporcionalnost
h) Multiple R = 0,9844 . Govori da je povezanost izmedju zavisne varijable (funkcije potraznje ) i tri nezavisne
varijable X1,X2, i X3 jaka korelacija koja tezi jedinici , dakle funkcijskoj vrijednosti. Adjusted R Square treba
primjenjivati u regresijskoj analizi malih uzoraka (N<30) sa vecim brojem nezavisnih varijabli. 96,33% varijance je
protumaceno regresijskom modelom.

6
Za opširnu diskusiju pogledajte Elaborat na stranicama 51-53.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 66/118

i) Lower 95%, sto znaci da je  = 0,05 .Pokazatelji P- value su gore markirani crvenom bojom.Oni trebaju biti
manji od 0,05 da bi znacajno utjecali na regresijsku analizu to jest na zavisnu varijablu. Prema tome nezavisne varijable
X1 i X2 znacajno utjecu na zavisnu varijablu , dok varijabla X3 nema statisticki znacajan utjecaj na zavisnu varijablu.

F
8969,74  167,33..............F ?
j) 1, n  4, 0.05
53,6052
Tablice F1, n-4 0,05 = 4,49 to jest F1, 16 0,05 = 4,49 (20 observacija umanjene za 4 i to ;
Intercept , X Variable 1 , X Variable 2 , X Variable 3 )

Kako je računata vrijednost veća od tablične (F-nivo ili nivo sigurnosti)


odbacujemo nultu hipotezu i tvrdimo da je regresijski model jak , i dobro veže
nezavisno promjenljive X1, X2 i X3 sa zavisnom varijablom Y.

Pripreme za ispit

1.

oznato je da je standardna devijacija volumena vode za piće u bocama od 710-ml, koje puni
P određena tvrtka, jednaka 6 ml. Slučajno je izabran uzorak od devedeset boca i izmjeren
volumen u njima:

a) Nađite vrijednost z-statistike (zα/2) za 90% interval pouzdanosti za sredinu volumena boca
u cijeloj populaciji.
b) Izračunajte standardnu pogrešku za sredinu volumena boca
c) Izračunajte širinu 90%-nog intervala pouzdanosti za sredinu volumena boca vode u
populaciji.
d) Izračunajte donju i gornju granicu intervala pouzdanosti.
Rijesenja;

Rafinirano sakupljeni primjeri sa instrukcija


۞ 67/118

a) Z α/2 = +/- 1,6448 ; 90/(2*100) = 0,450

z 0,00 0,01 0,02 0,03 0,04 0,05


1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505

Interpolacija7
(0,4505  0,4495) * x  0,04 0,0005  0,004
0,450  0,4495   odakle....x   0,045
0,05  0,04 0,1

z/2 = 1,6+0,045 = 1,645

b)  90  6 / 90  0,63246

d)DKG = 710 – 1,645 * 6 90 = 708,959 i GKG = 710 + 1,645 * 6 90 = 711,040


c) sirina intervala = 711,040 – 708,959 = 2,081

2.

omoću uzorka procjenjuje se proporcija poreznih obveznika s tromjesečnim prihodom većim


P od 10000 EURA u regiji u kojoj je potkraj 2010. Zaposleno 97563 osoba. Varijanca populacije
planirana je u iznosu od 0,09. U procjeni se tolerira greška od najviše 0,025 odnosno 2,5%. Razina
pouzdanosti procjene proporcije je 95%. Pretpostavlja se da je riječi o velikom uzorku.

a) Odredite veličinu uzorka za procjenu proporcije osnovnog skupa navedene skupine


zaposlenih.
b) Nakon izbora jedinica u uzorak ustanovljeno je da 65 zaposlenih u uzorku ima tromjesečni
prihod veći od 10000 EURA. U kojim se granicama može očekivati proporcija svih
zaposlenih spomenute kategorije poreznih obveznika? Razina pouzdanosti je 95%.

1,96 0,09 2
a) N = 97563, pq = 0,09, d = 0,025, z0,025 = 1,96 n0 = [ ] = 553 f0 = 553/97563 =
0,025
0,00555<0,05, n = n0 velicina uzorka za statisticku obradu = 553

Interpolacija = 5% ; 95/(2*100)= 0,4750 , interpolacija nije potrebna vec ocitavamo

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07


1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756
Z0,025 = 1,9 + 0,06 = 1,96

7
Gornja z vrijednost je izracunata u Excelu pa zato nije ni data sirina intervala koja može proizaći i iz interpolacije

Rafinirano sakupljeni primjeri sa instrukcija


۞ 68/118

 

b) p 
65  
, p  0,11754 , q  1  pˆ   0,88246 ,   
pq = 0,01371
553 p n0  1


 
P( - z0,025   ) < p < P( + z0,025  )  P(0,09067<p<0,14441) = 0,95 !
p p p p

pˆ  z 0,025 *  pˆ  p  pˆ  z0,025 *  pˆ
Granice prihoda od 906,7 eura do 1444 eura. (Pomnozene sa 10 000 ).
Interpolacija u tablici :Segmenti povrsina ispod Normalne krivulje

y x
0,0 0,5
0,09067 x=!
0,10 0,4602
(0,10  0,0) * x  0,5  1,2563  0,09067
0,09067  0,0   odakle....x   2 * 0,4639  0,9278
0,4602  0,5  2,51256

3.

studenta iz slučajno odabranog uzorka, koji su upisali kolegije iz poslovne etike,


1562 zamoljeni su da se, koristeći skalu od 1 („uopće se ne slažem“) do 7 („jako se
slažem“), izjasne o tvrdnji: „Viši menadžeri tvrtki su socijalno osjetljivi“. Obradom uzorka
ustanovljeno je da su se studenti opredijelili za prosječnu ocjenu 4,27, uz standardnu devijaciju
izrečenih ocjena od 1,32.

a) Uz 1%-tnu razinu signifikantnosti testirajte nultu hipotezu koja kaže da sredina populacije
iznosi 4, nasuprot njezinoj dvosmjernoj alternativnoj hipotezi.
b) Uz razinu8 signifikantnosti od 1% nađite vjerojatnost prihvaćanje nulte hipoteze u slučaju da
je stvarna sredina odgovora jednaka 3,95.

a)
x4
-2,576 < < 2,576 => DKG = 3,914; GKG = 4,086, Prihvaća se H1 hipoteza
1,32 / 1562
3,914  4,086
3,914<4<4,086..........  4,0
2

3,914  3,95 4,086  3,95


b)   P( )< z < ) =P( -1,08 <Z <4,07 ) = 0,8599
1,32 1562 1,32 1562

8
To je zapravo “ snaga testa“, knjiga strana 356.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 69/118

Interpolacija u tablici :Segmenti povrsina ispod Normalne krivulje

z = 1,08 = 1,08 , napomena interpolaciju u odnosu na 4,07 ne mozemo vrsiti u tablicama.

y x
1,0 0,8413
1,08 x=!
1,1 0,8643

(1,10  1,0) * x  0,8413 0,08  3,6578


1,08  1,0   odakle....x   0,8597
0,8643  0,8413 4,34782
Sve interpolacije teku preko jednadžbe pravca kroz dvije točke

 y2  y1  
y  y1  * x  x1 
x2  x1 
4.

akroekonomist je, na uzorku od 120 kvartalnih podataka, ocijenio funkciju potrošnje


M kućanstava i dobio sljedeće rezultate:

C = 2,05 + 0,70 x DIH + 0,234 x M + u


(1,1081) (0,1647) + (0,0412)

F = 7,85 R2 = 09052

gdje su: C – potrošnja kućanstava, DIH – raspoloživi dohodak kućanstava, M – oročeni depoziti
kućanstava u poslovnim bankama. Brojevi u zagradama su standardne greške koeficijenata regresije

a) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku obje nezavisne
varijable: DIH i M objašnjavaju potrošnju kućanstava?
b) Možete li na razini signifikantnosti od 5% utvrditi da obje varijable: i DIH i M, doista,
utječu na potrošnju kućanstava (C)?
c) Što u smislu snage objašnjavanja potrošnje kućanstava, dvjema gore ispitivanim nezavisnim
varijablama, govori empirijska F statistika: uz pretpostavljenu razinu signifikantnosti od
95%?
d) Ako raspoloživi dohodak kućanstava iznosi 200 milijardi EURA, a oročeni depoziti
kućanstava 50 milijardi EURA, koliko bi (prema gornjoj jednadžbi) trebala iznositi
potrošnja kućanstava?

Rafinirano sakupljeni primjeri sa instrukcija


۞ 70/118

Za opširnu diskusiju pogledajte Elaborat na stranicama 51-53. i tablicu na str. 41.

a) Da. Regresijska analiza je obuhvaćena sa 90,52% poznatim ili objašnjenim odstupanjem.

b) M – oročeni depoziti kućanstava u poslovnim bankama statički značajno utječe na potrošnju


kućanstava(C) jer je p<0,05 ( p= 0,0412) signifikantnost je 5% = 0,05

DIH – raspoloživi dohodak kućanstava statistički ne utječe na potrošnju kućanstava(C) jer


je ; p>0,05 (p =0,1647 ).

c) F = 7,85 ( treba biti veći od jedan). Možemo zaključiti da su rezidualna odstupanja


značajna , jer ona umanjuju F-nivo u nazivniku , pa otuda i proizlazi da DIH nije statistički
značajan.To proizlazi i iz samoga zapisa regresijske jednadžbe gdje „u“ označava
neobjašnjeni dio zavisne varijance.

d) C = 2,05 + 0,70 x DIH + 0,234 x M + u

DIH = 200 milijardi EURA , M = 50 milijardi EURA

Cˆ  2,05  0,70 * 200  0,234 * 50  u  153,75milijardiE URA  u


Ako je DIH = 0 i M = 0 C =2,05 Milijarde Eura +u .

ANOVA i REGRESIJA

oduzeće za distribuciju električne energije analiziralo je prodaju električne energije u GWh


P (109 Wh), u razdoblju prvo tromjesečje 2007. do četvrtog tromjesečja 2010.. Analizom trenda
dobilo je sljedeće rezultate (Excel ispis):

SUMMARY OUTPUT

Regression Statistics
Multiple R 0,7304
R Square 0,5335
Adjusted R Square 0,5001
Standard Error 1,8164
Observations 16

ANOVA
Significance
df SS MS F F
Regression 1 52,8118 52,8118 16,0076 0,0013
Residual 14 46,1882 3,2992
Total 15 99

Rafinirano sakupljeni primjeri sa instrukcija


۞ 71/118

Standard Upper
Coefficients Error t Stat P-value Lower 95% 95%
Intercept 11,90 0,9525 12,4934 0,0000 9,8571 13,9429
X Variable 1 0,394 0,0985 4,0010 0,0013 0,1828 0,6054
Primjedba : 4,0010 ^2 = 16,0076 (pogledajte žuta polja)
k) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku varijabla
vrijeme, iskazana u tromjesečjima, objašnjava prodaju električne energije u GWh ?
l) Ispišite regresijsku jednadžbu i interpretirajte koeficijente!
m) Interpretirajte pokazatelj Multiple R iz ANOVA tablice!
n) Možete li na temelju t-statistike koeficijenta smjera ustanoviti da vrijeme, na razini
značajnosti od 5%, pridonosi očekivanoj prodaji električne energije. Objasnite !
o) U ANOVA tablici interpretirajte razinu signifikantnosti (p-vrijednost) za F statistiku.
Napišite odgovarajuće hipoteze. Odgovor potkrijepite grafički!

Za opširnu diskusiju pogledajte Elaborat na stranicama 51-53. kao i tablicu na str. 41.

k) Da. 53,35% regresijske statistike protumačeno je objašnjenim odstupanjem.


l) yˆ  11,90  0,394 * X 1  u , gdje su „u“ rezidualna odstupanja.
m) Multiple R = 0,7304. Korelacija između X1 i ŷ je relativno jaka. Adjusted R Square R 2 =0,5001 ,
što govori da je 50% varijance u razdoblju prvo tromjesečje 2007. do četvrtog tromjesečja 2010.
protumačeno sa X1.
r* n2
t .......r   0,5335  0,7304.........n  16
1 r2
n)
 0,7304 * 16  2
t  4,001
1  0,5335

F14, 0.05 = 2,145 , Tablična vrijednost manja od računate, H0 se odbacuje , što znači da se
može prihvatiti činjenica da vrijeme utječe na prodaju električne energije.
d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano
0,1 0,05 0,025 0,01 0,005 Jednostrano
14 1,345 1,761 2,145 2,624 2,977

o) P-value za Intercept i X Variable 1, su manji od 0,05. pa se prihvaća hipoteza da ti


parametri imaj značajan statistički utjecaj na zavisnu varijablu Y.
To također potvrđuje i F-test.
F  4,0010 
52,8118
 16,0076.............F1,162,0.05  ?
2

3,2992
F1, 14 , 0.05 = 4,60 pa se H0 odbacuje a prihvaća hipoteza o već spomenutom statičkom
utjecaju .(16 observacija -2 zbog linearnosti = 14 redova u F-tablicama sa 1 stupcem).

Rafinirano sakupljeni primjeri sa instrukcija


۞ 72/118

Priprema za ispit
1.

lužbenik referade za upis studenata na studij poslovne administracije ustanovio je da je prosjek


S uspjeha koji su kandidati za upis donijeli iz srednje škole slijedio normalnu distribuciju sa
standardnom devijacijom 0,45. Prosjek uspjeha u srednjoj školi izračunat iz uzorka od 25 kandidata
iznosio 2,90.
e) Nađite 95%-ni interval pouzdanosti za sredinu populacije.
f) Temeljem rezultata dobivenih iz uzorka statističar je zaključio da interval pouzdanosti za
sredinu populacije ima raspon od 2,81 do 2,99. Nađite razinu pouzdanosti za interval.

a) n =25, x =2,90, σ = 0,45 ; z0,025 = 1,96


95/(2*100) = 0,475

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

x +/- Z 0,025 *  n = 2,90 +/- 1,96 * (0,45/ 25 ) = 2,7236 do 3,0764

2,99  2,90 = zα/2 = 1, α = 2[1-Fx(1)] = 0,3174


b)
0,45 25
 = 2 (1-0,8413) = 0,3174
ili 0.1587*2 = 0,3174 100*(1-0,3174) = 68,26%

Segmenti povrsina ispod normalne krivulje; Beogradsko izdanje statistickih tablica9


z

1. 0,3413 0,8413 0,1587 0,6826 0,3174

Segmenti povrsina ispod normalne krivulje;(Müller-Neumann-Storm) Njemačko izdanje


z …0 1 2 3 4
1.00 0,841345 0,841587 0,841828 0,842070 0,842311

9
Dolazak do povrsina razlicitim metodama

Rafinirano sakupljeni primjeri sa instrukcija


۞ 73/118

Do pribliznog rezultata interpolacijom10 Zagrebackog izdanja tablica(žuto) ili očitavanjem crvenog


markera
z / 2 
2,99  2,81  0,08 0,08  0,0  0,1  0,0 * x  0,0 ....x  0,08  0,03184
0,45 / 25 0,0398  0,0 2,51256

(1,0)- (0,08 ) = 0,3413 – 0,03184 = 0,3094 , 100*(1- 0,3094)= 69,054%

z 0,00 0,01 ....... 0,08


0,0 0,0000 0,0040 ....... 0,0319
0,08 ?
0,1 0,0398 0,0438
,,,,,,,, ,,,,,,, ,,,,,,,
1,0 0,3413 0,3438

2.

rocjenjuje se proporcija birača za kandidata X na izborima na području A. Koliko birača od


P njih 62653 treba izabrati u uzorak ako se proporcija osnovnog skupa procjenjuje na razini
pouzdanosti od 95% i ako se tolerira greška od najviše +/- 2,5%?
0,95/(2)= 0,475 , u prethodnom zadatku je očitano z = 1,9 pod 6.
dr = 0,025 V= 1

 / 2V  1,96*1
2


2

z 6147
n    0,025 
 , n0 = 6147, f0 = =0,09811
62653
 dr   
0

f0 > 0,05, n= n 0
=
6147
=5598.
1  0,09811
1 n 0

10
To je zapravo jednadžba pravca kroz dvije točke

Rafinirano sakupljeni primjeri sa instrukcija


۞ 74/118

3.

slučajnom uzorku od 150 svršenih studenata poslovne administracije njih 50 slaže se


U ili se jako slaže s tvrdnjom da bi poduzeća svoje napore trebala usredotočiti na
inovativne strategije e-trgovanja. Uz 5% razinu signifikantnosti testirajte nultu hipotezu koja kaže
da se najviše 25% svih svršenih studenata poslovne administracije slaže s izrečenom konstatacijom.

Nulta hipoteza H0: p <= 0,25 1 - 0,25 = 0,75


Alternativna hipoteza H1: p > 0,25 n = 150

Signifikantnost 5% (100-2*0,05)/2= 0,4500 , dvosmijer , Interpolacija na markere u boji11

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

0,45  0,4495 
0,4505  0,4495 * x  0,04 ....x  0,0005  0,004  0,045
0,05  0,04 0,1
Z0,05 = 1,6+0,045 = 1,645; tablična vrijednost

50 / 150  0,25
Računata vrijednost z =2,356 => H0 se odbija.
0,25 * 0,75 / 150

4.

M akroekonomist je, na uzorku od 120 kvartalnih podataka ocijenio funkciju investicija


poduzeća i dobio sljedeće rezultate:

I= 5,06 + 0,35 x QGDP - 0,003 x i+ u


(1,1081) (0,1647) + (0,0412)

F = 8,25 R2 = 09137

gdje su: I – bruto investicije poduzeća, QGP– kvartalni BDP-ovi, i – prosječni dugoročni
kamatnjaci u poslovnim bankama. Brojevi u zagradama su standardne greške koeficijenata regresije

e) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku obje nezavisne
varijable: QGP i i objašnjavaju bruto investicije poduzeća?
f) Možete li na razini signifikantnosti od 5% utvrditi da obje varijable: i QGP i i, doista, utječu
na bruto investidije poduzeća (I) ?

11
To je zapravo jednadžba pravca kroz dvije točke

Rafinirano sakupljeni primjeri sa instrukcija


۞ 75/118

g) Što u smislu snage objašnjavanja potrošnje kućanstava, dvjema gore ispitivanim


nezavisnim varijablama, govori empirijska F statistika: uz pretpostavljenu razinu
signifikantnosti od 95%?
h) Ako kvartalni BDP iznosi 350 milijardi EURA, a prosječni dugoročni kamatnjaci 5%, ,
koliko bi (prema gornjoj jednadžbi) trebale iznositi bruto investicije?
Za opširnu diskusiju pogledajte Elaborat na stranicama 51-53.

e) Da. Koeficijent determinacije je 0,9137 što govori u prilog da je 91,37 % odstupanja u


regresijskoj jednadžbi objašnjeno.Također govori u prilog o dobroj korelacijskoj vezi između QGP
i i , sa bruto investicijama poduzeća. Za QGP = 0, i i = 0 , I = 5,06 + u.(u je Rezidual ).
Pored toga QGP ima proporcionalan udio u I, dok je utjecaj kamatnjaka na I negativan(sa porastom
kamatnjaka I opada).

f) Signifikantnost 5% , p< 0,05. Kako je p kamatnjaka p= 0,0412 a to je manje od 0,05 ,


zaključujemo da kamatnjaci statistički značajno utječu na bruto investicije poduzeće ali su blizu
granice kada bi mogli govoriti i obratno. Za QGP p = 0,1647 a to je manje od 0,05 te stoga slijedi
odgovor da QGP nema statistički utjecaj na I.

g) F = 8,25 ( treba biti veći od jedan) i na njega u nazivniku utječe rezidual obrnuto proporcionalno
, što je vidljivo i u F-statistici , da je jedna nezavisna varijabla blizo granice statističkog utjecaja a
druga nezavisna varijabla izvan dosega statističkog utjecaja za signifikantnost 5%., Ako se misli na
snagu testa :
I) Snaga testa je veća što je stvarna sredina udaljenija od hipotetske sredina
II) Što je razina singnifiksntnodti testa () manja (Snaga = 1-  )
 xC    
  P *  z  
  / n 
III) Što je varijanca populacije veća
IV)Što je uzorak veći

h) BDP=350 milijardi EURA , i =5% , tada je I12


Iˆ  5,06  0,35 * 350  0,003 * 0,05  u  127,55985milijardiE URA  u

12
Ne zaboravite iznad I staviti znak ^ koji interpretira regresijsku jednadžbu

Rafinirano sakupljeni primjeri sa instrukcija


۞ 76/118

ANOVA i REGRESIJA

arketinška služba poduzeća XXX upotrijebila je regresijsku analizu za ustanovljivanje jesu li


M napori poduzeća u smislu financiranja promidžbenih aktivnosti, a radi povećanja vrijednosti
prodaje, urodili plodom – i dobila je sljedeće rezultate (ispis u Excel-u):

SUMMARY OUTPUT

Regression Statistics
Multiple R 0,9226
R Square 0,8512
Adjusted R
Square 0,8326
Standard Error 2,8607
Observations 10

ANOVA
Significance
df SS MS F F
Regression 1 374,533 374,533 45,768 0,000
Residual 8 65,467 8,183
Total 9 440,000

Standard Upper
Coefficients Error t Stat P-value Lower 95% 95%
Intercept 7,60 6,33 1,20 0,26440 -7,00 22,20
X Variable 1 3,53 0,52 6,77 0,00014 2,33 4,74
Primjedba; 6,77^2 = 45,768 , Pogledajte žuta polja ( to je uvijek za linearnu regresiju)
a) Možete li, na temelju koeficijenta determinacije (R2), reći u kojem postotku izdaci za
reklamu objašnjavaju visinu prodaje (prihoda poduzeća),
b) Ispišite regresijsku jednadžbu i interpretirajte koeficijente!
c) Interpretirajte pokazatelj Multiple R iz ANOVA tablice!
d) Možete li na temelju t-statistike koeficijenta smjera ustanoviti da izdaci za reklamu
značajno, na razini značajnosti od 5%, pridonose prodaji. Objasnite !
e) U ANOVA tablici interpretirajte razinu signifikantnosti (p-vrijednost) za F statistiku.
Napišite odgovarajuće hipoteze. Odgovor potkrijepite grafički!
(Pogledati stranice 38, 41 - 43, i 53)

a) Da. R2 = 0,8512 što govori u prilog daj e 85,12 % objašnjeno regresijsko odstupanje, ili da je
sa istim postotkom obuhvaćeno obješnjenje o utjecaju reklama na prihod poduzeća.
b) yˆ  7,60  3,53 * X 1  u ;gdje je „u “ rezidualno odstupanje. Varijabla X1 , izdaci za
reklame , utječe upravo proporcionalno na prihod poduzeća , to jest povećanim ulaganjem u
reklame možemo očekivati i povećanje prihoda poduzeća.

c) ) Multiple R = 0,9226. Korelacija između X1 i ŷ je izuzetno jaka. Adjusted R Square R 2 =0,8326 ,


što govori da je 83,26% varijance ulaganjem u reklame protumačeno sa X1.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 77/118

r* n2
t .......r   0,8512  0,9226.........n  10
1 r2
d) + jer je tg ispred X1 pozitivan(3,53)
 0,9226 * 10  2
t  6,765
1  0,8512
2 2
Iskustveno pravilo r    0,63245
n 10

Tablična vrijednost je: F8, 0.05 = 2,306 pa se prihvaća H1 (Tablice jače od računatog)
Nultu hipotezu možemo odbaciti jer postoje čvrsti dokazi o linearnosti veze X1 i Y.

d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano


0,1 0,05 0,025 0,01 0,005 Jednostrano
8 1,397 1,860 2,306 2,896 3,355

e) p-Value = 0,00014 < 0,05 pa postoji značajan statistički utjecaj X1 na Y.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 78/118

 2  DISTRIBUCI JA

A
nalizira se uspjeh studenata na ispitu iz matematike u ovisnosti o predznanju
algebre.Studenti iz dvije grupe se analiziraju; oni koji su slušali matematiku do jedne
godine i oni koji su slušali dvije i više godine. = 5%.Rezultati su predstavljeni u tablici.

Broj godina Ukupno


učenja
Broj postignutih bodova
0-10 11-20 21-30 31-40 41-5 0
0-1 5.....(E11) 20....(E12) 35....(E13) 10.....(E14) 5.......(E15) 75
2 i više 15...(E21) 10....(E22) 40....(E23) 65.....(E24) 45.....(E25) 175
Ukupno 20 30 75 75 50 250

H0 : ne postoji zavisnost broja bodova i godina učenja algebre


H1 : postoji zavisnost broja bodova i godina učenja algebre

20 * 75 30 * 75 75 * 75 75 * 75
E11   6......E12   9....E13   22,5....E14   22,5, , , , , , ,
250 250 250 250
20 *175 30 *175 75 *175 75 * 75
E 21   14..E 22   21..E 23   52,5..E 24   52,5, , , , , ,
250 250 250 250

Tablica očekivanja(nade) 6 9 22,5 22,5 15


izgleda: 14 21 52,5 52,5 35

 2

5  6
2

20  9
2

35  22,5
2

10  22,5
2

5  15
2

6 9 22,5 22,5 15
15  142  10  212  40  52,52  65  52,52  45  352  48,809
14 21 52,5 52,5 35

Stupnjevi slobode: df  row  1 * colum  1  2  1 * 5  1  1* 4  4

Chi 2 Distribucija
Kritične vrijednosti - Desnostrani test
- razina signifikantnosti
d.f. 0,10 0,05 0,025 0,02 0,01 0,005
,,, ,,, ,,, ,,, ,,, ,,, ,,,
4 7,7794 9,4877 11,1433 11,6678 13,2767 14,8603

Kako je tablična vrijednost 9,4877 manja od računate 48,809 , prihvaćamo hipotezu da postoji
zavisnost između bodova i godina učenja algebre (H1).Pogledajte dolje očitavanje funkcije i grafički
prikaz .(1-0.05 = 0.95).

Rafinirano sakupljeni primjeri sa instrukcija


۞ 79/118

Kumulativna funkcija vjerojatnosti

Funkcija gustoce vjerojatnosti

Rafinirano sakupljeni primjeri sa instrukcija


۞ 80/118

Kumulativna funkcija vjerojatnosti  2

0.8
Probability = 0,995
alfa = 0,005
0.6
Degrees of freedom = 4
Tab. vrijed.=14,860
0.4

0.2

0
0 5 10 15 20 25

Funkcija gustoce vjerojatnosti  2


0.2

0.15
Probability = 0,995
alfa = 0,005
0.1 Degrees of freedom = 4
Tab. vrijed.= 14,8603
Density = 0,0022034

0.05

0
0 5 10 15 20 25

0.2

0.15 Probability = 0,995


alfa = 0,005
Degrees of freedom = 8
0.1 Tab. vrijed.=21,995
Density = 0,001883

0.05

0
0 5 10 15 20 25

Rafinirano sakupljeni primjeri sa instrukcija


۞ 81/118

F  DISTRIBUCI JA

nvestitor prosuđuje istinitost informacije da su dionice ALB i SEP jednake rizičnosti. U tu svrhu
I izabran je slučajni uzorak od 17 prosječnih zaključanih ocjen dionica ALB na burzi koje je
rezultirao prosječnom zaključnom cijenom od 12,5 E s prosječnim odstupanjem od 2,5 E. U uzorku
26 prosječnih zaključnih cijena dionice SEP ustanovljena je prosječna zaključna cijena od 14 E , s
prosječnim odstupanjem od 2,2 E. Do kojeg je zaključka došao na razini signifikantnosti od 10%.
= 10%  /2 = 5%

ALB SEP
n1  17 n2  26
x1  12,5E x 2  14 E
S1  2,5 S 2  2,2
  10%   10%
 / 2  5%  / 2  5%
df1  17  1  16 df 2  26  1  25
Columns Rows

Daje se primjena interpolacije u


ovim tablicama , kao i direktno
očitavanje preko funkcije FINV
U Excelu

2
S 2  2,5 
F  12     1,29 Računata
S 2  2,2 

Alfa = 0,05
Broj stupnjeva slobode df1 (Deg_freedom1- Columns)
,,,,,,,,,,,,, ,,,,,,,, 12 15 16 20 ,,,,,,,,,,,,,,
25 ,,,,,,,, 2,16 2,09 x=? 2,01 ,,,,,,,,,,,,,,,
,,,,,,,,,,,,, ,,,,,,,, Točka 1 Točka 2 ,,,,,,,,,,,,,,,
F(16, 25)  2,09 ; već ova poredba govori o prihvaćanju H0 (tablična vrijednost veća od računate)
Ako želimo interpolaciju, koja ovdije nije potrebna:
16  15 
20  15 * x  2,09........x  1  130,625  2,074
2,01  2,09  62,5
Excel daje rezultat; Komanda;

Insert / Function.../ padajuća lista- Statistical / FINV / OK

Rafinirano sakupljeni primjeri sa instrukcija


۞ 82/118

Kumulativna funkcija vjerojatnosti F-distribucija

Rafinirano sakupljeni primjeri sa instrukcija


۞ 83/118

Funkcija gustoce vjerojatnosti – F - Distribucija

Rafinirano sakupljeni primjeri sa instrukcija


۞ 84/118

PrilogI;Smjernice za izbor odgovarajuäeg pravila odlučivanja za proporcijski udio u populaciji

Postavite Hipotezu
I II III
H 0 : P  P0 H 0 : P  P0 H 0 : P  P0
H 1 : P  P0 H 1 : P  P0 H 1 : P  P0

Zadajte 

1 P0  * P0
 pˆ 
n

I Tip III
Hipoteze

II

Pravilo odlučivanja Pravilo odlučivanja Pravilo odlučivanja


pˆ  p 0
z pˆ  p0
1  p0  * p0 / n  / 2  z
p 0 * 1  p 0  / n pˆ  p 0
pˆ  p 0   z
  z / 2 p 0 * 1  p 0  / n
p 0 * 1  p0  / n
Odbaciti H0
Prihvatiti H1 Odbaciti H0
Odbaciti H0 Prihvatiti H1
Prihvatiti H1

Dolazak do prozora u MATLAB-u

Rafinirano sakupljeni primjeri sa instrukcija


۞ 85/118

Help/ Demos (MATLAB)

Toolboxes / Statistics

Probability / Distributions

Rafinirano sakupljeni primjeri sa instrukcija


۞ 86/118
PrilogII;Smjernice za izbor odgovarajućeg pravila odlučivanja za sredinu populacije
Postavite Hipotezu;
I II III
H 0 :   0 H 0 :   0 H 0 :   0
H1 :   0 H1 :   0 H1 :   0
Zadajte 

Uzmite:  x2   2 / n DA NE Uzmite: s x2  s 2 / n
 2  poznato ?
Standardna normalna distribucija Z Studentova t- Distribucija

I TIP HIPOTEZE III I TIP HIPOTEZE III

II II
Izračunajte Izračunajte Izračunajte Izračunajte Izračunajte Izračunajte
kritične kritičnu kritičnu kritične kritičnu kritičnu
vrijednosti vrijednost vrijednost vrijednosti vrijednost vrijednost
xU   0  z / 2 *  x xCrit   0  z *  x xCrit   0  z *  x xU  0  t / 2 * sx xCrit   0  t * s x xCrit   0  t * s x
x L   0  z / 2 *  x xL  0  t / 2 * sx

Pravilo
Pravilo odlučivanja
odlučivanja Pravilo odlučivanja Pravilo odlučivanja Pravilo odlučivanja Pravilo odlučivanja Pravilo odlučivanja
AkojejexxxxUiliili
Ako Ako je x  xCrit Ako je x  xCrit Ako je x  xU ili Ako je x  xCrit Ako je x  xCrit
U
 xxL
xx  x  xL
L
Odbaciti HH00 Odbaciti H0 Odbaciti H0 Odbaciti H0 Odbaciti H0 Odbaciti H0
Odbaciti Prihvatiti H1 Prihvatiti H1 Prihvatiti H1 Prihvatiti H1
PrihvatitiHH11
Prihvatiti Prihvatiti H1

Rafinirano sakupljeni primjeri sa instrukcija


۞ 87/118

a  qnorm(0.75  2  1) a  2.674

b  qnorm(0.9  2  1) b  3.282

c  qnorm(0.95  2  1) c  3.645

y  0  1

z-Distribucija
0.8
pnorm ( x  2  1)
dnorm ( x  2  1)
0.6
y
y 0.4
y
0.2

0
1 0 1 2 3 4
x x a b c
Distribution
Density
75%-tile
90%-tile
95%-tile

Veza Gamma funkcije sa distribucijama:


Distributions associated with the Student's T Equation:

Distribution generators for the Chi-squared Equation:

Rafinirano sakupljeni primjeri sa instrukcija


۞ 88/118

Distribution generators for the Gamma Equation:

Distributions associated with the Normal Equation:

Distribution generators for the F-Distribution Equation:

<<Statistics`ANOVA`
onewaydata = {{1,15.75}, {1,11.55}, {1,11.16}, {1,9.92},
{1,9.23}, {1,8.20}, {2,12.63}, {2,11.46}, {2,10.77}, {2,9.93},
{2,9.87}, {2,9.42}, {3,9.27}, {3,8.28}, {3,8.15}, {3,6.37},
{3,6.37}, {3,5.66}};
ANOVA[onewaydata]

ANOVA
DF SumOfSq MeanSq FRatio PValue
Model 2 48.5287 24.2644 6.97021 0.00723432
,
Error 15 52.2173 3.48115
Total 17 100.746

All 9.66611
Model 1 10.9683
CellMeans
Model 2 10.68
Model 3 7.35

Rafinirano sakupljeni primjeri sa instrukcija


۞ 89/118

Priroda i drustvo Lutrijski Turisricki Alfa=0,05


15,75 12,63 9,27
11,55 11,46 8,28
11,16 10,77 8,15
9,92 9,93 6,37
9,23 9,87 6,37
8,2 9,42 5,66

Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
Priroda i drustvo 6 65,81 10,96833 7,004777
Lutrijski 6 64,08 10,68 1,44504
Turisricki 6 44,1 7,35 1,99364

ANOVA EXCEL
Source of
Variation SS df MS F P-value F crit
Between Groups 48,52874 2 24,26437 6,970213 0,007234 3,68232
Within Groups 52,21728 15 3,481152

Total 100,746 17
ANOVA- prvi metod
ANOVA
DF SumOfSq MeanSq FRatio PValue
Model 2 48.5287 24.2644 6.97021 0.00723432
,
Error 15 52.2173 3.48115
Total 17 100.746

All 9.66611
Model 1 10.9683
CellMeans
Model 2 10.68
Model 3 7.35
ANOVA –drugi metod
 15.75   12.63   9.27 
 11.55   11.46   8.28 
     
D   11.16 
D   10.77 
D   8.15 
0  9.92  1  9.93  2  6.37 
 9.23   9.87   6.37 
     
 8.20   9.42   5.66 

Enter level of significance :   0.01

Program for conducting ANOVA test:

Rafinirano sakupljeni primjeri sa instrukcija


۞ 90/118

ANOVA  D     n total  0

SX  0
SX2  0
T0
for i  0  last ( D)

SDi  Di
nDi  length D  i
SX  SX  SDi

SX2  SX2   D D
i 
i

2
SDi
TT
nDi
n total  n total  nDi

2
SX
SSfactor  T 
n total

SSerror  SX2  T

2
SX
SStotal  SX2 
n total

dffactor  length ( D)  1

dferror  n total  length ( D)

dftotal  n total  1

 SSfactor 
 SSfactor dffactor 
 dffactor

Analysis   SSerror 
0  SSerror dferror 
 dferror 
 SS 
 total dftotal 0

Analysis 00  2
Analysis 
1
Analysis 01  2
Analysis  qF 1    dffactor  dferror
2
Analysis  Analysis  Analysis
3 1 2
Analysis

Rafinirano sakupljeni primjeri sa instrukcija


۞ 91/118

The ANOVA table

 48.528744 2 24.264372 
ANOVA  D    0   52.217283 15 3.481152 
 
 100.746028 17 0 

ANOVA EXCEL
Source of
Variation SS df MS F P-value F crit
Between Groups 48,52874 2 24,26437 6,970213 0,007234 6,3588735
Within Groups 52,21728 15 3,481152

Total 100,746 17

 {3,3} 
 
ANOVA  D      6.970213  The observed F statistic
 6.358873  The critical F quantile
 0 
 
ANOVA D   1  6.970213
ANOVA D   2  6.358873 Excel F(2,15, 0.01)=6,358873481
ANOVA D   3  0

Rafinirano sakupljeni primjeri sa instrukcija


۞ 92/118

Gamma funkcija

 ( 4.25 0)  8.2850851418352201659 Pi  3.141592653589793238

1 2.6372245085205841239 Pi  8.2850851418352201651

 4.251  x 585 2
2
 x e dx   

 
256 3
0

 4
1
2.
585 2
   2.6372245085205841239 
  
256. 3
 
4.

10

8.13  (4.25,0)

6.25

4.38

( z) 2.5

0.63

1.25

3.13

5
4 2.63 1.25 0.13 1.5 2.88 4.25 5.63 7
z

 ( 4.0 0)  6. (4 -1)! = 3! = 3*2*1 = 6

Rafinirano sakupljeni primjeri sa instrukcija


۞ 93/118

<<Statistics`LinearRegression`
data = {{0.055, 90}, {0.091, 97}, {0.138, 107},
{0.167, 124}, {0.182, 142}, {0.211, 150},
{0.232, 172}, {0.248, 189}, {0.284, 209},
{0.351, 253}};
(regress = Regress[data, {1, x}, x];
Chop[regress, 10^(-6)])

Estimate SE TStat PValue


ParameterTable 1 39.6484 8.86908 4.4704 0.00208211,
x 580.151 41.5757 13.9541 0
RSquared 0.960536, AdjustedRSquared 0.955603, EstimatedVariance 123.247,
DF SumOfSq MeanSq FRatio PValue
Model 1 23998.1 23998.1 194.716 0
ANOVATable
Error 8 985.973 123.247
Total 9 24984.1
dplot=ListPlot[data]
250

225

200

175

150

125

100
0.05 0.15 0.2 0.25 0.3 0.35
Graphics
EXCEL X Y Alpha =0,05
0,055 90 Estimate
0,091 97 Coefficients
0,138 107 39,64838733
0,167 124 580,1511622
0,182 142
0,211 150
0,232 172
0,248 189
0,284 209
0,351 253

SUMMARY OUTPUT

Regression Statistics
Multiple R 0,980069373
R Square 0,960535976
Adjusted R 0,955602973

Rafinirano sakupljeni primjeri sa instrukcija


۞ 94/118

Square
Standard Error 11,10165039
Observations 10

ANOVA
Significance
df SS MS F F
Regression 1 23998,12687 23998,13 194,7163 6,73964E-07
Residual 8 985,9731308 123,2466
Total 9 24984,1

Upper
Coefficients Standard Error t Stat P-value Lower 95% 95%
Intercept 39,64838733 8,869081922 4,470405 0,002082 19,19624776 60,10053
X 580,1511622 41,57574504 13,95408 6,74E-07 484,2773223 676,025

300,0

250,0 0,351; 253,000

y = 580,15x + 39,648
R2 = 0,9605 0,284; 209,000
200,0
0,248; 189,000

0,232; 172,000

150,0 0,211; 150,000


0,182; 142,000
Series1
0,167; 124,000 Linear (Series1)

0,138; 107,000
100,0 0,091; 97,000
0,055; 90,000

50,0

0,0
0,0000 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000

Rafinirano sakupljeni primjeri sa instrukcija


۞ 95/118

Primjer sa vježbi;

ontrolom težine 100 paketića maslaca marke A, pakiranog po 250 grama, tržišni inspektor
K
grama.
je utvrdio prosječnu težinu paketića maslaca 2478,5 grama s prosječnim odstupanjem od 10

Može li se uz nivo signifikantnosti 3% prihvatiti kao moguća tvrdnja ptoizvođača da je prosječna


težina paketića maslaca jednaka deklariranoj?.
Frakcija izbora je manja od 0,05.
n  1 * x    99 * 248,5  250
  3%...............................H 0 :   250.......z    1,492
S 10
x  248,5
S  10...............................................................tablicnoOcitavanje  2,17...........H 0
n  100
  250grama
S
x   1,005
n 1

Rafinirano sakupljeni primjeri sa instrukcija


۞ 96/118

Kumulativna funkcija vjerojatnosti

Funkcija gustoce vjerojatnosti

Rafinirano sakupljeni primjeri sa instrukcija


۞ 97/118

Kumulativna funkcija vjerojatnosti

Funkcija gustoce vjerojatnosti

Rafinirano sakupljeni primjeri sa instrukcija


۞ 98/118

Nelinearna regresija
<<Statistics`LinearRegression`
data = {{0.055, 90}, {0.091, 97}, {0.138, 107},
{0.167, 124}, {0.182, 142}, {0.211, 150},
{0.232, 172}, {0.248, 189}, {0.284, 209},
{0.351, 253}};
(regress = Regress[data, {1, x^2}, x];
Chop[regress, 10^(-6)])

Estimate SE TStat PValue


ParameterTable 1 88.194 4.21167 20.9404 0 ,
x2 1430.68 73.6951 19.4136 0
RSquared 0.979215, AdjustedRSquared 0.976616, EstimatedVariance 64.9129,
DF SumOfSq MeanSq FRatio PValue
Model 1 24464.8 24464.8 376.887 0
ANOVATable
Error 8 519.303 64.9129
Total 9 24984.1

dplot=ListPlot[data]
250

225

200

175

150

125

100
0.05 0.15 0.2 0.25 0.3 0.35
Graphics

Komparirajte ovaj primjer sa prethodnim zadatkom na stranici 93-94.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 99/118

Neki grafički prikazi standardne normalne distribucije

Sredina = 4 ; Varijanca = 2. Sredina = 4 ; Varijanca = 0,6

5
Sredina= 5 Varijanca 0.0625
4
f(x)

0-1
0
1 4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4
Funkcija gustoce vjerojatnosti normalne distribucije

Rafinirano sakupljeni primjeri sa instrukcija


۞ 100/118

Primjer:
lijent raspolaže investicijskim portfeljom čija sredina iznosi 500 kuna, a standardna
K devijacija 15 kuna. On je zatražio da se utvrdi vjerojatnost da vrijednost portfelja bude
između 485 i 530 kuna.
485  500 530  500
z 485  15  1...........z 530   2
15
P485  X  530  P 1  Z  2  1  PZ  1  PZ  2  1  0,1587  0,0228  0,8185
Grafička ilustracija: Zbog simetriönosti   : 2  2 :   0,0228

-3 -2 -1 0 1 2 3
f(X)

0.8
P(-1< Z < +2 ) = 1- 0,1587 - 0,0228 = 0,8185
Normalna distribucija

0.6 P(-1>Z ) = 0,1587

P(Z>+2) = 0,0228
0.4

0.2

0
Portfelj 485 kuna 530kuna Z

Rafinirano sakupljeni primjeri sa instrukcija


۞ 101/118

Dijagram toka za izbor odgovarajućug testa za testiranje hipoteze o proporcijskim


udjelima u populacijama

Postavite hipotezu:
I II III
H 0 : p 1  p 2  0.....H 0 : p 1  p 2  0.....H 0 : p 1  p 2  0
H 1 : p 1  p 2  0....H 1 : p 1  p 2  0......H 1 : p 1  p 2  0

Zadajte 

Izračunajte:
p̂  p̂1  p̂ 2
I III
. p1 * (1  p1 ) p 2 * (1  p 2 )
 p̂  
n1 n2

TIP
HIPOTEZE

II
Izračunajte kritične vrijednosti: Izračunajte kritičnu vrijednost: Izračunajte kritičnu vrijednost:
P̂U   z  / 2 *  P̂ P̂Crit   z  *  P̂
P̂Crit   z  *  P̂
P̂L   z  / 2 *  P̂

Pravilo odlučivanja: Pravilo odlučivanja: Pravilo odlučivanja:


P̂  P̂U
P̂  P̂Crit P̂  P̂Crit
P̂  P̂L Rafinirano sakupljeni primjeri sa instrukcija
Odbaciti H0 : Prihvatiti H1 Odbaciti H0 : Prihvatiti H1
Odbaciti H0 : Prihvatiti H1
۞ 102/118

Ispravke :(Ako ima grešaka, ispravite, Statistika nas podučava da se ništa ne može uraditi bez greške)
Str. Primjedba Napomena

Rafinirano sakupljeni primjeri sa instrukcija


۞ 103/118

Tablica 1: Standardizirana Normalna Distribucija – test na desnu granicu


z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998

Rafinirano sakupljeni primjeri sa instrukcija


۞ 104/118

3,5 0,4998
4,0 0,5000
4,5 0,5000
5,0 0,5000

Tablica 2: Studentova (t) Distribucija – test na obje granice


d.f 0,2 0,1 0,05 0,02 0,01 Dvostrano
0,1 0,05 0,025 0,01 0,005 Jednostrano
1 3,078 6,314 12,706 31,821 63,657
2 1,886 2,920 4,303 6,965 9,925
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355
9 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,169
11 1,363 1,796 2,201 2,718 3,106
12 1,356 1,782 2,179 2,681 3,055
13 1,350 1,771 2,160 2,650 3,012
14 1,345 1,761 2,145 2,624 2,977
15 1,341 1,753 2,131 2,602 2,947
16 1,337 1,746 2,120 2,583 2,921
17 1,333 1,740 2,110 2,567 2,898
18 1,330 1,734 2,101 2,552 2,878
19 1,328 1,729 2,093 2,539 2,861
20 1,325 1,725 2,086 2,528 2,845
21 1,323 1,721 2,080 2,518 2,831
22 1,321 1,717 2,074 2,508 2,819
23 1,319 1,714 2,069 2,500 2,807
24 1,318 1,711 2,064 2,492 2,797
25 1,316 1,708 2,060 2,485 2,787
26 1,315 1,706 2,056 2,479 2,779
27 1,314 1,703 2,052 2,473 2,771
28 1,313 1,701 2,048 2,467 2,763
29 1,311 1,699 2,045 2,462 2,756
30 1,310 1,697 2,042 2,457 2,750
32 1,309 1,694 2,037 2,449 2,738
34 1,307 1,691 2,032 2,441 2,728
36 1,306 1,688 2,028 2,434 2,719

Rafinirano sakupljeni primjeri sa instrukcija


۞ 105/118

38 1,304 1,686 2,024 2,429 2,712


40 1,303 1,684 2,021 2,423 2,704
50 1,299 1,676 2,009 2,403 2,678
60 1,296 1,671 2,000 2,390 2,660
120 1,289 1,658 1,980 2,358 2,617
1000000000 1,282 1,645 1,960 2,326 2,576

Chi 2 Distribucija
Kritične vrijednosti - Desnostrani test
razina signifikantnosti
d.f. 0,10 0,05 0,025 0,02 0,01 0,005
1 2,7055 3,8415 5,0239 5,4119 6,6349 7,8794
2 4,6052 5,9915 7,3778 7,8240 9,2103 10,5966
3 6,2514 7,8147 9,3484 9,8374 11,3449 12,8382
4 7,7794 9,4877 11,1433 11,6678 13,2767 14,8603
5 9,2364 11,0705 12,8325 13,3882 15,0863 16,7496
6 10,6446 12,5916 14,4494 15,0332 16,8119 18,5476
7 12,0170 14,0671 16,0128 16,6224 18,4753 20,2777
8 13,3616 15,5073 17,5345 18,1682 20,0902 21,9550
9 14,6837 16,9190 19,0228 19,6790 21,6660 23,5894
10 15,9872 18,3070 20,4832 21,1608 23,2093 25,1882
11 17,2750 19,6751 21,9200 22,6179 24,7250 26,7568
12 18,5493 21,0261 23,3367 24,0540 26,2170 28,2995
13 19,8119 22,3620 24,7356 25,4715 27,6882 29,8195
14 21,0641 23,6848 26,1189 26,8728 29,1412 31,3193
15 22,3071 24,9958 27,4884 28,2595 30,5779 32,8013
16 23,5418 26,2962 28,8454 29,6332 31,9999 34,2672
17 24,7690 27,5871 30,1910 30,9950 33,4087 35,7185
18 25,9894 28,8693 31,5264 32,3462 34,8053 37,1565
19 27,2036 30,1435 32,8523 33,6874 36,1909 38,5823
20 28,4120 31,4104 34,1696 35,0196 37,5662 39,9968
21 29,6151 32,6706 35,4789 36,3434 38,9322 41,4011
22 30,8133 33,9244 36,7807 37,6595 40,2894 42,7957
23 32,0069 35,1725 38,0756 38,9683 41,6384 44,1813
24 33,1962 36,4150 39,3641 40,2704 42,9798 45,5585
25 34,3816 37,6525 40,6465 41,5661 44,3141 46,9279
26 35,5632 38,8851 41,9232 42,8558 45,6417 48,2899
27 36,7412 40,1133 43,1945 44,1400 46,9629 49,6449
28 37,9159 41,3371 44,4608 45,4188 48,2782 50,9934
29 39,0875 42,5570 45,7223 46,6927 49,5879 52,3356
30 40,2560 43,7730 46,9792 47,9618 50,8922 53,6720

Rafinirano sakupljeni primjeri sa instrukcija


۞ 106/118

Rafinirano sakupljeni primjeri sa instrukcija


۞ 107/118

Alfa = 0,05
BROJ SUPNJEVA SLOBODE U BROJNIKU v1
s.s. 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 1000000
1 161,45 199,5 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 243,91 245,95 248,01 249,05 250,10 251,14 252,20 253,25 254,31
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
1000000 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00

Rafinirano sakupljeni primjeri sa instrukcija


۞ 108/118

Formula11.11

2
 S 2   S 2y  
   x     
 n x   n y  
  x  y

  S 2  2  
  x   
  n x   
 x   
  ( n x
 1 ) 
  
 
  S 2  2  
  y   
  n y   
 y   
  ( n  1) 
 
y


 

x U  z  / 2  x (II)x Crit   z   x (I) x U   t  / 2Sx (II) x Crit   t Sx 
x L  z  / 2  x (III)x Crit   z   x (I) x L   t  / 2Sx (III) x Crit   t Sx


Ako je: Ako je: Ako je:
x  x U (II)x  x Crit
Ako je : (II) x  x Crit Dijagram za izbor
x   x U odgovarajućeg testa za
x  x L (III)x  x Crit (III) x  x Crit testiranje hipoteze o
x   x L sredinama populacija
Odbaciti H0 Odbaciti H0 Odbaciti H0 Odbaciti H0

Rafinirano sakupljeni primjeri sa instrukcija


۞ 109/118

Napomena: Da bi jasnije pročitali zelenu tablicu , postavite pokazivač miša na poziciju 1 i kada bijela strelica
pokazuje kut u prvom kvadrantu (Šiljati) kliknite lijevi taster miša. Dobit će te donju sliku.Kad god napuštate
dokument iziđite bez snimanja promijena.

Rafinirano sakupljeni primjeri sa instrukcija


۞ 110/118

Equations for Analysis of Variance Table Simple


Linear Regression Komentirajte sami ANOVA-I u tri programa:

 0.711 0.58 
 
 0.701 0.63 
 0.706 0.603 
 0.67 0.615 
 
 0.898 0.855 
 0.821 0.810 
 0.872 0.799

   0
FLEX   0.874 0.834  x  FLEX
 0.848 0.791 
 
 0.853 0.81  n  rows  x
 0.67 0.615 
 0.905 0.916   1
  y  FLEX
 0.887 0.87 
 0.742 0.73 
 0.79 
 0.696 

yhat( x y)  intercept( x y)  slope( x y)  x

last ( x)
 yi  yhatx  yi
2
SSE 
i 0

last ( x)
 yhatx  yi  meany
2
SSR 
i 0

last ( x)
 yi  meany
2
SST 
i 0

Rafinirano sakupljeni primjeri sa instrukcija


۞ 111/118

SSE
DF_RESID  n  2 MSE 
DF_RESID

SSR
DF_REG  1 MSR 
DF_REG

DF_TOTAL  DF_RESID  DF_REG

MSR
F  n1  DF_REG n2  DF_RESID
MSE

p  1  pF( F  n1 n2)

R_square  corr x  y
2

DF SS MS F

DF_REG  1 SSR  0.16 MSR  0.16 F  138.142


3
DF_RESID  13 SSE  0.015 MSE  1.16  10 p-value
8
DF_TOTAL  14 SST  0.175 p  2.68  10

Coefficient of Determination: R_square  0.914

A B
0,711 0,58
0,701 0,63 ANOVA
Significance
0,706 0,603
df SS MS F F
0,67 0,615
Regression 1 0,16029483 0,160294833 138,1415279 2,6798E-08
0,898 0,855
Residual 13 0,01508477 0,001160367
0,821 0,81
Total 14 0,1753796
0,872 0,799
0,874 0,834
0,848 0,791
0,853 0,81
0,67 0,615
0,905 0,916
0,887 0,87
0,742 0,73
0,79 0,696

Rafinirano sakupljeni primjeri sa instrukcija


۞ 112/118

SUMMARY OUTPUT Excel Alpha = 0,05

Regression Statistics
Multiple R 0,956027145
R Square 0,913987901
Adjusted R
Square 0,907371586
Standard Error 0,034064156
Observations 15

ANOVA
df SS MS F Significance F
Regression 1 0,160294833 0,160294833 138,1415279 2,6798E-08
Residual 13 0,015084767 0,001160367
Total 14 0,1753796

Coefficients Standard Error t Stat P-value Lower 95%


-
Intercept 0,226561034 0,083010542 -2,729304349 0,017204628 -0,405894408
A 1,217979203 0,10362815 11,75336241 2,6798E-08 0,994104196

Napomena : Ispred Coefficients Intercept stoji predznak MINUS

<<Statistics`LinearRegression`
data = {{0.711, 0.58}, {0.701, 0.63}, {0.706, 0.603},
{0.67, 0.615}, {0.898, 0.855}, {0.821, 0.810},
{0.872, 0.799}, {0.874, 0.834}, {0.848, 0.791},
{0.853, 0.81}, {0.67, 0.615}, {0.905, 0.916}, {0.887, 0.87},
{0.742, 0.73},{0.79, 0.696}};
(regress = Regress[data, {1, x^1}, x];
Chop[regress, 10^(-6)])

Estimate SE TStat PValue


ParameterTable 1 0.226561 0.0830105 2.7293 0.0172046 ,
x 1.21798 0.103628 11.7534 0
RSquared 0.913988 , AdjustedRSquared 0.907372 ,
EstimatedVariance 0.00116037 , ANOVATable
DF SumOfSq MeanSq FRatio PValue
Model 1 0.160295 0.160295 138.142 0
Error 13 0.0150848 0.00116037
Total 14 0.17538

Rafinirano sakupljeni primjeri sa instrukcija


۞ 113/118

Grafički prikaz podataka ulazne matrice FLEX.


Bijele linije – linije opažanja
Crvene linije – linearna regresijska jednadžba
U dvije točke grafa A= ( 0.742 , 0.730 ) i B = (0.790 , 0.696), snažnim alatima Auto-CAD-a

provjerena su rezidualna odstupanja  i


( 0.735642536 – 0.696 = 0.039642536 )
( 0.677179534 – 0.730 = 0.052820465)

Rafinirano sakupljeni primjeri sa instrukcija


۞ 114/118

Residual Plot

0,06
Točka A (0,742 = 0,052820466 )

0,04

0,02
Residuals

0
0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95

-0,02

-0,04
Točka B (0,790 = - 0,039642536 )

-0,06

-0,08
Opažene frekvencije

Rafinirano sakupljeni primjeri sa instrukcija


۞ 115/118

Rafinirano sakupljeni primjeri sa instrukcija


۞ 116/118

Sadržaj i predgovor

Autor ove Scripte je dugi niz godina ( više decenija ) dajući instrukcije iz STATISTIKE
srednješkolcima i studentima iz sačuvanog materijala složio istu. Obrađena je ANOVA i
REGRESIJA dok se ARIMA može koristiti samo primjenom računara.
Na pocetku Scripte daje se Uvod u bitne formule koje se obimno mogu pronaći:

1. Ivan Šošić , Pregled formula iz statistike, Školska knjiga , Zagreb 2009.

Prve korake učenja počeo sam od naših uvaženih Profesora:

2. Vladimir Serdar , Udžbenik STATISTIKE ,Školska knjiga ,Zagreb 1966.


3. Vladimir Vranić , Vjerojatnost i Statistika , Tehnička Knjiga Zagreb , 1971.

Prvu kompjuterizaciju ( do koje sam došao) uradio je :

4. Momčilo C. Kostić , Metodi statističke analize , Naučna knjiga Beograd , 1990.

Odajući priznanje brojnim domaćim i stranim autorima knjiga iz STATISTIKE , citirat ću :

5.Ulrich Kockelkorn , Statistik für Anwender, Springer-Verlag Berlin Heidelberg 2012.

Svi moji studenti uspješno su polagali ovaj predmet.

Zahvala

Na pomoći u realizaciji ove Scripte zahvaljujem se:

Gospodinu Miloradu Rabljenoviću, inž. Građevine Zagreb ( dostupnost na Internetu )


Mr Zoranu Rabljenoviću dipl. inž. Zagreb (dostupnost na Internetu )
Vladi Dunoviću dipl inž. , Dresden , Njemačka (intenzivno prikupljanje literature )
Vasi Begoviću dipl. inž. , USA (poklonom računala )
Logistici: Miroslavu Mrkšiću dipl inž. , Čikago , USA
Prof. Radomiru Ćurčija , Beograd, Srbija

Rafinirano sakupljeni primjeri sa instrukcija


۞ 117/118

Rafinirano sakupljeni primjeri sa instrukcija


۞ 118/118

Detaljno(kompjuterski) i manuelno kontrolirani su zadaci , čime učenje postaje olakšano.


Zadaci su potkrijepnjeni grafičkom pozadinom u različitim programima.
Grafičke Outpute ostavio sam i Vama za program Mini-TAB.
O prikupljanju uzoraka i odredjivanju razreda (Strugesovo pravilo ) nisam ulazio,
kao ni i u deskriptivnu statistiku ni vrste razdioba.
Pojam Cluster analize nisam obradio jer je to viši nivo uglavnom za magisterij.
U svome istraživanju ove metode prvi put sam primjenio 1975 godine na računaru UNIVAC IBM .

U Volinji 2019 godine

Rafinirano sakupljeni primjeri sa instrukcija

Você também pode gostar