AKU pt2-3 2jaanuar

Arvuti kasutamine uurimists (AKU)
Informaatika valikaine pik gmnaasiumile
1. Infootsing
1.1. Uurimist olemus
2. Andmete kogumine ja analsiks ettevalmistamine

D EESMRGI
Kesolevas peatkis leiame vastused ksimustele:
Kuidas andmeid koguda, et uurimist tulemused oleksid usaldusvrsed?
2.1. Andmete kogumise erinevad viisid
Nide: Malle soovib oma uurimists rkida oma kla inimeste mlestustest, mis seonduvad
julukommetega nende lapseplvekodus. Jukul on plaanis lhemalt uurida ilmastiku muutumist
kodukandis. Kalle tahaks teada saada, kuidas on inimesed harjunud euro kasutamisega. Sassi aga
huvitab, milliseid veebilehti tema eakaaslased kige enam klastavad ja milliseid nad kige petlikemaks
peavad.
Et oma ksimustele vastused saada, on neil kigil on vaja koguda andmeid. Aga mil viisil on mistlik ja
vimalik andmeid koguda, et uurimist tulemused oleksid usaldusvrsed?
Andmete saamiseks vib lbi viia otseseid mtmisi vi kasutada andureid (mta vib nt temperatuuri,
inimese pikkust, jooksu aega, vms), kasutada olemasolevaid allikaid (arhiivimaterjalid, inimeste
veebipostitused vi blogid, meediatekstid, fotod ja pildid, logid, vms), korraldada vaatlusi, ksitlusi vi
testimist. Seega, lhtuvalt sellest, mida me uurida tahame, vib andmetena kasutada vga erinevaid
allikaid, kuid silmas tuleb pidada, et ei mindaks vastuollu eetikaga ning et uurimist lbiviija tunneks
hsti vastavat tpi andmete analsimiseks sobivaid meetodeid.
Andmete edasise ttlemise ja analsimise seisukohast ei ole tihti mrav kas, andmed on kogutud
kirjalikult, suuliselt vi visuaalse vaatluse teel vaid hoopis see, kuivrd uurija mrab kindlaks vi jtab
avatuks selle, millisel kujul peavad kogutavad andmed olema (konkreetsed arvud, valikud etteantud
variantide hulgast, vaba tekst, jms). Uurimismeetodite kontekstis rgitakse siinkohal tihti
kvantitatiivsetest ja kvalitatiivsetest meetoditest. Kuna need mrksnad on uurimistde lbiviimise juures
vga laia thendusvljaga, viks andmete kogumisest rkides eelistada snapaarile kvantitatiivne
kvalitatiivne sisult konkreetsemaid mrksnu: struktureeritud ja struktureerimata andmekogumise viisid ja
andmed.
STRUKTUREERITUD andmekogumise meetodi STRUKTUREERIMATA andmekogumise tpilise

tpilise nitena vib ette kujutada ht tavaprast nitena vib ette kujutada avatud intervjuud, mis
ankeeti, kus vastajale on ette antud nii ksimused sarnaneb vabale vestlusele, kus intervjueerija ei
kui ka vimalikud vastuste variandid, mille hulgast esita konkreetseid lhivastust eeldavaid ksimusi,
ta vastavalt juhendile sobiva(d) vlja peab valima. vaid suunab intervjueeritavat teatud teemadest
rkima, esitab kuuldu phjal tpsustavaid ksimusi
ning julgustab teda oma mtteid phjalikult lahti
seletama ja phjendama.
Loomulikult vib ette kujutada ka vahepealset varianti, kus vastajale esitatakse kas kirjalikult vi suuliselt
vastamiseks avatud st ilma vastusevariantideta, kuid kllalt konkreetseid ksimusi, millele eeldatakse
vastaja oma tlgendusest lhtuvat, kuid siiski suhteliselt lhidat vastust. Sellisel juhul viks rkida
poolstruktureeritud andmekogumise meetodist.
Tavaprased andmekogumismeetodid:
otsene loendamine ja mtmine
dokumenteerimine / koondandmete talletamine
***
struktureerimata e avatud, poolstruktureeritud ja struktureeritud intervjuud (suulised ksitlused)
struktureeritud ja poolstruktureeritud ankeedid (kirjalikud ksimustikud)
(standardiseeritud) vimekus ja sooritustestid
pshholoogilisi ja sotsiaalseid nhtusi (nt hoiakud, vrtused, hinnangud, jms) mtvad testid
***
struktureerimata andmete kodeerimine kontentanals
lesanne. Meenuta koos kaaslastega, mil viisil olete ise andmeid kogunud (vi ninud kogutavat) ja
tida jrgmine tabel rhmatna.
Andmekogumise viisid: Mis eesmrgil oled Milliste uurimisteemadega

kasutanud? vi ppeainetega eelkige
seondub?
Andmete lugemine anduritelt
Olemasolevate allikate kasutamine
Vaatlus
Ksitlus
Testimine
2.2. Ksimustiku koostamise ABC

Nide. Liise soovib uurida, millised on tema klassikaaslaste plaanid peale keskhariduse omandamist. Ta
alustas teemade kaardistamisest, mille kohta ta tahaks rohkem teada saada:
Millised on klassikaaslaste keskhariduse omandamise jrgsed plaanid edasippimiseks vi
ttamiseks?
Missugune on edasippimise puhul esimene eelistus? Kuhu/kellena soovivad kaaspilased tle
minna?
Mis on tehtavate valikute phjused?
Liise otsustas, et parim viis nende teemade kohta andmete kogumiseks on ksitluse lbiviimine. Seega,
peab ta nd oma laiematest ksimustest vormistama ankeedi ksimused. Liise oli pisut kimbatuses, sest
ta polnud varem ankeeti koostanud ja ei teadnud, mida ta peab selle koostamise juures silmas pidama?
Tihti meldakse, et kuna oleme ise vastanud paljudele ksimustikele ning erinevate ksimuste esitamine
on kigile inimestele igapevane tegevus, siis on ksimustiku koostamine vga lihtne tegevus.
Uurimistde lbiviimise juures tuleb aga tihti ette, et uurijale nii selgena nivad ksimused ei ole vastaja
jaoks hsti arusaadavad, mistttu jvad uurijal vastused saamata vi siis on saadud vastuste e andmete
kvaliteet vga madal. Silmas tuleb aga pidada, et andmete kvaliteet on kogu uuringu kvaliteedi aluseks
sellest ksi ei piisa heade ja usaldusvrsete tulemuste saamiseks, kuid kui andmete kvaliteet on kehv,
siis ei aita kski andmete analsimise meetod saada hid tulemusi! Seeprast ole ksimustiku
koostamise juures eriti hoolas, ksi petaja vi kellegi kogenuma abi ning pa jrgida alljrgnevalt
toodud juhiseid.
Hea ksimustik on: Hoiduda tuleks sellistest ksimustest nagu:

selge snastusega, suunavad ksimused;
kergesti ja heselt mistetavate ksimustega, teaduslikult tpse, kuid pika ja keeruka
kompaktne ja kiiresti vastatav,
snastusega ksimused;
vormistuselt korrektne; mitmeti mistetavad ksimused;
koostatud nii, et oleks minimiseeritud vastajate ja rritavad ksimused (sh ksimusega
andmete ttlejate poolt potentsiaalselt tehtavate mittesobivad vastusevariandid).
vigade hulk.
Ksimuste/mdikute kavandamisel mtle ja otsi infot jrgneva kohta:

kas saab uuritavat nhtust mta otse vi lbi indikaatori(te)?
kas antud nhtust on eelnevates uuringutes mdetud ning kas vastav kirjandus on usaldusvrne?
kas saab juba olemasolevaid mdikuid kohandada vi tuleb vlja ttada uued
mdikud/ksimused? (pra thelepanu: kultuurilised ja kontekstuaalsed erinevused; vrreldavus
eelnevate uuringute tulemustega, jne)
kas peaks kasutama kellegi kogenuma abi?
kas peaks kasutama piloteerimist ning jrelkontrolli?
Jtkates punkti alguses kirjeldatud nidet, koostame ankeedi jaoks sobilikud ksimused ning lisame
vajadusel ka vastusevariandid.
1. Kas oled melnud, mida teed peale keskhariduse omandamist?
a) mul on kindel plaan pinguid jtkata
b) ei soovi pinguid jtkata, lhen tle
c) olen sellele melnud, kuid ei oska hetkel elda, mida ma tahan edaspidi teha
2. Kui kavatsed pinguid jtkata, siis millises ppeasutuses (soovi korral kirjuta mitme
ppeasutuse nimed)?
3. Millisel erialal sooviksid pinguid jtkata (soovi korral kirjuta mitu eriala alustades kige
sobivamast)?
lesanne. Koostatud nidisksimustel 2. ja 3. pole vastusevariante vlja toodud. Kas sina toimiksid
samuti vi lisaksid nendele ksimustele vastusevariandid? Phjenda vastust.
lesanne. Jtka niteankeeti 3-5 ksimusega nii, et Liise poolt kaardistatud teemad oleksid kaetud.
lesanne. Arutlege grupis, miks kirjalikes (eriti posti teel korraldatud) ksitlustes pole tavaliselt soovitav
esitada avatud ksimusi?
lesanne. Arutle, mis on avatud ja struktureeritud ksimuste eelised ja puudused vi piirangud?
2.3. Veebiphise ksimustiku koostamine
Nide. Kuna Kirsti on usin arvutikasutaja ning teab, kuivrd palju lihtsamaks vib infotehnoloogia
kasutamine muuta t tegemise ja spradega suhtlemise, otsustas ta ka andmete kogumisel kasutada
interneti vimalusi ning koostas veebiphise ksimustiku kasutades selleks programmi Google Forms.
Valmis ksimustiku aadressi edastas Kirsti oma spradele e-maili teel, postitas foorumisse ning
Facebooki. Esimesel peval laekus 23 vastust, teisel 11 ning jrgmistel pevadel vastuseid enam ei
tulnud.
lesanne: Arutle, mis visid olla phjused, et Kirsti loodetud mitmesaja vastuse asemel sai ainult pisut
le kolmekmne vastuse?
Veebiphisel andmekogumisel on omad tugevused: aja ja raha kulu suure hulga vastajateni judmiseks
ja andmete kogumiseks on minimaalsed ning uuritavad saavad valida nendele sobiva aja vastamiseks.
Siiski juhtub praktikas tihti, et veebiphiselt saadetud ksitlusele ei saada soovitud hulgal vastuseid, sest
igapevases informatsioonitulvas jb saadetud ksitlus mrkamata vi seda lihtsalt ignoreeritakse kuna
vastamise palve saanutel puudub huvi teema vastu ja seetttu ka motivatsioon oma aega panustada.
Vastajate motivatsiooni vib vhendada ka see, kui prdumine ja ksitlus on lohakalt, oskamatult vi
vigaselt vormistatud, sisaldades kirjavigu, ebakorrektset keelekasutust, ebasobivat vi vastamist segavat
kujundust, vms. Arvestada tuleb ka sellega, et kik sihtgrupid ei pruugi olla aktiivsed ja vilunud
arvutikasutajad, mistttu sellisel teel saadetud ksitlus ei jua nendeni vi jb vastamine toppama
vheste arvutikasutusoskuste tttu.
Suurema osaluse tagamiseks peaks vastajate poole prdumine olema motiveeriv ning vajadusel
informeeritakse vastajaid eelnevalt uuringu toimumisest niteks telefoni teel.
Veebiphiseid ksitluste koostamise ja lbiviimise programme on mitmeid. Alljrgnevas on vrdlevalt
kirjeldatud mnda neist. Pane thele, et osad programmid on sna piiratud vimalustega, kuid algajale
kasutajale lihtsamad, teised jlle on vga professionaalset lhenemist lubavad, aga seelbi ka
keerulisemad kasutada. Valida tuleb see, mis vastab parimal viisil sinu eesmrkidele ja oskustele.
petused lihtsamate programmide Google Formi ja Zoho kasutamiseks leiad www.tlu.ee/~kairio/akufailid
Google Form on lihtne veebiphine ksitluste koostamise

vahend, sisaldades 7 philist ksimuse tpi: lhike tekst,
pikem tekstiala, valikvastusega ksimus (nii he kui ka mitme
vastusevariandi valimise vimalused), hinnanguskaala ning
https://www.google.com/accounts
tabeli tpi ksimus. Ksitluse tausta kujundamiseks
pakutakse le 90 erineva nidisphja.
Valmis ksitluse saab saata programmist otse e-mailile, lisada
veebilehele vi kopeerida ksitluse aadress foorumisse vms.
Ksitluse tulemused salvestatakse andmetabelina ning neid
on vimalik alla laadida .xls failivormingus. Tulemuste
graafilist kokkuvtet on vimalik vaadata Google Docs
keskkonnas.
Connect.ee on eestikeelne ksitluste koostamise vahend, mis
sisaldab 10 erinevat ksimuse tpi ning pakub kasutamiseks
erinevaid uuringumalle.
http://www.connect.ee/ Eeldab kasutajaks registreerumist Connect.ee keskkonnas.
Tasuta vahend sisaldab 3 kuulist kasutusaega, kuni 3
ksitlust (igas maksimaalselt 10 ksimust) ning kuni 50
vastaja tulemusi he ksitluse kohta.
Ksitluse aadressi saab saata e-posti teel vi kopeerida
otselingina.
Tulemused on koondatud graafikutesse ning neid on vimalik
alla laadida exceli formaadis edasiseks ttlemiseks.
Zoho Creator on veebiphiste ksitluste koostamise vahend,
mis sisaldab mitut erinevat (tasulist) versiooni (tasuta 15
pevane proovimise vimalus).
http://www.zoho.com/creator/
eFormular on lihtne eesti keelne vahend, mis sisaldab
phjalikku abiinfossteemi. Formularide koostamine ja
ksitluste lbiviimine on tasuta, tasuliseks muutub vastuste
http://www.eformular.com/
(alates 10. vastajast) vaatamine ja allalaadimine vastavalt
hinnakirjale (11...100 vastajat - 7.00 ). Eraldi hinnad kehtivad
ldhariduskoolidele ning kutsehariduskeskustele.
Lime Survey on vabavaraline ksitluse loomise tarkvara, mille
kasutamine eeldab tarkvara installeerimist arvutisse.
Vimaldab koostada viite eritpi (kuni 28 alatpi) ksimusi.
http://www.limesurvey.org/
lesanne. Too niteid teemadest ja sihtrhmadest, mille/kelle uurimisel sobiks kasutada veebiphiseid
andmekogumisvahendeid ja mille/kelle puhul mitte.
lesanne. Koosta vastajaid motiveeriv prdumine (kaaskiri) palumaks neil osaleda pt.2.2. nites
ksitletud uuringus (teemaks tegurid, mis mjutavad klassikaaslaste valikuid peale keskhariduse
omandamist).
2.4. Pisut teooriat, mida hea teada ja arvestada juba enne andmete
kogumist
Nide: Ats oli kokku kogunud suure hulga andmeid ja neid juba ka analsinud, kuid kui ta oma tulemusi
petajale nitas, tles viimane, et analsiks valitud meetodid ei ole andmetele kohased ja uuris, miks
Ats oli valinud just sellised ksimused ja valikvastused, kui ta oma ksimustikku koostas?
Ats ei osanud midagi kosta ja ksis, kas ta siis ei saagi kogutud andmeid analsida? petaja rahustas
Atsi, et mingi analsi saab ka tema kogutud andmete phjal lbi viia, kuid samas mainis, et jrgmine
kord tasub analsi vimaluste peale melda juba enne andmete kogumist ja selleks on vaja teada pisut
teooriat!
Niisiis, enne kui (jrgmine kord) otsustad, mil viisil ja milliste konkreetsete vahendite vi meetoditega oma
uurimists andmeid koguma hakata, pime selgeks neli andmeanalsi juures mdapsmatut
mrksna: objekt, tunnus, vrtus ja skaala ning rgime pisut erinevatest struktureeritud andmete
tpidest. hest kljest aitab nende mistete teadmine paremini vastavatest teemadest rkida ja aru
saada, teisest kljest aitavad laiemad teadmised andmete olemusest kaasa parema ja usaldusvrsema
analsitulemuse saamisele.
Tuletame meelde, et vastavalt sellele, mida me uurida tahame, kogume me andmeid kas inimeste,
koolide, valgete hiirte, kalendrikuude, kartulipldude vms kohta. Kiki selliseid indiviide vi ksusi,
kelle/mille kest vi kohta on me andmeid kogume, nimetatakse statistilises andmeanalsis
OBJEKTIDEKS. Andmeid koguma asudes oleme valmis melnud mingid neid objekte iseloomustavad
omadused, mis meid huvitavad, niteks: vrvus, vanus, hind, kaal, arvamus millegi suhtes, jne selliseid
omadusi nimetatakse muutujateks. Omadusi, mida saab mta nii (vi mis on juba kokku vetud nii), et
iga objekti jaoks saadakse ainult ks vastus ehk ks hik infot nimetatakse TUNNUSTEKS. Objektid ja
tunnused peavad olema valitud enne andmete kogumist ning andmete kogumise kigus pame saada
tulemuse vi vastuse iga objekti kohta kigi meid huvitavate tunnuste likes - statistika terminoloogiast
lhtudes on need VRTUSED. Nii vivad tunnuse haridus vimalikud vrtused olla niteks
algharidus, phiharidus, keskharidus ja krgharidus, aga tunnuse vanus vrtused niteks arvud
12, 27, 6, jne.
Neme, et andmed ehk vrtused vivad olla nii arvud kui snad. Kik tunnused vimalikud vrtused
kokku moodustavad SKAALA. Niteks inimese pikkust mtes vtame kasutusele harjumusprase
arvskaala, mida neme mdulindil, ksimustikku koostades peame aga tihti ksimustele
vastusevariandid vlja mtlema ehk vastavate tunnuste jaoks skaala ise konstrueerima. Vimalikest
vrtustest e skaalast, sltub, mis tpi tunnusega on tegu ja sellest omakorda, milliseid analsi
meetodeid vastava tunnuse analsimiseks saab kasutada. igeks analsimeetodi valikuks tuleb osata
teha vahet vhemalt kolmel tunnuste phitbil: NIMITUNNUSED, JRJESTUSTUNNUSED ja
INTERVALLTUNNUSED. Praktilise andmeanalsi seisukohast on intervalltunnusel olulised alamtbid,
mistttu saame alljrgneva jaotuse, kus tpe eristavateks vtmeksimusteks on see,
- kas vastuseid e vrtusi saab heselt jrjestada vi mitte?,
- kas vastustest/vrtustest moodustatud skaalal tekkivad vahemikud on vrdsed vi mitte? ning
- kas vimalikke erinevaid vastuseid e vrtusi on vhe vi palju?
Nimitunnused (nt rahvus: eestlane, venelane, soomlane, ...)
NB! Nimitunnusel ei ole vrtused heselt jrjestatavad, jrjestustunnusel on!
Jrjestustunnused (nt haridustase: algharidus, phiharidus, keskharidus, ...)
NB! Jrjestustunnusel ei ole vrtuste vahemikud vrdsed, intervalltunnusel on!
Intervalltunnused (s.h arvtunnused) (nt vanus: 27 a, 32 a, 51 a, ...)
Intervalltunnused vheste erinevate vrtustega

(nt 4-palli rahuloluskaala: rahul, pigem rahul, pigem mitte rahul, mitte rahul)
Intervalltunnused paljude erinevate vrtustega (nt palk: 926 eur, 1003 eur, 1442 eur, ...)
lesanne: Vaadake alltoodud ksimusi ja kujutledes, et selliseid andmeid saaksite koguda nt saja kooli
kohta, otsustage, mis tpi tunnuse moodustavad iga ksimuse phjal saadavad andmed?
Mis tpi kooliga on tegu? (algkool, 9-klassiline kool, 12-klassiline kool)

Kui kaugel on kool kesklinnast?
Milline on kooli maine? (vga hea, hea, rahuldav, halb, vga halb)
Millised huviringid koolis tegutsevad? (laulukoor, korvpalli trenn, kunstiring, jne)
Mitu paralleelklassi avatakse?
Kui suured on selles koolis klassid? (vikesed, keskmised, suured)
Mis on petajate keskmine vanus selles koolis?
2.5.* Uuritavate valimine andmete kogumiseks - valim ja ldkogum
Nide: Malle soovib oma uurimists rkida oma kla inimeste mlestustest, mis seonduvad
julukommetega nende lapseplvekodus. Kalle tahaks vrrelda huvitegevuse vimalusi maa ja
linnakoolides. Sassi aga huvitab, milliseid veebilehti tema eakaaslased kige enam klastavad ja milliseid
nad kige petlikemaks peavad.
Et oma ksimustele vastused saada, on neil kigil vaja koguda andmeid. Aga kuidas otsustada, kellelt
andmeid koguda?
Kui me hoolikalt loeme nites toodud uurimist eesmrkide snastusi, siis neme, et need mravad
kll ra sihtrhma, kellelt vi mille kohta andmeid koguda, kuid ei piiritle seda vga tpselt. Niteks Malle
puhul on selleks oma kla inimesed, Kalle puhul maa ja linna koolid ning Sassi puhul tema
eakaaslased.
lesanne: Arutle, kas Malle, Kalle ja Sass suudaksid koguda andmeid kigi sihtrhma liikmete e
objektide kest/kohta?
On selge, et tegelikus elus ei ole tihti vimalik vaadelda, mta, loendada vi ksitleda kiki objekte, keda
meie esialgsed uurimiseesmrgid sihtrhmana kirjeldavad. Olukorra lahendamise ks vimalus on
piiritleda sihtrhm kitsamalt arvestades sellega, kelle kest vi milliste objektide kohta me tegelikult
suudame andmeid koguda ning teha oma jreldused ka ainult selle grupi kohta, mille kohta on meil
andmed olemas. Algajatel uurijatel, kelle on veel vhe oskusi ning napib ka ajalist ning rahalist ressurssi
uurimist lbiviimiseks, on tihti mistlik just selline tagasihoidlik strateegia valida.
Tsisemate uuringute eesmrgiks on aga tihti ka ldistuste tegemine st mingi laiema objektide hulga
kirjeldamine, mille kiki objekte ei ole uuringu kigus reaalselt vimalik (ega ka mttekas) vaadelda.
Niteks pshholoog, kes uurib valgete hiirte ppimisvimet, loodab, et saavutatud tulemused ning seega
ka jreldused kehtivad kigi valgete hiirte puhul - mitte ainult praegu olemasolevate, vaid ka veel
sndimata hiirte puhul ning ta vib isegi loota, et tema tulemusi vib sedavrd ldistada, et need selgitaks
inimese ppimist.
ldistavate jrelduste aluseks vib olla teoreetiline teadmine objektide sarnasuses kohta, uuritud
objektide tpilisus vi statistiline tenosus. Viimasel juhul rgitakse andmete kogumisel valimist, mille
phjal saab teha jreldusi ldkogumi kohta.
LDKOGUMI (ehk populatsiooni) all meldakse kiki juhtumeid vi situatsioone, mille kohta uurijad
soovivad, et nende poolt saadud jreldused vi prognoosid kehtiksid.
Niteks vivad erinevate valdkondade esindajad tahta uurida (kigi) Tallinna koolilaste pimotivatsiooni;
ra arvata erinevatel eksamitel lbipsevate pilaste (ld)arvu; ennustada viljasaaki (kigil) uue
vetisega vetatavatel pldudel; jne. ldkogumist uurimiseks valitud (suhteliselt vikest) objektide gruppi
nimetatakse VALIMIKS.
lesanne. Too nide olukorrast, kus kogu ldkogumi uurimine ei ole praktiliselt vimalik.
lesanne. Too nide ldkogumist, mille kiki objekte oleks vimalik uurida, kuid see oleks vga
ressursikulukas.
Juhusliku valimi koostamine

Nide. Juss sai lesandeks uurida kiki oma kooli pilasi. Uuringu teemaks oli rahulolu kooli toiduga.
Kuna Juss ja tema sbrad olid koolitoiduga vga rahul, ei pidanud ta vajalikuks ksitleda kedagi peale
oma sprade. Kikide kooli pilaste ksitlemine oleks niikuinii liiga kaua aega vtnud.
lesanne. Vasta jrgmistele ksimustele:

a) Kes moodustasid antud nites ldkogumi?
b) Kas Jussi arvamus, et ta kiki kooli pilasi ksitleda ei jua, oli phjendatud?
c) Kas Jussi sprade arvamus annab levaate sellest, mida arvavad kik tema kooli pilased. Phjenda
vastust.
Selleks, et valimi phjal ldkogumi kohta statistiliste meetodite abil ldistatud jreldusi teha, tuleb
valimi liikmed valida JUHUSLIKULT. Juhuslikult ei ole antud kontekstis sugugi mitte snonm
suvalisele; juhuslikkus statistikas thendab, et igal ldkogumi liikmel peab olema vrdne vimalus
valimisse valitud saada.
Selleks, et tagada valimi esindamisvime on mitmeid vimalusi.

JUHUVALIM Kui meil on kasutada ldkogumi liikmete nimekiri:
kigepealt tuleb ksikud liikmed nummerdada
mrata valimi maht e. valimisse valitavate objektide arv
juhuslike arvude tabeli vi arvuti juhuslike arvude generaatori abil leida vastav
hulk arve, mis mravad ra valimisse valitavate ldkogumi liikmete
jrjekorranumbrid.
SSTEMAATILINE Kui meil ei ole ldkogumi liikmete nimekirja. Niteks tnavaksitlusel ei tea, kes
VALIM teile jrgmisena vastu tuleb ning loomulikult ei saa te neid vastutulijaid eelnevalt
nummerdada. Nimekirja puudumisel tuleks toimida nii:
eelnevalt tuleb otsustada, et te ksitlete peale iga eelmise intervjuu lppemist
niteks tpselt viiendat vastutulijat vi siis inimest, kes tuleb teile vastu tpselt
1 (vi 2, vi 3 vi jne.) minutit peale eelmise intervjuu lppu.
KIHTVALIM Mnel juhul, kui on ette teada, et ldkogum koosneb erinevatest osadest (niteks
gmnaasiumis pib 700 naissoost ja 300 meessoost pilast) ning meil on phjust
arvata, et need osad omavahel mne tunnuse osas erinevad, siis on mistlik
kasutada kihtvalimit, kus eelnevalt otsustatakse kui palju liikmeid valitakse
valimisse igast ldkogumi erinevast osast. Tavaliselt tehakse seda
proportsionaalselt ldkogumi tegeliku jaotusega. Seega, kui me tahame saada
sajaliikmelist valimit, mis oleks proportsionaalne eelnevas nites toodud
ldkogumiga, siis peaksime vlja valima 70 naist ja 30 meest, kusjuures naiste ja
meeste hulgast tuleb valimi liikmed valida eelpool toodud nudeid arvestades st.
juhuslikult.
KIKNE VALIM Olukord kus ldkogumi suuruse vi eripra tttu kaasatakse uuringusse kik
ldkogumi objektid e. ldkogum = valim
lesanne. Millist tpi valimi soovitaksid sina Jussil moodustada, et see oleks juhuslik ning annaks
levaate kikide kooli pilaste arvamusest.
lesanne. Sstemaatilist valimit saab koostada ka nimekirja olemasolu korral. Too nide.
lesanne. Arutle oma pinginaabriga, millisel viisil viks moodustada valimi Eesti avaliku arvamuse
ksitluste lbiviimisel.
lesanne. Kui reeglina kaasatakse Eestis avaliku arvamuse ksitlustesse umbes 1000 inimest, siis kui
suur on tenosus, et sina satud juhuvaliku tulemusena valimisse?
2.6.* Kvalitatiivsete e struktureerimata andmete kategoriseerimine

KAI: Struktureerimata andmestiku kodeerimine ja mrgendamine. Kategoriseerimise vimalused
teoreetilised kategooriad ja induktiivselt tuletatud kategooriad. Kategoriseerimise protsessi etapid.
2.7. Struktureeritud andmestik ja andmetabeli koostamine
Nide: Malle oli lbi viinud ankeetksitluse, milles kokku 26 ksimust. Ta hakkas hinal paberil olevaid
andmeid analsima lapates ksitluslehti ja lugedes kokku hte moodi vastuseid. sna varsti Malle tdis
sellest tegevusest ja otsustas, et andmete analsimine on ks tlikas ja igav t.
lesanne: Arutle, kas sellisel viisil lbiviidud anals on mistlik? Kui Malle ind poleks raugenud, kas ja
kuivrd oleksid tema analsi tulemused olnud piiratud? Kuidas andmete analsimise juures tmahtu
vhendada ja analsitulemuste usaldusvrsust tsta?
Enne arvulisel vi struktureeritud kujul olevate andmete analsima asumist on mistlik andmed
sisestada andmetabelisse kasutades selleks mnd ruudulise tlehega arvutiprogrammi (nt MS Excel,
OpenOffice.org Calc, Statistica, SPSS, jne) ning kasutada hiljem andmete analsimisel arvuti abi.
Viimane pstab meid korduvast ja aeganudvast andmete loendamisest ning vimaldab kiiresti ja
mugavalt kasutada samu andmeid uute sisuliste analsiksimuste vastamiseks.
Algandmetest andmetabelit koostades tuleb eelkige meeles pidada, et ige andmetabel peab olema
askeetlik st hsti lihtsa ja alati samasuguse phistruktuuriga: iga objekt saab endale tabelis he rea, iga
tunnus omale he veeru ning iga vrtus he lahtri.
Toon kaks nidet andmetabelitest, mis on mlemad korrektse lesehitusega, kuigi esimese puhul on tegu
koolipilaste ning teisel puhul professionaalide poolt koostatud tabeliga.
Mugava ja paindliku analsi tagamiseks tuleb andmetabeli koostamisel arvestada veel mitmete
reeglitega, millest olulisemad on jrgmised:
Igale tunnusele/veerule antakse nimi, mis peab olema unikaalne st teistest erinev ning suhteliselt
lhike, sest pikkade nimede puhul vtab igete tunnuste otsimine analsi kigus vga palju aega; ei
kasutata mitut veergu hendavaid pealkirju jms!
Igas lahtris tohib olla ainult ks vrtus e ks hik infot st mitut vastust hte lahtrisse sisestada ei tohi!
Seega, kui he ankeedi ksimuse puhul on vastajal lubatud valida mitu vastusevarianti, annab iga
variant andmetabelis eraldi tunnuse/veeru.
Professionaalid vldivad andmete sisestamist tekstidena ning kasutavad selle asemel

vastusevariantide kodeerimist, sest nii hoitakse kokku aega, vlditakse sisestusvigu ning hiljem on
vimalik andmeid paindlikumalt analsida (PS! ilma kodeerimiseeskirja teadmata ei ole sellist
andmestikku sisuliselt vimalik analsida; professionaalsed statistikapaketid lubavad
kodeerimiseeskirja sisestada koos andmetega ja oskavad seal olevaid kirjeldusi ka kasutada!)
hes veerus tohivad olla ainult ht tpi andmed st kui on otsustatud tunnuse snaliste vrtuste
asemel kasutada arvulisi koode, siis arvude vahele muid smboleid ei sisestata; puuduva
vastuse/vrtuse jaoks meldakse vlja sobiv arvuline kood vi jetakse vastav lahter lihtsalt thjaks.
lesanne. Lisaks uurimuse teemaga seonduvatele ksimustele kogutakse vastajate kohta selleks, et
vrrelda tulemusi niteks soo, vanuse, hariduse, elukoha vi mnede muude huvipakkuvate tunnuste
likes, ka vastavaid sotsiaal-demograafilisi andmeid.
Koosta ksimustiku alltoodud taustatunnuste osa kohta andmetabel ja sisesta sinna enda kohta kivad
andmed.
1. Sugu: mees naine 6. Tegevusala: (mrgi kik sobivad vastused)

2. Vanus: ________ aastat Kin tl
3. Leibkonna liikmete arv: ___________ lipilane, pilane
4. Elukoht: Pensionr
Tallinn Kodune
Maakonnakeskus, suurem linn Ttu
Vikelinn
Maa-asula, kla
5. Krgem omandatud haridustase:
Algharidus Kigi uuringus osalejate vahel loositakse vlja
Phiharidus 20x10 kinkekaardid. Loosimises osalemiseks
Kutseharidus (ilma keskhariduseta) palun kirjutage oma e-posti aadress:
Keskharidus
Kutseharidus + keskharidus ____________________________________
Rakenduslik krgharidus
likooliharidus, kraadiharidus Tname koost eest!
2.8. Andmete korrastamine

Nide: Anne oli juba tkk aega andmeid analsinud, kui talle hakkasid tulemused kahtlased tunduma
kui nd keskmiseks hindeks tuli grupil arvutuste kohaselt 5,72 oli selge, et seda ei saa teseks pidada,
sest isegi ksikud hinded ei saa ju le 5 olla! Anne oli kimbatuses ja ei osanud vea phjust leida.
lesanne: Mtle ja arutle, mis vivad olla valede analsitulemuste phjusteks?
Andmete sisestamisel andmetabelisse peab olema vga hoolikas, et vltida sisestusvigu, sest tihti pole
hiljem vimalik neid vigu leida. Samas peaks enne andmete sisulist analsi siiski veenduma, et andmete
sisestamisel pole tekkinud tpilisi ja kergesti tuvastatavaid npuvigu. Niteks on tpilised vead sellised,
kus arvude sisestamisel on koma jnud panemata vi on see sattunud valesse kohta; kodeeritud
andmete puhul on koodi 2 asemel sisestatud 22 vi koodi 5 asemel 55; tekstina sisestatavate
andmete puhul on sama vrtuse jaoks kasutatud erinevaid snu (nt Harjumaa ja Harju maakond) vi
on tekkinud kirjaviga (nt Tallinn asemel on sisestatud Talliin); vms.
Selliste vigade leidmiseks vib kasutada erinevaid tarkvara vimalusi, kuid Exceli puhul on ks vga
nutikas lahendus kasutada filtreerimist. Valides Data/Sort&Filter/Filter lisatakse kigi tunnuste/veergude
pisele valikunupp, millel klpsides kuvatakse rippmens kik veerust leitud erinevad vrtused. Kui
nende hulgas on selliseid, mis antud tunnuse puhul pole lubatud, siis saab need sama filtreerimise
vimalust kasutades les leida ning vastavalt parandada (vajadusel tuleb ige vrtuse teadasaamiseks
otsida les vastava objekti mtmistulemuste leht vi ksimustik!).
Nide. Kontrollime andmestiku ess.xlsx (Euroopa Sotsiaaluuringu andmestik) sisestusvigade suhtes

filtreerimise teel.
Lisame filtreerimise valiknupu Data/Sort&Filter/Filter
Kikide meie andmestiku tunnuste pistesse ilmusid valiknupud.

Avades tunnuse Regioon filtri neme rippmens valikuid
erinevatest tunnuse vrtustest.
Andmesisestusel on mnel korral eksitud vrtuse Phjaeesti

sisestamisel, mille asemel peaks olema Phja-Eesti.
Eemaldame selekteeringu (Select All) ning valime ainult vrtuse,

mida soovime kuuta (antud nites: Phjaeesti). Valikut kinnitades
(OK) neme andmetabelis vaid neid objekte, kellel on regiooni
vrtuseks Phjaeesti.
Teeme parandused ning eemaldame filtris mratud tingimuse (Clear Filter form Regioon)
Lisaks vrtuste loendile pakub fitreerimine ka andmetabeli

jrjestamist valitud tunnuse vrtuste phjal (Sort). Andmete
jrjestamine vrvi jrgi (Sort by Color) eeldab, et andmete
sisestamisel on kasutatud erinevaid vrve (Font Color).
Snalise tunnuse korral saame kasutada teksti filtreid (Text Filters), mis
pakuvad laiemaid vimalusi andmete filtreerimisel. Niteks saab mrata,
kas mingi fraas sisaldub (vi ei sisaldu) filtreeritavates kirjetes. Samuti saab
mrata, millise thega/fraasiga algavad vi lpevad filtreeritavad kirjed.
Samaaegselt saab mrata mitu tingimust.
Numbrilise tunnuse filtreerimisel pakub numbrifilter (Number Filters) veelgi

enam tingimuste mramise valikuid (suurem/viksem teatavast vrtusest, vrtuste vahel asetsev,
keskvrtusest viksem/suurem jne).
Pane thele, et filtri kasutamise tagajrjel kuvatavad

kirjed omavad algset rea numbrit ning objektid, mis ei
vasta mratud tingimusele on peidetud (mitte
kustutatud).
Andmestiku all on ra toodud objektide arv, kui palju

vastavale tingimusele vastavaid objekte leiti.
lesanne. Arutle, miks peab olema ettevaatlik filtreeritud andmestikust niteks kolme jrjestikuse objekti
kustutamisel.
lesanne. Vaata tunnuse Tegevus sisestatud vrtusi. Arutle, milliseid vrtuseid viks koondada
heks vrtuseks ja vii see koodamine lbi?
lesanne. Paranda andmestikus esinevad sisestusvead (Leibkonna suuruseks on sisestatud 50, peaks
olema 5; kooliskidud aastate arvu 80 asemel peaks olema 8). Leia lisaks veel hes tunnuses esinev
sisestusviga.
lesanne*. (Eeldab, et andmestikus on sisestusvead parandatud ning sobivad andmed koondatud)

Kasuta filtreid ja leia, kui palju on ksitlusele vastanuid, kes ...
a) ...on alla 65 aastased pensionrid

b) ...on magistrikraadiga ttud
c) ...elavad Kirde-Eestis ning kelle kodune keel on eesti keel
d) ...on le 40 ja alla 50 aastased mehed ning kivad tasustatud tl
3. Andmete analsimine
D EESMRGI
Kesolevas peatkis leiame vastused ksimustele:

Millise meetodiga saab kige lihtsamalt levaate andmetest?
Millal ja kuidas on statistiliselt korrektne oma uuringu tulemusi ldistada?
Kas mnikord on ainult tekst tulemuste esitamiseks parim viis?
Mis on diagrammide eesmrk ja kuidas seda saavutada?
3.1. Andmete analsimise phisammud
Eeldame nd, et oleme andmete kogumise, sisestamise ja korrastamise etapid lbinud ja saame
alustada andmete analsimist. Kuidas aga otsustada, millist meetodit oma andmete analsimiseks
kasutama peaksid?
Anals algab ksimuse snastamisest andmete kohta nt. Kui suur osa ksitlusele vastanutest
omavad Facebooki kontot?, Kuidas jagunevad spordipeval saadud jooksutulemused?, Kas ja kui
palju hommikul ja htul mdetud hutemperatuurid erinevad?, Kas kitumise hinne on seotud hindega
klassijuhataja poolt petatud aines?, jne. Pane thele, et need andmete analsi suunavad ksimused
erinevad nii uurimisksimustest, mis suunavad uurimistd tervikuna, kui ka ksimustikus vastajatele
esitatud ksimustest!
Sammud andmete analsi lbiviimisel
Snastan konkreetse andmetest lhtuva ksimuse, millele tahan vastust saada
Valin pstitatud ksimusest lhtudes kasutadaolevate andmete jaoks sobiva analsimeetodi
Tulemuste esitlemiseks valin andmete olemust ja tulemuste sisu parimal viisil vlja toova ning
sihtrhmale arusaadava ja esitluse kohale sobiva esitlusviisi ning visuaalse kujunduse.
Analsi tuleks alustada lihtsamate hte tunnust korraga puudutavate ksimustega, mis annavad
andmetest esialgse ldise levaate. Peale esialgsete kokkuvtete ja levaadete tegemist andmetest on
vimalik asuda uurima ka erinevusi ja seoseid.
3.2. Ksimustest Kui palju ? ja Kui suur osa ? lhtuv

anals.
Nide. 10. klasside pilaste seas viidi lbi uuring internetikasutuse kohta. Muuhulgas ksiti ka seda, kui
sageli pilased klastavad Facebooki portaali, kusjuures vastamiseks anti ette viis vastusevarianti.
Esmased analsi eeldavad ksimused viks olla nt. sellised:
Kui suur osa pilasi kasutab Facebooki iga pev?,
Kas ja kui palju leidub neid pilasi, kes Facebooki ldse ei kasuta?
Mis on kige tpilisem kasutussagedus ehk millise vastusevariantidest on valinud kige suurem osa
pilastest?.
lesanne. Koosta antud teema kohta veel ks samalaadi ksimus

Kik need ksimused eeldavad vastamist kaht tpi ksimustele:
Kui palju? Kui suur osa?
Vastuse saamiseks seda tpi ksimustele tuleb loendamise teel leida erinevate vastutusevariantide e.
vrtuste esinemissagedused. Arvuti abil vastavat analsi lbi viies tuleb tunda nii tavapraste
statistiliste meetodite nimesid, kui ka kasutada oleva tarkvara vimalusi. Edaspidises on toodud nited
Eesti koolides kige laiemalt kttesaadava andmeanalsi vimaldava tarkvara MS Excel baasil.
3.2.1. Sagedustabel
Isegi kui esmane ksimus eeldab ainult he vastusevariandi e vrtuse esinemissageduse leidmist,
koostatakse arvuti abil analsi lbi viies mugavuse ja analsi kompaktsuse tttu reeglina vastava
tunnuse kiki vrtusi kokkuvttev sagedustabel, mis viks antud nite puhul vlja nha selline:
Tabel 1. Facebooki portaali klastuste sagedus.
Vastajate arv Osakaal

Mitu korda pevas 347 54,2%
Tavaliselt kord pevas 209 32,7%
Kllalt regulaarselt, aga mitte iga pev 24 3,7%
sna harva, ebaregulaarselt 25 3,9%
Ei kasuta ldse 35 5,5%
KOKKU 640 100 %
Tabelis 1. on lisaks sagedustele (vastajate arv) vlja toodud ka iga vrtuse esinemise osakaal
protsentides, mis lihtsustab andmetest levaate saamist.
Nide. Vaatame internetikasutuse osakaalusid 2008.aastal erinevates riikides 6.-17.aastaste

laste seas. Tulemuste esitamiseks on koostatud kaks sisuliselt sama, kuid andmete paigutuse (vrtuste
esituse) poolest erinevat tabelit (Tabel 2A ja Tabel 2B).
Tabel 2A. Tabel 2B.
Riik Osakaal Riik Osakaal Juhul kui tabelis toodud kategooriad ei ole
Eesti 93% Soome 94%
sisuliselt thenduslikus jrjekorras, siis
Itaalia 45% Eesti 93%
Kreeka 50% Rootsi 91% jrjestatakse tabeli read
Leedu 86% Ungari 88% sageduste/osakaalude jrgi (Tabel 2B).
Lti 83% Leedu 86%
Rootsi 91% Lti 83%
Soome 94% Kreeka 50%
Ungari 88% Itaalia 45%
Sagedustabeli koostamine programmis Excel
Sagedustabeli loomiseks kasutame vahendit Pivot Table (Liigendtabel)
Aktiviseeri ks lahter andmetabelist.
Vali Insert/PivotTable/PivotTable
Avanenud aknas on vimalik muuta tabeli koostamiseks kasutatava andmetabeli asukohta vi olla nus
pakutava andmetabeliga
Tunnuse FACEBOOK vrtuste kokkulugemiseks lohista tunnus
FACEBOOK Row vljale. See tagab, et loodava tabeli vrtused
ja nendele vastavad sagedused kuvatakse ridades.
Kui viid tunnuse FACEBOOK Column vljale, saad

sagedustabeli, mille vrtused ja sagedused on paigutatud
veergudesse.
Selleks, et vrtuste esinemissagedused kokku loendatakse, vii

tunnus FACEBOOK vljale Values.
Snalise tunnuse korral lisatakse tunnuse ette automaatselt
funktsioon Count (loendamine). Numbrilise tunnuse korral
pakutakse vaikimisi keskvrtuse leidmist (Average). Sel juhul
tuleb funktsioon average asendada igega (count). Selleks ava
Values lahtris oleva tunnuse taga olev nool ja vali: Value Field
Settings/ Summarize by/ Count
Protsentide lisamiseks tabelisse vii

tunnus FACEBOOK veelkord Values
vljale. Klpsa tunnuse jrel oleval
noolel ja vali: Value Field Settings/
Show value as/ % of column (100%
moodustub kokku veerus olevatest
vrtustest).
lesanne. Anna levaade andmestiku pilased.xls tunnuse Kuidas oled ppinud arvutit kasutama?
vrtustest. Kujunda tabelit ning otsusta, kas antud tunnuse vrtuseid oleks korrektne suuruse
jrjekorda paigutada vi mitte.
lesanne. Pstita andmestiku pilased.xls kohta 2 esmast andmeanalsi ksimust. Koosta pstitatud
ksimuste kohta sagedustabelid ning kirjuta nendele jreldused.
JTA
Sagedustabel loendab tunnuse vrtuste esinemissagedused. Tunnuse vrtuste jaotumisest
levaatlikuma pildi saamiseks lisatakse tabelisse ka protsendid.
MEELDE
Kui tunnuse vrtustel on sisuline jrjestus, siis tabeli ridu sageduste jrgi ei jrjestata.
OLULINE VAHETERA I - Analsi tulemuste esitlemisest
Nide: Maril on analsi tulemusena koostatud sagedustabel, kuid ta on kuulnud, et analsi tulemusi
peaks esitama alati diagrammina. Mari khkleb, sest ta on ka tabelina esitatud tulemusi ninud ja ei oska
seetttu otsustada, mil moel oma analsi tulemust teistele siis esitlema peaks.
lesanne: Mtle ja arutle, millal viks oma tulemusi esitleda tabelina ning millal diagrammina ning kas on
veel mni esitlemise vimalus?
Statistilisi andmeid ja statistilise andme-analsi arvulisi tulemusi saab esitada:

- teksti sees toodud arvudena
- tabelina
- arvjoonise e diagrammina
Tulemuste esitlusviisi valik sltub mitmetest teguritest: nt, kas tulemusi esitatakse paberil vi suulises
ettekandes, kes on sihtrhm ja mis on nende eeldatavad teadmised uurimuse teemavaldkonnas ning
statistiliste meetodite alal, jms, kuid esmathtis on, et esitlusviis toetaks parimal viisil tulemuste sisust
kiiret ja iget arusaamist ning oleks kompaktne.
ldjuhul vali esitluseks:

- diagramm, kui soovid eelkige anda kiiret levaadet ldtendentsi(de)st ja suundumus(te)st
- tabel, kui on vajalik anda edasi tpset arvulist infot vi kui vrreldavate arvnitajate suurusjrgud on
vga erinevad
- tekst, kui korraga on vaja esitada vaid ks-kaks arvulist nitajat.
Nide: Tulemus, mida Mari tahtis oma ts esitada, ngi Google Formi poolt koostatud kokkuvttena
vlja nii:
Kuna nagu tulemustest selgub, klastavad kik 20 ksitlusele vastanut eKooli igapevaselt ei ole antud
juhul otstarbekas tulemuste esitamiseks kasutada ei tabelit ega ka diagrammi, sest lihtne lause aitab
kogu tulemuse kenasti ja arusaadavalt edasi anda.
lesanne: 2008.a. TNS Emori lbiviidud heategevusliku kitumise uuringu tulemuste esitamiseks on all
toodud kaks vimalust (A sektordiagramm ja B tekst). Kaalu mlema variandi tugevusi ja nrkuseid ning
otsusta, milline nendest on parem viis andmete esitamiseks suulises ettekandes ja uurimist kirjalikus
raportis.
A. SEKTORDIAGRAMM B. TEKST
2008.a. heategevuses osalenud isikute osakaal 2008.a. TNS Emori lbiviidud uuringus
heategevuslikust kitumisest selgus,
et 87% vastajatest on viimase aasta
jooksul heategevusega hel vi teisel
ei ole heategevuses osalenud; 13%
moel kokku puutunud.
olen osalenud heategevuses; 87%
Joonis 1. Heategevuses osalemine (2008.a.).
Tulemusi kirjalikult uurimist raportis esitledes tuleb arvestada, et igale lisatud tabelile, diagrammile ja
joonisele tuleb tekstiosas viidata ning tabelis vi diagrammil olev sisu seletatakse tekstiosas lahti.
Lahtiseletuseks ei sobi tabelis vi diagrammil oleva arvulise info ks-hene leskirjutamine tekstina.
Niteks EI SOBI eelmise punkti Tabelis 1. Toodud tulemuste lahtiseletamiseks jrgmine tekst:
47 pilast ei kasuta Facebooki portaali ldse, 184 pilast kasutab kllaltki regulaarselt, kuid mitte iga pev.
84 pilast kasutab portaali mitu korda pevas, 101 kasutab tavaliselt kord pevas ja 224 pilast kasutab
Facebooki sna harva.
Tabelis vi diagrammil olevate arvuliste tulemuste lahtiseletamisel uurimust tekstis tuleks vlja tuua
ldised tendentsid (nt. le poolte vastanutest kasutavad portaali mitu korda pevas vi ligikaudu 85%
vastanutest kasutab portaali vhemalt ks kord pevas) ning see, mis on t sisulises kontekstis antud
tulemi korral oluline ja mida tahetakse esile tsta.
lesanne. Ksi oma klassi pilastelt, kui sageli nemad Facebooki portaali klastavad. Soovi korral
kasuta nites toodud skaalat. Koosta vastustest sagedustabel. Kirjuta tekst, mis sobib saadud
sagedustabeli lahtiseletuseks.
lesanne. Siim viis lbi uuringu, milles osales 48 poissi ja 72 trdukut. Antud tulemuste esitamiseks
koostas Siim jrgmise sagedustabeli.
Arv %
Poiss 48 40%
Tdruk 72 60%
KOKK 120 100%
U
Phjenda, kas Siim peaks vi ei peaks koostatud sagedustabelit oma ts uuringu tulemuste esitamiseks
kasutama.
lesanne. Too niteid tunnustest, mille tulemuste esitamiseks on sobivaim viis kasutada ainult teksti.
lesanne. Too niteid tunnustest, mille puhul tulemuste esitamiseks tuleks tekstile lisaks esitada ka tabel
vi diagramm.
Nide. Moonika viis oma klassis lbi lhiuuringu sellest, kui paljud tema klassikaaslased on kokku
puutunud heategevusega. Kokku osales uuringus 26 pilast.
Tulemuste esitamisel kaalus Moonika kahe variandi vahel, kas esitada tulemused sagedustena (A) vi
protsentuaalselt (B).
A. Kokku vastas 26 pilast, kellest 8 on hea- B. Kokku vastas 26 pilast, kellest 31% on hea-
tegevusega kokku puutunud. tegevusega kokku puutunud.
lesanne: Millise variandi valiksid sina Monika olukorras?
Vikeste valimite korral on mistlik tulemused esitada sagedustena. Protsentide kasutamine vib
lugejatele edastada kallutatud pildi andmetest e tekitada ettekujutuse nagu oleks uuritud isikute hulgas
tegelikust rohkem vastajaid. Niteks esitades uuringu tulemusi sellisel kujul: uuringus osales 17 inimest,
kellest 23,5% olid teinud rahalisi annetusi eelmise aasta jooksul, on 23,5% taga tegelikult vaid 4 inimest.
Seega, korrektsem viis tulemuste esitamiseks oleks jrgmine: uuringus osales 17 inimest, kellest 4 olid
teinud rahalisi annetusi eelmise aasta jooksul. Soovi korral vib levaatlikkuse tstmiseks sagedusele
sulgudes lisada osakaalu: uuringus osales 17 inimest, kellest 4 (23%) olid teinud rahalisi annetusi
eelmise aasta jooksul.
Suurte valimite korral (kui vastajaid on rohkem kui 100), vib tulemuste esitamisel kasutada ka ainult
protsente. Niteks: Uuringus osales 350 pilast, kellest 12% olid annetanud oma mnguasjad
heategevuslikuks otstarbeks.
JTA
he vi kahe arvulise nitaja esitamiseks kasuta teksti, mitte tabelit ega diagrammi.
Kui vastajaid on alla saja, kasuta tulemuste esitamisel sagedusi. Kui vastajaid on le saja, kasuta
protsente.
MEELDE
Ksitluste lbiviimise tarkvara poolt koostatud analsi suhtu ettevaatlikkusega ning mtle lbi, kas
3.2.2. Tulpdiagramm
Nide: TNS Emori andmetel vaatasid Eesti elanikud novembris 2011 televiisorit
0 tundi
keskmiselt 4 tundi pevas. Meie kasutuses olevas andmestikus pilased.xlsx on alla 1 tunni
olemas tunnus Aeg teleri vi video vaatamiseks pevas, mille vrtused on kogutud 1-2 tundi
3-4 tundi
krvaltoodud skaalal.
le 5 tunni
Vastuste jagunemise kirjeldamiseks saame koostada sagedustabeli, kuid kuna tunnusel on vimalikke
vrtusi rohekm kui paar tkki (kokku 5), siis vime tulemuste esitamiseks kaaluda ka diagrammi
koostamist.
lesanne. Koosta andmestikku pilased.xlsx kasutades tunnuse Aeg TV phjal alljrgnev

sagedustabel.
Teleri vaatamise Vastajate
aeg pevas arv
0 tundi 12
alla 1 tunni 105
1-2 tundi 300
3-4 tundi 187
le 5 tunni 36
KOKKU 640
Koostame nd tulemuste visualiseerimiseks tulpdiagrammi, milles iga tulba krgus on proportsionaalne

vastavasse kategooriasse kuuluvate pilaste arvuga.
Tulpdiagrammi koostamnine
Tulpdiagrammi koostamiseks MS Exceli abil kasutame eelnevalt koostatud
sagedustabelit.
Mrgistame kokkuvetud andmed ning valime Insert/Charts/Column
Tulpdiagrammi kujundamine
Tulba krguse tpseks kirjeldamiseks on vimalik lisada tulpadele tulba tpset krgust vljendavad
sildid. Selleks mrgista tulbad ning vali: Layout/Labels/Data Labels
Lisatud andmesiltide kujundamiseks mrgista sildid ning vali: Layout/Labels/More Data Label Options
Andmesiltide lisamisel tuleb lhtuda sellest, et joonisel olevad numbrid ja jooned ei kattuks/likuks
vaid oleksid selgelt loetavad. Vajadusel lohista lisatud sildid ise sobivasse kohta vi eemalda jooniselt
abijooned.
Tulpdiagrammile pealkirja lisamiseks vali: Layout/Labels/Chart Title/Above Chart
Tulpade muutmiseks mrgista tulbad ning vali: Format/Shape Styles
Kui loodud tulpdiagramm kirjeldab vaid he tunnuse vrtuseid, ei ole tulpade krvale kuvatavat
legendi vaja. Selle asemel on mistlik lisada selgitus (pilaste arv) y-teljele.
Y-teljele selgituse lisamiseks vali: Layout/Labels/Axis Titles/Primary Vertical Axis Title/Rotated Title
Joonis 1. Tulpdiagramm
lesanne: Arutle, kas antud tulemustest saab kiirema ja parema levaate sagedustabelist vi
tulpdiagrammilt ning phjenda, millise valiku teeksid sina antud tulemuste esitlemiseks?
lesanne. Koosta andmestiku pilased.xlsx tunnuse Keskmine hinne vrtuste jagunemise

kirjeldamiseks tulpdiagramm.
Vrtuste kokkuloendamisel selgub, et thjasid lahtreid st puuduvaid vastuseid on 26. Kas need oleks
mttekas diagrammilt vlja jtta vi kaasa vtta?
Kujunda diagramm esitluseks sobivale kujule.
Nide 2. Martin koostas eesti keele tunni raames uuringu kaaspilaste lugemisharjumustest ning ksis
muuhulgas ka seda, mis liiki oli tema kooli 10.klasside pilaste viimati loetud raamat.
Tulemused koondas Martin jrgnevasse tabelisse:
Mis liiki raamatut viimati lugesid? pilaste arv
Kriminaalromaanid, pnevus 26
Teatmeteosed 26
Ajaloolised ja eluloolised romaanid 24
Matka- ja reisiraamatud 27
KOKKU 103
lesanne. Sisesta sagedustabelis toodud andmed Exceli tlehele ja koosta nende phjal tulpdiagramm.
Vaata vaikimisi loodavat diagrammi (toodud all) ja too vlja puudused diagrammi kujunduses, mida oleks
vaja parema levaate saamiseks umber kujundada
Kui tulpasid kirjedavad tekstid on pikad, siis paigutub tekst tavaliselt automaatselt nii, et seda on
ebamugav lugeda (kaldu, ksteise alla vms.). Parema loetavuse saavutamiseks tuleks tulpdiagrammi
teljed ra vahetada. Selleks mrgista tulpdiagramm ning vali: Design/Change Chart Type/Bar
Tulpade jrjestamiseks kahanevasse jrjekorda jrjestame read sagedustabelis vastavalt sageduste

kahanemise jrjekorda.
Skaala muutmiseks teljel mrgistame skaala ning valime

hiire parema klahvi alt avanenud rippmenst: Format
Axis
Reeglina peaks ige visuaalse levaate saamiseks skaala
teljel algama 0-st. Mrame skaala miinimumvrtuseks
(Fixed) 0.
Maksimumvrtuseks vib meie nite puhul jda ka 28, kuid soovides 5-hikulise jaotusega skaalat,
mrame maksimumvrtuseks 30.
Jaotushikud moodustatakse automaatselt mele sisestatud madalaima ja krgeima teljel kuvatava
vrtuse jrgi. Soovi korral saab neid ka muuta (major unit hredam jaotus; minor unit tihedam
jaotus).
Lisades veel diagrammile pealkirja, x-telje kirjelduse ning kustutades legend, saame jrgneva diagrammi,
millel on toodud 10.klasside pilaste viimase kuu lugemuse levaade.
lesanne. Koosta tulpdiagramm andmestiku pilased.xlsx tunnuse Aeg ppimiseks kirjeldamiseks.
lesanne. Koosta tulpdiagramm tunnuse Arvuti samastub kige enam kirjeldamiseks. Kujunda
saadud tulemit ning kirjuta sellele uurimuse tekstis toodav lahtiseletus.
3.2.3. Sektordiagramm
Nide. Anna luges looduspetuse pikust lauset Kige suurem maailmajagu maailmas on Aasia, mis
moodustab kogu maismaa pinnast 30% ja tal tekkis tahmine saada kompaktset levaadet kui suure osa
maismaast hlmavad teised maailmajaod.
Terviku jaotumist osadeks kirjeldatakse tihti sektordiagrammi abil, milles kik kategoorid kokku
moodustavad 100% ning mis toob selgelt vlja iga kategooria osa tervikust.
laltoodud nites Anna poolt soovitud levaate annab jrgmine sektordiagramm:

lesanne. Arutle, kas sama infot viks esitada ka tulpdiagrammi abil ning mispoolest erineb saadav
visuaalne levaade sektor- ja tulpdiagrammi puhul?
Nide: Vastajatel paluti hinnata vitega pilased kituvad tunnis paremini, kui seal arvuteid kasutada
nusolekut 4-palli skaalal. Vastuste jagunemise illustreerimiseks vime kasutada sektordiagrammi.
Sektordiagrammi koostamiseks:
Koonda tunnuse vrtused sagedustabelisse (Pivot Table) ja vajadusel sorteeri
tabeli read sobivasse jrjekorda
Mrgista kokkuvetud andmed
Vali Insert/Pie
Sektordiagrammi kujundamine
Sageduste ja/vi protsentide

lisamiseks mrgista sektorid ning
vali: Layout/Labels/Data Labels
Lisatud siltide kujundamiseks
mrgista sildid ning vali:
Layout/Labels/More Data Label
Options
Reeglina ei esitata hel graafikul korraga sagedusi ja protsente, sest liigne numbrite rohkus vib
segada kiire ja levaatliku ettekujutuse saamist andmetest.
Sektordiagrammile pealkirja lisamiseks vali: Layout/Labels/Chart Title/Above Chart
Sektorite vrvi muutmiseks vali sektorid he kaupa (vali sektorid ning seejrel klpsa konkreetse
sektori peal) ja muuda nende vrvi (Home/Font/Fill Color).
lesanne. Mtle ja arutle, kas alljrgnevad sektordiagrammid esitlevad vastvaid andmeid parimal
vimalikul viisil?
Jta meelde:
- ra kasuta kujundusviisi, kus kik sektorid on ksteisest eraldatud, sest see vhendab diagrammi
levaatlikkust! Sektori vljatstmist kasutatakse siis, kui ks sektoritest on tulemuste kontekstis
teistest olulisem vi kesksem ning seda soovitakse seeprast rhutada ning esile tsta. Reeglina
ei tsteta vlja kige suuremat sektorit.
- Soovituslikult viks hel sektordiagrammil olla 3-9 sektorit. Liiga paljude sektorite esitamine hel
diagrammil vhendab levaatlikkust. Vajadusel henda viksemad sektorid hiseks sektoriks
Muu, mis paigutatakse diagrammil viimaseks.
- Kolmemtmelisus loob olukorra, kus eespool asetsevad sektorid tunduvad visuaalselt suuremad
kui tagumised, mistttu on mistlik seda kujundusviisi vltida.
lesanne. Kasutades andmestikku pilased.xlsx koosta sektordiagramm illustreerimaks pilaste

arvamusi vite Arvutimngud phjustavad sltuvust kohta. Milline on sinu arvamus antud ksimuses?
Nide: Liina de Mari on otsustanud paar kilo alla vtta, sest kik tema sbrad
Pilt
langetavat kaalu. Liinal tekib seepeal huvi teada saada, kuivrd populaarne on kaalu tdruku
langetamine koolipilaste seas? Ta otsustab koolis lbi viia vikese uuringu, mille st
raames ta ksib pilaste kaalu, pikkust, rahuolu oma kehakaaluga ning seda, kas
pilased toituvad tervislikult ning mitu korda ndalas nad treeninguga tegelevad.
lesanne. Milliste, juba pitud, meetoditega saab levaate jrgmiste ksimuste

vastustest?
a) Kuivrd oled rahul oma praeguse kehakaaluga? (Vga rahul, pigem rahul, pigem
ei ole rahul, ldse ei ole rahul)
b) Kas toitud tervislikult? (jah, ei)
Lisaks eelnevas lesandes vlja toodud jrjestus- ja nimiskaalat kasutavatele tunnustele, sisaldas Liina
ksimustik ka arvskaalal mdetavaid tunnuseid: pikkus, kaal ja treeninguga tegelemise sagedus
ndalas. Lisaks arvutas Liina vlja iga pilase kehamassiindeksi (KMI) ja tahtis selle phjal saada
levaadet, kui suur osa pilastest on lekaalulised, kui suur osa normkaalus ning kui suur osa on
alakaalus. Ta kasutas saadud andmete analsimiseks tuttavat tulpdiagrammi ja sai alljrgneva
tulemuse:
Tulpdiagramm
4
3
2
Vastajate arv 1
0
Joonis 1. Tulpdiagramm pilaste KMI vrtustest
lesanne. Kas antud analsi tulemus aitab pstitatud ksimusele kiiresti ja selgesti vastuse saada?
Phjenda vastust!
Kuna tunnuse KMI vrtused on komakohtadega arvud, siis on sisuliselt iga pilase KMI pisut erinev kigi
teiste pilaste KMI-st. Kui sellise paljude erinevate vrtustega arvtunnuse kohta koostada tavaline
tulpdiagramm, siis tulemus on tiesti ebalevaatlik, sest tulpadena kantakse diagrammile
arvutiprogrammide poolt tunnuse kik erinevad vrtused hekaupa. laltoodud diagrammilt on nha, et
suurem osa KMI-test esineb ks kord (enamus tulpasid on krgusega 1) ning on vaid mned vrtused,
mis korduvad 2 vi 3 korda. Seega, tulpdiagramm ei anna levaatlikku pilti seda laadi andmete jaotusest
ning selle kasutamine antud olukorras ei ole asjakohane. Jrelikult tuleb leida mni teine andmete
analsimise meetod, mis paremini sobiks.
3.2.4. Histogramm
lesanne. Kas alltoodud analsi tulemus aitab pstitatud ksimusele kiiremini ja paremini selge vastuse
saada kui laltoodud joonisel olnud tulpdiagramm? Phjenda vastust!
Mille poolest erinevad need kaks diagrammi?
Histogrammis on koondatud KMI vrtused vahemikesse ning iga tulp nitab konkreetsesse vahemikku
kuuluvate vastajate arvu.
Kuna antud histogrammi vahemikud on valitud nii, et nende otspunktid lhevad kokku arstide poolt
mratud ala- ja lekaalulisuse piiridega, siis nitab histogramm, et alakaalulisi e. neid, kelle KMI on alla
19 punkti on pilaste seas
rohkem (11 pilast) kui
lekaalulisi (8 pilast).
Joonis 2. Histogramm
pilaste KMI vrtustest
Histogramm on
tulpdiagrammi spetsiifiline
alamliik, kus telgede
thendused on alati
heselt mratud.
Histogramm sobib ainult arvtunnuste kirjeldamiseks, kuna sellel teljel, millele tulbad toetuvad, on alati arv-
vrtustest moodustatud vahemikud. Kuna seal, kus lppeb eelmine vahemik, algab kohe jrgmine, siis
on histogrammil sisuliselt sobilik tulbad asetada vahetult ksteise krvale. Tulpade krgus histogrammil
kirjeldab alati antud vahemiku sagedust e seda, mitu tulemust (vi kui suur osa tulemustest) antud
vahemikku ji.
lesanne. Nimeta, millised nites 1. toodud tunnustest on veel arvtunnused, millel on palju erinevaid
vrtuseid.
lesanne. Mille poolest erinevad tulpdiagramm ja histogramm? Too vlja nii sisulised kui ka visuaalsed
erinevused.
Histogrammi koostamine Excelis

Nide. Anname levaate pilaste kehamassiindeksitest (KMI) andmestiku treening.xlsx phjal.
Kuna tegemist on arvtunnusega, millel on palju erinevaid vrtuseid, siis koostame histogrammi.
Histogrammi koostamist Excelis tuleks alustada soovitud vahemike

otspunktide mramisest. Selleks sisesta soovitud vahemike otspunktide
vrtused tlehele eraldi veergu.
Kui te sisestate numbrid 19, 22, 25 ja 28 moodustatakse kokku 5 vahemikku:
16-18,9 19 21,9 22-24,9 25 -27,9 28 -30,9
Kui vahemike otspunkte ei sisestata, moodustab Excel vahemikud ise, mis annab kll kiire levaate
andmete jagunemisest, kuid ei ole sisuliselt sobivaim lahendus.
Histogrammi loomiseks kasutame
lisavahendit Data/Data Analysis.
Data Analysis sisaldab, lisaks
histogrammile, mitmeid erinevaid
andmeanalsi vahendeid, millega
tutvume jrgmistes tundides.
Histogrammi loomise aknas tuleb mrata piirkond (Input Range), kus asuvad vrtused, millest
histogrammi koostama hakatakse. Meie
nites on selleks tunnuseks KMI.
Output Options vimaldab mrata,

kuhu loodav histogramm asetatakse.
Chart Output tuleb mrgistada, vastasel

juhul histogrammi ei looda. Kuvatakse
vaid sagedustabel koondatud vahemike
vrtustest.
Bin Range vljale tuleb sisestada loodavate vahemike otspunktide piirkonna

aadress. Kui vahemike otspunkte ei sisestata, moodustab Excel vahemikud
ise, mis ei ole alati sobivaim lahendus (vt. joonis 3).
Histogramm
30
20
10
Frequency 0
Bin
Joonis 3. Histogramm KMI vrtustest. Vahemike otspunkte ette antud ei ole.

Histogrammi kujundamine
Excelis loodaval histogrammil on tulpade alla kirjutatud vahemike otspunktid. Diagrammi sisu paremaks
mistmiseks tuleks need asendada tegelike vahemike siltidega.
Vahemike silte muuda loodud vahemikke kirjeldavas tabelis.
Eelnevalt arutlesime, et histogrammil on ige paigutada tulbad vahetult ksteise krvale, sest seal, kus
lppeb eelmine vahemik, algab kohe
jrgmine. Selleks vali tulbad, tee
paremklikk tulpade peal ning vali
Format Data Series/Gap Width/No
Gap
Histogrammi tulpade vrvi, pealkirjade ja skaala muutmine on sarnane tulpdiagrammi kujundamisega.

(vt.pt.3.2.3)
lesanne. Arutle ja phjenda, kas tunnuse dede-vendade arv vrtuste jaotusest levaate saamiseks
sobib paremini tulpdiagramm vi histogramm?
lesanne. Koosta andmestiku treening.xlsx tunnuse kaal kohta histogramm ning kujunda saadud
tulemit.
lesanne. Leia andmestikust pilased.xlsx tunnus, mille vrtuseid oleks sobilik esitada histogrammi abil.
Koosta histogramm, kujunda saadud tulemit ning kirjuta sellele uurimuse tekstis toodav lahtiseletus.
JTA
Selleks, et arvtunnuste analsimiseks sobivaid meetodeid valida, tuleb teha vahet, kas tegemist on
vheste erinevate vrtustega arvtunnusega vi paljude erinevate vrtustega arvtunnusega. Kui
arvtunnusel on vhe erinevaid vrtusi, siis saab kasutada nii tavalist sagedustabelit kui
MEELDE
tulpdiagrammi, sest ksikute arv-vrtuste phjal tekkivaid gruppe on vhe ja nad mahuvad kenasti
Vhe erinevaid vrtuseid Palju erinevaid vrtuseid

Klaasikaaslaste vanus: arvtunnus, millel on vhe petajate vanus: arvtunnus, millel on palju
erinevaid vrtuseid. Sinu klassikaaslaste vanused erinevaid vrtuseid. Tenoliselt on teie koolis
ei erine omavahel ilmselt palju rohkem kui 2-3 aasta petajaid vga erinevates vanustes - nii noori,
vrra. keskealisi kui ka vanemaid petajaid.
dede-vendade arv: arvtunnus, millel ka ei ole pilase pikkus: arvtunnus, mille vrtused
vga palju vimalikke erinevaid vrtusi, sest saadakse mtmise teel. Jllegi on tenoline, et
enamasti on Eesti peredes 1-3 last ja seega desid- sinu klassikaaslased on kik erineva pikkusega.
vendasid hel lapsel 0-2.
lesanne 1. Koosta andmestiku pilased.xlsx tunnuse vanus kohta sagedustabel, histogramm ja

tulpdiagramm. Arutle, millise nendest valiksid tulemuste esitamiseks ning miks?
lesanne 2. Mtle, mis tpi on tunnused kaal ja treeningu sagedus. Lisa omalt poolt kaks nidet
erinevat tpi arvtunnuste kohta.
OLULINE VAHETERA II* Valimi phjal saadud tulemuste

ldistamine
Nide: Pt.3.2 toodud nites judsime tulemuseni , et 54,2% ksitlusele vastanutest klastab Facebooki
portaali mitu korda pevas.
Aga kui me sooviksime teha jreldusi mitte ainult vastanute vaid ka kogu ldkogumi kohta. Seega
tahaksime nd andmete phjal teada:
Kui suur osa Eesti pilastest (e tema uuringu ldkogumist) klastab Facebooki lehte mitu korda pevas?
Mtle veel! Kui me oleme uurinud vaid vikest
lesanne. Tta jrgnev skeem iseseisvalt lbi.
osa ldkogumist, kas on loogiline eeldada, et
meie valimi tulemus on tpselt sama, mis
Kui 54,2% valimist klastab Facebooki lehte mitu saaksime ldkogumis kui me teaksime kigi
korda pevas, kas me saame sellest jreldada, JA
ldkogumi objektide kohta vastavaid andmeid?
et ka tpselt 54,2% ldkogumist klastab
Facebooki lehte mitu korda pevas?
ige! Selle, et valimi ja ldkogumi protsendid
EI tulevad kllaltki sarnased tagab see, et meil on
ige! Valimi ja ldkogumi protsendid ei pruugi juhuvalim, mis esindab ldkogumit sna hsti.
JA Aga kui sarnased need valimi ja ldkogumi
olla vrdsed, kuid kas need vivad olla kllaltki
sarnased? protsendid siis ikkagi on?
EI
Matemaatiliste valemitega on seda vimalik
Mtle veel. Juhuvalimi koostamisega tagati, et vga tpselt vlja arvutada.
see esindaks vimalikult hsti ldkogumit. Valimi phjal arvutatud arvkarakteristikud
Vikese tenosusega on vimalik erandlik (antud juhul grupi osakaal) on vastavate
olukord, et valimi tulemus on vga erinev ldkogumi parameetrite hindamise aluseks,
ldkogumi omast, kuid eeldusel, et valimi kuid valimilt ldkogumile jrelduste
objektid on valitud juhuslikult, tulevad reeglina tegemisel tuleb alati arvestada juhusliku
valimi tulemused kllaltki sarnased ldkogumi veaga, mida arvestades saame ldkogumi
vastavatele nitajatele. parameetri kohta VAHEMIKHINNANGU
Sellist hinnangute andmist ldkogumi parameetrite kohta nimetataksegi STATISTILISEKS JRELDAMISEKS e

LDISTAMISEKS.
Kas statistilise jreldamise tpsus sltub meie See on tepoolest nii. Mida suurem on valim,
JA
ksutuses oleva valimi suurusest? seda tpsem on meie hinnang ldkogumile.
Lisaks valimi suurusele on veel teisigi tegureid,
Praktikas vib muidugi tulla ette ka olukord, kus mis mjutavad hinnangute tpsust, kuid philine
uurijat huvitav sihtrhm on suhteliselt vike (vi ja htlasi meie poolt mjutatav on just valimi
uurimiseks eraldatud ressursid vga suured) ning suurus.
ta suudab vajalikud andmed koguda (praktiliselt) Seega, suurendades valimit saame suurendada
kigi ldkogumi liikmete kohta. Sel juhul oma ldistavate jrelduste tpsust.
rgitakse kiksest uuringust vi Kui tpseks me saame oma jreldustes minna?
juhtumianalsist, ning eeldades, et Kas me vime ldkogumi kohta vita midagi
andmekogumise meetodid on olnud sellised, JA 100% tenosusega?
mille puhul mtmisinstrumendist tingitud
juhusliku vea arvestamine ei ole thtis, vib EI
vajalike jrelduste tegemiseks piirduda
olemasolevaid andmeid kokkuvtvate Suurendades valimit saame suurendada oma
meetoditega. jrelduse tpsust, kuid me ei saa kunagi elda,
et ldkogumi parameeter on 100%-lise
kindlusega vrdne he konkreetse arvnitajaga.
Statistiline jreldamine on alati seotud statistilise
(Vlja arvatud juhul, kui me mdame kiki
e juhusliku veaga. Kas seda viga on vimalik ra
ldkogumi objekte.)
hoida vi krvaldada?
Parim, mis me teha saame, on vita, et
alamgrupi osakaal ldkogumis vi mistahes teine
Vimalikku juhuslikku viga statistilise jreldamise ldkogumi arvkarakteristik (nt ldkogumi
kigus ei suuda krvaldada kski valem ega keskvrtus) asub he vi teise tenosusega
statistiline meetod. Kll aga vimaldavad hes vi teises vrtuste vahemikus.
viimased meil seda viga hinnata - mta.
JTA
Valimilt ldkogumile jrelduste tegemise e ldistamise kigus tekkida viva juhusliku vea arvutamisel
tuleb lhtuda vastavatest valemitest, mis on vlja ttatud kigi philiste arvnitajate jaoks (s.h
MEELDE
alamgrupi osakaal, aritmeetiline keskmine, jne). Arvutusvalemiga mratud juhuslikku viga
Valemid ja matemaatiline taust on lahti seletatud jrgmiste materjalides:

K.Niglase loengumaterjalides lk.32-37
http://minitorn.tlu.ee/~katrin/cmsSimple/uploads/opmat/stat_loeng.pdf
K.Hiob Matemaatiline statistika Algkursus koolidele. Ptk. 2.12-2.14 ( lk.44-50)
3.2.5.* Vahemikhinnang valitud grupi osakaalu

kirjeldamiseks ldkogumis
Nide. Hindame pt.3.2 nites toodud andmete phjal, mitu protsenti ldkogumi liikmetest klastab
Facebooki lehte mitu korda pevas.
Mida me teame? Mida me tahame teada?

Facebooki klastab mitu korda pevas 347 e.
54,22% uuringus osalenud pilastest.
p=54,22% (vastava vrtuse osakaal valimis) Kui suur osa ldkogumi liikmetest klastab
N=640 (valimi suurus) Facebooki lehte mitu korda pevas?
Lahendus.
Rakendame reeglit:
95% tenosusega asub ldkogumi parameeter vahemikus: valimi arvnitaja vrtus 2 st.viga
St.viga%=
p(100 p)
N
Asendades valemis thistused konkreetsete vrtustega, saame, et st.viga %=
54,22(10054,22)
640
=
2482,19
640
=1,97
95% tenosusega jb ldkogumi osakaal vahemikku: 54,22% 21,97% e. 54,22% 3,94%
Arvutuste phjal saame jreldada, et nende pilaste osakaal kigi Eesti pilaste seas (e ldkogumis), kes
klastavad Facebooki lehte mitu korda pevas, jb 95% tenosusega vahemikku 50,3% ... 58,2%
lesanne. Leia kui suur osa Eesti pilastest ei klasta Facebooki lehte ldse. Snasta jreldus ja selgita
tulemust oma snadega.
lesanne. Kui kikidest Eesti koolidest valitud juhuvalimi uurimisel saadi teada, et likooli soovib edasi
ppima minna 46%. Millise hinnangu saab selle phjal anda ldkogumi vastavale osakaalule kui uuritud
valimi suurus oli 1500 pilast?
lesanne. 2006.a. lbiviidud uuringus Lapsed ja internet selgus, et uuritud 6-14.aastastest lastest on
interneti jututoas vi suhtlusprogrammis kontakti loonud vrastega kohtumas kinud 6% vastanutest.
Hinnake, kui suur osa Eesti 6.-14.aastastest lastest oli 2006.aasta seisuga vrastega kohtumas kinud,
kui on teada, et valimisse kuulus 145 pilast ja 2006.a. seisuga oli Eestis 122 985 6.-14.aastast last.
3.3 Teised hte tunnust puudutavad ksimused ja nendest

lhtuv anals.
Siiani vaatlesime pikalt vimalusi kuidas analsi lbi viia, et vastuseid saada Kui palju? ja Kui suur
osa? tpi ksimustele. Andmete analsimise kigus tekkib aga varem vi hiljem veel terve rida teisi
lihtsamaid ja keerulisemaid ksimusi. Keerulisemad ksimused puudutavad korraga mitut tunnust, kuid
jtkame hetkel veel lihtsamate, vaid hte tunnust puudutavate, ksimustega nagu niteks:
Mis on kige madalam ja kige Mis on mtmiste keskmine Kui sarnased vi erinevad on
krgem saadud tulemus? tase? saadud tulemused?
Kigile nendele ksimustele vastuse saamiseks on vlja ttatud matemaatilised algoritmid vi valemid,
mis olemasolevaid andmeid hel vi teisel viisil kokku vttes annavad tulemuseks andmete teatud
aspekti kirjeldava arvulise tulemuse. Viimaseid nimetatakse andmeanalsi kontekstis
ARVNITAJATEKS (vahel ka statistikuteks).
Suurem osa arvnitajatest on meldud kasutamiseks arvutunnuste korral, kuid leidub ka selliseid, mida
saab kasutada jrjestustunnuste vi koguni nimitunnuste puhul.
3.3.1. Keskmised
Nide. Mia otsustas 11.klassis sooritada keemia riigieksami ning kogus eelnevalt selle eksami kohta
informatsiooni 50-lt oma kooli abituriendilt, kes olid keemia riigieksami sooritanud. Muuseas ksis Mia
neilt riigieksamil saadud tulemust. Mia lootis, et eelmisel aastal koolikaaslaste poolt saadud
eksamitulemuste analsimine annab talle parema pildi tema enda vimalustest. Kuna Mia arvas, et tal
on keemias teistega vrreldes sna keskmine tase, tahtis ta kohe teada, mis oli eelmisel aastal eksami
sooritanute keskmine tulemus, aga pnev oli teada saada ka seda, kas keegi kukkus eksamil lbi vi mis
oli ldse kige madalam ja kige krgem saadud tulemus?
Mia oli koolikaaslastega vestlemise kigus kik 50 eksamitulemust jrjest paberile kirjutanud, kuid
niimoodi lbisegi olevast 50-st tulemusest oli vga raske midagi vlja lugeda.
Matemaatika petaja soovitas, et parema levaate saamiseks tulemuste jagunemisest, viks tulemused
jrjestada kasvamise vi kahanemise jrjekorda saades niimoodi VARIATSIOONIREA. Mia pusis tkk
aega kuid sai tulemused nnelikult kasvamise jrjekorda:
50 pilase eksamitulemused (VARIATSIOONIRIDA)

62 64 65 66 68 70 71 71 72 72
73 74 74 75 75 76 77 77 77 78
78 78 79 79 79 80 80 80 80 81
81 81 81 82 82 82 83 83 85 85
86 87 87 88 89 90 90 92 94 96
Prast tuli Mial phe, et seda jrjestamist saanuks veelgi mugavamalt teha, kui kik 50 tulemust Exceli
tlehel hte veergu e tunnusesse sisestada ja siis andmete sorteerimise funktsiooni kasutada!
Peale sorteerimist on lihtne nha, mis oli kige madalam ja kige krgem tulemus (ehk statistika
terminoloogias kasutades leida minimaalne ja maksimaalne vrtus): need olid vastavalt 62 ja 96
punkti.
Sellisest kasvavas jrjekorras antud vaatlustulemuste reast on kerge leida ka jaotuse keskel paiknevat
vrtust ehk MEDIAANI. Mediaan on selline vrtus, mis jagab vaatlustulemused kahte ossa nii, et
pooled vaatlustulemused on mediaanist viksemad ja pooled suuremad.
Nide. Kui meil on teada seitsme petaja kohta nende keskmine kontrolltde parandamise aeg ndalas
(tundides) ning ajad on jrjestatud kasvamise jrjekorda:
0 2 3 4 6 6 10
siis saame elda, et mediaan on 4 (tundi ndalas), sest vrtus 4 asub tulemuste rea keskel.
Kui meil on aga paaris arv vaatlustulemusi, siis ei saa me nende hulgast leida hte, millest oleks vrdne
arv viksemaid ja suuremaid vrtusi. Seeprast leitakse sel juhul vrtus, mis asub tpselt kahe
variatsioonireas keskel asuva vrtuse vahel.
***
Mia nites pilaste keemiaeksami tulemuste kohta on 25-es vrtus 79 ning 26-es 80. Et leida tpselt
79 80
79,5
2
nende vahel paiknevat vrtust, tuleb need vrtused kokku liita ning jagada kahega: .
Seega mediaaniks on 79,5 palli. Viimasest arvnitajast saame teha nd omakorda sisulise tlgenduse ja
elda, et poolte pilaste eksamitulemus ji alla 79,5 punkti ja pooltel pilastel oli see le 79,5 punkti.
Nide. Kasutame Mia kogutud andmeid (keemia.xlsx) ning arvutame eksamitulemuste mediaani Excelis.
Arvnitajate leidmiseks kasutame Exceli funktsioone (Formulas/Insert Function vi klpsate
valemirea alguses paiknevat funktsioonide nuppu)
Mediaani arvutamiseks valime funktsiooni MEDIAN ning sisestame andmepiirkonna (hiirega mrgistades.
Vastus ilmub andmetabelisse, valemireal jb

nhtavaks funktsioon, mida me kasutasime.
***
Mediaan on ks statistikas kasutatavaid keskmist tendentsi vljendavaid suurusi. Kuid mrksa

sagedamini kasutatakse ARITMEETILIST KESKMIST, mida tavaliselt kutsutakse lihtsalt keskmiseks vi
siis keskvrtuseks ja mille arvutusalgoritmiga oled tuttav matemaatika kursustest.
Tuletame selle algoritmi meelde: Aritmeetilise keskmise leidmiseks tuleb kik vaatlustulemused kokku liita
ning saadud summa jagada vaatlustulemuste arvuga. Leiame nd eelnevas nites toodud petajate
kontrolltde parandamise aja aritmeetilise keskmise:
0 2 3 4 6 6 10 31
x 4,4
7 7
tundi ndalas.
Kui meil on aga teada, et algandmetena kasutatud arvud ei olnud tpsed vaid mardatud vi
hinnangulised (st petajad ei pruugi kontrolltid parandada tpselt 2 vi 6 tundi vaid ligikaudu nii palju)
siis peame ka arvnitaja phjal jreldust tehes jma algandemete tpsuse tasemele ja tlema, et
keskmiselt parandavad petajad kontrolltid 4 kuni 5 tundi ndalas.
Nide. Kasutame taaskord Mia kogutud andmeid (keemia.xlsx) ning arvutame eksamitulemuste
keskvrtuse Excelis.
Keskvrtuse arvutamiseks kasutame funktsiooni

AVERAGE.
Keskmiseks eksamitulemuseks saame 79,1 punkti.
Vrreldes kahte erinevat keskmist tendentsi vljendavat suurust: mediaani ja aritmeetilist keskmist,
neme, et nad on keemaieksami tulemuste puhul natuke erinevad, kuid siiski kllalt sarnased. Vaatame
aga hte teist nidet:
Nide. Vaadake kahte alljrgnevat jaotust. Mlemas on toodud viie inimese kuupalgad:
I 800 1000 1400 1700 1900
II 700 1100 1300 1600 3900
Mediaanid kahes grupis on kllalt sarnased: I > 1400 , II > 1300 . Arvutades aga vlja keskvrtused
saame, et keskvrtus esimeses grupis on 1360 , mis on mediaaniga kllalt sarnane, kuid teises grupis
on keskvrtus 1720 , millest on kik peale he vrtuse madalamad.
Esimese grupi puhul saame me nii mediaani kui keskvrtuse abil ige ettekujutuse grupi liikmete
keskmisest palgast. Kuid kumb keskmistest annab parema ettekujutuse tavaprasest palga suurusjrgust
teises grupis?
Teises grupis tuleks keskmist tendentsi vljendava suurusena (keskvrtusele lisaks) kasutada mediaani,
sest keskvrtus on tugevalt mjutatud hest ebatpilisest, teistest vga erinevast vrtusest, mediaani
aga sellised ekstreemsed vrtused ei mjuta.
JTA
Kui me jrjestame tulemused kasvamise vi kahanemise jrjekorda saame variatsioonirea.

Mediaan on vrtus, mis jagab vaatlustulemused kahte ossa nii, et pooled vaatlustulemused on
mediaanist viksemad ja pooled suuremad.
MEELDE
Aritmeetilise keskmise (keskmise v keskvrtuse) leidmiseks tuleb kik vaatlustulemused kokku
lesanne. Tiina grupikaaslaste testitulemused olid jrgmised: 45 12 21 93 36 31 28

Leia testitulemuste mediaan ning selgita selle thendust. Leia ka keskvrus.
lesanne. Andrese grupikaaslaste eksamihindeid oli jrgmised: 1 2 2 3 3 5

Millised vited on iged?
a) Eksamihinnete mediaan on 2,5
b) Eksamihinnete mediaanid on 2 ja 3
lesanne. Millised vited on korrektsed?

a) Mediaan on alati reaalne vrtus uuritud valimi vrtuste hulgast
b) Mediaan vib olla ka selline vrtus, mida reaalsete vastuste hulgas ei esine
c) Keskvrtus on alati reaalne vrtus uuritud valimi vrtuste hulgast
d) Keskvrtus vib olla ka selline vrtus, mida reaalsete vastuste hulgas ei esine
lesanne. Tooge niteid andmetest, mille keskmise taseme kirjeldamiseks peaks lisaks keskvrtusele
kasutama ka mediaani.
lesanne. Tida jrgmine tabel, kirjutades igasse lahtrisse, kas seda arvnitajat on antud tunnuse korral
korrektne arvutada ja vimalik sisuliselt tlgendada vi mitte.
Tunnus Mediaan Keskvrtus
Sugu
Vanus
Sissetulek
(0-199, 200-399, 400-599, 600-799, 800 ja rohkem)
Kui thtis on riiete ostmisel kaubamrk?
(vga oluline, oluline, vhe oluline, ldse ei ole oluline)
Lemmik kaubamrk
lesanne. Kasutage andmestiku treening.xlsx andmeid ning leidke pilaste pikkuse ja kaalu keskvrtus
ja mediaan. Otsustage, milliseid arvnitajaid te antud tunnuste korral keskmise taseme kirjeldamiseks
kasutaksite. Phjendage vastust.
3.3.2. Vrtuste hajuvust kirjeldavad arvnitajad
Kuigi keskmised on kige tuntumad ja enamkasutatavad arvnitajad, ei anna ainult keskmise teadmine
meile andmete kohta tit pilti. Seetttu tuleb osata ksida ja analsida ka seda, kuivrd erinevad vi
sarnased on tulemused/vrtused omavahel.
Nide. Esimese klassi lapsevanematel paluti 7-palli ssteemis hinnata kuivrd thtsaks nad peavad
seda, et kool arendaks lastes jrgmisi vrtusi:
1) Kohuse- ja vastutustunne (viie lapsevanema vastused: 3 4 4 4 5 )

2) Aktiivsus, ettevtlikus (viie lapsevanema vastused: 1 2 3 7 7 )
Mlemal juhul saame keskmiseks thtsuse hinnanguks 4 palli, kuid ometi neme selgelt, et
lastevanemate arvamused nende kahe aspekti arendamise thtsuse osas ei ole tpselt hesugused:
kohuse- ja vastutustunde arendamise osas on lapsevanemad olnud suhteliselt ksmeelselt arvamusel, et
see on keskmise thtsusega, kuid aktiivsuse ja ettevtlikkuse arendamist on osad lastevanematest
pidanud vga thtsaks, teised jlle ldse mitte thtsaks st vastajate arvamused on olnud vga erinevad.
Sellist vrtuste omavahelise erinevuse mra nimetatakse statistikas HAJUVUSEKS. Hajuvus ongi
keskmise krval teine oluline andmete jaotust iseloomustav suurus.
lesanne Vrrelge kahte jrgnevat punkt-diagrammi, kus on kujutatud kahe erineva pilasterhma
testitulemused. Mis on teie arvates kige suurem erinevus nende kahe jaotuse vahel? Kas te oskate
elda, milline juba vaadeldud arvnitajatest aitab seda erinevust kirjeldada?
50 pilase testitulemused - GRUPP A
**
******
** ** ******* * * *
* *** * ************** ****** * * *
60 65 70 75 80 85 90 95 100
50 pilase testitulemused - GRUPP B

**
* ***
* ****** *
*****************
*******************
60 65 70 75 80 85 90 95 100
Diagrammidele peale vaadates vime kohe nha, et esimene jaotus on rohkem vlja venitatud st
testitulemused grupis A on rohkem hajunud kui grupis B. Jaotuse hajuvust saame kige lihtsamini
vljendada arvutades jaotuse ulatuse (suurima ja vhima vrtuse vahe). Meie nites:
grupis A on ulatus = 96 - 62 = 34 punkti
grupis B on ulatus = 88 - 70 = 18 punkti
Seega, saaksime ulatuse phjal ka siis, kui meil andmetest diagrammi tehtud ei ole, teha jrelduse, et
grupis B on tulemuste omavahelised erinevused e hajuvus palju viksem kui grupis A.
Ulatus on kige ldisem ja lihtsamini leitav hajuvuse nitaja, kuid tema suur puudus on selles, et ta sltub
ainult jaotuse kahest kige rmisest vrtusest, mis vivad aga mingil phjusel olla teistest vga
erinevad nn ekstreemsed vrtused (tuletage meelde nidet palkadest!). Seeprast on selle nitaja
usaldatavus grupi kui terviku iseloomustamisel vike ning teda kasutatakse vaid jaotusest kige ldisema
pildi saamiseks.
Kige sagedamini kasutatav hajuvuse nitaja on aga STANDARDHLVE. Nagu aritmeetiline keskmine,
nii vtab ka standardhlve arvesse kik vaatlustulemused.
Kui meie vaatlustulemused on kik hesugused (nt kik lapsevanemad hindasid mtlemisoskuse
arendamist kooli poolt vga thtsaks st valisid 7-palli skaalal vastuseks 7), siis andmetes hajuvust ei ole
ning mistahes hajuvuse nitaja peaks andma vastuseks 0. Tavaliselt on aga vaatlustulemused hajuvad
ning ksikud tulemused erinevad (hlbivad) keskvrtusest enamal vi vhemal mral. Standardhlve
ongi selline arvkarakteristik, mis vimaldab meil elda, kui palju ksikud tulemused grupi aritmeetilisest
keskmisest (keskmiselt) erinevad. Mida suurem on hajuvus, seda suuremad on erinevused ning seda
suurem on ka standardhlve.
Nide. Vaatame eelpool toodud nidet lapsevanemate hinnangutest. Kumba jaotuse puhul allolevatest on
teie arvates standardhlve suurem?
x4
1) Kohuse- ja vastutustunne (viie lapsevanema vastused: 3 4 4 4 5 )
x4
2) Aktiivsus, ettevtlikus (viie lapsevanema vastused: 1 2 3 7 7 )
Vrtused teises reas on rohkem hajunud (st. nad erinevad ehk hlbivad keskvrtusest rohkem) kui
esimeses reas. Seega vime arvata, et standardhlve on suurem teises reas olevate andmete puhul.
Arutluse kontrollimiseks sisestame hinnangud Exceli tabelisse ning arvutame mlema jaotuse
standardhlbed.
Funktsioon STDEV arvutab mrgistatud andmepiirkonna standardhlbe.
Nagu nha, on esimese jaotuse
standardhlve palju viksem kui teise
jaotuse puhul ning jb alla he palli, sest
le he palli ei erinenud selle jaotuse puhul
grupi keskmisest ju kellegi arvamus! Kui
meil oleks tegemist suurema hulga
andmetega (nt 68 lapsevanema arvamused),
siis andmetele peale vaatamine (nagu antud
vikeses nites) meile head levaadet vastuste hajuvusest ei annaks, kuid olles vlja arvutanud, et
vastuste standardhlve aktiivsuse ja ettevtlikkuse thtsuse hinnangute puhul on s = 2,8 palli ning
kohuse- ja vastutustunde thtsuse hinnangute puhul ainult s = 0,7 palli, saaksime kohe andmete kohta
teha jrelduse, et aktiivsuse ja ettevtlikkuse arendamise thtsuse osas lksid lastevanemate arvamused
omavahel lahku e anti vga erinevaid hinnanguid, aga kohuse- ja vastutustunde thtsust hindasid
lapsevanemad vga sarnaselt. Pane thele, et hajuvuse nitaja phjal ei saa teha jreldust selle kohta,
kumba hinnati thtsamaks; selleks on vaja teada ka keskmist!
JTA
Ulatus on kige lihtsamini leitav hajuvuse nitaja, kuid tema suur puudus on selles, et ta sltub ainult
jaotuse kahest kige rmisest vrtusest, mis vivad aga mingil phjusel olla teistest vga
erinevad.
MEELDE
Standardhlve on kige sagedamini kasutatav hajuvuse nitaja. Mida suuremad on vrtuste
lesanne. Kogutud andmete phjal arvutati meeste vanuse standardhlbe vrtuseks 12 ja naiste
vanuse standardhlbe vrtuseks 7. Milline vide on ige?
a) Mehed on vanemad
b) Naised on vanemad
c) Meeste vanused on rohkem koondunud mber oma grupi keskmise vanuse
d) Naiste vanused on rohkem koondunud mber oma grupi keskmise vanuse
lesanne. Kasutades andmestikku treening.xlsx tida jrgmises tabelis thjad lahtrid.

Arvnitaja Pikkus Kaal
Maksimaalne vrtus 198
Minimaalne vrtus 154 51
Ulatus
Keskvrtus
Mediaan 64
Standardhlve
lesanne. Vasta andmestiku treening.xlsx ning eelnevalt tidetud tabeli phjal jrgmistele ksimustele.
1 Kokku osales uuringus _______________ pilast.
2 pilaste keskmine kaal oli 64,3 kg ning mediaan 64 kg. Kuna mediaan ja keskvrtus on vga
__________________, vime jreldada, et jaotusel ei ole
_____________________________________ vrtuseid.
3 Pooled pilastest olid lhemad ja pooled pikemad kui __________________ cm.
4 Pikkuste jaotuse ulatus oli ____________cm. See thendab, et
________________________________
________________________________________________________________________________
__.
5 Kige lhem pilane kaalus __________________ kg. ja kige pikem __________________ kg.
6 Uuritud pilaste pikkuste standardhlve oli __________________ cm ning kaalude standardhlve
__________________ kg. Kirjeldades jaotuste standardhlbeid saame elda, et __________
________________________________________________________________________________.
3.3.3.* ldkogumi keskvrtuse vahemikhinnang
Nide. Vaatame taas ptk 3.2.4. ksitletud Liina uuringut kaalu langetamisest koolipilaste seas.
Uuritud pilaste pikkuse ja kaalu suhtest arvutati vlja KMI (kehamassiindeks) ning selle keskvrtus
valimis oli 21,55. Kas ja millise hinnangu saame selle valimi tulemuse phjal anda kigi Eesti pilaste KMI
kohta?
Soovides saadud keskmise phjal teha statistilist ldistust ldkogumile e kikidele Eesti pilastele,
peame silmas pidama, et see on korrektne ainult juhul kui valim esinduslik st on koostatud juhuslikkuse
phimttel, mis tagab, et igal Eesti kooli pilasel on olnud vrdne tenosus valimisse sattuda. Kui see
tingimus on tidetud kasutame ldkogumi keskvrtuse hindamiseks ptk. 3.2.4. esitatud mttekiku ning
reegleid:
99% tenosusega asub ldkogumi parameeter vahemikus: valimi arvnitaja vrtus 2,5 st.viga
Keskvrtuse standardviga arvutatakse valimi standardhlbe ja valimi suuruse phjal jrgmiselt:
s
st . viga x
= n
Mida me teame? Mida me tahame teada?

Kui suur on valimi KMI keskvrtus. Millisesse vahemikku jb ldkogumi e kigi
pilaste keskmine KMI?
N=114 (valimi suurus)
x =21,55 (valimi keskvrtus)
s=2,24 (valimi standardhlve)
Lahendus.
Rakendame reeglit:
95% tenosusega asub ldkogumi parameeter vahemikus: valimi parameeter 2 st.viga
s
st . viga x
= n
2,24 2,24
Asendades valemis thistused konkreetsete vrtustega, saame, et
st . viga x = =
117 10,82
=0,21
95% tenosusega jb ldkogumi keskmine vahemikku: valimi keskmine 2 st . viga x
95% tenosusega jb ldkogumi keskmine vahemikku: 21,55 2 0,21
95% tenosusega jb ldkogumi keskmine vahemikku: 21,55 0,42
95% tenosusega jb ldkogumi keskmine vahemikku: 21,13 ... 21,97
Seega, oleme vastanud ksimusele, millisesse vahemikku jb ldkogumi keskmine KMI ning vime
elda, et see keskmine asub 95%-lise tenosusega vahemikus 21,13 ... 21,97 ehk mardatult saame
elda, et Eesti pilaste KMI jb 21 ja 22 vahele.
lesanne. Arutle, mis juhtub vahemikuga, kuhu jb teatava tenosusega ldkogumi parameeter juhul
kui me suurendame valimi suurust? Kas see vahemik muutub laiemaks vi kitsamaks?
lesanne. 10-ndate klasside pilastest koostatud juhuvalimi keskmine matemaatika aastahinne oli 3,86.
Hinnete standardhlve oli 0,4 ja valimi suurus 2500. Arvuta, millisesse vahemikku jb kikide Eesti 10-
ndate klassi pilaste keskmine matemaatika aastahinne.
Nide. Kasutame andmestikku treening.xlsx ning arvutame, millisesse vahemikku jb ldkogumi

keskmine treeninguga tegelemise arv ndalas.
Esmalt arvutame valimi keskmise: 2,32
ldkogumi keskmise hinnangu leidmiseks kasutame Exceli funktsiooni CONFIDENCE.

Kui me soovime teha jreldust 95%-lise tenosusega, sisestame Alpha vljale 0,05.
Eelnevalt vlja arvutatud standardhlbe vrtuse sisestame Standard_dev vljale.
Size vljale sisestame valimi suuruse.
Saadud tulemuse phjal saame vlja kirjutada vastuse ksimusele: millisesse
vahemikku jb ldkogumi keskmine treeninguga tegelemise arv ndalas?
95% tenosusega jb ldkogumi keskmine vahemikku: 2,32 0,27
lesanne. Kasuta andmestikku pilased.xlsx ning leia, millisesse vahemikku jb ldkogumi e kikide
pilaste keskmine arvutikasutusaeg ndalas.
KORDA JA
ldkogumi all meldakse kiki juhtumeid vi situatsioone, mille kohta uurijad soovivad, et
nende poolt saadud jreldused, oletused vi prognoosid kehtiksid. Uurimiseks valitud
(suhteliselt vikest) objektide gruppi nimetatakse valimiks.
Selleks, et valim annaks ldkogumi kohta objektiivset ja usaldatavat informatsiooni, tuleb
JTA
Hiljem lisame!
3.4. Erinevuste anals.
3.4.1.
3.5. Seoste anals.

3.5.1.
3.6.* Kvalitatiivsete andmete anals ja tlgendamine.

3.6.1.

AKU pt2-3 2jaanuar

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

AKU pt2-3 2jaanuar

Enviado por

Direitos autorais:

Formatos disponíveis

Arvuti kasutamine uurimists (AKU)

Informaatika valikaine pik gmnaasiumile

1.1. Uurimist olemus

2. Andmete kogumine ja analsiks ettevalmistamine

Kesolevas peatkis leiame vastused ksimustele:

Kuidas andmeid koguda, et uurimist tulemused oleksid usaldusvrsed?

2.1. Andmete kogumise erinevad viisid

STRUKTUREERITUD andmekogumise meetodi STRUKTUREERIMATA andmekogumise tpilise

otsene loendamine ja mtmine

dokumenteerimine / koondandmete talletamine

struktureerimata e avatud, poolstruktureeritud ja struktureeritud intervjuud (suulised ksitlused)

struktureeritud ja poolstruktureeritud ankeedid (kirjalikud ksimustikud)

(standardiseeritud) vimekus ja sooritustestid

struktureerimata andmete kodeerimine kontentanals

Andmekogumise viisid: Mis eesmrgil oled Milliste uurimisteemadega

2.2. Ksimustiku koostamise ABC

Hea ksimustik on: Hoiduda tuleks sellistest ksimustest nagu:

Ksimuste/mdikute kavandamisel mtle ja otsi infot jrgneva kohta:

2.3. Veebiphise ksimustiku koostamine

Google Form on lihtne veebiphine ksitluste koostamise

Nimitunnused (nt rahvus: eestlane, venelane, soomlane, ...)

NB! Nimitunnusel ei ole vrtused heselt jrjestatavad, jrjestustunnusel on!

Jrjestustunnused (nt haridustase: algharidus, phiharidus, keskharidus, ...)

NB! Jrjestustunnusel ei ole vrtuste vahemikud vrdsed, intervalltunnusel on!

Intervalltunnused (s.h arvtunnused) (nt vanus: 27 a, 32 a, 51 a, ...)

Intervalltunnused vheste erinevate vrtustega

Mis tpi kooliga on tegu? (algkool, 9-klassiline kool, 12-klassiline kool)

2.5.* Uuritavate valimine andmete kogumiseks - valim ja ldkogum

Juhusliku valimi koostamine

lesanne. Vasta jrgmistele ksimustele:

Selleks, et tagada valimi esindamisvime on mitmeid vimalusi.

2.6.* Kvalitatiivsete e struktureerimata andmete kategoriseerimine

Professionaalid vldivad andmete sisestamist tekstidena ning kasutavad selle asemel

1. Sugu: mees naine 6. Tegevusala: (mrgi kik sobivad vastused)

2.8. Andmete korrastamine

lesanne: Mtle ja arutle, mis vivad olla valede analsitulemuste phjusteks?

Nide. Kontrollime andmestiku ess.xlsx (Euroopa Sotsiaaluuringu andmestik) sisestusvigade suhtes

Lisame filtreerimise valiknupu Data/Sort&Filter/Filter

Kikide meie andmestiku tunnuste pistesse ilmusid valiknupud.

Andmesisestusel on mnel korral eksitud vrtuse Phjaeesti

Eemaldame selekteeringu (Select All) ning valime ainult vrtuse,

Lisaks vrtuste loendile pakub fitreerimine ka andmetabeli

Samaaegselt saab mrata mitu tingimust.

Numbrilise tunnuse filtreerimisel pakub numbrifilter (Number Filters) veelgi

Pane thele, et filtri kasutamise tagajrjel kuvatavad

Andmestiku all on ra toodud objektide arv, kui palju

lesanne*. (Eeldab, et andmestikus on sisestusvead parandatud ning sobivad andmed koondatud)

a) ...on alla 65 aastased pensionrid

Kesolevas peatkis leiame vastused ksimustele:

3.1. Andmete analsimise phisammud

3.2. Ksimustest Kui palju ? ja Kui suur osa ? lhtuv

lesanne. Koosta antud teema kohta veel ks samalaadi ksimus

Tabel 1. Facebooki portaali klastuste sagedus.

Vastajate arv Osakaal

Nide. Vaatame internetikasutuse osakaalusid 2008.aastal erinevates riikides 6.-17.aastaste

Kui viid tunnuse FACEBOOK Column vljale, saad

Selleks, et vrtuste esinemissagedused kokku loendatakse, vii

Protsentide lisamiseks tabelisse vii

OLULINE VAHETERA I - Analsi tulemuste esitlemisest

Statistilisi andmeid ja statistilise andme-analsi arvulisi tulemusi saab esitada:

ldjuhul vali esitluseks:

olen osalenud heategevuses; 87%

Joonis 1. Heategevuses osalemine (2008.a.).