Você está na página 1de 49

ANALISIS DATA

dr. Novita Hasiani Simanjuntak, MARS


Tujuan Analisis data
a. Memperoleh gambaran/deskripsi masing-masing variabel
b. Membandingkan dan menguji teori atau konsep dengan informasi
yang ditemukan
c. Menemukan adanya konsep baru dari data yang dikumpulkan
d. Mencari penjelasan apakah konsep baru yang diuji berlaku umum
atau hanya berlaku pada kondisi tertentu

2
Analisis suatu penelitian akan dilakukan
tergantung dari:
a. Jenis penelitian
b. Jenis sampel
c. Jenis data/variabel
d. Asumsi kenormalan distribusi data

3
a. Jenis Penelitian
Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata)
pendapat masyarakat akan suatu hal tertentu, maka pengumpulan
data dilakukan dengan survei. Dari kasus ini maka dapat dilakukan
analisis data dengan pendekatan kuantitatif.
Bila kita diinginkan untuk mendapatkan pendapat/gambaran yang
mendalam tentang suatu fenomena, maka data dapat dikumpulkan
dengan fokus grup diskusi atau observasi, maka analisisnya
menggunakan pendekatan analisis kualitatif

4
b. Jenis Sampel
Analisis sangat tergantung pada jenis sampel yang
dibandingkan, apakah kedua sampel independen atau
dependen.
Misalnya pada penelitian survei yang tidak menggunakan
sampel yang sama, dapat digunakan uji statistik yang
mengasumsikan sampel yang independen.
Misalkan survei untuk mengetahui apakah ada perbedaan
berat badan bayi antara bayi-bayi yang dilahirkan dari ibu
perokok dengan bayi-bayi dari ibu yang tidak merokok. Disini
berarti kelompok ibu perokok dan kelompok ibu bukan perokok
bersifat independen.

5
b. Jenis Sampel
Untuk penelitian eksperimen yang sifatnya pre dan post
(sebelum dan sesudah adanya perlakuan tertentu dilakukan
pengukuran) maka uji yang digunakan adalah uji statistik utnuk
data yang dependen.
Misalnya, suatu penelitian ingin mengetahui pengaruh
penelitian manajemen terhadap kinerja petugas kesehatan.
Pertanyaan penelitiannya Apakah ada perbedaan kinerja
petugas kesehatan antara sebelum dan sesudah
mendapatkan pelatihan manajemen?.
Dalam penelitian ini sampel kelompok petugas kesehatan
bersifat dependen, karena pada kelompok (orang) yang sama
diukur dua kali yaitu pada saat sebelum pelatihan (pre test)
dan sesudah dilakukan pelatihan (Post Test).

6
c. Jenis Data/Variabel
Data dengan jenis katagori berbeda cara analisisnya dengan
data jenis numerik.
Beberapa pengukuran/uji statistik hanya cocok untuk jenis
data tertentu.
Sebagai contoh, nilai proporsi/persentase (pada analisis
univariat) biasanya cocok untuk menjelaskan data berjenis
katagorik, sedangkan untuk data jenis numerik biasanya dapat
menggunakan nilai rata-rata untuk menjelaskan
karakteristiknya.
Untuk analisis hubungan dua variabel (analsis bivariat), uji kai
kuadrat hanya dapat dipakai untuk mengetahui hubungan data
katagori dengan data katagori.
Sebaliknya untuk mengetahui hubungan numerik dengan
numerik digunakan uji korelasi/regresi.
7
d. Asumsi Kenormalan
Jenis analisis yang akan dilakukan sangat tergantung dari
bentuk distribusi datanya.
Bila distribusi datanya tidak normal, maka sebaiknya
digunakan prosedur uji statitik nonparametrik.
Sedangkan bila asumsi kenormalan dapat dipenuhi maka
dapat digunakan uji statistik parametrik.

8
ANALISIS UNIVARIAT
Tujuan :menjelaskan/mendeskriptifkan karakteristik masing-masing
variabel yang diteliti.
Fungsi analisis adalah menyederhanakan atau meringkas kumpulan
data hasil pengukuran sedemikian rupa sehingga kumpulan data
tersebut berubah menjadi informasi yang berguna.
Peringkasan tersebut berupa ukuran-ukuran statistik, tabel dan juga
grafik.

9
1. Peringkasan Data Untuk Data Jenis Numerik

a. Ukuran Tengah
Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai
hasil pengukuran.
Berbagai ukuran dikembangkan untuk mencerminkan ukuran
tengah tersebut, dan yang paling sering dipakai adalah mean,
median dan mode/modus.

10
Mean
Mean/average adalah ukuran rata-rata yang merupakan hasil
dari jumlah semua nilai pengukuran dibagi oleh banyaknya
pengukuran
Keuntungan nilai mean adalah mudah menghitungnyadan
sudah melibatkan seluruh data dalam penghitungannya.
Kelemahan dari nilai mean adalah sangat dipengaruhi oleh
nilai ekstrim, baik ekstrim tinggi maupun rendah. Oleh karena
itu pada kelompok data yang ada nilai ekstrimnya (sering
dikenal dengan distribusi data yang menceng/miring),
Mean tidak dapat mewakili rata-rata kumpulan nilai
pengamatan.

11
Median
Median adalah nilai dimana setengah banyaknya pengamatan
mempunyai nilai di bawahnya dan setengahnya lagi
mempunyai nilai di atasnya.
Berbeda dengan nilai mean, penghitungan median hanya
mempertimbangkan urutan nilai dari hasil pengukuran, besar
beda antar nilai di abaikan
Median tidak dipengaruhi oleh nilai ekstrim
Prosedur penghitungan median melalui langkah
a). Data diurutkan/di-array dari nilai kecil ke besar
b). Hitung posisi median dengan rumus (n+1)/2
c). Hitung nilai mediannya
12
Mode/Modus
Mode adalah nilai pengamatan yang mempunyai
frekuensi/jumlah terbanyak.
Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20
th, 23th, 20 th.
Dari data tersebut berarti mode-nya adalah 20 tahun

13
Ukuran Variasi
Nilai-nilai hasil pengamatan akan cenderung saling berbeda
satu sama lain atau dengan kata lain hasil pengamatan akan
bervariasi.
Untuk mengetahui seberapa jauh data bervariasi digunakan
ukuran variasi antara lain:
Range
Jarak linier kuartil
Standard deviasi

14
1). Range
Range merupakan ukuran variasi yang paling dasar, dihitung
dari selisih nilai terbesar dengan nilai terkecil. Kelemahan
range adalah dipengaruhi nilai ekstrim. Keuntungan
penghitungan dapat dilakukan dengan cepat.
2). Jarak Inter Quartil
Nilai observasi disusun berurutan dari nilai ke cil ke besar,
kemudian ditentukan kuartil bawah dan atas.
Kuartil merupakan pembagian data menjadi 4 bagian yang
dibatasi oleh tiga ukuran kuartil, yaitu :
kuartil I, kuartil II dan kuartil III.

15
Kuartil I mencakup 25% data berada di bawahnya dan 75%
data berada di atasnya.
Kuartil II (median) mencakup 50% data berada di bawahnya
dan 50% data berada di atasnya.
Kuartil III mencakup 75% data berada di bawahnya dan 25%
data berada di atasnya.
Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I.
Ukuran ini lebih baik dari range, terutama kalau frekuensi
pengamatan banyak dan distribusi sangat menyebar.

16
Standard Deviasi

Standard Deviasi merupakan akar dari varian:


Seperti halnya varian, semakin besar SD semakin besar
variasinya.
Apabila tidak ada variasi, maka SD=0

17
Peringkasan Data Katagorik

Pada data katagorik peringkasan data hanya menggunakan


distribusi frekuensi dengan ukuran persentase atau proporsi.
Bila data berjenis katagorik, tentunya informasi/peringkasan
yang penting disampaikan tidak mungkin/tidak lazim
menggunakan ukuran mean atau median. melainkan informasi
jumlah dan persentase yang disajikan.

18
Bentuk Penyajian Data

Bentuk penyajian analisis univariat dapat berupa tabel atau


grafik.
Namun perlu diingat bahwa kita dianjurkan hanya memilih
salah satu, tidak diperkenankan secara sekaligus
menggunakan tabel dan juga grafik dalam menyampaikan
informasi suatu data/variabel.

19
Contoh penyajian analisis deskriptif

20
21
ANALISIS BIVARIAT

Kegunaan analisis bivariat bisa untuk mengetahui apakah ada


hubungan yang siginifikan antara dua variabel, atau bisa juga
digunakan untuk mengetahui apakah ada perbedaan yang
signifikan antara dua atau lebih kelompok(sampel).

22
23
Berdasarkan karakteristik data tersebut maka uji beda dua mean
dibagi dalam dua kelompok, yaitu:
1. uji beda mean independen (uji T independen)
2. uji beda mean dependen (uji T dependen).

24
Uji Beda Dua Mean Independen
Tujuan: untuk mengetahui perbedaan mean dua dua kelompok
data independen,
syarat yang harus dipenuhi:
a. Data berdistribusi normal/simetris.
b. Kedua kelompok data independen.
c. Variabel yang dihubungkan berbentuk numerik dan katagorik
(ket: variabel katagorik hanya dengan dua kelompok).

25
Uji Beda Dua Mean Dependen (Paired Sample)

Tujuan : Untuk menguji perbedaan mean anatara dua kelompok


data yang dependen. Contoh kasus:
Apakah ada perbedaan tingkat pengetahuan antara sebelum
dan sesudah dilakukan pelatihan.
Apakah ada perbedaan berat badan antara sebelum dan
sesudah mengikuti program diet.

26
Uji Beda Dua Mean Dependen (Paired Sample)

Syarat :
a. Distribusi data normal
b. Kedua kelompok data dependen/pair
c. Jenis variabel: numerik dan katagorik (dua kelompok)

27
Uji Anova
Prinsip uji ANOVA adalah melakukan telaah variabilitas data
menjadi dua sumber variasi yaitu variasi dalam kelompok
(within) dan variasi antar kelompok (between).
Bila variasi within dan between sama (nilai perbandingan
kedua varian sama dengan 1) maka mean-mean yang
dibandingkan tidak ada perbedaan, sebaliknya bila hasil
perbandingan tersebut menghasilkan lebih dari 1, maka mean
yang dibandingkan menunjuk ada perbedaan.

28
Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah:
1. Varian homogen
2. Sampel/kelompok independen
3. Data berdistribusi normal
4. Jenis data yang dihubungkan adalah : Numerik dengan
katagori (untuk katagori yang lebih dari 2 kelompok.

29
Analisis Multi Comparison (POSTHOC TEST)
Analisis ini bertujuan untuk mengetahui lebih lanjut kelompok
mana saja yang berbeda mean-nya bilamana pada pengujian
ANOVA dihasilkan ada perbedaan yang bermakna (Ho ditolak).
Ada berbagai jenis analisis multiple comparasion diantaranya
adalah Bonferroni, Honestly Significant different (HSD),
Scheffe dan lain-lain

30
UJI KAI KUADRAT (Chi Square)
Analisis ini bertujuan untuk menguji perbedaan proporsi dua
atau lebih kelompok sampel
Dilihat dari segi datanya uji kai kuadrat dapat digunakan untuk
mengetahui hubungan antara variabel katagorik dengan
variabel katagorik.

31
Contoh pertanyaan penelitian untuk kasus yang dapat
dipecahkan oleh uji kai kuadrat misalnya:

Apakah ada perbedaan kejadian hipertensi antara


wanita dan pria.
Kasus ini berarti akan menguji hubungan variabel
hipertensi (katagori dengan klasifikasi ya dan tidak)
dengan variabel jenis kelamin (katagori dengan
klasifikasi wanita dan pria)

Apakah ada perbedaan kejadian anemia antara ibu


yang kondisi soseknya tinggi, sedang dan rendah.
Pada kasus ini akan menguji hubungan variabel
anemia katagori dengan klasifikasi ya dan tidak)
dengan variabel Sosek (katagori dengan klasifikasi
rendah, sedang dan tinggi).
Prinsip dasar Uji Kai Kuadrat

Proses pengujian kai kuadrat adalah membandingkan


frekuensi yang terjadi (observasi) dengan frekuensi harapan
(ekspektasi).
Bila nilai frekuensi observasi dengan nilai frekuensi harapan
sama, maka dikatakan tidak ada perbedaan yang bermakna
(signifikan).
Sebaliknya, bila nilai frekuensi observasi dan nilai frekuensi
harapan berbeda, maka dikatakan ada perbedaan yang
bermakna (signifikan).

33
Pembuktian dengan uji kai kuadrat dengan menggunakan
formula:

df = (k-1)(n-1)
ket :
O = nilai observasi
E = nilai ekspektasi (harapan)
k = jumlah kolom
b = jumlah baris

34
Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel
disajikan dalam bentuk tabel silang:

35
Contoh
untuk mencari nilai ekspektasi (E) untuk sel a adalah:
+ + ( + )
=

Untuk Eb, Ec dan Ed dapat dicari dengan cara yang sama.
Khususnya untuk tabel 2x2, dapat mencari nilai X2 dengan
menggunakan rumus:

36
Uji kai kuadrat sangat baik untuk tabel dengan derajat
kebebasan (df) yang besar. Sedangkan khusus untuk tabel 2 x
2 (df-nya adalah 1) sebaiknya digunakan uji kai kuadrat yang
sudah dikoreksi (Yate Corrected atau Yates Correction).
Keterbatasan Kai Kuadrat
Tidak boleh ada sel yang mempunyai nilai harapan (nilai E)
kurang dari 1.
Tidak boleh ada sel yang mempunyai nilai harapan (nilai E)
kurang dari 5, lebih dari 20% dari jumlah sel.

37
Jika keterbatasan tersebut terjadi pada saat uji kai kuadrat,
peneliti harus menggabungkan katagori-katagori yang
berdekatan dalam rangka memperbesar frekuensi harapan
dari sel-sel tersebut (penggabungan ini dapat dilakukan untuk
analisis tabel silang lebih dari 2 x 2, misalnya 3 x 2, 3 x 4 dsb).
Penggabungan ini tentunya diharapkan tidak sampai membuat
datanya kehilangan makna.
Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini
berarti tidak
bisa menggabung katagori-katagorinya lagi), maka dianjurkan
menggunakan uji Fishers Exact.

38
UJI KORELASI DAN REGRESI LINIER SEDERHANA
Hubungan antara dua variabel numerik dapat dihasilkan dua
jenis, yaitu derajat/keeratan hubungan, digunakan korelasi.
Sedangkan bila ingin mengetahui bentuk hubungan antara dua
variabel digunakan analisis regresi linier.

39
Korelasi

Korelasi di samping dapat untuk mengetahui derajat/keeratan


hubungan, korelasi dapat juga untuk mengetahui arah
hubungan dua variabel numerik.
Misalnya, apakah huubungan berat badan dan tekanan darah
mempunyai derajat yang kuat atau lemah, dan juga apakah
kedua variabel tersebut berpola positif atau negatif.

40
Secara sederhana atau secara visual hubungan dua variabel
dapat dilihat dari diagram tebar/pencar (Scatter Plot).
Diagram tebar adalah grafik yang menunjukkan titik-titik
perpotongan nilai data dari dua variabel (X dan Y).
Pada umumnya dalam grafik, variabel independen (X)
diletakkan pada garis horizontal sedangkan variabel dependen
(Y) pada garis vertikal.
Dari diagram tebar dapat diperoleh informasi tentang pola
hubungan antara dua variabel X dan Y.
Selain memberi informasi pola hubungan dari kedua variabel
diagram tebar juga dapat menggambarkan keeratan hubungan
dari kedua variabel tersebut

41
42
Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai
arahnya nilainya antara 1 s.d. +1.
r=0 tidak ada hubungan linier
r = -1 hubungan linier negatif sempurna
r = +1 hubungan linier positif sempurna

Hubungan dua variabel dapat berpola positif maupun negatif.


Hubungan positif terjadi bila kenaikan satu diikuti kenaikan
variabel yang lain, misalnya semakin bertambah berat
badannya (semakin gemuk) semakin tinggi tekanan darahnya.
Sedangkan hubungan negatif dapat terjadi bila kenaikan satu
variabel diikuti penurunan variabel yang lain, misalnya
semakin bertambah umur (semakin tua) semakin rendah kadar
Hb-nya.

43
Menurut Colton, kekuatan hubungan dua variabel secara
kualitatif dapat dibagi dalam 4 area, yaitu:
r = 0 - 0.25 tidak ada hubungan/lemah
r= 0.26 0.5 hubungan sedang
r = 0.51 0.75 hubungan kuat
r = 0.76 1 hubungan sangat kuat/sempurna

44
Uji Hipotesis
Koefisien korelasi yang telah dihasilkan merupakan langkah
pertama untuk menjelaskan derajat hubungan derajat
hubungan linier anatara dua variabel.
Selanjutnya perlu dilakukan uji hipotesis untuk mengetahui
apakah hubungan antara dua variabelteradi secara signifikan
atau hanya karena faktor kebetulan dari random sample (by
chance).
Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama:
membandingkan nilai r hitung dengan r tabel, kedua:
menggunakan pengujian dengan pendekatan distribusi t.

45
Regresi Linier Sederhana
Analisis regresi merupakan suatu model matematis yang dapat
digunakan untuk mengetahui bentuk hubungan antar dua atau
lebih variabel.
Tujuan analisis regresi adalah untuk membuat perkiraan
(prediksi) nilai suatu variabel (variabel dependen) melalui
variabel yang lain (variabel independen).
Sebagai contoh kita ingin menghuubungkan dua variabel
numerik berat badan dan tekanan darah. Dalam kasus ini
berarti berat badan sebagai variabel independen dan tekanan
darah sebagai variabel dependen, sehingga dengan regresi
kita dapat memperkirakan besarnya nilai tekanan darah bila
diketahui data berat badan.

46
Untuk melakukan prediksi digunakan persamaan garis yang
dapat diperoleh dengan berbagai cara/metode.
Salah satu cara yang sering digunakan oleh peneliti adalah
dengan menggunakan metode kuadrat terkecil (leastsquare).
Metode least square merupakan suatu metode pembuatan
garis regresi dengan cara meminimalkan jumlah kuadrat jarak
antara nilai Y yang teramati dan Y yang diramalkan oleh garis
regresi itu.
Secara matematis persamaan garis sbb:
y = a + bx + e

47
Koefisien Determinasi (R2)
Ukuran yang penting dan sering digunakan dalam
analisisregresi adalah koefisien determinasi atau disimbolkan
R2 (R Square).
Koefisien determinasi dapat dihitung dengan mengkuadratkan
nilai r, atau dengan formula R2 = r2.
Koeifisien determinasi berguna untuk mengetahui seberapa
besar variasi variabel dependen (Y) dapat dijelaskan oleh
variabel independen (X). atau dengan kata lain R2
menunjukkan seberapa jauh variabel independen dapat
memprediksi variabel dependen.
Semakin besar nilai R square semakin baik/semakin tepat
variabel independen memprediksi variabel dependen.
Besarnya nialai R square antara 0 s.d. 1 atau antara 0% s.d.
100%.

48
Selesai

Você também pode gostar