Você está na página 1de 7

Analisis regresi linier dalam SPSS

This example is based on the FBI's 2006 crime statistics. Contoh ini didasarkan pada 2006,
FBI statistik kejahatan. Particularly we are interested in the relationship between size of the
state, various property crime rates and the number of murders in the city. Terutama kita
tertarik dalam hubungan antara ukuran negara, tingkat kejahatan dan berbagai properti
jumlah pembunuhan di kota itu. It is our hypothesis that less violent crimes open the door
to violent crimes and also that even we account for some effect of the city size by
comparing crime rates per 100,000 inhabitants that there still is an effect left. Ini adalah
hipotesis kami bahwa kejahatan kekerasan kurang terbuka pintu untuk kejahatan kekerasan
dan juga bahwa bahkan kita account untuk beberapa efek dari luas kota dengan
membandingkan tingkat kejahatan per 100.000 penduduk yang masih ada efek kiri.

First we need to check whether there is a linear relationship between the independent
variables and the dependent variable in our multiple linear regression model. Pertama kita
perlu memeriksa apakah ada hubungan linier antara variabel independen dan variabel
dependen dalam kita linier regresi berganda model. We check the scatter plots. Kami
memeriksa scatter plot. The scatter plots indicate a good linear relationship between murder
rate and burglary and motor vehicle theft rates, and only weak relationships between
population and larceny. The scatter plot menunjukkan hubungan linear yang baik antara
tingkat pembunuhan dan perampokan dan tingkat pencurian kendaraan bermotor, dan
hanya hubungan yang lemah antara populasi dan pencurian.

Secondly we need to check for multivariate normality. Kedua kita perlu untuk memeriksa
normalitas multivariat. In our example we find that multivariate normality might not be
present in the population data (which is not surprising since we truncated variability by
selecting the 70 biggest cities to begin with). Dalam contoh kita kita menemukan bahwa
normalitas multivariat mungkin tidak hadir di data kependudukan (yang tidak mengejutkan
karena kita terpotong variabilitas dengan memilih 70 kota terbesar untuk memulai dengan).
We will ignore this violation of the assumption, and conduct the multiple linear regression
analysis. Kami akan mengabaikan pelanggaran asumsi ini, dan melakukan analisis regresi
linier berganda. Multiple linear regression is found in SPSS in
Analyze/Regression/Linear… Regresi linier ditemukan di SPSS di Menganalisis / Regresi /
Linier ...

In our example we need to enter the variable murder rate as the dependent variable to our
multiple linear regression model and the population, burglary, larceny, vehicle theft as
independent variables. Dalam contoh kita kita harus memasukkan tingkat pembunuhan
variabel sebagai variabel tergantung untuk model regresi linier dan penduduk, perampokan,
pencurian, pencurian kendaraan sebagai variabel independen. We also select stepwise as
the method. Kami juga memilih bertahap sebagai metode. The default method for the
multiple linear regression analysis is 'Enter', that means that all variables are forced to be in
the model. Metode standar untuk analisis regresi linier berganda adalah 'Enter', yang berarti
bahwa semua variabel yang terpaksa dalam model. But since over fitting is a concern of
ours, we want only the variables in the model that explain additional variance. Tapi karena
lebih pas adalah perhatian kita, kita ingin hanya variabel dalam model yang menjelaskan
varians tambahan.

In the field options we can set the stepwise criteria. Dalam opsi bidang kita dapat mengatur
kriteria stepwise. We want to include variables in our multiple linear regression model that
increase F by at least 0.05 and we want to exclude them if the increase F by less than 0.1.
Kami ingin memasukkan variabel dalam model regresi linier kami yang meningkatkan F
oleh setidaknya 0,05 dan kita ingin mengecualikan mereka jika F meningkat kurang dari
0,1.
The field statistics allows us to include additional statistics that we need to assess the
validity of our linear regression analysis. Statistik lapangan memungkinkan kita untuk
memasukkan statistik tambahan yang kita butuhkan untuk menilai validitas analisis regresi
linier kami.

It is advisable to additionally include the collinearity diagnostics and the Durbin-Watson


test for autocorrelation. Dianjurkan untuk tambahan mencakup diagnostik collinearity dan
uji Durbin-Watson untuk autokorelasi. To test the assumption of homoscedasticity and
normality of residuals we also include a special plot in the Plots menu. Untuk menguji
asumsi normalitas homoscedasticity dan residu kami juga termasuk plot khusus di menu
Plot.

The first table tells us the variables in our analysis. Tabel pertama memberitahu kita
variabel dalam analisis kami. Turns out that only motor vehicle theft is useful to predict the
murder rate. Ternyata bahwa pencurian kendaraan bermotor hanya berguna untuk
memprediksi tingkat pembunuhan.

The next table shows the multiple linear regression model summary and overall fit
statistics. Tabel berikut menunjukkan ringkasan model regresi linier berganda dan statistik
cocok secara keseluruhan. We find that the adjusted R² of our model is 0.398 with the R²
= .407 that means that the linear regression explains 40.7% of the variance in the data.
Kami menemukan bahwa adjusted R ² model kita adalah 0,398 dengan R ² = 0,407 yang
berarti bahwa regresi linier menjelaskan 40,7% dari varians dalam data. The Durbin-
Watson d = 2.074, which is between the two critical values of 1.5 < d < 2.5 and therefore
we can assume that there is no first order linear autocorrelation in our multiple linear
regression data. The Durbin-Watson d = 2,074, yaitu antara dua nilai kritis dari 1,5 <d <2,5
dan karena itu kita bisa berasumsi bahwa tidak ada autokorelasi urutan pertama linier dalam
data kami regresi linier berganda.

If we would have forced all variables (Method: Enter) into the linear regression model we
would have seen a little higher R² and adjusted R² (viz. 0.424 and .458). Jika kita akan
memaksa semua variabel (Metode: Masukkan) ke dalam model regresi linier kita akan
melihat sedikit lebih tinggi dan disesuaikan R ² R ² (yakni 0,424 dan 0,458).

The next table is the F-test , the linear regression's F-test has the null hypothesis that there
is no linear relationship between the variables (in other words R²=0). Tabel berikutnya
adalah F-test , regresi linier's F-test memiliki hipotesis nol bahwa tidak ada hubungan linear
antara variabel-variabel (dengan kata lain R ² = 0). The F-test is highly significant, thus we
can assume that there is a linear relationship between the variables in our model. F-test
sangat penting, sehingga kita dapat mengasumsikan bahwa ada hubungan linear antara
variabel-variabel dalam model kami.
The next table shows the multiple linear regression estimates including the intercept and the
significance levels. Tabel berikut menunjukkan perkiraan regresi linier berganda termasuk
mencegat dan tingkat signifikansi.

In our stepwise multiple linear regression analysis we find a non-significant intercept but
highly significant vehicle theft coefficient, which we can interpret as for every 100 vehicle
thefts per 100,000 inhabitants we will see 2 additional murders per 100,000. Dalam analisis
regresi linier berganda kita kita menemukan intercept yang tidak bermakna tapi sangat
pencurian kendaraan signifikan koefisien, yang kita dapat menafsirkan sebagai untuk setiap
100 pencurian kendaraan per 100.000 penduduk kita akan melihat 2 pembunuhan tambahan
per 100.000.

If we force all variables into the multiple linear regression the Beta weights and collinearity
are interesting. Jika kita memaksa semua variabel dalam regresi linier berganda bobot Beta
dan collinearity yang menarik. Beta expresses the relative importance of each independent
variables in standardized terms. Beta mengungkapkan kepentingan relatif dari setiap
variabel independen dalam hal standar. Firstly we find that only burglary and motor vehicle
theft are significant predictors, secondly we find that motor vehicle theft has a higher
impact than burglary (beta = .507 and beta = .333). Pertama kita menemukan bahwa hanya
perampokan dan pencurian kendaraan bermotor adalah penaksir signifikan, kedua kita
menemukan bahwa pencurian kendaraan bermotor memiliki dampak yang lebih tinggi dari
pencurian (beta = 0,507 dan beta = 0,333).

This table also checks for multicollinearity in our multiple linear regression model. Tabel
ini juga memeriksa multikolinearitas dalam model regresi linier kami. Tolerance should be
> 0.1 (or VIF < 10) for all variables, which they are. Toleransi harus> 0,1 (atau VIF <10)
untuk semua variabel, yang mereka.

As the Goldfeld-Quandt test is not supported in SPSS we check is the homoscedasticity and
normality of residuals with the QQ-Plot of z*pred and z*presid. Sebagai uji Goldfeld-
Quandt tidak didukung di SPSS kita cek adalah homoscedasticity dan normalitas residu
dengan QQ-Plot z * pred dan presid * z. The plot indicates that in our multiple linear
regression analysis there is no tendency in the error terms. plot menunjukkan bahwa dalam
analisis regresi linier kita tidak ada kecenderungan dalam istilah kesalahan. If that happens
you see a graph that looks like a staircase. Jika itu terjadi Anda melihat grafik yang terlihat
seperti tangga.
Related Pages Halaman Terkait
 SPSS Modules Modul SPSS
 F-Test F-Test
 Selection Process for Multiple Regression Seleksi Proses Multiple Regresi
 Stepwise Regression Stepwise Regresi

Você também pode gostar