Sebenarnya sudah ada postingan tentang uji asumsi klasik
dalam web ini bahkan merupakan artikel yang paling populer. Artikel ini
hanya untuk melengkapi saja tulisan tersebut dengan melengkapinya. Uji
asumsi klasik merupakan terjemahan dari clasical linear regression model
(CLRM) yang merupakan asumsi yang diperlukan dalam analisis regresi linear
dengan ordinary least square (OLS). Sebagai informasi, semua ini berkat
kejeniusan seorang matematikawan Jerman bernama Carl Friedrich Gauss.
CLRM juga sering disebut dengan The Gaussian Standard, yang sebenarnya
terdiri dari 10 item. Akan tetapi, yang sering kita jumpai dalam
berbagai penelitian, atau berbagai buku statistik terapan mungkin hanya 4
atau 5 saja. Mengapa? Berikut sedikit uraian tentang 10 item tersebut.
1. Asumsi 1: Linear Regression Model.
Model regresi haruslah linear, meskipun bisa saja sebenarnya variabel
terikat Y dengan variabel bebas X tidak linear. Istilah linear
sebenarnya ada dua macam, yaitu linearitas pada variabel dan linearitas
pada parameter. Yang disebut dengan linearitas pada variabel adalah jika
digambarkan dalam grafik maka akan berbentuk garis lurus. Misalnya
persamaan Y = a + bX. Seandainya persamaannya adalah Y = a + b X^2 maka
disebut tidak linear, karena jika digambarkan dalam grafik tidak
membentuk garis lurus. Atau secara umum dapat dikatakan jika X mempunyai
pangkat 1. Sedangkan linearitas pada parameter adalah merujuk kepada
koefisiennya yaitu b. Jadi persamaan Y = a + b X^2 dapat disebut linear
jika koefisien b mempunyai pangkat 1. Asumsi yang diperlukan dalam
regresi linear adalah linearitas pada parameter, bukan linearitas pada
variabel.
Nilai variabel X diasumsikan stokastik
atau dianggap tetap dalam sampel yang berulang. Misalnya ada 7 data
yang akan dianalisis dengan regresi (ini hanya contoh saja, karena
regresi dengan 7 data tampaknya terlalu sedikit).
Gaji (juta) Pengeluaran (juta)3 2,5
3 2
3 3
4 3
4 2,5
5 4,5
5 4
Jadi misalnya ambil nilai tetap untuk X, yaitu gaji 3 juta maka sampel
pertama mempunyai pengeluaran 2,5 juta. Lalu ambil lagi sampel kedua
dengan gaji 3 juta maka pengeluarannya adalah 2 juta. Demikian
seterusnya untuk sampel dengan gaji 4 juta dan 5 juta. Jadi nilai X
dianggap tetap pada sampel yang berulang. (dalam regresi lanjut, dapat
diasumsikan bahwa X tidak stokastik).
Nilai Y hasil prediksi dengan model regresi tentunya mempunyai kesalahan
atau tidak tepat sama dengan nilai Y pada data. Selisihnya sering
disebut dengan disturbance dan sering disimbolkan dengan u. Nilai ini
harus mempunyai rata-rata sama dengan 0 (eksak). Ketika kita telah
mendaptkan garis lurus pada model, maka nilai Y yang sebenarnya bisa
berada di atas atau di bawah garis lurus tersebut, akan tetapi jumlahnya
akan seimbang sehingg rata-ratanya sama dengan 0.
Homo berarti sama atau equal, scedasticity berarti disperse atau scatter atau ada yang mengartikan sebaran. Jadi varians dari
error atau disturbance haruslah sama pada masing-masing nilai X.
Sebagai contoh, ada 3 orang dengan gaji 3 juta sehingga memberikan tiga
buah error dan mempunyai varians. Varians ini harus sama (equal) dengan
varians error pada nilai X yang lain misalnya 4 juta. Demikian
seterusnya.
Asumsi ini masih berkaitan dengan nilai error, yaitu bahwa untuk
sembarang 2 buah nilai X, maka kedua error itu tidak berkorelasi (atau
mempunyai korelasi 0). Misalnya error pada X sebesar 3 juta dengan Y
sebesar 2,5 dengan error pada X sebesar 3 juta dengan Y sebesar 2 juta
tidak berkorelasi. Pengertian lain adalah misalnya ada persamaan Y = a +
b X + u dengan u adalah error. Jika ada korelasi antara u dengan u-1
(error sebelumnya) maka model akan gagal, karena Y pada model harusnya
dipengaruhi oleh X saja, akan dipengaruhi oleh u. Demikian seterusnya.
Artinya nilai variabel bebas (Xi) dengan error (ui) tidak berkorelasi.
Diasumsikan bahwa Y adalah dipengaruhi oleh X dan u, sehingga X dan u
harus tidak saling berkorelasi. Jika X dan u berkorelasi, maka tidak
mungkin mencari pengaruh masing-masing terhadap Y. Jika X berkorelasi
positif dengan u, maka jika X meningkat u juga meningkat, atau jika X
menurun maka u juga menurun (juga sebaliknya jika berkorelasi negatif).
Sehingga sulit untuk mengisolasi pengaruh X dan u terhadap Y. Asumsi ini
sebenarnya akan terpenuhi secara otomatis jika X merupakan stokastik
karena untuk X bernilai tetap, u akan berubah.
Asumsi ini sebenarnya tidak asing bagi matematika sederhana. Jika ada
dua parameter yang akan dicari nilainya maka tentunya tidak mungkin
diselesaikan dengan satu persamaan (observasi).
Harus ada variasi nilai dalam variabel X. Jika X nilainya sama untuk
semua observasi maka tentunya tidak dapat diestimasi. Meskipun ini mudah
dimengerti namun sering dilupakan.
Model regresi yang dibangun haruslah benar dalam arti sesuai dengan
teori yang telah dikembangkan. Seperti telah dijelaskan bahwa statistik
hanyalah untuk menguji teori atau fenomena tertentu. Jadi jika
menggunakan variabel yang sembarangan (atau tidak berdasarkan teori
tertentu) maka model regresi yang dihasilkan juga patut dipertanyakan.
Tidak ada hubungan linear yang tinggi antara variabel-variabel bebas
dalam model regresi. Jadi asumsi ini tentunya tidak bisa diterapkan pada
regresi dengan satu variabel bebas (regresi linear sederhana).
Setelah menyimak uraian di atas, mungkin ada beberapa pertanyaan yang
spontan muncul dalam benak Anda. Misalnya, mengapa uji normalitas
residual tidak ada? Tepat sekali, asumsi normalitas residual (bukan
normalitas pada masing-masing variabel) memang diperlukan akan tetapi
itu tidak termasuk dalam uji asumsi klasik. Gujarati (2004:93) menulis
'The assumption that the disturbances ui are normally distributed is not
a part of the CLRM’. Jika Anda masih berargumen, bahwa di dalam
berbagai penelitian, uji normalitas residual dimasukkan dalam uji asumsi
klasik (CLRM). Kajian tentang normalitas dimasukkan dalam Classical
Normal Linear Regression Model (CNLRM). Jadi masalah penempatannya mau
di mana, kita tidak dapat berkomentar.
Jika Anda simak lebih lanjut, maka dari 10 asumsi dalam CLRM tidak
semuanya perlu diuji karena secara otomatis telah dimasukkan dalam
persamaan untuk mengestimasi nilai konstanta, koefisien atau errornya.
Asumsi 2, 3, 6, 7, 8 dan 9 tidak perlu lagi dilakukan pengujian
tersendiri. Asumsi 1 juga sering tidak dilakukan karena terkait dengan
asumsi 9, yaitu bahwa model harus dispesifikasi dengan benar. Asumsi 4, 5
dan 10 yang memerlukan pengujian tersendiri ditambah dengan pengujian
normalitas.
Sumber Bacaan: Gujarati (2004)
Tidak ada komentar:
Posting Komentar