Asumsi Analisis Regresi Linear (skripsi dan tesis)

 

Agar mampu memiliki kesimpulan yang benar tentang parameter α dan β, pemenuhan asumsi-asumsi model regresi yang harus terpenuhi (Drapper dan Smith, 1992): 1. Nilai ɛi adalah bebas satu dengan yang lainnya atau korelasi (ɛi , ɛj) = 0. Untuk asumsi pertama yang menyatakan independent, artinya ɛi merupakan variabel acak dengan nilai tengah nol dan ragam σ 2 yang tidak diketahui. Jadi, E(ɛi) = 0, V(ɛi) = σ 2 . ɛi dan ɛj tidak berkorelasi, i ≠ j , sehingga covv(ɛi ɛj) = 0. Jadi, E(Yi ) = α + βXi , Yi dan Yj , i ≠ j , tidak berkorelasi. ɛi merupakan variabel acak normal, dengan nilai tengah nol dan ragam σ 2 ɛ dengan kata lain ɛi ~ N (0, σ 2 ɛ). 2. Nilai tengah dari Y adalah fungsi linier dari X, yaitu jika dihubungkan titik-titik dari nilai tengah yang berbeda, maka akan diperoleh garis lurus µ(y/x) = α + β X. Untuk asumsi kedua yang disebut garis linier, artinya X mempunyai hubungan linier dengan Y. Nilai tengah Y untuk kombinasi tertentu dari nilai X adalah fungsi linier dari X, yaitu µY|X . ɛ adalah variabel acak dengan µ = 0 untuk nilai X yang tetap, sehingga µɛ|X = 0 untuk sembarang X, dengan nilai X yang tetap maka nilai E(Y) = E(βX) = βX. ɛ menggambarkan seberapa jauh setiap Y menyimpang dari regresi populasinya. Yang dimaksud dengan kelinieran adalah linier dengan koefisien.

Jika hubungan titik-titik dari nilai tengah µY|X yang berbeda akan diperoleh garis lurus. Asumsi ini diperlukan agar uji-uji statistik seperti uji F dan uji t menjadi signifikan. 6 3. Ragam galat homogen (homoskedastik) yaitu galat memiliki nilai ragam yang sama antara galat ke-i dan galat ke-j. Secara matematis ditulis Var (ɛi) = σ 2 ; i = 1,2,. . . , n dan n = banyaknya pengamatan. Untuk asumsi ketiga yang menyatakan varian Y adalah sama untuk setiap kombinasi tetap X; yaitu σ 2 Y|X = var (Y|X) = σ 2 untuk semua X. Asumsi ini sering dikenal dengan sebutan homoscedasticity, dengan homo berarti sama scedastic berarti sebaran. Model regresi menganggap galat menyebar secara normal disekitar nilai tengah nol, dan mempunyai ragam yang sama. Banyak metode yang dapat dipergunakan untuk memeriksa apakah asumsi ini terpenuhi atau tidak, salah satunya adalah dengan metode Glejser. Kehomogenan diperlukan agar uji-uji statistik seperti uji F dan uji t menjadi signifikan. 4. Ragam galat menyebar normal dengan rata-rata nol dan suatu ragam tertentu. Asumsi keempat menyatakan untuk sembarang kombinasi tetap dari variabel bebas X, variabel tak bebas Y berdistribusi normal atau yang biasa disebut asumsi kenormalan. Dengan kata lain Y ~ N (µY|X, σ 2 ). E(Y) = E(Xβ) + E(ɛ) dengan E(ɛ) = 0 sehingga E(Y) = (Xβ). Dan Var (Y) = Var (X + β ) = Var (ɛ) = σ 2 . ɛi merupakan variabel acak dengan nilai tengah nol dan ragam σ 2 , sehingga ɛ ~ N (0, σ 2 ). Sebaran normal diperlukan agar uji t maupun uji F dapat dilakukan. Kenormalan bisa dilihat secara eksploratif melalui plot sisaan sedangkan untuk uji formalnya dapat digunakan uji Kolmogorov-Smirnov.