1. ANALISIS REGRESI
SEDERHANA (ANALISIS REGRESI DUA VARIABEL)
Regresi linear sederhana adalah persamaan regresi yang menggambarkan hubungan antara satu variabel bebas (X) dan satu variable terikat (Y), dimana hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Dalam suatu persamaan regresi besarnya nilai variabel terikat adalah tergantung pada nilai variabel (satu) bebas yang diketahui. Hubungan kedua variabel tersebut dapat dituliskan dalam bentuk persamaan regresi linier sederhana Y terhadap X adalah:
Regresi linear sederhana adalah persamaan regresi yang menggambarkan hubungan antara satu variabel bebas (X) dan satu variable terikat (Y), dimana hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Dalam suatu persamaan regresi besarnya nilai variabel terikat adalah tergantung pada nilai variabel (satu) bebas yang diketahui. Hubungan kedua variabel tersebut dapat dituliskan dalam bentuk persamaan regresi linier sederhana Y terhadap X adalah:
- Model populasi regresi linier sederhana dinyatakan dalam persamaan: Yi = a+bXi+ei
- Model sampel (penduga) untuk regresi linier sederhana: Yi = a + bXi
Yi = variable terikat (dependen) yang diprediksikan
Xi = variable bebas
(independen) yang mempunyai nilai tertentu
a = penduga bagi
intersep (α)
b = penduga bagi
koefisien regresi (β)
i = 1,2,3,…
Nilai α dan β adalah parameter yang nilainya tidak diketahui
sehingga diduga menggunakan statistik sampel. Komponen sisaan/kesalahan (ei =error/ galat) menunjukkan:
- Pengaruh dari variabel yang tidak dimasukkan dalam persamaan regresi karena berbagai pertimbangan.
- Penetapan persamaan yang tidak sempurna.
- Kesalahan pengukuran dalam pengumpulan dan pemrosesan data.
Nilai a menunjukkan intersep (konstanta) persamaan tersebut,
artinya untuk nilai variabel X = 0 (harga konstan) maka besarnya harga Y = a,
parameter b menunjukkan besarnya koefisien regresi (slope) persamaan tersebut
apakah terjadi peningkatan atau penurunan variabel dependen yang didasrkan pada
variabel independen. Nilai ini menunjukkan besarnya perubahan nilai Y jika
nilai X berubah sebesar satu satuan. Bila b (+) maka naik, dan bila (-) maka
terjadi penurunan. Metode yang digunakan untuk menduga nilai parameter adalah
metode kuadrat trkecil (least square method), karena mudah dikerjakan secara
manual. Dengan menggunakan metode kuadrat terkecil, nilai a dan b dapat
dihitung dengan menggunakan rumus sebagai berikut:
Diilustrasikan dengan data dari Gujarati (2003), dengan populasi
beranggotakan 60 keluarga.
- Xi : pendapatan/minggu per keluarga
- Yi : konsumsi/minggu per keluarga
- i = 1, …, 60 (60 keluarga yang diamati)
Dari
60 keluarga tersebut dikelompokkan ke dalam 10 kelas pendapatan:
Sebaran Bersyarat dari konsumsi/minggu untuk beberapa kelas
pendapatan.
Untuk setiap kelas pendapatan/minggu terdapat variasi jumlah
konsumsi/minggu dan secara rata-rata jumlah konsumsi/minggu meningkat seiring
dengan pendapatan/minggu.
X= Pendapatan
Y= Konsumsi
2. KONSEP FUNGSI REGRESI
POPULASI (POPULATION REGRESSION FUNCTION – PRF)
Adalah garis yang menghubungkan nilai harapan bersyarat untuk
seluruh kemungkinan nilai X dan berpengaruh positif, karena semakin tinggi
tingkat pendapatan maka akan semakin tinggi tingkat konsumsinya. Jadi intinya,
parameter digunakan untuk populasi, karena populasi tidak dapat
ditentukan/diduga. Jika diasumsikan bahwa hubungan kedua variabel tersebut
linier, maka digunakan fungsi linier dari X, yaitu:
Arti dari linear:
- Linear dalam variabel:
- Linear dalam parameter:
Fungsi Regresi Populasi Secara Stokastik: Untuk model konsumsi sebagai fungsi dari
pendapatan, dimungkinkan bahwa faktor selain pendapatan juga mempengaruhi
konsumsi. Faktor-faktor lain tsb dirangkum dalam komponen error/galat sehingga,
tidak semua titik tepat pada garis regresi.
3. KEUTAMAAN DARI
KOMPONEN STOKASTIK GALAT/ERROR
Dalam statistika dan matematika stokastik, galat (bahasa Inggris: error) adalah sumber variasi data yang
tidak dapat dimasukkan ke dalam model.
Dalam literatur statistika, galat dikenal pula sebagai sesatan, sisaan, residu,
atau noise. Galat dapat disebut juga error atau dalam keseharian
dapat disebut sebagai kesalahan, kesalahan yang dimaksud disini adalah
kesalahan dalam proses pengambilan data. Jadi, Mengapa
tidak menggunakan sebanyak-banyaknya variabel yang
mungkin untuk mempengaruhi konsumsi (tidak hanya pendapatan)?
Karena:
- Teori yang belum pasti: jika variabel yang dicantumkan tidak sesuai dengan teori yang tersedia.
- Ketidaktersediaan data: Misalnya, yang mempengaruhi konsumsi adalah pendapatan tetapi bisa saja kesejahteraan juga mempengaruhi konsumsi. Tetapi karena kesejahteraan itu hanya teori yang belum tentu ada datanya maka variabelnya tidak sesuai, sehingga akan terjadi error
- Variabel utama vs variabel tambahan: jika variabel utama yang dimasukkan itu terjadi error, maka akan digantikan dengan variabel lainnya.
- Sifat alami perilaku manusia (acak)
- Peubah proxy yang kurang berkualitas
- Model sesederhana mungkin (Principle of Parsimony): penjelasan dari variabel yang dicantumkan harus mudah dipahami dan menggunakan variabel yang sederhana.
- Kemungkinan hubungan fungsional yang kurang tepat: Jika teori yang sudah ada dan telah diuji, maka bisa saja teori yang telah diuji tersebut belum tepat. Sehingga data yang muncul akan berlawanan dengan teori. Maka teori tersebut harus diverifikasi dulu.
4. KONSEP FUNGSI REGRESI SAMPEL (SAMPLE REGRESSION FUNCTION – SRF)
Adalah regresi yang dibentuk dari sampel. Dipakai untuk menduga regresi populasi dan hasilnya tidak akan pernah sama untuk sampel yang berbeda. Fungsi Regresi Populasi (PRF) secara praktek tidak mungkin memperoleh informasi secara keseluruhan dari populasi . Misalnya, data pendapatan dan konsumsi yang diasumsikan berasal populasi 60 keluarga. Pengambilan sampel pasangan nilai pendapatan (X) dan konsumsi (Y) dari populasi tersebut Menduga PRF berdasarkan informasi dari sampel. Dan Akibat fluktuasi sampel, maka ada kemungkinan bahwa pendugaan tidak akurat. SRF digunakan untuk
menduga PRF dan dengan adanya sampel yang berfluktuasi, SRF hanya sebagai
pendekatan dari PRF.
Keterangan:
Tabel pasangan konsumsi dan pendapatan dari 2 sampel berukuran 10 keluarga yang diambil dari populasi 60 keluarga:
Garis regresi
dari dua sampel yang berbeda tersebut, terdapat dua garis yang berbeda karena fungsi regresi populasi dalam
prakteknya tidak akan pernah diketahui:
___________________________________________________________
Sumber tambahan:
- Sukoco, Agus. "Modul 5: Regresi Linear". Surabaya: Fak. Ekonomi Universitas Narotama. http://suci-rahma.mhs.narotama.ac.id/files/2013/06/Modul-Regresi-Linear-WEB.pdf
- Listyani, Endang. 2013. "Bahan Ajar Analisis Regresi". Yogyakarta. http://staff.uny.ac.id/sites/default/files/pendidikan/Endang%20Listyani,%20MS./BAHAN%20AJAR%20ANALISIS%20REGRESI.docx.















0 comments:
Post a Comment