20.10.17

Resume W4: Analisis Regresi Sederhana


1. ANALISIS REGRESI SEDERHANA (ANALISIS REGRESI DUA VARIABEL)
Regresi linear sederhana adalah persamaan regresi yang menggambarkan hubungan antara satu variabel bebas (X) dan satu variable terikat (Y), dimana hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Dalam suatu persamaan regresi besarnya nilai variabel terikat adalah tergantung pada nilai variabel (satu) bebas yang diketahui. Hubungan kedua variabel tersebut dapat dituliskan dalam bentuk persamaan regresi linier sederhana Y terhadap X adalah:
  • Model populasi regresi linier sederhana dinyatakan dalam persamaan: Yi = a+bXi+ei
  • Model sampel (penduga) untuk regresi linier sederhana: Yi = a + bXi
di mana: 
Yi = variable terikat (dependen) yang diprediksikan
Xi = variable bebas (independen) yang mempunyai nilai tertentu
a   = penduga bagi intersep (α)
b   = penduga bagi koefisien regresi (β)
i    = 1,2,3,…

Nilai α dan β adalah parameter yang nilainya tidak diketahui sehingga diduga menggunakan statistik sampel. Komponen sisaan/kesalahan (ei =error/ galat) menunjukkan:
  • Pengaruh dari variabel yang tidak dimasukkan dalam persamaan regresi karena berbagai pertimbangan.
  • Penetapan persamaan yang tidak sempurna.
  • Kesalahan pengukuran dalam pengumpulan dan pemrosesan data.
Nilai a menunjukkan intersep (konstanta) persamaan tersebut, artinya untuk nilai variabel X = 0 (harga konstan) maka besarnya harga Y = a, parameter b menunjukkan besarnya koefisien regresi (slope) persamaan tersebut apakah terjadi peningkatan atau penurunan variabel dependen yang didasrkan pada variabel independen. Nilai ini menunjukkan besarnya perubahan nilai Y jika nilai X berubah sebesar satu satuan. Bila b (+) maka naik, dan bila (-) maka terjadi penurunan. Metode yang digunakan untuk menduga nilai parameter adalah metode kuadrat trkecil (least square method), karena mudah dikerjakan secara manual. Dengan menggunakan metode kuadrat terkecil, nilai a dan b dapat dihitung dengan menggunakan rumus sebagai berikut:
Diilustrasikan dengan data dari Gujarati (2003), dengan populasi beranggotakan 60 keluarga.
  • Xi : pendapatan/minggu per keluarga
  • Yi : konsumsi/minggu per keluarga
  • i = 1, …, 60 (60 keluarga yang diamati) 
Dari 60 keluarga tersebut dikelompokkan ke dalam 10 kelas pendapatan:

Sebaran Bersyarat dari konsumsi/minggu untuk beberapa kelas pendapatan.

Untuk setiap kelas pendapatan/minggu terdapat variasi jumlah konsumsi/minggu dan secara rata-rata jumlah konsumsi/minggu meningkat seiring dengan pendapatan/minggu.
X= Pendapatan
Y= Konsumsi

2. KONSEP FUNGSI REGRESI POPULASI (POPULATION REGRESSION FUNCTION – PRF)
Adalah garis yang menghubungkan nilai harapan bersyarat untuk seluruh kemungkinan nilai X dan berpengaruh positif, karena semakin tinggi tingkat pendapatan maka akan semakin tinggi tingkat konsumsinya. Jadi intinya, parameter digunakan untuk populasi, karena populasi tidak dapat ditentukan/diduga. Jika diasumsikan bahwa hubungan kedua variabel tersebut linier, maka digunakan fungsi linier dari  X, yaitu:
Arti dari linear:
  • Linear dalam variabel:
  • Linear dalam parameter:

Fungsi Regresi Populasi Secara Stokastik: Untuk model konsumsi sebagai fungsi dari pendapatan, dimungkinkan bahwa faktor selain pendapatan juga mempengaruhi konsumsi. Faktor-faktor lain tsb dirangkum dalam komponen error/galat sehingga, tidak semua titik tepat pada garis regresi.

3. KEUTAMAAN DARI KOMPONEN STOKASTIK GALAT/ERROR
Dalam statistika dan matematika stokastik, galat (bahasa Inggris: error) adalah sumber variasi data yang tidak dapat dimasukkan ke dalam model. Dalam literatur statistika, galat dikenal pula sebagai sesatan, sisaan, residu, atau noise. Galat dapat disebut juga error atau dalam keseharian dapat disebut sebagai kesalahan, kesalahan yang dimaksud disini adalah kesalahan dalam proses pengambilan data. Jadi, Mengapa tidak menggunakan sebanyak-banyaknya variabel yang mungkin untuk mempengaruhi konsumsi (tidak hanya pendapatan)?
Karena:
  1. Teori yang belum pasti: jika variabel yang dicantumkan tidak sesuai dengan teori yang tersedia.
  2. Ketidaktersediaan data: Misalnya, yang mempengaruhi konsumsi adalah pendapatan tetapi bisa saja kesejahteraan juga mempengaruhi konsumsi. Tetapi karena kesejahteraan itu hanya teori yang belum tentu ada datanya maka variabelnya tidak sesuai, sehingga akan terjadi error
  3. Variabel utama vs variabel tambahan: jika variabel utama yang dimasukkan itu terjadi error, maka akan digantikan dengan variabel lainnya.
  4. Sifat alami perilaku manusia (acak)
  5. Peubah proxy yang kurang berkualitas
  6. Model sesederhana mungkin (Principle of Parsimony): penjelasan dari variabel yang dicantumkan harus mudah dipahami dan menggunakan variabel yang sederhana.
  7. Kemungkinan hubungan fungsional yang kurang tepat: Jika teori yang sudah ada dan telah diuji, maka bisa saja teori yang telah diuji tersebut belum tepat. Sehingga data yang muncul akan berlawanan dengan teori. Maka teori tersebut harus diverifikasi dulu.

4. KONSEP FUNGSI REGRESI SAMPEL (SAMPLE REGRESSION FUNCTION – SRF)
Adalah regresi yang dibentuk dari sampel. Dipakai untuk menduga regresi populasi  dan hasilnya tidak akan pernah sama untuk sampel yang berbeda. Fungsi Regresi Populasi (PRF) secara praktek tidak mungkin memperoleh informasi secara keseluruhan dari populasi . Misalnya, data pendapatan dan konsumsi yang diasumsikan berasal populasi 60 keluarga. Pengambilan sampel pasangan nilai pendapatan (X) dan konsumsi (Y) dari populasi tersebut Menduga PRF berdasarkan informasi dari sampel. Dan Akibat fluktuasi sampel, maka ada kemungkinan bahwa pendugaan tidak akurat. SRF digunakan untuk menduga PRF dan dengan adanya sampel yang berfluktuasi, SRF hanya sebagai pendekatan dari PRF.
Keterangan:

      Tabel pasangan konsumsi dan pendapatan dari  2 sampel berukuran 10 keluarga yang diambil dari populasi 60 keluarga:

    
      Garis regresi dari dua sampel yang berbeda tersebut, terdapat dua garis yang berbeda karena fungsi regresi populasi dalam prakteknya tidak akan pernah diketahui:
___________________________________________________________ 
          Sumber tambahan:


0 comments: