Belajar Regresi Polynomial

Compiled by: Suprapto van Plaosan

Regresi polinomial adalah teknik yang didasarkan pada penggunaan model linier ketika dataset yang dianalisis bersifat tidak linier pada data aslinya.

Konsepnya adalah melakukan tranformasi data sesuai pola hubungan antara variabel dependent dan independent.

Dataset non-linear yang dapat diinterpolasi menggunakan regresi parabola sehingga hasil interpolasinya menjadi linier (Geron, 2017).

Contoh kurva sebaran data X dan y yang menunjukan korelasi non linier adalah sebagai berikut:

Koefisien korelasi untuk regresi linier adalah 0.1553685172877023

Figure 3: Kurva kurva data berupa lengkungan

Akurasi regresi menggunakan model linier akan sangat buruk. Namun, dengan melihat kurva, terlihat bahwa regresi kuadrat dapat dengan mudah menyelesaikan masalah ini. Pustaka scikit-learn menyediakan kelas PolynomialFeatures, yang mengubah set asli menjadi yang diperluas sesuai dengan parameter kwadrat.

Transformasi kuadratik nilai X menghasilkan model regresi linier dengan nilai koefisien korelasi:

0.9823692655023508

Seperti disebutkan sebelumnya, Ada banyak jenis regresi non-linear, tetapi mungkin yang paling umum adalah: -

  • Kubik
  • Kuadrat
  • Eksponensial
  • Logaritma
  • Sigmoidal/Logistik

Kubik:

Fungsi kubik adalah dalam bentuk: - y_hat sama dengan intersep plus variabel x dinaikkan ke orde tiga ditambah x dinaikkan ke orde dua dan seterusnya. Bisa juga dibalik dari orde 1 ke orde 3 Grafik fungsi ini bukan garis lurus di atas bidang 2D.

$$y = \beta_{0} + x^3$$
Figure 6: Kurva sebaran y = x^3
Figure 7: Kurva regresi polinomial y = x^3

Kuadratik:

Fungsi kuadrat adalah persamaan: - y_hat sama dengan variabel x dikalikan dengan variabel x atau dinaikkan menjadi pangkat 2.

$$y = \beta_{0} + x^2$$
Figure 8: Kurva sebaran y = x^2
Figure 9: Kurva regresi polinomial y = x^2

Eksponensial:

Fungsi eksponensial dengan basis c didefinisikan sebagai y-hat sama dengan intersep ditambah kemiringan dikalikan dengan konstanta (c) pangkat variabel X. Dapat juga digunakan fungsi numpy.exp () dengan variabel X sebagai argumennya dalam bentuk ini:

$$y_hat = np.exp (X)$$

Kemudian plot variabel X pada sumbu x dan variabel y pada sumbu y .

Figure 10: Kurva sebaran y = e^x
Figure 11: Kurva regresi polinomial y = e^x

Logaritmik:

Dalam fungsi logaritma, y_hat adalah hasil dari penerapan peta logaritmik pada variabel X . Ini adalah salah satu ekspresi paling sederhana dari fungsi logaritmik.

$$y_hat = np.log (X)$$
Figure 12: Kurva sebaran y = a.log (b*x)+c
Figure 13: Kurva regresi polinomial y = a.log (b*x)+c

(Pedregosa, 2011)