Compiled by: Suprapto van Plaosan
Regresi polinomial adalah teknik yang didasarkan pada penggunaan model linier ketika dataset yang dianalisis bersifat tidak linier pada data aslinya.
Konsepnya adalah melakukan tranformasi data sesuai pola hubungan antara variabel dependent dan independent.
Dataset non-linear yang dapat diinterpolasi menggunakan regresi parabola sehingga hasil interpolasinya menjadi linier (Geron, 2017).
Contoh kurva sebaran data X dan y yang menunjukan korelasi non linier adalah sebagai berikut:
Akurasi regresi menggunakan model linier akan sangat buruk. Namun, dengan melihat kurva, terlihat bahwa regresi kuadrat dapat dengan mudah menyelesaikan masalah ini. Pustaka scikit-learn menyediakan kelas PolynomialFeatures, yang mengubah set asli menjadi yang diperluas sesuai dengan parameter kwadrat.
Transformasi kuadratik nilai X menghasilkan model regresi linier dengan nilai koefisien korelasi:
Seperti disebutkan sebelumnya, Ada banyak jenis regresi non-linear, tetapi mungkin yang paling umum adalah: -
Fungsi eksponensial dengan basis c didefinisikan sebagai y-hat sama dengan intersep ditambah kemiringan dikalikan dengan konstanta (c) pangkat variabel X. Dapat juga digunakan fungsi numpy.exp () dengan variabel X sebagai argumennya dalam bentuk ini:
$$y_hat = np.exp (X)$$Kemudian plot variabel X pada sumbu x dan variabel y pada sumbu y .
(Pedregosa, 2011)