https://blogger.googleusercontent.com/img/a/AVvXsEg2k6DIKnwAncQ_ofcrMwsB0aoNxN_fUgTHGMwNBYvUFGWRj0wMt0QwfuHqPPI0pQV2E6EWgIZKE3cNsibRril6t-CPqet4na6a9hPVQ-miIa1SwmdpHxxCZT53V3rOW_Yv6bH6iic7ea64zyfbgBBW7mw6MJsoYxnp0K0E1SIZKC_e0aLm7kjl9wMF=s900

REGRESI LOGISTIK ADALAH

Regresi logistik adalah metode statistika yang digunakan untuk menganalisis hubungan antara satu atau lebih variabel independen dengan variabel dependen biner. Variabel dependen biner adalah variabel yang hanya memiliki dua nilai mungkin, seperti 0 dan 1, hidup atau mati, sukses atau gagal. Regresi logistik merupakan perluasan dari regresi linier yang digunakan ketika variabel dependen bersifat kontinu. Dalam konteks ini, regresi logistik sangat berguna dalam memahami dan memodelkan faktor-faktor yang mempengaruhi kejadian atau non-kejadian suatu peristiwa.

REGRESI LOGISTIK ADALAH | PENGERTIAN, JENIS, SYARAT UJI DAN CONTOH

Pengertian Regresi Logistik

Regresi logistik menggabungkan konsep regresi (analisis hubungan antara variabel) dengan fungsi logistik (fungsi sigmoid yang menghasilkan nilai antara 0 dan 1). Fungsi logistik digunakan untuk memodelkan probabilitas bahwa variabel dependen adalah sukses atau gagal, 1 atau 0. Rumus regresi logistik umumnya ditulis sebagai berikut:

P(Y=1)=11+e(b0+b1X1+b2X2+...+bkXk)

Dalam rumus ini:

  • P(Y=1) adalah probabilitas bahwa variabel dependen Y adalah 1 (kejadian sukses).
  • e adalah konstanta logaritma natural.
  • b0,b1,...,bk adalah koefisien regresi yang perlu diestimasi.
  • X1,X2,...,Xk adalah variabel independen.

Jenis-Jenis Regresi Logistik

  1. Regresi Logistik Binomial Sederhana: Regresi logistik binomial sederhana digunakan ketika hanya ada satu variabel independen yang memprediksi variabel dependen biner. Contoh, memprediksi apakah seseorang lulus atau tidak berdasarkan jumlah jam belajar.

  2. Regresi Logistik Multinomial: Regresi logistik multinomial diterapkan ketika variabel dependen memiliki lebih dari dua kategori. Misalnya, memprediksi warna mobil (merah, biru, hijau) berdasarkan berbagai variabel independen.

  3. Regresi Logistik Ordinal: Regresi logistik ordinal digunakan ketika variabel dependen adalah ordinal, yaitu memiliki tingkatan atau urutan tertentu. Contohnya, memprediksi tingkat kepuasan konsumen (rendah, sedang, tinggi) berdasarkan berbagai faktor.

  4. Regresi Logistik Berganda: Regresi logistik berganda adalah jenis regresi logistik yang paling umum. Ini digunakan ketika ada lebih dari satu variabel independen yang mempengaruhi variabel dependen biner. Sebagai contoh, memprediksi apakah seorang siswa lulus ujian berdasarkan variabel seperti jumlah jam belajar, tingkat kehadiran, dan sebagainya.

Syarat Uji dalam Regresi Logistik

  1. Independensi Error: Seperti pada regresi lainnya, asumsi bahwa error (kesalahan prediksi) adalah independen satu sama lain harus terpenuhi. Artinya, nilai error untuk satu observasi tidak dapat memprediksi nilai error untuk observasi lainnya.

  2. Ketidakmultikolinieran: Variabel independen dalam regresi logistik harus bebas dari masalah multikolinieran, yaitu tidak ada hubungan linear sempurna antara variabel independen.

  3. Linearitas Log-Odds: Hubungan antara variabel independen dan log-odds harus bersifat linier. Jika hubungan tidak linier, hasilnya mungkin tidak dapat diinterpretasikan dengan benar.

  4. Ketidaknormalan Residual: Distribusi residual harus mendekati distribusi normal. Ini dapat diperiksa dengan memeriksa plot distribusi residual atau menggunakan uji normalitas.

  5. Homoskedastisitas: Homoskedastisitas berarti variasi dari error harus konstan sepanjang rentang nilai prediksi. Jika variasi tidak konstan, model dapat menghasilkan prediksi yang tidak akurat.

    REGRESI LOGISTIK ADALAH | PENGERTIAN, JENIS, SYARAT UJI DAN CONTOH

Contoh Aplikasi Regresi Logistik

Misalkan kita memiliki dataset yang mencakup informasi tentang sejumlah siswa dan variabel dependen biner yang menunjukkan apakah siswa tersebut lulus ujian (1) atau tidak (0). Variabel independen melibatkan jumlah jam belajar per minggu dan nilai ujian prasekolah.

python
import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score, confusion_matrix # Membuat dataset contoh data = {'Jam_Belajar': [10, 5, 8, 12, 6, 9, 7, 4, 11, 8], 'Nilai_Ujian_Prasekolah': [85, 60, 75, 90, 70, 80, 78, 65, 88, 76], 'Lulus': [1, 0, 1, 1, 0, 1, 1, 0, 1, 1]} df = pd.DataFrame(data) # Memisahkan variabel independen dan dependen X = df[['Jam_Belajar', 'Nilai_Ujian_Prasekolah']] y = df['Lulus'] # Membagi dataset menjadi data latih dan uji X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Membuat model regresi logistik model = LogisticRegression() model.fit(X_train, y_train) # Memprediksi hasil y_pred = model.predict(X_test) # Mengukur akurasi accuracy = accuracy_score(y_test, y_pred) conf_matrix = confusion_matrix(y_test, y_pred) print(f'Akurasi Model: {accuracy}') print(f'Matrix Confusion:\n{conf_matrix}')

Dalam contoh ini, model regresi logistik digunakan untuk memprediksi apakah seorang siswa lulus ujian berdasarkan jumlah jam belajar dan nilai ujian prasekolah. Setelah model dibuat, kita dapat menggunakan data uji untuk memeriksa akurasi prediksi. Output termasuk akurasi model dan matriks kebingungan yang menunjukkan sejauh mana model berhasil memprediksi kelas lulus dan tidak lulus.

Regresi logistik adalah alat statistik yang kuat untuk menganalisis dan memodelkan hubungan antara variabel dependen biner dan variabel independen. Dengan memahami prinsip-prinsip dasar regresi logistik, peneliti dan praktisi dapat mengaplikasikannya dalam berbagai konteks, mulai dari penelitian akademis hingga pengambilan keputusan bisnis.

Terima kasih,

Tim RAJARAK.CO.ID, RAJARAKTOKO.COM & RAJARAKMINIMARKET.COM

Posting Komentar

Produk Rak Minimarket

[Rak Minimarket][carousel1][#e74c3c]

Rak Gudang Harga Murah

[Rak Gudang][carousel1][#8e44ad]
Diberdayakan oleh Blogger.