Perbandingan Akurasi Random Forest Classifier dalam Memprediksi Kelayakan Kendaraan berdasarkan Jumlah Decision Tree dan Selection Feature

Penulis

  • Laily Nur Qomariyati Faculty of Electrical Engineering, Telkom University
  • Sifa Nurpadillah Fakultas Teknik Universitas Garut

DOI:

https://doi.org/10.52434/jft.v4i1.4017

Kata Kunci:

Random Forest, Decision tree, Feature Selection, Data Mining, Machine Learning, Klasifikasi Kendaraan

Abstrak

Pasca pandemi, terdapat peningkatan permintaan dan kebutuhan kendaraan yang ditandai dengan peningkatan penjualan. Konsumen memiliki banyak pertimbangan dalam membeli kendaraan. Produsen harus memahami kebutuhan dan pertimbangan konsumen agar kendaraan yang diluncurkan dapat diterima dengan baik. Penelitian ini bertujuan memprediksi kelayakan kendaraan menggunakan Random Forest Classifier berdasarkan jumlah decision tree dan pemilihan fitur. Model Random Forest diterapkan dengan variasi jumlah decision tree untuk mengidentifikasi pengaruhnya terhadap akurasi. Hasil menunjukkan bahwa akurasi meningkat signifikan dengan penambahan jumlah decision tree dan mencapai stabil pada sekitar 50-100 pohon dengan akurasi maksimum 94.57%. Selanjutnya, penelitian mengevaluasi pengaruh jumlah fitur input terhadap akurasi. Hasil menunjukkan peningkatan akurasi dari 69.53% dengan satu fitur hingga 94.57% dengan semua fitur. Fitur-fitur utama seperti Safety, Persons, Buying, Maint, dan Lug_boot terbukti sangat penting, dengan penggunaan lima fitur ini menghasilkan akurasi 92.64%. Analisis importance score menunjukkan bahwa menghilangkan fitur dengan importance tinggi, seperti Safety, menurunkan akurasi secara signifikan. Kesimpulan penelitian ini adalah bahwa pemilihan jumlah decision tree yang optimal dan fitur yang tepat sangat penting untuk meningkatkan akurasi model Random Forest. Penggunaan sekitar 50-100 decision tree dan pemilihan fitur berdasarkan importance score dapat memberikan prediksi yang akurat dan efisien. Penelitian ini memberikan panduan praktis bagi produsen kendaraan dalam memanfaatkan data mining dan machine learning untuk memahami preferensi konsumen dan meningkatkan efektivitas produksi.

Unduhan

Diterbitkan

2024-06-30