Abstrak
Penelitian ini dilatarbelakangi oleh terjadinya fenomena kejahatan klitih yang
terjadi di wilayah Yogyakarta dan cukup menyita perhatian karena mengganggu
keamanan dan ketertiban masyarakat. Pada era revolusi industri 4.0 saat ini Polri
dituntut untuk mampu menggerakkan kebijakan organisasi di atas data sehingga
dilakukanlah penelitian pada penegakan prediksi dengan menggunakan metode K-
NN Classifier Machine learning atas kejahatan klitih agar membantu pelaksanaan
tugas kepolisian.
Penegakan prediksi kejahatan klitih terutama menggunakan konsep data
mining dan Big data analytic oleh Daniel T. Larose serta konsep ilmu kepolisian dari
Prof. Harsya W. Bachtiar dimana teknologi kepolisian sebagai bidang ilmu yang berdiri
sendiri dimanfaatkan dalam upaya menangani masalah sosial yakni kejahatan klitih.
Penelitian ini dilakukan dengan pendekatan kuantitaif, menggunakan metode
big data analytic dimana data kejahatan klitih yang terjadi dalam kurun waktu tahun
2018 s.d 2022 dijadikan sebagai data primer dan dilakukan pencatatan secara
langsung, kemudian dilakukan pelabelan sesuai atribut membentuk dataset yang
selanjutnya dilakukan pengolahan data. Untuk mendukung hasil pengolahan data
tersebut peneliti juga memberikan kuesioner kepada penyidik di Ditreskrimum Polda
DIY agar menunjukan bahwa data yang dihasilkan robust.
Pada penelitian ini dilakukan uji coba implementasi nilai k=1, k=3, k=5, k=7,
dan k=9 dengan rasio perbandingan data training dan data testing sebesar 90%, 80%,
70%, dan 60% kemudian dilakukan komparasi untuk menghasilkan model prediksi
yang terbaik guna menganalisis profil pelaku kejahatan klitih.
Hasil uji coba dan perhitungan menunjukkan model dapat memprediksi
kejahatan klitih di Polda DIY dengan akurasi rata-rata 74,45%. Hasil prediksi tertinggi
pada kombinasi rasio data training dan data testing 60% : 40%, yaitu sebesar 80,12%.
Hasil pencermatan menunjukkan pada rasio data training dan data testing 90%:10%,
titik performance optimum sebelum turun adalah pada K=5. Hal ini dapat dijelaskan
karena jumlah data trainingnya cukup besar yaitu 90%. Selanjutnya pada rasio data
training dan data testing 60%:40%, titik performance optimum sebelum turun adalah
pada K=4.5. Temuan ini cukup menarik, karena hal ini menunjukkan model dapat
belajar hanya dengan data training sejumlah 60% dapat diandalkan untuk menguji
data 40%, selain itu didapat hasil akurasi yang cukup tinggi yaitu 80,9%. Dari
pencermatan di atas maka peneliti menyimpulkan untuk rasio terbaik data training :
data testing model ini adalah 60%:40% dengan menggunakan K=4.5.