Abstrak
Penelitian ini dilatarbelakangi oleh terjadinya fenomena kejahatan klitih yang terjadi di wilayah Yogyakarta dan cukup menyita perhatian karena mengganggu keamanan dan ketertiban masyarakat. Pada era revolusi industri 4.0 saat ini Polri dituntut untuk mampu menggerakkan kebijakan organisasi di atas data sehingga dilakukanlah penelitian pada penegakan prediksi dengan menggunakan metode K- NN Classifier Machine learning atas kejahatan klitih agar membantu pelaksanaan tugas kepolisian. Penegakan prediksi kejahatan klitih terutama menggunakan konsep data mining dan Big data analytic oleh Daniel T. Larose serta konsep ilmu kepolisian dari Prof. Harsya W. Bachtiar dimana teknologi kepolisian sebagai bidang ilmu yang berdiri sendiri dimanfaatkan dalam upaya menangani masalah sosial yakni kejahatan klitih. Penelitian ini dilakukan dengan pendekatan kuantitaif, menggunakan metode big data analytic dimana data kejahatan klitih yang terjadi dalam kurun waktu tahun 2018 s.d 2022 dijadikan sebagai data primer dan dilakukan pencatatan secara langsung, kemudian dilakukan pelabelan sesuai atribut membentuk dataset yang selanjutnya dilakukan pengolahan data. Untuk mendukung hasil pengolahan data tersebut peneliti juga memberikan kuesioner kepada penyidik di Ditreskrimum Polda DIY agar menunjukan bahwa data yang dihasilkan robust. Pada penelitian ini dilakukan uji coba implementasi nilai k=1, k=3, k=5, k=7, dan k=9 dengan rasio perbandingan data training dan data testing sebesar 90%, 80%, 70%, dan 60% kemudian dilakukan komparasi untuk menghasilkan model prediksi yang terbaik guna menganalisis profil pelaku kejahatan klitih. Hasil uji coba dan perhitungan menunjukkan model dapat memprediksi kejahatan klitih di Polda DIY dengan akurasi rata-rata 74,45%. Hasil prediksi tertinggi pada kombinasi rasio data training dan data testing 60% : 40%, yaitu sebesar 80,12%. Hasil pencermatan menunjukkan pada rasio data training dan data testing 90%:10%, titik performance optimum sebelum turun adalah pada K=5. Hal ini dapat dijelaskan karena jumlah data trainingnya cukup besar yaitu 90%. Selanjutnya pada rasio data training dan data testing 60%:40%, titik performance optimum sebelum turun adalah pada K=4.5. Temuan ini cukup menarik, karena hal ini menunjukkan model dapat belajar hanya dengan data training sejumlah 60% dapat diandalkan untuk menguji data 40%, selain itu didapat hasil akurasi yang cukup tinggi yaitu 80,9%. Dari pencermatan di atas maka peneliti menyimpulkan untuk rasio terbaik data training : data testing model ini adalah 60%:40% dengan menggunakan K=4.5.