Deteksi Anomali Berbasis Pembelajaran Mesin untuk Audit Klaim Selektif: Perbandingan Isolation Forest Lintas Diagnosis dan Per Diagnosis pada Klaim Rawat Inap BPJS Kesehatan

Syarif Rahman Hasibuan — Universitas Pembangunan Nasional Veteran Jakarta

deteksi anomali klaim rawat inap INA-CBG Isolation Forest BPJS Kesehatan surveilans data klaim

Abstract

BPJS Kesehatan menerima jutaan klaim rawat inap setiap tahun untuk diverifikasi. Peraturan Menteri Kesehatan Nomor 16 Tahun 2019 mengamanatkan pemantauan data dan analisis data klaim sebagai bagian dari upaya kendali mutu dan kendali biaya. Penelitian ini mengembangkan dan membandingkan dua pendekatan pembelajaran mesin Isolation Forest untuk menandai klaim yang memerlukan verifikasi lebih lanjut: model 1 (pooled) yang mendeteksi anomali lintas seluruh diagnosis, dan model 2 (within-diagnosis) yang mendeteksi anomali relatif terhadap klaim dengan diagnosis yang sama. Analisis potong lintang dilakukan terhadap 1.035.528 klaim rawat inap dari data sampel BPJS Kesehatan (2017–2024) dengan sebelas fitur hasil feature engineering. Model 2 dijalankan pada 266 kelompok diagnosis (ICD-10 3-digit, n≥500), dan klaim di atas persentil ke-95 ditandai sebagai kandidat verifikasi pada masing-masing model. Masing-masing model menandai sekitar 52.000 klaim (5%), namun hanya 25.009 (2,4%) yang ditandai oleh kedua model secara simultan. J18 (pneumonia), E11 (diabetes melitus tipe 2), dan Z51 (kemoterapi) merupakan tiga diagnosis dengan jumlah klaim tertinggi yang ditandai oleh kedua model. Masing-masing model menunjukkan perbedaan pada diagnosis tertentu. Misalnya, pada kode H33 (retinal detachment) ditandai 83,8% oleh model 1, namun hanya 5,1% oleh model 2. Contoh lainnya, D66 (hemofilia) ditandai 87,8% oleh model 1, namun 15,2% oleh model 2. Masing-masing model menangkap pola anomali yang berbeda. Kombinasi kedua pendekatan menyediakan sistem prioritisasi klaim untuk audit berbasis risiko guna mendukung implementasi kendali mutu dan kendali biaya.