Aku bertanya-tanya jika ada yang baik dan bersih pemrograman berorientasi objek (OOP) pelaksanaan Bayesian filtering spam dan klasifikasi teks? Ini hanya untuk tujuan pembelajaran.
Saya merekomendasikan Weka yang merupakan Open Source Software Data Mining ditulis dalam Java:
Weka adalah kumpulan dari algoritma mesin pembelajaran data mining tugas. Algoritma yang baik dapat diterapkan secara langsung ke dataset atau disebut dari kode Java. Weka berisi alat-alat untuk data pre-processing, klasifikasi, regresi, clustering, association rules, dan visualisasi. Hal ini juga cocok untuk mengembangkan mesin baru skema pembelajaran.
Seperti disebutkan di atas, itu kapal dengan sekelompok dari berbagai kelompok seperti SVM, Menampi, C4.5, Naif Bayes (tentu saja) dan masih banyak lagi (lihat API doc). Perhatikan bahwa banyak kelompok yang dikenal memiliki jauh lebih baik kinerja dari Naive Bayes di bidang deteksi spam atau klasifikasi teks.
Selanjutnya Weka membawa anda sangat GUI yang kuat...
Mungkin https://ci-bayes.dev.java.net/ atau http://www.cs.cmu.edu/~javabayes/Home/node2.html?
Saya pernah bermain dengan sangat baik.
Berikut ini merupakan implementasi dari Bayesian filtering di C#: A Naive Bayesian Spam Filter untuk C# (hosted on CodeProject).