스팸 및 텍스트 분류를 위한 베이지안 필터링을 객체 지향 프로그래밍(OOP)으로 깔끔하게 구현할 수 있는 좋은 방법이 있는지 궁금합니다. 이것은 단지 학습 목적입니다.
난 절대로 추천합니까 웨카 에 Java 로 작성된 오픈 소스 데이터 마이닝 소프트웨어 :
>. 웨카 기계 학습 알고리즘을 위한 데이터 마이닝 이동작업 모음입니다. 이 알고리즘을 적용할 수도) 에서 직접 전화를 걸어 자신의 데이터세트를 또는 자바 코드를. 웨카 map_layer 도구, 데이터 처리, 분류, 회귀 클러스터링에는 연관입니다 규칙, 시각화. 또 신제품 개발에 적합한 기계 학습 구성표과.
앞서 언급한 대로, 이 같은 여러 다른 분류기의 출고됩니다 SVM, [키질] [3], C4.5, 나이브 베이즈 (당연히) 등의 많은 (자세한 내용은 apiu doc). 단, 나이브 베이즈 것보다 훨씬 많은 것으로 알려진 분류기의 성능 분야에서 스팸 검사 또는 텍스트 분류.
또 웨카 장점은 매우 [강력한 gui 를] [6].
[3]: http://en.wikipedia.org/wiki/Winnow_% 28algorithm% 29
[6]: http://www.cs.waikato.ac.nz/ ~ ml/weka/gui_explorer.html
https://ci-bayes.dev.java.net/][1] 또는 http://www.cs.cmu.edu/~javabayes/Home/node2.html?
저도 한 번도 사용해 본 적이 없습니다.
6 장 체크아웃합니다 [프로그래밍 집단 지성] (http://www.amazon.com/programming-collective-intelligence-building-applications/dp/ 0596529325)