자동분류엔진기능

  • SCD 파일을 자동분류엔진의 input 데이터로 정의
  • 분류결과를 DB로 저장
  • 학습/분류 알고리즘(KNN, SVM light, SVM sgd, LR, NB 등)
  • 하나의 문서가 여러 카테고리에 분류되는 다중 분류 기능
  • Boolean 연산을 사용하는 rule 분류 기능
  • Rule 추천을 위한 rule induction 기능
  • 관리자 지정 분류 기능
  • 실시간 분류 기능
  • 다국어 지원(UTF-8)
  • 재학습 기능
  • 계층형 분류 기능
  • 분류 결과에 대한 score 부여

자동분류엔진 API

  • Taxonomy 관리기능 API: 생성, 삭제
  • 분류 모델 생성 (학습) API: 알고리즘 선택 및 파라미터 입력
  • 분류를 위한 API: 분류요청, 모델관리
  • Rule 관련 API: rule induction 요청, rule 추가
  • 특정 Taxonomy 작업현황 조회 API
  • java wrapper: 특정 API를 위한 request, response XML 생성

자동분류관리

  • Multi Category(하위/형제) 생성/수정/삭제 기능
  • Category Drag & Drop 기능
  • SCD 로딩 후 문서를 분석하여 Category자동 생성
  • Category 정보를 xml 파일로 export, 반대로 import 기능
  • SCD를 통한 학습 문서 일괄할당, 관리자에 의한 학습문서 할당
  • 학습 실행 기능(초기학습, 학습문서 변경에 따른 재학습)
  • 분류 실행 기능
  • 분류 rule 강제 지정 기능(Boolean에 의한 지정, 복수 개 지정)
  • 문서이동 기능(Drag & Drop에 의한 이동)
  • 분류된 문서의 Category정보 변경, 분류된 문서 분류대기 이동
  • 미분류 문서 특정 Category로 이동 또는 분류대기로 이동
  • Category 정보를 xml 파일로 export, 반대로 import 기능

Taxonomy 정보

  • Taxonomy 생성/수정/삭제 기능
  • Taxonomy 디렉토리 설정
  • 실시간 분류 On/Off 설정
  • Taxonomy 기본 정보 보기

문서관리

  • 학습/분류/미분류/분류대기 문서에 대한 관리
  • 문서 검색/보기/삭제 기능
  • 문서를 기준으로 분류된 카테고리 정보 보기
  • 분류된 문서의 score확인

Rule Induction

  • 분류 규칙 추천 기능: 학습문서를 기준으로 rule 자동 추천
  • Rule induction 실행 기능
  • 추천 rule 수용/삭제 기능: 수용할 경우 분류 rule로 자동 등록

시스템 모니터링

  • 모듈 상태보기 기능
  • 로그확인 기능

시스템 구성

clssifier_diagram2