수집 / 추출 기능

  • SNS 수집(트위터, 페이스 북, 미투데이 등)
  • 선별적 정보 수집
  • 댓글/답글의 수집
  • 자바스크립트 처리
  • 인증페이지 수집
  • 수집등록 마법사
  • 웹페이지 수집
  • 이미지 수집
  • 첨부파일 수집 및 파일 이름 추출
  • 팝업창으로 연결된 내용 페이지 수집
  • 첨부파일 이름 자동추천
  • 댓글 페이지의 페이징 지원
  • 검색페이지에 질의어 입력 수집
  • 항목별 데이터 추출
  • 다국어 데이터 지원
  • 지속적으로 안정적인 수집
  • 수집페이지의 스크린샷
  • 표준 RSS 본문 수집
  • 기존 문서 업데이트 및 데드링크 체크

클렌징 기능

  • 중복 문서 정책 강화
  • 패턴기반 데이터 필터링
  • 필터링 자동 추천
  • URL 중복 체크 필터링

저장 기능

  • 사용자 지정 이관 기능 (Hadoop, NoSQL, File, RDBMS 지원)
  • ODBC 지원
  • 첨부파일, 이미지 저장
  • 수집기 자체 저장 기능
  • 원하는 항목별 추출 저장

관리/기타 기능

  • 수집기 작업 스케줄링
  • 자동화되고 편의성이 향상된 룰 등록
  • 직관적인 UI 기반의 룰 관리
  • 반복적인 규칙 등록의 간소화
  • 수집 상태/에러/결과에 대한 보고
  • 수집기 리소스 관리를 통한 안정적 수집
  • 웹관리 도구를 통한 통계 및 데이터 조회
  • 수집대상 분류 관리
  • 필드별 적용 필터 자동 추천
  • 정확한 시뮬레이터
  • 멀티 룰 테스트 기능