수집 / 추출 기능

  • 수집등록 마법사
  • 웹페이지 수집
  • 자바스크립트 처리
  • 인증페이지 수집
  • 첨부파일 수집 및 파일 이름 추출
  • 이미지 수집
  • 댓글/답글의 수집
  • 팝업창으로 연결된 내용 페이지 수집
  • 선별적 정보 수집
  • 항목별 데이터 추출
  • 다국어 데이터 지원
  • 지속적으로 안정적인 수집
  • 댓글 페이지의 페이징 지원
  • 검색페이지에 질의어 입력 수집
  • 수집페이지의 스크린샷
  • 표준 RSS 본문 수집
  • 기존 문서 업데이트 및 데드링크 체크
  • 첨부파일 이름 자동추천

필터링 기능

  • 패턴기반 데이터 필터링
  • 중복문서 정책 강화
  • Title, Contents 등 항목 별 중복 체크
  • URL 중복 체크 필터링
  • 필터링 자동 추천

저장기능

  • 수집기 자체 저장 기능
  • 원하는 항목별 추출 저장
  • 첨부파일, 이미지 저장
  • 사용자 지정 이관 기능
  • ODBC 지원

관리/기타 기능

  • 수집기 작업 스케줄링
  • 자동화되고 편의성이 향상된 룰 등록
  • 직관적인 UI 기반의 룰 관리
  • 반복적인 규칙 등록의 간소화
  • 수집 상태/에러/결과에 대한 보고
  • 수집기 리소스 관리를 통한 안정적 수집
  • 웹관리 도구를 통한 통계 및 데이터 조회
  • 정보원 분류 관리
  • 정보원 변경 시 알림 기능
  • 필드별 적용 필터 자동 추천
  • Side, Seed 검색 기능
  • 정확한 시뮬레이터
  • 멀티 룰 테스트 기능
  • 여러 DB 포맷 사용 가능

시스템 구성

infofinder_diagram2