텍스트 색인
파일명, 제목, 설명, OCR 본문, 문서 본문, 게시글 본문을 검색 대상으로 둡니다.
Search & Index
자료가 1차 이주권 개인 데이터센터에 많이 쌓이면 폴더 구조만으로는 찾을 수 없습니다. 홈페이지 글, 캡쳐, 영상, 문서, 로그, 사진, 외부 자료, 성인 전용 민감 자료를 파일명, 본문 텍스트, OCR 결과, 태그, 날짜, 위치, 탐사차 서버, 프로젝트, 공개 등급 단위로 색인해야 합니다.
파일명, 제목, 설명, OCR 본문, 문서 본문, 게시글 본문을 검색 대상으로 둡니다.
날짜, 카테고리, 공개 상태, 성인 전용 여부, 민감 등급, 소유자, 출처, 처리 상태로 좁힙니다.
해시, 파일 크기, 이미지 지문, URL 정규화로 중복과 유사 파일을 찾습니다.
파일을 홈페이지, 게시판, 개인 기록, 탐사차 운용 기록과 연결해 맥락을 만듭니다.