Transform

홈페이지 운영본과 개인 보존본 분리

탐사차 홈페이지에서 바로 보여줄 파일과 1차 이주권 개인 데이터센터에 보관할 원본은 다릅니다. 원본은 손대지 않고 보존하며, 홈페이지에는 썸네일, 압축 이미지, 미리보기, 텍스트 추출본 같은 가공본을 사용합니다. 성인 전용 자료는 공개 가능한 가공본과 비공개 원본을 더 엄격히 분리합니다.

원본은 1차 이주권 개인 데이터센터에 보존하고, 서비스용 파생 파일은 탐사차 서버에서 빠르게 제공합니다.
이미지

이미지

리사이즈, WebP/PNG 변환, 썸네일, 워터마크, EXIF 정리, 캡쳐 검수.

문서

문서

PDF 텍스트 추출, OCR, 페이지 이미지화, 제목·본문·표 분리.

데이터

데이터

CSV, JSON, XML을 표준 스키마로 정규화하고 오류 행을 분리합니다.

콘텐츠

콘텐츠

기사 원고, 게시판 글, 캡쳐 설명을 공개용 본문과 개인 보관 메모로 나눕니다.

성인 자료

성인 자료

원본, 검수본, 공개 가능본, 비공개 보관본을 분리하고 자동 공개를 막습니다.