지식 베이스로 문서 가져오기 - Notez Nerd Documentation

이 가이드는 기존 자료(논문, 법조항, 연구 노트, 보고서 등)를 Notez Nerd의 로컬 지식 베이스에 가져와서 AI 대화에서 검색, 인용, 확장 및 참조하는 방법을 설명합니다.

1. 지원 파일 형식

유형	확장자	참고
텍스트	.md / .mdx / .txt	Markdown 권장 (구조가 명확)
오피스	.docx / .doc	본문 텍스트만 (복잡한 서식은 단순화)
PDF	.pdf	선택 가능한 텍스트 레이어 추출; 스캔 PDF는 먼저 OCR 필요
구조화	.csv / .json (계획 중)	표 형식 / 구조화 데이터용 (곧 지원 예정)

참고: 암호화된 PDF, 텍스트 레이어가 없는 이미지 스캔, DRM 보호 파일은 인덱싱할 수 없습니다 (먼저 변환 필요).

적합한 상황: 이미 정리된 데스크탑 폴더의 임시 대량 가져오기.

적합한 상황: 소수의 파일을 신중하게 선택할 때.

적합한 상황: 장기 프로젝트 저장소 / 연구 문헌 폴더. 팁: 많은 파일을 이동하거나 이름을 변경하면 재구축이 트리거될 수 있습니다; 유휴 시간에 예약하세요.

가져오기 후 각 파일은 다음을 거칩니다:

상태 표시:

업로드된 후 Notez Nerd는 사용자가 수동 작업을 수행하지 않는 한 아무것도 업데이트하거나 삭제하지 않습니다.

파일이 인용되지 않는 경우: 임베딩 구축 완료를 확인하세요.

Q: PDF에 깨진 문자가 표시되나요? A: 이미지 스캔이거나 사용자 정의 폰트일 가능성이 높습니다. 먼저 OCR을 실행하세요 (예: ocrmypdf).

Q: 새 파일이 매우 늦게 나타나나요? A: 대기열 백로그를 확인하세요; 대용량 파일 / 많은 동시 작업이 대기를 유발합니다. (우선순위 재정렬 계획 중.)

Q: 중복 콘텐츠가 너무 많아 검색에 영향을 주나요? A: 설정에서 "중복 청크 접기"를 활성화하거나 흩어진 노트를 수동으로 통합하세요.

Q: 임베딩 모델 없이 사용할 수 있나요? A: 키워드 검색만 가능; 의미론적 관련성이나 스마트 인용 정렬은 불가능합니다.

Q: 소스 파일을 삭제한 후에도 인용이 남아있나요? A: 이전 인용은 무효로 표시됩니다; 클릭하면 정리가 트리거됩니다.

증상	단계
모든 가져오기 실패	디스크 권한 확인 (macOS 시스템 설정 > 개인 정보 보호 및 보안 > 파일 및 폴더)
단일 파일 실패	로그 확인; UTF-8로 다시 저장 시도
임베딩 정지	임베딩 모델 URL / 키 / 모델 이름 확인
채팅이 로컬 데이터 무시	청크 수 > 0 확인; "오른쪽 사이드 참조"가 선택되었는지 확인
속도 느림	동시성 줄이기; 대용량 PDF 분할; 불필요한 딥 검색 일시 비활성화

가져오기 후 다음을 할 수 있습니다:

— 가져오기 및 인덱싱 가이드 끝