PDF 문서에서 글씨를 매우 작게 해도 되나요?

최종 수정: 2026. 2. 2.

Q. PDF 용량을 줄이기 위해 글씨를 매우 작게 해도 될까요?

PDF 문서는 마우스로 드래그가 되니까 컴퓨터가 텍스트를 인식하는 데 문제가 없을 것 같습니다. 용량 절약을 위해 폰트 사이즈를 아주 작게 줄여서 업로드해도 괜찮을까요?

A. 안 됩니다. 폰트 크기는 일반적인 크기(10~11pt)를 권장합니다.

사람이 읽기 힘든 글씨는 AI도 읽기 힘듭니다. 글씨를 임의로 작게 줄여서 업로드하면 챗봇의 성능이 심각하게 저하될 수 있습니다.

그 이유를 3단계로 나누어 자세히 설명해 드리겠습니다.


1. AI는 문서를 '읽는' 게 아니라 '보는' 것부터 시작합니다 (OCR)

우리가 업로드한 PDF 파일을 AI(RAG 시스템)가 인식할 때, 단순히 텍스트만 긁어오는 것이 아닙니다. 많은 경우 광학 문자 인식(OCR) 기술을 통해 문서를 분석합니다.

  • 이미지 기반 PDF : 스캔한 문서나 이미지로 변환된 PDF는 AI에게 '글자'가 아닌 '그림'으로 보입니다.
  • 디지털 텍스트 PDF : 텍스트가 드래그되는 문서라도, 폰트가 지나치게 작으면 텍스트 추출 과정에서 줄바꿈이나 띄어쓰기 정보가 손실될 위험이 있습니다.

2. 글자가 작으면 '해상도'가 부족해집니다

AI가 글자를 인식하려면 글자를 구성하는 점(Pixel) 들이 충분해야 합니다. 폰트가 너무 작으면 이 점들이 뭉개져 보입니다.

  • 폰트가 작을 경우 (8pt 미만): 글자를 표현하는 픽셀 수가 부족해져, 'ㅇ'과 'ㅁ' 을 구별하지 못하거나 'ㅣ(모음)'와 'l(영어 소문자)' 을 혼동하게 됩니다.
  • 폰트가 적절할 경우 (10~11pt 이상): 획의 굵기와 곡선이 명확하게 드러나 AI가 정확하게 글자를 인식합니다.

3. "쓰레기가 들어가면, 쓰레기가 나옵니다" (Garbage In, Garbage Out)

작은 폰트로 인해 발생한 오타는 단순히 글자 한두 개가 틀리는 문제로 끝나지 않고, 챗봇 전체를 망가뜨립니다.

  1. 텍스트 손상 : "클라우드튜링"이 "클라두드튜링"으로 잘못 인식됩니다.
  2. 검색 실패 : 사용자가 "클라우드튜링 가격"을 물어봐도, AI는 문서에서 "클라두드튜링"만 찾을 수 있어 "관련 정보를 찾을 수 없습니다" 라고 대답합니다.
  3. 환각 현상 (Hallucination) : 잘못 인식된 정보를 억지로 해석하려다 보니, AI가 전혀 엉뚱한 거짓말을 지어낼 확률이 높아집니다.

✅ 결론
문서를 업로드할 때는 사람이 편안하게 읽을 수 있는 크기(10pt 이상) 로 작성해 주세요. 사람이 읽기 좋은 문서가 AI에게도 가장 좋은 학습 자료입니다.