자주 묻는 질문
이미지표 엑셀 OCR 에 대한 15개 질문.
- Q1. 정말 서버로 업로드되지 않나요?
- 네. 이 도구는 AWS S3 정적 호스팅이며 이미지·텍스트를 받을 백엔드가 존재하지 않습니다. 개발자도구 Network 탭을 열고 OCR 을 실행하면 업로드 트래픽이 0바이트인 것을 직접 확인할 수 있습니다. 페이지 최초 로드 이후 네트워크를 끊어도 동작합니다(언어 모델이 캐시된 이후).
- Q2. 어떤 이미지 형식이 지원되나요?
- PNG · JPG · WEBP 를 지원합니다. 브라우저가 읽을 수 있는 다른 이미지(GIF, BMP 등) 도 대부분 동작하지만 공식 테스트는 앞 세 가지입니다. PDF 는 현재 미지원이며 PDF 페이지를 PNG 로 내보내어 업로드해 주세요.
- Q3. 한국어 정확도는 얼마나 되나요?
- tesseract.js 의 한국어 모델(kor) 은 인쇄된 깔끔한 표에서 95%+ 정확도, 일반 웹·앱 스크린샷에서 80~90% 수준입니다. 손글씨·스캔 품질이 낮은 문서는 60% 아래로 떨어질 수 있습니다. 숫자·영문·특수기호가 많은 표는 한국어보다 오히려 더 정확합니다(영어 모델이 함께 동작).
- Q4. CLOVA OCR 이나 Google Vision 을 쓰지 않는 이유는?
- 그쪽 API 는 정확도는 높지만 (1) 유료 전환이 필요하고 (2) 이미지를 외부 서버로 보내야 합니다. 본 도구는 브라우저-only 무료를 우선한 제품이라 tesseract.js 를 기본으로 씁니다. 사내용으로 CLOVA OCR 정확도가 필요하면 온프레미스 변형을 문의해 주세요.
- Q5. 얼마나 큰 이미지까지 올릴 수 있나요?
- 실무적으로 5MB · 긴 변 3000px 이하를 권장합니다. 그 이상이면 브라우저 메모리가 압박을 받아 탭이 먹통이 될 수 있습니다. 더 큰 이미지는 표 부분만 잘라서 올리면 훨씬 빠르고 정확합니다.
- Q6. 왜 첫 실행이 오래 걸리나요?
- 한국어 모델(~12MB) 과 영어 모델(~8MB) 을 CDN 에서 1회 다운로드해 브라우저(IndexedDB) 에 캐시하기 때문입니다. 이후 같은 브라우저에서는 즉시 OCR 이 시작됩니다.
- Q7. 행·열이 잘못 분리됐어요. 어떻게 고치나요?
- 결과 표의 아무 셀이나 더블클릭 하면 수정할 수 있습니다. 행 전체가 잘못됐다면 왼쪽 체크박스로 선택 후 "선택 행 삭제". 행이 빠졌으면 "행 추가" 로 맨 아래에 빈 행을 만들고 수동 입력. 열 구조를 크게 바꿔야 한다면 XLSX 로 먼저 내보낸 뒤 엑셀에서 편집하는 편이 빠릅니다.
- Q8. 한글 "원" / "%" 같은 기호가 자꾸 깨집니다.
- 본 도구는 셀별 후처리로
12,345 원같은 공백을12,345원으로 자동 결합합니다. 그러나 OCR 단계에서 이미 글자 자체가 손상된 경우는 복원되지 않습니다. 이 경우 이미지 해상도를 올리거나, 셀 더블클릭으로 직접 수정해 주세요. - Q9. 병합 셀은 어떻게 처리되나요?
- 이 도구는 이미지 픽셀만 볼 뿐 셀 병합 정보를 알 수 없으므로, 병합된 구간의 텍스트는 해당 구간에 포함된 모든 열의 "가장 왼쪽 열" 셀로 들어가는 경향이 있습니다. 필요 시 결과 표에서 셀을 다른 칸으로 잘라 옮기거나 XLSX 로 내보낸 뒤 엑셀에서 병합을 복원하세요.
- Q10. 결과를 구글 스프레드시트로 바로 붙여넣을 수 있나요?
- XLSX 로 다운로드 후 구글 스프레드시트의 "파일 → 가져오기" 로 여는 방식이 가장 안정적입니다. CSV 다운로드는 UTF-8 BOM 포함이므로 구글 스프레드시트 / 엑셀 모두 한글이 안 깨집니다. 향후 "클립보드 복사" 버튼을 추가할 예정입니다.
- Q11. PDF 여러 페이지 일괄 변환도 지원하나요?
- 현재 MVP 에서는 이미지 1장씩만 지원합니다. PDF 일괄 처리는 로드맵에 있습니다. 지금 단계에서는 엑셀의 "PDF → 스크린샷" 또는 macOS 미리보기로 페이지를 PNG 로 내보낸 뒤 한 장씩 처리해 주세요.
- Q12. 모바일에서도 되나요?
- iOS Safari 16 이상, Android Chrome 에서 동작합니다. 모바일은 메모리·CPU 제약이 있어 2MP 이하 표 이미지 정도가 적합합니다. 큰 이미지는 데스크톱을 권장합니다.
- Q13. 데이터를 저장하거나 로그를 남기나요?
- GA4 와 네이버 애널리틱스를 이용한 방문 수 집계만 수행합니다. 업로드한 이미지나 인식된 텍스트는 어떠한 서버에도 저장되지 않습니다(애초에 전송 자체가 없습니다). 브라우저 localStorage 에는 언어 토글 설정만, IndexedDB 에는 tesseract 언어 모델 캐시만 저장됩니다.
- Q14. 회사 보안 정책으로 파일 업로드가 금지되어 있어요. 써도 되나요?
- 이 도구는 정적 호스팅(S3 + CloudFront) 이며 이미지·텍스트를 받을 백엔드 자체가 존재하지 않습니다. 파싱과 OCR은 브라우저 안의 tesseract.js WebAssembly 런타임에서만 해석됩니다. 일부 기업은 외부 JS 실행도 제약하므로 보안팀 정책을 먼저 확인하세요. 필요시 온프레미스 배포도 가능합니다(문의).
- Q15. 손글씨 표도 인식되나요?
- 현재 사용하는 tesseract.js 모델은 인쇄체 특화로, 손글씨 정확도는 낮습니다(30~50%). 손글씨 표는 한 줄씩 이미지로 쪼개어 여러 번 돌리면 조금 나아지지만, 전용 손글씨 OCR(예: CLOVA OCR) 이 필요한 영역입니다.