이런 상황에 쓰면 좋아요
회의실 화이트보드 사진, 영수증 더미 스캔본, 책 한 페이지를 찍은 휴대폰 사진 — 텍스트를 다시 옮겨 적느라 시간을 쓰셨다면 Gemini가 깔끔하게 줄여줍니다. Gemini는 여러 버전이 모두 멀티모달이고, 이미지 캡셔닝·시각 질의응답·문서 이해를 기본으로 처리합니다(2026년 4월 기준 최신 멀티모달 모델은 Gemini 3 Pro).
준비물
- Google 계정 (Gemini 무료 플랜으로 충분)
- gemini.google.com 접속 또는 Gemini 앱(iOS/Android)
- 분석할 이미지 — JPG/PNG/HEIC가 무난합니다. 글자가 흐릿하면 결과 정확도가 떨어지므로 가능하면 정면·고해상도로 찍어 두세요.
- 무료 플랜으로도 이미지 입력은 가능합니다(이미지 “생성” 한도와 별개로, 이미지 “이해/분석"은 일반 채팅 한도에서 사용).
단계별 사용법
- 새 채팅을 열고 이미지를 업로드합니다. 입력창의 + 또는 클립 아이콘으로 사진을 붙입니다. 한 번에 여러 장 첨부도 됩니다.
- 무엇을 뽑을지 한 줄로 적습니다. “표만 마크다운으로”, “영수증의 품목·금액만 CSV로"처럼 목적이 분명할수록 정확합니다.
- 언어를 지정합니다. “원문 한국어 그대로, 번역 금지” 한 줄을 넣으면 자동 번역 사고를 막을 수 있습니다.
- 모호한 글자 처리 규칙을 정합니다. “흐려서 판독 불가한 부분은
[?]로 표시"라고 적어두면 환각을 막습니다. - 결과를 표로 받습니다. 자유 서술이 아니라 마크다운 표·CSV·JSON 중 하나로 받아야 후속 작업이 편합니다.
- 검수 한 번을 추가합니다. “위 표를 원문 이미지와 다시 대조해서 누락·오타가 있으면 수정해 줘"라고 한 번 더 요청합니다.
- 민감 정보는 자릅니다. 신용카드 번호·주민번호가 보이면 업로드 전에 가리거나 이미지 일부를 잘라내세요.
결과 예시
영수증 사진을 올리고 다음 프롬프트를 던졌다고 가정해 봅시다.
첨부한 영수증 사진을 분석해 줘.
[추출할 항목]
- 가맹점명, 결제일시(YYYY-MM-DD HH:MM), 품목명, 수량, 단가(KRW), 합계(KRW)
[규칙]
- 원문 그대로(한국어 유지, 번역 금지)
- 흐려서 못 읽는 글자는 [?]로 표시
- 본문에 없는 값 추측 금지
- 출력은 ① 마크다운 표 ② 동일 내용 CSV
이런 식으로 답이 옵니다.
| 가맹점명 | 결제일시 | 품목명 | 수량 | 단가(KRW) | 합계(KRW) |
|---|---|---|---|---|---|
| 모카하우스 강남점 | 2026-04-21 14:32 | 아메리카노(R) | 2 | 4,500 | 9,000 |
| 모카하우스 강남점 | 2026-04-21 14:32 | 크루아상 | 1 | 5,800 | 5,800 |
| 모카하우스 강남점 | 2026-04-21 14:32 | (합계) | — | — | 14,800 |
가맹점명,결제일시,품목명,수량,단가(KRW),합계(KRW)
모카하우스 강남점,2026-04-21 14:32,아메리카노(R),2,4500,9000
모카하우스 강남점,2026-04-21 14:32,크루아상,1,5800,5800
자주 발생하는 문제
- 한국어가 영어로 번역돼 나와요. → 프롬프트에 “원문 한국어 유지, 번역 금지"를 명시. Gemini는 사용자의 기본 언어 설정을 따라가는 경향이 있어 영어 번역으로 흐를 때가 있습니다.
- 표 칸이 어긋나요. → “각 행은 원본 이미지의 한 줄과 1:1 대응"이라고 규칙을 추가하세요. 행 분할 기준이 명확해집니다.
- 숫자에 원·콤마·공백이 섞여요. → “숫자 컬럼은 정수 또는 소수만, 단위 기호 제거"를 명시.
- 여러 장을 동시에 처리하면 순서가 섞여요. → 첨부 파일 이름을
01.jpg, 02.jpg식으로 정렬되도록 지정하고, 프롬프트에 “파일 이름 순서대로 처리"라고 적어두세요.
더 효율적으로 쓰는 팁
- 한 장에 너무 많은 정보가 들어 있으면 잘라서 올리세요. 사진 한 장에 표 두 개가 있으면 둘로 나눠 업로드해야 인식률이 올라갑니다.
- 밝기·대비가 낮은 사진은 보정 후 업로드하세요. 휴대폰 기본 사진 앱의 자동 보정만으로도 OCR 결과가 눈에 띄게 좋아집니다.
- “표 + 분석” 한 번에 받으세요. “표를 추출한 뒤, 같은 답변 안에 결제일별 합계를 한 줄로 요약"이라고 시키면 정리·집계가 한 번에 끝납니다.
- 결과를 Google Sheets로 바로 붙여 넣으세요. 마크다운 표보다 CSV로 받아 시트에 붙여 넣는 편이 호환성이 좋습니다.
- Gemini 앱의 “공유 → Gemini로 보내기"를 활용하세요. 사진을 갤러리에서 곧장 Gemini로 던질 수 있어 캡처·재첨부 단계가 사라집니다.
마치며
이미지 첨부 → 추출 항목 명시 → “원문 유지·추측 금지” 규칙 → 표·CSV로 받기. 이 흐름만 익히면 손으로 옮기던 OCR 작업이 1~2분짜리 일이 됩니다. 줄글에서 표 데이터를 뽑는 작업은 Claude로 텍스트에서 표 데이터 깔끔하게 뽑아내기에서, PDF 보고서 요약은 Claude로 PDF 30페이지를 5분 안에 요약하는 법에서 이어 보실 수 있습니다.