Claude로 텍스트에서 표 데이터 깔끔하게 뽑아내기

보고서·웹 자료·이메일 본문에 흩어진 숫자와 항목을 Claude에게 던져 한 번에 정돈된 표(마크다운·CSV)로 받아내는 실전 프롬프트 패턴을 정리했습니다.

이런 상황에 쓰면 좋아요

여러 보도자료·이메일·고객 후기 같은 줄글에서 “회사명·금액·날짜"만 뽑아 엑셀에 정리하고 싶을 때, 손으로 한 줄씩 옮기다 보면 반나절이 그냥 사라집니다. Claude는 줄글을 읽고 마크다운·CSV 형식의 표로 바로 정돈해 줘서, 뽑아낸 결과를 스프레드시트에 그대로 붙여 넣을 수 있습니다.

준비물

  • Claude.ai 계정 (무료 플랜으로 시작 가능, 2026년 4월 기준 기본 모델은 Sonnet 4.6)
  • 무료 플랜은 한 대화에 파일 20개, 합계 30MB까지 업로드할 수 있고, 일일 메시지 한도는 사용량 기준으로 약 20~30회 수준에서 제한됩니다.
  • 추출 대상 텍스트(이메일·웹 페이지 복붙·PDF 등). 여러 개라면 파일로 한꺼번에 첨부하는 편이 안정적입니다.

단계별 사용법

  1. 결과의 “스키마"부터 정합니다. 뽑고 싶은 컬럼을 먼저 적으세요. 예: 회사명 | 발표일 | 투자금액(USD) | 투자단계 | 출처 문장. 컬럼이 명확하면 환각이 크게 줄어듭니다.
  2. 원문을 그대로 붙여 넣습니다. 요약·번역하지 말고 원본 텍스트를 통째로 줘야 인용 정확도가 높습니다.
  3. “본문에 없는 값은 비우라"는 규칙을 명시합니다. 빈칸 처리 규칙이 없으면 Claude가 추측으로 칸을 채울 수 있습니다.
  4. 출력 형식을 마크다운 표 + CSV 두 가지로 요청합니다. 마크다운 표는 검토용, CSV는 스프레드시트 붙여넣기용으로 동시에 받으면 편합니다.
  5. 각 행마다 “근거 문장"을 같이 출력하라고 시킵니다. 행 옆에 원문 한 줄이 붙으면 검수가 5배 빨라집니다.
  6. 재검토 한 번을 추가합니다. “위 표를 다시 검토해서 누락된 항목, 잘못 매칭된 행이 있으면 수정해 줘” 한 줄을 붙이면 정확도가 올라갑니다.
  7. 결과를 Artifact로 받아 다운로드합니다. Claude가 만든 표를 Artifact에 띄우면 CSV 파일로 바로 내려받을 수 있습니다.

결과 예시

아래 프롬프트를 그대로 사용해 보세요.

[역할] 너는 정형 데이터 추출에 능한 분석가야.
[원문]
"엔비프 리서치는 2026년 3월 5일 시리즈 B로 4,200만 달러를 유치했다.
한편 같은 달 12일, 트랜식트는 2,000만 달러 규모의 시드 라운드를 마무리했다.
또한 4월 1일 펄스AI가 시리즈 A로 1,500만 달러를 받은 것으로 알려졌다."

[추출 스키마]
회사명 | 발표일(YYYY-MM-DD) | 투자금액(USD) | 투자단계 | 근거 문장

[규칙]
- 본문에 없는 값은 빈칸으로 둘 것.
- 추측·외부 지식 추가 금지.
- 출력은 ① 마크다운 표 ② 동일 내용 CSV 두 가지로.

이런 식의 답이 돌아옵니다.

회사명발표일투자금액(USD)투자단계근거 문장
엔비프 리서치2026-03-0542,000,000시리즈 B“엔비프 리서치는 2026년 3월 5일 시리즈 B로 4,200만 달러를 유치했다.”
트랜식트2026-03-1220,000,000시드“한편 같은 달 12일, 트랜식트는 2,000만 달러 규모의 시드 라운드를 마무리했다.”
펄스AI2026-04-0115,000,000시리즈 A“또한 4월 1일 펄스AI가 시리즈 A로 1,500만 달러를 받은 것으로 알려졌다.”
회사명,발표일,투자금액(USD),투자단계,근거 문장
엔비프 리서치,2026-03-05,42000000,시리즈 B,"엔비프 리서치는 2026년 3월 5일 시리즈 B로 4,200만 달러를 유치했다."

자주 발생하는 문제

  • 숫자 단위가 섞여요(억/만/달러). → 스키마 컬럼명에 단위를 못 박으세요. 투자금액(USD)처럼 단위를 컬럼명에 명시하면 자동 환산해 줍니다.
  • 빈칸 대신 “정보 없음” 같은 한국어가 들어가요. → “빈 셀은 빈 문자열로만 둘 것” 한 줄을 추가하세요.
  • 여러 사건이 한 문장에 묶여 있을 때 행이 누락돼요. → “한 문장에 사건이 두 개면 두 행으로 분리” 규칙을 명시합니다.
  • CSV에 쉼표·따옴표가 깨져요. → “값에 쉼표가 있으면 큰따옴표로 감쌀 것"을 규칙에 넣고, 출력 후 첫 줄과 마지막 줄을 한 번 검수하세요.

더 효율적으로 쓰는 팁

  1. 스키마를 “프로젝트"에 저장해 두세요. Claude의 Projects 기능에 자주 쓰는 스키마와 규칙을 시스템 프롬프트로 넣어두면 매번 적지 않아도 됩니다.
  2. 대용량은 분할해서 받으세요. 30MB·20파일 한도를 넘기면 업로드가 막힙니다. 200페이지짜리 PDF는 50페이지 단위로 잘라 올리는 편이 안정적입니다.
  3. 검수는 “샘플 5행 무작위 추출"로. 모든 행을 사람이 검토하기 어려우니 무작위 5행만 원문과 대조해도 정확도를 짐작할 수 있습니다.
  4. 표 → 차트는 Artifact 한 번 더. 추출이 끝난 표를 그대로 두고 “이 표를 막대차트로 시각화해 줘"라고 하면 인터랙티브 차트를 즉석에서 만들어 줍니다.
  5. 반복 작업은 같은 대화창에서 이어가세요. 한 대화창 안에서는 앞서 정한 스키마와 규칙을 기억하므로, 새 원문만 붙여 넣어도 바로 같은 형식으로 정리해 줍니다.

마치며

스키마 정의 → 원문 첨부 → “근거 문장 함께” 규칙. 이 세 가지만 지켜도 줄글에서 표 데이터를 뽑는 작업이 반나절짜리에서 10분짜리로 줄어듭니다. 더 긴 PDF를 다루는 작업은 Claude로 PDF 30페이지를 5분 안에 요약하는 법에서 이어 보시고, 출처가 중요한 리서치는 Perplexity로 출처 있는 리서치 답변 받기도 도움이 됩니다.

Hugo로 만듦
JimmyStack 테마 사용 중