이런 상황에 쓰면 좋아요
여러 보도자료·이메일·고객 후기 같은 줄글에서 “회사명·금액·날짜"만 뽑아 엑셀에 정리하고 싶을 때, 손으로 한 줄씩 옮기다 보면 반나절이 그냥 사라집니다. Claude는 줄글을 읽고 마크다운·CSV 형식의 표로 바로 정돈해 줘서, 뽑아낸 결과를 스프레드시트에 그대로 붙여 넣을 수 있습니다.
준비물
- Claude.ai 계정 (무료 플랜으로 시작 가능, 2026년 4월 기준 기본 모델은 Sonnet 4.6)
- 무료 플랜은 한 대화에 파일 20개, 합계 30MB까지 업로드할 수 있고, 일일 메시지 한도는 사용량 기준으로 약 20~30회 수준에서 제한됩니다.
- 추출 대상 텍스트(이메일·웹 페이지 복붙·PDF 등). 여러 개라면 파일로 한꺼번에 첨부하는 편이 안정적입니다.
단계별 사용법
- 결과의 “스키마"부터 정합니다. 뽑고 싶은 컬럼을 먼저 적으세요. 예:
회사명 | 발표일 | 투자금액(USD) | 투자단계 | 출처 문장. 컬럼이 명확하면 환각이 크게 줄어듭니다. - 원문을 그대로 붙여 넣습니다. 요약·번역하지 말고 원본 텍스트를 통째로 줘야 인용 정확도가 높습니다.
- “본문에 없는 값은 비우라"는 규칙을 명시합니다. 빈칸 처리 규칙이 없으면 Claude가 추측으로 칸을 채울 수 있습니다.
- 출력 형식을 마크다운 표 + CSV 두 가지로 요청합니다. 마크다운 표는 검토용, CSV는 스프레드시트 붙여넣기용으로 동시에 받으면 편합니다.
- 각 행마다 “근거 문장"을 같이 출력하라고 시킵니다. 행 옆에 원문 한 줄이 붙으면 검수가 5배 빨라집니다.
- 재검토 한 번을 추가합니다. “위 표를 다시 검토해서 누락된 항목, 잘못 매칭된 행이 있으면 수정해 줘” 한 줄을 붙이면 정확도가 올라갑니다.
- 결과를 Artifact로 받아 다운로드합니다. Claude가 만든 표를 Artifact에 띄우면 CSV 파일로 바로 내려받을 수 있습니다.
결과 예시
아래 프롬프트를 그대로 사용해 보세요.
[역할] 너는 정형 데이터 추출에 능한 분석가야.
[원문]
"엔비프 리서치는 2026년 3월 5일 시리즈 B로 4,200만 달러를 유치했다.
한편 같은 달 12일, 트랜식트는 2,000만 달러 규모의 시드 라운드를 마무리했다.
또한 4월 1일 펄스AI가 시리즈 A로 1,500만 달러를 받은 것으로 알려졌다."
[추출 스키마]
회사명 | 발표일(YYYY-MM-DD) | 투자금액(USD) | 투자단계 | 근거 문장
[규칙]
- 본문에 없는 값은 빈칸으로 둘 것.
- 추측·외부 지식 추가 금지.
- 출력은 ① 마크다운 표 ② 동일 내용 CSV 두 가지로.
이런 식의 답이 돌아옵니다.
| 회사명 | 발표일 | 투자금액(USD) | 투자단계 | 근거 문장 |
|---|---|---|---|---|
| 엔비프 리서치 | 2026-03-05 | 42,000,000 | 시리즈 B | “엔비프 리서치는 2026년 3월 5일 시리즈 B로 4,200만 달러를 유치했다.” |
| 트랜식트 | 2026-03-12 | 20,000,000 | 시드 | “한편 같은 달 12일, 트랜식트는 2,000만 달러 규모의 시드 라운드를 마무리했다.” |
| 펄스AI | 2026-04-01 | 15,000,000 | 시리즈 A | “또한 4월 1일 펄스AI가 시리즈 A로 1,500만 달러를 받은 것으로 알려졌다.” |
회사명,발표일,투자금액(USD),투자단계,근거 문장
엔비프 리서치,2026-03-05,42000000,시리즈 B,"엔비프 리서치는 2026년 3월 5일 시리즈 B로 4,200만 달러를 유치했다."
자주 발생하는 문제
- 숫자 단위가 섞여요(억/만/달러). → 스키마 컬럼명에 단위를 못 박으세요.
투자금액(USD)처럼 단위를 컬럼명에 명시하면 자동 환산해 줍니다. - 빈칸 대신 “정보 없음” 같은 한국어가 들어가요. → “빈 셀은 빈 문자열로만 둘 것” 한 줄을 추가하세요.
- 여러 사건이 한 문장에 묶여 있을 때 행이 누락돼요. → “한 문장에 사건이 두 개면 두 행으로 분리” 규칙을 명시합니다.
- CSV에 쉼표·따옴표가 깨져요. → “값에 쉼표가 있으면 큰따옴표로 감쌀 것"을 규칙에 넣고, 출력 후 첫 줄과 마지막 줄을 한 번 검수하세요.
더 효율적으로 쓰는 팁
- 스키마를 “프로젝트"에 저장해 두세요. Claude의 Projects 기능에 자주 쓰는 스키마와 규칙을 시스템 프롬프트로 넣어두면 매번 적지 않아도 됩니다.
- 대용량은 분할해서 받으세요. 30MB·20파일 한도를 넘기면 업로드가 막힙니다. 200페이지짜리 PDF는 50페이지 단위로 잘라 올리는 편이 안정적입니다.
- 검수는 “샘플 5행 무작위 추출"로. 모든 행을 사람이 검토하기 어려우니 무작위 5행만 원문과 대조해도 정확도를 짐작할 수 있습니다.
- 표 → 차트는 Artifact 한 번 더. 추출이 끝난 표를 그대로 두고 “이 표를 막대차트로 시각화해 줘"라고 하면 인터랙티브 차트를 즉석에서 만들어 줍니다.
- 반복 작업은 같은 대화창에서 이어가세요. 한 대화창 안에서는 앞서 정한 스키마와 규칙을 기억하므로, 새 원문만 붙여 넣어도 바로 같은 형식으로 정리해 줍니다.
마치며
스키마 정의 → 원문 첨부 → “근거 문장 함께” 규칙. 이 세 가지만 지켜도 줄글에서 표 데이터를 뽑는 작업이 반나절짜리에서 10분짜리로 줄어듭니다. 더 긴 PDF를 다루는 작업은 Claude로 PDF 30페이지를 5분 안에 요약하는 법에서 이어 보시고, 출처가 중요한 리서치는 Perplexity로 출처 있는 리서치 답변 받기도 도움이 됩니다.