티스토리 뷰
목차
반응형
안녕하세요. 회사에서 혹은 학교 과제 때문에 PDF 파일의 텍스트를 인식해야 하는 일, 종종 있으시죠? 오늘은 PDF 파일의 텍스트를 챗GPT를 이용해 1분만에 추출하는 방법 알려드릴게요!
📌 ChatGPT를 활용한 PDF 텍스트 추출 가이드
아래의 순서대로 하기 전에 챗GPT 사이트에 가서 로그인 후 추출하려는 PDF 파일을 업로드하세요.
그리고 아래에 작성해드린 프롬프트 중에 필요한 내용의 프롬프트를 사용해서 텍스트를 추출하시면 됩니다.
1. 기본적인 PDF 텍스트 추출
이 PDF 파일의 텍스트를 추출해 주세요.
2. 페이지 범위 지정
이 PDF 파일에서 1~5페이지의 텍스트만 추출해 주세요.
3. 텍스트 포맷 조정
문단별로 정리하고, 불필요한 개행을 제거해 주세요.
4. 표(테이블) 데이터 추출
PDF에서 표 데이터를 추출하여 CSV 형식으로 변환해 주세요.
5. 특정 키워드 포함 부분만 추출
"인공지능"이라는 단어가 포함된 문장만 추출해 주세요.
6. 요약 및 분석 요청
PDF 텍스트를 추출한 후, 핵심 내용을 3줄로 요약해 주세요.
7. OCR(이미지 PDF) 텍스트 추출
이 PDF는 이미지 기반 문서입니다. OCR을 사용하여 텍스트를 추출해 주세요.
✅ 최종 예시 (완벽한 프롬프트)
이 PDF 파일에서 1~5페이지의 텍스트를 추출한 후,
- 문단별로 정리하고
- 불필요한 개행을 제거한 후
- 핵심 내용을 3줄로 요약해 주세요.
또한, "결론"이라는 키워드가 포함된 문장이 있으면 따로 표시해 주세요.
🎯 기타 프롬프트
- 단순 추출: "이 PDF 파일의 텍스트를 추출해 주세요."
- 페이지 지정: "1~5페이지 텍스트만 추출해 주세요."
- 포맷 정리: "문단별로 정리하고 개행 제거해 주세요."
- 표 추출: "표 데이터를 CSV로 변환해 주세요."
- 키워드 검색: "OOO 단어가 포함된 문장만 추출해 주세요."
- 요약 요청: "핵심 내용을 3줄 요약해 주세요."
- OCR 사용: "OCR을 사용하여 이미지 PDF에서 텍스트를 추출해 주세요."
이제 필요에 맞게 프롬프트를 작성해 보세요! 🚀😊
어때요? 생각보다 어렵지 않으시죠? 조금씩 챗GPT와 친해지셔서, 업무시간을 확~ 줄여보세요!
반응형