티스토리 뷰

목차



    반응형

    PDF파일 텍스트 추출

     

     

    안녕하세요. 회사에서 혹은 학교 과제 때문에 PDF 파일의 텍스트를 인식해야 하는 일, 종종 있으시죠? 오늘은 PDF 파일의 텍스트를 챗GPT를 이용해 1분만에 추출하는 방법 알려드릴게요!

     

     

    📌 ChatGPT를 활용한 PDF 텍스트 추출 가이드

    아래의 순서대로 하기 전에 챗GPT 사이트에 가서 로그인 후 추출하려는 PDF 파일을 업로드하세요.

     

    PDF파일 텍스트 추출
    PDF파일 텍스트 추출

     

    그리고 아래에 작성해드린 프롬프트 중에 필요한 내용의 프롬프트를 사용해서 텍스트를 추출하시면 됩니다.

     

     

    1. 기본적인 PDF 텍스트 추출

    이 PDF 파일의 텍스트를 추출해 주세요.

    PDF파일 텍스트 추출
    PDF파일 텍스트 추출

    2. 페이지 범위 지정

    이 PDF 파일에서 1~5페이지의 텍스트만 추출해 주세요.

     

    PDF파일 텍스트 추출
    PDF파일 텍스트 추출

     

     

    3. 텍스트 포맷 조정

    문단별로 정리하고, 불필요한 개행을 제거해 주세요.

     

    PDF파일 텍스트 추출
    PDF파일 텍스트 추출

     

    4. 표(테이블) 데이터 추출

    PDF에서 표 데이터를 추출하여 CSV 형식으로 변환해 주세요.

     

    PDF파일 텍스트 추출
    PDF파일 텍스트 추출

     

    5. 특정 키워드 포함 부분만 추출

    "인공지능"이라는 단어가 포함된 문장만 추출해 주세요.

     

    PDF파일 텍스트 추출
    PDF파일 텍스트 추출

     

    6. 요약 및 분석 요청

    PDF 텍스트를 추출한 후, 핵심 내용을 3줄로 요약해 주세요.

     

    PDF파일 텍스트 추출
    PDF파일 텍스트 추출

     

    7. OCR(이미지 PDF) 텍스트 추출

    이 PDF는 이미지 기반 문서입니다. OCR을 사용하여 텍스트를 추출해 주세요.

     

    PDF파일 텍스트 추출
    PDF파일 텍스트 추출

     

     

    ✅ 최종 예시 (완벽한 프롬프트)

    이 PDF 파일에서 1~5페이지의 텍스트를 추출한 후,
    - 문단별로 정리하고
    - 불필요한 개행을 제거한 후
    - 핵심 내용을 3줄로 요약해 주세요.
    또한, "결론"이라는 키워드가 포함된 문장이 있으면 따로 표시해 주세요.

     

    🎯 기타 프롬프트

    • 단순 추출: "이 PDF 파일의 텍스트를 추출해 주세요."
    • 페이지 지정: "1~5페이지 텍스트만 추출해 주세요."
    • 포맷 정리: "문단별로 정리하고 개행 제거해 주세요."
    • 표 추출: "표 데이터를 CSV로 변환해 주세요."
    • 키워드 검색: "OOO 단어가 포함된 문장만 추출해 주세요."
    • 요약 요청: "핵심 내용을 3줄 요약해 주세요."
    • OCR 사용: "OCR을 사용하여 이미지 PDF에서 텍스트를 추출해 주세요."

    이제 필요에 맞게 프롬프트를 작성해 보세요! 🚀😊

    어때요? 생각보다 어렵지 않으시죠? 조금씩 챗GPT와 친해지셔서, 업무시간을 확~ 줄여보세요!

     

     

    반응형