테스트 사이트 - 개발 중인 베타 버전입니다

PDF 파일에서 텍스트 추출 채택완료

1년 전 조회 28,985

서버는 dothome 무료입니다.

.pdf 파일을 업로드 하면 .pdf 파일의 텍스트를 추출하여 필요한 부분을 값으로 가져오고 싶은데

어떤 라이브러리를 사용해야하는지 어떻게 사용해야 하는지 검색만 반나절 하다 여쭤봅니다.

 

댓글을 작성하려면 로그인이 필요합니다.

답변 1개

채택된 답변
+20 포인트

pdf를  text로 추출하기 위한 라이브러리는 여러가지가 있습니다.

 

1. Smalot/PdfParser

2. TCPDF

3. Poppler-utils (pdftotext)

4. XPDF (pdftotext)

 

등이 있으며 해당 라이브러리를 이용하시려면 구글에서 해당 키워드로 검색해보시기 바랍니다.

원하시는 용도마다 사용법등 조금씩 다르기 때문에 확인해 보시고 원하시는 라이브러리르 활용하시기 바랍니다.

 

 

로그인 후 평가할 수 있습니다

답변에 대한 댓글 2개

답변감사합니다.
혹시 이중 보편적으로 많이 사용하는게 어떤걸까요..?
개인적으로 다르기 때문에 특별히 뭐가 많이 사용하는것보다 어떤부분이 본인이 사용하기 사용하기 편한가를 보시고, 옵션도 다르기 때문에 잘 살펴보시길 바라겠습니다.

댓글을 작성하려면 로그인이 필요합니다.

답변을 작성하려면 로그인이 필요합니다.

로그인

전체 질문 목록

🐛 버그신고