• 문서뷰어
  • PDF 변환
  • OCR
  • 데이터/텍스트 추출
  • 유출방지
  • 비식별화ㆍ익명화
  • LLMㆍRAG 구축

도입사례

다양한 산업군에서의 실제 적용 사례를 소개합니다.
고객의 환경에 맞춘 솔루션이 어떻게 구현됐는지 확인해보세요.

Notion Labs, Inc.

PDF를 편집 가능한 html로 변환하여 사용자 편의성 개선

Notion Labs, Inc.는 샌프란시스코에 본사를 둔 소프트웨어 기업으로, 개인과 팀의 워크플로우를 단순화하는 올인원 생산성 플랫폼을 제공하고 있다.
Notion은 사용자 경험을 강화하기 위해, PDF 문서를 가져와 편집 가능한 Notion 페이지로 변환하는 기능을 구현하고자 했다. 이를 위해서는 PDF를 DOCX 형식으로 변환한 뒤, 다시 Notion 플랫폼에서 호환되는 HTML 블록으로 변환할 수 있는 솔루션이 필요했다. 목표는 가져온 PDF 콘텐츠를 네이티브 Notion 요소처럼 다룰 수 있게 하여 원활한 편집과 협업을 지원하는 것이었다. 
Notion은 서버 인프라에 *PyMuPDF Pro와 **pdf2docx를 통합해 사용자가 PDF를 가져오면, PDF가 DOCX 파일로 변환된 뒤 다시 HTML 블록으로 변환되어 Notion 내부에서 네이티브 콘텐츠처럼 사용·편집할 수 있는 환경을 구현하였다. 사용자는 이제 PDF를 손쉽게 Notion 작업 공간으로 가져와, 원래의 서식과 구조를 유지한 채 편집 가능한 페이지로 변환할 수 있게 되었고 이 개선은 워크플로우를 단순화하고, 생산성을 높이며, 사용자가 Notion 플랫폼 내에서 문서를 보다 유연하게 관리할 수 있도록 만들었다.

*PyMuPDF Pro: PDF 및 다양한 문서의 데이터 추출, 분석, 변환, 조작을 지원하는 고성능 파이썬 라이브러리
**pdf2docx: PyMuPDF와 python-docx를 활용해 PDF를 DOCX 형식으로 간단히 변환하는 라이브러리

#PyMuPDFPro

구현기능

PDF를 사용자가 편집 가능한 html로 변환

COPYRIGHT 2025,
ePapyrus INC.

DOCUMENT AI
FOR ENTERPRISE

CONTACT :
COMPANY

(우)13493 경기도 성남시 분당구 판교역로 230 4층 408호

TEL

02-2051-5207

EMAIL

support@epapyrus.com

FAX

02-2051-5209