• 문서뷰어
  • PDF 변환
  • OCR
  • 데이터/텍스트 추출
  • 유출방지
  • 비식별화ㆍ익명화
  • LLMㆍRAG 구축

언론보도

외부 언론에 소개된 기업의 공식 보도자료입니다.
다양한 매체를 통해 전달된 소식을 확인해보세요.

“헤비한 GPU 서버는 필요 없다”… 이파피루스 ‘파이뮤PDF 프로’, 공공 HWPX 의무화 속 AI 데이터 전처리 시장 판도 바꾼다

이파피루스가 HWP와 HWPX를 아우르는 전천후 AI 문서 데이터 추출 라이브러리 PyMuPDF Pro를 앞세워 AI 데이터 전처리 시장 공략에 나섭니다.
공공기관 HWPX 전면 의무화로 AI 데이터 전처리 수요가 급증하는 가운데, 기존 HWP 레거시 문서까지 구조화 지원하며 서버 자원은 기존 대비 1/100 수준으로 절감한 것이 특징입니다.

자세한 내용은 아래 기사 전문에서 확인하세요!
==========================

(2026년 5월 26일) 도큐먼트AI 전문 기업 이파피루스가 정부가 지난 18일부터 공공기관의 '개방형 문서 포맷(HWPX)' 사용을 전면 의무화하면서 행정 시스템 내 문서를 인공지능(AI) 학습 및 검색 증강 생성(RAG) 분석용 데이터로 변환하는 ‘AI 데이터 전처리’ 수요가 폭발하고 있다. 그러나 시장에서는 새롭게 생산되는 HWPX 포맷뿐만 아니라, 기관망 내에 이미 수십 년간 축적되어 있는 막대한 양의 기존 'HWP' 포맷 문서들을 어떻게 유실 없이 AI 데이터로 전환할 것인가가 최대 과제로 떠올랐다. 이러한 상황에서 글로벌 스마트워크 소프트웨어 기업 이파피루스(대표 김정희)가 HWP와 HWPX를 아우르는 전천후 AI 문서 데이터 추출 라이브러리 ‘파이뮤PDF 프로(PyMuPDF Pro)’를 앞세워 시장의 해법을 제시하고 나섰다.

현재 시장에 제시되고 있는 기존 솔루션들은 대다수 '독립 서버형' 구조를 고수하고 있어, AI 문서 구조 분석을 위해 고성능 CPU는 물론 수천만 원을 호가하는 GPU와 128GB 이상의 대용량 RAM 등 무거운 하드웨어 스펙을 필수로 요구한다. 이는 공공기관 및 기업 IT 담당자들에게 가중되는 추가 인프라 투자 비용 부담을 안기며 도입의 걸림돌이 되어 왔다.

반면 이파피루스와 자회사 아티펙스(Artifex Inc.)가 공동 개발한 ‘파이뮤PDF 프로’는 이러한 인프라 비용 문제를 혁신적으로 걷어냈다. 이 제품은 고성능 하드웨어 사양(CPU/GPU)에 전혀 구애받지 않으며, RAM 4GB 이상의 경량 환경에서도 가볍고 빠르게 구동되는 압도적인 자원 효율성을 자랑한다. 서버 자원 사용량은 기존 솔루션 방식 대비 무려 1/100 수준에 불과해 인프라 도입 및 유지보수 비용을 파격적으로 절감할 수 있다. 특히 파이썬(Python) 환경이 지원되는 곳이라면 OS와 상관없이 고유 어플리케이션 코드 내에 직접 내장(Embedding)되는 ‘라이브러리’ 형태이기에, 별도의 무거운 소프트웨어 설치 없이도 가장 유연하게 맞춤형 AI 시스템을 구축할 수 있는 것이 강력한 차별점이다.

가장 큰 기술적 성과는 공공 및 금융 기관의 숙제였던 '기존 HWP 레거시 문서의 구조화'를 실현했다는 점이다. ‘파이뮤PDF 프로’는 최신 HWPX는 물론 기존 HWP 파일 내부의 다단 구조, 표, 이미지, 리스트 등 복잡한 비정형 문서 구조를 실제 눈으로 읽는 순서 그대로 완벽하게 인식해 데이터화한다.

또한, 모든 페이지를 이미지화하여 OCR(광학문자판독)로 변환해 과도한 시간과 비용을 발생시키던 기존 방식에서 탈피했다. 자체 스마트 페이지 분석기가 이미지나 손상된 폰트 등 '진짜 OCR이 필요한 영역'만 골라내어 처리하는 혁신적인 ‘하이브리드 OCR’ 방식을 적용했다. 이를 통해 원본 레이아웃과 폰트 스타일을 100% 보존하면서도 문서 처리 속도를 기존 대비 50% 이상 향상시켰으며, 1,100페이지에 달하는 대용량 문서도 단 1분 만에 AI가 즉시 학습 가능한 마크다운(Markdown)이나 JSON 형식으로 구조화하여 출력한다.

시장 신뢰성 측면에서도 단연 독보적이다. ‘파이뮤PDF 프로’는 전 세계 개발자들이 19년 이상 신뢰해 온 C 기반 문서 엔진 ‘MuPDF’ 기술을 파이썬 환경으로 이식한 상용 확장판으로, 글로벌 누적 다운로드 6억 9천만 건, 일 평균 다운로드 210만 건 이상을 기록 중인 글로벌 1위 솔루션이다. 이미 슈나이더 일렉트릭(Schneider Electric), 보쉬(BOSCH), 도큐사인(DocuSign), 오라클(ORACLE) 등 세계적인 기술 거인들이 핵심 컴포넌트로 채택하며 품질을 검증받았다. 또한, 최신 대세인 생성형 AI 및 RAG 환경에 최적화되어 메타데이터를 포함한 청크(Chunk) 생성 기능과 LLM 특화 ‘라마인덱스 리더(LlamaIndex Reader)’ 출력을 기본 지원해 AI 모델의 학습 효율을 극대화한다.

이파피루스 김정희 대표이사는 “이번 공공기관 HWPX 전면 의무화 조치는 국가 행정망의 막대한 데이터를 AI 자산으로 탈바꿈시키는 거대한 디지털 전환점이지만, 정작 현장에서는 기존 포맷인 HWP 형태로 남아있는 방대한 옛 문서들을 어떻게 손실 없이 AI 데이터로 전환할 것인가가 가장 큰 숙제였다”고 짚었다. 이어 김 대표는 “새롭게 도입되는 HWPX뿐만 아니라, 기관과 기업 내에 쌓여 있는 기존 HWP 포맷 문서까지 완벽하게 파싱하고 구조화할 수 있어야 진정한 디지털 혁신이 완성된다”며, “글로벌 6억 9천만 사용자가 검증한 ‘파이뮤PDF 프로’는 고비용의 인프라 구축 부담 없이 기존 HWP와 최신 HWPX 문서를 가장 가볍고 정확하게 AI 솔루션에 수혈할 수 있는 최적의 선택지로서 시장의 표준을 선도해 나갈 것”이라고 강한 포부를 밝혔다.

한편, 이파피루스는 공공기관 및 기업 담당자들이 ‘파이뮤PDF 프로’의 압도적인 성능을 직접 검증할 수 있도록 공식 홈페이지를 통해 60일간 조건 없이 사용할 수 있는 라이선스와 상세 제품 매뉴얼을 무상 제공하고 있으며, 전문 개발자들을 위한 신속한 기술 지원에도 만전을 기하고 있다.

👉 디지털데일리 기사 원문 보기

COPYRIGHT 2025,
ePapyrus INC.

DOCUMENT AI
FOR ENTERPRISE

CONTACT :
COMPANY

(우)13493 경기도 성남시 분당구 판교역로 230 4층 408호

TEL

02-2051-5207

EMAIL

support@epapyrus.com

FAX

02-2051-5209