본문
- 금융감독원
- 불공정거래조사시스템 OCR 구축
- TextSense
금융감독원은 데이터에 대한 조사 시스템의 데이터 분석을 위하여 과거 다양한 포멧의 문서를 디지털화 하기를 원했다. 대량의 문서의 데이터를 텍스트로 추출하기 위해 인공지능(딥러닝) 기반의 OCR솔루션 TextSense를 도입했다.
TextSense를 통해 공시서류, 처리 의견서 등 주요한 내용을 텍스트 추출 후 DB 에 적재하여 활용을 하였으며, 텍스트화된 문서를 원문 검색할 수 있어서 업무에 효율성이 상향되었다.
TextSense를 통해 공시서류, 처리 의견서 등 주요한 내용을 텍스트 추출 후 DB 에 적재하여 활용을 하였으며, 텍스트화된 문서를 원문 검색할 수 있어서 업무에 효율성이 상향되었다.
구현기능
- 이미지 내 문자를 인식하여 텍스트 데이터로 추출하는 기능
- 서식 내 특정 내용만 추출하는 기능
- 이미지를 Searchable PDF 문서로 변환하는 기능
텍스트 추출문서 분류