본문
- 병무청
- 병무청 징병 검사서 OCR 시스템 구축
- TextSense
병무청은 병역판정 업무를 위해 매년 7만건의 병역판정 검사서 및 진료내역서를 우편으로 받아 왔다. 또한 민원신청 시스템을 통해 받는 웹팩스 문서도 매년 약 20~30만 건에 달했다.
이렇게 받은 문서들은 사람이 직접 내용을 확인한 후 데이터를 수기로 입력하여 관리해 왔다.
수기 업무로 인한 인력 낭비 방지와 업무 효율화를 위해 인공지능 OCR인 TextSense를 도입하였다.
이후 우편으로 접수된 문서는 스캔하여 텍스트를 추출하고, 웹팩스시스템을 통해 접수된 문서의 경우 먼저 문서 내 주요 정보(생년월일, 서식, 주소지, 시군구, 담당자 등)를 통해 어떤 종류의 문서인지 인식하고 분류하는 작업을 거친 후에 텍스트를 추출했다.
이렇듯 단순 수기 업무는 OCR이 대신하고, 사람은 OCR의 작업 결과를 검증 및 수정만 할 수 있게 되어 업무 부담이 줄고 문서 작업 속도와 정확성이 모두 향상되었다.
구현기능
- 이미지 내 문자를 인식하여 텍스트 데이터로 추출하는 기능
- 문서에 포함된 텍스트를 기반으로 문서 유형 자동 분류 기능
텍스트 추출문서 분류