손필기 OCR 인식 검토

배경

기회

학생들은 수학 문제를 풀 때 손필기 방식이 자연스럽지만, 현재는 키보드 입력 방식만 지원되고 있어서 불편해요.

이전 히스토리

저희측에서 AI디지털교과서 플랫폼을 개발 중에 손필기를 인식하여 스트링 데이터로 변환를 통해 정/오 판단까지 진행되는 요구사항이 존재합니다.
이 부분을 충족시키기 위해 별도의 솔루션을 테스트 해보았으나, 해당 솔루션의 동작 방식과 그 결과가 자체적으로 테스트 했을때 인식정확도는 약 61.42% 였으며, 특히 두 줄이상 작성된 문자 및 수식의 경우 전혀 인식을 못하는 결과를 확인하였고, 이 부분을 사용하는 것이 무리가 있다고 판단 되었습니다.
해서 이 부분을 귀사에서 자체구축하여 사용하고 계시는 OCR기능을 통해 이 부분을 해소할수 있으면 좋을것 같아 문의를 드리게되었습니다.
저희가 생각하는 손필기 데이터를 인식하여 스트링데이터로 변환하는 기능의 요건은 다음과 같습니다.
1. 설치 & 구현
- CSAP 인증을 받은 솔루션일 경우에만 외부 접근이 가능한 관계로 IHFB의 AIDT 플랫폼 인프라에 구축이 되어야 하거나, 이가 아닌 경우 CSAP 인증이 필요
2. 기능
- 사용자의 손필기 결과를 인식하여 스트링 데이터로 변환할 수 있어야 함
- 공통 - 2줄 이상으로 작성된 손필기를 인식하여 스트링 데이터로 변환
- 숫자 인식하여 스트링 데이터로 변환
- 수학 수식 인식하여 ( 초 / 중 / 고 ) 스트링 데이터로 변환
- 영어 단어 인식하여 ( 대소문자 구분 ) 스트링 데이터로 변환
- 영어 문장 인식하여 스트링 데이터로 변환
- O, X 등 문자를 인식하여 스트링 데이터로 변환
3. 결과
- 평균 인식률 80% 이상
위의 내용을 토대로 귀사에서 자체구축 하여 사용하고 계시는 OCR 기능을 저희가 사용해볼 수 있을지 확인 부탁 드리겠습니다.
셀바스AI 참고

솔루션 검토 - 콴다

솔루션 검토 - ncloud

콴다 vs ncloud

비교한 것이 보기 편하도록 구글 시트에 작성하였습니다.
https://docs.google.com

영어 단어 인식, 영어 문장(숙어) 인식

ncloud가 조금 더 좋습니다. 콴다의 경우에는 거의 제대로 동작하지 않습니다. 하지만 ncloud는 크기를 조정하면 콴다보다는 잘 동작합니다. 하지만 실사용에서 쓰는 것은 무리가 있다고 생각합니다.

수학 숫자 인식, 수학 수식 인식

콴다가 더 좋습니다. ncloud의 경우에는 수학에 들어가는 기호를 아예 인식을 못하는 것으로 보입니다.

객관식/O,X 인식

콴다의 데이터가 없어서 잘 모르겠지만, ncloud도 이용하기 어렵습니다. 숫자 선택지는 아예 인식을 하지 못하고(손필기 크기에 관계없이), O, X를 번갈아 입력하였을 때 O를 아예 인식하지 못합니다.

종합 평가

콴다와 ncloud 모두 활용하기 어려워 보입니다. 테스트를 하다보니 이미지 속의 텍스트의 크기에도 민감하고, 알 수 없는 이유로 원하는대로 나오지 않느 경우도 있습니다. 이것을 실용으로 활용한다면 유저의 불만이 많을 것으로 예상됩니다. 전반적으로 비슷하고, 수학에서 콴다가 약간 좋아보입니다.