어느 날 OCR이 사라지면 어떤 일이 생길까?

  • 관리자 신현승
  • 카테고리: 개발이슈
  • 조회수: 21
  • 작성일:

나는 지금껏 OCR(광학 문자 인식) 기술을 별로 신경 쓰지 않았다. 종이에 쓴 메모를 노션으로 옮길 때 사용한 것이 전부였다. 이제는 카메라 앱만으로 복사할 수 있게 되어 편리하다.

 

이 편리한 기술의 출처가 궁금해져 이 글을 쓰게 되었다. OCR은 여행지 메뉴를 실시간으로 번역하는 것 외에도 다양한 분야에서 사용된다. 이 기술이 없다면 우리의 사회 인프라는 제대로 작동하지 않을 것이다.

 

<출처: pro.europeana.eu>
 

1. OCR은 누가 만들었는가

OCR 기술은 문자를 전보 형태로 변환하는 것에서 시작되었다. 1차 세계대전 당시 엠마누엘 골드버그가 발명한 ‘Statistical machine’이 전기의 신호로 문자를 인식하는 기원이라 할 수 있다. 이어서 구스타프 타우셰크가 개발한 ‘Analog Reading Machine’은 문자 인식을 가능하게 했다.

 

<출처: researchgate.net>

 

이후 1950년대에 데이터의 폭발적인 증가로 인해 데이비드 셰퍼드와 하비 쿡 주니어가 GISMO 기계를 개발하였다. 이들은 1959년 IBM과 특허 계약을 맺으며 OCR의 이름을 알리게 되었다. 현재는 IBM 뿐만 아니라 여러 기업이 OCR 기술 관련 특허를 보유하고 있다.

 

OCR 기술은 계속해서 발전하고 있으며, 리서치 업체는 시장 규모가 2023년 125.6억 달러에서 2030년에는 330억 달러에 이를 것이라고 예상하고 있다.

 

2. OCR은 어떻게 작동할까?

<출처: mashable.com>

 

과거 OCR은 폰트와 패턴을 저장한 후 한 글자씩 대조하는 방식이었다. 그러나 기계 학습 모델의 도입으로 인식률이 크게 향상되었다. 현재는 이미지의 특성을 분석하여 글자를 인식하게 된다.

 

OCR의 기본 작동 과정:

  1. 이미지 파일 입력
  2. 텍스트 영역 감지
  3. 비텍스트 영역 제거
  4. 밝기 및 색상 보정
  5. 특징 분석 후 글자 인식
  6. 사전 조건 적용
  7. 확률 기반 추론
  8. 최종 결과 출력

 

애플은 iOS에 Live Text 기능을 추가하여, 이미지에서 쉽게 텍스트를 추출할 수 있게 했다. 이는 OCR 기능의 대중화를 이끌었다.

 

3. OCR은 어디에 활용될까?

<출처: cognex.com>

 

명함 관리 앱인 '리멤버'를 통해서도 OCR 기술이 많이 활용된다. 여행지의 메뉴판 번역, 메모 디지털화, 영수증 처리 등에서도 사용된다. OCR은 다양한 분야에서 중요한 역할을 한다.

 

  • 금융기관의 문서 처리
  • 보험회사의 진료비 처리
  • 공항의 여권 정보 스캔
  • 택배사의 배송 정보 저장
  • 우체국의 주소 확인
  • 병원의 진료 기록 처리
  • 공무원 시험 채점
  • 종이책을 전자책으로 변환
  • 과속 단속 카메라의 번호판 인식
  • 제조업체의 제품 정보 검수

 

4. OCR이 사라진다면 어떻게 될까?

<출처: trainingindustry.com>

 

OCR의 부재는 사회 전반에 영향이 크다. 은행과 보험사에서 서류를 수기로 처리해야 하며, 물류와 의료 행정의 효율성도 급감할 것이다. 전자책 시장이 사라질 수도 있으며, 과속 단속 카메라도 번호판 인식률이 떨어질 것이다.

 

물론 OCR 기술이 대체 불가능한 것은 아니다. 그러나 없으면 사회의 효율에 큰 타격이 있을 것이다.

 

결론: 있어 줘서 참 고마운 기술

<내용 정리>

  1. OCR 기술은 문자를 전보 형태로 변환하는 것에 뿌리가 있으며, IBM이 1959년 OCR이라는 이름을 사용하게 되었다.
  2. 이미지 파일에서 텍스트 영역을 감지하고 인식하여 디지털로 변환한다.
  3. 일상과 금융기관, 의료기관 등 다양한 분야에서 사용된다.
  4. OCR 기술이 없어도 작동은 가능하나, 효율성에는 큰 타격이 있을 것이다.

 

현재 OCR 기술은 기계학습과 함께 발전하고 있으며, 앞으로 더 많은 언어와 맥락을 이해할 수 있는 방향으로 나아갈 것이다.


<참고>

">How Does Optical Character Recognition (OCR) Work?

 


해당 기사는 GPT를 이용하여 요약한 내용입니다.

원문보기


코멘트 (0)