아티클

OCR 대체 텍스트가 적용되는 쇼핑몰 사례

엔비전스 접근성 2023-08-25 04:20:50

안녕하세요. 엔비전스입니다.

일반적으로 우리는 글자가 무수히 적혀 있는 용지를 글자 수와 무관하게 종이 몇 장, 혹은 공책 한 권으로 우선해 인식하지는 않나요?

그와 마찬가지로 스크린 리더는 제아무리 글자가 많이 적혀 있는 영역이라도 해당 요소가 이미지로 되어 있다면, 또한 대체 텍스트가 들어가 있지 않다면 이를 한 장의 이미지로만 인식해 글자를 읽어 주지 않습니다. 눈앞에 많은 정보가 담겨 있는 글자가 있더라도 시각 장애인은 이를 읽을 수 없는 것입니다.

이런 경우를 가장 흔히 볼 수 있는 사이트 중 하나로 쇼핑몰을 볼 수 있을 것 같습니다.

상품 상세 정보가 담겨 있는 텍스트들이 대체로 하나, 혹은 여러 개의 이미지 파일로 되어 있는 경우가 많습니다. 만약 대체 텍스트가 들어가 있지 않은 이미지라면 시각 장애인은 상품 설명에 대해 아무것도 보지 못하고 상품을 주문하거나, 주문할 수 없는 상황에 놓이게 됩니다.

때문에 이런 상황을 어느 정도 해결해 보고자 적용시키게 된 접근성 기능 중 하나로 OCR이 있습니다.

OCR이란, Optical Character Reader의 약자로, 이미지 내 글자를 인식하여 텍스트 데이터로 변환시켜 주는 광학 인식 기술입니다. 일전에 올라간 아티클 중 해당 기술을 사용한 이미지 인식 인공지능 앱을 소개한 적이 있죠. 최근에 와서 여러 접근성 방향에 도움이 되어 주고 있는 기술인데요. OCR이 적용된 쇼핑몰 사례를 간단히 살펴보겠습니다.

기본적인 탐색은 웹페이지 기준으로 설명됩니다. 다른 이슈가 없다면 각 쇼핑몰의 앱 내에서도 OCR 기능이 동일하게 제공됩니다.

OCR

G마켓

아래 링크를 눌러 이동 시 OCR 테스트 영상을 확인해 보실 수 있습니다.

G마켓 상품 상세 OCR 테스트

G마켓 기획전 OCR 테스트

이미지 OCR 대체 텍스트 음성지원 받기 버튼 하이라이트

  • G마켓 내 OCR이 적용되는 상품 및 기획전 페이지는 페이지 로딩 시 aria live를 활용해 OCR 음성지원 받기 사용 가능 여부에 대해 음성 안내 합니다.
  • OCR 버튼을 동작하기 전 상품 상세 영역을 탐색해 상품 상세 더보기 버튼이 있는지 확인해 주세요. 더보기가 존재하는 경우 해당 버튼을 동작해 확장시킨 후 OCR을 동작해 주시는 것이 키보드 탐색에 안정적입니다.
  • 이미지 OCR 대체 텍스트 음성지원 받기 버튼 동작합니다. 기본적으로 버튼이 숨겨져 있으며 탐색을 통해 접근 시 화면에 나타납니다. G마켓은 현재 거의 모든 상품, 기획전 페이지에서 OCR 기능을 활용할 수 있으므로 대부분 상품 내에서 버튼을 찾아볼 수 있습니다. 상품 상세 내에서 찾을 수 있는 OCR 지원받기 버튼의 경우 프레임 단위로 이동 시 쉽게 접근할 수 있습니다.
  • OCR 동작이 완료되면 나오는 진행중 안내 음성을 듣고 기다립니다. 이미지 내 글자 양에 따라 시간이 소요될 수 있습니다.
  • OCR 인식이 완료되면 완료 음성이 나타납니다. 방향키를 이용해 인식된 텍스트를 읽을 수 있습니다.

11번가

아래 링크를 눌러 이동 시 OCR 테스트 영상을 확인해 보실 수 있습니다.

11번가 상품 상세 OCR 테스트

상품설명 음성안내 버튼 하이라이트

  • 마찬가지로 OCR 버튼 동작 시 상세정보 더보기 버튼이 있는지 확인해 주세요. 기본적으로 버튼이 숨겨져 있으며 탐색을 통해 접근 시 화면에 나타납니다.
  • OCR을 사용할 수 있는 상품의 경우 페이지 상단, 스킵 내비게이션 내에서 상품설명 음성 안내 기능 바로가기를 통해 이동할 수 있습니다.
  • 상품설명 음성안내 동작 시 뜨는 새 창 내에서 OCR이 적용된 이미지를 탐색해 볼 수 있습니다.

소리마켓

아래 링크를 눌러 이동 시 OCR 테스트 영상을 확인해 보실 수 있습니다.

소리마켓 상품 상세 OCR 테스트

소리마켓은 G마켓, 11번가와는 다르게 동작할 수 있는 버튼이 존재하지 않습니다. 가능하다면 기본적으로 상품 상세 영역에 OCR 기능이 적용이 되어 있습니다.

이처럼, 판매자가 다양한 만큼 모든 사람들에게 대체 텍스트 제공을 기대하기는 어려운 환경에서 OCR은 어느 정도 사이트를 탐색할 수 있는 기대치를 높여 주는 좋은 접근성 활용법이 될 수 있습니다.

다만 이렇게 인공지능의 힘을 빌려 가져온 텍스트가 무조건적으로 대체 텍스트를 대신할 수 있는 수단이 될 수는 없습니다.

예컨대 만약 상품 영업을 위해 화려한 디자인이 되어 있는 이미지라면, 당연하게도 텍스트를 왼쪽에서 오른쪽으로 읽는 인공지능의 특성은 고려하지 않았을 확률이 높습니다. 정확도가 완벽하지 않고 논리적인 순서가 틀어진 채 인식된 텍스트를 스크린 리더로 이해하는 데에는 한계점이 생길 수밖에 없습니다.

또한 스크린 리더 사용자의 편의를 생각한 판단을 거칠 수 있는 대체 텍스트와 다르게 OCR은 보이는 모든 글자를 텍스트로 변환시키기 때문에 장식용 이미지와 같은 불필요한 텍스트 역시 함께 듣게 됩니다.

이런 선택지는 사용성에 크게 영향을 주는 환경을 만들 수 있기 때문에, OCR은 특정 환경에서 시도해 볼 수 있는 접근성의 일종으로 참고할 수 있었으면 좋겠습니다.

읽어 주셔서 감사합니다.

댓글 0
댓글을 작성하려면 해주세요.