필자가 캄보디아에서 찍었던 간판. 무슨 의미인지 이해할 수 없었다.

나는 최근에 캄보디아 크메르어로 된 글을 본 적이 있다. 당연히 읽을 수는 없었다. 적어도 나에게 한글은 시각적으로 구분되는 요소들이 다양한데 비해 크메르어는 꼬불꼬불한 곡선이 많아 구분이 어려웠다. (물론 캄보디아인들에겐 한글이 구분이 되지 않겠지만) 대체 어떻게 이걸 읽을 수 있단 말인가?


간단하다. 오랜 기간 학습자가 해당 언어에 노출되고 적응하면 된다. 학습의 깊이는 결국 노출되는 시간에 정비례하기 때문이다. 마찬가지로 디지털 인터페이스에 대한 익숙한 정도는 마치 언어를 익히는 과정과 같다. 초등학교 저학년인 우리 아이만 해도 어떤 것이 버튼이고, 인터페이스 상에서 화살표는 무엇을 의미하는지, 어떤 것을 누르면 ‘더 보기’가 나오는지 등을 안다. 누군가 특별히 가르쳐 준 것도 아닌데 스스로 몇 번씩 눌러보더니 이미 적응했다. 넷플릭스나 유튜브 같은 영상 플랫폼에 코로나 시기부터 익숙해졌기 때문이다. 


반면에 어르신들이 앱이나 디지털 기기를 사용하는 과정을 자세히 살펴보면 “이거 어떻게 해야 돼?” 하고 자주 물으신다. 디자이너들은 ‘아니 저기 커다랗게 색깔 있는 버튼이 있는데 왜 모르실까?’라고 생각할 수 있다. 그러나 디지털 인터페이스의 시각적 언어뿐 아니라 전반적인 레이아웃이 어르신들에게 매우 생소하기 때문에 이는 당연한 반응이다. 이는 멘탈 모델의 차이인데, 관련해서는 멘탈 모델에 대해 설명한 글 (https://msvinsight.com/mentalmodel-ux/)을 참조하길 바란다.

상호작용과 디자인

©미션잇

여기서 사용자의 상호작용에 대해 생각해 볼 필요가 있다. 사람과 사람 사이의 상호작용과 사람과 기기와의 상호작용은 완전히 다른 경험이다. (기기와 상호작용을 한다는 것이 조금 어색하게 들릴 수 있겠지만, 모바일 기기를 포함한 디지털 기기를 조작하고 어떤 결과를 얻는 일련의 행위를 떠올려보자. 예를 들어 주문을 한다던가, 호출을 한다던가, 그런 식으로 디지털 기기를 활용하는 모든 행위들 말이다.) 사람과 대화할 때는 말로 하거나, 혹은 쪽지를 쓰거나 하지만 기기와의 상호작용은 다르다.


아무리 GPT처럼 인간과 유사한 대화형 인터페이스가 존재한다고 해도, 여전히 화면상에 누르는 버튼이 있고 내가 뭔가 입력을 해야 하는 매개체들이 화면 안에 존재한다. 하물며 키오스크나 보편적인 앱처럼 대화형이 아닌 평면적인 인터페이스 요소들을 눌러가며 사용해야 하는 것들은 더욱 그렇다. 이런 경험은 베이비부머 세대나 그 이전 세대의 사람들에게 분명히 학습과 적응이 필요하다. 평생 한글만 알고 있는 사람이 크메르어가 익숙할 리 없는 것처럼 말이다.

 

그렇다면 시니어 세대를 위한 디자인으로 가장 익숙한 형태는 어떤 것인가? 좋은 디자인이라고는 말하지 않겠다. '익숙한 것'이 꼭 '좋은 것'은 아니니까. 하지만 분명한 건, 익숙한 것이 가장 편안하고 또 이들이 잘 사용할 수 있는 디자인이라고는 할 수 있다.

 

대화형 인터페이스와 상호작용

대화형 인터페이스는 인간의 상호작용 방식과 가장 닮아 있다. 사람과 사람의 소통은 결국 '대화'로 이뤄진다. 대화의 방식이야 문자로 하든, 목소리로 하든, 몸짓 발짓을 섞어가며 하든, 심지어 눈빛만으로 주고 받는 간에, 핵심은 '내가 말을 건네면 상대방이 대답한다'는 구조다. 그래서 질문을 던졌을 때 대답이 돌아오는, 이 가장 기본적인 대화 구조는 누구에게나 자연스럽고 편리하게 여겨진다.


그렇기 때문에 한 번에 한 가지씩 질문하고 답하는 구조는 그 자체로도 충분히 유용하다. 모든 질문에 완벽히 답할 수 없더라도 필요한 질문에만 적절히 반응할 수 있도록 구현된 대화형 인터페이스는, 그래픽 UI로만 상호작용을 하는 것보다 나은 방향이다. 지금도 우리가 내비게이션에 목적지를 입력할 때 목소리로 말하는 방식을 떠올려보면 쉽게 이해된다.

당신에게 여러 사람이 한꺼번에 말을 건넨다면?

그런데 잘 생각해 보면 1:1 대화에서는 멀티태스킹이 불가능하다. 대화의 화제를 여러 가지로 넓혀갈 수는 있겠지만 어쨌든 두 사람 사이에 한 가지 화젯거리를 중심으로 대화가 오고간다. 예를 들어 A라는 화자가 “밥 먹을래?”라고 물으면 B가 “그래 먹으러 가자” 하고 순차적으로 대답하는 것이 보통이다. 그런데 A가 “밥 먹을래?” “커피 뭐 마실까?”라는 질문을 동시에 던지고, B가 “그래 먹으러 가자”,”아메리카노”를 동시에 대답할 수는 없다. 사람의 입은 하나니까. 

그러나 디지털 인터페이스는 상황이 다르다. 많은 경우 한 화면 안에서 여러 가지를 동시에 전달한다. 사용자 입장에서는 마치 여러 명에게 동시에 질문을 받는 것처럼 말이다. 여러분에게 여러 명이 동시에 말을 건네면 어떨까? 당황스럽다. 결국에는 한 사람에게 대답을 먼저 해주고, 나머지 사람들에게 차례대로 대답하게 된다. 어떤 경우이건 순서를 정해서 행동한다. 사람 간 대화에서야 나랑 친한 사람이거나, 먼저 대답해 주지 않으면 위협적으로 보이는(?) 사람에게 대답을 해주겠지만, 인터페이스 상에서는 여러 명이 말을 건네지만 사용자는 '어떤 정보'에 '어떤 대답'을 '먼저' 해야 할지 모를 수도 있다. 그렇다면 인터페이스 상에서도 중요도와 대답에 대한 힌트를 확연하게 보여줄 수 있어야 한다. 

그래서 한 화면에서 너무 많은 질문을 하지 않는 것이 좋다. 페이지의 효율 상 한 화면에 가급적 많은 것을 처리하고 싶은 욕심이 있을 수 있겠다. 하지만 처리해야 할 정보와 그것을 위해 각종 레이아웃과 버튼이 들어가게 된다면 그 때 부터 사용자는 이 화면을 해석해야 한다. 어디서부터 어떻게 해야 할지 막막하다. 반면 내가 실제로 만났던 꽤 많은 분들의 경우, 한 가지만 명확하게 물어본다면 상대적으로 수월하게 진행해 나가셨다.

아파트와 골뱅이@의 차이 

©미션잇

최근 흥미로웠던 두 가지 사례가 있다. 출제자의 의도를 맞춰 100% 따라가기 원하지만 그 의도대로 되지 않는 경우가 빈번하다. 가령 어떤 앱에서 주소를 입력해달라고 명시된 칸이 있었다. 그런데 주소를 입력할 때 어르신들을 관찰해 보니 아파트를 골뱅이 기호(@)로 쓰시는 분들이 몇몇 계셨다. 가령 한국아파트 105동 201호를 한국@105-201과 같이 쓰는 식이다. 그런데 이렇게 입력을 하니 “특수 문자는 사용할 수 없습니다”라는 메시지가 아주 작게 뜬다. 어르신 입장에서는 당황스러울 수밖에 없다.

두 번째 사례는 010-0000-0000처럼, 전화번호를 입력하게 되어있는데, 010은 모두 통일되어 있으니 다음의 8자리를  입력할 수 있게 공란으로 둔 것이다. 그런데 어르신은 본인의 번호가 예를 들어 010-1234-5678이니 010부터 누르셨다. 결국 실제 입력되는 번호는 010-0101-2345로 눌렀던 것이다.

위 두 가지 사례의 공통점은 무엇일까? 사용자에게 입력 조건을 제시 했지만 입력될 반응의 예외를 충분히 생각하지 못한 경우다. 보통 “어디 사세요?”라고 물어볼 때  “한국 골뱅이 105동에 삽니다.”라고 대답하지는 않지 않는가? “한국아파트 105동이요.”라고 한다. 하지만 글로 주소를 적을 때 골뱅이 기호를 넣는 경우가 종종 있다. 그렇다면 00아파트 000동 000호처럼 자연스럽게 입력할 수 있는 약간의 가이드가 있거나, @로 입력했을 때 아파트로 변환이 된다던가, 혹은 이 주소가 맞는지 인터페이스 내에서 물어본다던가 등 보완이 필요하다.


후자도 재밌는 사례인데 이건 반대 경우다. 대화를 나누다가 “전화번호가 어떻게 되세요?” 하면 “1234-5678입니다라고 말하는 경우는 거의 없다. 대다수는 “010-1234-5678입니다”라고 말한다. 대화에서 이미 010부터 번호를 말하는 것이 익숙하기 때문에 꼭 010을 생략하여 입력시키고 싶다면 뒷자리부터 적어달라는 명료한 안내가 있던가 아니면 원래대로 010부터 쓰게 하는 것이 낫다. 오히려 약간은 비효율적으로 보이지만 혼동은 줄일 수 있기 때문이다.

보편적 경험과 예외적 경험에 대한 고민 

우리가 아무리 직관적으로 디지털 기기의 인터페이스를 만든다 하더라도 어르신들은 여전히 당황할 수 있다. 그렇다면 '직관적인 디자인'은 누구에게나 동일한 의미일까?


사람이 본능적으로 주목도를 느끼는 보편적인 색상, 방식은 어떤 것인지? 그리고 예외는 있지 않은지? 무얼 눌러야 할지 막막한 사람에게 누를 수 있는 어포던스affordance를 준다는 것은 어떤 형상, 색상, 메시지가 함께 병행되어야 하는지? 우리는 무엇을 버튼이라고 지칭하고, 무엇을 통해 방향을 지시하는지?


무엇보다 오늘 글의 내용처럼 어떤 상호작용이 가장 익숙한 경험인지에 대해 설계자는 충분히 검증하며 되돌아봐야한다. 이런 답은 GPT가 알려주지 않는다. 세대, 문화권, 민족 등 사용자의 맥락을 분석할 때만 찾을 수 있다. 답은 언제나 사용자 안에 있다. 


김병수 미션잇 대표ㅣMSV 발행인 
byungsu.kim@missionit.co
변화를 만드는 인사이트. MSV의 다른 글도 읽어보세요.  
주식회사 미션잇은 장애인, 고연령층 등 지금까지 주목하지 않았던 사람들의 사용자 경험을 연구하는 디자인·콘텐츠 기업으로, 포용적인 제품과 서비스를 위한 깊이 있는 전략을 만듭니다. MSV는 Meet Social Value의 약자로 콘텐츠의 선한 영향력을 지향하는 미션잇의 브랜드입니다. MSV 뉴스레터는 포용적 사회를 지향하는 2,000명이 넘는 독자분들이 구독하고 있습니다. 
홈페이지 www.missionit.cowww.msvinsight.com
프로젝트 문의 hello@missionit.co ㅣ 02.6289.6000
과천시 관문로 92 힐스테이트 101동(오피스동) 612호

수신거부 Unsubscribe