2022.05.19 (목)

  • 구름많음동두천 17.5℃
  • 구름많음강릉 23.6℃
  • 구름많음서울 19.2℃
  • 구름많음대전 19.5℃
  • 구름많음대구 22.4℃
  • 구름많음울산 20.8℃
  • 구름많음광주 20.8℃
  • 구름많음부산 18.3℃
  • 흐림고창 17.9℃
  • 흐림제주 19.8℃
  • 구름많음강화 16.6℃
  • 구름많음보은 16.1℃
  • 구름많음금산 18.1℃
  • 구름많음강진군 17.5℃
  • 구름조금경주시 21.2℃
  • 구름조금거제 18.7℃
기상청 제공

학술기획

알 수 없는 알고리즘이 나를 이 기사로...

URL복사
“방탄소년단 영상을 보다가 강화유리 영상까지 와버렸어!”, “마지막으로 딱 하나만 더 보고 자야지”
위는 KBS 코미디 프로그램 ‘개승자(개그로 승부하는 자들)’의 ‘신비한 알고리즘의 세계’라는 코너 속 대사다. 이 코너는 유튜브 알고리즘으로 겪는 여러 경험을 개그 소재로 삼아 시청자들의 큰 호응을 얻었다.
이 코너가 인기 있는 이유는 우리가 유튜브 알고리즘을 많이 이용하기 때문일 것이다. 추천 영상 목록에 있는 영상의 내용이 궁금해 클릭한다든지, 연관 동영상을 클릭하다 어느 순간 아예 다른 주제의 영상을 보고 있다든지. 이런 경험들이 쉽게 공감될 정도로 알고리즘은 우리 생활 깊이 들어와 있다.
분명 알고리즘은 사용자에게 필요할 만한 정보를 추천하고 있다. 온라인 쇼핑몰은 구매하려는 상품의 연관 상품까지 추천해주고, 증권거래소 앱은 매수하기 좋은 주식 목록을 작성해준다. 때로는 정말 필요한 정보들까지 추천해 나도 모르게 작은 탄성이 새어 나오기도 한다. 알고리즘은 우리의 취향을 어떻게 알고 있을까?●

유튜브 알고리즘의 비밀
인터넷의 가장 기본적인 도구는 검색이다. 인터넷상의 정보는 매우 방대하고, 우리는 그중 필요한 정보만 찾아야 하기 때문이다. 그래서 검색엔진과 포털 사이트는 알맞은 정보를 제공하기 위한 알고리즘을 만들고, 이를 지속해서 발전·보완하고 있다.
알고리즘의 원래 의미는 ‘어떤 문제의 해결을 위한 절차와 규칙의 집합’이다. 그러나 우리에게 익숙한 알고리즘은 ‘개인에게 맞는 콘텐츠를 추천해주는 서비스’라는 표현이 더 정확할 것이다. 다만 이 서비스를 알고리즘이라고 정의하는 것이 틀렸다고 말할 수는 없다. 개인의 선호도, 취향, 가치관 등을 파악하려면 서비스만의 고유 알고리즘이 필요하기 때문이다. 즉 알고리즘이라는 큰 범주 안에 이 서비스가 포함된다고 말할 수 있다.
알고리즘을 활용하는 플랫폼 중에서는 유튜브가 가장 유명할 것이다. 구글은 아직 유튜브 알고리즘을 정확하게 공개하지 않았고, 알고리즘의 종류도 여러 가지가 있다. 하지만 공개된 인터뷰 및 관계자들의 이야기를 통해 유튜브 알고리즘 중 몇 가지는 알 수 있다.
유튜브 알고리즘의 기본 작동원리는 간단하다. 유튜브 영상에는 고유의 태그가 있는데, 보통 영상 제목 위 해시태그(#)가 그 영상의 태그다. 유튜브 알고리즘은 시청자가 시청한 영상의 태그를 수집하고 같거나 관련된 태그를 가진 다른 영상을 추천목록에 띄워준다.
유튜브 알고리즘은 비슷한 태그(주제)의 영상을 본 다른 시청자의 영상 시청 패턴도 분석한다. 만약 어떤 시청자가 유튜브에서 한 유명 가수의 뮤직비디오를 즐겨 본다면, 유튜브 알고리즘은 그 가수의 뮤직비디오를 많이 시청하는 다른 시청자들을 찾는다. 그런데 이 시청자들은 뮤직비디오뿐만 아니라 그 가수가 나오는 무대 행사나 예능 프로그램 영상도 즐겨 본다. 따라서 유튜브 알고리즘은 기존 시청자에게 가수의 무대 행사, 예능 프로그램 영상들까지도 함께 추천해준다.
물론 이 과정에는 맹점이 있다. 가령 일부 영상 제작자는 조회수를 늘리기 위해 섬네일과 제목을 자극적으로 만든다. 이런 방법으로 조회수를 늘릴 수는 있지만, 조회수와 비교하면 영상 내용은 부실한 경우가 많다. 그래서 유튜브 알고리즘은 단순 조회수만을 기준으로 두지 않고, 시청자의 영상 시청 시간에 집중한다. 즉 시청자가 어떤 영상을 끝까지 봤는지, 혹은 잠깐 보고 끈 것인지를 구분한다. 영상 내용이 부실하다면 시청 시간이 길지 않을 것이고, 추천목록에 들어가기도 어려울 것이다.
단순 알고리즘으로 발생하는 여러 문제점을 보완하기 위해 유튜브 알고리즘은 머신러닝을 활용하고 있다. 영상 추천목록에서 시청자가 어떤 반응을 보이는지 유튜브 알고리즘이 스스로 분석하고, 추천목록을 수정하는 원리다. 추천 기준으로 시청 패턴, 조회수 증가 속도, 좋아요·싫어요·댓글 등의 데이터를 사용한다. 기존에는 개발자들은 실시간으로 유튜브 알고리즘의 오류를 수정했다면, 머신러닝은 스스로 본인의 알고리즘을 수정한다는 차이가 있다.
플랫폼들이 알고리즘 개발에 이토록 눈독 들이는 이유는 간단하다. 플랫폼 이용자의 이용 시간을 대폭 늘릴 수 있기 때문이다. 2019년 3월 유튜브의 최고 상품 책임자(CPO) 닐 모한은 뉴욕타임스와의 인터뷰에서 “유튜브 시청 시간의 70%는 유튜브 알고리즘의 영향이며, 알고리즘 도입 이후 시청 시간이 20배 이상 증가했다”라고 말했다. 기하급수적으로 늘어나는 유튜브 이용자 수를 보면, 잘 만든 알고리즘의 파급력이 얼마나 강한지 알 수 있다.

알고리즘은 이렇게 추천합니다
다른 플랫폼의 알고리즘도 유튜브와 비슷하다. 인스타그램은 내가 좋아할 만한 다른 사람의 게시물을, 넷플릭스는 취향에 맞는 영화와 드라마를 추천해준다. 보통 플랫폼에서는 다양한 알고리즘을 사용하지만, 그중 공통으로 쓰이는 알고리즘이 있다.
첫 번째는 ‘협업 필터링’ 알고리즘이다. 이 알고리즘은 이용자가 플랫폼을 이용하는 경향을 파악하고, 비슷한 성향을 지닌 이용자들의 다른 선택을 추천한다. 만약 음식 배달 앱에서 치킨을 주문하려고 한다면, 알고리즘은 이용자의 이전 주문 내역을 분석한다. 분석 결과 이 이용자는 치킨 브랜드 A사의 양념치킨을 주로 주문했다. A사의 양념치킨을 많이 주문하는 다른 이용자들의 주문을 분석해보니, 이들은 B사의 간장치킨도 선호했다. 이 분석을 기반으로 알고리즘은 이용자의 추천 메뉴에 B사의 간장치킨을 넣는다.
협업 필터링은 다수 이용자의 성향을 분석해 알맞은 추천 결과를 도출한다는 점에서 집단 지성과 비슷하다. 따라서 이용자가 많을수록 추천의 다양성과 정확도가 높아진다. 다만 데이터가 없는 신규 이용자에게는 추천이 어렵다. 같은 이유로 이용한 기록이 부족한 신상품에 대한 추천도 소홀해진다.
두 번째 알고리즘은 ‘내용 기반 필터링’이다. 협업 필터링이 이용자들의 통계에 집중한다면, 내용 기반 필터링은 콘텐츠(내용)에 집중한다. 위 예시로 돌아가면, 내용 기반 필터링은 치킨과 브랜드의 종류를 특징에 따라 작은 갈래로 분류한다. 그리고 이용자가 선호하는 A사의 양념치킨과 유사한 특징을 가진 브랜드의 치킨을 추천해준다. 그래서 양념치킨을 판매하지만, 주문량이 많지 않은 C사의 양념치킨이 추천 메뉴에 들어올 수 있다.
내용 기반 필터링은 다른 이용자의 데이터가 필요하지 않고, 추천 기준에 개인의 특별한 취향을 넣을 수 있다. 신상품에 취약한 협업 필터링의 단점도 보완할 수 있다. 반면 모든 콘텐츠를 항상 정확하고 세부적으로 분석·분류하는 것은 불가능하다. 이런 상황에서는 다른 이용자의 선택을 참고하는 협업 필터링이 좋은 방안이 될 수 있다.
이처럼 두 알고리즘은 상호보완적으로 이용할 수 있어서 많은 플랫폼이 두 알고리즘을 혼합해 사용한다. 여기에 알고리즘 개발자들은 추천을 돕는 새로운 명령어를 만들고 유해 콘텐츠를 필터링하는 등 알고리즘의 단점을 수정한다.

알고리즘에 빼앗긴 선택권?
이러한 알고리즘 시대를 걱정하는 시선도 많다. 추천 알고리즘 때문에 이용자의 주체적인 선택이 힘들어진다는 우려다. 알고리즘이 추천하는 정보와 콘텐츠만 보게 된다면, 결국 자신의 취향과 가치관마저 고정될 수밖에 없다. 이는 ‘보고 싶은 것만 보게 된다’는 확증 편향을 일으키기 쉽다.
미국 온라인 시민단체 ‘무브온’의 이사장 엘리 프레이저는 이 현상을 ‘필터 버블(filter bubble)’이라고 명명했다. 프레이저는 진보주의자인데, 페이스북에서 보수 성향을 지닌 친구들의 소식이 사라지고 있었다. 구글에 같은 검색어를 입력해도 보수 성향과 진보 성향 이용자의 검색 결과가 각각 달랐다. 프레이저가 인터넷에서 진보 성향의 뉴스만 읽어 알고리즘이 보수 성향의 콘텐츠를 배제했기 때문이다. 이에 프레이저는 모든 이용자는 각각 하나의 거품 방울 안에 갇혀 있다고 주장했다. 필터 버블은 알고리즘 시장이 팽창함에 따라 사회문제로 대두되고 있다.
페이스북의 프로덕트 매니저였던 프랜시스 하우겐은 작년 10월 미국 상원 청문회에서 페이스북의 알고리즘 문제를 폭로했다. 하우겐의 폭로에 따르면, 페이스북·인스타그램의 알고리즘은 게시물들의 조회수를 높이는 것을 목표로 설계됐다. 그래서 사람들 간 혐오를 부추기는 게시물이나 가짜 뉴스가 이용자들 사이에 쉽게 퍼질 수 있다. 페이스북 측은 이를 알고 있었으나, 이를 의도적으로 방관했다. 분노를 일으키는 게시물의 조회수가 상대적으로 많고, 광고 수익을 증대시키기 때문이다. 이 때문에 페이스북 알고리즘은 전 세계 이용자들 간의 분열을 조장하고, 청소년들의 정신 건강을 악화시켰다. 하우겐은 “페이스북의 알고리즘이 민주주의의 근간을 위협하고 있다”고 경고했다.
결국 작년 12월 인스타그램은 올해부터 알고리즘을 기반으로 하는 콘텐츠 노출 서비스를 폐지한다고 밝혔다. 기존 알고리즘의 추천 게시물로 채워지던 피드는 최신순으로 생성되는 게시물로 대체된다.
알고리즘의 기술적 문제는 개발자의 과제다. 그러나 알고리즘의 판단에는 플랫폼의 수익창출 가치관이 개입될 수밖에 없다. 그리고 알고리즘은 모든 콘텐츠를 보여주지 않는다. 오히려 알고리즘은 수많은 콘텐츠 중 이용자에게 맞는 것을 판단해주는 서비스다. 그 과정에서 판단 기준이 무엇인지, 배제된 콘텐츠는 무엇인지 파악하기는 쉽지 않다.
알고리즘의 미래는 이러한 문제점을 해결하는 것에 달렸다. 분명 앞으로도 알고리즘은 필요한 정보를 좀 더 정확하게 추천할 것이고, 언젠가는 자기 자신도 몰랐던 본인의 새로운 취향까지 찾아줄 것이다. 알고리즘이 인간을 울타리 안에 집어넣는 일이 반복돼서는 안 된다. 독일 언론인 크리스토프 드뢰서는 “알고리즘은 인간의 사고와 일치하지 않고, 객관적이지 않다”며 “본인의 선택을 알고리즘에 안심하고 맡기지 말라”고 주장했다. 알고리즘에 잡아먹히지 않으려면, 알고리즘을 알아야 할 시대다.

참고문헌
-『알고리즘이 당신에게 이것을 추천합니다』, 크리스토프 드뢰서,  해나무, 2018
-『유튜브 컬처』, 케빈 알로카, 스타리치북스, 2018
-『생각 조종자들』,엘리 프레이저, 알키, 2011

<협업 필터링>
① 두 명 모두 A사의 양념치킨을 선호함
② 채영이와 예은이는 비슷한 취향으로 분석됨
③ 채영이는 B사의 간장치킨도 선호함
④ 따라서 예은이에게 B사의 간장치킨도 추천함

<내용 기반 필터링>
① 채영이는 A사의 양념치킨을 선호함
② A사의 양념치킨은 C사의 양념치킨과 유사함
③ 따라서 채영이이게 C사의 양념치킨도 추천함


유동현(공대 기계공학 17)
편집 조현진 기자 jhj20@knu.ac.kr


포토뉴스