로봇은 인간다운 기사를 쓴다
  • 권희정 기자
  • 승인 2017.07.04 15:19
  • 댓글 0
이 기사를 공유합니다

 
기사 작성은 더 이상
인간 고유의 영역이 아니다
 
위 문제를 풀어보셨나요? 기사 A·C는 인간기자가, 기사 B·D는 이준환 교수(서울대 언론정보학과)가 속한 연구팀의 로봇이 작성한 기사입니다. 어느 정도 맞추셨나요? 틀렸다고 기죽을 필요는 없습니다. 한국언론진흥재단이 진행한 설문조사 결과 위 문제의 정답률은 절반 정도에 그쳤으니까요. 특히 B기사의 경우 일반인의 81.4%, 기자의 74.4%가 인간기자의 기사라 예측했죠. 그만큼 구분하기 어려운 것입니다. 식별하기 어려울 정도로 인간다운 기사를 쓰는 로봇이라니, 놀랍지 않나요? 로봇이 만드는 언론, ‘로봇 저널리즘’에 대해서 파헤쳐 봤습니다.
 
 알고리즘에서 온 그대
 ‘로봇기자’라고 하면 인간의 형상에 가까운 로봇이 키보드를 두드리는 모습을 상상하기 쉽습니다. 하지만 사실 로봇기자는 키보드를 두드리지 않습니다. ‘로봇기자’는 물리적 형상을 가진 하드웨어가 아닌 소프트웨어이기 때문이죠. 로봇보단 인공지능, 인공지능보단 ‘알고리즘’에 가까운 형태입니다. 스스로 생각한다기보단 일정한 알고리즘에 정보를 집어넣어 처리하는 식이죠.
 
  알고리즘은 저널리즘 저변에서 이미 사용되고 있습니다. 뉴스 분류 및 배열은 물론 개인 맞춤형 기사 추천에도 쓰이고 있죠. 인간이 수행했던 작업들을 로봇이 대신하는 것입니다. 그렇기에 ‘알고리즘 저널리즘’ 자체를 로봇 저널리즘이라고 부르기도 하는데요.
 
  하지만 일반적으로 로봇 저널리즘은 자동 기사 작성 알고리즘만을 일컫습니다. 알고리즘이 기자를 대신하고 있는 수많은 영역 중에서 ‘기사 작성’만을 꼽아서 로봇 저널리즘이라 부르는 거죠. 기자 고유의 영역이라 여겼졌던 ‘기사 작성’ 마저도 알고리즘이 대신하고 있는 것이죠.
 
  이러한 로봇기자에 대한 사람들의 평가는 꽤나 호의적입니다. 앞서 제시했던 한국언론진흥재단의 설문조사에 따르면 기사 작성자가 로봇이라고 알렸을 때가 주체를 알리지 않거나 인간이라고 말했을 때보다 좋은 평가를 받았다고 하는데요. 특히 신뢰성, 명확성, 가독성 부분에서 높은 평가를 받았죠. 많은 사람들이 로봇기자에 대한 기대를 가지고 있는 것입니다.
 
  우리 편집장님을 소개합니다
  알고리즘이 ‘문서’를 작성한다는 측면에서, 로봇 저널리즘의 시초는 1952년 만들어진 ‘연애편지 작성기(love letter genera-tor)’라고 할 수 있습니다. 영국의 컴퓨터 과학자인 크리스토퍼 스트레이(Christopher Strachey)가 만든 이 알고리즘은 문장의 구조를 미리 정립한 후, 그에 형용사, 부사, 동사 등을 자동으로 채워 넣는 방식을 사용했는데요. 그 방식이 간단하긴 하나 처음으로 사람의 손을 거치지 않은 문장이 만들어졌다는 점에서 주목해볼 만합니다.
 
  알고리즘이 ‘기사’를 작성하기 시작한 것은 ‘연애편지 작성기’로부터 반세기가 넘게 지난 2009년입니다. 미국 노스웨스턴대 학술 프로젝트의 일환으로 만들어진 ‘스탯 몽키(Stats monkey)’가 바로 그 주인공이죠. 노스웨스턴대 연구팀은 스포츠 기사에 일정한 형식이 반복된다는 점에서 착안해 야구 데이터를 문장으로 바꾸는 알고리즘을 개발했습니다. 이들은 후에 ‘내러티브 사이언스’라는 벤처 회사를 설립해 로봇기자를 상업화하는 데 성공합니다. 현재 미국의 경제전문지 ‘포브스’에선 내러티브 사이언스가 만든 ‘퀼(Quill)’이란 로봇기자가 활약하고 있는데요. 퀼은 주요 시장 상황 정보를 하루에 수십 건씩 작성하고 있다고 합니다. 
 
  한편 현재 가장 괄목할만한 성과를 내고 있는 로봇기자는 오토메이티드 인사이츠 사의 ‘워드스미스(Wordsmith)’입니다. 초당 9.5개의 기사를 생산해내는 워드스미스는 2014년엔 10억 개, 2015년에는 15억 개의 기사를 썼죠. 미국의 AP통신은 이 워드스미스에 분기별로 발표되는 기업 실적 기사를 맡기기도 했습니다.
 
  로봇은 기사 작성을 넘어, 편집에 까지 손을 뻗습니다. 영국의 ‘가디언’지는 2013년에 ‘더 롱 굿 리드(The long good read)’라는 주간지를 발행하는데요. 24쪽짜리 타블로이드 판형인 이 종이신문의 편집장은 다름 아닌 로봇입니다. 알고리즘이 ‘가디언’의 온라인 기사를 기사 길이와 독자의 반응을 기준으로 선별해 자동 편집한 거죠. 이는 발전을 거듭하며 2014년엔 미국에 ‘#오픈001(#Open001)’이란 월간지를 발행하기까지 이릅니다. 
 
  로봇에겐 너무 어려운 한글
  그렇다면 한국의 로봇 저널리즘 상황은 어떨까요? 한국 최초의 로봇기자는 ‘테크봇’입니다. 테크봇은 2014년 기술 분야 소식지 ‘테크홀릭’에서 처음으로 기사를 작성했는데요. 한 주간의 인기 기사를 추린 ‘위클리 초이스’는 테크봇에 의해 자동으로 운영되고 있습니다. 하지만 테크봇은 이미 작성된 기사 틀 안에 수치만 채워 넣는 수준에 그쳤죠.
 
  이준환 교수가 개발한 로봇기자들은 그보다 조금 더 발전한 형태를 띱니다. 그의 연구팀이 개발한 ‘프로야구 뉴스 로봇’은 로봇이 썼다고는 믿기지 않을 만한 수준의 기사를 내놓기도 했는데요. 서봉원 교수(서울대 융합과학기술대학원)와 협업해 만든 ‘아이엠에프엔봇(IamFNbot)’과 ‘에프엔라씨(fnRASSI)’는 각각 지난해 1월, 6월부터 ‘파이낸셜 뉴스’에서 기사를 자동으로 작성하고 있습니다. 아이엠에프엔봇이 실시간 주식시장 상황 기사 작성에 그친 것에 반해 에프엔라씨는 보다 분석이 가미된 투자 길잡이 역할을 하고 있는데요. 이후엔 주문 맞춤형 기사도 서비스할 예정이라고 합니다.
 
  그 외에도 교육전문지 ‘뉴트리션’에서 기사를 작성하고 있는 ‘뉴트봇’·‘뉴트봇B2’나, SBS에서 19대 대선 투·개표 데이터 기사를 작성한 ‘NARe’ 등 국내에도 수많은 로봇기자들이 있는데요. 그럼에도 유럽이나 미국에 비해선 뒤쳐져 있는 실정입니다. 아직 그 쓰임이 한정적이죠. 이준환 교수는 그 원인으로 한글을 꼽았습니다. “보통 언어처리는 기존의 기술들을 가져다 만드는데, 한글의 경우 기반 기술이 거의 개발되지 않았어요. 기반 기술부터 만들어야 하는 게 어렵죠.” 한글이 영어에 비해 구조적으로 복잡하다 보니 일상 언어 처리 기술이 미비하다는 설명입니다.
 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.