편집자 주

"언론이 신뢰를 잃었다." 이미 진부한 분석입니다. 2020년 오늘, 대한민국에서 가장 신뢰받는 미디어는 1백여년 역사를 자랑하는 신문도, TV도 아닙니다. 인공지능(AI)을 활용하는 구글의 유튜브와 네이버가 신뢰받는 미디어 1,2위. 영국 옥스포드대 부설 로이터 저널리즘연구소가 세계 각국 언론 신뢰도 조사를 시작한 이후 한국 언론 신뢰도는 단 한번의 예외도 없이 최하위를 지킵니다. (로이터 디지털 뉴스 리포트)

물론, 몇 가지 조사 결과가 한국 미디어 전부를 드러내진 못합니다. 그러나 적어도 "기레기ㆍ뒷광고 논란에 휩쌓인 기존 언론의 자리를 알고리즘에 기반한 소셜미디어가 장악해가는 추세"는 분명해 보입니다.

1989년 영국의 팀 버너스리 경은 하이퍼텍스트 시스템을 개발하고, 특허 대신 공개와 공유를 선택했습니다. 이후 눈부시게 발전한 월드와이드웹 세상에서 전통적 언론사들은 기술을 외면했거나 뒤처졌습니다. 영향력을 잃었고 가짜뉴스 논쟁에 휘말렸습니다.

한편, 디지털 기술에 바탕한 소셜미디어는 폭풍 성장을 거듭하고 있습니다. 인공지능 관련 기술은 소셜미디어에 날개를 달아준 형국입니다.

특별취재팀은 물었습니다. 인공지능이 저널리즘을 대체할 수 있고, 대체하는 것이 오히려 바람직한 것인가?

특별취재팀= 장준하ㆍ이윤정ㆍ윤영주ㆍ박혜섭ㆍ김재호 기자
팀장= 권영민 전문위원ㆍ실장

(출처=셔터스톡)
(출처=셔터스톡)

◆ AI 통번역 실력 어디까지 왔나?

(사진='꽃보다 청춘 in 아이슬란드' 영상 캡쳐)
(사진='꽃보다 청춘 in 아이슬란드' 영상 캡쳐)

“핫도그 세 개 주세요.” “Please, hot dog world.” 

‘세 개’를 ‘세계’로 잘못 알아들은 번역기의 오역은 지난 2016년 예능 프로그램의 한 장면.

같은해 이세돌과의 바둑 승부로 이름을 알린 알파고를 비롯한 딥러닝 기반 인공지능(AI) 기술은 눈부시게 발전했다. 통번역기기는 기존 통계 기반 기계번역(SMT)이나 구문 기반 기계번역(PBMT) 방식에서 AI를 접목한 인공신경망 번역(NMT) 방식으로 전환됐다. 단어나 구 단위 구분이 아니라 문장의 의미 분석을 통해 맥락을 이해하는 방식으로 발전해온 것.

◆ AI에 뛰어든 IT 공룡들…MS VS 구글 VS 페이스북 삼파전?

마이크로소프트(MS)‧페이스북‧구글 등 거대 IT공룡들이 펼치는 자연어처리(NLP) 분야 선점 경쟁은 통번역 기술을 '사람 수준'까지 끌어올리고 있다. 지난 10월 페이스북은 100개 언어를 번역할 수 있는 대규모 다국어 기계 번역(MMT) 모델 ‘M2M-100’을 선보였다. 기존 AI 번역기가 영어라는 중간 다리를 거친 것과 달리, 영어 데이터를 기반으로 하지 않는 세계 최초의 다국어 번역모델이라는 게 페이스북 측의 설명이다.

지난 2017년 21일 오후 서울 광진구 세종대학교 광개토관에서 열린 ‘인간번역사와 인공지능(AI)의 번역대결 행사’에서 이 학교 교수들이 네이버 파파고, 구글 번역기, 시스트란 번역기에 지문을 입력해 번역기를 실행하고 있다. 이날 대회는 인간 전문번역사 4명과 네이버 파파고, 구글 번역기, 시스트란 번역기가 즉석에서 번역 대결을 펼쳐 정확도 등에 따라 승패를 가르는 방식으로 진행됐다.인간 번역사 팀은 30점 만점에 평균 24점을 받은 반면, 번역기는 평균 11점. 또 영한 번역에서도 번역사들은 평균 25점을 받았지만, 번역기는 13점에 그쳤다. (사진=뉴스1).
지난 2017년 21일 오후 서울 광진구 세종대학교 광개토관에서 열린 ‘인간번역사와 인공지능(AI)의 번역대결 행사’에서 이 학교 교수들이 네이버 파파고, 구글 번역기, 시스트란 번역기에 지문을 입력해 번역기를 실행하고 있다. 이날 대회는 인간 전문번역사 4명과 네이버 파파고, 구글 번역기, 시스트란 번역기가 즉석에서 번역 대결을 펼쳐 정확도 등에 따라 승패를 가르는 방식으로 진행됐다.인간 번역사 팀은 30점 만점에 평균 24점을 받은 반면, 번역기는 평균 11점. 또 영한 번역에서도 번역사들은 평균 25점을 받았지만, 번역기는 13점에 그쳤다. (사진=뉴스1).

M2M-100의 번역 결과물은 기계번역 평가 방법 가운데 하나인 BLEU 미터법에서 영어 중심의 AI번역기보다 10점 이상 높게 나타난다. ( [특별 기획] AI, 저널리즘을 부탁해! ⑤: ‘기계 번역’ 평가 점수 BLEU 스코어란 )

이에 질세라 MS와 구글도 각각 다국어 번역모델 ‘T-ULRv2’와 ‘mT5’를 공개했다. 떠오르는 신흥강자 네이버 역시 자체 번역 서비스 파파고로 무섭게 추격해오고 있다. 파파고의 AI 번역 평가 모델 ‘PATQUEST’은 지난 8월 국제 머신러닝 대회 ‘WMT20’에서 ‘문서 단위 품질 평가(Document-Level QE)’ 1위와 ‘문장 단위 직접 평가’ 영-독 번역 부문 4위를 차지한 바 있다. 특히 네이버의 경우 파파고의 AI 성능 강화와 번역 품질 개선을 위해 대대적인 투자에 나서며 기술 개발에 집중하고 있다.

네이버는 한국어-베트남어, 한국어-인도네시아어, 한국어-프랑스어 등 14개 언어쌍 번역 기술 개발에 향후 3년간 총 160억을 투자한다는 계획이다. 또 엔비디아와 협력해 GPGPU(범용 컴퓨팅 처리 GPU) 기반의 슈퍼컴퓨터를 병렬로 연결, 700페타플롭스(PF) 이상의 성능을 확보함으로써 한국어‧일본어를 위한 차세대 초거대 AI 언어모델을 구축하겠다는 포부도 밝혔다. 네이버의 계획대로라면 현재로서 가장 뛰어나다고 평가받는 오픈AI의 언어모델 'GPT-3'를 능가할 AI 모델이 앞으로 등장할 것이라는 기대를 모으고 있다.

코로나19 팬데믹 장기화로 비대면 소통이 늘어나는 상황에서 AI 번역 시장은 더욱 성장할 수밖에 없다. 미국 시장조사기관인 그랜드 뷰 리서치의 보고서(2018년)에 따르면, 글로벌 기계 번역 시장 규모는 14.6%의 연평균성장률(CAGR)을 기록하면서 향후 2022년 약 9억8330만 달러에 이를 것으로 추산된다. 또 최근 글로벌마켓인사이츠(Global Market Insights)는 기계 번역 시장 규모가 지난해 약 5억5000만 달러였으며 2026년에는 15억 달러를 넘어설 것으로 내다봤다. 

(사진=셔터스톡)

◆ 갈 곳 잃은 외신기자‧특파원?…상생 길 모색만이 살길

지난 2016년 ‘유엔 미래보고서 2045’에서 2045년 이후 사라질 직업 가운데 하나로 번역가가 꼽혔다. 이후 발표된 여러 보고서 역시 AI 번역 기술의 발전으로 인해 번역 관련 일자리가 위험할 것이라는 전망을 내놓는다. 이에 전문 통번역사 외에 외신기자나 특파원의 입지도 점점 더 좁아질 수 있다는 우려도 나온다. 실제로도 통번역업계 종사자들에게 AI는 위협적인 존재일까? AI에게 밥줄을 뺏기지 않을까 노심초사해야 하는 상황인지 이들의 속사정을 들어봤다.

◆ 한영불(한국어-영어-프랑스어) 전문 번역사 A씨

“인하우스 번역사로서 사내 기술문서 및 공문 번역 업무를 주로 하는데 영어-불어 번역만 놓고 보면 인공신경망을 적용한 번역기의 등장 후 업무처리 방식이 확실히 달라지기는 했다.

예전에는 아무것도 없는 백지에서 번역을 시작했다면, 구글 번역이 인공신경망을 적용한 2016년 말부터는 평이한 영불 문서의 경우 1차적으로 구글 번역기의 결과물을 확인한 다음, 원문과 비교하며 감수하는 형식으로 번역을 마무리하고 있다. 이 덕분에 번역 시간이 현저히 줄어들어 이전보다 많은 양의 문서를 신속하게 번역할 수 있게 됐다.

다만 이는 기계 번역 개발의 중심 언어인 '영어'와 이와 가까운 언어인 '불어'라는 언어 조합이기에 가능하다고 생각한다. 아직 한국어-불어 번역은 기계 번역 결과물의 정확도가 낮기 때문에 여전히 백지에서부터 번역을 하고 있다.”

한영(한국어-영어) 전문 통역사 B씨

“아직까지 크게 달라진 점은 없다. 물론 자연어 처리와 음성합성 기술이 빠른 속도로 발달하면서 기계 통역기가 통역사를 대체하는 것 아니냐는 우려도 종종 듣는다.

하지만 이야기의 흐름이 어디로 튈지 모르는 긴박한 상황에서 화자의 발언 뒤에 숨겨진 의도까지 감안해 매 순간 판단을 내려가며 말을 전달해야 하는 통역의 복잡한 특성을 기계가 100% 대체할 수 있을지는 의문이다.

그럼에도 인간과 달리 방대한 분량의 용어를 기억할 수 있고, 불필요한 긴장을 하지 않아 실수하지 않으며, 컨디션 여부와 상관없이 언제나 동일한 수준의 결과물을 낼 수 있다는 점은 기계가 가진 장점이 분명하기 때문에 도입 시 그 유용성에 대해서는 의심할 여지가 없다고 생각한다.”

◆ 한일(한국어-일본어) 전문 번역사 C씨

“AI가 통‧번역사를 머지않아 대체할 것이라는 전문가들의 견해가 나오면서 AI 기술 발전이 통번역업계에 미칠 영향력을 우려하는 시각도 있다. 물론 어느 정도 사실이다. 게다가 한국어와 문장 구조가 비슷한 일본어의 경우 AI 번역 결과물의 정확도는 꽤 높은 편이다.

그러나 AI 번역기 덕분에 번역 업무 속도가 크게 단축돼 동일한 시간 내 소화할 수 있는 번역 작업량도 많아졌다. 또 AI 번역 모델 학습에 필요한 데이터를 검수하는 일거리도 늘어나면서 여전히 사람인 전문 번역사를 필요로 하고 있다.”

 

◆AI 기술은 저널리즘 영역 확장의 기회

지난 2018년 로라 비커 BBC 한국 특파원이 자신의 기사를 공정하게 번역해달라는 트윗을 통해 한국 언론의 외신 오역에 대해 쓴소리를 냈다. 외신 오역은 언어 능력에 기인하기도 하지만, 경우에 따라서는 기자 자신이나 편집국의 입맛대로 의도적인 원문 왜곡 보도로 발생하기도 한다.

AI 기반 번역은 다소의 오류를 감안하더라도 일부 언론의 정치적‧이념적 편향성에 따른 의도적 왜곡을 피할 수 있다. 실제 한 신문사는 한글 기사 말미에 구글 번역기로 영문 번역한 기사를 함께 게재하는 서비스를 선보이기도 했다.

AI 기술을 통해 추락한 저널리즘의 위상을 제고해야 한다는 주장과 연구는 계속되고 있다. 구글 뉴스 이니셔티브(GNI)는 다양한 AI기술을 접목한 취재보도 기법을 개발하고, 팩트 체크 기능을 제공하며 세계 각국의 저널리즘AI 연구개발을 후원한다.

저널리즘의 개입주의는 1인 미디어의 활성화로 저널리스트의 편향성ㆍ경향성을 확장한다. 어쩌면 이 시대의 저널리스트는 협업 필터링(collaborative filtering)과 내용 기반 필터링(content-based filtering) 알고리즘을 다룰 수 있는 코딩실력과 빅데이터 분석 능력을 요구받고 있을지 모른다.

LSE 보고서: 해외 언론 인공지능 활용 사례

1. 월스트리트 저널: 다이나믹 페이월
머신러닝 정보에 근거해 각 독자에 따라 구독 형태 결정. 방문자에 따른 각기 다른 사이트 접근 권한 부여하는 방식. 방문자의 구독 확률에 따라 결정.
2. 워싱턴 포스트: 헬리오그래프:
기사 자동 작성 툴. 2016년 올림픽과 선거에서 성공적으로 사용됨.
3. 프레스 어쏘시에이션의 레이더(RADAR):
어브스(Urbs) 미디어와 프레스 어쏘시에이션의 자동 뉴스 서비스. 3개월 만에 5만 건 작성
4. 타임스 오브 런던 제임스(JAMES):
"Journey Automated Messaging for higher Engagement through Self-Learning"의 약자. 데이터를 통해 소비자들의 버릇, 관심사, 선호도를 파악한다. 디지털 집사 역할을 함.
5. 블룸버그의 사이보그(Cyborg):
인공지능을 이용해 수천 개 기업의 수익 보고서에서 핵심 데이터 포인트를 파악하고, 헤드라인과 기사를 초 단위로 게재하는 자동화 시스템.
6. 바이트댄스의 토우티아오(Toutiao):
인공지능을 통한 개인화. 중국 모바일 앱 토우티아오. 4,000개 파트너 뉴스 사이트에서 일상 뉴스를 자동 큐레이션 함.
7. 디플(DeepL)
텍스트를 이해하고 자동으로 번역할 수 있는 딥러닝 툴.
8. 뉴욕타임스의 프로젝트 필(Project Feels):
인공지능을 통해 뉴욕타임스의 기사가 감정에 끼치는 영향을 예측한 후 각 독자에게 개인화된 광고를 하는 프로젝트.
9. 텍스티(Texty)의 `Leprosy of the Land` (기사: 땅의 문둥병)
인공지능을 활용한 탐사 보도 기사. 머신러닝 모델을 통해 우크라이나의 불법 채굴을 검거해 기사화했다.
10. 일레(Yle)의 보이또(Voitto):
"읽고 싶은 뉴스를 놓치지 않게" 도와주는 인공지능 비서 서비스. 스마트폰 잠금화면에 개인화된 알림을 보냄. 알림을 누르는지에 따라 강화학습이 이루어져 사용할수록 더 강화된 추천시스템을 구현한다.   

키워드 관련기사
  • [특별 기획] AI, 저널리즘을 부탁해! ⑤-1 : ‘기계 번역’ 평가 점수 BLEU 스코어란