번역을 둘러싸고 인간과 기계가 대결을 벌였다는 보도를 둘러싸고 몇 가지 논의가 오갔다. (대표적으로 우석대 박상익 교수의 페이스북 포스팅과 댓글들 참조 1 2 3 ). 핵심 쟁점 중 하나는 '고전'을, 가령 17세기 영어로 쓴 밀턴 작품을 기계가 번역할 수 있느냐 하는 점이다. 이건 원리상의 문제, 곧 철학적 쟁점을 건들고 있기에 중요하다.
기계가 할 수 있는 것과 근본적으로 할 수 없는 것을 구별하는 일은 과학과 기술의 주제일 뿐 아니라 철학적 주제이기도 하다. 기계가 잘 하는 건 분명코 계산이다. 다시 말해 논리적, 합리적, 이성적 작업은 기계에게 적합하다. 가령 바둑은 경우의 수가 아주 많기는 해도 분명 수학적인 게임이다. 그래서 알파고는 이세돌을 이길 수 있었고, 그 업그레이드 버전 마스터 9단은 커제와 박정환을 비롯한 최정상 프로 기사들에게 이길 수 있었다.
그렇다면 언어는 어떠할까? 언어에는 두 차원이 있다. 하나는 일상적인 커뮤니케이션에 특화된 언어로, 의미가 상당히 높은 패턴으로 확정되어 있다. 논리적인 글(학술적인 글, 신문 기사, 분석 보고서 등)은 이 패턴이 상당히 일정하기 때문에 상당히 예외적인 언어이다(즉 수학에 가깝다). 일상 대화에 사용되는 언어의 경우에는 각 언어마다 문장 대 문장 차원의 대응이 존재한다(또는 존재하게 만들 수 있다). 이를 패턴의 대응이라고 부를 수 있는데, 이렇게 되면 수학적으로 처리될 수 있다. 문맥에 따라 같은 진술도 뜻이 달라진다는 이야기를 하는 사람도 많은데, 문맥 역시 패턴화될 수 있기 때문에 꽤 긴 일상 언어도 기계가 잘 번역할 수 있다.
이제부터 하는 말이 중요하다. 그렇다면 각 언어 내에 있는 이 패턴의 언어 대 언어 대응은 어떻게 이해할 수 있을까? 사싱 이건 의미의 문제가 아니다. 중요한 것은 용법과 용례이며, 기계 학습은 빅데이터를 통해 용법과 용례의 대응을 기억하는 작업이다. 구글번역기가 문장을 음소와 어절로 분해한 후 번역을 수행한다는 점은 이를 잘 보여준다. 문장 대 문장 번역이란 시작어의 패턴 대 도착어의 패턴의 대응을 가리킨다. 내가 일상 언어를 강조한 건 여기에 해당하는 패턴화된 데이터가 무진장 많기에 기계 학습이 용이하다는 점을 말하기 위함이다.
그렇다면 패턴화된 데이터가 없을 경우 어떨까? 다시 말해 인간이 번역한 용례가 데이터로 존재하지 않을 때에도 기계는 번역할 수 있을까? 문학 번역이나 고전 번역이 기계에 의해 이루어지기 어렵다(또는 불가능하다)는 결론은 여기에서 도출된다. 인간이 번역할 수 없다면, 또는 인간이 제공해 준 데이터가 없다면, 기계도 번역할 수 없다. 왜냐하면 기계 번역은 의미와 전혀(!) 연관이 없는 작업이기 때문이다.
기계 번역은 존 설이 말한 '중국어 방' 가설도 극복한다. 의미의 문제가 개입하지 않기 때문이다. 대화(언어)를 통해 기계가 지능을 지녔는지 평가하는 튜링 검사도 의미의 문제를 제거했기 때문에 '지능'에 대한 새로운 정의를 제공한 것에 불과하며, 튜링 검사를 통과했다고 해서 인간이 지닌 지능을 기계도 갖고 있다고 결론 내려서는 안 된다. 튜링 검사란 기계가 얼마나 인간 언어를 모사할 수 있느냐에 대한 검사에 불과하다. 기계 번역은 튜링과 설이라는 수학과 철학의 두 대가가 던진 문제를 검토할 수 있는 좋은 사례이다.
방금 한 논의에 대한 나의 결론은 이미 나 있다. 기계 번역은 기계 학습에 기반하고 있으며, 기계 학습은 인간이 이미 생산해 놓은 데이터들 및 이 데이터들의 패턴에 의존한다. 따라서 인간이 준 데이터가 없다면, 그것도 다량의 데이터가 없다면, 컴퓨터가 의미를 이해한다거나 하는 일이 원리상 불가능하기 때문에, 기계 번역은 불가능하다. "아" 다르고 "어" 다른 문제는 일상 언어 속에서는, 패턴 형태로 구별된 데이터가 무수히 존재하기 때문에, 기계 번역의 장애물은 아니다. 그 문제는 문학 번역이나 고전 번역처럼 텍스트의 의미 그 자체에 접근하려 시도하거나 때로는 텍스트의 의미 자체를 생산하는 상황에서 발생한다.
- 관련 내용을 추가 포스팅했습니다. 인공지능 번역의 실제 : 구글 번역 최고 담당자 마이크 슈스터