시스트란, 인공지능 기반 고전문헌 자동 번역시스템 구축
상태바
시스트란, 인공지능 기반 고전문헌 자동 번역시스템 구축
  • 윤현기 기자
  • 승인 2018.01.22 14:45
  • 댓글 0
이 기사를 공유합니다

고전문헌 말뭉치 추가 등 고전문헌-현대문 번역 저변 확대

시스트란(대표 지 루카스)은 2017년 6월부터 6개월 간 진행된 과학기술정보통신부(한국정보화진흥원) ‘2017년도 ICT기반 공공서비스 촉진사업’의 과제인 한국고전번역원의 ‘인공지능 기반 고전문헌 자동번역시스템 구축’ 프로젝트에 참여해 성공적으로 완수했다고 22일 밝혔다.

고전문헌-현대문 번역에 국내 최초로 도입되는 시스트란의 이번 인공지능 기반 고전문헌 자동번역 솔루션은 4차 산업혁명 시대에 강조되고 있는 인문사회-과학기술 융합의 대표적인 사례로 꼽히며 대한민국의 미래성장동력 마련 및 학술적 자산 확보에 기여할 것으로 기대된다.

이번 번역시스템은 고전번역원에서 제공한 승정원일기 영조대 즉위년부터 4년 3월까지의 총 35만 말뭉치 및 시스트란 자체보유 말뭉치를 기반으로 30번 이상의 인공지능 기반 자동번역 모델 훈련을 통해 완성됐다. 인공지능 기반 고전문헌자동번역시스템에 적용된 신경망 번역기술은 원문과 번역문에서 서로 연관성이 있는 고유패턴을 찾아내고, 그 데이터를 기반으로 번역모델을 생성한다. 이 번역모델은 원문과 번역문 간의 대응 관계 정보를 스스로 학습하는데, 이는 실제 번역 과정에서 가장 적합한 대역어 관계를 탐색하고 판단하여 최종 번역문을 생성하게 한다.

이와 함께 시스트란은 인공지능 번역엔진이 고전문헌을 보다 쉽게 인식할 수 있도록 고전 한자를 뜻단위로 분리시켜주는 고전문헌용 토크나이저를 별도 개발해 시스템에 통합시켰으며, 2018년까지 고전문헌 말뭉치를 추가하고 번역문 기계학습 길이 확장(300자까지)을 통해 장문의 고전문헌 문장도 초벌 번역 작업에서 원활하게 활용될 수 있도록 할 예정이다.

초벌번역으로 상당한 완성도를 보인다는 프로젝트 자문위원의 평가를 받은 이번 시스템은 타사 대비 우수한 번역결과를 기반으로 한국고전번역원의 요구사항에 부응하고 있다. 이와 같은 높은 만족도를 바탕으로 시스트란은 앞으로 한국고전종합DB에서 서비스되고 있는 조선왕조실록, 일성록 및 문집류의 원문과 번역문 데이터베이스를 대상으로 한 고전문헌 자동번역 모델 확대 등 지속적인 고도화 사업을 진행해 고전 번역자들의 초벌번역에 도움을 주고, 향후 고전문헌 번역 유관기관 및 관련 학과의 업무 및 연구 과정에 사용할 수 있는 자동번역 서비스를 구현한다는 계획이다.

지 루카스 시스트란 대표는 “시스트란은 언어 간 번역뿐 아니라, 과거와 현재를 이어주는 번역 산업에까지 성공적으로 완수하며 회사의 가능성을 부각시키고 있다”며 “세계 1위 지능형 언어처리 기업으로서 역사 연구를 비롯한 다양한 연구 분야 발전을 위해 지속적으로 노력하며 비즈니스 역량을 강화하겠다”고 설명했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.