[인터뷰] 박정석 KT 팀장 "장애가 장벽 되지 않도록…AI 기술로 지원"

  • 입력 2020.07.26 10:44
  • 수정 2020.07.26 12:42
  • EBN 문은혜 기자 (mooneh@ebn.co.kr)

학습데이터 없이 청각장애인 목소리 구현한 KT…전용 메신저앱 '마음 톡' 선보여

KT "ICT 활용한 사회공헌 꾸준히 이어갈 것"


박정석 KT 융합기술원 AI Voice Generation 프로젝트 팀장. ⓒEBN박정석 KT 융합기술원 AI Voice Generation 프로젝트 팀장. ⓒEBN

"인공지능(AI)으로 당신의 목소리를 찾아드립니다."


KT가 AI 음성합성 기술을 활용한 '목소리 찾기' 프로젝트의 첫 번째 결과물을 지난 25일 공개했다.


청각장애를 가진 이들의 목소리를 AI 기술로 구현, 이를 메신저 앱에 적용한 '마음 톡(TALK)'을 선보인 것.


목소리 찾기 프로젝트의 기술을 총괄한 KT 융합기술원의 박정석 팀장은 "청각장애인의 삶에서 목소리가 제약이 되지 않도록 AI 기술로 돕고자 했다"며 "의사소통의 보조수단으로써 도움이 되길 바라는 마음"이라고 말했다.


◆ 학습데이터 없이 목소리 구현…KT가 유일


지난 4월부터 사연을 받아 목소리 찾기 참가자 20명을 선발한 KT는 5~6월 두 달 동안 참가자 가족(동성 가족 1~2명)의 목소리 녹음을 진행했다. 참가자의 부모, 형제, 자매는 정교한 목소리 구현을 위해 준비된 1000문장을 약 6시간 동안 녹음했다.


KT는 이 녹음 데이터를 바탕으로 실제 참가자의 성별, 나이, 구강구조 등 개인 특성을 반영해 참가자만의 음색과 어조, 말투가 반영된 목소리를 생성했다. 여기에 AI 딥러닝을 통한 목소리 정교화 과정까지 거쳐 특색있는 목소리 구현에 성공했다.


현재 많은 IT기업들이 사용하고 있는 음성합성 기술은 특정인의 목소리 데이터를 기반으로 새로운 데이터를 생성하는 방식이다. 기본 학습데이터가 구축돼 있으면 어떤 문장이든 특정인의 목소리로 재생할 수 있다.


하지만 이번 프로젝트에서 KT는 참가자 본인의 학습데이터 없이 가족의 목소리와 약 1000명의 일반인 구강구조 자료를 바탕으로 한 목소리 데이터를 결합해 새로운 목소리를 만들어냈다. 음성합성 기술은 보편화됐지만 학습데이터 없이 새로운 음성을 구현한 것은 전 세계에서 KT가 유일하다.


박 팀장은 "청각장애인의 경우 기본 목소리 데이터가 없기 때문에 샘플을 만드는 것이 프로젝트의 핵심이었다"며 "가족의 목소리 데이터와 구강구조 데이터를 가지고 참가자에게 맞도록 자연스럽게 보정하는데 많은 노력이 들어갔다"고 말했다.


KT는 앞서 지난해 3월에도 비슷한 기술을 활용해 KBS의 다큐 드라마 '3∙1운동 100주년 특집 <그날이 오면>' 방송에서 고(故) 정재용∙이갑성 선생의 목소리를 복원, 공개한 바 있다. KT는 여기서 더 나아가 음성합성으로 만든 상담사 목소리가 실시간으로 고객상담을 해주는 콜센터 기능도 빠르면 연내에 선보일 계획이다.


◆ 기술로 일상의 변화 만드는 KT…"ICT 활용한 사회공헌 꾸준히 이어갈 것"


KT 목소리 찾기 프로젝트 참가자 김혜원 씨가 마음 톡을 이용해 지인과 대화를 나누고 있다. ⓒKTKT 목소리 찾기 프로젝트 참가자 김혜원 씨가 마음 톡을 이용해 지인과 대화를 나누고 있다. ⓒKT

박 팀장은 목소리 찾기 프로젝트 참가자들과 인터뷰를 하며 관련 기술의 확장 가능성을 봤다.


그는 "젊은 참가자들과 인터뷰를 하다 보니 이들은 가족들과의 단순한 의사소통을 넘어서 유튜브 같은 매체를 통해 건청인들과도 적극 소통하고 싶어한다는 것을 알게 됐다"고 말했다. 마음 톡 앱이 보조수단으로써 이들의 적극적인 의사소통을 지원할 수 있다는 것이 박 팀장의 생각이다.


KT는 향후 2년 동안 '마음 톡' 앱 사용자의 불편함이나 개선점 등을 점검해 2차, 3차 업데이트를 해나가기로 했다. 또한 '기술로 일상의 변화를 만든다'는 모토 아래 ICT를 활용한 다양한 장애인 지원 사업도 지속적으로 펼칠 계획이다.


KT는 이미 다양한 분야에서 장애인들이 5G, VR, AI 등 기술로 자립·자활을 이루고 일자리를 스스로 창출할 수 있도록 돕는 프로그램을 지원하고 있다.


지난해 4월에는 발달장애인이 VR 콘텐츠를 통해 바리스타 수업을 받을 수 있는 직무교육장을 포항에 개설했다. 또 11월에는 시각장애인을 위한 '5G 360도 카메라'를 시연하기도 했다. 목소리 찾기 프로젝트의 시초인 청각장애인 '소리 찾기' 사업은 지난 2003년부터 18년째 이어져 오고 있다.


©(주) EBN 무단전재 및 재배포 금지

전체 댓글 0

로그인 후 댓글을 작성하실 수 있습니다.
EBN 미래를 보는 경제신문