청각장애인의 부정확한 발음도 인공지능이 인식할 수 있도록 음성 DB 구축
‘과학기술정보통신부’가 주관하고 ‘한국지능정보사회진흥원(이하 NIA)’이 추진하는 ‘2022년 인공지능 학습용 데이터 구축 지원사업’이 본격적으로 시작됐다. 이 사업은 총 5,382억원 규모로 3차 공고에 걸쳐 기업, 대학, 공공기관, 정부 및 지자체 등 기관이 컨소시엄을 맺어 188개 분야에서 데이터 사업이 구축된다.
그러나 컴퓨터 비전, 음성, 자연어, 헬스케어, 자율주행, 교통, 제조, 문화, 관광, 재난, 안전, 환경 등 다양한 분야에 걸쳐 방대한 데이터를 구축하지만, 청각장애 관련 데이터 구축 사업은 음성 영역의 '구음장애인 명령어 데이터'가 유일하다.
지난 해 유사한 사업으로 '구음장애 음성인식 데이터' 가 진행되었으나, 올해에는 '음성인식'이 아닌 '명령어 데이터'로 청각장애 등으로 인한 구음장애를 가진 사람들의 명령어를 스마트기기가 인식할 수 있도록 하기 위한 인공지능 학습용 데이터 구축 지원사업이다.
이번 사업에 선정되어 청각장애인 명령어 데이터를 수집하는 청각장애인생애지원센터는 청각장애인 및 가족이 겪는 다양한 문제를 해결하는 사회적기업으로 700명의 청각장애인이 녹음한 2,800시간 분량의 음성 데이터를 수집한다.
이에 청각장애인생애지원센터에서는 청각장애인 참여자가 비대면으로 참여할 수 있도록 '라이프스토리지' 플랫폼을 구축하였다.
인공지능 학습을 위한 데이터셋이 구축되면, 청각장애인의 말소리가 인공지능 스피커 또는 실시간 자막생성 프로그램이 청각장애인의 음성을 보다 명확하게 인식하거나, 온/오프라인 기반의 음성인식, AI 비서, Voice BOT, Voice Command&Control, AI Contact Center, AI 로봇, 음성인식기반 키오스크 등 장애인의 IT 접근 지원을 위한 소프트웨어 등 생활 및 의료 분야에서 다양한 혁신 기술 개발에 적용할 수 있다.
청각장애인생애지원센터 조성연 대표는 “청각장애인의 삶의 질을 높이기 위해 인공지능 학습용 데이터를 구축해 나갈 예정”이라며 "기술을 활용하여 앞으로도 청각장애인이 다양한 사업에 쉽고 편하게 참여할 수 있도록 지원하겠다”고 밝혔다.
참여를 희망하는 등록 청각장애인은 언어평가를 거쳐 일상, 금융, 교통정보 의료예약 등 명령어 카테고리 13개 총 4회 음성녹음을 제출하면 사례비 20만원이 지급된다.
청각장애인 음성데이터 구축을 위해 참여를 희망하는 등록 청각장애인은 https://bit.ly/3tivciG 링크에서 신청서를 작성하거나, 카카오톡 채널 @청생원 또는 영상전화 ☎ 010-3334-2596으로 문의하면 된다.