kautm - 대학기술이전 네트워크의 중심 kautm - 대학기술이전 네트워크의 중심
 
CONTACT US오시는길
kautm - 대학기술이전 네트워크의 중심
  자동로그인
 
ID
회원가입    ID/Pw찾기
 
kautm - 대학기술이전 네트워크의 중심
TLO LICENSE CORNEL
 
HOME > 기술복덕방 > 판매희망기술
 
kautm - 대학기술이전 네트워크의 중심 kautm - 대학기술이전 네트워크의 중심
강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법
Online target-speech extraction method for robust automatic speech recognition
소 속
서강대
연구책임자
박형민
기술분류
멀티모달/시청각 정보처리, 음성 인식/위치추적, 딥러닝(Deep learning)
키워드
강인음성인식, 음성향상, 전처리, 신호분리, 독립성분분석
 
기술개발 단계(TRL 9단계)
기초연구단계 실험단계 시작품단계 제품화단계 사업화
1. 기초이론/실험   3. 실험실 규모의
기본성능 검증
V 5. 확정된 시작품
제작 및 성능평가
  7. 신뢰성 평가 및
수요기업 평가
  9. 사업화  
2. 실용목적의
아이디어,
특허등 개념 정립
  4. 실험실 규모의
평가
  6. 파일롯 규모
시작품 제작 및
성능 평가
  8. 시제품 인증 및
표준화
   
- 국내특허 : 강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법(출원번호 : 10-2015-0037314, 출원일 : 2015.03.18, 등록완료)
- 미국특허 : ONLINE TARGET-SPEECH EXTRACTION METHOD FOR ROBUST AUTOMATIC SPEECH RECOGNITION
(출원번호 : 15071594, 출원일 : 2016.03.16)
 
본 기술은 강인음성인식 전처리를 위한 온라인 목표 음성 추출 방법에 관한 기술임
- 복수의 마이크로폰에 대해서 목표 화자의 방향에 null 값을 형성함으로써 잡음 추정
- 추정된 잡음에 독립적인 목표 음성을 추정하기 위해 요구되는 가중치는 독립성분 분석에 대한 수정된 비용 함수를 이용하여 학습
- 특히, 최소왜곡원리, nonholonomic constraint, 입력 신호의 smoothed power 추정치에 의한 규준화를 적용한 실시간 natural gradient 학습 규칙으로 기존 독립성분 분석보다 적은 계산량으로 시간에 따라 power가 변화하는 음성에 대해서도 안정적인 수렴 특성을 나타냄
- Underdedtermined problem을 겪는 일반적인 독립성분 분석과 달리 본 기술은 성공적인 목표 음성 추정을 위해 신호대 잡음비가 최대가 되도록 하는 beamformer 형성

 
기존 독립성분 분석 방법은 고전적인 beamforming에 비해 상대적으로 적은 개수의 마이크로폰으로도 효율적인 신호 분리가 가능하여 음성인식 전처리 기법으로 두각되었으나, 목표 음성 출력 신호를 고정할 수 없고, 음원 개수보다 적은 개수의 마이크로폰 신호로 모든 음원을 분리할 수 없는 underdetermined problem으로 인해 상용화에 어려움이 있었음

본 기술은 목표 화자의 방향에 null 값을 형성하여 잡음을 효율적으로 추정하는 동시에 그 출력단을 고정하고 이러한 출력단과 다른 출력단에서 기존 잡음 출력과 가능한 독립적인 목표 음성 신호가 추정되도록 하여 목표 음성의 출력단을 고정할 뿐만 아니라 신호대 잡음비가 최대가 되도록 하는 beamformer를 형성하여 훨씬 적은 계산량으로 시간에 따라 power가 변화하는 음성에 대해서도 안정적인 수렴 특성을 나타냄
 
- 본 기술은 음성인식 상용화에 있어 문제점 중 하나인 실제 환경에서 잡음에 대한 강인성을 확보하기 위한 전처리 기법으로 음성인식 시장 전반에 활용 가능
- 인공지능 스피커와 같은 원거리 음성인식에서 사용자의 만족도를 제고할 수 있는 핵심 기술임

 
공동연구(Joint R&D), 기술이전(매각) 또는 라이센싱
 
서강대학교 산학협력단 / 02-3274-4861
 
kautm - 대학기술이전 네트워크의 중심
등록된 한 줄 답변이 없습니다.
댓글달기