기술정보
기술정보
기술명 음성인식 성능향상을 위한 지능형 환경잡음감쇄 기술
기술명(영문) Intelligent Noise Reduction Software
활용분야 AI speaker Mobile Phone 보안용 IoT
기술번호 TI2019-01224
기술성숙도
#기술성숙도
개발전 4단계:연구실 규모의 무품/시스쳄 핵심 성능평가
개발후 6단계:파일롯 규모 시작품 제작 및 성능평가
외부기술요소 개발목표시기 2020-12-31
결과물 형태
검증방법
시장성
시장성
시장성 내용
1. 국내외 기술동향 및 경쟁력
   ㅇ 국내기술 동향
    ▷ 인공지능 관련 기술 동향
       - 자율지능 디지털 동반자 기술을 위한 사용자 의도 및 맥락 인지 기술은 최근 2~3년간 다수의 기업에 의해 기술 개발되고 있으나, 개발 기간이 짧은 것이 현실. 투입 인력이 부족할 뿐 아니라 서비스에 연계된 기술 개발 환경이 제대로 이루어져 있지 않아 개별적인 상황 인지 기술을 개발 중.
       - 음성, 텍스트, 영상, 스토리, 정형 및 비정형 데이터, 장치 정보, 공간 정보 등 복합 인지 및 정보로부터 지식을 습득하고 사용자 상황을 파악하는 연구 및 개발은 개별 기관/기업이 해낼 수 없는 복합적인 기술로 시도하지 못한 단계임.
       - 근거리 음성인식을 위한 잡음에 대한 연구개발은 수행되었으나, 로봇 등을 위한 원거리 음성인식 및 실제 잡음 환경에서의 연구는 초기 단계임. 원거리 음성인식을 위해서는 타채널 음질 개선 기술이 필수적임.
 
   ㅇ 해외기술 동향
    ▷ 인공지능 기반의 음성인식 시장 확대
       - 영어 기반의 음성 인식은 상당부분 진척이 되어 있는 상황으로 Nuance, Verint 등 전문업체들이 미국 등 선진국에서 사업화를 진행하고 있음 
       - 음성 대화의 경우, 애플 SIRI, 아마존 ECHO, MS Cortana 등을 통해 글로벌 서비스가 진행되고 있으며, 이를 콜센터와 같은 기업-고객 상담 시장에 적용하려는 업체(Nuance 등)가 늘고 있음.

   ㅇ 기술적 경쟁력(우수성 및 차별성)
경쟁기술 본 기술의 우수성 및 차별성
BeamFormIt
(ICSI, Berkley Univ., 2014)
장점: 실시간성, 구현용이, 정상잡음 감쇄에 효과적, DB 없음 (非학습 기반)
단점: 마이크 배열의 정보를 요구, 비정상 잡음 감쇄 효과가 떨어짐
비교우위: 마이크의 배열 정보 불필요, 잡음모델 학습 기반이므로 다양한 비정상 잡음 감쇄에 효과적
SNMF+ONL
(GIST, 2016)
장점: 실시간성, 정상 및 비정상 잡음감쇄에 효과적, 소용량의 음성 DB만 요구
단점: 다채널 처리에 용이하지 않음, 음원분리에 따른 음질 열화 발생
비교우위: NTF를 이용하여 임의의 다채널 오디오에서의 음성 분리에 적합, 딥러닝 기반의 IRM 추정치를 원신호에 적용하므로 음질 열화를 개선
SEGAN
(Universitat Politecnica de Catalunya, 2017)
장점: End-to-End 훈련 기반, 고품질의 잡음감쇄, 다양한 잡음환경 대응 (DB가 충분히 큰 경우)
단점: 다채널 구조 변경이 매우 어려움 (네트워크 구조 재도출 필요), 실시간성 x, 다량의 음성 및 잡음DB 요구
비교우위: 실시간성, 다채널 활용을 통한 고품질 음성분리 가능, 소용량 음성 DB만으로 구현 용이

2. 국내외 시장동향 및 전망
   ㅇ 국내시장 동향 및 전망
    ▷ 음성인식 관련 국내 동향
       - 음성인식 기술과 관련된 국내 특허는 특허청 검색 결과 약 12,000여건 정도가 조사됐으며 그 중 LG전자와 삼성전자가 3,500여건의 가장 많은 특허를 보유하고 있음. 
       - 그 외에 SKT와 KT가 250여건과 200여건을 보유하고 있으며, ETRI 또한 약 200여건의 특허를 보유하고 있음. 그러나 원거리 환경에서의 음성인식에 관련된 특허는 총 500여건 정도로 낮은 비율을 차지하고 있는 것으로 나타남.
       - 대화처리와 관련된 특허 건수는 약 3,400여건으로 조사됐으며, 마이크로소프트, LG전자, 삼성전자가 각각 200여건 정도의 특허를 보유하고 있었으며, 그 뒤로 ETRI, 퀄컴 등이 100여건 정도의 특허를 보유하고 있음.

   ㅇ 해외시장 동향 및 전망
    ▷ 음성인식 관련 해외 동향
       - 최근 음성인식 분야의 국외 특허 동향은 Google, Microsoft, Facebook, Nuance와 같은 글로벌 기업의 특허출원이 대다수를 차지하고 있는 실정임. 
       - Facebook은 자동 음성통역 분야에 특화된 자연어 음성인식 기술을 확보하고 있으며, Nuance는 다국어를 인식 대상의 대화체 음성인식 기술 및 고객을 위한 인식엔진 특화 기술을 확보 중임.
       - 대화처리 분야의 경우, 언어 이해 및 사용자 의도 파악과 관련된 특허가 Nuance, AT&T를 중심으로 출원되고 있음.
시장성 -제품화 및 활용분야
시장성 -제품화 및 활용분야
활용분야(제품/서비스) 제품 및 활용분야 세부내용
등록된 내용이 없습니다
AI speaker
다채널 마이크로폰의 음질개선을 통한 음성인식 성능향상
Mobile Phone
음질개선을 통한 통화 품질 개선
보안용 IoT
잡음제거를 통한 음향 기반 사건 검출의 성능 향상
기술개요(영문)
기술개요(영문)
기술개요(영문) 내용
1. Technical Name
Intelligent Noise Reduction Software

2. Concept

3. Service Offering
● Noise reduction using speech/noise separation
● DNN-based speech enhancement

4. Comparative Advantage
● Noise reduction : Non-negative tensor factorization (NTF)-based noise reduction
● Speech compensation : DNN-based speech compensation using ideal ration mask (IRM) estimation 
● Environment noise adaptation : Trainable noise model update
● 8 / 16kHz supported

5. Patents(Domestics)
 
Patents(Domestics) Application (    )
Registration(    )
Patents(International) Application (    )
Registration(    )
기술개요 및 개념도
기술개요 및 개념도
기술개요 및 개념도 내용
1. 기술의 개념 및 내용
  ㅇ 기술의 개념
       - 최근 음성 개선 (speech enhancement)의 경우 음성 기반의 어플리케이션의 발달과 함께 수요가 증가하는 추세임. 많은 어플리케이션들이 잡음환경에서 음성이 녹음되며 이러한 환경에서 녹음된 음원의 경우, 낮은 signal to ratio (SNR)에서 작동하는 경우가 존재함. 따라서 이러한 잡음 조건에서 잘 동작하기 위해 음성 개선은 음성을 활용하는 어플리케이션에 효과적으로 사용 가능함.
       - 응용 서비스 환경에서 제공되는 다채널 마이크로폰 환경에서는 제공 환경마다 그 마이크 구조가 다양하며, 적합한 전처리 기술이 필요함. 본 기술은 다채널 마이크로폰 환경에서의 전처리 기술의 하나로서 음성 잡음 분리를 목표로 함.

   ㅇ 기술개념도(고해상도 그림 사용 요망)


   ㅇ 기술의 상세내용 및 사업화 제약사항
    - 제안 기술은 여러 배경 소음이 혼재하는 실제 환경에서의 음성을 분리하는 방법에 있어서 다채널 마이크 어레이를 활용한 비음수 텐서 분해 기법 (Nonnegative Tensor Factorization, NTF)을 통해 실시간으로 동작함.
    - 특히, 외부 잡음들에 대해 잡음 모델을 실시간으로 적응가능하며, 이를 통해 더욱 강건하게 잡음분리가 가능한 것이 특징임. 
    - 또한 본 기술은 딥러닝 기법을 활용한 스펙트럼 ideal ratio mask (IRM) 추정 방법을 결합하여 더욱 강건한 잡음감쇄가 가능함.
    ▷ 기숭이전 범위
       - 비음수 텐서 분해 기법 기반의 잡음감쇄 기술
       - 비음수 텐서분해의 잡음모델 실시간 업데이트 기술
       - 딥러닝 기반 스펙트럼 마스크 추정 기술
    ▷ 사업화 제약사항
       - 응용 서비스에 따른 알고리즘 튜닝이 필요할 수 있음.
첨부파일
본과제 정보
본과제 정보
과제명(한글) (지능정보-총괄/1세부) 자율지능 디지털 동반자 프레임워크 및 응용 연구개발
과제명(영문) Autonomous Intelligent Digital Companion Framework and Application
색인어 (한글) 자율지능 디지털 동반자 프레임워크  / 자율지능 디지털 동반자 프레임워크  / 디지털 동반자 응용 서비스  / 디지털 동반자 모델링  / 지능형 소셜 에이전트
색인어 (영문) Autonomous Digital Comanion  / Autonomous Digital Companion Framework  / Digital Companion Application Service  / Digital Companion Modelling  / Intelligent Social Agent
과제번호 2017-0-00255-003 해당연도 2019
기술분류
권리성 SW/SW-IP
총연구기간 2017-04-01 ~ 2020-12-31 총예산 미공개
기간(당해연도) 2019-01-01 ~ 2019-12-31 예산(당해연도) 미공개
참여기관 미공개
주관기관 전자부품연구원 과제책임자 정혜동
연락처
연락처
tel : 미공개
cp : 미공개
E-Mail 미공개
개발중인 기술(기술예고)
개발중인 기술(기술예고)
기술번호 기술명 목표시기
TI2019-0121400001 웰니스 컴패니언 질의응답 시스템 2019-12-31
TI2019-0121900002 수어 자동 통역 서비스 기술 2020-12-31
TI2019-0124400006 기계학습을 이용한 의료도메인 개체명 인식 기술 2019-12-31
TI2019-0122400003 음성인식 성능향상을 위한 지능형 환경잡음감쇄 기술 2020-12-31
TI2019-0122800004 컴패니언 모니터링 시스템 2020-12-31
TI2019-0124200005 인공지능 OpenAPI 서비스 프레임워크 기술 2020-10-30
TI2019-0126500007 인공지능 질환자동분류 모델 기술 2020-12-31
TI2019-0126700008 심층 신경망 기반 기계 독해 시스템 기술 및 장치 2020-12-31
이전가능 기술
이전가능 기술
기술번호 기술명
등록된 내용이 없습니다
지재권 목록
관련 지재권 목록
발명 명 출원 번호
등록된 내용이 없습니다
덧글 0