전국매일신문
지면보기
 표지이미지
지방시대
지면보기
 표지이미지
ETRI, 복수 단말 음향 장면 인식 ‘세계 우승’
상태바
ETRI, 복수 단말 음향 장면 인식 ‘세계 우승’
  • 대전/ 정은모기자
  • 승인 2020.07.20 14:42
  • 댓글 0
이 기사를 공유합니다

로봇 전자 귀, 장비 모니터링 등 활용 가능
ETRI가 20일 세계적인 인공지능 기반 음향 이벤트 및 장면 인식 기술 경진 대회 음향 장면 인식 분야에서 세계 1위를 달성했다. [ETRI 제공]
ETRI가 20일 세계적인 인공지능 기반 음향 이벤트 및 장면 인식 기술 경진 대회 음향 장면 인식 분야에서 세계 1위를 달성했다. [ETRI 제공]

ETRI가 20일 세계적인 인공지능 기반 음향 이벤트 및 장면 인식 기술 경진 대회에 음향 장면 인식 분야에서 세계 1위를 달성했다.

대회는 세계 최대 전기·전자기술자협회 AASP가 주관하고 구글, 인텔, 아마존, IBM, 삼성 등 세계 유수 기관이 참가하는 음향 기술 관련 유일한 국제대회다. 6개 분야에 총 138개 팀과 473개의 제안 시스템이 제출되어 3월부터 6월 중순까지 과제별 기술 경쟁이 이뤄졌다.

ETRI은 참가한 분야 중 하나인 인공지능 이용해 소리를 듣고 어떠한 상황인지 음향 인식 기술력을 겨루어 우수를 차지헸다. 이로써 기계가 사람과 같이 청각을 인식하는 길에 한 걸음 더 나아가고 음향 기술과 다양한 산업 분야의 융합이 가속화될 전망이다.

연구팀은 해당 분야에서 시스템 순위 1, 2위를 석권하며 압도적인 기술력을 자랑했다. 개발한 기술은 노약자 및 청각 장애인 등을 위한 위험 회피 기술분야로 응용이 가능하다. 소리를 잘 듣지 못해 상황을 인식하지 못하는 계층을 위해 따뜻한 기술로 활약할 수 있는 셈이다.

이외에도 소리를 듣고 관련 정보를 도출해내는 미디어 자동 태깅 기술, 자동차, 공장 라인 소리를 듣고 이상 유무를 알아내는 장비 상태 모니터링, 로봇 등 다양한 분야로 활용도 예상된다.

연구진은 우수한 성적의 비결로 소리를 주파수 대역별로 나누어 모델이 각각 학습을 할 수 있도록 만든 딥러닝 기반 트라이던트 구조 신경망 개발, 단말별 오디오 신호처리 특성 일반화를 이루는데 강점을 지닐 수 있는 비균 등 입력 특징 분할 기법 설계와 적용한 점을 들었다.

특히 수행 중인 과제와 관련해 저복잡도 기반 음향 장면 인식, 음향 발생 방향 및 이벤트 인식 분야에도 참가하여 좋은 성적을 거뒀다. 입상한 팀은 추가 성능 분석 결과를 포함하여 학회 논문 제출 및 발표를 진행할 예정이다.

또한 AI가 시각, 언어 인식 등의 분야에서는 인간을 상회하는 수준으로 연구가 이뤄진 것에 비해, 청각 분야에서는 아직 갈 길이 먼 상황에서 전자 귀와 같은 모든 음향을 인식할 수 있는 수준으로 목표로 연구개발 중이다.

한편 이번 대회는 ETRI 미디어부호화연구실 서상원 연구원, 박수영 연구원, 정영호 책임연구원이공동으로 참여, 과학기술정보통신부의 신체기능의 이상이나 저하를 극복하기 위한 휴먼 청각 및 근력증강 원천 기술 개발 과제의 일환으로 연구를 진행했다.

 

[전국매일신문] 대전/ 정은모기자
J-em@jeonmae.co.kr


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사