[AI 프로젝트 코딩기술서] 건설 현장에서의 음성인식을 위한 음성처리 연구

IoT, 인공지능, 빅데이터의 상호관계 및 실무지식을 심화학습하고 산업과 사회에서 겪는 소프트웨어 문제를 코딩을 통해 해결하여 기술적 이슈와 응용능력 배양

 
박수현.png

콘텐츠 소개(About Contents)


해당 프로젝트는 건설현장에 적용가능한 음성인식 서비스 개발을 위해 기존 음성인식 모델들을 이용하기에 앞서 건설현장 소음에 대한 noise cancellation 처리가 음성인식 성능 향상에 유효한 지 실험한다.
noise cancellation  모델은 mozilla의 RNNoise를 이용한다. 모델 훈련을 위해서는 소음이 없는 환 경에서 녹음된 발화인 Clean speech와 건설현장 소음 데이터로 구성된 Noise sound가 필요하다. 이때 두 데이터셋의  sampling rate는 통일되어야 하고, 형식은 .pcm으로 변환되어야 한다.

Institution 글로벌공학교육센터(Global Education Center for Engineers)
Subject IoT·인공지능·빅데이터

기획자(Planner)

서울대학교 건축학과 
 박수현

첨부파일