• Research Article

    Comparison of environmental sound classification performance of convolutional neural networks according to audio preprocessing methods

    오디오 전처리 방법에 따른 콘벌루션 신경망의 환경음 분류 성능 비교

    Wongeun Oh

    오원근

    This paper presents the effect of the feature extraction methods used in the audio preprocessing on the classification performance of the Convolutional ...

    본 논문에서는 딥러닝(deep learning)을 이용하여 환경음 분류 시 전처리 단계에서 사용하는 특징 추출 방법이 콘볼루션 신경망의 분류 성능에 미치는 영향에 ...

    + READ MORE
    This paper presents the effect of the feature extraction methods used in the audio preprocessing on the classification performance of the Convolutional Neural Networks (CNN). We extract mel spectrogram, log mel spectrogram, Mel Frequency Cepstral Coefficient (MFCC), and delta MFCC from the UrbanSound8K dataset, which is widely used in environmental sound classification studies. Then we scale the data to 3 distributions. Using the data, we test four CNNs, VGG16, and MobileNetV2 networks for performance assessment according to the audio features and scaling. The highest recognition rate is achieved when using the unscaled log mel spectrum as the audio features. Although this result is not appropriate for all audio recognition problems but is useful for classifying the environmental sounds included in the Urbansound8K.


    본 논문에서는 딥러닝(deep learning)을 이용하여 환경음 분류 시 전처리 단계에서 사용하는 특징 추출 방법이 콘볼루션 신경망의 분류 성능에 미치는 영향에 대해서 다루었다. 이를 위해 환경음 분류 연구에서 많이 사용되는 UrbanSound8K 데이터셋에서 멜 스펙트로그램(mel spectrogram), 로그 멜 스펙트로그램(log mel spectrogram), Mel Frequency Cepstral Coefficient(MFCC), 그리고 delta MFCC를 추출하고 각각을 3가지 분포로 스케일링하였다. 이 데이터를 이용하여 4 종의 콘볼루션 신경망과 이미지넷에서 좋은 성능을 보였던 VGG16과 MobileNetV2 신경망을 학습시킨 다음 오디오 특징과 스케일링 방법에 따른 인식률을 구하였다. 그 결과 인식률은 스케일링하지 않은 로그 멜 스펙트럼을 사용했을 때 가장 우수한 것으로 나타났다. 도출된 결과를 모든 오디오 인식 문제로 일반화하기는 힘들지만, Urbansound8K의 환경음이 포함된 오디오를 분류할 때는 유용하게 적용될 수 있을 것이다.

    - COLLAPSE
    May 2020
  • Research Article

    A study on the estimation of bubble size distribution using an acoustic inversion method

    음향 역산법을 이용한 기포의 크기 분포 추정 연구

    Cheolsoo Park, So Won Jeong, Gun Do Kim, Ilsung Moon, and Geuntae Yim

    박철수, 정소원, 김건도, 문일성, 임근태

    This paper presents an acoustic inversion method for estimating the bubble size distribution. The estimation error of the attenuation coefficient represented by ...

    본 논문에서는 음향 역산법을 이용한 기포의 크기 분포 추정 기법을 제시하였다. 제 1종 Fredholm 적분방정식으로 표현된 감쇠계수의 추정오차를 목적함수로 정의하였고, 최적해를 구하기 ...

    + READ MORE
    This paper presents an acoustic inversion method for estimating the bubble size distribution. The estimation error of the attenuation coefficient represented by a Fredholm integral equation of the first kind is defined as an objective function, and an optimal solution is found by applying the Levenberg-Marquardt (LM) method. In order to validate the effectiveness of the inversion method, numerical simulations using two types of bubble distribution are performed. In addition, a series of experiments are carried out in a water tank (1.0 m × 0.54 m × 0.6 m), using bubbles generated by three different generators. Images of the distributed bubbles are obtained by a high-speed camera, and the insertion losses of the bubble layer are measured using a source and a hydrophone. The image is post-processed to glance a distribution characteristics of each bubble generator. Finally, the size distribution of bubbles is estimated by applying the inversion method to the measured insertion loss. From the inversion results, it was observed that the number of bubbles increases exponentially as the bubble size decreases, and then increases again after the local peak at 70 μm - 120 μm.


    본 논문에서는 음향 역산법을 이용한 기포의 크기 분포 추정 기법을 제시하였다. 제 1종 Fredholm 적분방정식으로 표현된 감쇠계수의 추정오차를 목적함수로 정의하였고, 최적해를 구하기 위해 Levenberg-Marquardt(LM)기법을 적용하였다. 두 가지의 기포 분포에 대한 수치 시뮬레이션을 통해 제안된 역산 기법의 유용성을 검증하였다. 세 종류의 기포발생기를 이용하여 사각 수조(1.0 m × 0.54 m × 0.6 m)에서 기포 실험을 수행하였다. 고속카메라 촬영을 통해 기포의 분포 이미지를 획득하였고, 음원과 수중청음기를 이용하여 기포층의 주파수별 삽입손실(insertion loss)을 계측하였다. 촬영된 이미지는 후처리를 통해 기포 발생기별 기포 분포 특성을 파악하는데 활용하였고, 계측된 삽입손실에 역산 기법을 적용하여 기포의 크기 분포를 추정하였다. 음향 역산결과로부터 기포의 크기가 작아짐에 따라 기포 개수는 지수적으로 증가하며, 70 μm ~ 120 μm의 국부 피크를 지난 후 다시 증가하는 경향성을 확인하였다.

    - COLLAPSE
    May 2020
  • Research Article

    Analysis of the range estimation error of a target in the asynchronous bistatic sonar

    비동기 양상태 소나의 표적 거리 추정 오차 분석

    Euicheol Jeong and Tae-Hwan Kim

    정의철, 김태환

    The asynchronous bistatic sonar needs to estimate direct blast arrival time at a receiver to localize targets, and therefore the direct blast ...

    비동기 양상태 소나는 음원 방향에서 수신되는 직접파를 탐지하고 직접파가 수신된 시간을 추정하여 반사파의 거리를 산출한다. 따라서 동기식에 비해 직접파 수신 시간 추정 ...

    + READ MORE
    The asynchronous bistatic sonar needs to estimate direct blast arrival time at a receiver to localize targets, and therefore the direct blast arrival time estimation error could be added to target localization error in comparison with synchronous system. Direct blast especially appears as several peaks at the matched filter output by multipath, thus we compared the first peak detection technique and the maximum peak detection technique of those peaks for direct blast arrival time estimation through sea trial data. The test was performed in a shallow sea with bistatic sonar made up of spatially separated source and line array sensors. Line array sensors obtained the target signal which is generated from the echo repeater. As a result, the first peak detection technique is superior to maximum peak detection technique in direct blast arrival time estimation error. The result of this analysis will be used for further research of target tracking in the asynchronous bistatic sonar.


    비동기 양상태 소나는 음원 방향에서 수신되는 직접파를 탐지하고 직접파가 수신된 시간을 추정하여 반사파의 거리를 산출한다. 따라서 동기식에 비해 직접파 수신 시간 추정 오차가 표적 거리 추정 오차에 더하여 나타난다. 특히, 직접파는 다중경로 신호에 의해 정합필터 출력이 여러 개의 첨두치로 나타나는데 문턱치를 넘는 첫 번째 첨두치로 직접파 도달시간을 추정하는 기법과 가장 큰 첨두치로 직접파 도달시간을 추정하는 기법에 대하여 분석하였다. 실험은 공간적으로 분리된 음원과 해저에 매설된 선배열 수신센서로 구성된 양상태 소나를 이용하여 모의 반향기에서 반향되는 유사 표적 신호를 획득하는 방식으로 진행되었다. 실험결과 첫 번째 첨두치로 직접파 도달시간을 추정하는 기법이 표적 거리 추정 오차가 더 작은 것을 확인하였다. 도출된 결과는 비동기 양상태 소나의 표적 추적 기법에 활용할 예정이다.

    - COLLAPSE
    May 2020
  • Research Article

    Design of a wideband cymbal transducer array

    광대역 심벌 트랜스듀서 배열 설계

    Donghyun Kim and Yongrae Roh

    김동현, 노용래

    Cymbal transducers are often used as an array rather than single because they have a high quality factor and low energy conversion ...

    심벌 트랜스듀서는 높은 품질계수와 낮은 에너지 변환 효율성을 가지기 때문에 단일보다는 배열형으로 많이 사용된다. 단, 배열형으로 사용하면 구성 트랜스듀서들 간의 상호작용으로 인해 ...

    + READ MORE
    Cymbal transducers are often used as an array rather than single because they have a high quality factor and low energy conversion efficiency. When used as an array, there occurs a big change in the frequency characteristics of the array due to the interaction between constituent transducers. In this study, we designed the structure of a cymbal transducer array to have ultra-wideband characteristics using this property. First, cymbal transducers with specific center frequencies were designed. Then, a 2x2 planar array was constructed with the designed transducers, where the cymbal transducers were arranged to have same or opposite polarization directions. For this structure, we analyzed the effect of the difference in the center frequency of and the spacing between the constituent transducers on the acoustical characteristics of the array. Based on the analysis, we designed the structure of the cymbal transducer array to have the widest possible bandwidth.


    심벌 트랜스듀서는 높은 품질계수와 낮은 에너지 변환 효율성을 가지기 때문에 단일보다는 배열형으로 많이 사용된다. 단, 배열형으로 사용하면 구성 트랜스듀서들 간의 상호작용으로 인해 주파수 특성에 많은 변화가 나타난다. 본 연구에서는 이러한 성질을 이용하여 초광대역 특성을 가지는 배열형 심벌 트랜스듀서의 구조를 설계하였다. 먼저, 특정 중심 주파수를 가지는 심벌 트랜스듀서를 설계하였다. 그리고 설계된 심벌 트랜스듀서들로 2x2 평면 배열을 구성하는데, 구성 트랜스듀서들이 모두 동일하거나 엇갈리는 분극 방향을 가지도록 하였다. 이 배열구조에 대해서 구성 트랜스듀서들 간의 중심 주파수 차이와 트랜스듀서들 중심과 중심 간의 간격이 전체 배열 구조의 음향특성에 미치는 영향을 분석하였다. 이 결과를 바탕으로 비대역폭이 최대가 되는 배열형 심벌 트랜스듀서의 구조를 도출하였다.

    - COLLAPSE
    May 2020
  • Research Article

    Analysis on performance of grid-free compressive beamforming based on experiment

    실험 기반 무격자 압축 빔형성 성능 분석

    Myoungin Shin, Youngbin Cho, Youngmin Choo, Keunhwa Lee, Jungpyo Hong, Seongil Kim, and Wooyoung Hong

    신명인, 조영빈, 추영민, 이근화, 홍정표, 김성일, 홍우영

    In this paper, we estimated the Direction of Arrival (DOA) using Conventional BeamForming (CBF), adaptive beamforming and compressive beamforming. Minimum Variance Distortionless ...

    본 논문에서는 일반 빔형성, 적응 빔형성, 압축센싱을 이용하여 도래각을 추정한다. 이때, 적응 빔형성으로 Minimum Variance Distortionless Response(MVDR)과 Multiple Signal Classification ...

    + READ MORE
    In this paper, we estimated the Direction of Arrival (DOA) using Conventional BeamForming (CBF), adaptive beamforming and compressive beamforming. Minimum Variance Distortionless Response (MVDR) and Multiple Signal Classification (MUSIC) are used as the adaptive beamforming, and grid-free compressive sensing is applied for the compressive sensing beamforming. Theoretical background and limitations of each technique are introduced, and the performance of each technique is compared through simulation and real experiments. The real experiments are conducted in the presence of reflected signal, transmitting a sound using two speakers and receiving acoustic data through a linear array consisting of eight microphones. Simulation and experimental results show that the adaptive beamforming and the grid-free compressive beamforming have a higher resolution than conventional beamforming when there are uncorrelated signals. On the other hand, the performance of the adaptive beamforming is degraded by the reflected signals whereas the grid-free compressive beamforming still improves the conventional beamforming resolution regardless of reflected signal presence.


    본 논문에서는 일반 빔형성, 적응 빔형성, 압축센싱을 이용하여 도래각을 추정한다. 이때, 적응 빔형성으로 Minimum Variance Distortionless Response(MVDR)과 Multiple Signal Classification(MUSIC)을 사용하였고, 압축 빔형성(compressive sensing beamforming)을 위해 무격자 압축센싱(grid-free compressive sensing)을 적용하였다. 앞서 언급한 각 기법들의 이론적 배경 및 한계점을 소개하고 모의실험 및 실제 실험을 통해 각 기법의 성능을 비교하였다. 실제 실험은 반사 신호가 존재하는 환경에서 수행하였으며, 2대의 스피커를 통해 음원을 송신하고 8대의 마이크로폰을 사용한 선배열을 통해 데이터를 수신하였다. 모의실험 및 실제 실험 결과를 통해 상관신호가 존재하지 않을 때, 적응 빔형성과 무격자 압축 빔형성이 일반 빔형성보다 고해상도의 결과를 보임을 확인하였다. 반면, 반사 신호가 존재하는 환경에서 적응 빔형성의 성능이 저하되지만, 무격자 압축 빔형성의 경우 반사 신호의 영향을 받지 않고 일반 빔형성의 분해능이 개선됨을 확인하였다.

    - COLLAPSE
    May 2020
  • Research Article

    Performance of direction-of-arrival estimation of SpSF in frequency domain: in case of non-uniform sensor array

    주파수 영역으로 구현한 SpSF알고리듬: 비균일 센서 환경에서의 도래각 추정 성능

    Ji Woong Paik, Xueyang Zhang, Wooyoung Hong, Jungpyo Hong, Seongil Kim, and Joon-Ho Lee

    백지웅, Xueyang Zhang, 홍우영, 홍정표, 김성일, 이준호

    Currently, studies on the estimation algorithm based on compressive sensing are actively underway, but to the best of our knowledge, no study ...

    현재 압축센싱 기반 도래각 추정 알고리듬의 연구는 활발히 진행 중이나 비균일 센서 배열 기반 공분산 fitting 알고리듬의 성능에 대한 연구는 진행되지 않았다 ...

    + READ MORE
    Currently, studies on the estimation algorithm based on compressive sensing are actively underway, but to the best of our knowledge, no study on the performance of the Sparse Spectrum Fitting (SpSF) algorithm in nonuniform sensor arrays has been made. This paper deals with the derivation of the compressive sensing based covariance fitting algorithm extended to the frequency domain. In addition, it shows the performance of directon-of-arrival estimation of the frequency domain SpSF algorithm in non-uniform linear sensor array system and the sensor array failure situation.


    현재 압축센싱 기반 도래각 추정 알고리듬의 연구는 활발히 진행 중이나 비균일 센서 배열 기반 공분산 fitting 알고리듬의 성능에 대한 연구는 진행되지 않았다. 본 논문에서는 주파수 영역으로 확장된 압축센싱 기반 공분산 fitting 알고리듬의 유도과정을 다루며 센서배열이 비균일하게 배치된 경우와 센서배열의 일부 소자에 고장이 발생한 경우에 대한 해당 알고리듬의 도래각 추정 성능을 비교하였다.

    - COLLAPSE
    May 2020
  • Research Article

    A study on the broadband beam pattern synthesis using spatial response variation

    공간 응답 변화량을 적용한 광대역 빔 형성기 설계법

    Jun Seok Lim, Keunhwa Lee, and Jae-Kyun Ahn

    임준석, 이근화, 안재균

    In this paper, we propose a broadband beamforming method using the Spatial Response Variation (SRV) which is defined to measure the fluctuation ...

    본 논문은 공간 응답 변화량(Spatial Response Variation, SRV)을 사용한 광대역 빔 형성 방법을 제안한다. SRV를 정규화 항으로 적용하여 목표하는 주파수 ...

    + READ MORE
    In this paper, we propose a broadband beamforming method using the Spatial Response Variation (SRV) which is defined to measure the fluctuation of the array spatial response within the desired frequency band. By applying the SRV to regularization term, we achieve a good quality main beam width variation less than 1 degree within the desired frequency band. In design experiments, we show that the proposed method is better than the existing method.


    본 논문은 공간 응답 변화량(Spatial Response Variation, SRV)을 사용한 광대역 빔 형성 방법을 제안한다. SRV를 정규화 항으로 적용하여 목표하는 주파수 대역에서 주 빔 폭의 변동이 약 1도 이내로 적은 양질의 광대역 빔 패턴을 얻도록 하였다. 설계 실험에서 제안 된 방법이 기존 방법보다 낫다는 것을 입증하였다.

    - COLLAPSE
    May 2020
  • Research Article

    Study on the pre-processors to improve the generalized-cross -correlation based time delay estimation under the narrow band single tone signal environments

    협대역 단일 주파수 신호 환경에서 일반 상호 상관 시간 지연 추정 향상을 위한 전처리기 연구

    Jun Seok Lim and Seongil Kim

    임준석, 김성일

    There are several methods for the time delay estimation between signals to two receivers. Among these methods, Generalized Cross Correlation (GCC), which ...

    두 개 수신기에 도래한 신호 간의 시간 지연을 추정 방법에는 여러 가지가 존재한다. 그 중에서 두 수신기에 입력되는 서로 다른 신호간의 상호 ...

    + READ MORE
    There are several methods for the time delay estimation between signals to two receivers. Among these methods, Generalized Cross Correlation (GCC), which estimates the relative delay from the cross- correlation between the different signals at the two receivers, is a traditionally well-known method. However, when using a narrow band Continuous Wave (CW) signal, the GCC method degrades the estimation performance from relatively higher signal-to-noise ratio than when using a wideband signal. To improve this phenomenon, this paper examines four different pre-processors for GCC using narrow band single frequency signals. Simulation shows that the performance gain of the preprocessed GCC is up to 9 dB for a 100 msec CW signal as well as up to 4 dB for a 1 s CW signal.


    두 개 수신기에 도래한 신호 간의 시간 지연을 추정 방법에는 여러 가지가 존재한다. 그 중에서 두 수신기에 입력되는 서로 다른 신호간의 상호 상관으로부터 상대적인 지연을 추정하는 Generalized Cross Correlation(GCC) 방법은 안정적인 성능을 내는 전통적으로 유명한 방법이다. 그러나 GCC 방법은 단일 주파수 신호를 사용하는 경우에 일반 광대역 신호를 사용하였을 때보다 더 높은 신호 대 잡음비에서부터 추정 성능이 저하된다. 본 논문에서는 이 같은 현상을 개선하기 위해서 협대역 단일 주파수 신호에 대해 GCC를 위한 네 가지 전 처리기를 살펴본다. 시뮬레이션을 통해서 처리기를 사용하였을 때가 전 처리기를 전혀 사용하지 않았을 때보다 100 msec 길이 송신 신호에 대해서 최대 9 dB의 성능 이득을 얻었고, 1 s 길이 송신 신호에 대해서는 최대 4 dB의 성능 이득이 있음을 보인다.

    - COLLAPSE
    May 2020
  • Research Article

    Discrete-time approximation and modeling of a broadband underwater propagation channel based on eigenray analysis

    고유 음선 분석에 기반한 광대역 수중음향 전달 채널의이산시간 근사 및 모의 방법 연구

    Donghoon Shin, Hyeon-Deok Cho, Taekik Kwon, and Jae-Kyun Ahn

    신동훈, 조현덕, 권택익, 안재균

    In this paper, broadband underwater propagation channel modeling based on eigenray analysis is discussed. Underwater channels are often formulated in frequency domain ...

    본 논문은 음선 경로법에 기반한 광대역 수중음향 전달 채널을 모델링하는 방법을 다루었다. 수중음향 전달 채널은 종종 주파수 영역에서 시간 조화 함수로 취급되어 ...

    + READ MORE
    In this paper, broadband underwater propagation channel modeling based on eigenray analysis is discussed. Underwater channels are often formulated in frequency domain time-harmonic signals, which are impractical for simulating broadband signals in time domain. In this regard, time domain modeling of the underwater propagation channel is required for the simulation of broadband signals, for which the eigenray analysis based on ray tracing, resulting in multipath propagation delays in time-domain, is used in this paper. For discrete time system application, the phase, frequency-dependent loss and non-integer sample delays for each eigenray, are approximated by the finite impulse response of the broadband propagation channel.


    본 논문은 음선 경로법에 기반한 광대역 수중음향 전달 채널을 모델링하는 방법을 다루었다. 수중음향 전달 채널은 종종 주파수 영역에서 시간 조화 함수로 취급되어, 광대역 시계열 신호 모의 시 활용이 어렵다. 따라서 수중 음파전달 환경을 반영한 광대역 시간영역 모델링 기법이 요구되며, 본 논문에서는 이를 위해 시간영역에서 다중 경로의 도달 시간지연이 계산 가능한 고유 음선 분석 기법을 활용하였다. 또한 연속 시간의 파동방정식으로부터 산출된 고유 음선의 분석 결과를 컴퓨터 모의가 가능한 이산시간 시스템에 적용하기 위해, 음선의 위상, 주파수별 손실 및 도달 시간지연을 유한 임펄스 응답으로 근사하여, 광대역 수중음향 전달 채널을 모의하는 방법을 제안하였다.

    - COLLAPSE
    May 2020