• Research Article

    Computational study on prediction of electrical beam steering phenomenon of parametric array sound source

    파라메트릭 어레이 음원의 전기적 빔 조향 현상 예측을 위한 수치 해석 기법 연구

    Kyounghun Been, Won-Suk Ohm, Wonkyu Moon

    빈경훈, 엄원석, 문원규

    The parametric array phenomenon refers to the generation of a high directivity low frequency wave from a small size radiation plate using ...

    파라메트릭 어레이란 매질의 비선형성을 이용하여 작은 크기의 방사판에서 고지향성 저주파음을 발생시키는 현상을 말한다. 이러한 파라메트릭 어레이의 유용성을 높이기 위해 저주파 음향 빔 ...

    + READ MORE
    The parametric array phenomenon refers to the generation of a high directivity low frequency wave from a small size radiation plate using the nonlinearity of the medium. In order to improve the usability of parametric array, the beam steering method of low frequency wave is researched, and the beam steering phenomenon is predicted easily using the PD (product directivity) model. However, the PD model can only be applied to Gaussian sources under quasi-linear conditions. Also, the prediction accuracy of low frequency wave beam width is poor. In this paper, a method for predicting the beam steering characteristics of a parametric array that can overcome the limitation of the PD model is investigated. For this purpose, the numerical analysis algorithm of the KZK (Khokhlov-Zabolotskaya-Kuzentsov) equation widely used for parametric array phenomenon prediction is improved. Thus, the beam steering characteristics are calculated by applying the electrical beam steering condition and comparing experimental results. As a result, the numerical analysis using the modified KZK equation algorithm in this study confirms that the beam steering phenomenon can be predicted even in a parametric array source that does not correspond to the quasi-linear condition.


    파라메트릭 어레이란 매질의 비선형성을 이용하여 작은 크기의 방사판에서 고지향성 저주파음을 발생시키는 현상을 말한다. 이러한 파라메트릭 어레이의 유용성을 높이기 위해 저주파 음향 빔 조향 연구가 진행 되고 있으며, PD(Product Directivity) 모델을 이용하여 빔 조향 현상이 간편하게 예측되고 있다. 그러나 PD 모델은 준선형 조건에서 가우시안 음원만 적용이 가능하며, 저주파 음향 빔 폭의 예측 정확성이 떨어진다. 본 논문에서는 PD 모델의 한계를 극복할 수 있는 파라메트릭 어레이의 빔 조향 특성 예측 방법에 대해 연구하였다. 이를 위해 파라메트릭 어레이 현상 예측에 널리 사용되는 KZK(Khokhlov-Zabolotskaya-Kuzentsov) 방정식의 수치 해석 알고리즘을 개선하였다. 그리고 전기적 조향 조건을 적용하여 빔 조향 특성을 계산, 실험 결과와 비교 하였다. 그 결과 개선된 알고리즘을 이용하면 준선형 조건에 해당되지 않는 파라메트릭 어레이 음원에서도 저주파 빔 조향 특성 예측이 가능함을 확인하였다.

    - COLLAPSE
    September 2019
  • Research Article

    Analysis of a fixed source-to-receiver underwater acoustic communication channel parameters in shallow water

    송수신기가 고정된 천해 수중음향통신 채널 매개변수 해석

    Minja Bae, Jihyun Park, Jong Rak Yoon

    배민자, 박지현, 윤종락

    Underwater acoustic communication channel parameters consist of impulse response, delay spreading, scattering function, coherence bandwidth, frequency selective fading, coherence time and time ...

    수중음향통신시스템의 모뎀이나 채널 코딩 설계를 위한 채널 매개변수는 임펄스 응답, 지연 확산, 산란함수, 도플러 확산, 상관 대역폭, 주파수 선택적 페이딩, 상관 시간 ...

    + READ MORE
    Underwater acoustic communication channel parameters consist of impulse response, delay spreading, scattering function, coherence bandwidth, frequency selective fading, coherence time and time variant magnitude fading statistics on which communication system modem and channel coding are designed. These parameters are influenced by sound velocity profile, platform motion and sea surface roughness in given acoustical oceanography condition. In this paper, channel model based on phasor, channel simulator, measurement and analysis method of channel parameters are given in a fixed source-to-receiver system and the parameters are analyzed using shallow water experimental data. For two different source-to-receiver ranges of 300 m and 600 m, the parameters are characterized by three multipaths such as a direct, a surface reflection path with time variant scattering and a bottom reflection path. The results present a channel modelling method of a fixed source source-to-receiver system, channel parameters measurement and analysis methods and a system design and performance assessment method in shallow water.


    수중음향통신시스템의 모뎀이나 채널 코딩 설계를 위한 채널 매개변수는 임펄스 응답, 지연 확산, 산란함수, 도플러 확산, 상관 대역폭, 주파수 선택적 페이딩, 상관 시간 및 시변 진폭 페이딩의 통계적 분포 함수 등이다. 이들 매개변수들은 주어진 해양 음향 조건에서 수층의 음속 구조, 플렛폼의 운동이나 해면의 거칠기에 영향을 받는다. 본 논문에서는 송수신기 고정 천해 수중음향통신 채널에 대한 페이저 기반의 채널 모델과 모의실험 및 채널 매개변수들의 측정과 분석 방법을 제시하고 천해의 실험 자료를 이용하여 이들 매개변수들을 해석하였다. 송수신기 거리가 300 m와 600 m에 대한 이들 매개 변수들은 직접파, 산란 성분을 갖는 해면 반사파 및 해저 반사파로 구성되는 3개 다중 경로에 의해 그 특징이 결정됨을 보인다. 연구의 결과는 천해 고정 시스템의 채널 모델 방법, 채널 매개변수들의 측정과 분석 방법 및 시스템 설계와 성능평가 방법을 제시한다.

    - COLLAPSE
    September 2019
  • Research Article

    Acoustic scattering of an obliquely incident acoustic field by a finite elastic cylindrical shell

    비스듬히 입사하는 음장에 대한 유한 길이의 탄성 원통 쉘의 음향 산란

    Keunhwa Lee, Sung-Hoon Byun, Sea-Moon Kim

    이근화, 변성훈, 김시문

    In this study, we theoretically study the acoustic scattering of an obliquely incident plane wave from a finite elastic cylindrical shell. A ...

    본 연구에서는 무한 유체에 놓여있는 유한 길이의 탄성 원통 쉘에 외부에서 비스듬히 평면파가 입사할 때 발생하는 음향 산란 현상을 이론적으로 연구했다. 유한 ...

    + READ MORE
    In this study, we theoretically study the acoustic scattering of an obliquely incident plane wave from a finite elastic cylindrical shell. A heuristic scattering method of Ye [Z. Ye, J. Acoust. Soc. Am. 102, 877-884 (1997)] for a finite fluid cylinder is extended into a finite elastic cylindrical shell since no analytic solutions exist in the finite cylinder. The elastic cylindrical shell is modeled with the 3D elastic wave theory considering internal fluid. Using the derived analytic solution, we observe the effect of the internal fluid on the scattering field, the scattering field for the Rayleigh parameter, and the far-field scattering function for the elastic property of the cylindrical shell.


    본 연구에서는 무한 유체에 놓여있는 유한 길이의 탄성 원통 쉘에 외부에서 비스듬히 평면파가 입사할 때 발생하는 음향 산란 현상을 이론적으로 연구했다. 유한 길이의 원통 쉘에서는 해석적인 산란 해가 존재하지 않기 때문에, Kirchhoff 가정을 적용한 Ye의 산란 기법[Z. Ye, J. Acoust. Soc. Am. 102, 877-884 (1997)]을 사용했다. 탄성 원통 쉘의 특성은 3차원 탄성파 이론을 적용하여 구현했으며 원통 쉘 내부의 유체를 고려했다. 유도된 해석 해를 이용하여 내부 유체가 산란 음장에 미치는 효과, Rayleigh 변수에 대한 산란 음장, 탄성 재질의 변화에 따른 먼 거리 산란 함수를 살펴보았다.

    - COLLAPSE
    September 2019
  • Research Article

    Transmission waveform design for compressive sensing active sonar using the matrix projection from Gram matrix to identity matrix and a constraint for bandwidth

    대역폭 제한 조건과 Gram 행렬의 단위행렬로의 사영을 이용한 압축센싱 능동소나 송신파형 설계

    이세현, 이근화, 임준석, 정명준

    Sehyun Lee, Keunhwa Lee, Jun-Seok Lim, Myoung-Jun Cheong

    The compressive sensing model for range-Doppler estimation can be expressed as an under-determined linear system y = Ax. To find the solution of ...

    거리-도플러 추정을 위한 압축센싱(Compressive Sensing,CS) 모델은 과소결정계인 y=Ax 선형시스템으로 표현할 수 있다. 압축센싱 기법으로 위 선형시스템의 해를 찾으려면 행렬 ...

    + READ MORE
    The compressive sensing model for range-Doppler estimation can be expressed as an under-determined linear system y = Ax. To find the solution of the linear system with the compressive sensing method, matrix A should be sufficiently incoherent and x to be sparse. In this paper, we propose a transmission waveform design method that maintains the bandwidth required by the sonar system while lowering the mutual coherence of the matrix A so that the matrix A is incoherent. The proposed method combines two methods of optimizing the sensing matrix with the alternating projection and suppressing unwanted frequency bands using the DFT (Discrete Fourier Transform) matrix. We compare range-Doppler estimation performance of existing waveform LFM(Linear Frequency Modulated) and designed waveform using the matched filter and the compressive sensing method. Simulation shows that the designed transmission waveform has better detection performance than the existing waveform LFM.


    거리-도플러 추정을 위한 압축센싱(Compressive Sensing,CS) 모델은 과소결정계인 y=Ax 선형시스템으로 표현할 수 있다. 압축센싱 기법으로 위 선형시스템의 해를 찾으려면 행렬 A가 충분히 비간섭적이고 x가 희소해야한다. 본 연구는 행렬 A가 비간섭적이도록 행렬 A의 상호간섭성을 낮추는 동시에 소나시스템에서 요구하는 대역폭을 유지하는 송신파형 설계 방법을 제안하였다. 제안한 방법은 행렬사영으로 센싱행렬을 최적화하는 방법과 DFT (Discrete Fourier Transform) 행렬을 이용하여 원하지 않은 주파수밴드를 억압하는 두 가지 방법을 결합한 것이다. 정합필터와 압축센싱 기법을 이용하여 기존파형 LFM(Linear Frequency Modulated)과 설계한 파형의 거리-도플러 추정 성능을 비교하였다. 시뮬레이션을 통해 설계한 송신파형이 기존파형(LFM)보다 탐지성능이 우수함을 보인다.

    - COLLAPSE
    September 2019
  • Research Article

    Computational performance and accuracy of compressive sensing algorithms for range-Doppler estimation

    거리-도플러 추정을 위한 압축 센싱 알고리즘의 계산 성능과 정확도

    Hyunkyu Lee, Keunhwa Lee, Wooyoung Hong, Jun-Seok Lim, Myoung-Jun Cheong

    이현규, 이근화, 홍우영, 임준석, 정명준

    In active SONAR, several different methods are used to detect range-Doppler information of the target. Compressive sensing based method is more accurate ...

    능동소나에서는 표적의 거리 도플러 정보를 탐지하기 위해 여러 가지 기법을 사용한다. 그중 압축 센싱을 적용한 기법은 기존의 방식보다 더욱 정밀한 탐지가 가능하며 ...

    + READ MORE
    In active SONAR, several different methods are used to detect range-Doppler information of the target. Compressive sensing based method is more accurate than conventional methods and shows superior performance. There are several compressive sensing algorithms for range-Doppler estimation of active sonar. The ability of each algorithm depends on algorithm type, mutual coherence of sensing matrix, and signal to noise ratio. In this paper, we compared and analyzed computational performance and accuracy of various compressive sensing algorithms for range-Doppler estimation of active sonar. The performance of OMP (Orthogonal Matching Pursuit), CoSaMP (Compressive Sampling Matching Pursuit), BPDN (CVX) (Basis Pursuit Denoising), LARS (Least Angle Regression) algorithms is respectively estimated for varying SNR (Signal to Noise Ratio), and mutual coherence. The optimal compressive sensing algorithm is presented according to the situation.


    능동소나에서는 표적의 거리 도플러 정보를 탐지하기 위해 여러 가지 기법을 사용한다. 그중 압축 센싱을 적용한 기법은 기존의 방식보다 더욱 정밀한 탐지가 가능하며 우수한 성능을 나타낸다. 능동 소나의 거리 도플러 추정에 적용할 수 있는 압축 센싱 알고리즘은 여러 가지 있다. 압축 센싱 알고리즘 마다 계산 성능이 다르며 압축 센싱 알고리즘에 따라 신호 대 잡음비와 센싱 행렬의 코히런스가 거리 도플러 추정에 미치는 영향의 정도가 다르다. 본 논문은 능동 소나의 거리 도플러 추정을 위한 여러 가지 압축 센싱 알고리즘의 계산 성능과 정확도를 비교, 분석하였다. 여러 신호 대 잡음비, 상호간섭성 값에 대한 OMP(Orthogonal Matching Pursuit) , CoSaMP(Compressive Sampling Matching Pursuit), BPDN(CVX)(Basis Pursuit Denoising), LARS(Least Angle Regression) 알고리즘의 추정 성능을 확인하였으며, 상황에 따른 최적의 압축 센싱 알고리즘을 보인다.

    - COLLAPSE
    September 2019
  • Research Article

    Detection of tonal frequency of underwater radiated noise via atomic norm minimization

    Atomic norm minimization을 통한 수중 방사 소음 신호의 토널 주파수 탐지

    Junhan Kim, Jinhong Kim, Byonghyo Shim, Jungpyo Hong, Seongil Kim, Wooyoung Hong

    김준한, 김진홍, 심병효, 홍정표, 김성일, 홍우영

    The tonal signal caused by the machinery component of a vessel such as an engine, gearbox, and support elements, can be modeled ...

    수중 표적의 기어박스 및 보조 장치 등으로부터 방사되는 토널 신호의 주파수 성분은 처리하고자 하는 주파수 대역에 비해 상대적으로 적어 희소신호로 모델링될 수 ...

    + READ MORE
    The tonal signal caused by the machinery component of a vessel such as an engine, gearbox, and support elements, can be modeled as a sparse signal in the frequency domain. Recently, compressive sensing based techniques that recover an original signal using a small number of measurements in a short period of time, have been applied for the tonal frequency detection. These techniques, however, cannot avoid a basis mismatch error caused by the discretization of the frequency domain. In this paper, we propose a method to detect the tonal frequency with a small number of measurements in the continuous domain by using the atomic norm minimization technique. From the simulation results, we demonstrate that the proposed technique outperforms conventional methods in terms of the exact recovery ratio and mean square error.


    수중 표적의 기어박스 및 보조 장치 등으로부터 방사되는 토널 신호의 주파수 성분은 처리하고자 하는 주파수 대역에 비해 상대적으로 적어 희소신호로 모델링될 수 있다. 근래에 토널 신호의 주파수 희소성을 이용하여 빠른 시간 내에 적은 수의 관측치로 토널 주파수를 복원하는 압축센싱 기반의 연구가 활발히 진행되고 있다. 기존의 방법들은 이산(discrete) 주파수 영역에서 주파수를 검출하기 때문에 이산화로 인한 basis mismatch error가 불가피하다. 본 논문에서는 atomic norm minimization을 이용하여 적은 수의 관측치로 연속(continuous) 주파수 영역에서 토널 주파수를 검출하는 기법을 제안한다. 모의실험을 통해 기존의 기법들에 비해 제안하는 기법의 성능이 정확성과 평균제곱오차 측면에서 우수함을 확인하였다.

    - COLLAPSE
    September 2019
  • Research Article

    Analysis of acoustic scattering characteristics of an aluminum spherical shell with different internal fluids and classification using pseudo Wigner-Ville distribution

    구형 알루미늄 쉘 내부의 충전 유체에 따른 수중 음향 산란 특성 분석 및 유사 위그너-빌 분포를 이용한 식별 기법 연구

    Yeon-Seong Choo, Sung-Hoon Byun, Sea-Moon Kim, Keunhwa Lee

    추연성, 변성훈, 김시문, 이근화

    The acoustical scattering characteristics of a target are influenced by the material properties and structural characteristics of the target, which are critical ...

    표적의 음향 산란 특성은 표적의 재료 특성과 구조적 특성에 영향을 받으며, 이는 음향을 이용하여 수중에서 표적을 탐지, 식별하고자 할 때 매우 중요한 ...

    + READ MORE
    The acoustical scattering characteristics of a target are influenced by the material properties and structural characteristics of the target, which are critical information for acoustic detection and identification of underwater target. In particular, for thin elastic target, unique scattered signals are generated around the target by the Lamb wave. In this paper, the results of scattered signal measurement of aluminum spherical shell in the water tank using the stepped frequency sweep sine signal are presented. In particular, the scattering of the water-filled aluminum spherical shell is compared with that of the air-filled one both theoretically and experimentally. The difference of the scattered signals are analyzed using the pseudo Wigner-Ville distribution in terms of average frequency, frequency distribution, and energy of the scattered signal. The result shows that all observed parameters increased when the aluminum sphere was water-filled, and it is well matched to the theoretical expectation.


    표적의 음향 산란 특성은 표적의 재료 특성과 구조적 특성에 영향을 받으며, 이는 음향을 이용하여 수중에서 표적을 탐지, 식별하고자 할 때 매우 중요한 정보가 된다. 특히, 얇은 탄성체의 경우 램파(Lamb wave)에 의해 표적 주변 유체에 산란파가 생성된다. 본 논문에서는 계단 주파수 스윕 사인 파형을 이용하여 수조에서 알루미늄 구의 산란 신호를 측정한 결과를 제시한다. 특히 알루미늄 구의 내부에 물이 채워져 있는 경우와 공기가 채워져 있는 경우에 대하여 산란 신호의 차이를 측정하고 이론 모델과 비교하였다. 또, 내부 물질에 따른 표적 산란 신호 차이를 유사 위그널-빌 분포를 이용하여 분석하고, 유도파의 평균 주파수, 주파수 분포, 에너지의 차이를 비교하였다. 분석 결과, 구의 내부에 물이 채워진 경우가 공기가 채워진 경우에 비해 유도파의 평균 주파수, 주파수 분포, 에너지가 증가하는 것을 확인하였으며 이는 이론적인 예상과 부합한다.

    - COLLAPSE
    September 2019
  • Research Article

    Effects of changes in banner size on acoustic environments in multipurpose halls for broadcasting

    방송용 다목적 홀에서 배너 가변에 따른 음향 환경 변화

    Ho-Cheul Park, Rosa Seo, Chun-Ki Seo, Jin Yong Jeon

    박호철, 서로사, 서춘기, 전진용

    When used for broadcasting, multipurpose halls need to accommodate various types of programs such as speeches, Korean traditional music, musicals, pop music ...

    스피치, 국악, 뮤지컬, 대중음악과 콘서트까지 다양한 장르의 공연이 이루어지는 방송용 다목적 홀의 경우 공연에 필요한 전기, 건축 음향적 요구 조건이 다양하다. 하지만 ...

    + READ MORE
    When used for broadcasting, multipurpose halls need to accommodate various types of programs such as speeches, Korean traditional music, musicals, pop music, and concerts. Therefore, multipurpose halls must meet a wide range of electric and architectural acoustic demands. However, there are few ways to alter acoustic environments for multipurpose halls, given these different demands. The current study investigates the effects of banners on acoustic environments in the presence of an acoustic shell or electric acoustic system. The results indicate that the installation of a 15% banner of wall area could vary the range of reverberation time(T30) by 0.12s, EDT (Early Decay Time) by 0.15s, clarity of music(C80) by 0.76dB, and clarity of speech(D50) by 6.43% under different measurement circumstances. A computer simulation that enlarges the banner size to 40% of the wall area varies the reverberation time from 0.11s to 0.55s depending on the room environment.


    스피치, 국악, 뮤지컬, 대중음악과 콘서트까지 다양한 장르의 공연이 이루어지는 방송용 다목적 홀의 경우 공연에 필요한 전기, 건축 음향적 요구 조건이 다양하다. 하지만 실제 음향 환경 가변을 위한 효율적인 운용 방법은 많지 않다. 본 연구는 무대 반사판의 설치 유ㆍ무와 전기 음향 사용 조건하에서 배너의 가변에 따른 홀의 음향 환경 변화를 살펴보았다. 그 결과 벽체 면적의 15 %에 해당하는 배너를 설치한 실제 측정에서 잔향 시간(Reverberation Time, T30)은 최대 0.12s, 초기감쇠시간(Early Decay Time, EDT)은 0.15s, 음악 명료도(Clarity, C80)는 0.76dB, 음성 명료도(Definition, D50)는 6.43% 변하였다. 배너의 면적을 확장시킨 컴퓨터 시뮬레이션을 통해 전체 벽체 면적의 40%에 해당하는 배너를 설치할 경우 잔향 시간은 0.11s에서 최대 0.55s까지 가변되는 것을 확인했다.

    - COLLAPSE
    September 2019
  • Research Article

    Performance comparison of lung sound classification using various convolutional neural networks

    다양한 합성곱 신경망 방식을 이용한 폐음 분류 방식의 성능 비교

    Gee Yeun Kim, Hyoung-Gook Kim

    김지연, 김형국

    In the diagnosis of pulmonary diseases, auscultation technique is simpler than the other methods, and lung sounds can be used for predicting ...

    폐질환 진단에서 청진은 다른 진단 방식에 비해 단순하고, 폐음을 이용하여 폐질환 환자식별뿐 아니라 폐음과 관련된 질병을 예측할 수 있다. 따라서 본 논문에서는 ...

    + READ MORE
    In the diagnosis of pulmonary diseases, auscultation technique is simpler than the other methods, and lung sounds can be used for predicting the types of pulmonary diseases as well as identifying patients with pulmonary diseases. Therefore, in this paper, we identify patients with pulmonary diseases and classify lung sounds according to their sound characteristics using various convolutional neural networks, and compare the classification performance of each neural network method. First, lung sounds over affected areas of the chest with pulmonary diseases are collected by using a single-channel lung sound recording device, and spectral features are extracted from the collected sounds in time domain and applied to each neural network. As classification methods, we use general, parallel, and residual convolutional neural network, and compare lung sound classification performance of each neural network through experiments.


    폐질환 진단에서 청진은 다른 진단 방식에 비해 단순하고, 폐음을 이용하여 폐질환 환자식별뿐 아니라 폐음과 관련된 질병을 예측할 수 있다. 따라서 본 논문에서는 다양한 합성곱 신경방 방식을 기반으로 폐음을 이용하여 폐질환 환자를 식별하고, 소리특성에 따른 폐음을 분류하여 각 신경망 방식의 분류 성능을 비교한다. 먼저 폐질환 소견을 갖는 흉부 영역에서 단채널 폐음 녹음기기를 이용하여 폐음 데이터를 수집하고, 수집된 시간축 신호를 스펙트럼 형태의 특징값으로 추출하여 각 분류 신경망 방식에 적용한다. 폐 사운드 분류 방식으로는 일반적인 합성곱 신경망, 병렬 구조, 잔류학습이 적용된 구조의 합성곱 신경망을 사용하고 실험을 통해 각 신경망 모델의 폐음 분류 성능을 비교한다.

    - COLLAPSE
    September 2019
  • Research Article

    Snoring identification method based on residual convolutional neural network

    잔류 합성 곱 신경망 기반의 코골이 식별 방식

    Seung-Su Shin, Hyoung-Gook Kim

    신승수, 김형국

    Snoring is a typical symptom of sleep disorder and it is important to identify the occurrence of snoring because it causes sleep ...

    코골이는 전형적인 수면장애 증상이며 수면 무호흡증을 유발하기 때문에 코골이의 발생을 확인하는 것이 중요하다. 이에 본 논문에서는 효율적인 코골이 식별 알고리즘으로 잔류 합성 ...

    + READ MORE
    Snoring is a typical symptom of sleep disorder and it is important to identify the occurrence of snoring because it causes sleep apnea. In this paper, we proposes a residual convolutional neural network as an efficient snoring identification algorithm. Residual convolutional neural network, which is a structure combining residual learning and convolutional neural network, effectively extracts features existing in data more than conventional neural network and improves the accuracy of snoring identification. Experimental results show that the performance of the proposed snoring algorithm is superior to that of the conventional methods.


    코골이는 전형적인 수면장애 증상이며 수면 무호흡증을 유발하기 때문에 코골이의 발생을 확인하는 것이 중요하다. 이에 본 논문에서는 효율적인 코골이 식별 알고리즘으로 잔류 합성 곱 신경망을 제안한다. 잔류 학습과 합성 곱 신경망을 결합한 구조인 잔류 합성 곱 신경망은 기존의 신경망보다 데이터에 존재하는 특징을 효과적으로 추출하여 코골이 식별 정확도를 향상한다. 실험 결과는 제안한 코골이 식별 알고리즘의 성능이 기존 방식보다 더 우수하다는 것을 보여준다.

    - COLLAPSE
    September 2019
  • Research Article

    A biomimetic communication method based on time shift using dolphin whistle

    돌고래 휘슬을 이용한 지연시간 기반 생체 모방 통신 기법

    Hojun Lee, Jongmin Ahn, Yongcheol Kim, Sangkug Lee, Jaehak Chung

    이호준, 안종민, 김용철, 이상국, 정재학

    In this paper, we propose a biomimetic communication method using a dolphin whistle to covertly transmit the communication signal. A conventional CSS ...

    본 논문에서는 은밀하게 통신 신호를 전송하기 위해 돌고래 휘슬음을 모방한 통신 기법을 제안하였다. 기존의 CSS(Chirp Spread Spectrum) 변조 기법은 돌고래 휘슬음을 ...

    + READ MORE
    In this paper, we propose a biomimetic communication method using a dolphin whistle to covertly transmit the communication signal. A conventional CSS (Chirp Spread Spectrum) modulation technique divides dolphin whistle into several slots and modulates with up and down chirp signals. That causes the time-frequency characteristic difference between the original dolphin whistle and the camouflage performance is degraded. In this paper, we propose a delay based modulation scheme to eliminate distortions. The simulation results show that the bit error rate of the proposed method is better performance than that of the conventional CSS modulation method by about 3.5 dB to 8 dB. And the camouflage performance that evaluated through the cross correlation in the time-frequency domain is also better than that of the CSS modulation method.


    본 논문에서는 은밀하게 통신 신호를 전송하기 위해 돌고래 휘슬음을 모방한 통신 기법을 제안하였다. 기존의 CSS(Chirp Spread Spectrum) 변조 기법은 돌고래 휘슬음을 정해진 시간 단위에 따라 여러 슬롯으로 나누고 각 슬롯에 상향 및 하향 처프 신호를 통해 변조하는 기법이다. 이에 따라 본래의 돌고래 휘슬음과의 시간-주파수 특성 차이가 발생하게 되어 모방 성능이 저하된다. 본 논문에서는 이러한 왜곡을 제거하기 위해 지연 시간을 기반으로 하는 변조 기법을 제안하였다. 전산 모의실험 결과 기존의 CSS 변조 기법에 비해 제안 방법의 비트오류율 성능이 약 3.5 dB ~ 8 dB 우수하였으며 시간-주파수 영역에서의 상호 상관도를 통한 모방 성능 평가에서도 CSS 변조 기법에 비해 우수한 것을 보였다.

    - COLLAPSE
    September 2019
  • Research Article

    Performance improvement of long-range underwater acoustic communication in deep water using spatiotemporal diversity

    심해 장거리 환경에서 시공간 다이버시티를 이용한 수중음향통신성능 향상

    Heejin Park, Donghyeon Kim, J. S. Kim, Joo Young Hahn, Joung-Soo Park

    박희진, 김동현, 김재수, 한주영, 박정수

    ISI (Inter Symbol Interference) reduces the performance of UAComm (Underwater Acoustic Communication). This paper shows that the performance of UAComm can be ...

    수중음향통신에서 다중경로로 인한 인접 심볼 간 간섭은 통신 성능을 저하시킨다. 인접 심볼 간 간섭의 영향을 최소화하여 수중음향통신 성능을 향상시키기 위해 다이버시티 기법을 ...

    + READ MORE
    ISI (Inter Symbol Interference) reduces the performance of UAComm (Underwater Acoustic Communication). This paper shows that the performance of UAComm can be improved through the spatiotemporal diversity method that is the combination of spatial diversity and temporal diversity methods. By using spatiotemporal diversity, the array aperture was reduced to increase the efficiency of the UAComm system. It is also verified using the experimental data of BLAC18 (Biomimetic Long range Acoustic Communication 18) conducted in October 2018.


    수중음향통신에서 다중경로로 인한 인접 심볼 간 간섭은 통신 성능을 저하시킨다. 인접 심볼 간 간섭의 영향을 최소화하여 수중음향통신 성능을 향상시키기 위해 다이버시티 기법을 사용한다. 본 논문에서는 공간 다이버시티와 시간 다이버시티의 결합을 통해 수중음향통신 성능이 개선됨을 보인다. 시공간 다이버시티를 통해 제한적인 배열에서 수중통신 시스템의 효율성을 증대시켰다. 또한 2018년 10월 한국의 동쪽 해역에서 수행한 BLAC18(Biomimetic Long range Acoustic Communication 18) 실험 데이터와 비교하여 이를 검증하였다.

    - COLLAPSE
    September 2019
  • Research Article

    Utilization of age information for speaker verification using multi-task learning deep neural networks

    멀티태스크 러닝 심층신경망을 이용한 화자인증에서의 나이 정보 활용

    Ju-ho Kim, Hee-Soo Heo, Jee-weon Jung, Hye-jin Shim, Seung-Bin Kim, Ha-Jin Yu

    김주호, 허희수, 정지원, 심혜진, 김승빈, 유하진

    The similarity in tones between speakers can lower the performance of speaker verification. To improve the performance of speaker verification systems, we ...

    화자 간 음색의 유사성은 화자 인증 시스템의 성능을 하락 시킬 수 있는 요인이다. 본 논문은 화자 인증 시스템의 일반화 성능을 향상시키기 위해 ...

    + READ MORE
    The similarity in tones between speakers can lower the performance of speaker verification. To improve the performance of speaker verification systems, we propose a multi-task learning technique using deep neural network to learn speaker information and age information. Multi–task learning can improve generalization performances, because it helps deep neural networks to prevent hidden layers from overfitting into one task. However, we found in experiments that learning of age information does not work well in the process of learning the deep neural network. In order to improve the learning, we propose a method to dynamically change the objective function weights of speaker identification and age estimation in the learning process. Results show the equal error rate based on RSR2015 evaluation data set, 6.91 % for the speaker verification system without using age information, 6.77 % using age information only, and 4.73 % using age information when weight change technique was applied.


    화자 간 음색의 유사성은 화자 인증 시스템의 성능을 하락 시킬 수 있는 요인이다. 본 논문은 화자 인증 시스템의 일반화 성능을 향상시키기 위해, 심층신경망에 멀티태스크 러닝 기법을 적용시켜 발화자의 화자 정보와 나이 정보를 함께 학습 시키는 기법을 제안한다. 멀티태스크 러닝 기법은 은닉층들이 하나의 태스크에 과적합 되지 않도록 하여 심층신경망의 일반화 성능을 향상시킨다고 알려져 있다. 하지만 심층신경망을 멀티태스크 러닝 기법으로 학습시키는 과정에서, 나이 정보에 대한 학습이 효율적으로 수행되지 않는 것을 실험적으로 확인하였다. 이와 같은 현상을 방지하기 위해, 본 논문에서는 심층신경망의 학습 과정 중 화자 식별과 나이 추정 목적 함수의 가중치를 동적으로 변경 하는 기법을 제안한다. 동일 오류율을 기준으로 RSR2015 평가 데이터세트에 대해 화자 인증 성능을 평가한 결과 나이 정보를 활용하지 않은 화자 인증 시스템의 경우 6.91 %, 나이 정보를 활용한 화자 인증 시스템의 경우 6.77 %, 나이 정보를 활용한 화자 인증 시스템에 가중치 변경 기법을 적용한 경우 4.73 %의 오류율을 확인하였다.

    - COLLAPSE
    September 2019
  • Research Article

    Korean speech recognition based on grapheme

    문자소 기반의 한국어 음성인식

    Mun-hak Lee, Joon-Hyuk Chang

    이문학, 장준혁

    This paper is a study on speech recognition in the Korean using grapheme unit (Cho-sumg [onset], Jung-sung [nucleus], Jong-sung [coda]). Here we ...

    본 논문에서는 한국어 음성인식기 음향모델의 출력단위로 문자소를 제안한다. 제안하는 음성인식 모델은 한글을 G2P(Grapheme to Phoneme)과정 없이 초성, 중성, 종성 단위의 ...

    + READ MORE
    This paper is a study on speech recognition in the Korean using grapheme unit (Cho-sumg [onset], Jung-sung [nucleus], Jong-sung [coda]). Here we make ASR (Automatic speech recognition) system without G2P (Grapheme to Phoneme) process and show that Deep learning based ASR systems can learn Korean pronunciation rules without G2P process. The proposed model is shown to reduce the word error rate in the presence of sufficient training data.


    본 논문에서는 한국어 음성인식기 음향모델의 출력단위로 문자소를 제안한다. 제안하는 음성인식 모델은 한글을 G2P(Grapheme to Phoneme)과정 없이 초성, 중성, 종성 단위의 문자소로 분해하여 음향모델의 출력단위로 사용하며, 특별한 발음 정보를 주지 않고도 딥러닝 기반의 음향모델이 한국어 발음규정을 충분히 학습해 낼 수 있음을 보인다. 또한 기존의 음소기반 음성인식 모델과의 성능을 비교 평가하여 DB가 충분한 상황에서 문자소 기반 모델이 상대적으로 뛰어난 성능을 가진다는 것을 보인다.

    - COLLAPSE
    September 2019
  • Research Article

    LFMMI-based acoustic modeling by using external knowledge

    External knowledge를 사용한 LFMMI 기반 음향 모델링

    Hosung Park, Yoseb Kang, Minkyu Lim, Donghyun Lee, Junseok Oh, Ji-Hwan Kim

    박호성, 강요셉, 임민규, 이동현, 오준석, 김지환

    This paper proposes LF-MMI (Lattice Free Maximum Mutual Information)-based acoustic modeling using external knowledge for speech recognition. Note that an external ...

    본 논문은 external knowledge를 사용한 lattice 없는 상호 정보 최대화(Lattice Free Maximum Mutual Information, LF-MMI) 기반 음향 모델링 방법을 제안한다. External ...

    + READ MORE
    This paper proposes LF-MMI (Lattice Free Maximum Mutual Information)-based acoustic modeling using external knowledge for speech recognition. Note that an external knowledge refers to text data other than training data used in acoustic model. LF-MMI, objective function for optimization of training DNN (Deep Neural Network), has high performances in discriminative training. In LF-MMI, a phoneme probability as prior probability is used for predicting posterior probability of the DNN-based acoustic model. We propose using external knowledges for training the prior probability model to improve acoustic model based on DNN. It is measured to relative improvement 14 % as compared with the conventional LF-MMI-based model.


    본 논문은 external knowledge를 사용한 lattice 없는 상호 정보 최대화(Lattice Free Maximum Mutual Information, LF-MMI) 기반 음향 모델링 방법을 제안한다. External knowledge란 음향 모델에서 사용하는 학습 데이터 이외의 문자열 데이터를 말한다. LF-MMI란 심층 신경망(Deep Neural Network, DNN) 학습의 최적화를 위한 목적 함수의 일종으로, 구별 학습에서 높은 성능을 보인다. LF-MMI에는 DNN의 사후 확률을 계산하기 위해 음소의 열을 사전 확률로 갖는다. 본 논문에서는 LF-MMI의 목적식의 사전 확률을 담당하는 음소 모델링에 external knowlege를 사용함으로써 과적합의 가능성을 낮추고, 음향 모델의 성능을 높이는 방법을 제안한다. External memory를 사용하여 사전 확률을 생성한 LF-MMI 모델을 사용했을 때 기존 LF-MMI와 비교하여 14 %의 상대적 성능 개선을 보였다.

    - COLLAPSE
    September 2019
  • Research Article

    Determination of representative emotional style of speech based on k-means algorithm

    k-평균 알고리즘을 활용한 음성의 대표 감정 스타일 결정 방법

    오상신, 엄세연, 장인선, 안충현, 강홍구

    Sangshin Oh, Se-Yun Um, Inseon Jang, Chung Hyun Ahn, Hong-Goo Kang

    In this paper, we propose a method to effectively determine the representative style embedding of each emotion class to improve the global ...

    본 논문은 전역 스타일 토큰(Global Style Token, GST)을 사용하는 종단 간(end-to-end) 감정 음성 합성 시스템의 성능을 높이기 위해 각 ...

    + READ MORE
    In this paper, we propose a method to effectively determine the representative style embedding of each emotion class to improve the global style token-based end-to-end speech synthesis system. The emotion expressiveness of conventional approach was limited because it utilized only one style representative per each emotion. We overcome the problem by extracting multiple number of representatives per each emotion using a k-means clustering algorithm. Through the results of listening tests, it is proved that the proposed method clearly express each emotion while distinguishing one emotion from others.


    본 논문은 전역 스타일 토큰(Global Style Token, GST)을 사용하는 종단 간(end-to-end) 감정 음성 합성 시스템의 성능을 높이기 위해 각 감정의 스타일 벡터를 효과적으로 결정하는 방법을 제안한다. 기존 방법은 각 감정을 표현하기 위해 한 개의 대푯값만을 사용하므로 감정 표현의 풍부함 측면에서 크게 제한된다. 이를 해결하기 위해 본 논문에서는 k-평균 알고리즘을 사용하여 다수의 대표 스타일을 추출하는 방법을 제안한다. 청취 평가를 통해 제안 방법을 이용해 추출한 각 감정의 대표 스타일이 기존 방법에 비해 감정 표현 정도가 뛰어나며, 감정 간의 차이를 명확히 구별할 수 있음을 보였다.

    - COLLAPSE
    September 2019