Research Article

The Journal of the Acoustical Society of Korea. 30 November 2023. 603-616
https://doi.org/10.7776/ASK.2023.42.6.603

ABSTRACT


MAIN

  • I. 서 론

  • II. 주거소음원 데이터셋

  • III. 주거소음원 군집화

  •   3.1 방법

  •   3.2 결과

  • IV. 주거소음원 분류

  •   4.1 방법

  •   4.2 결과

  • V. 결 론

I. 서 론

우리나라의 대표적인 주거공간인 아파트에서 발생되는 소음관련 민원 중 바닥충격음에 대한 불만이 가장 많이 나타난다.[1] 환경부 산하 이웃사이센터에서는 민원 상담과 24 h 동안의 측정을 통해 이웃 간의 분쟁해결을 하고자 노력하고 있으나, 바닥충격소음으로 인한 민원 수는 매년 증가하고 있는 추세이다.[2,3] 이웃사이센터에서는 조사원이 24 h 동안 녹음된 소리를 듣고 음원 유형을 분류하여 층간소음 기준의 초과여부를 판단한다. 이러한 과정은 많은 시간이 소요되며 개인의 주관적인 판단을 수반하기 때문에 자동화가 필요하다. 공동주택에서 발생되는 소음원 중 저주파 대역의 음에너지가 지배적인 음원이 많기 때문에, 사람의 귀로는 정확하게 분류하기 어렵다. 이에 따라, 시간에 따른 주거소음원의 종류와 레벨을 자동분석 하기 위해서는 머신러닝을 활용한 classification이 필요하다.

한편, 환경소음분야에서는 Environmental Sound Classification(ESC)를 위한 데이터셋 구축[4]과 DCASE challenge[5]를 통해 Artificial Intelligence(AI)를 활용한 연구들이 진행되고 있다. 이를 통해 음향과 관련된 다양한 task(음향이벤트검출 등)에 대한 성능이 발전되고 있다. 건축물 소음 분야에서도 층간소음 분류를 위한 연구들이 일부 이루어졌으나, 각 연구마다 특정 층간소음 종류만의 데이터셋을 이용한 연구가 진행되었다.[6,7,8] 그러나, 층간소음 이외에 건축물의 실내공간에서 발생되는 다양한 주거소음원을 분류하는 연구는 미흡한 실정이다. 층간소음을 포함한 실내 주거 소음은 환경소음과는 다르게 건축물의 바닥슬래브와 벽 및 천장 등을 통해 전달되는 소음이다. 이는 건축물의 성능에 따라 전달되는 소음이 다르게 나타남을 의미하기 때문에 주거소음원의 데이터셋을 구축하기 쉽지 않다. 하지만, 주거소음원 민원을 해결하기 위해서는 주거소음원을 분류하기 위한 데이터셋 구축이 필요한 실정이다.

공동주택 건축물의 물리적 개선방안에 대한 많은 연구들이 진행되었다.[9,10,11,12,13,14] 하지만, 건축물의 물리적 개선에도 불구하고 오래전에 건설된 실내 환경에서 발생되는 주거소음원에 대한 불만은 지속적으로 나타나고 있다. 소음에 대한 주관적인 반응은 소음의 주파수 특성과 시간적 특성에 의해 다르게 나타나는 것으로 조사되었다.[15,16] Kim et al.의 연구[17]에서는 층간소음의 시간적 특성(충격, 변동, 정상음)에 따라서 주관적 반응이 다르게 나타났다. 따라서, 심리적인 관점에서 주거소음환경 개선을 위해서는 주거소음원의 주파수 및 시간적 특성에 대한 조사가 필요하며, 이러한 음향적 특성이 몇 개의 군집으로 분류되는지 조사할 필요가 있다. 따라서, 본 연구에서는 다양한 주거소음원을 대상으로 구축한 데이터셋을 바탕으로 주파수 특성과 시간적 특성을 통해 주거소음원을 군집화하였다.

본 연구는 공동주택에서 발생되는 주거소음원의 주파수 및 시간 특성을 분석하고, 머신러닝을 통해 주거소음원의 군집 분류를 진행하였다.

실제 거주지에서 발생되는 주거소음원은 거주자가 발생시키는 소음이 아닌 다른 세대로부터 전달되는 소음이 대부분이다. 이에 따라 측정 및 녹음을 통해서 소음원의 종류를 파악하는데 한계점(사람이 직접 소음원을 듣고 판단하는 과정 등)이 있는 것으로 판단된다. 따라서, 본 연구에서는 주거소음원을 분류함에 있어 1차적으로 음향 특성인 주파수와 시간을 기반으로 음원의 종류를 군집화하고자 하였다. 또한, 군집화 결과를 바탕으로 거주지에서 발생되는 주거소음원을 관리하는 하나의 방안으로 주거소음원의 군집 분류를 목적으로 진행하였다.

따라서, 본 연구의 연구 질문은 다음과 같다. 1. 주거소음원은 주파수 특성과 시간적 특성에 의해 몇 개의 군집화가 나타나는가? 2. 주거소음원의 군집을 자동으로 분류하기 위해 어떠한 음원의 파라메타가 적절한가?

II. 주거소음원 데이터셋

본 연구에서 사용된 주거소음원은 환경부 산하 층간소음 이웃사이센터에 접수된 민원 현황을 대상으로 데이터셋을 구성하였다. 2019년도 이웃사이센터 보고서[18]에 의하면 가장 민원이 많이 발생되는 소리는 어린이 달리기 또는 걷기(69.2 %)였으며, 그 외(12.6 %), 망치질 소리(4.2 %), 가구 끄는 소리(3.5 %) 등의 순으로 민원이 발생되는 것으로 조사되었다. 이를 바탕으로 최종 수집된 주거소음원은 Table 1과 같이 바닥충격음(14종, 528개), 공기전달음(4종, 105개), 급배수(3종, 42개) 및 설비소음(1종, 11개), 환경 소음(4종, 132개), 공사장 소음(20종, 240개)으로 총 46종류로 1,058개 이었다. 최종 수집된 주거소음원의 정보는 길이 30 s, sampling rate 44,100 ms, monoral wav로 구성되었다.

Table 1.

Dataset of residential sound in apartment buildings.

Noise sources N Noise sources N
Floor impact noise Adult jumping 58 Air- borne noise Dog bark 33
Adult running 47 Metal 24
Adult walking 52 Piano 24
Children jumping 18 TV 24
Children running 18 Plumbing and equipment noise Bath 18
Chair dropping 46 Shower 4
Vaccum cleaner 23 Washbowl 10
Remote dropping 47 Toilet 10
Entrance close 24 Outdoor 11
Golf ball dropping 33 Environmental noise Traffic 40 km 36
60 km 36
Hammering 54
80 km 36
Indoor close 26
Remote dropping 41 Aircraft 12
Spoon dropping 41 Railway 12
Construction noise Air compressor 12 Construction noise Excavator stop 12
Asphalt finisher 12 Forklift 12
Batch plant 12 Loader 12
Breaker 12 Payloader 12
Bulldozer 12 Piledriver 12
Concrete mixer 12 Road roller 12
Concrete pumping 12 Stone crush 12
Concrete vibrator 12 Truck unloading 12
Earthauger 12 Tunnel ventilation 12
Excavator loading 12 Vibrating roller 12

본 연구에서는 배경소음이 낮은 곳에서 주거소음원만을 녹음하여 주거소음원의 주파수 및 시간적 특성 분석을 진행하고자 실제 주택과 유사하게 시공된 LH 주택성능 연구개발센터의 실증 주택에서 진행하였다. 실증 주택 중 국내 공동주택에 가장 보편적으로 보급된 뜬바닥 구조(슬라브 두께: 210 mm, 완충재 30 mm, 경량기포콘크리트 40 mm, 마감모르타르 40 mm)와 평천장(석고보드 1장)의 형태를 가진 59 m2과 84 m2 면적의 세대에서 녹음하였다. 수음지점은 ISO10052 간편법[19]과 Jeong과 Ryu[20]을 참고하여 가진 세대의 직하층에서 소음계(NL-52, Rion)를 통해 거실의 중앙지점과 거실 내 발코니 쪽의 벽에서 75 cm 이격 한 모서리 지점인 총 2개 지점에서 수음하였다. 수음의 높이는 1.2 m였으며, 30 s 동안 녹음하였다. 본 연구에서 수집된 음원들은 거실공간에서 수음되는 주거소음원을 대상으로 수집되었다. 거실공간에서 수음되는 공기전달음의 경우, 옆 세대에서 발생되는 소리보다 상부세대에서 발생되는 주거소음원의 소리가 크기 때문에 상부세대에서 스피커(SRS-X7, SONY)를 통해 재생하여 녹음되었다. 바닥충격음의 경우 성인(몸무게: 70 kg, 75 kg, 80 kg, 85 kg, 나이: 평균 28세)과 어린이(몸무게: 17 kg, 22 kg, 24 kg, 나이: 평균 7세)가 가진하였다. 제자리 뜀의 경우 가진 층의 중앙에서 가진하였으며, 달리기와 걷기의 경우는 거실의 4개의 모서리와 중앙지점을 반복하여 가진하였다. 리모컨, 골프공, 숟가락 떨어뜨리는 소리는 거실의 중앙지점과 거실 내 발코니 쪽의 벽에서 75 cm 이격 한 모서리 지점에서 가진 높이(20 cm, 100 cm)를 다르게 하여 가진하였다. 망치질은 거실에서 내력벽과 비내력벽에서 모두 가진하였으며, 실내문 여닫는 소리는 거실과 붙어있는 안방문을 대상으로 녹음하였다. 의자끄는소리는 거실의 중앙에서 가진하였으며, 현관문 여닫는 소리는 상부세대의 현관문을 여닫는 소리를 녹음하였다. 공사장 소음, 교통 소음, 환경 소음, 실외기 소음은 공동주택 파사드 차음성능 필터링 값(1/3 옥타브 밴드 50 Hz ~ 5k Hz)[21]을 적용하였다.

모든 음원의 길이는 5 s로 동일하게 편집하였다. 공동주택에서 발생되는 주거소음원의 음압 레벨[22]을 참고하여 40 dBA ~ 50 dBA in Leq(2 dBA 간격)로 조정하였다. 각 음원은 AS-70(Rion) 프로그램을 통해 분석하였다. Fig. 1은 주거소음원이 주파수 특성과 시간적 특성으로 분석되는 과정을 나타낸다. 주파수 특성은 1/1 옥타브 밴드(31.5 Hz ~ 2k Hz)와 1/3 옥타브 밴드(25 Hz ~ 2,500 Hz)의 Leq와 Lmax값을 도출하였다. 시간적 특성은 5 s 동안 매 6 ms의 음압레벨 분석(time weighting: fast with 6 ms step, Integral time: 125 ms)을 통해 Leq값을 도출하였다. 본 연구에서는 주거소음원을 설명하는데 있어 보다 많은 데이터를 활용하기 위하여 AS-70(Rion) 프로그램에서 분석되는 최솟값(6 ms)을 활용하였다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F1.jpg
Fig. 1.

Examples of analyzing spectral and temporal characteristics features.

III. 주거소음원 군집화

3.1 방법

K-Means clustering은 주어진 데이터 집합을 유사한 데이터 그룹으로 나누는 대표적인 비지도 학습 머신러닝 알고리즘이다. 본 연구에서는 K-Means clustering[23]을 통해 주거소음원을 주파수 특성과 시간적 특성에 대해 군집화를 진행하였다. K-Means의 k의 개수는 각 군집의 중심점을 의미한다. k의 개수에 따라 군집이 여러 개로 나누어지게 되며, k 값을 결정하는 방법으로 엘보우 방법(Elbow method)과 실루엣 계수(Silhouette coefficient) 방법 등이 있다. 본 연구에서는 k의 개수를 와 엘보우 방법을 통해 선택하였다. 먼저, 각 옥타브 대역별 Leq와 Lmax값을 바탕으로 1차 군집화(주파수 특성에 대한 군집화)를 수행하고 비교하였다. 이후 각 주파수 특성에 기반한 군집의 시간적 특성에 대해 2차 군집화(시간적 특성을 통한 군집화)를 진행하였다. 본 연구에서는 주파수 특성이 음원분류의 활용성 측면에서 더욱 중요하다고 판단하여 먼저 군집화를 진행하고 시간적 특성을 통한 군집하를 이후에 진행하였다.

실루엣 계수[24]Eq. (1)에 의해 계산되며, a(i)는 개별 데이터의 동일 군집 내 다른 데이터들과의 평균 거리이며, b(i)는 가장 가까운 군집과의 평균 거리를 의미한다. 각 데이터에 대해 실루엣 계수를 구한 후 평균을 내어 전체 데이터의 실루엣 계수를 구하여 각 군집별로 평균값의 편차가 크지 않을 때 군집 성능이 좋은 것으로 판단한다.

(1)
s(i)=b(i)-a(i)max(a(i),b(i)).

엘보우 방법[25]Eq. (2)와 같이, 군집 내 중심점과 데이터 간의 거리를 제곱하여 합한 값을 계산하여 값이 작은 값을 사용한다. 여기서 k는 군집화 수이고 n는 데이터 수를 말하며, xi:는 i번째 데이터이고 cjj번째 군집의 중심을 말한다.

(2)
SSE=j=1kn=1n(xij-cj))2.

3.2 결과

3.2.1 주파수 특성 군집화

Fig. 2는 평가지수 1/1 옥타브 밴드별 Leq값을 사용하여 군집화하였을 때 k의 계수를 정하기 위한 실루엣 계수와 엘보우 방법을 나타낸다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F2.jpg
Fig. 2.

(Color available online) Example of elbow method and silhouette coefficient.

Table 2는 K-means clustering의 k를 결정하기 위해 사용된 실루엣 계수의 평균과 군집 간의 실루엣 계수 편차를 나타낸다. 본 연구에서는 2개 ~ 5개의 k 중 전체 평균 실루엣 계수 평균값과 개별 군집의 평균값의 편차가 가장 낮은 k 값을 사용하였다. 주파수 특성을 활용한 1차 군집화 결과, 모든 평가지수와 옥타브밴드에 대해 각각 3개의 군집(A, B, C)이 나타났다.

Table 2.

Mean and standard deviation of silhouette coefficient.

Evaluation Index k Silhouette coefficient Cluster
AVE STEDV
Leq (1/1octave band) 3 0.30 0.02 A1
B1
C1
Leq
(1/3 octave band)
3 0.31 0.05 A2
B2
C2
Lmax
(1/1 octave band)
3 0.26 0.04 A3
B3
C3
Lmax
(1/3 octave band)
3 0.27 0.05 A4
B4
C4

Figs. 34는 1/1과 1/3옥타브 밴드별 평가지수 Leq 값과 Lmax값을 통해 나타난 1차 군집화(주파수 특성 기반) 결과를 나타낸다. 1/1과 1/3 옥타브 밴드별 평가지수 Leq값을 통해 나타난 군집은 3개인 것으로 나타났다. 3개의 군집별 주파수 특성은 Fig. 34 같이 저주파 대역과 중・저주파 대역 간의 기울기가 비교적 높은 그룹, 중간그룹, 낮은 그룹으로 나타났다. Table 3은 평가지수 1/1 옥타브 밴드 Leq를 활용해 나타난 각 군집별 상위 5개의 음원을 나타낸다. 군집 1의 상위 5개 음원은 성인 달리기, 성인 제자리 뜀, 성인 걷기, 어린이 제자리 뜀과 어린이 달리기 순으로 나타났으며, 군집 1의 총음원은 1,175개로 나타났다. 군집 2의 총음원은 2,884개로 구성되어 있으며, 상위 5개 음원은 망치질, 도로교통소음 40 km, 의자 끄는 소리, 개 짖는 소리와 도로교통소음 60 km 순으로 나타났다. 군집 3에서의 상위 5개 음원은 건전지 떨어뜨리는 소리, 숟가락 떨어뜨리는 소리, 도로교통소음 80 km, 골프공 떨어뜨리는 소리와 리모컨 떨어뜨리는 소리 순으로 나타났으며, 군집 3의 총음원은 2,343개로 구성되었다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F3.jpg
Fig. 3.

(Color available online) Spectral characteristics of clustering result - 1/1, 1/3 octave band, Leq.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F4.jpg
Fig. 4.

(Color available online) Spectral characteristics of clustering result - 1/1, 1/3 octave band, Lmax.

Table 3.

Most of using spectral characteristic in residential noise (1/1 octave band, Leq).

Cluster 1 2 3
Sound source Adult running
Adult jumping
Adult walking
Child jumping
Child running
Hammering
Traffic noise
40 km
Chair scrapping
Dog barking
Traffic noise
60 km
Dry-cell dropping
Spoon dropping
Traffic noise
80 km
Golf-ball dropping
Remote dropping
Number 1,175 2,884 2,343

Fig. 5Table 4는 주파수 특성으로 나타난 군집별 평균값과 각 평가지수와 주파수 대역별 음압레벨 비율 값을 나타낸다. 주파수 대역별로 평균값과 주파수 음압레벨 비율 값을 통해 군집별 차이를 조사하였다. 평가지수 1/1 옥타브 밴드 Leq와 Lmax값을 통해 나타난 각 평가지수의 평균 주파수 특성은 유사하게 나타났다. 군집 1의 평균 주파수 대역은 군집 2와 군집 3의 31.5 Hz ~ 125 Hz 평균 주파수 대역에서 높게 나타났으며, 250 Hz ~ 2k Hz 평균 주파수 대역에서 낮게 나타났다. 군집 2의 31.5 Hz ~ 125 Hz 평균 주파수 대역은 군집 1의 평균 주파수 대역보다 낮고, 군집 2의 평균 주파수 대역보다 높게 나타났다. 또한, 군집 2의 250 Hz ~ 2k Hz 평균 주파수 대역은 군집 1과 3의 평균 주파수 대역보다 높게 나타났다. 군집 3의 250 Hz ~ 2k Hz 평균 주파수 대역은 군집 1보다 높지만, 군집 2보다는 낮게 나타났다. 또한, 평가지수 1/3 옥타브 밴드 Leq와 Lmax값을 통해 나타난 각 평가지수의 평균 주파수 특성도 유사하게 나타났다. 군집 1의 평균 주파수 대역은 군집 2와 군집 3의 20 Hz ~ 100 Hz 평균 주파수 대역에서 높게 나타났으며, 250 Hz ~ 2.5k Hz 평균 주파수 대역에서 낮게 나타났다. 군집 2의 20 Hz ~ 100 Hz 평균 주파수 대역은 군집 1보다 낮게 나타났고, 군집 3보다 높게 나타났다. 또한, 군집 2의 250 Hz ~ 2.5k Hz 평균 주파수 대역은 군집 1과 3보다 높게 나타났다. 군집 3의 20 Hz ~ 100 Hz 평균 주파수 대역은 군집 1과 2보다 낮게 나타났고, 군집 2의 250 Hz ~ 2.5k Hz 평균 주파수 대역은 군집 2보다는 낮고 군집 1에 비해 높게 나타났다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F5.jpg
Fig. 5.

(Color available online) Spectral characteristics of clustering result – 1/1, 1/3 Octave band, Lmax and Leq.

Table 4.

Percentage by frequency band [%] (L: Low, M: Mid, H: High).

Evaluation Index L, M, H / (L+M+H) *100 Low-High
Low Mid High
Leq
(1/1 octave band)
A1 52.1 27.1 20.7 31.4
B1 41.5 31.4 27 14.5
C1 37.7 32.7 29.4 8.3
Leq
(1/3 octave band)
A2 54.4 27 18.5 35.9
B2 42.7 31.9 25.3 17.4
C2 38.2 33.9 27.8 10.4
Lmax
(1/1 octave band)
A3 51.4 32.6 29.3 22.1
B3 41.3 31.5 27.1 14.2
C3 37.9 32.6 29.3 8.6
Lmax
(1/3 octave band)
A4 52.9 27.6 19.3 33.6
B4 42 31.5 26.3 15.7
C4 37.2 33.2 29.5 7.7

Table 4는 군집별 주파수 대역(Low, Mid, High) 음압레벨의 비율을 나타낸다. 음압레벨의 비율은 실내음향 측정 시 사용하는 Bass ratio의 개념[26]을 참고하여 분석하였다. 각 평가 지표의 주파수 대역을 저주파(1/1옥타브 밴드: 31.5 Hz, 63 Hz, 125 Hz, 1/3 옥타브 밴드: 20 Hz, 31.5 Hz, 40 Hz, 50 Hz, 63 Hz, 80 Hz, 100 Hz, 125 Hz, 160 Hz), 중주파(1/1 옥타브 밴드: 250 Hz, 500 Hz, 1/3 옥타브 밴드: 200 Hz, 250 Hz, 315 Hz, 400 Hz, 500 Hz, 630 Hz), 고주파 대역(1/1 옥타브 밴드: 1k Hz, 2k Hz, 1/3 옥타브 밴드: 800 Hz, 1k Hz, 1.25k Hz, 1.6k Hz, 2k Hz, 2.5k Hz)으로 나누어 각 주파수 그룹 간의 차이를 조사하였다. 비율은 모든 주파수 대역의 값을 더하여 주파수 대역별로 나눈 값을 계산하였다. 모든 평가지수에서 나타난 군집은 저주파 대역이 높게 나타났으며, 저주파 대역의 음압레벨 비율이 각 군집에 따라 차이가 나타났다. 평가지수별 A1, A2, A3, A4의 군집이 저주파 대역의 음압레벨 비율이 가장 높은 군집으로 나타났다. 또한, 저주파 대역과 고주파 대역의 음압레벨 차이값에 따라 군집이 다르게 나타났다.

3.2.2 시간적 특성 군집화

Table 5는 K-means clustering의 k를 결정하기 위해 사용된 실루엣 계수의 평균과 군집 간의 실루엣 계수 편차를 나타낸다. 시간적 특성을 활용한 2차 군집화 결과, 평가지수 1/1, 1/3 옥타브 밴드별 Leq값을 통해 나타난 군집화 3개(A1, B1, C1, A2, B2, C2)는 각각의 군집에 따라 3개의 시간적 특성 군집으로 구성되어 총 9개의 주거소음원(A1-1, A1-2, A1-3, B1-1, B1-2, B1-3, C1-1, C1-2, C1-3)이 구성되었다. 또한, 평가지수 1/1, 1/3 옥타브 밴드별 Lmax값을 통해 나타난 군집 3개(A3, B3, C3, A4, B4, C4) 중 A3, B3, A4, B4는 3개의 시간적 특성 군집으로 구성되었으며, C3와 C4는 5개의 시간적 특성 군집으로 구성되어 총 11개의 주거소음원(A3-1, A3-2, A3-3, B3-1, B3-2, B3-3, C3-1, C3-2, C3-3, C3-4, C3-5, A4-1, A4-2, A4-3, B4-1, B4-2, B4-3, C4-1, C4-2, C4-3, C4-4, C4-5)이 구성되었다. Fig. 6은 1/1 옥타브 밴드별 Leq값을 통한 주파수 특성과 시간적 특성으로 나타난 총 9개의 주거소음원(A1-1, A1-2, A1-3, B1-1, B1-2, B1-3, C1-1, C1-2, C1-3)을 나타낸다. A1 군집을 시간적 특성으로 나타난 3개의 군집 중 A1-1의 군집은 A1-2 군집보다 변동성과 주기성이 강하게 나타나며, A1-3 군집보다는 충격성, 변동성과 주기성이 약한 음원들이 나타났다. B1 군집을 시간적 특성으로 군집화한 B1-1의 군집은 B1-2와 B1-3의 군집보다 정상음의 특성을 나타내며, 변동성이 낮은 음원들이 군집되었다. C1 군집을 시간적 특성으로 군집화한 군집 중 C1-1의 군집은 C1-2의 군집보다 변동성이 많이 나타났으나, C1-3의 군집이 변동성이 가장 많이 나타났다. Table 6는 1/1 옥타브밴드 별 Leq 값을 통해 주파수 특성으로 군집화된 A1, B1, C1의 군집을 시간적 특성으로 군집화하여 각 군집별 상위 2개의 음원과 군집에 속한 전체 음원의 개수를 나타낸다. A1-1의 군집(총 220개)의 상위 2개의 음원은 성인 달리기와 성인 걷기로 나타났다. A1-2(총 644개)의 군집의 상위 2개의 음원은 성인 걷기와 어린이 제자리 뜀으로 구성되어 있으며, A1-3(총 311개)의 군집은 성인 제자리 뜀과 현관문 여닫기로 나타났다. 또한, B1-1의 군집(총 1,285개)에서는 망치질과 건전지 떨어뜨림 소리가 있으며, B1-2 군집(1,178개)에는 망치질과 도로교통소음 40 km로 나타났다. B1-3 군집(총 422개)의 상위 2개의 음원은 의자 끄는 소리와 현관문 여닫는 소리로 나타났다. C1-1 군집(총 987개)의 음원은 건전지 떨어뜨리는 소리와 숟가락 떨어뜨리는 소리로 구성되었다. C1-2 군집(총 539개)의 상위 2개의 음원은 샤워 소리와 건전지 떨어뜨리는 소리로 나타났으며, C1-3 군집(총 817개)에서는 의자 끄는 소리와 리모컨 떨어뜨리는 소리가 나타났다.

Table 5.

Silhouette coefficient mean and standard deviation.

Temporal characteristics Cluster
Cluster by spectrum k AVE STEDV
Leq
(1/1 octave band)
A1 3 0.25 0.12 A1-1
A1-2
A1-3
B1 3 0.23 0.22 B1-1
B1-2
B1-3
C1 3 0.25 0.06 C1-1
C1-2
C1-3
Leq
(1/3 octave band)
A2 3 0.25 0.14 A2-1
A2-2
A2-3
B2 3 0.25 0.06 B2-1
B2-2
B2-3
C2 3 0.22 0.23 C2-1
C2-2
C2-3
Lmax
(1/1 octave band)
A3 3 0.25 0.07 A3-1
A3-2
A3-3
B3 3 0.22 0.23 B3-1
B3-2
B3-3
C3 5 0.29 0.08 C3-1
C3-2
C3-3
C3-4
C3-5
Lmax
(1/3 octave band)
A4 3 0.25 0.07 A4-1
A4-2
A4-3
B4 3 0.22 0.24 B4-1
B4-2
B4-3
C4 5 0.25 0.17 C4-1
C4-2
C4-3
C4-4
C4-5

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F6.jpg
Fig. 6.

(Color available online) Temporal characteristics of clustering result - 1/1 octave band, Leq.

Table 6.

Most of using temporal characteristic in residential noise (1/1 octave band, Leq).

Cluster A1-1 A1-2 A1-3
Sound source Adult running
Adult walking
Adult walking
Child jumping
Adult jumping
Entrance close
Number 220 644 311
Cluster B1-1 B1-2 B1-3
Sound source Hammering
Dry-cell dropping
Hammering
Traffic noise 40km
Chair scraping
Entrance close
Number 1,285 1,178 421
Cluster C1-1 C1-2 C1-3
Sound source Dry-cell dropping
Spoon dropping
Bath
Dry-cell dropping
Chair scrapping
Remote dropping
Number 987 539 817

Fig. 7은 평가지수 1/1옥타브 밴드별 Leq값을 통해 주파수 특성 군집화와 시간적 특성으로 군집화된 군집별 시간에 따른 평균 Leq값을 나타낸다. 또한, Table 7은 주파수 특성과 시간적 특성으로 군집화된 군집별 변동성을 조사하기 위한 L10-L90을 나타낸다. L10-L90[27]은 시간에 따른 Leq값의 상위 10 %에 해당하는 값과 하위 10 %에 해당하는 값의 차이를 계산하여 군집별 시간적 변화를 조사하였다. 평가지수 1/1 옥타브 밴드 Leq값을 통해 나타난 주파수 및 시간적 특성의 군집은 군집별로 L10-L90 값이 다르게 나타났다. 군집 중 A1-3이 L10-L90 값이 크게 나타났으며, C1-2가 값이 가장 낮게 나타났다. Fig. 7과 같이 A1-3의 군집이 시간변화에 따른 변동성이 가장 크고, C1-2 군집이 시간변화에 따른 변동성이 가장 작은 군집이 나타났다. A1-3의 군집은 성인 제자리 뜀과 현관문 여닫음과 같이 충격시간이 짧고 단발성 음원들이 변동성이 가장 큰 군집으로 나타난 것으로 판단된다. 반대로 C1-2 군집은 샤워음과 건전지 떨어뜨림같이 충격시간이 길고 지속성이 있는 정상음의 음원들이 변동성이 가장 작은 군집으로 나타난 것으로 판단된다. 본 연구에서 수집된 건전지 떨어뜨림 소리는 충격력이 약하고 구르는 소리가 포함되었기 때문에 C1-2 군집 중 상위음원으로 나타난 것으로 판단된다. 또한, C1-1과 C1-2의 군집에서 모두 리모컨 떨어뜨림 소리가 상위 2개의 음원에 포함되었다. 이는, 같은 소음원 종류이고 주파수가 같음에도 시간적 특성이 다르면 다른 군집으로 분류가 되었음을 나타낸다. 또한, 주파수 특성을 통한 군집에서도 동일한 소음원 종류의 음원이 다른 군집으로 나타난 경우도 있다. 이러한 결과는 동일한 소음원임에도 충격력이나 충격력 시간 등에 의해서 군집이 다르게 나타날 수 있음을 보여준다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F7.jpg
Fig. 7.

(Color available online) Temporal characteristics of clustering result - 1/1 octave band, Leq.

Table 7.

Clustering by spectral and temporal characteristics L10-L90 by clusters.

Evaluation Index L10-L90
Leq
(1/1, oct)
A1-1 26.06
A1-2 15.62
A1-3 28.10
B1-1 5.13
B1-2 6.86
B1-3 15.01
C1-1 4.78
C1-2 4.32
C1-3 7.10

IV. 주거소음원 분류

4.1 방법

본 연구에서는 주거소음원의 군집화한 결과를 활용하는 방안으로써, 각 주파수와 시간적 특성으로 나타난 군집화 결과를 바탕으로 주거소음원을 분류하였다. 9개와 11개의 주거소음원을 라벨링 하여 Support Vector Machine(SVM), k-Nearest Neighbor(k-NN), 인공신경망(Artificial Neural Network, ANN)을 통해 음원을 분류하고[28,29,30] 분석방법 간의 차이를 조사하였다. 서포트 벡터 머신은 머신러닝 방법 중 하나로 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석을 위해 사용한다. k-최근접 이웃(k-NN) 알고리즘은 패턴 인식 분야에서 분류나 회귀에 사용되는 방법이다. Fig. 8과 같이 인공신경망은 여러 분야에서 사용되는 머신러닝 방법으로 분류와 회귀 등 분석에 사용된다. 각 모델에 사용된 데이터는 주파수 특성, 시간적 특성, 주파수 특성과 시간적 특성이었다. 모든 데이터는 학습 70 %, 검증 30 %로 구성되었으며, 학습 데이터의 30 %는 테스트에 사용되었다. k-NN과 SVM은 scikit-learn에서 제공하는 알고리즘을 사용하였으며, k-fold(n = 10)를 사용하여 검증하였다. k-fold 교차검증은 머신러닝에서 모델의 성능을 측정하고 검증하는 기술 중 하나이다. 데이터 세트를 k개의 부분집합으로 분할하고, 이 중 하나를 검증 데이터로 가용하며, 나머지 k-1개의 부분집합을 학습 데이터로 사용하여 모델 학습을 k번 반복하는 방법이다. k개의 모델을 생성하여 각각의 모델이 다른 검증 데이터로 성능을 측정하여 성능지표를 k번 평균하여 최종 성능지표를 계산한다. ANN은 입력계층과 출력계층 사이에 은닉계층 2개를 사용하여 간단한 모델을 구축했으며, 학습 횟수는 100회, 배치 사이즈는 128로 진행하였다. loss는 cross entropy를 사용했으며, optimizer는 Adam을 사용하였다. 각 머신러닝의 모델의 분류 성능은 accuracy와 F-1 score[31]를 통해 비교 분석하였다.

https://cdn.apub.kr/journalsite/sites/ask/2023-042-06/N0660420614/images/ASK_42_06_14_F8.jpg
Fig. 8.

Examples of simple ANN model architecture.

4.2 결과

Table 8은 각 머신러닝 모델별 accuracy와 F-1 score 결과를 나타낸다. 주파수와 시간적 특성으로 군집화된 주거소 음원을 대상으로 머신러닝 모델의 정확도를 비교하였다. 평가지수 1/3 옥타브 밴드별 Leq값을 통해 군집화된 군집이 주파수 특성, 시간적 특성, 주파수와 시간적 특성을 사용하여 주거소음원을 분류한 결과가 다른 모델에 비해 모두 정확도가 높게 나타났다. 가장 정확도가 높은 모델은 평가지수 1/3옥타브 밴드별 Leq값을 통해 군집화한 주파수와 시간적 특성을 사용하여 ANN 모델을 이용한 경우가 accuracy 93 %와 f1-score 92 %로 가장 높게 나타났다. 또한, 주파수 특성 데이터를 가지고 분류한 모델이 시간적 특성 테이터를 가지고 분류한 모델보다 분류성능 accuracy와 f1-score값이 높게 나타났다(평가지수 1/1 옥타브 밴드별 Lmax의 군집화된 모델 제외). 이는 Fig. 6과 같이 주파수 특성이 다름에도 불구하고 시간적 특성이 동일한 군집으로 나타나는 경우와 연관이 있는 것으로 판단된다. 시간적 특성이 동일한 군집이 나타나기 때문에 시간적 특성 데이터만을 사용했을 때 보다 주파수 특성 데이터를 활용했을 때의 주거소음원 군집화 분류 성능이 높게 나타난 것으로 판단된다.

Table 8.

Performance of machine learning models accuracy and f1-score [%].

Using temporal characteristic
Index Band width Model evaluation ANN SVM KNN
Leq 1/1 OCT Accuracy 77 71 69
F-1 score 76 66 70
1/3 OCT Accuracy 77 71 67
F-1 score 78 66 71
Lmax 1/1 OCT Accuracy 76 62 61
F-1 score 76 66 66
1/3 OCT Accuracy 76 64 65
F-1 score 72 59 64
Using spectral characteristic
Index Band width Model evaluation ANN SVM KNN
Leq 1/1 OCT Accuracy 87 77 84
F-1 score 86 75 83
1/3 OCT Accuracy 90 78 82
F-1 score 88 75 82
Lmax 1/1 OCT Accuracy 85 74 80
F-1 score 76 62 74
1/3 OCT Accuracy 88 77 80
F-1 score 80 69 73
Using spectral and temporal characteristic
Index Band width Model evaluation ANN SVM KNN
Leq 1/1 OCT Accuracy 90 75 77
F-1 score 88 72 77
1/3 OCT Accuracy 93 76 77
F-1 score 92 76 80
Lmax 1/1 OCT Accuracy 91 69 72
F-1 score 89 71 75
1/3 OCT Accuracy 91 69 78
F-1 score 84 70 72

V. 결 론

본 연구에서는 주거소음원의 주파수 및 시간적 특성 데이터를 활용하여 머신러닝 기반 주거소음원의 군집화 및 분류를 진행하였다. 주거소음원은 각 평가지수(Leq와 Lmax)별 주파수 특성의 음압레벨에 의해 3개의 군집으로 구분되는 것으로 나타났다. 군집별 주파수 특성은 평가지표별 저주파 대역의 비율이 50 %, 40 %, 30 %인 경우에 따라 군집이 다르게 나타났다. 평가지수별 주파수 특성을 통한 군집화를 진행 후 3개의 군집을 시간적 특성으로 2차 군집화를 진행하였다. 평가지수 1/1, 1/3 옥타브 밴드별 Leq값을 통해 나타난 시간적 특성 군집은 총 9개의 주거소음원이 구성되었다. 또한, 평가지수 1/1, 1/3 옥타브 밴드별 Lmax값을 통해 나타난 시간적 특성 군집은 총 11개의 주거소음원이 구성되었다. 이후, 주거소음원의 군집을 활용하기 위해 본 연구에서 나타난 군집 수로 라벨링하여 주거소음원을 분류하였다. 본 연구에서는 평가지수별로 9개와 11개의 군집이 나타났다. 각 해당하는 평가지수의 라벨링을 통해 주거소음원의 주파수 특성만을 이용한 경우, 시간적 특성만 이용한 경우와 주파수 특성과 시간적 특성을 같이 이용하여 주거소음원을 분류하여 각 평가지수와 분류성능이 높은 모델을 조사하였다. 주거소음원의 분류는 1/3 옥타브 밴드별 Leq값으로 군집화 된 9개의 라벨링을 통해 주파수 특성과 시간적 특성을 사용하여 ANN모델을 이용한 경우가 가장 높은 정확도를 나타냈다.

본 연구는 공동주택에서 발생되는 주거소음으로 인한 민원을 해결하기 위한 기초연구로서 공동주택에서 발생되는 주거소음원 데이터셋을 구축하고, 군집화 및 분류하였다. 주거소음으로 인한 민원을 해결하기 위해서는 거주지에서의 모니터링을 통해 주거소음원을 자동 분류할 필요가 있다. 하지만 자동분류를 하기 위해서는 공동주택에서 발생되는 주거소음원의 데이터셋을 구축할 필요가 있기 때문에 본 연구에서는 주거소음원 데이터셋 구축을 하였다. 그럼에도 불구하고 주거소음원은 건축물에 의해 전달되는 소음으로서 거주지마다 다르게 나타나기 때문에 추가적인 데이터셋 구축이 필요하다. 거주지에서 발생되는 주거소음원은 주파수 및 시간적 특성에 의해 주관적 반응이 다르게 나타나기 때문에, 본 연구에서 조사한 주파수 및 시간적 특성에 의한 군집수를 활용한 모니터링이 필요하다고 판단된다. 본 연구는 실제 거주공간에서 발생되는 주거소음원을 실제 거주공간과 유사하게 시공된 실증주택에서 수집하였다. 실제 거주공간에서의 주거소음원의 녹음은 제한적이며 어려움이 있다. 배경소음이 최소화된 음원을 확보하고자 실증주택에서 녹음을 진행하였지만, 본 연구결과를 활용하기 위해서는 실제 거주공간에서 발생되는 다양한 주거공간에서의 음원 확보가 필요할 것으로 판단된다. 또한, 공기전달음의 경우 옆 세대에 의한 민원이 발생하기 때문에 옆세대에 의한 공기전달음 수집이 추가분석이 필요하다. 본 연구의 주거소음원 군집화 분석방향은 주파수 특성이 음원분류의 활용성 측면에서 더욱 중요하다고 판단하여 먼저 진행하고 시간적 특성을 통한 군집화를 이후에 진행하였는데, 시간적 특성을 통한 군집화를 먼저 진행하고 주파수 특성을 통한 군집화를 분석하여 비교가 필요하다. 본 연구의 군집화 방법은 k-means clustering을 이용하였으나, Gaussian Mixture Model(GMM)과 같은 추가적인 군집화 방법의 분석을 진행하여 군집화 방법간의 비교도 필요할 것으로 판단된다. 활용측면에서 본 연구의 결과는 주파수와 시간적 특성에 따라 나누어진 군집별로 사운드 마스킹을 적용하여 거주자의 심리적 측면에서 민원을 줄일 수 있는 하나의 방안으로 활용될 수 있을 것으로 판단된다. 향후, 주거소음원 분류 성능을 향상시키기 위한 음향적 특징에 대한 연구가 추가적으로 필요하며, 거주지에서 주거소음원을 녹음하기 어렵기 때문에 주거소음원의 데이터셋을 구축하기 위한 방법론이 추가적으로 연구가 필요하다.

Acknowledgements

본 연구는 국토교통부/국토교통과학기술진흥원(과제번호 RS-2022-00144050), 산업통상자원부 및 산업기술평가관리원(과제번호 20023556)과 전남대학교 연구년교수 연구비(과제번호: 2021-3907)의 지원으로 수행되었음

References

1
Gwanghwamun Ilbunga, http://19gwanghwamoon1st.pa.go.kr/, (Last viewed November 24, 2023).
2
Korea Environment Corporation, "Casebook of complaints from neighboring," in Ministry of Environment, edited by Floor Noise, Management Centre, Case book, 2018.
3
Joint housing management dispute mediation central committee, "Infrastructure and transport, central committee for management dispute mediation of multi-unit dwelling: Guidebook of noise prevention and management," Ministry of Land, Guide book, 2020.
4
K. J. Piczak, "ESC: Dataset for environmental sound classification," Proc. ACM Int. Conf. Multimed. 1015-1018 (2015). 10.1145/2733373.2806390
5
D. Stowell, D. Giannoulis, E. Benetos, and M. D. Plumbley, "Detection and classification of acoustic scenes and events," Proc. DCASE, 1733-1746 (2023). 10.1109/TMM.2015.2428998
6
H. K. Shin, S. H. Park, and K. W. Kim, "Inter-floor noise classification using convolutional neural network," Plos One, 15, e0243758 (2020). 10.1371/journal.pone.024375833351829PMC7755197
7
H. Choi, H. Yang, S. Lee, and W. Seong, "Classification of inter-floor noise type/position via convolutional neural network-based supervised learning," Appl. Sci. 9, 3735 (2019). 10.3390/app9183735
8
H. Choi, W. Seong, and H. Yang, "Source type classification and localization of inter-floor noise with a single sensor and knowledge transfer between reinforced concrete buildings," Appl. Sci. 11, 5399 (2021). 10.3390/app11125399
9
H. G. Park, G. O. Baek, and D. H. Moon, "Modal Parameter of floor and walls in residual building" (in Korean), Proc. KSNVE Annual Spring Conf. 682-685 (2015).
10
J. K. Ryu, I. H. Kim, and J. C. Go, "Heavy-weight floor impact sound and vibration with structure types in apartment building" (in Korean), J. Acoust. Soc. Kr. Suppl. 1(s) 34, 212 (2015).
11
M. J. Kim, J. Y. Sohn, and H. S. Kim, "Contribution ratio of each surface of receiving room for floor impact sound transmission by using sound intensity method" (in Korean), Proc. Spring Annual Conf. AIK, 311-313 (1998).
12
K. W. Kim, J. S. Kang, S. E. Lee, and K. S. Yang, "Floor impact sound isolation performance by composition of ceiling and wall" (in Korean), Trans. Korean Soc. Noise Vib. Eng. 15, 465-473 (2005). 10.5050/KSNVN.2005.15.4.465
13
S. Lee, D. Hwang, J. Park, and J. Y. Jeon, "Cause and perception of amplitude modulation of heavy-weight impact sound in concrete wall structure," Build. Environ. 94, 785-792 (2015). 10.1016/j.buildenv.2015.04.020
14
Y. Kwak, S. Lee, J. Park, D. Hwang, J. Y. Jeon, and J. Park, "Effect of the static compressive load on vibration propagation in multistory buildings and resulting heavyweight floor impact sounds," J. Acoust. Soc. Am. 142, 308-316 (2017). 10.1121/1.499429028764414
15
J. Y. Jeon, "Subjective evaluation of floor impact noise based on the model of ACF/IACF," J. sound Vib. 241, 147-155 (2001). 10.1006/jsvi.2000.3286
16
J. Ryu, H. Sato, K. Kurakata, A. Hiramitsu, M. Tanaka, and T. Hirota, "Relation between annoyance and single-number quantities for rating heavy-weight floor impact sound insulation in wooden houses," J. Acoust. Soc. Am. 129, 3047-3055 (2011). 10.1121/1.356166021568408
17
S. Kim, J. Kim, S. Lee, H. Song, M. Song, and J. Ryu, "Effect of temporal pattern of impact sound on annoyance: Children's impact sounds on the floor," Build. Environ. 208, 108609 (2022). 10.1016/j.buildenv.2021.108609
18
Floor Noise, Management Centre, "Interfloor noise neighbor center 2019 civil complaint statistics status," Mon. Rep., Korea Environment Corporation, 2019.
19
ISO 10052, Acoustics - Field Measurements of Airborne and Impact Sound Insulation and of Service Equipment Sound - Survey Method (2021).
20
J. Jeong and J. Ryu, "Survey method for field measurement of rubber ball impact sound in reinforced concrete apartment houses," Acta Acust. 7, 1-12 (2023). 10.1051/aacus/2023023
21
J. Ryu and H. Song, "Effect of building facade on indoor transportation noise annoyance in terms of frequency spectrum and expectation for sound insulation," Appl. Acoust. 152, 21-30 (2019). 10.1016/j.apacoust.2019.03.020
22
S. H. Park, P. J. Lee, and B. K. Lee, "Levels and sources of neighbour noise in heavyweight residential buildings in Korea," Appl. Acoust. 120, 148-157 (2017). 10.1016/j.apacoust.2017.01.012
23
G. Hamerly and C. Elkan, "Learning the k in k-means," Proc. NIPS, 281-288 (2003).
24
P. J. Rousseeuw, "A graphical aid to the interpretation and validation of cluster analysis," J. Comput. Appl. Math. 20, 53-65 (1987). 10.1016/0377-0427(87)90125-7
25
C. Shi, B. Wei, S. Wei, W. Wang, H. Liu, and J. Liu, "A quantitative discriminant method of elbow point for the optimal number of clusters in clustering algorithm," EURASIP J. Wirel. Commun. Netw. 2021, 1-16 (2020). 10.1186/s13638-021-01910-w
26
L. Beranek, Concert Halls and Opera Houses: Music, Acoustics, and Architecture (Springer, New York, 2004), pp. 662. 10.1007/978-0-387-21636-2PMC522193
27
M. E. Nilsson, "A-weighted sound pressure level as an indicator of perceived loudness and annoyance of road-traffic sound," J. Sound Vib. 302, 197-207 (2007). 10.1016/j.jsv.2006.11.010
28
W. S. Noble, "What is a support vector machine?," Nat. biotechnolo. 24, 1565-1567 (2006). 10.1038/nbt1206-156517160063
29
L. E. Peterson, "K-nearest neighbor," Scholarpedia, 4, 1883 (2009). 10.4249/scholarpedia.1883
30
A. K. Jain, J. Mao, and K. M. Mohiuddin, "Artificial neural networks: A tutorial," Computer, 29, 31-44 (1996). 10.1109/2.485891
31
C. Goutte and E. Gaussier, "A probabilistic interpretation of precision, recall and F-score, with implication for evaluation," Proc. LNISA, 345-359 (2005). 10.1007/978-3-540-31865-1_25
페이지 상단으로 이동하기