티스토리 뷰



세계 최초로 개발된 음성분석 보이스피싱 모델

보이스 피싱범 검거용으로 '보이스피싱 음성분석 모델'을 개발했다고 행정안전부가 발표했다.

이는 세계 최초로  IT강국의 면모를 보여주는 듯하다.

 

행안부가 22일에 발표한 바에 따르면 이달 말부터 사기수사과정에 이 모델을 활용할 계획이라고 밝혔다. 초동수사의 속도와 검거율을 높이는데 기여할 거라는 기대와 함께 경찰과 모델을 공유해 보이스피싱범죄 수사에 활용할 방침이다.

전세사기나 기관사칭 등을 통해 서민들을 울리는 다양한 음성 관련 범죄 수사 전반에 도입할 예정이다.

 

 

이미 검거된 범죄자의 여죄 추궁이나 범죄조직 그룹화 등에도 보유 중인 약 1만 개의 보이스 피싱범 음성데이터를 분석해 밝혀낼 예정이다.

지금까지는 영국과 러시아에서 개발한 음성분석 모델을 이용해 국내 보이스피싱 수사에 활용해 왔다. 그러나 이 모델은 외국어로 학습이 되어 있어 한국어를 사용하는 범죄자자 진범인지를 확인하는데 정확도의 한계가 있었다.

 

보이스 피싱 범죄의 특성상 점조직으로 이루어져 있고 역할을 나누어 그룹별로 활동한다는 점을 볼 때,  범죄에 연루된 범죄자

들을 취합하는 기능이 필요했으나 기존 외국에서 개발한 모델은 이러한 기능이 없었다.

그래서 국립과학수사연구원과 행정안전부 통합 데이터 분석센터를 작년부터 보이스 피싱 범죄자 검거에 초점을 두고 이야기하는 사람을 구분하는 정확도 개선과 범죄 연루자의 취합이 가능한 모델 개발을 시작했고, 그 결과 세게 최초로 보이스피싱 범죄자 검거에 주안점을 둔 음성분석 모델을 개발했다. 

 

이번 개발 모델은 국내외 약 6000여 명으로부터 추출한 100만 개 이상의 한국어와 외국어 음성 데이터를 이용하여 최신인공지능학습기술을 통해 태어났다.

 

또한,  보이스피싱범의 목소리를 구분에 필요한 최적의 알고리즘을 만들기 위해 국과수가 보유 중인 실제 보이스피싱범 음성데이터와 약 10만 개 이상의 일반 데이터를 함께 활용해 다양한 학습 과정과 성능 검증을 반복해서 시행했다.

 

정확도 검증

모델 개발 후, 정확도 확인을 위해 두 차례의 검증을 했다.

1차 검증에서는 150명의 660여 개, 2차는 200명의 1만 2000여 개의 별도 음성데이터를 다양한 가정과 상황하에 이루어졌다.

 

이렇게 검증을 실행한 결과 기존 모델에서는 100개의 범죄자의 음성을 감정할 때 목소리의 동일성 여부를 28개 정도 판별해 냈다면 국내에서 개발한 모델에서는 51개까지 판별이 가능했다.

이러한 결과에 의해 범죄자의 목소리를 정확하게 판별해 내는 판독률이 기존 외국 개발 모델에 비해 약 77% 향상된 것이 확인되었다

또한,  외국산 모델에서는 불가능했던 범죄 가담자의 취합, 그룹화(사건별 범죄자 목소리의 연쇄 비교과정을 거쳐 동일인임을 확인 및 군집화) 기능도 세계 최초로 만들어 냈다.

국내에서 발생한 보이싱 피해 건수는 지난 5년간 총 15만 6249건으로 피해액만 3조 원을 넘겼다고 경찰청이 최근에 밝혔다.

이렇게 보이스 피싱 피해와 액수는 불어나고 있다.

 

지난 1월에만 보이스피싱 피해가 843건 접수돼서 35억 원 규모의 피해가 있는 것으로 금융감독원이 국회에 제출한 바 있다.

 

"새로 개발된 보이스 피싱 음성분석모델은 데이터 분석을 통해 사회현안을 해결하는 디지털 플랫폼 정부의 구체적 성과물에 해당한다"라고 행정 안전부 차관은 밝히고 앞으로도 국민이 필요로 하는 분석과제를 발굴하고 현장에 적극 활용해 나갈 것이라고 그는 이야기했다.

 

앞으로 이 음성분석모델이 범죄자들을 검거하는 데 백분 활용되어 효과를 봤으면 하는 바람이다.

반응형