[김익현기자] "어떻게 찾아냈을까?"
미국 경찰이 보스턴 폭탄 테러 사건의 용의자를 추적 중이라고 CNN을 비롯한 주요 외신들이 17일(현지 시간) 보도했다.
외신 보도에 따르면 현지 경찰들은 사건 발생 직전에 테러 장소에 폭탄을 놓고 있는 한 남성을 찾아냈다. 이 남성은 야구모자를 거꾸로 쓰고 있으며, 후드가 달린 밝은색 운동복에 검은 재킷을 입고 있었던 것으로 알려졌다. 또 등에는 백팩을 매고 있었다고 외신들이 전했다.
이번 사건은 인파가 몰려 있던 넓은 장소에서 발생했다. 게다가 범인들은 휴대폰으로 폭발물을 원격 조정한 것으로 알려졌다. 그만큼 범인 색출이 쉽지 않은 사건이었다.
더버지, 기가옴 등 주요 IT 전문 외신들은 보스턴 테러 같은 사건에서 빅데이터 분석이 어떤 역할을 하는 지 분석하는 기사를 게재했다.
◆동영상 증거 자료만 10테라바이트 분량
외신들에 따르면 이번 수사에는 1천 명 이상의 전문가가 동원됐다. 현장을 탐문하고 주변 인물들을 인터뷰하는 수사관은 기본. 이번 사건 같은 경우엔 동영상, 통화기록 등 멀티미디어 자료 분석 전문가들이 중요한 역할을 했다. 소셜 미디어 분석 역시 빼놓을 수 없다.
이번 사건은 증거 수집 작업부터 수월하지 않았던 것으로 알려졌다. 40km가 넘는 넓은 지역에서 마라톤 경기가 진행된 데다 범죄 현장도 12개 블록에 걸쳐 있었기 때문이다. 에드 데이비스 보스턴 경찰국장이 16일 기자 회견에서 "그 동안 다뤄온 사건 중 가장 복잡한 범죄 현장이다"고 털어놨을 정도다.
LA타임스 보도에 따르면 연방수사국(FBI)이 수집한 이번 사건 관련 증거 자료만 10테라바이트 분량에 이른다. 여기엔 인근 기지국에서 수집한 각종 통화 기록과 목격자들이 제공한 사진, 동영상 등이 포함돼 있다. 물론 600여 개에 이르는 인근 CCTV 영상도 분석 대상이다.
자료 수집 방법엔 정답이 없다. 하지만 더버지는 이런 유형 수사의 모범 사례로 2011년 6월 발생한 밴쿠버 폭동 사건을 꼽았다. 당시 북미아이스하키리그(NHL) 결승전에서 지역 팀인 밴쿠퍼 캐넉스가 보스턴 브루윈스에서 패하자 시내 지역에서 폭동 사건이 발생했다.
사건 발생 직후 밴쿠버 시는 곧바로 목격자들이 증거 자료를 제출할 수 있는 시스템을 구축했다. 증거자료는 동영상, 사진, 통화 기록 등 다양한 종류를 총 망라했다.이 시스템을 통해 경찰이 수집한 동영상 자료만 5천 시간 분량이었다고 더버지가 전했다.
수집 작업을 끝낸 밴쿠버 경찰은 곧바로 법 집행 및 긴급 서비스 동영상 연맹(LEVA)에 분석을 의뢰했다. LEVA는 세계 유일의 디지털 멀티미디어 증거처리 전문 연구소라고 더버지가 설명했다.
당시 52명의 분석 전문가가 14일 동안 분석 작업에 매달린 끝에 300명의 폭도들이 1만5천건 가량의 범죄 행위를 한 사실을 적발해냈다고 더버지가 전했다.
◆전과자-범죄 용의자엔 특수 코드 부여
보스턴 테러 수사 역시 비슷한 과정으로 진행됐을 가능성이 많다. IT전문 매체인 더버지는 인디애나폴리스에 있는 LEVA에서 포렌식 동영상 분석 전문가로 활동하고 있는 그랜드 프레데릭스의 설명을 토대로 범죄 관련 데이터 분석 과정을 설명했다.
수집한 동영상은 곧바로 분석 전문가들의 손에 넘어간다. 동영상을 넘겨받은 분석 전문가들은 일단 형식 통일 작업부터 진행하게 된다. 무수히 많은 동영상들이 서로 호환될 수 있도록 하는 작업이다. 이렇게 한 뒤엔 중앙 관리시스템에 업로드하게 된다. 본격적인 분석 작업은 이때부터 시작된다.
동영상 분석 작업은 주로 정밀 관찰한 뒤 코드를 붙이는 방식으로 진행된다. 이 과정에서 범죄 용의자나 전과자들에겐 특수 코드가 부착된다. 용의자에게 태그를 붙이는 건 나중에 신원 확인 작업을 좀 더 수월하게 하기 위한 것이다.
동영상 분석 과정에서 용의자를 잘못 선정할 가능성은 없을까? 이에 대해 프레데릭스는 더버지와 인터뷰에서 "프로파일링 과정에선 특정 개인을 선별하는 게 아니라 유형을 뽑아내는 것"이라고 설명했다. 이번 사건 같은 경우 '백팩을 맨 사람' 같은 증거 자료에 따라 분류하게 돼 있다는 것이다.
따라서 제대로 된 용의자를 찾아내는 건 동영상 분석팀이 아니라 경찰의 몫이란 게 프레데릭스의 설명이다. 다른 증거 자료까지 전부 취합한 뒤 용의자 체포에 나서기 때문. 최종 판단을 위한 근거 자료를 제공해주는 것까지가 멀티미디어 분석 팀의 역할과 책임인 셈이다.
◆"진정한 빅데이터 분석 위해선 수집과정 개선 필요"
보스턴 폭발사고 수사 과정에선 다양한 유형의 데이터들을 분석 가능한 체계적인 데이터 형식으로 바꾸는 작업이 중요한 역할을 했다. 이번 수사에 '빅데이터 분석'이 동원됐다는 평가가 나오고 있는 것은 바로 이 때문이다.
흔히 ▲규모(volume) ▲속도(velocity) ▲다양성(variety) 등이 빅데이터의 3대 요소로 꼽힌다. 단순히 양이 많다고 해서 빅데이터가 아니란 얘기다. 제 아무리 많은 데이터라도 주민등록 자료처럼 단일 형식으로 통일돼 있을 경우엔 빅데이터가 아니다.
보스턴 테러 수사 같은 경우 엄청나게 많은 멀티미디어 자료들이 동원됐다. 특히 다양한 형식의 자료들을 정비한 뒤 답을 찾아내는 과정이 분석 작업에서 중요한 부준이었다. 게다가 엄청나게 빠른 속도로 올라오는 데이터를 계속 수집해야 하는 과제도 함께 안고 있다. 전형적인 빅데이터 작업과 상당히 닮아 있는 셈이다.
물론 개선할 부분도 적지 않다는 지적도 나오고 있다. 무엇보다 기본 정보를 수집하는 과정부터 좀 더 체계적으로 바뀔 필요가 있다는 것이다. 이번 사건에서 증거 수집 시스템 개선 문제가 거론되는 것 역시 이런 차원이다.
워싱턴 D.C에 있는 포렌식 동영상 솔루션즈에서 동영상 전문 애널리스트로 활동하고 있는 래리 콤프톤은 더버지와 인터뷰에서 이런 부분을 지적했다.
콤프톤은 "(이번 사건 같은 경우) 정부가 시민들이 제보하는 동영상이나 사진들을 접수하는 시스템을 개선할 필요가 있다"고 주장했다. 911센터 같은 곳에서 무차별적으로 받을 게 아니라 제출자와 연결할 수 있는 정보를 비롯해 촬영한 카메라 기종, 촬영 시간 같은 기본적인 정보를 담을 수 있도록 해야 한다는 것이다.
이렇게 할 경우 훨씬 더 빠른 속도로 좀 더 큰 그림을 수월하게 그려낼 수 있다는 것이 콤프톤의 주장이다.
/김익현기자 sini@inews24.com
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기