인공 지능이 다크웹에서 빛을 발합니다

새로운 도구는 불법 포럼에서 사용자를 추적하고 식별하기 위해 방대한 온라인 데이터에서 패턴을 찾을 수 있습니다.

 

표면 웹 아래서 매일 이메일을 확인하거나 뉴스 기사를 읽는데 사용하는 인터넷의 공개 형태는 숨겨진 “다크웹”입니다. 익명의 암호로 보호 된 사이트의 호스트인 다크웹은 무기, 마약 및 인신매매 된 인물의 광고 및 판매에서 범죄 시장이 번성하는 곳입니다. 법 집행 기관은 이러한 활동을 중단시키기 위해 지속적으로 노력하지만 이 사이트에 게시하는 사용자의 실체를 조사하고 기소할 때 직면하는 어려움은 엄청납니다.

MIT 링컨 연구소의 인공지능 기술 및 시스템 그룹의 찰리 다글리 (Charlie Dagli) 연구원은 “다크웹 마켓플레이스의 팝업 특성 때문에 참가자와 이들의 활동을 추적하는 것이 매우 어렵다”라고 말했습니다. 다글리(Dagli)는 다크웹 시장이 문을 닫는 속도(해킹, 압수수색, 버림받거나, 고객이 미수납 주문에 대한 대가를 지불한 후 사이트를 의도적으로 폐쇄하는 ‘출구 사기’로 설정되기 때문에)와 새로운 시장이 나타나는 속도를 가리킵니다. 이러한 시장의 짧은 수명은 몇 달에서 몇 년 사이에 사용자 식별을 위한 노력을 방해합니다.

이러한 어려움을 극복하기 위해 Lincoln Laboratory는 표면 및 다크웹 데이터를 분석하기 위한 새로운 소프트웨어 도구를 개발하고 있습니다.

이 도구는 판매자와 구매자가 웹의 여러 레이어, 표면에서 깊은 곳 및 다크웹 포럼에서 계속 유지되는 연결 고리 문제와 같은 이점을 활용합니다. “사이트 간 끊임없는 전환은 이제 다크웹 시장들이 어떻게 운영되는지에 대한 확립된 부분이 되었습니다.”라고 Dagli는 말합니다.

사용자는 새로운 프로필을 꾸준히 만들고 있습니다. 사이트 간에 동일한 사용자 이름을 사용하지는 않지만 콘텐츠를 통해 서로에게 신호를 보내 연결을 유지합니다. 이러한 신호는 다크웹 포럼을 통해 동일한 사용자에게 속한 페르소나를 연결하고, 다크웹의 페르소나를 표면 웹에 연결하여 사용자의 실제 신원을 밝힐 수 있습니다.

다크웹에서 사용자를 연결하는 것은 법 집행 기관이 이미 시도한 것입니다. 문제는 수작업으로 섞는 데 필요한 데이터의 양 (한 달에 500,000 개의 전화번호와 200 만 개의 성 광고가 게재 됨)이 너무 커서 연결을 빨리 찾을 수 없다는 것입니다. 따라서 낮은 비율의 사례 만 추구할  수 있습니다.

인물 연결 프로세스를 자동화하기 위해 Lincoln Laboratory는 여러 포럼에서 사용자 간의 유사성을 계산하는 기계 학습 알고리즘을 교육합니다. 이 계산은 사용자의 온라인 의사소통의 세 가지 측면, 즉 “다른 사람에게 식별되는 방법, 그들이 무엇에 대해 쓰는지, 누구와 함께 쓰는지”를 기반으로 합니다.

알고리즘은 주어진 포럼 A에 있는 사용자의 데이터를 먼저 제공받고 각 사용자에 대한 작성 모델을 만듭니다. 그런 다음 포럼 B의 사용자 데이터가 포럼 A의 모든 사용자 모델에 대해 실행됩니다. 프로필 정보와 일치하는 항목을 찾기 위해 알고리즘은 포럼 A에서 “sergeygork”와 같은 사용자 이름 철자의 변경 사항과 같은 간단한 단서를 “sergey gorkin” 포럼 B에서는 “조 나이트 메어”에서 “조 나이트”와 같은 더 미묘한 유사점을 발견했습니다.

시스템이 보게 되는 다음 기능은 내용 유사성입니다. 이 시스템은 여러 광고에서 사용되는 고유 한 문구 (예 : “햇볕을 쬐다”)를 선택합니다. “복사 및 붙여 넣기가 많이 진행되므로 비슷한 사용자가 동일한 사용자의 팝업이 나타날 것입니다.”라고 Dagli는 말합니다. 그런 다음 시스템은 사용자의 네트워크에서 유사점을 찾습니다. 사용자 네트워크는 사용자가 상호 작용하는 사람들의 서클과 사용자 네트워크에서 논의하는 주제를 찾습니다.

프로파일, 컨탠츠 및 네트워크 기능은 융합되어 단일 출력을 제공합니다. 즉, 두 포럼의 두 인물이 동일한 실제 인물을 나타내는 확률 점수입니다.

연구자들은 오픈 소스 Twitter 및 Instagram 데이터와 다크웹 포럼의 수작업 라벨링 된 사실 데이터를 사용하여 이러한 인물 연결 알고리즘을 테스트해 왔습니다. 이 작업에 사용된 모든 데이터는 승인된 방법을 통해 얻습니다. 결과는 긍정적이었습니다. Dagli는 “우리가 매치를 발표할 때마다 95 %의 정확도를 보이고 있습니다. 이 시스템은 문헌에서 찾을 수 있는 최고의 연결 시스템 중 하나입니다”라고 말했습니다.

이 일은 현재 진행 중인 연구의 가장 최근의 발전입니다. 링컨 연구소는 2014년부터 2017년까지 국방고등 연구 계획국(DARPA) Memex 프로그램에 기여했습니다. Memex는 표면 및 다크웹 데이터 분석 소프트웨어 제품군을 수십 개의 대학, 국립 실험실 및 회사와 공동으로 개발했습니다. Memex를 위해 만들어진 텍스트, 음성, 시각적 분석을 망라한 10가지 실험실 기술은 DARPA Open Catalog를 통해 오픈 소스 소프트웨어로 출시되었다.

오늘날 전 세계 30 개 이상의 기관에서 Memex 소프트웨어를 사용하여 조사를 수행하고 있습니다. 가장 큰 사용자 중 하나이자 Memex의 발전에 있어 이해관계자 인 사람은 Manhattan District Attorney ‘s Office의 Human Trafficking Response Unit (HTRU)입니다.

Manhattan 지방 검사 Cyrus Vance Jr. 는 그의 하원 의원이 Memex 도구를 사용하여 2017 년에만 인신매매의 징후를 6,000 명 이상 체포할 수 있다는 서면 증언에서 밝혔습니다. “우리는 또한 Memex를 271 건의 인신 매매 수사와 2017 년에 도입된 6 건의 신규 성매매 기소에 사용했습니다. Memex가 도입됨에 따라 HTRU에서 인신매매 징후로 선별된 성매매 검거는 5 %에서 62 %로 증가했으며 뉴욕 경찰청 매춘 관련 체포에 대한 조사는 연간 15에서 300으로 증가했습니다.

HTRU의 부국장인 Jennifer Dolle는 실험실을 방문하여 이 기술로 어떻게 이익을 얻었는지 발표했습니다. “우리는 매일 이러한 도구를 사용합니다. 실제로 사무실에서 업무를 수행하는 방식이 바뀌었습니다.”라고 Dolle는 Memex 이전에는 인신매매 조사가 상당히 오래 걸릴 수 있다고 설명했습니다.

이제 Memex 도구를 통해 HTRU는 신흥 사례를 신속하게 개선하고 정보가 거의 없는 리드에서 성매매 조사를 구축할 수 있습니다. 예를 들어, 성매매 광고 데이터의 색인 생성, 요약 및 검색을 위해 TellFinder (Memex 기고가 Uncharted Software가 제작)를 포함하여 이 도구는 단일 온라인 성매매 광고의 데이터에서 미성년자를 식별하는 데 사용되었습니다. “이러한 추가 조사 지침을 통해 HTRU는 인신매매 범을 폭력적인 중죄 혐의로 기소하고 이들 피고인은 취약한 희생자를 상대로 한 범죄의 본질을 책임지게 됩니다.”라고 Dolle은 말합니다.

연구자들은 새로운 기술들이 어떻게 기관들이 필요로 하는 것과 다크웹이 어떻게 작동하는지 계속해서 배우고 있습니다. “데이터 기반 기계 학습은 다크웹 상에서 불법적인 온라인 시장들과 싸우기 위해 법 집행 기관이 입증될 수 있는 중요한 도구가 되었다.”라고 연구소 기술실을 통해 자금을 지원하는 이 연속적인 연구의 조사자인 린 리 씨가 말합니다. “하지만, 현재 진행 중인 과제와 연구 분야에는 수요 경제에 대한 이해 확대, 공급 경제 붕괴, 전반적인 상황 인식 개선 등이 포함되어 있다.”

다크웹 경제의 공급과 수요 사슬이 어떻게 작용하는지 더 잘 이해하면 팀이 이러한 사슬을 파괴하는 기술을 개발하는 데 도움이 될 것입니다. 목표의 일부는 이 불법 경제에 참여하는 위험을 높이는 것입니다. 다크웹의 페르소나와 표면 웹의 페르소나를 연결하는 것은 잠재적으로 강력한 전략 중 하나입니다.

그는 “이 급속하게 성장하는 불법 경제는 DARPA가 테러 활동에 자금을 대주는 것을 보여주었고 HTRU는 현대판 노예제도의 원동력이라는 것을 보여줬다”라고 말했습니다. 조지프 캠벨 예술 정보기술 시스템 그룹 대표는 “테러를 물리치고 노예제도를 없애는 것은 국가적, 인도주의적 요구”라며 “우리 그룹은 다국어 음성, 텍스트, 비디오에서 추출한 정보를 바탕으로 AI, 기계학습, 인적 네트워크 분석에 대한 전문 지식을 갖고 있으며, 우리가 만들고 개발하고 발전시키는 첨단 기술은 이런 국가적, 인도주의적 요구에 엄청난 영향을 주면서 매일 사용하는 우리의 후원자들에게 이전된다.”라고 말했습니다.

 

출처:mit news

인공 지능이 다크웹에서 빛을 발합니다”의 49개의 생각

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다