여의도연구원, 페이스북 글 무단 수집·활용 논란

▲ 여의도연구원이 지난 5일 발표한‘담벼락에 쓰인 대한민국: 2014 상반기 페이스북 빅데이터 분석 보고서’일부 내용
[아이티데일리] “절대 안전하기는 개뿔… 정부나 경찰, 그리고 카드사들의 발표가 사실이라면, 이번에 털린 것보다 더 많은 정보가 털렸다는 거고, 정부, 경찰, 카드사들은 사건파악도 못하고 있다는 뜻임”

지난 1월 23일 신OO씨가 자신의 페이스북에 남긴 글이다. 신씨를 포함한 페이스북 사용자 500만 명이 전체공개로 설정한 글 3,100만 건이 무단으로 수집돼 보고서로 활용된 사건이 발생했다.

여의도연구원이 지난 5일 ‘담벼락에 쓰인 대한민국: 2014 상반기 페이스북 빅데이터 분석 보고서’를 발표했다.

이를 두고 일부 페이스북 사용자와 관련 전문가들은 개방형 SNS인 트위터도 아닌 폐쇄형 SNS인 페이스북에서 남긴 글은 물론 개인정보까지 무단으로 수집됐다며 문제를 제기했다. 특히 여의도연구원이 새누리당 정책연구원이라는 점에서 개인사찰까지 이뤄진 거 아니냐며 우려를 감추지 않았다.

 
실제 여의도연구원이 발표한 보고서는 2014년 1월부터 6월까지 전체 페이스북 사용자 중 500만 명의 전체공개 뉴스피드(담벼락 글) 3,100만 건을 연구대상으로 삼았다.

보고서에는 1월부터 6월까지 월별 핫 키워드를 분석했으며, 이 과정에서 페이스북 사용자들이 남긴 글을 고스란히 노출시켰으며, 성별로 나눠 사용자들이 남긴 글도 노출시켰다.

즉, 여의도연구원은 페이스북 사용자들을 대상으로 이름, 성별, 계정, 공개된 글까지 모두 수집한 것이다.

이와 관련해 한 빅데이터 전문가는 “일반적으로 빅데이터 분석이라고 칭하는 소셜 분석의 경우 트위터에서 데이터를 수집하는 경우가 대부분이다. 페이스북은 기본적으로 친구 공개이기 때문에 수집할 수 있는 데이터 양이 적어 수집 대상에 두지 않는다”며, “여의도연구원처럼 페이스북에서만 데이터를 수집하는 경우는 없다”고 지적했다.

그는 이어 “전체 경향과 패턴 파악이 목적인만큼 데이터 수집 과정에서 개인을 식별할 수 있는 정보는 수집하지 않는다. 또한 이는 개인정보 수집 및 사생활 보호라는 측면에서도 수집 대상에 두지 않는다”며 여의도연구원의 수집 방식에 의문을 제기했다.

소셜 분석 전문 기업 한 전문가는 여의도연구원 보고서의 신뢰성에 의문을 제기하기도 했다.

그는 “여의도연구원과 동일하게 실험을 해 본 결과 1월부터 6월까지 수집된 데이터는 약 2천만 건이고 수집 대상 사용자수는 약 1,400만 명이다. 또한 보고서 키워드 중 안전불감증의 경우 여의도연구원은 7,376건이 언급됐다고 했지만 약 1천 건만 언급되는 등 보고서가 밝힌 것보다 약 7분의 1 수준 밖에 수집되지 못했다”며, “이 같은 결과는 수집 시 카운트 방식에 따라 달라질 수 있지만, 여의도연구원 측은 한 문서에서 중복 언급한 단어를 그대로 각각 카운트 한 것으로 추정된다”고 밝혔다.

게다가 페이스북 측이 여의도연구원 측에 데이터를 제공했다는 의심까지 나오고 있다.

2014년 3월 기준 국내 페이스북을 월 1회 이상 활동한 사용자가 1,300만 명, 일 1회 이상 활동한 사용자가 830만 명인 점을 감안하면 여의도연구원이 연구대상으로 삼은 페이스북계정은 실제 사용자의 3분의 1 이상이 수집 대상이 됐다며 이 같은 대규모 데이터는 페이스북 도움 없이는 불가능하다는 게 관련 업계 전문가의 시각이다.

이에 대해 페이스북 측은 “여의도연구원이 발표한 보고서와 관련해 데이터를 제공한 적이 없을 뿐더러 어떠한 내용도 고지 받지 못했다”며 관련성이 없다고 공식 입장을 밝혔다.

여의도연구원의 데이터 무단 수집 논란에 대해 페이스북 관계자는 “페이스북 데이터 사용정책은 사용자의 동의 없이 어떠한 정보도 외부 제3자와 공유하지 않는다”며, “사용자들이 페이스북에 게시하는 모든 콘텐츠와 정보의 소유권은 사용자에게 있다”고 답변했다.

이 같은 논란에 대해 보고서를 발표한 여의도연구원 측에 지난 5일부터 연락을 취했지만 “담당자는 휴가 중이며, 직접 연락을 위한 휴대전화 번호는 개인정보라서 알려줄 수 없다”며, “담당자에게 지속적으로 문자로 이 사실을 알렸으나 답변이 없다”고 말했다.

이후 지속적으로 연락 끝에 13일 담당자인 나경태 연구위원과 직접 통화가 됐으며, 나경태 연구위원은 “보고서에 나온 내용 그대로 이해하면 된다”며 문제 될 게 없다는 입장을 밝혔다.

이름, 성별, 계정, 글 등이 무단 수집됐다는 논란에 대해 나경태 연구위원은 “페이스북 계정을 통해 그들이 공개한 글을 수집한 건 맞지만 이름 등은 비공개 처리한 이상 문제 소지가 없다”고 답했다.

이에 추가질문을 요청했으나 나경태 연구위원은 회의 중이라는 말과 함께 전화를 끊었고 이후 연결은 되지 않았다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지