데이터 마이닝, 버락 오바마 재선 캠프에도 활용했다?

전아현 / 2021-07-30 19:16:40
출처: Unsplash
출처: Unsplash

최근, 다양한 방식으로 데이터 수집과 정보 가공이 이루어지는 상황에서 효율적인 데이터 활용이 중요해졌다. 대용량 데이터 분석, 처리 과정에서 우리 일상생활과 업무수행 방식에 있어 무엇이 일어날 것인지 예측하는 방안이 필요하다. 여기서 '데이터 마이닝(data mining)'의 중요성이 대두되었다.

데이터 마이닝은 KDD(Knowledge-Discovery in Database)로 각종 데이터베이스에 내재한 데이터를 토대로 동작 가능한 정보를 찾는 프로세스를 의미한다. 각각의 데이터 집합에 대해 패턴 인식 기술이나 통계, 수학적 지식을 이용하여 새로운 상관관계의 추세를 발견하고, 패턴을 예측한다.

기존에는 가설을 세운 뒤 분석하면서 검증했지만, 데이터 마이닝은 궁극적으로 예측에만 초점을 맞춘다는 점이 다르다. 특히, 비정형화된 데이터(이미지, 동영상)는 모형의 예측 성과를 높이는 데 집중하고 있어 인공지능 분야에서 주목한다.

그렇다면, 데이터 마이닝을 실제로 활용한 사례로 어떤 사례를 볼 수 있을까? 과거 버락 오바마 전 대통령 재선 캠프를 이야기할 수 있다. 당시 오바마 전 대통령 캠프는 정확한 미래를 예측하는 홍보 전략을 펼쳤다.

정확한 미래를 예측하며 잠재적인 지지자를 공략하는 데 데이터 마이닝이 강력한 영향을 준 것이다. 대선을 준비하면서 10억 달러 이상의 후원금 모금액을 달성해야 했던 오바마 전 대통령은 일원화된 개인 맞춤형 서비스를 구축하여 성공적인 모금 행사를 마칠 수 있었다.

당시 오바마 전 대통령 측의 개인 맞춤형 서비스 구축 방식은 아래와 같다.

먼저, SNS 기록이나 전화번호 등 개인 정보를 수집한 뒤 분산된 데이터베이스들을 통합하는 작업을 통하여 일원화된 정보망으로 저장하였다. 그다음에는 목적에 맞춰 개인정보를 잠재적 유권자 여부로 나누면서 대상을 선정하였다.

목표 데이터에 수립될 수 있도록 유의미한 데이터로 선별하는 작업을 거친 데이터 정제& 변환 작업은 프로세스 과정에 있어 70% 이상의 많은 작업 시간이 할애된다.

전처리 과정을 통해 데이터 안에 숨겨져 있는 패턴을 파악하여 나타난 타깃층을 확인했다. 이를 바탕으로 타깃 대상과의 저녁 식사 자리를 마련하여 기존 모금 방식보다 4배 이상 높은 후원금을 거두어 낼 수 있었다.

[ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

전아현

IT/Tech, 금융, 산업, 정치, 생활문화, 부동산, 모빌리티

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0