데이터와 공존하는 세상 : 과거와 현재는 미래와 연결되어 있다.
아마존 매출의 3분의 1은 추천 목록과 개인 맞춤 시스템에서 나온다. 넷플릭스 또한 4분의 3이 추천 목록으로부터 만들어진다. 사람들이 왜 그 추천 목록에 흥미를 가질 가능성이 높은 것인지 이유를 알지 못한 체로. 이유를 아는 것은 유쾌한 일이다. 이유는 알게 되는 것보다 만드는 것에 가깝다. 그 이유를 만드는 것은 마케터가 해야 하는 당연한 일이다. 그런데, 그 이유에 정당한 결론이 있어야 한다. 그리고 그 결론은 데이터로부터 나온다.
데이터를 분석하는 가장 기본적인 방법 중에 하나는 상관성을 살펴보는 것이다. 상관성을 통해 우리는 이전 보다 더 쉽고 빠르게 더 분명한 통찰을 얻을 수 있다. 핵심만 얘기하면 상관성은 두 데이터 값 사이의 통계적 관련성을 수량화 한다. 상관성이 강하다는 것은 하나의 데이터 값이 변화 할 때 다른 하나도 변할 가능성이 매우 높다는 것이다. 반대로 상관성이 약하다는 것은 하나의 데이터 값이 변해도 다른 것에는 거의 아무 변화도 일어나지 않는 다는 뜻이다.
어떤 현상을 분석할 때 상관성은 그 현상의 내부 원리를 알 수 있는 해결의 실마리를 제공해줄 뿐만 아니라, 무엇인 내부 원리를 아는데 유용한 대용물이 될 수 있는지를 알려준다. 물론 강한 상관성도 결코 완벽하지는 않다. 우연으로 비슷하게 움직였을 수도 있다. 상관성에는 확신은 없고, 개연성만 있다. 하지만 상관성이 강하다면 관련이 있을 가능성이 높다.
상관성은 어떤 현상에 대한 현재를 파악하고 미래를 예측하는데 도움을 준다. A라는 사건이 B라는 사건과 자주 함께 발생한다면 우리는 B사건을 지켜보면서 A사건이 발생할지를 예측할 수 있다. A사건을 직접 측정하거나 관찰할 수 없더라도 말이다. 그리고 미래에 A사건에게 어떤 일이 일어날지 예측할 수 있다. 물론 상관성이 미래를 예언할 수는 없지만 어느 정도의 확률로 그 일이 일어날지 예측할 수는 있다. 예측할 수 있다는 것은 큰 가치를 가진다.
상관성에 기초한 예측은 데이터 분석의 핵심이다. 이제는 상관 분석이 너무나 빈번하게 사용되는 나머지, 때로 우리는 상관 분석이 미친 영향을 알아보지 못하기도 한다. 하지만 새로운 데이터 유형에서 상관성을 찾는 것은 아주 중요하고 강력한 방법이다. 그래야 예측이 가능하기 때문이다.
많은 산업분야에서 어떤 사건이 일어나기 전에 그것을 예견하는 용도로 예측 분석을 광범위 하게 이용하기 시작했다. OTT서비스의 추천 영화를 제공하는 알고리즘도 일종의 예측 분석이다. 커다란 기술적 결함이나 구조적 결함을 방지하는데도 예측 분석이 사용되고 있다. 데이터의 패턴을 모니터하다가 변화가 감지되면 곧 문제가 생길 수 있다는 지표로 삼는 것이다.
데이터를 수집, 저장, 분석하는 데 드는 비용과 어려움이 컸던 시기에는 데이터를 버리는 것이 적절했을 수도 있다. 하지만 이제는 상황이 다르다. 데이터 속에 숨은 관계를 밝혀내려면 엄청난 양의 데이터에 통계적 방법을 적용해봐야 한다는 것만은 분명하다. 한 점 의속도 남지 않도록 말이다. 상관 분석을 통한 예측 분석은 문제의 원인을 설명해주지 않을 수 있다. 문제가 있다는 사실만 가리키는 것이다.
여기서 중요한 점은 마케터와 데이터 분석가가 연결되어 있어야 한다는 것이다. 데이터 분석을 통해 결론, 사실을 알 수 있다면 마케터는 그 결론에 이유를 만들고 설명하는 역할을 수행한다. 모든 고객 경험에는 ‘이유’와 ‘결론’을 결합해야 완결성을 가질 수 있기 때문이다.
HSAD는 이 두가지 역량을 모두 가지고 있다. ‘이유’를 만들 역량, ‘결론’을 도출할 역량.
데이터는 늘 변화한다. 과거와 현재의 데이터가 있으면 미래 예측이 가능해진다. 과거와 현재를 통해서 미래의 변화 예측에 대응하려면 데이터 분석은 선택이 아닌 필수적으로 이루어져야 한다. 그리고 항상 연결되어 있어야 한다. 마케팅과 데이터 분석은 그래야 그 시너지로 미래를 연결할 수 있기 때문이다.