작성자 : 데이터 엔지니어 김진석 (https://www.linkedin.com/in/joshuajsk/)
[TL;DR]
- 블록체인 기반 서비스는 성장을 위해 Web2와 Web3 데이터를 통합하여 분석해야 하지만, 두 데이터는 각각 한계점을 가지고 있어 독립적 사용에는 어려움이 있다.
- 위핀 워크스페이스는 Web2의 사용자와 Web3의 계정을 연결하는 사용자 통계 기능을 통해 이를 극복하고, 데이터 웨어하우스를 구축하여 정확하고 안정적인 통계 서비스를 제공한다.
- 이를 바탕으로 블록체인 기반 서비스는 사용자 유입, 리타게팅 등 효과적인 제품 성장 전략을 수립할 수 있다
- 위핀 지갑은 지속적인 제품 고도화를 통해 고객의 서비스 관리와 액션 실행을 지원할 예정이다.
1. 들어가는 글
최근 데이터는 그 어느 때보다 중요해졌습니다. 비즈니스의 성장을 도모하기 위해서는 반드시 데이터를 활용해야 하는 시대에 살고 있는 것이죠. 단순히 A/B 테스트, 성과 보고 등과 같은 클래식한 데이터 활용을 넘어, 이제는 인과추론, 머신러닝, 그리고 생성형 AI까지 제품에 녹여내기 위해 데이터를 다양한 방면으로 활용하고 있습니다.
특히 블록체인 기반 서비스의 활성화로 인해 우리가 활용해야 할 데이터의 성격이 근본적으로 변화하고 있습니다. 기존의 Web2 기반의 데이터는 전통적인 서비스 상에서 수집되는 사용자 데이터로, 사용자 행동 패턴, 위치 정보, 세션 정보 등을 포함합니다. 반면, Web3 데이터는 블록체인 네트워크로부터 수집되는 데이터로, 트랜잭션 내역, 가상자산 보유 정보, 혹은 컨트랙트 활용도 등을 포함하여 누구에게나 투명하게 공개되어 있습니다.
Web2와 Web3 데이터는 각기 장단점을 가지고 있으며, 블록체인 기반 서비스 입장에서 둘 중 하나의 유형만 독립적으로 분석하기에는 한계가 존재합니다. 두 유형의 데이터를 통합하여 분석할 수 있는 환경이 마련되어야, 더 깊이 있는 인사이트를 얻고, 사용자 경험을 최적화하며, 또한 보다 효율적인 제품 성장 전략을 수립할 수 있을 것입니다.
본 글에서는 Web2와 Web3 데이터의 특성과 한계점을 살펴본 후, 이 두 데이터를 통합할 수 있는 방법과 이를 통해 얻을 수 있는 이점에 대해 논의해보고자 합니다. 마지막에는 이를 구현한 위핀 워크스페이스의 사용자 통계 기능이 어떤 가치를 제공하고 있는지 알려드리도록 하겠습니다.
2. Web2와 Web3 데이터의 특성
2.1 Web2 데이터의 특성
Web2 데이터는 우리가 흔히 알고 있는 전통적인 웹 데이터를 의미하며, 서비스에 방문하거나 로그인한 사용자의 속성과 행동 정보를 포함하고 있습니다. 아래 그림과 같이, 서비스 내에 수많은 사용자들이 존재하고, 각 사용자는 수많은 이벤트를 발생시키는 구조로 이루어져 있습니다.
이러한 Web2 데이터를 수집하여 일반적으로 다음과 같은 목적으로 활용되곤 합니다.
- 사업 전략: DAU, MAU, 총 누적 사용자 등 일반적인 사업 보고 목적에 활용됩니다.
- 퍼포먼스 마케팅: 서비스 내 사용자의 평생가치(Customer’s Lifetime Value)를 측정하고, ROAS(Return on Ad Spend) 등을 통해 광고 성과를 비교하거나, 리타게팅을 실행하기 위해 사용자 세그먼트를 선별하기 위한 목적으로 활용됩니다.
- UX: 사용자의 여정을 매끄럽게 설계하기 위해 아하 모먼트 탐색, 전환율 측정, A/B 테스트 실행 등을 위한 목적으로 활용됩니다.
- 개발: 머신러닝, 추천 시스템, 생성형 AI 등을 통해 제품의 퀄리티를 향상시키거나 개인화 서비스를 제공하기 위한 목적으로 활용됩니다.
2.2 Web3 데이터의 특성
Web3 데이터는 블록체인 상에 기록되는 데이터로, 각 네트워크 내에서 활동하는 계정의 가상자산 보유 정보, 트랜잭션 실행 내역, 컨트랙트 정보 등을 포함하고 있습니다. 즉 아래 그림과 같이, 블록체인 내에 수많은 계정들이 존재하고, 각 계정이 수많은 트랜잭션을 실행하는 구조로 이루어져 있습니다. (일반적인 사용자 계정인 EOA는 트랜잭션을 실행할 수 있고, 서비스 목적의 계정인 CA는 내부 트랜잭션이 EOA에 의해 실행되지만, 이 모든 내역을 확인할 수 있습니다.)
Web3 데이터는 일반적으로 최초 블록(Genesis Block)부터 최근 블록까지 모든 데이터를 저장하는 풀 노드(Full Node)나 아카이브 노드(Archive Node)를 직접 운영하거나 접근할 수 있다면, 누구나 투명하게 활용할 수 있습니다. 즉 Web 2 데이터와 달리, 특정 서비스가 독점하는 것이 아니라 누구에게나 공개된 데이터인 것입니다.
가령 이더리움을 포함한 EVM 호환 네트워크의 경우, Web 3 데이터는 다음과 같은 원시 데이터로 구성됩니다.
- blocks: 각 블록의 생성 정보
- transactions: 프로토콜 상에 기록된 트랜잭션 발생 내역
- traces: 프로토콜이나 컨트랙트에 요청한 함수 호출 내역
- logs: 프로토콜이나 컨트랙트로부터 EVM 연산을 통해 발생한 이벤트 내역
- creation_traces: 컨트랙트 배포 내역
- balances: 프로토콜로부터 응답 받은 각 계정의 네이티브 코인(ETH)의 보유액, 혹은 컨트랙트로부터 응답 받은 각 계정의 실시간 토큰 보유액 (원시 데이터는 존재하지 않고, 노드에 RPC Method를 직접 요청하여 실시간으로 불러옴)
이러한 Web 3 데이터를 통해 최종적으로 다음과 같은 목적으로 활용될 수 있습니다.
- 사업 전략: DAA(Daily Active Addresses), MAA(Monthly Active Addresses) 등 블록체인 기반 서비스의 일반적인 사업 보고 목적에 활용됩니다.
- 퍼포먼스 마케팅: 각 계정의 가상자산 보유액과 트랜잭션 실행 내역을 측정하여 에어드랍 이벤트의 성과나 다른 서비스 이용 현황을 파악하는 오버랩 분석(Overlap Analysis) 목적으로 활용됩니다.
3. Web2, Web3 데이터의 한계
3.1 Web 2 데이터의 한계
블록체인 기반 서비스를 운영하는 기업의 입장에서 Web2 데이터는 다음과 같은 한계점이 있습니다.
3.1.1 블록체인 데이터를 알기 어렵습니다.
블록체인 기반 서비스는 단순히 웹 내에서 발생한 데이터 뿐만 아니라, 연동된 블록체인 상의 트랜잭션 내역이나 가상자산 보유 현황 데이터를 함께 확인해야 합니다. 이를 통해 서비스 사용자가 실제로 블록체인 상에서 얼마나 높은 수준의 활동을 하는지, 또 얼마나 큰 경제력을 지니고 있는지 확인해야 합니다. 그러나 Web2 데이터는 이를 알려주지 않습니다.
3.1.2 Cross-service한 데이터를 수집할 수 없습니다.
일반적으로 사용자는 하나의 서비스만 사용하는 것이 아니라, 동시에 여러 개의 서비스를 사용합니다. 그러나 Web 2 데이터는 구조적으로 투명하게 공개되어 있지 않기 때문에, 서비스 기업의 입장에서 사용자의 서비스 내에서의 활동만 확인할 수 있을 뿐, 사용자의 전체 생태계 활동 내역을 알 수 없습니다. 즉, 구글 데이터 담당자가 메타의 Web2 데이터에 접근할 수 없다는 의미입니다.
3.1.3 개인정보 보호 문제에 직면하고 있습니다.
유럽연합의 GDPR(General Data Protection Regulation) 등 전세계적으로 사용자 쿠키 수집에 관한 기업 규제가 나날이 강화되고 있으며, 이에 따라 Web2 데이터를 수집하는 것이 점차 어려워지고 있습니다. 결국 서비스 사용자 데이터를 수집하는 과정에서 누락으로 인해 정합성을 갖춘 데이터를 활용하는 것에 큰 위험성이 도사리고 있는 것이죠.
3.2 Web3 데이터의 한계
물론 Web3 데이터 역시 다음과 같은 한계점이 존재합니다.
3.2.1 서비스 내의 데이터를 알기 어렵습니다.
Web3 데이터는 기본적으로 블록체인 상에 전송된 트랜잭션 위주의 실행 내역만 존재할 뿐, 사용자가 서비스 내에서 세부 기능들에 얼마나 잘 참여하고 있는지 전혀 알려주지 않습니다.
3.2.2 사용자 속성 데이터가 매우 빈약합니다.
Web2 데이터는 일반적으로 국가, 기기 정보, 성별, 나이 등 인구통계학적 데이터를 함께 수집합니다. 반면에 Web3 데이터에서는 활동의 주체가 사용자가 아닌 계정이며, 각 계정은 가명성(pseudonymization)을 지닌 무작위의 16진수로 식별됩니다. 이로 인해, 인구통계학적 데이터를 전혀 알려주지 않습니다.
특히, 실제 사용자 1명이 여러 개의 계정을 사용할 경우, Web3 데이터는 이를 사용자 1명으로 집계할 수 없기 때문에 DAU, MAU 등 기초적인 데이터 분석 조차 정합성을 가지기 어려운 본질적인 문제점을 가지고 있습니다.
4. Web2와 Web3 데이터의 통합
4.1 왜 통합해야 하는가
앞서 언급했듯이, Web2와 Web3 데이터는 각각 한계점을 가지고 있습니다. 따라서 블록체인 기반 서비스를 운영하는 기업이라면, 두 데이터를 각각 독립적으로 사용하기에는 활용의 한계가 존재합니다.
결국, 서비스와 블록체인 내의 모든 사용자 속성과 행동 내역을 확인할 수 있어야만 종합적인 사용자 분석, CRM, 리타게팅, 개인화 서비스 등을 제공하여 빠르고 효과적인 제품 성장을 이뤄나갈 수 있을 것입니다.
4.2. 그러나, 현실은
물론 Web2와 Web3 데이터를 독립적으로 분석할 수 있는 플랫폼은 다수 존재합니다. 그러나 안타깝게도 Web2와 Web3 데이터를 통합적으로 분석할 수 있는 플랫폼은 전 세계적으로 매우 드물며, 존재하더라도 데이터 정합성과 활용 가치가 상대적으로 낮은 편입니다.
5. 이를 극복한 위핀 지갑의 사용자 통계
이러한 배경과 문제 의식으로부터 위핀 워크스페이스의 사용자 통계 기능이 탄생했습니다. 즉, 기업용 Web3 지갑 솔루션을 사용하는 각 기업이 최종 사용자들을 효과적으로 관리하기 위해 Web2와 Web3를 통합한 데이터 분석을 함께 진행할 수 있도록 지원합니다.
5.1 핵심 통합 지점: “사용자와 계정을 연결하다”
위핀 사용자 통계는 앞서 살펴본 Web2의 사용자와 Web3의 계정 식별을 연결하는 것으로부터 시작했습니다. 이를 통해 Web2 기반의 데이터 항목과 Web3 기반의 데이터 항목을 자유롭게 넘나들며 분석할 수 있게 됩니다. 블록체인 기반 서비스를 운영하는 기업이 핵심 사용자군을 정교하게 파악함으로써 보다 효과적인 로컬라이제이션(Localization) 등과 같은 전략을 수립하는 데 도움을 줄 것입니다.
5.2 기술적 구현: “데이터 웨어하우스”
사용자 통계 기능을 정교하고 안정되게 서비스하기 위해 비즈니스 데이터 웨어하우스를 구축했습니다. 먼저 위핀 앱 Production DB는 최종 사용자의 Web2 데이터와 Web3 데이터를 함께 수집합니다. 그런 후, 물리적으로 완전히 분리된 데이터 웨어하우스 전용 DB에서 ELT 툴을 사용하여 데이터 파이프라인이 실시간 혹은 주기적으로 데이터를 최신화합니다.
데이터 웨어하우스의 설계 과정 전반은 정확하고 안정적인 통계 서비스를 제공하기 위해 가장 널리 사용되는 Kimball’s Dimensional Modeling 이론을 적용했습니다. 즉, 추후 사용자 통계 기능을 고도화하거나 업데이트 상황에 직면했을 때, 유연하고 빠르게 확장할 수 있는 구조를 갖춘 것입니다.
5.3 사용자 통계 맛보기 (1) 토큰 보유량
국가별로 각 토큰 보유량 추이를 확인할 수 있습니다. 토큰 보유량이 많은 국가라면 우리의 블록체인 기반 서비스 성장에 대한 잠재 기여도가 높다는 것을 의미할 수 있습니다. 이를 통해, 특정 국가를 타게팅한 마케팅이나 에어드랍 이벤트를 효과적으로 진행하는 데 도움이 될 것입니다.
5.4 사용자 통계 맛보기 (2) 보유자 수
우리의 블록체인 기반 서비스에 연동된 특정 토큰을 보유한 사용자들의 수를 국가별로 확인할 수 있습니다. 리타게팅 전략을 수립 과정에서 중요한 데이터 척도가 될 것입니다.
6. 결론
블록체인 기반 서비스는 Web2와 Web3 데이터를 통합하여 제품 성장 전략을 수립해야 합니다. 따라서 바이럴 이벤트를 통한 사용자 유입, 기존 사용자를 대상으로 한 비즈니스 고도화 전략 등을 효과적으로 실행하기 위해서는 양질의 사용자를 타게팅할 수 있는 데이터를 확보해야 할 것입니다. 데이터 기반의 제품 성장 전략이 갖춤으로써 시장 내 경쟁력을 확보하는 데 유리한 고지를 점령할 수 있는 것이죠.
결국 위핀의 사용자 통계 기능은 이러한 고객의 요구를 충족시키기 위해, 단순히 지갑 솔루션만 제공하는 것을 넘어 효율적인 서비스 성장에 기여하기 위해 탄생했습니다. 여기에서 멈추지 않고, 사용자 통계 기능을 포함하여 위핀 워크스페이스는 지속적으로 제품을 고도화하여 고객이 블록체인 기반 서비스를 통합적으로 관리하고 다양한 액션을 실행할 수 있는 기능을 도입할 예정입니다.