케이젠, 5300만명 사용자 기반 AI 학습 데이터 구조 제시
황두현 기자
간단 요약
- 케이젠은 5300만명 이상 사용자 네트워크를 활용한 AI 학습 데이터 수집 구조를 공개했다고 밝혔다.
- 자체 개발한 POGE(Proof of Gamified Engagement) 구조로 허수 데이터를 제외한 고도화된 데이터셋을 구축 중이라고 전했다.
- 가정 내 일상 1인칭 시점 영상 데이터 약 2만 시간을 확보했으며, 글로벌 네트워크 기반 정교한 데이터 구조를 확대할 계획이라고 밝혔다.
기간별 예측 흐름 리포트



탈중앙화 데이터 인프라 기업 케이젠(KGeN)이 5300만명 이상의 사용자 네트워크를 활용한 인공지능(AI) 학습 데이터 수집 구조를 2일 공개했다.
케이젠은 인도, 동남아시아, 브라질, 중동 등 글로벌 전역에 분산된 사용자 층을 통해 실제 환경에서 생성되는 데이터를 확보하고 있다. 단순 클릭 데이터가 아닌, 사용자의 실제 의도와 행동이 반영된 데이터를 수집하는 것이 핵심이다.
데이터 검증에는 자체 개발한 'POGE(Proof of Gamified Engagement·게이미피케이션 참여 증명)' 구조를 적용했다. 이를 통해 사용자의 신원과 활동 내역을 확인하고, 허수 데이터를 제외한 고도화된 데이터셋을 구축한다는 설명이다.
구체적인 데이터 구축 사례도 제시됐다. 케이젠은 가정 내 일상 활동을 담은 1인칭 시점 기반 영상 데이터를 약 2만 시간 규모로 확보했다.
케이젠 측은 "해당 데이터는 연출 없이 실제 생활 속에서 수집됐기 때문에 환경과 행동의 다양성이 그대로 반영됐다"며 "수집 과정에서 개인정보 및 민감 정보는 철저히 제외하는 방식으로 운영 중"이라고 강조했다.
이어 "AI 학습 데이터의 질과 다양성이 모델 성능을 결정짓는 핵심 요소가 되고 있다"며 "글로벌 네트워크를 기반으로 실제 환경에서 생성된 정교한 데이터 구조를 지속적으로 확대해 나갈 계획"이라고 덧붙였다.

황두현 기자
cow5361@bloomingbit.io여러분의 웹3 지식을 더해주는 기자가 되겠습니다🍀 X·Telegram: @cow5361





