データ分析~「手法の本質」と「事実の解釈」について~
はじめに
こんにちは!
G2 Studios データアナリストの新井です。
ゲーム開発・運用でも重要な役割を果たす「データ分析」について、問題設定から提案まで数多くフローがありますが、今回は「分析手法」と、分析後の「事実の解釈」に焦点を当て、説明します。
数学など学術的なものはなく、専門分野以外でも分かりやすく嚙み砕いた内容になっていますので、ぜひ最後までお付き合いください。
データ分析の意義と目的の確認
「なぜデータを見なければいけないのか」、「何のためにデータ分析を行うのか」、その意義と目的について私なりに言語化してみました。
①意義について
技術の発展で誰もがデジタルデバイスを利用出来るようになり、そこからサービスを利用するユーザーの属性が多様化してきました。事実に基づきより良い改善をするために、データ分析が必要なのです。
②目的について
これに尽きます。
データ分析は、何か意思決定を行うための判断材料の1つとして利用されます。
そのため、「データ分析自体が目的となってしまっている」「すでに実行が決まっているもの」に対して行っても、価値ある分析にはなりません。
どんな問題を解決したいのか、どんな意思決定を行うためにどんなデータを出したいのか、分析を始める前にしっかり擦り合わせましょう。
データ分析手法の本質とは何か
では本題に入っていきたいと思います。
分析の本質とは、「分解」と「比較」だと考えています。
分析の意味を考えると「分解」と「比較」の理由がわかります。
分析の意味に「分解」が入っています。また、成分・要素・側面を明らかにするためには何か基準となるものと比較する必要があるので、分析の本質は「分解」と「比較」なのです。
分解の仕方
分解されている状態とは、3つの要件を満たしたモノのことを指しています。
①ディメンジョンの統一
(例)〇:食べ物→野菜類、肉類、魚類 → ネギ、豚肉、秋刀魚
×:食べ物→野菜類、豚肉、秋刀魚 → ネギ、肉類、魚類
②クライテリアの設定
(例)食事の切り口
・食文化で切る(日本食、中華、フレンチ、イタリアンなど)
・食材で切る(肉類、魚類、野菜類など)
③MECEであること
(例)人間を血液型で分解すると、A,B,O,ABですべての人間をもれなくダブりなくカバーできる
比較の仕方
比較とは、2つ以上の事柄を照らし合わせて、異同や優劣を確認するものです。
1つの値だけ見てもその数値が良いか悪いかの判断ができないので、2つ以上の数字を比べる必要があります。
比較の方法は4種類あります。
どれを使うかは、目的に沿って選ぶことが重要です。
分解と比較は組み合わせて利用する
「分解」と「比較」は、組み合わせて使うことが多いです。
今回は例として、ゲーム内イベント参加率が落ち込んでいて、どのユーザー層が減少しているのか分析してみましょう。
①分解
分解の対象は、イベント参加ユーザー
これをユーザーの10レベルごとに分けたいと思います。
※最小値がLv.1、最大値がLv.100のゲームと仮定
分解時の3つの要件を満たせていることも確認できます。
②比較
今までのイベントからどのユーザーが減少したのかを知りたいので、過去との比較を行います。
レベル帯別に第3回までのイベント参加ユーザーを集計したクロス集計表になります。
Lv.41〜60のユーザーが減少していることが分かります。
(※数値はすべてダミーです)
今回はやりませんが、ここから更に深掘りした分析を行っていきます。
事実と解釈とは何か
上記のダミーデータをもとに、事実と解釈について説明します。
(例)
イベント参加率が減少したのは、Lv.41〜60です。
(例)
なぜこのレベル帯が減少しているのか、要因を考えます。
ゲーム外の要因・・・他ゲームのリリースなど
ゲーム内の要因・・・報酬に飽きた、ステージ数が多い、難易度が高いなど
分析した結果(=事実)のみ伝えても次の行動には繋がりません。結果の数字からその背景要因を探ることが重要になります。
解釈に関して深掘りして話すと、解釈を入れるためにはドメイン知識が必要になります。
ドメイン知識をインプットすることで、知識不足による的外れな仮説や、無駄な追加分析をせずに済み、効率的に解釈を行うことが可能です。
終わりに
以上が「分析手法」と、分析後の「事実の解釈」についての解説です。
データ分析について、少しでも理解が進んでいただければ幸いです。
▼G2 Studiosについてはこちら