Case Studyから学ぶデータ分析
こんにちは!
G2 Studios 運営企画の新井です。
「データ分析」について、分析フローや手法についての記事をよく見かけるのですが、事例をもとにした解説などはあまり見かけません。
そこで今回は、Case Studyを使って分析フローに沿った、データ分析の解説を行っていきます。
Case Studyは2つ用意していて、
になります。
データ分析全体のフローについて
以下が分析のフローになります。
【問いかけ】
分析全体の設計を行うフェーズだと考えてください。
「誰に対して」「どんな目的で」「どのような手法を用いて」データ分析を行うのかを検討します。
そして、最終的にどんなアウトプットを出して、どのように活用されれば分析の成功なのかを定義していきます。
【準備】
「問いかけ」で導き出した設計を満たすために、どのようなデータが必要なのかを洗い出します。
そして、収集したデータが「バイアスがかかっていないか」「ソース元がはっきりしているか」「十分にデータがそろっているか」「最新の情報か」を確認していきます。
【処理】
続いて「収集したデータに欠損がないか」「データの各カラムが指定した型で統一されているかどうか」などのデータクリーニングを行っていきます。
この処理を行っていないと、その後の分析で誤った結論を導き出してしまう可能性があります。
【分析】
処理を施したデータをもとに分析を行っていきます。
最初の設計段階で、ある程度分析の手法は決めているので、それに沿って分析を進めていき、新たに仮説が出たら、その都度分析手法を決めて、深掘りを行っていきます。
【共有】
分析結果を資料に落とし込み、分析の依頼者に報告します。
続いて「資料は分かりやすく見やすい構成になっているか」「空雨傘(※1)で話ができているか」「分析結果から出た示唆はロジックが飛躍していないか」を確認します。
これらができていないと、聞き手の納得感がなくなってしまいます。
(※1)空雨傘とは?
【行動】
分析結果をもとに、ネクストアクションを定めます。
分析結果は、今後の施策改善や意思決定の役に立たなければ、意味のないものになってしまいます。
そのため「論理的な提案を導けているか」「分析結果が依頼者の意思決定に役立つか」を確認します。
Case Study①:過去に視聴した映画の傾向分析
ここからは、上記のフローに沿って、実際に分析を行っていきたいと思います。
私が過去に観た映画、約800作品のデータセットを作成して、分析したケースをご紹介します。
【問いかけ~処理について】
前述した各フローの説明に沿って、設計を行っていきます。
今回は、ChatGPT4.0を利用しており、データの完全性やR-O-C-C-Cはないですが、許容して進めています。
※R-O-C-C-Cとは
【分析について】
設計したものをもとに、どのような分析手法を使えば目的を達成できそうかを整理します。
【共有~行動】
スライド1枚の中の構成としては、「分析のタイトル」「事実」「解釈」「グラフのビジュアライズ」の順に載せます。
なるべく1枚のスライドで、1つのグラフにした方が好ましいです。
ただし、同じカテゴリのグラフの場合は、複数入れ込んでも良いかと思います。
最終的にネクストアクションの検討や意思決定ができるように、分析の結果と提案をまとめたページを用意して、締めます。
Case Study②:プロジェクトの月次振り返り
次にプロジェクトで行っている月次の分析レポートを題材に、分析フローに沿って話していきます。
【問いかけ~処理について】
準備については、社内データベースを参照しており、情報としてR-O-C-C-Cは満たしているという前提があるので、省いています。
【分析について】
【共有~行動】
データ分析は大きな傾向から掴み、徐々にピンポイントな分析をして仮説を絞り込んでいきます。
まずは、全体の売上とそこに紐づくKPIについて、予測値と実測値の乖離を確認します。
その後、セグメント別に見て、細かな傾向を把握します。
さらに、各KPIの乖離がどこからきているものなのか、コンテンツ別に分析をしていきます。
最後に、Case Study①と同様、ネクストアクションの検討や意思決定ができるように、分析の結果、問題点、提案をまとめたページを用意して、締めます。
最後に
以上が、分析フローの説明とCase Studyでした。
分析フローのいずれかを飛ばしてしまうと、誤った結論を導いてしまったり、聞き手の欲しい情報を提供できなかったりするので、こちらのフローを意識しながらデータ分析をしていただければと思います。
▼G2 Studiosについてはこちら