重回帰分析とは?
複数の変数を用いて、目的となる変数を説明することであり、店舗における来店顧客数や売上高を予測する「予測モデル」を構築するために用いられる分析手法です。小売業や流通業においては、店舗の売上の要因分析や予測などに用いられます。
重回帰分析に必要な要素
実際に重回帰分析を行うにあたって必要な要素や GIS を用いてできることを説明します。
分析対象の店舗情報
例えば、横浜市内のコープの店舗を対象に重回帰分析を用いて、月平均売上高に対する要因を分析し「予測モデル」を構築します。月平均売上高を予測するために店舗情報は必要な変数ですが、店舗情報のみでは予測精度が不十分になるケースがほとんどです。
商圏情報の収集
GIS を用いて各店舗の商圏範囲を定義し、その中の統計情報や競合店情報を収集します。収集したデータは、予測モデル構築のための変数として店舗情報と合わせて利用します。
効率的な変数選択
説明変数が多くなるほど売上などの予測変数に寄与する変数の組み合わせを見つけるのは至難の業になってきます。また、予測モデル内の説明変数同士が相関する場合にモデルが不安定になる(多重共線性)の危険が生じやすくなります。
ArcGIS では、売上などの予測変数を説明する説明変数の最適な組み合わせを統計的な検定を加味しつつ、自動的に抽出する「予備回帰分析」というツールを搭載しています。
予備回帰分析による出力レポート
予備回帰分析を実行することで、説明変数の選択数ごとに当てはまりの良い組み合わせが自動抽出されます。決定係数(R2)が単に最大化される組み合わせに加えて、統計検定をクリアした中での良い組み合わせがリストアップされます。
今回の解析結果では、以下の 5 つ説明変数の組み合わせが統計検定をクリアしながら、最も当てはまりが良い(R2≒0.91)という結果になっています。
+ テナント面積
+ 売場面積
+ 65 歳以上人口
+ 商圏内競合店数
– 500 ~ 700 万円世帯数
予測モデルの構築
予備回帰分析で選択された変数の組み合わせをもとに予測モデルを構築し、各変数の係数などを算出するツールとして ArcGIS には「一般線形回帰分析」ツールが搭載されています。予測式の構築だけでなく、構築したモデルの統計的検定も同時に出力され、モデルの安定性を評価することができます。
モデルの地域的偏差の評価
予測モデルから得られる理論値と実績値の差分(残差)がチャートおよびマップ上に表示されます。残差の多い店舗が地理的に偏っている場合は、不足している変数を検討するためのヒントになります。
回帰分析結果の活用法
新規候補物件に対してモデルを適用
予測モデルに必要な項目を新規候補物件に対して抽出し、その情報を基にして新規候補物件の予測を行い、出店を検討する際の材料として活用します。このように、ArcGIS 上で要因分析・予測分析を行うことで、要因の地理的影響の把握を行い、その後の施策につなぐことが容易になります。
予測モデルから有望エリアを抽出
予測モデルで使用される変数をエリアに当てはめることで、市場ポテンシャルの高い有望なエリアを抽出することもできます。以下は、65歳以上人口・商圏内競合店数・500~700万円世帯数をもとに算出した市場ポテンシャル マップです。赤いエリアほど市場ポテンシャルが高いことを表しています
関連リンク