実証会計学のてほどき

発生処理高による検証のすすめ方
OBEnet
by 岡部 孝好

イントロダクション目次

Chapter 1 (Part 1)Chapter 1 (Part 2)Chapter 2Chapter 3Chapter 4Chapter 5Chapter 6

 裁量的発生処理高の経験的検証



4.1 期待モデルと裁量的発生処理高


 4.1.1 純利益から裁量的発生処理高へ

 経営者が操作の目標としている会計数値が当期純利益NIだとする見方は、ビジネス界ではしごく一般的なものである。それなのに実証会計学では、裁量的会計行動の分析にあたり、NIというよりも、総発生処理高TACCの方に目を向ける。NIの一部を構成する営業活動によるキャッシュフローCFOはクリーンだとして、NICFOの差額としてのTACCを分析のターゲットに選ぶのである。

 こうしてあえてTACCを分析対象にするのであれば、目標に定められたTACCの統計量を調べるだけですべてが片づくように思えるかもしれない。たしかに、TACCの 分析だけで、実証研究を完結させるやり方もなかったわけではない。DeAngelo[1988]が採用したのはまさにこのやり方であり、マッチド・ペア方式によって組み合わされた2群のサンプルにつき、それぞれのTACCを測定し、2つの中心的傾向(平均、メディアン)を比較する方法によっていた。このディアンジェロ・モデルによると、データの収集も統計手法の適用もいたって簡便であり、誤解もミスもおきるおそれも少ない。それだから、ディアンジェロ・モデルはかつては広く使われ、TACCによる実証分析といえば、そのままこのやり方を指すことさえ少なくなかった。

 実証会計学のこのアプローチを大きく転換させたのは、Jones[1990]である。Jones[1990]によれば、経営者の裁量行動によって歪められているのはTACCのごく一部であって、TACCの全部ではない。TACCの中にはクリーンな非裁量的発生処理高NACCが含まれているのだから、もっと精密な議論を展開するには、クリーンなNACCTACCから取り除き、残余の裁量的発生処理高DACCに焦点を合わせることが必要である。こうして実証会計学の分析対象は、第1のステップではNIからTACCへと絞り込まれたのに、次の第2のステップでは、ジョーンズ・モデルによりTACCからDACCへとさらに狭く絞り込まれることになった。

 経営者の裁量行動によって「汚されている《のが、TACCの全部ではなく、その一部のDACCだとすれば、DACCを実証分析のターゲットにするというのが当然のことと されるようになった。しかし、この考えによれば、TACCの中でどの部分までがクリーンかを見きわめ、さらにその金額を具体的に測定しなければならないが、この作業は簡単なことではない。クリーンなNACCを予測できさえすれば、DACCの分離が可能になるが、NACCを予測するには期待モデル(expectation model)を導入することが必要とされる。

 期待モデルについては、多様な提案がなされているが、信頼できる標準的なモデルはいまもなお存在しない。まったく汚されていないクリーンなNACCなど、想像上のものでしかないからである。それでも、実証分析をすすめるには期待モデルは欠かせないから、先行研究においては便宜上、Jones[1990]にしたがい重回帰モデルを利用する例が多い。ジョーンズ・モデルによる場合でも、時系列分析(time-series analysis)とクロスセクション分析(cross-section analysis)とが使い分けられているし、重回帰モデルの説明変数に何を投入するかについても、先行研究の間に見解の上一致がみられる。しかし、ここではこの詳細に立ち入る余裕がないので、クロスセクション・ジョーンズ・モデルによることにし、売上高の増減と有形固定資産を説明変数にするオーソドックスな重回帰モデルを採用することにしよう。

 4.1.2 回帰モデルによる予測

 実証会計学の分析ターゲットは裁量的発生処理高DACCであるが、総発生処理高TACCからこのDACCを切り離すには、非裁量的発生処理高NACCをまず予測しなければならない。NACCを予測するにあたっては、Jones[1990]にしたがって、次の(1)の重回帰モデル(添字省略)を導入するのがふつうである。この重回帰モデルはTACCを従属変数に、⊿REVとPPEを説明変数にしており、誤差項がεである。なお、ここで⊿REVは売上高の純増減、PPEは有形固定資産合計であり、すべての変数は期首の資産合計によって基準化されている。

 

     TACC = α0 + α1 ⊿REV + α2 PPE + ε                   (1)

 

 この回帰モデルの母数(population)のパラメータとなるのはα0、α1、α2、 σであるが、それぞれに対応するパラメータのサンプル推定量(estimator)は、a0a1a2sであり、推定量の方はサンプルのデータから最小自乗法(OLS)によって計測される。この回帰モデルは、誤差項εが相互に独立で、平均ゼロの正規分布N(0, σ)に従うという前提によっており、εの標準偏差σ(分散σ2)も回帰モデルの重要なパラメータをなしている。

 OLSにより回帰係数の推定量a0a1a2を計算するには、TACC、⊿REV、PPEの3変数について実際のデータが必要とされるが、そのデータとして、特定の会社を取り上げ、その会社の過年度の会計数値(通常は過去6年以上)を利用するのが、時系列ジョーンズ・モデル(time-series Jones model)である。これに対して、クロスセクション・ジョーンズ・モデル(cross-section Jones model)では、特定年度(たとえば2003年)に時間を固定する一方で、横に会社群を拡げて、1つの産業(業界)に属する多数の会社の会計数値を使って回帰係数a0a1a2を推計する。ここでは、クロスセクション・ジョーンズ・モデルによることにしている。

 クロスセクション・ジョーンズ・モデルによってサンプルを抽出する場合には、マッチド・ペア方式で(matched pair design)組み合されたp社とq社が所属する産業がターゲットになる。証券コード頭2桁をキーにして、同一産業内の会社をリストアップし、サンプル抽出規準を満たす会社をすべて選んで、推定ポートフォリオ(estimate portfolio)を編成する。産業ごとに1つのポートフォリオが編成され、これが統計処理の単位にされるので、サンプルがj個の産業にわたる場合には、ポートフォリオの数も(したがって統計処理のファイル数も)j個となる。

 回帰モデルの(1)式によると、回帰係数の推定に使われる変数は三つである。そこで、データ・ファイルにはケースごとにTACCi、⊿REVi、PPEiのデータをn個並べて、統計ソフトウェアに統計処理を委ねる。

 

     ケース1 (TACC1, ⊿REV1、PPE1)

     ケース2 (TACC2, ⊿REV2、PPE2)

          ・・・

     ケースn (TACCn, ⊿REVn、PPEn)

 

 4.1.3 期待値予測モデル

 さて、回帰モデルのパラメータの推定量a0a1a2sは、産業別のポートフォリオがj個ある場合には、jセットがコンピュータから出力される。それぞれの推定量は特定の産業の特性を反映する要約的な統計量であるから、ポートフォリオごとに数値は異なっているであろう。しかし、その統計処理の基礎になったのは、ポートフォリオに編入された会社の会計数値なのだから、回帰係数の推定量はそれぞれの産業における平均的な反応(mean response)を反映している。そこで、この回帰係数を用いて、従属変数TACCi平均的な期待値(expected value)を推計してみることにする。特定の産業のポートフォリオにはp社とq社のサンプルが含まれているから、この2社には、分析対象年度(たとえば2003年)における⊿REVとPPEに特定の値(いずれも前期末資産合計で基準化されている)が存在する。p社とq社の特定値、⊿REV*とPPE*、を次の(2)式に代入して、期待値としての予測値を導く。

 

     = a0 + a1 ⊿REV* + a2 PPE*                     (2)

 

 ここで、予測に用いられた⊿REV*とPPE*がp社とq社の実績値であるのに、回帰係数のa0a1a2は各産業の平均的な反応係数である。したがって、予測値のは、この産業に属する企業の平均的なTACCiの期待値だとみることができる。実証会計学ではこの考え方を推し進めて、は、裁量行動がない場合の予測値だとしているから、これこそ「汚されていない《非裁量的発生処理高NACCiにほかならない。とすれば、NACCiであるから、p社とq社については、それぞれの実際の発生処理高TACCiからNACCi(= )を差し引くことによって、DACCiを分離することができる。

   DACCiTACCi - NACCi                            (3)

 DACCiについてのペアのデータは残りすべての産業に必要だから、他の産業について同じ統計処理をすすめ、全サンプルのDACCiを計算する。DACCiのデータがすべて揃えば、最終的に、P企業群とN企業群の2群の間において中心的傾向(平均、メディアン)を比較することができる。しかし、DACCiの個々の予測値は小サンプルのOLS回帰分析によっているから、その回帰モデルの評価には多数の問題点が含まれている。そこで、次節において、回帰モデルのフィットを検定する手順をやや詳しく説明することにしよう。

4.2 残差とそのバラツキの測度

 4.2.1 残差の統計量

 クロスセクション・ジョーンズ・モデルによる場合には、同一産業に属するすべての会社(ただしサンプル選択規準を満たす会社)が推定ポートフォリオに組み入れられ、このポートフォリオの会社群の会計数値を使って回帰係数の推定量、a0a1a2が推計されている。そして、総発生処理高TACCiの期待値を個々に予測するにあたっては、この回帰係数の推定量、a0a1a2をサンプル企業の実績値に当てはめ、期待値として予測値を導出している。

 このようにして推定された予測値 は、最小自乗回帰直線の上に存在する1点であり、当該産業における「平均的な反応《を表している。従属変数は正規分布にしたがう確率変数なのだから、予測値はいろいろな値をとる可能性があるのに、確率的に「最もありそうな期待値《として、(2)式で計算された予測値が特定されている。しかし、実際に観察された会社iのTACCiの値を調べてみると、その実績値TACCi予測値とは異なっている。2つの間には差異が生じていて、一致していない。予測値と実績値のこの差異は残差(residual)と呼ばれ、uiで表わされる。

 

      ui = TACCi -                                 (4)

 

 母回帰モデルの(1)式においては、誤差項εiは、平均がゼロ、標準偏差がσとされ、独立な正規分布にしたがうと仮定されている。上の(4)式における残差uiは、母数のεiに対応するサンプル側の統計量であり、i社についての従属変数TACCi の誤差を表している。そのバラツキを測定するにあたっては、1社ごとの残差uiにもとづいて、ポートフォリオ全体で残差の自乗ui2を集約する(uiの単純な合計はゼロだから無意味である)。その合計が残差平方和ui2であるが、これをサンプル1つあたりの平均に換算すると、(5)式に示す残差平均平方和s2がえられる。このs2は、ふつうの分散に相当するバラツキの統計量であり残差分散(residual variance)と呼ばれることも多い。残差分散の平方根が、(6)式の標準誤差sである。

  

   s2=∑ui2/(n-k-1)=(TACCi-2 /(n-k-1)             (5)

    s =√s2                                       (6)

 

 残差のバラツキを測定する場合には、残差平方和∑ui2を集計するが、この残差平方和は一般にはSSE(Sum of Square for Error)と略称されている。このSSEを自由度調整済みのサンプル数(n-k-1)で割ると、残差平方和の平均値として、残差平均平方和s2が導かれるが、このs2の略称がMSE(Mean Square for Error)である。ここで、平均を計算する際に(n-k-1)で割っているのは、s2がσ2の上偏推定量となるためには、説明変数がk個の場合、観察数nからさらに(k+1)を引いた値を自由度(degrees of freedom)にする必要があるからである。

 4.2.2 残差分散の評価

 回帰係数の計算にあたり、OLSでは、残差の平方和∑ui2が最も小さくなるように、最適化が図られている。正規方程式の解を求めるにあたっては、残差平方和∑ui2が最小化されるように、回帰直線の切片と傾きが決められている。しかし、実際のデータがどのように散らばっているかはケースによって異なっており、回帰直線のまわりの狭い範囲内にuiが散らばる場合もあれば、回帰直線から著しくかけ離れて散らばっている場合もある。

 回帰モデルがうまくフィットしているときには、従属変数のデータが回帰直線の真上に乗ったり、その直線のごく近傍にばらついている。回帰モデルの当てはまりがよい場合には、残差uiが、したがって残差平方和∑ui2が小さい。この点で、回帰の適合度(goodness of fit)を測る最も重要なモノサシとなるのは、残差分散s2(またはその平方根の残差標準誤差s)、つまりMSEである。 しかし、残差分散s2のMSEがどの程度まで小さければよいのかは、それだけをみてもわからない。他の指標と比較したうえで、「相対的に大きいのか小さいのか《を調べてみなければならない。回帰分析の評価では決定係数R2とかF統計量がよく使われるが、実をいえば、これらの統計量こそ、残差分散s2のMSEを相対的に評価するツールにほかならないのである。

4.3 回帰の適合度

 4.3.1 回帰モデルの説明力

 回帰モデルによってまず予測値 を計算し、次にこの予測値 に実績値TACCiを対比してみて、実績値の離れ具合を測っているのが残差uiである。しかし、従属変数TACCiの平均値 を基準にしてみると、予測値 それ自体も平均値から離れた数値であり、必ずしも平均値の近くに位置するわけではない。むしろ、2つの説明変数の値が増減すると、それにおうじて直線的に(比例的に)増減するのが従属変数の予測値 なのである。そこでいま、予測値と平均値とのズレを( - )によって測定するとすれば、その平方和∑( - )2によって、予測値が平均からどれだけかけ離れているかを表現することが可能になる。平均値 からの予測値 の離れ具合は、回帰直線の線上における増減でしかないから、回帰モデルにより正確に捕捉済みのものであり、この差異は、モデルそのものに起因するといえる。この平方和∑( - )2は一般にSSM(Sum of Square for Model)と呼ばれているが、SSMはモデルの適合のよさを示す指標であり、SSMが大きいのは回帰モデルがフィットしていることの何よりの証左となる。なお、SSMは説明変数の個数kによって増減するので、実際には、説明変数1つあたりの平均平方和(=∑( - )2 /k)に換算され、MSM(Mean Square for Model)として使われる。

 回帰直線の当てはめがうまくいっている場合には、予測値 は回帰直線の近傍に密集しており、残差uiが、したがって誤差の程度を測るSSEとMSEの値が、小さい。これに対応して、モデルの適合度を測るSSMとSSMが反対に大きくなるが、SSMとSSMが大きいとすれば、実績値が回帰直線の近くにあり、回帰モデルによって捉えられている割合が高いことが意味されている。回帰直線の当てはまりがよい場合には、一般に「モデルの説明力が大きい《といわれるが、このモデルの説明力を測るのがSSMとMSMなのであり、説明力が大きいほど、SSMとMSMの値が高くなる。

 4.3.2 決定係数とF統計量

 従属変数TACCiの分散を計算する場合には、まず平均値 を計算し、実際のデータの平均からの偏差の平方和Σ(TACCi - )2を求める。この平均からの偏差の平方和をデータ数(n-1)で割って平均に換算したのが、分散(variance)である。平均からの偏差の平方和は、全体をまとめることからSST(Sum of Square for Total)と言い換えられているし、またSSTをデータ数(n-1)で割った値(分散)は、MST(Mean Square for Total)と呼ばれている。

 モデル差異の平方和SSMと残差平方和SSEとを加算すると、合計は全体のSSTに等しくなる。同じ関係はMSM、MSE、MSTの間にも成り立つから、次のように表すことができる。

   ∑(-)2+∑(TACCi-2=Σ(TACCi- )2     (7.1)

   SSM       +SSE       =SST               (7.2)

   MSM      +MSE       =MST               (7.3)

 いま右辺に掲げられている全体のSST(とMST)が一定だとすると、関心の焦点は、左辺においてSSM(とMSM)またはSSE(とMSE)がどれほどの割合を占めるかになってくる。SSMとSSEの間には、一方が増えると他方は減るという関係にあって、両方が同時に増えることはありえない。回帰モデルの適合度という点からすると、モデルのSSMが多いこと、言い換えるとSSEが少ないのが望ましいが、そういう関係がどの程度まで成り立っているのかが問題である。決定係数が表現しようとするのは、まさにこの関係にほかならない。

    R2 = SSM/SST                            (8.1)

    adjR2= 1 - MSE/MST                        (8.2)

 まず決定係数R2はSSMとSSTの比であり、全体のSSTの中で、モデルによって説明されるSSMがどれほどの割合を占めているかを測定している。決定係数は相関係数(重相関係数という)の二乗であり、1より小さく、ゼロより大きい(1≧R2≧0)。この決定係数R2に代えて、自由度修正済み決定係数adjR2が実際にはよく使われるが、このadjR2も同様の考え方によっていて、SSMの相対的大きさを評価する統計量である。adjR2は誤差のMSEの方に目を転じて、MSEとMSTの比によって残差の大きさを測定しているかにみえるが、この比が示すのは「非説明力《、つまり説明できない程度であり、これを1から控除すると、モデルの説明力が表現されることになる。

 次に、相対立する関係におかれているMSMとMSEとを直接に対比するのが、F統計量である。残差の平均平方和s2が小さい場合には、分母のMSEに比べて分子のMSMが大きくなるから、F統計量には、回帰モデルの説明力がどの程度大きいかが端的に示される。

 

        F = MSM/MSE                        (9)

 

 4.3.3 回帰分析と分散分析表

 全体としてのバラツキが平均値からの距離であるとすれば、それを直接に測っているのは、SST=Σ(TACCi - )2である。このSSTを分解すると、残差に関するSSE=∑(TACCi - )2とモデルに関するSSM=∑( - )2とを導けることから、相互の関連は(7.1)、(7.2)、(7.3)のように、等式によって表現することができる。これらの相互関係を一覧表として示すのが、次の分散分析表(ANOVA)である。回帰分析の標準的なソフトウェアは、回帰係数の推定値とともに、この分散分析表を出力するのがふつうである。

    分散分析表(ANOVA)

   


4.4 有意性の検定

 4.4.1 ワルドのF検定

 上の(9)式に示したF統計量は、ある特殊な仮定をおいた場合に、自由度(p, n-k-1)のF分布にしたがうということがわかっている。ここに特殊な仮定というのは、母回帰係数のα1もα2も共にゼロだというケースであり、このケースが妥当すると、回帰モデルが想定するような傾きがまったく存在しなくなり、回帰分析そのものが無意味になってしまう。そこで、α1もα2も共にゼロだという命題を帰無仮説(H012=0)にして、この帰無仮説を覆すことによって、代替仮説を立証する。ここで代替仮説というのは、α1かα2どちらかが非ゼロで、従属変数と説明変数の間に、最低限のこととして、1つの直線的な関係が存在するということである。

 帰無仮説を覆すには、(9)式で計算したFを、自由度(p, n-k-1)のF分布表の数値に照らし合わせみる。そして、たとえば10%の有意水準で帰無仮説を棄却できるとすれば、代替仮説の方を採択して、α1かα2のどちらかが非ゼロであり、直線回帰分析が無意味ではない、と結論づける。これがワルドのF検定(Wald F-test)の手法である。

 4.4.2 回帰係数のt検定

 母回帰モデルの(1)式には3つのパラメータα0、α1、α2あるが、ソフトウェアによると、それぞれに対応するOLSの推定量a0a1a2と、それぞれのバラツキを示す係数の標準誤差(standard errors of estimates)が出力される。ここでa0の標準誤差をSa0a1の標準誤差をSa1a2の標準誤差をSa2とした場合には、次のようにそれぞれを回帰係数と組み合わせると、α0、α1、α2がゼロに等しいと仮定したとき、値は、自由度(n-k-1)のt分布に従うことが証明されている。この性質を利用すれば、H00=0、H01=0、H02=0という帰無仮説を個別に棄却することが可能となるが、これが回帰係数の有意性の検定である。ワルドのF検定はα1とα2がともにゼロだと一括して検定するが、回帰係数の検定はα1とα2を切り離して、1つひとつ検定する。

 

    a0Sa0            (10.1)

    a1Sa1            (10.2)

    a2Sa2            (10.3)

 

 回帰係数の有意性検定は定数項のα0に対して行っても、実際上の意味がない。2つの説明変数の係数α1とα2のいずれもがゼロの場合に、定数項α0がy軸と交差しているとしても、回帰直線はx軸と平行になっており、回帰モデルそのものが意味を失っている。これに対して、直線の傾きを捉える2つの係数が仮にゼロだとすれば、直線的関係が存在しなくなって、説明変数を従属変数に関係づけることが無意味になってしまう。それではこまるので、t検定によって、α1=0またはα2=0という帰無仮説を棄却しようとするわけである。


[つづく] ⇒Chapter 5



OBEnet

代表 岡部 孝好