独立変数 (どくりつへんすう、英語 : independent variable )によって説明される変数 を従属変数 (じゅうぞくへんすう、英語: dependent variable )と言う。 従属変数は、何らかの法則 や規則 (数学関数 など)によって他の変数の値に依存するという仮定や前提のもとで用いられる。一方、独立変数は、対象となる研究等の範囲内では他の変数から独立 していると見做す。[ 注釈 1] このとき、一般的な独立変数として時間 、空間 、密度 、質量 、流体の流量 [ 1] [ 2] 、および将来の値(従属変数)を予測するために使用される、ある観測対象の過去 の値(例:人口 )などが挙げられる[ 3] 。
この二つのうち、常に変化 が研究対象となるのは従属変数であり、統計学 では説明変数 とも呼ばれる入力を変更することでその変化が調べられる。実験 において、他の変数を用いずに値を割り当てることができる変数は、独立変数と呼ばれる。モデル や実験は、独立変数が従属変数に与える影響を検証する。その影響が直接的な関心の対象でない場合でも、独立変数が潜在的な交絡 効果を考慮するためなどの理由で含まれることがある。
1変数の微積分では、関数は通常、横軸に独立変数、縦軸に従属変数をとってグラフ化される。 この関数では、y は従属変数であり、x は独立変数である。
純粋数学において
数学において、関数とは入力(数または数の集合等)を受け、出力(数または数の集合等)を出す規則である[ 4] 。任意の入力を表す符号は独立変数 と呼ばれ、任意の出力を表す符号は従属変数 と呼ばれる。入力の最も一般的な記号はx であり、出力の最も一般的な記号はy である。関数は通常、y = f (x ) と表される[ 5] 。
独立変数や従属変数を複数持つことも可能である。 例えば、多変数微積分 では、z = f (x ,y ) の形をした関数にしばしば出会う。ここで、z は従属変数であり、x とy は独立変数である。 複数の出力を持つ関数は、しばしばベクトル値函数 と呼ばれる。
モデル化と統計学において
数理モデル では、従属変数の集合 と独立変数の集合との関係が研究される[要出典 ] 。
一般線形モデル y i = a + bx i + e i において、y i は従属変数のi 番目の値であり、x i は独立変数のi 番目の値である。e i の項は「誤差」であり、独立変数に依らない従属変数の変動を含む[要出典 ] 。
複数の独立変数がある場合にモデルはy i = a + bx i ,1 + bx i ,2 + ... + bx i,n + e i , となる。ここでn は独立変数の個数を表す[要出典 ] 。
統計学 、特に線形回帰 において、データの散布図 が生成され、X が独立変数、Y が従属変数として表される。これは二変量データとも呼ばれ、(x 1 , y 1 )(x 2 , y 2 ) ...(x i , y i ) の形を取る。この一般線形モデルは、Y i = a + Bx i + U i の形を取り、i = 1, 2, ... , n となる。この場合、U i , ... ,U n は離散型確率変数 である。これは、測定値が互いに影響を与えない場合に発生する。独立性 の伝播 により、U i の独立性はY i の独立性を意味するが、各Y i には異なる期待値 がある。各U i は期待値が0で、分散がσ2 である[ 6] 。
E
[
Y
i
]
=
E
[
α
+
β
x
i
+
U
i
]
=
α
+
β
x
i
+
E
[
U
i
]
=
α
+
β
x
i
.
{\displaystyle E[Y_{i}]=E[\alpha +\beta x_{i}+U_{i}]=\alpha +\beta x_{i}+E[U_{i}]=\alpha +\beta x_{i}.}
二変量データのあてはめはy = α + βx の形を取り、線形単回帰 と呼ばれる。α とβ はそれぞれ切片 と傾き に対応する[ 6] 。
実験において実験者によって操作される変数は、その働きが証明されている独立変数と言う[ 7] 。従属変数は、独立変数が操作されるときに変化が期待される事象である[ 8] 。
多変量解析 や機械学習 用のデータマイニング ツールでは、従属変数は目的変数 (ラベル属性とも)、独立変数は単に変数[ 7] [ 9] または特徴量 と呼ばれる。目的関数の既知の値は、学習データ セットおよびテストデータ セットに用いられるが、他のデータについては予測が必要となる。目的関数は教師あり学習 で使用され、教師なし学習 では使用しない。
類義語
分野に応じて独立変数は「予測変数」、「回帰変数」、「共変量」、「操作変数」、「説明変数」、「曝露変数」(信頼性工学 )、「危険因子 」(医療統計学)、「特徴 」(機械学習 およびパターン認識 )、「入力変数」と呼ばれる[ 10] [ 11] 。計量経済学 では、「共変量」の代わりに「制御変数」という用語が通常用いられる[ 12] [ 13] [ 14] [ 15] [ 16] 。
脚注
注釈
^ 既存の依存関係が可換であっても(逆関数が存在する場合等)、逆の依存関係が実験の研究対象でない場合は、命名則はそのまま維持される。
出典
^ Aris, Rutherford (1994). Mathematical modelling techniques . Courier Corporation
^ Boyce, William E.; Richard C. DiPrima (2012). Elementary differential equations . John Wiley & Sons
^ Alligood, Kathleen T.; Sauer, Tim D.; Yorke, James A. (1996). Chaos an introduction to dynamical systems . Springer New York
^ Carlson, Robert. A concrete introduction to real analysis. CRC Press, 2006. p.183
^ Stewart, James. Calculus. Cengage Learning, 2011. Section 1.1
^ a b Dekking, Frederik Michel (2005), A modern introduction to probability and statistics: understanding why and how , Springer, ISBN 1-85233-896-2 , OCLC 783259968
^ a b Variables
^ Random House Webster's Unabridged Dictionary. Random House, Inc. 2001. Page 534, 971. ISBN 0-375-42566-7 .
^ English Manual version 1.0 Archived 2014-02-10 at the Wayback Machine . for RapidMiner 5.0, October 2013.
^ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms , OUP. ISBN 0-19-920613-9 (entry for "independent variable")
^ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms , OUP. ISBN 0-19-920613-9 (entry for "regression")
^ Gujarati, Damodar N.; Porter, Dawn C. (2009). “Terminology and Notation”. Basic Econometrics (Fifth international ed.). New York: McGraw-Hill. pp. 21. ISBN 978-007-127625-2
^ Wooldridge, Jeffrey (2012). Introductory Econometrics: A Modern Approach (Fifth ed.). Mason, OH: South-Western Cengage Learning. pp. 22–23. ISBN 978-1-111-53104-1
^ Last, John M., ed (2001). A Dictionary of Epidemiology (Fourth ed.). Oxford UP. ISBN 0-19-514168-7
^ Everitt, B. S. (2002). The Cambridge Dictionary of Statistics (2nd ed.). Cambridge UP. ISBN 0-521-81099-X
^ Woodworth, P. L. (1987). “Trends in U.K. mean sea level”. Marine Geodesy 11 (1): 57–87. Bibcode : 1987MarGe..11...57W . doi :10.1080/15210608709379549 .