再現性の危機 (さいげんせいのきき、英 : replication crisis, replicability crisis )とは、多くの科学実験 の結果が他の研究者やその実験を行った研究者自身による後続の調査において再現 することが難しい、もしくはできないという科学 における方法論 的な危機のことである[ 1] 。この危機には長い歴史があるが、「再現性の危機」というフレーズそのものは2010年代 初頭に注意を集める問題の一部として名づけられた。
実験の再現性は科学的方法論 において欠かせない部分であるため、有意な理論が再現できない実験研究に基づいている科学の多くの領域において、研究の再現ができないことは潜在的に破滅的な結果をもたらす。
再現性の危機は特に心理学 (社会心理学 )と医学 の領域で広く議論されてきた。これらの領域においては古典的な結果の再調査やその結果の妥当性の評価、そしてもし妥当でないならばなぜ実験の再現が失敗するかの理由について多くの努力が行われてきた[ 2] [ 3] 。心理学と同じく、他の社会科学 の分野の中でも社会学 や経済学 等は共に、自然科学との比較で用語の定義が曖昧かつ研究の再現性も低い問題が指摘されている[ 4] 。
科学一般
1500人の科学者を対象にした2016年の調査によれば、70%の研究者が他者の実験の再現に失敗した(50%の研究者は自身の研究の再現にも失敗している)。この数字は分野によって異なる[ 5] 。
凡例: 他者が行った実験に失敗したことがある人の割合 (自身が行った実験に失敗したことがある人の割合)
化学 : 90% (60%)
生命科学 : 80% (60%)
物理学 と工学 : 70% (50%)
医学: 70% (60%)
地球科学 と環境科学 : 60% (40%)
2009年には科学者の2%が、少なくとも一度は(自身が)《研究の捏造》(=科学における不正行為 の一種)を行い、科学者の14%は そのような捏造を行った人を個人的に知っている ことを認めた。「(実験)処理の誤り」は、(他の分野に比べて)医学研究者の方がより頻繁 に報告している[ 6] 。
医学
1990年から2003年にかけての、1000件以上引用された49の医学研究のうち、45の研究で研究された治療法が効果的であったと主張された。これらの研究のうち、16%は後続研究により否定され、16%は治療法の効果が誇張され、24%は再現されなかった[ 7] 。アメリカ食品医薬品局 は1977年から1990年にかけて、医学研究の10%から20%に欠陥を発見した[ 8] 。アムジェン に勤務する生命技術コンサルタントの Glenn Begley とテキサス大の Lee Ellis が2012年に出版した論文では、癌の前臨床研究のたった11%しか研究の再現に成功しなかったと主張している[ 9] [ 10] 。学術雑誌 PLOS Medicine で最近出版された論文のタイトルは "Why Most Clinical Research Is Not Useful"(なぜほとんどの臨床研究は使えないのか)である[ 11] 。
心理学
実験の再現の失敗は心理学に固有のものではなく、科学の全ての領域で発見される[ 12] 。しかしながらいくつかの要素が合わさって心理学を論争の中心に置いてきた。臨床心理学 のような他の心理学の領域においても関係はあるものの、多くの焦点は社会心理学 の領域に当てられてきた。
まず最初に、疑わしい研究慣習(英 : questionable research practices, QRPs )が心理学において一般に認知されてきた。故意のねつ造ではないものの、このような慣習の結果として許容可能な科学的慣習におけるグレーゾーンが利用されるか、もしくは望ましい結果を得るための努力としての柔軟なデータ収集、分析、報告が利用されてきた。QRPsの例として、データを選択して報告する事や部分的な出版(出版にあたって研究条件や収集した従属変数の一部のみを報告する事)、恣意的な停止(データ収集をいつ止めるかをしばしば検定が統計的に有意になるかに基いて選ぶ)、p値の丸め(統計的に有意であることを述べるためにp値を5%となるように丸める事)、ファイル・ドロワー効果(英 : file drawer effect )(データが出版されないこと)、ポストホックなストーリー展開((仮説が無い状況での)探索的な分析を(何らかの仮説についての)確証を得るための分析として見なすこと)、外れ値の操作(統計的検定が有意となるようにデータセットから外れ値を削除したり除去したりすること)などがある[ 13] [ 14] [ 15] [ 16] 。2000人以上の心理学者による聞き取り調査によれば、回答者の多くは少なくとも一つのQRPを用いたことを認めている[ 13] 。出版への圧力、もしくは著者自身の確証バイアス に依ることが多い偽陽性的 な結論は心理学に固有の災いであり、一部の読者はある程度の懐疑主義を持たなくてはならない[ 17] 。
第二に、特に心理学と社会心理学は明かな研究不正に伴ういくつかのスキャンダルの中心に巻き込まれてきた。最も注記すべきはDiederik Stapel (英語版 ) が認めたデータのでっちあげだが[ 18] 、他の研究者に対しても疑惑はある。しかしながら多くの研究者は研究不正は、おそらくは、再現性の危機について大きな寄与はないと認めている。
第三に、心理科学におけるいくつかの効果は現在の再現性の危機以前より再現することが難しいということが発見されてきた。例えば、科学雑誌 Judgment and Decision Making は無意識的思考理論 (英語版 ) を支持する事に失敗した研究を数年にわたっていくつか発行している。理論に対し強い疑念を持っていない研究グループによって研究実験が事前登録され施行される時、研究の再現は特に難しくなるように思われる。
これら三つの要素は結果として実験の再現についてダニエル・カーネマン による新たな注意をもたらした[ 19] 。多くの効果の精密な調査はいくつかの中心的な信念は再現する事が難しいことを示してきた。学術雑誌 Social Psychology の最近の特集号のひとつは再現研究に焦点を当てており、今までの固定観念の多くが再現することが難しいことを発見した[ 20] 。学術雑誌 Perspectives on Psychological Science の2012年の特集号でもまた出版バイアスからヌル・アバージョン(null aversion、否定的な結果を避けようとする考え方)まで含む心理学における再現性の危機に寄与する問題について焦点があてられた[ 21] 。2015年、心理学において最初の再現性の公開実証研究が出版された。これはReproducibility Project (英語版 ) と呼ばれている。三つの心理学の最も有力な学術雑誌における100個の実証研究の再現のため世界中の研究者が協力した。行われた再現実験の多くが事前に予期された結果と同じ傾向を示したものの、統計的に有意な水準で再現することに成功したものは半数以下となった[ 22] 。
学者James Coyneは多くの研究実験とメタアナリシスが質の悪さと著者とプロの組織の両方に関連する利益相反によって毀損されており、結果としてある種の精神療法の効果について多くの偽陽性をもたらしていると著している[ 23] 。
再現性の危機は心理学が非科学的であるということを意味しない[ 24] [ 25] [ 26] 。むしろこのプロセスは、科学的なプロセスの辛辣な部分ではあるが、健康的である。このプロセスにおいて古い考えや入念かつ精密な調査に耐えることのできない考えが(この方法が常に効率的であるとは限らないものの[ 27] [ 28] )排除される[ 29] [ 30] 。この結論として、かつて信頼できると見なされた心理学のいくつかの分野、例えば社会的プライミング、が再現実験の失敗により詳細な調査の対象となっている[ 31] 。イギリスのインデペンデント 紙はReproducibility Project (英語版 ) の結果は出版された研究の多くがただの“心理バブル”(psycho-babble)であることを示したと記している[ 32] 。
ノーベル賞受賞者で心理学の名誉教授であるダニエル・カーネマン は、出版された方法は曖昧であることが多いので、原著者は再現性への努力に携わるべきだと主張している[ 33] 。他の科学者、例えばAndrew Wilson博士はこれに同意せず、出版された方法の詳細を書くべきだと主張している。2012年における心理学分野の再現率調査は、著者が研究の原著者と共同した時、再現研究において高い再現成功率が得られることを示唆している[ 34] (原著者と共同しない場合の再現成功率は64.6%なのに比べ原著者と共同した研究における再現成功率は91.7%である)。
心理学における再現率
Open Science CollaborationがBrian Nosek (英語版 ) と共同して行った2015年8月の報告では三つの高ランクの心理学の学術雑誌から100個の心理科学における研究の再現性を推定した[ 35] 。元々の研究では97%の研究が統計的に有意な効果(p 値が0.05以下)を持っていたのに比べ、再現実験全体の36%が統計的に有意である結果が得られた。再現実験における効果量 (英語版 ) の平均は元々の研究で報告された効果量のおよそ半分程度の大きさだった。
同じペーパーでは学術雑誌(Journal of Personality and Social Psychology (英語版 ) [JPSP], Journal of Experimental Psychology: Learning, Memory, and Cognition (英語版 ) [JEP:LMC], Psychological Science (英語版 ) [PSCI])と分野(社会心理学 と認知心理学 )の再現率と効果量も調査された。研究の再現率はJPSPは23%、JEP:LMCは38%、PSCIは38%であった。認知心理学における研究の再現率は50%で社会心理学における研究の再現率(25%)より高かった。
1900年から2012年の間の心理学の学術雑誌の上位100誌における出版履歴による分析が示唆するところによると、全ての心理学の出版論文の内およそ1.6%については再現実験が行われていた[ 34] 。もし「再現」("replication")という用語が論文中に登場したならば、その論文は再現実験が行われていると考慮した。これらの研究の一つのサブセット(500個の研究)を更なる調査の為にランダムに選ぶと、その再現率は低く、1.07%(500個の研究の内342個は再現実験が行われていた)となった。500の研究のサブセットにおいて分析が示すところによれば、出版された再現実験の78.9%が成功していた。少なくとも一人以上の原著者が再現実験に参加した時、再現実験の成功率は有意に高くなった(64.6%に比べて91.7%である)。
方法論的な社会的ジレンマ
Brian D. Earp と Jim A. C. Everettは、心理学における再現実験を推奨させない社会的な構造に着目して、なぜ再現実験が一般的ではないのかについて5つの点を列挙した[ 36] [ 37] 。
他者の発見の独立かつ直接的な再現は再現研究者にとって時間がかかる。
再現実験は研究者自身のオリジナルな考えを反映した他のプロジェクトから直接的にエネルギーと資源を奪いがちである。
再現実験は一般に出版することが難しい(再現実験は独自性が無いと見なされるという理由が大部分を占める)。
もし再現実験が出版されても、これらは分野に対する大きな貢献というよりは 'bricklaying' な研究とみなされがちである。
再現実験は認知も称賛もされづらく、キャリア上の基本的な安定さえ得づらい[ 38] 。
これらの理由により著者らは心理学は、分野の利益と個別の研究者の利益が調和しない、方法論的な社会的ジレンマに直面していると主張した。
社会学や経済学
社会科学の分野の中で心理学 の他にも、社会学や経済学等は共に自然科学との比較で用語の定義が曖昧かつ研究の再現性 も低い問題が指摘されている。そのため、アメリカ合衆国国立衛生研究所 (NIH)は一部の社会科学分野の現状の是正の方向性を示す戦略を発表した[ 4] 。ブール 最適化 は特に問題が多く、社会科学へのブール最適化の導入は、論理実証主義の時代遅れの考え方に似ている。その無批判な適用は再現性の危機の一因となっている[ 39] 。
人工知能
人工知能 における機械学習の予測精度は過大評価される可能性があり[ 40] 、機械学習が不適切に行われた場合の再現性と情報漏洩の問題がある[ 41] [ 42] [ 43] 。また、ルンド大学の研究者によれば、主成分分析は機械学習において再現性がない可能性があり、使用する際には特別な注意がほしい[ 44] 。
危機の原因
Glenn Begley と John Ioannidis (英語版 ) は2015年に出版された論文で、現在の科学の苦境をまとめるために5つの要点を提出した[ 45] 。
新しいデータの作成/前例のない率での出版
ほとんど長期的には称賛されえないだろう発見の証拠の強制
原因:良い科学的慣習の定着の失敗と、出版か死か(英 : publish or perish )という絶望
これは多くの要素と多くの利害関係者が存在する問題である。
一つの集団が単独で責任を負うものでもなく、一つの答えで十分でもないだろう。
実際、科学の精度の制御メカニズムにおいてありうる危機の予測は数十年にわたって、特にscience and technology studies (英語版 ) (STS)における学者の間で、遡及することができる。科学計量学 (英語版 ) の父と見なされるDerek de Solla Price (英語版 ) は、科学は自身の指数的成長の結果として'老衰'してしまうだろう、と予測している[ 46] 。今日におけるある文献は、注目と質の両方において老衰しているのを嘆きながら、この行き過ぎた予言が間違いであると証明しようとしているように見える[ 47] [ 48] 。
心理学者で科学史家であるJerome R. Ravetz (英語版 ) は自身の1971年に出版された著書Scientific knowledge and its social problems (英語版 ) で、制限された科学者のコミュニティで出来た小さな科学から大きな科学もしくは技術的な科学に移る上で、科学は質のコントロールの内部的システムにある大きな問題に悩まされることだろう、と予測した。Ravetz は近代のインセンティブの科学的システムは機能不全になるだろう(現在の出版か死かへの挑戦)と予測した。Ravetz にとって、規範と標準、そしてそういったものの上に立とうとする意志によってつながった学者コミュニティがあるならば、科学の質は保たれるだろう。
歴史家のPhilip Mirowski (英語版 ) は、より最近の2011年の著作 Science Mart で同じような診断を下した[ 49] 。'Mart' はここでは小売大手のウォルマート 'Wall Mart' に言及され、科学の商品化の暗示である。Mirowski の分析では、科学が市場で取引される商品になった時にその質は崩壊する。Mirowski は、科学の減衰を企業が自らの業務を大学にアウトソーシングさせるために企業内研究室を閉じたという決定に帰し、結果として企業の研究は大学からより安価な契約研究機関に移ったと主張している。
科学の質をコントロールするシステムの危機は政策においての科学利用にも影響を与えている。これは、証拠に基づいた政策(エビデンスベースドポリシー、英 : evidence based policy )において現在の緊張点を識別しているSTSの科学者集団による最近の論文で触れられている[ 50] [ 51] 。
再現性の危機への言及
再現性 は「科学のコーナーストーン」として言及されてきた[ 52] [ 53] 。再現研究は出版された結果が真の発見を反映したものか偽陽性を反映したものかを評価しようとしている。科学的発見の誠実さと研究の再現性は将来の研究の基礎知識を形作るため重要である。
再現性の危機に対応するための学術出版の近年の発展の一つは登録された報告を用いるものである[ 54] [ 55] 。登録された報告のフォーマットは著者に、データ収集の前に、研究方法と分析を記述したものを提出することを求めている。方法と分析の計画がピアレビューにより審査されたら、発見の出版は著者が提出したプロトコルに従っているか否かに基づき暫定的に保証される。登録された報告の一つの目的はQRPを導きかねない有意な発見に対する出版バイアス を回避することであり、厳密な方法に基づいた研究の出版を促進することである。
MIT とスタンフォード大学における実験的方法のコースワークに基づき、心理学のコースはオリジナルな研究というよりは再現実験を強調すべきと提案された[ 56] [ 57] 。このような試みのおかげで学生は科学的方法論を学び、再現性が確かめられるような意味ある科学的発見について多くの独立した再現実験を行うだろう。大学院生は卒業前に博士論文の研究に関連したトピックに基づいた高い精度の再現実験を出版することを求められるべきと薦める声もある[ 37] 。
再現実験の精度を高めるために、元の研究より大きなサンプルサイズ が必要とされる[ 58] 。出版バイアスと元の研究における小さなサンプルサイズと関連した大きなサンプリングの変動性のために、出版された研究における効果量 (英語版 ) の推定は誇張されることが多いので大きなサンプルサイズが要求される[ 59] [ 60] [ 60] [ 61] 。
データ、プロトコル、そして発見が大衆により記録でき、かつ評価もされうるオンライン・レポジトリにより研究の統合と再現性が改善されようとしている。そのようなレポジトリの例として、open science framework 、http://www.re3data.org/、 www.psychfiledrawer.org などがある。Open Science Framework のようなサイトは意欲的な科学者の努力における開かれた科学慣行のためにバッジを提供している。しかしながら、分析のためのデータとコードを提供したいと思うような研究者はおそらくもっとも洗練されているという懸念もある[ 62] 。スタンフォード大の John Ioannidis は"最も几帳面で洗練されていて研方法を熟知しており注意深い研究者が、間違いを追い求める再分析者による批判と評価の攻撃により影響されるようになるというパラドックスが起こるだろうし、どうやっても間違いを無視できない"と提言している[ 62] 。
学術雑誌 Psychological Science (英語版 ) では、研究の事前登録と、効果量と信頼区間の報告が推奨されている[ 63] 。編集スタッフは草稿を出版受理する前に、小さいサンプルサイズにおける試行からの驚くべき発見を行った研究の再現性について尋ねるようにしている、と筆頭編集者は記している。
2016年7月に、Netherlands Organisation for Scientific Research (英語版 ) は再現研究のために300万ユーロを拠出した。この資金は現在あるデータの再解析に基づいた再現と新しいデータの収集と分析による再現のためのものである。資金は社会科学、健康についての研究、ヘルスケア・イノベーションの領域で使用可能である[ 64] 。
2017年6月に72人の著名な研究者が、新たな発見をしたと主張する際の証拠の統計的基準の低さが再現性の危機の一因になっているとする論文を発表した。新発見の統計的有意性を評価するために、科学者が好んで用いるP値の閾値は0.05から0.005 に引き下げるべきであると、統計学 の大家たちは主張する。その一方、イリノイ工科大学 の計算機科学 者Shlomo Argamonは「実験する方法が多数ある限り、どんなに小さいP値の閾値を用いてもその中に一つの実験方法が偶然に有意になる可能性が極めて高い」と新しい方法論的な基準を求める。実際小さいP値の閾値を用いたらお蔵入り問題 がより著しくなり、多数の論文が出版できなくなる[ 65] 。
対策
事前登録、データ、プログラミングコードのオープンソース公開 は、再現性の危機に対する効果的な対策と考えられており、実行可能な比較の数が判明しない限り、諸悪の根源の一つであるp値の有意性を説明すべきではない[ 66] [ 67] 。
機械学習論文で使用されているデータセットに関する報告[ 68] の厳密性と透明性を高めることで、ほぼ確実に向上させることができる。このため、論文検索エンジンConsensusは、厳密性と透明性の指数を備えており[ 69] 、それ自体が機械学習と自然言語処理の産物である[ 70] 。
参考文献
^ Schooler, J. W. (2014). “Metascience could rescue the 'replication crisis'”. Nature 515 (7525): 9. doi :10.1038/515009a .
^ Gary Marcus (2013年5月1日). “The Crisis in Social Psychology That Isn’t ”. The New Yorker. 2016年10月8日閲覧。
^ Jonah Lehrer (2010年12月13日). “The Truth Wears Off ”. The New Yorker. 2016年10月8日閲覧。
^ a b Nast, Condé (2017年2月20日). “「社会科学」は崩壊した。米国の新たな指針は救いとなるか? ”. WIRED.jp . 2023年9月3日閲覧。
^ Baker, Monya (26 May 2016). 1,500 scientists lift the lid on reproducibility . 533 . pp. 452–454. doi :10.1038/533452a . http://www.nature.com/news/1-500-scientists-lift-the-lid-on-reproducibility-1.19970?WT.mc_id=SFB_NNEWS_1508_RHBox .
^ Fanelli, Daniele (29 May 2009). “How Many Scientists Fabricate and Falsify Research? A Systematic Review and Meta-Analysis of Survey Data” . PLOS ONE 4 (5): e5738. doi :10.1371/journal.pone.0005738 . PMC 2685008 . PMID 19478950 . http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0005738 .
^ Ioannidis JA (13 July 2005). “COntradicted and initially stronger effects in highly cited clinical research” . JAMA 294 (2): 218–228. doi :10.1001/jama.294.2.218 . https://doi.org/10.1001/jama.294.2.218 .
^ Glick, J. Leslie (1 January 1992). Scientific data audit—A key management tool . 2 . pp. 153–168. doi :10.1080/08989629208573811 . http://www.tandfonline.com/doi/abs/10.1080/08989629208573811 .
^ Begley, C. G., and Lee M. E., 2012, Drug Development: Raise Standards for Preclinical Cancer Research, Nature, 483, 531–533.
^ Begley, C.G., 2013, Reproducibility: Six red flags for suspect work, Nature, 497, 433–434.
^ Ioannidis JPA, 2016, Why Most Clinical Research Is Not Useful, PLoS Med 13(6): e1002049. doi:10.1371/journal.pmed.1002049.
^ “No, science’s reproducibility problem is not limited to psychology ”. The Washington Post . 2015年9月10日閲覧。
^ a b John, Leslie K.; Loewenstein, George; Prelec, Drazen (2012-05-01). “Measuring the Prevalence of Questionable Research Practices With Incentives for Truth Telling” . Psychological Science 23 (5): 524–532. doi :10.1177/0956797611430953 . ISSN 0956-7976 . PMID 22508865 . http://pss.sagepub.com/content/23/5/524 .
^ “The Nine Circles of Scientific Hell” . Perspectives on Psychological Science 7 (6): 643–644. (2012-11-01). doi :10.1177/1745691612459519 . ISSN 1745-6916 . PMID 26168124 . http://pps.sagepub.com/content/7/6/643 .
^ “Research misconduct - The grey area of Questionable Research Practices ”. www.vib.be . 2015年11月13日閲覧。
^ Fiedler, Klaus; Schwarz, Norbert (2015-10-19). “Questionable Research Practices Revisited” . Social Psychological and Personality Science 7 : 1948550615612150. doi :10.1177/1948550615612150 . ISSN 1948-5506 . http://spp.sagepub.com/content/early/2015/10/19/1948550615612150 .
^ Simmons, Joseph; Nelson, Leif; Simonsohn, Uri (November 2011). “False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant” . Psychological Science (Washington DC: Association for Psychological Science) 22 (11): 1359–1366. doi :10.1177/0956797611417632 . ISSN 0956-7976 . PMID 22006061 . http://pss.sagepub.com/content/22/11/1359.full 2012年1月29日閲覧。 .
^ Shea, Christopher (2011年11月13日). “Fraud Scandal Fuels Debate Over Practices of Social Psychology ”. 2016年10月8日閲覧。
^ Kahneman, Daniel. “A New Etiquette for Replication ”. 2016年10月8日閲覧。
^ [1] [リンク切れ ]
^ Table of Contents(目次)
^ Open Science Collaboration (2015). “Estimating the reproducibility of Psychological Science”. Science 349 (6251): aac4716. doi :10.1126/science.aac4716 . PMID 26315443 .
^ Coyne, James (2014年4月15日). “Are meta analyses conducted by professional organizations more trustworthy? ”. Mind the Brain . 2016年9月13日閲覧。
^ “Why Psychologists' Food Fight Matters ” (2014年7月31日). 2016年10月8日閲覧。
^ “Psychology Is Starting To Deal With Its Replication Problem ” (2015年8月27日). 2016年10月8日閲覧。
^ “Science Isn’t Broken ” (2015年8月19日). 2016年10月8日閲覧。
^ Ioannidis, John P. A. (2012-11-01). “Why Science Is Not Necessarily Self-Correcting” . Perspectives on Psychological Science 7 (6): 645–654. doi :10.1177/1745691612464056 . ISSN 1745-6916 . PMID 26168125 . http://pps.sagepub.com/content/7/6/645 .
^ Pashler, Harold; Harris, Christine R. (2012-11-01). “Is the Replicability Crisis Overblown? Three Arguments Examined” . Perspectives on Psychological Science 7 (6): 531–536. doi :10.1177/1745691612463401 . ISSN 1745-6916 . PMID 26168109 . http://pps.sagepub.com/content/7/6/531 .
^ Etchells, Pete (2014年5月28日). “Psychology’s replication drive: it’s not about you ”. 2016年10月8日閲覧。
^ Wagenmakers, Eric-Jan; Wetzels, Ruud; Borsboom, Denny; Maas, Han L. J. van der; Kievit, Rogier A. (2012-11-01). “An Agenda for Purely Confirmatory Research” . Perspectives on Psychological Science 7 (6): 632–638. doi :10.1177/1745691612463078 . ISSN 1745-6916 . PMID 26168122 . http://pps.sagepub.com/content/7/6/632 .
^ Bartlett, Tom (2013年1月30日). “Power of Suggestion ”. 2016年10月8日閲覧。
^ Connor, Steve (2015年8月27日). “Study reveals that a lot of psychology research really is just 'psycho-babble'” . The Independent (London). http://www.independent.co.uk/news/science/study-reveals-that-a-lot-of-psychology-research-really-is-just-psychobabble-10474646.html
^ Chambers, Chris (2014年6月10日). “Physics envy: Do ‘hard’ sciences hold the solution to the replication crisis in psychology? ”. 2016年10月8日閲覧。
^ a b Makel, Matthew C.; Plucker, Jonathan A.; Hegarty, Boyd (2012-11-01). “Replications in Psychology Research How Often Do They Really Occur?” . Perspectives on Psychological Science 7 (6): 537–542. doi :10.1177/1745691612460688 . ISSN 1745-6916 . PMID 26168110 . http://pps.sagepub.com/content/7/6/537 .
^ Collaboration, Open Science (2015-08-28). “Estimating the reproducibility of psychological” . Science 349 (6251): aac4716. doi :10.1126/science.aac4716 . ISSN 0036-8075 . PMID 26315443 . http://www.sciencemag.org/content/349/6251/aac4716 .
^ 以下もまた参照せよ。 Earp and Trafimow , 2015
^ a b Everett, Jim Albert Charlton; Earp, Brian D. (2015-01-01). “A tragedy of the (academic) commons: interpreting the replication crisis in psychology as a social dilemma for early-career researchers” . Frontiers in Psychology 6 : 1152. doi :10.3389/fpsyg.2015.01152 . PMC 4527093 . PMID 26300832 . http://journal.frontiersin.org/Article/10.3389/fpsyg.2015.01152/abstract .
^ “Resolving the replication crisis in social psychology? A new proposal | SPSP ”. www.spsp.org . 2015年11月18日閲覧。
^ Thiem, Alrik; Mkrtchyan, Lusine; Haesebrouck, Tim; Sanchez, David (2020-06-08). “Algorithmic bias in social research: A meta-analysis” (英語). PLOS ONE 15 (6): e0233625. doi :10.1371/journal.pone.0233625 . ISSN 1932-6203 . PMC PMC7279593 . PMID 32511249 . https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0233625 .
^ Saeb, Sohrab; Lonini, Luca; Jayaraman, Arun; Mohr, David C.; Kording, Konrad P. (2017-05-01). “The need to approximate the use-case in clinical machine learning” (英語). GigaScience 6 (5). doi :10.1093/gigascience/gix019 . ISSN 2047-217X . PMC PMC5441397 . PMID 28327985 . https://academic.oup.com/gigascience/article/doi/10.1093/gigascience/gix019/3071704 .
^ Kapoor, Sayash; Narayanan, Arvind (2022). Leakage and the Reproducibility Crisis in ML-based Science . doi :10.48550/ARXIV.2207.07048 . https://arxiv.org/abs/2207.07048 .
^ “How to avoid machine learning pitfalls: a guide for academic researchers ”. 2023年12月1日閲覧。
^ “Is AI Driving a Scientific Reproducibility Crisis? ” (英語). Is AI Driving a Scientific Reproducibility Crisis? (2022年8月17日). 2023年12月1日閲覧。
^ “Principal Component Analysis Can Negatively Impact Science ” (英語). Principal Component Analysis Can Negatively Impact Science (2023年3月1日). 2023年12月1日閲覧。
^ Begley, C. G. & Ioannidis, J. P. (2015). “Reproducibility in Science: Improving the Standard for Basic and Preclinical Research”. Circulation Research 116 (1): 116–126. doi :10.1161/CIRCRESAHA.114.303819 . PMID 25552691 .
^ De Solla Price; Derek J. (1963). Little science big science . Columbia University Press
^ Siebert, S.; Machesky, L. M. & Insall, R. H. (2015). “Overflow in science and its implications for trust” . eLife 4 : e10825. doi :10.7554/eLife.10825 . PMC 4563216 . PMID 26365552 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4563216/ .
^ Della Briotta Parolo, P.; Kumar Pan; R. Ghosh; R. Huberman; B.A. Kimmo Kaski; Fortunato, S. (2015). “Attention decay in science”. Journal of Informetrics 9 (4): 734–745. arXiv :1503.01881 . doi :10.1016/j.joi.2015.07.006 .
^ Mirowski, P. (2011). Science-Mart: Privatizing American Science . Harvard University Press
^ Benessia, A., Funtowicz, S., Giampietro, M., Guimarães Pereira, A., Ravetz, J., Saltelli, A., Strand, R., van der Sluijs, J., 2016. The Rightful Place of Science: Science on the Verge . The Consortium for Science, Policy and Outcomes at Arizona State University.
^ Andrea Saltelli; Jerome R. Ravetz & Silvio Funtowicz (25 June 2016). “A new community for science” . New Scientist (3079). https://www.newscientist.com/letter/mg23030791-600-7-a-new-community-for-science/ .
^ Moonesinghe, Ramal; Khoury, Muin J; Janssens, A. Cecile J. W (2007-02-27). “Most Published Research Findings Are False—But a Little Replication Goes a Long Way” . PLoS Med 4 (2): e28. doi :10.1371/journal.pmed.0040028 . PMC 1808082 . PMID 17326704 . https://doi.org/10.1371/journal.pmed.0040028 .
^ Simons, Daniel J. (2014-01-01). “The Value of Direct Replication” . Perspectives on Psychological Science 9 (1): 76–80. doi :10.1177/1745691613514755 . ISSN 1745-6916 . PMID 26173243 . http://pps.sagepub.com/content/9/1/76 .
^ “Registered Replication Reports - Association for Psychological Science ”. www.psychologicalscience.org . 2015年11月13日閲覧。
^ Chambers, Chris. “Psychology’s ‘registration revolution’ | Chris Chambers ”. the Guardian . 2015年11月13日閲覧。
^ Frank, Michael C.; Saxe, Rebecca (2012-11-01). “Teaching Replication” . Perspectives on Psychological Science 7 (6): 600–604. doi :10.1177/1745691612460686 . ISSN 1745-6916 . PMID 26168118 . http://pps.sagepub.com/content/7/6/600 .
^ Grahe, Jon E.; Reifman, Alan; Hermann, Anthony D.; Walker, Marie; Oleson, Kathryn C.; Nario-Redmond, Michelle; Wiebe, Richard P. (2012-11-01). “Harnessing the Undiscovered Resource of Student Research Projects” . Perspectives on Psychological Science 7 (6): 605–607. doi :10.1177/1745691612459057 . ISSN 1745-6916 . PMID 26168119 . http://pps.sagepub.com/content/7/6/605 .
^ Maxwell, Scott E.; Lau, Michael Y.; Howard, George S.. “Is psychology suffering from a replication crisis? What does "failure to replicate" really mean?” . American Psychologist 70 (6): 487–498. doi :10.1037/a0039400 . http://doi.apa.org/getdoi.cfm?doi=10.1037/a0039400 .
^ IntHout, Joanna; Ioannidis, John P.A.; Borm, George F.; Goeman, Jelle J.. “Small studies are more heterogeneous than large ones: a meta-meta-analysis” . Journal of Clinical Epidemiology 68 (8): 860–869. doi :10.1016/j.jclinepi.2015.03.017 . http://linkinghub.elsevier.com/retrieve/pii/S089543561500164X .
^ a b Button, Katherine S.; Ioannidis, John P. A.; Mokrysz, Claire; Nosek, Brian A.; Flint, Jonathan; Robinson, Emma S. J.; Munafò, Marcus R. (2013-05-01). “Power failure: why small sample size undermines the reliability of neuroscience” . Nature Reviews Neuroscience 14 (5): 365–376. doi :10.1038/nrn3475 . ISSN 1471-003X . http://www.nature.com/nrn/journal/v14/n5/full/nrn3475.html .
^ Greenwald, Anthony G.. “Consequences of prejudice against the null hypothesis.” (英語). Psychological Bulletin 82 (1): 1–20. doi :10.1037/h0076157 . http://content.apa.org/journals/bul/82/1/1 .
^ a b Ioannidis, John P.A.. “Anticipating consequences of sharing raw data and code and of awarding badges for sharing” . Journal of Clinical Epidemiology . doi :10.1016/j.jclinepi.2015.04.015 . http://linkinghub.elsevier.com/retrieve/pii/S0895435615003261 .
^ Lindsay, D. Stephen (2015-11-09). “Replication in Psychological Science” . Psychological Science 26 : 0956797615616374. doi :10.1177/0956797615616374 . ISSN 0956-7976 . PMID 26553013 . http://pss.sagepub.com/content/early/2015/11/09/0956797615616374 .
^ “NWO makes 3 million available for Replication Studies pilot ”. NWO . 2016年8月2日閲覧。
^ “Big names in statistics want to shake up much-maligned P value ”. www.nature.com . 2019年3月14日閲覧。
^ Holcombe, Alex O; Ludowici, Charles; Haroz, Steve (2019-09-06). “Is there a reproducibility crisis around here? Maybe not, but we still need to change.” (英語). Journal of Vision 19 (10): 87a. doi :10.1167/19.10.87a . ISSN 1534-7362 . https://jov.arvojournals.org/article.aspx?articleid=2750252 .
^ Hardwicke, Tom E.; Wallach, Joshua D.; Kidwell, Mallory C.; Bendixen, Theiss; Crüwell, Sophia; Ioannidis, John P. A. (2020-02). “An empirical assessment of transparency and reproducibility-related research practices in the social sciences (2014–2017)” (英語). Royal Society Open Science 7 (2): 190806. doi :10.1098/rsos.190806 . ISSN 2054-5703 . PMC PMC7062098 . PMID 32257301 . https://royalsocietypublishing.org/doi/10.1098/rsos.190806 .
^ Olorisade, Babatunde Kazeem; Brereton, Pearl; Andras, Peter (2017-09). “Reproducibility of studies on text mining for citation screening in systematic reviews: Evaluation and checklist” (英語). Journal of Biomedical Informatics 73 : 1–13. doi :10.1016/j.jbi.2017.07.010 . https://linkinghub.elsevier.com/retrieve/pii/S1532046417301661 .
^ “Search - Consensus: AI Search Engine for Research ”. consensus.app . 2023年12月1日閲覧。
^ Menke, Joe; Roelandse, Martijn; Ozyurt, Burak; Martone, Maryann; Bandrowski, Anita (2020-11-20). “The Rigor and Transparency Index Quality Metric for Assessing Biological and Medical Science Methods” . iScience 23 (11): 101698. doi :10.1016/j.isci.2020.101698 . ISSN 2589-0042 . https://www.sciencedirect.com/science/article/pii/S2589004220308907 .
発展的参考文献
Big names in statistics want to shake up much-maligned P value, Nature.com
1,500 scientists lift the lid on reproducibility, Nature.com
November 2012 special edition of Perspectives on Psychological Science on the issues of replicability and research practices in psychology
Reproducibility in Science: Improving the Standard for Basic and Preclinical Research[ 1]
Social, Behavioral, and Economic Sciences Perspectives on Robust and Reliable Science
Why Most Published Research Findings Are False
Bonett, DG (2012) Replication-extension studies. Current Directions in Psychology 21, 409-412.
Most scientific studies are wrong, but that doesn’t mean what you think it means - The Logic of Science
Article on The Conversation Science in crisis: from the sugar scam to Brexit, our faith in experts is fading, September 26, 2016
関連項目
^ Begley, C. Glenn; Ioannidis, John P. A. (2015-01-02). “Reproducibility in Science Improving the Standard for Basic and Preclinical Research” . Circulation Research 116 (1): 116–126. doi :10.1161/CIRCRESAHA.114.303819 . ISSN 0009-7330 . PMID 25552691 . http://circres.ahajournals.org/content/116/1/116 .