【ポエム】どうして僕がOpen Scienceをやるのか。
こんにちは。
この記事は、「Open and Reproducible Science Advent Calendar 2019」の3日目の記事です。そして、ポエムです。
気分を害したくないなら、読まない方が身のためです。
じゃあ、早速ポエムを始めましょうw
僕がOpenScienceを行う理由。
それはとても簡単です。僕は統計ができないからです。
だから、私は常にOpenScienceに大きな関心と注意を注いでいます。
現在、僕は心理統計学を研究しています。学部3年のゼミから"専攻"していますので、だいたい、学習歴は6年ぐらい?ですかね。
6年といえば、小学校に在籍する期間と一緒です。
ただ、それだけ学習しても(心理)統計はさっぱりわかりません。
僕の人一倍の要領の悪さといい加減な学習方法が、この原因だと思っています。
ただ、さすがに6年も専門的にやっているので、
心理学研究を行っている母集団の中では、ほんとにほんとにほんの少しだけ統計がわかるかもしれません。
だけど、やはり統計学を専攻している、所謂、理系の皆様よりはるかに統計ができません。
唯一の救いはわからないことを知っていることです。
だから、僕はOpenScienceを行うことを心がけています。
その理由、ちゃんと説明していきます。
ここからの話は、特に心理学研究を想定しています。
(量的/定量的/データを用いた)研究を行う上で、統計学及び、それに関連する知識は必須です。絶対にこれから逃れることが出来ません。
これは、理論・応用研究を問わずにそうです。
上でいう、統計学に関連する知識とは、
たとえば、
- 機械学習の知識
- 因果推論の知識
などが該当するのかなと思っています。
場面にもよりますが、
僕は、(心理学に問わず)社会科学を研究する上では、これらの知識は絶対に必須だと考えており、完璧に漏らすことなく知っている必要があると考えています。
あたりまえですが、そんなの無理です。全知全能の神でも無い限り。
少し大げさに書きました。*1
僕には、これが不可能だからOpenScienceを行います。
OpenScienceは、統計学のできない僕みたいなのこそ、
真っ先に身につけ、実践すべき研究法です。
ここで改めて、OpenScienceとは何かを考えます。
研究全体もしくはその過程を可視化することがOpenScienceです(正確な定義ではないかもしれませんが)。
僕がOpenScienceに関して、真っ先に思いつくのが、研究で収集、分析したデータの公開です。みなさんも同じものを想像したかもしれません。
ただ、これだけがOpenScienceではありません。
- 調査・実験に至るまで
- 方法(データ収集、手順の詳細)
- 解析手法(論文に載せていないものも含む)
- 等々
上記を正確に記述し、公開することもOpenScienceの一つだと思います。
これに実施することによって、科学は発展します(と考えています)。
少なくとも、科学の流れを止めません。止めるのがどうかみたいな話はしません。
たとえば、
僕は、OpenScienceの作法に則って、データを集め、解析Aを行い、論文を書きました。
しかし、統計学マスターの謙介さん(仮名)*2が、論文を読んだところ、今回の実験に関して、(解析Aでも間違っていないが)解析Bがより適していることに気付きました。
※この状況では、実際、解析Bを行うことがより正しい、わかることが多いとします。
ここで、僕がOpenScienceに取り組んでいなければ、 科学の発展は終わりです。少なくとも停滞します。
- 僕がOpenScienceに取り組んでいることによって、
- 謙介さん(仮名)*3が、同様の手順でデータを取り直すことができ、解析Bを行うことができる
- もしデータが公開されているならば、データを取り直すことなく解析Bをその場で実行することができる
というように、僕よりも遙かに優秀な人が効率的に科学を発展させる(社会をより良くする)ことにつながるのです。
もちろん、ここで僕もOpenScienceの作法に則り、貴重な研究基礎を提供したので、このようなコミュニティでは評価されることにつながると思います。
一方で、
- 僕がOpenScienceに取り組んでいなかった場合、
- 謙介さん(仮名)*4が、僕の論文同様の手順でデータを取ることが出来ないかもしれない*5。これによって、解析Bが出来たとしても、その結果と元論文の分析Aの結果を比較可能なのか?という問題も出てくる可能性がある。
というように、僕がOpenScienceを取り組んでいないがために、先ほどよりも研究の発展が難しくなるかもしれません。ここで、私は謙介さん(仮名)の先行研究になり得ていますが、謙介さん(仮名)がOpenScienceの作法に則って研究を行い、解析Aと解析Bを行った場合、そちらの研究の方がより研究貢献をしているような気がします*6。
従って、
僕がOpenScienceの作法に則り、研究を行えば、今後の誰かの研究の大きな一歩につながるかもしれないということです。そして、自分の研究がその研究に大きく貢献する可能性があるということです。
少し話しが逸れますが、
心理学の分野によってはOpenScienceが行いにくい分野ももちろんあります。
これには様々な理由が考えられますが、
- プライバシーの観点からデータ・手順を公開しにくい
- 古くからの慣習
- 大御所のおっさんが認めてくれない(多分あとで怒られる)
1.は臨床の分野だと多いかもしれませんね。そして、それを理由にOpenScienceを避けているのをたまに見たような気がしますが、あれは夢だったかもしれません。
まだ、心理学領域でほぼ語られていませんが、データを匿名化する方法はたくさん存在し、これらの方法を用いれば、たとえ臨床心理学で使われるような秘匿性の高いデータでも公開できるかもしれません。
また、医療系では既に匿名化を行うことでカルテ等のデータを共有することを考えているという話も聞いています。
おそらく、2-3年の内に(臨床)心理学でも匿名化の話が出てくると思います。*7
ここまで書いてきたことを踏まえたうえで、
僕は、統計はできないけど(から)、OpenScienceは行います。