【翻訳】出版社は学術の記録の管理を維持できるか?(2023.1.25)

ScholarlyKitchen.png

【翻訳】出版社は学術の記録の管理を維持できるか?(2023.1.25)

原文:Can Publishers Maintain Control of the Scholarly Record?
        by Danielle Cooper, Oya Y. Rieger, Roger C. Schonfeld (Jan 6, 2021)
翻訳:特定非営利活動法人UniBio Press

ジャーナル・ブランドは、学術出版社の偉大な無形資産であることが証明されています。ジャーナル・ブランドは、著者や読者に信頼と権威を示すものです。そのため、図書館が個別のタイトルではなくバンドルのライセンスを取得するようになり、ユーザがプラットフォームを通じてコンテンツを発見してアクセスするようになっても、出版社は、カスケードや著者のワークフロー統合などを通じて、ジャーナル・ブランドを守り、それを拡張するために懸命に努力してきました。通常、出版社が独占的に管理している学術の記録としての版(version of record)は、このジャーナル・ブランドを守るための手段となってきました。しかし、あちらこちらで、出版前登録、データセット、プレプリント、ソースコード、プロトコルなど、学術の記録(scholarly record)を構成する他の要素への関心が高まっているため、学術の記録としての版の重要性は相対的に低下しています。今後、学術の記録がどのように構造化され、誰がその所有権と管理権を持つことになるのかという点で、本当の意味での緊張関係が生まれてくることが予想されます。

出版社が学術の記録としての版以外の研究資料をサポートすることにより、ジャーナル・ブランドの影響力と価値を拡大しようとする際、どのような機会と課題があるのでしょうか?プレプリントと研究データの進化の背景を掘り下げることで、貴重な手がかりを得ることができるでしょう。

thunderstorm
Martin Johnson Heade作「近づきつつある雷雨」1859年(メトロポリタン美術館蔵

プレプリント

プレプリントは本来、学術コミュニケーションの領域にとって有益なものでもなければ、確立された出版ネットワークにとって脅威となるものでもありません。Oyaが分析しているように、プレプリント・サービスは、競争の激しい情報環境の中で信頼を築き、持続可能なビジネスモデルを構築するための様々な政策課題に直面しています。

プレプリントの1つの源流、および、このフォーマットの元々の動機は、研究コミュニティ間の非公式な共有ネットワークにあります。arXivはこのモデルのよく知られた例で、高エネルギー物理学から始まり、物理学や数学などの様々な隣接する分野に拡張しています。SSRNは、ビジネスや法律に焦点を当てた同様のアプローチから始まりました。これらのサービスは、それらがカバーする分野の学術的コミュニケーションのためのコミュニティ基盤の重要な構成要素となりました。当初、出版社はこれらのプレプリント・コミュニティが、その発展の仕方によっては潜在的な競争相手になる可能性があることを認識し、不安を抱えながらも、プレプリントとコミュニティと休戦状態に入りました。

最近では、OyaとRogerがこの春に分析したように、プレプリントに対する新たなビジョンが現れてきており、特に主要な商業出版社のすべてがそれを追求しています。この新しいモデルでは、出版社はプレプリントを推進していますが、同時にプレプリントを飼いならすことにも取り組んでおり、自らの論文投稿のワークフローの中にプレプリントを取り込み、プレプリントと学術の記録としての版をリンクさせることで、前者が後者を混乱させる力を時間の経過とともに弱体化させています。プレプリントの位置づけをグローバルな研究コミュニティの一部としてではなく(例えば,高エネルギー物理学の場合のように)、代わりにジャーナル・ブランドと直接リンクさせることで、出版社はこれまでジャーナルが提供してきた価値を高めることを期待しています。このビジョンは、arXiv や bioRxiv のようなコミュニティベースのプレプリント・サービスが、研究の早期共有を正式な出版段階から切り離して、著者が発見したことを特定のジャーナルだけに関連付けることを避けることによって、出版社に依存しないプラットフォームを提供する力と何らかのかたちで調和していくのか、あるいは時間が経つにつれてそれを妨げるようになるのでしょうか。それはまだわかりません。

研究データ

どちらかと言えば、研究データの状況はプレプリントのそれよりも複雑です。研究データは、ドメイン固有の構造、機関横断的な一般的な構造を持ち、そして機関による投資が増えつつあります。また、データセットの発見や、研究者のアイデンティティに関連付けられたレコード内のデータセットの取得のために開発された、興味深い新しいモデルもあります。

研究データの状況は現在、膨大な数のドメイン固有のリポジトリによって特徴づけられています。これらの多くは、Danielle氏が研究者主導のデータコミュニティと呼んでいるものから新たに発展したものであり、ある種のデータを、通常は学問分野や機関の境界を越えて共有するものです。データコミュニティの中には、何十年にもわたって存続するものもあれば、特定の研究の方向性や社会的なニーズに応じて、すばやく生み出され、あっという間に消えていくものもあります。Ithaka S+Rは、確立したデータコミュニティと新たに生まれつつあるデータコミュニティのいくつかを紹介してきました。研究者は、データとそれを利用する研究者との間に密接な関係を維持することの重要性を認識し、可能な限り特定のドメインのリポジトリを利用するのが一般的です。

機関別のデータリポジトリは、研究者がデータを預けるための主流のリポジトリとなっているわけではありませんが、個々の大学では、管理データと研究データの両方のデータセキュリティと企画に準拠したストレージ、およびその他の機関別研究データサービスに対する機関のニーズに対応するための投資が増えつつあります。こうした機関モデルは、プレプリントの要因とはなりにくいものです。また、米国の Data Curation Network やカナダの Portage のように、情報科学者の専門知識とリーダーシップによって、機関横断的にデータキュレーションサービスを提供しようとする動きもあります。

多くの出版社は、研究データ共有の重要性が高まっていることを痛感しています。2020年は、結局のところ、データの年でした。しかし、出版社は、研究データが自社のビジネスにとって意味のあるものになるかどうかを理解するのに苦労してきました。研究データを取り巻く環境には、有名な汎用リポジトリが数多く存在し、その中には出版社が所有しているものもあります。出版社のインフラストラクチャーは機関と学問分野を横断する大規模なものであり、出版社のワークフローとの連携が可能であることを考えると、汎用リポジトリと密接に連携することは理にかなっています。しかし、これまでのところ、プレプリントやそこから価値を引き出す他のメカニズムのように、出版社固有のサービスやワークフローに研究データを組み込むモデルを追求しているところはほとんどないように思われます。おそらくこれは、研究データセットが、プライバシーやその他の倫理的な要因からメタデータの記述や標準化に至るまで非常に複雑なものであり、長い間冷笑されつつも未だに使い続けられているPDFよりもはるかに扱いが難しいものであることを、出版社がよくわかっているからだと思います。

新たな戦略的方向性のひとつとして、出版社はデータ共有のコンプライアンスを確保することに重点を置くようになってきています。DataSeerAIは、出版社がこの分野でより良いサービスを提供するためのツールを構築できる有望な例です。もう一つのアプローチは、データ共有ポリシーをより厳格に管理することですが、これは一部の出版社が特定のリポジトリ選択基準の提唱に関与していることからも明らかです。COAR はこの動きに対して批判的な意見を述べており、出版社がデータリポジトリのコンプライアンスの基準を設定することで、 自社の商業的な、汎用志向の製品だけが満たすことができる基準を特権化することが可能になると主張しています。

それに対して、データコミュニティと強力なパートナーシップを構築している出版社は少なく、データコミュニティを可能にしたり、支援したり、 サービスを提供したりするためのモデルを特定している出版社はさらに少なくなっています。このような点で、出版社の中では、データコミュニティやその他の関連する研究記録を出版物と結びつけることができるという点で、学会が優位に立っている可能性があります。一部の出版社が汎用のリポジトリを好み、リポジトリの選択基準をより厳しく管理しようとしている傾向も、データコミュニティの広範な発展を促進するのには役立たず、研究者コミュニティがデータ共有が自分たちにとってどのように有用であるかを定義し、定義する際に主導権を握る必要があることを考えると、それを阻害することになる可能性があります。Brian Nosek氏はまた、データ共有を出版社の利益と強く絡めすぎると出版バイアスを悪化させる危険性があり、反対にデータ共有へのより自由なアプローチをとることで、研究者が結果に関係なくデータを共有することを奨励することになると指摘しています。

将来の予測

プレプリントと研究データセットという双子の例が示すように、学術の記録は細分化されつつあります。出版社はプレプリントを自社のワークフローや価値提案に統合する努力をしていますが、それが成功するかどうかはまだわかりません。研究データをどのように統合するかについては、出版社は確たる見通しを持っていないようですが、プレプリントに比べると、データセットが出版された論文に直接対応していないことを考えると、このことは理解できます。

ワークフローの観点から他の研究成果物に真に関与するためには、出版社は学術の記録としての版と他の成果物との二者間の接続に投資するだけでなく、 研究者、研究室や他の研究チーム、そしてより広く研究コミュニティとのネットワークを構築する必要があります。大手出版社の多くは、研究のスコープや分野に特化した深みをもっていないので、このようなプロジェクトに乗り出すのは難しいと思われます。ホワイトラベルサービスが必要なのかもしれません。

出版業界にとっては、この細分化が課題となっているようです。出版業界の統合や利益率に関心を持っている人たちは、この課題にチャンスを見いだすかもしれません。非現実的かもしれませんが、ひとつの思考実験として、この細分化を促進するために大規模な投資を行うことは、どのように見えるだろうか。研究コミュニティを管理することに関心のある学会やその他の関係者は、学術の記録のリファクタリングを促す方法を見つけることができるでしょうか?

Danielle Cooper
Danielle Cooperは、Ithaka S+Rのコラボレーションとリサーチ部門のマネージャーで、高等教育における情報の実践がどのように進化しているかを中心に研究しています

Oya Y. Rieger
Oya Y. Riegerは、Ithaka S+Rの図書館・学術コミュニケーション・博物館チームのシニアストラテジスト。研究図書館におけるコレクションのあり方の再検討、学術的記録へのアクセスと保存の確保、オープンソースソフトウェアとオープンサイエンスの可能性を探るプロジェクトの指揮を執っています。

Roger C. Schonfeld
Roger C. Schonfeldは、Ithaka S+Rの図書館、学術コミュニケーション、およびミュージアムのディレクター。研究、学習、保存を促進するために、図書館、出版社、博物館を横断して、証拠に基づく革新とリーダーシップを推進するための調査を実施し、助言サービスを提供する主題と方法論の専門家とアナリストのチームを率いています。以前は、アンドリュー・W・メロン財団のリサーチアソシエイトを務めていました。

(著作権に関する注意書き)

本記事の原文の著作権は、著者が保持しています。著者は、SSP(Society for Scholarly Publishing)に対して、本記事をあらゆる言語で世界中に配布する権利を許諾しています。UniBio Pressは、SSPから許諾を得て、本記事を日本語に翻訳し、本サイトに掲載しています。