論文も“探されやすさ”が必要!ジャーナルに効くSEOのお話

こんにちは、ジャーナルサポート担当の竹下です。
今回はジャーナルの「SEO対策」をテーマにお届けします!
「SEO対策」といっても一般的な検索エンジン向けの対策ではなく、ジャーナルの世界ではちょっと変わった対策が必要になります。ご存知の方も多いかと思いますが、ぜひ最後までご一読ください。
例えば皆さんは通販サイトでどのように商品を探しますか?論文の検索を支えるデータ形式「XML」全文XMLがもたらす、論文の「見つけやすさ」と「読まれやすさ」検索精度の向上翻訳のしやすさ全文XML化によるアクセス数増加の実例全文XMLデータによる全文HTML公開のすゝめ
例えば皆さんは通販サイトでどのように商品を探しますか?
楽天やアマゾンなどのネット通販を利用するときに、皆さんはどのように商品を探しますか?
目的の商品が決まっていれば楽天などのサイト内で直接検索するかもしれませんが、幅広く商品を探したいときはきっとGoogleなどで検索して、表示された検索結果から直接その商品ページを訪問することも多いでしょう。
このような行動が成り立つのは、それぞれの通販サイトがサイト内検索だけでなく、Googleなどの検索エンジンでも探しやすくなるようにサイト構成やプログラム記述(HTMLなど)を工夫しているからです。
これが通販サイトなどでの「SEO(Search Engine Optimization)対策」となります。
論文を探すときも同様で、各ジャーナルサイトを検索するのではなく、Google Scholar、Web of ScienceやScopus、そして大学機関などではOPACや各種ディスカバリーサービスを利用し、そこから直接該当する論文を読むことが多いのではないでしょうか。
…と、ここでちょっと考えてみましょう。なぜ、これらの外部のサービスから的確に論文を探すことができるのでしょうか?
論文の検索を支えるデータ形式「XML」
じつはJ-STAGEなどの電子ジャーナルプラットフォームでは、掲載されている論文が様々な学術検索サービスから発見されやすくなるように、XMLというデータ形式で情報を提供しつづけています。

XMLはデータの意味や構造を明確にするデータ形式のため、検索エンジンが読み取りやすく、結果として論文の「探されやすさ」が向上します。
また、XMLには提供される情報によって大きく2種類の形式があります。
ひとつは「ジャーナル名・巻/号/ページ・論文タイトル・著者名・要旨(アブストラクト)」等の最低限の情報をXML化したもの、これを「書誌XML」といいます。もうひとつは上記「書誌情報」に加えてさらに、論文の全文情報をXML化した「全文XML」です。
全文XMLがもたらす、論文の「見つけやすさ」と「読まれやすさ」
論文を全文XML形式で提供することによって、「見つけやすさ」と「読まれやすさ」の2つのメリットがあります。
検索精度の向上
「書誌XML」だけの提供ですと検索対象となる情報量が限られてしまいます。「全文XML」を提供することにより、論文全体が検索対象となるため、さらに精度の高い検索が可能となり、論文の「見つけやすさ」につながります。
翻訳のしやすさ
J-STAGEなどで「全文XML形式」で記述された論文を登載することで、PDFダウンロードをしなくても論文の全文がサイト上に表示されるようになります。これを「全文HTML公開」といいます。
これによりJ-STAGEなどのサイトに表示される論文を「日本語から英語に」「英語から日本語に」といった具合に自動で翻訳表示が可能となります。
もしも「書誌情報」だけがサイトに表示され、「本文情報」は添付されたPDFにしかない、という状態ですと、こうした自動翻訳の恩恵をうけることはできないのです。
「英語の論文を日本語で読みたい日本の研究者」や「日本語の論文を英語や中国語で読みたい海外の研究者」のニーズを満たすためにも、「全文情報」がサイト上に表示されていることが「ジャーナルの国際情報発信強化」にとっても、とても大切なこととなります。
これが論文の「読まれやすさ」につながるメリットです。
全文XML化によるアクセス数増加の実例
2024年のJ-STAGEセミナーに参加した際に、「天理医学紀要誌の全文XML化に対する取り組み」という講演がありました。J-STAGEで公開している天理よろづ相談所が「天理医学紀要」を全文XMLで公開するにあたっての取り組みが紹介されていました。
そのなかで全文XML化した2021年から海外も含めてアクセス数が増加したとの報告がありました。セミナー報告書にも記載されていた以下の図をみると明らかですね。

全文XMLデータによる全文HTML公開のすゝめ
ここまでお伝えしてきた通り、せっかく公開する論文を「探されやすい」ものにするためには全文XMLデータによる全文HTML公開がおすすめです。
また、J-STAGEでは2024年5月に中長期戦略が改訂され、その中に「我が国の電子ジャーナルの基本的機能の開発及び維持」の中にXML化について記載があり、「J-STAGEがXML形式を基礎とする機械可読なジャーナル出版のプラットフォームとなるように」というところからも、全文XML化を目指す方針が読み取れます。
とはいえ、全文XMLの作成はXMLの知識が必要になり、J-STAGEのJATS形式にそって記述する必要がありますので、1から作成するのはとても大変です。
アトラスでは2008年から論文公開に必要なデータを作成し、J-STAGEやPMCのジャーナルサイトに公開するサービスをおこなってきておりました。
また、2019年からは、著者最終稿からPDFファイルと全文XMLデータを作成し、J-STAGEでの全文HTML公開まで実施する「ジャーナル公開支援サービス」をおこなっていますので、XMLデータ作成に関してご支援させていただくことも可能です。
それでは次回のお役立ちコラムもお楽しみに~~
当コラムについて
「IT×学術」で研究者を支援する株式会社アトラスが運営する当コラムでは、学会運営に関するお役立ち情報を発信中!
「学術大会」「会員管理」「ジャーナル」という重要度の高い3つのカテゴリを軸に、学会運営に関わるすべての方の疑問やお悩みを解消することを目指しています!
詳細はこちら