文字サイズ

  • 大
  • 中
  • 小

生物種とOmics研究の相関

オミックス(Omics)とは、「生体分子の情報は、そのすべてにおいて有限であると考えられ、それらを網羅的に収集・解析するアプローチ」参1)である。
ここでは、オミックス研究における近年の動向を階層別、生物種別に把握するため、2種類の論文データベースEssential Science Indicators(ESI)参2)およびScopus参3)を用いて、それぞれ論文数と1論文あたりの被引用回数を算出した。
ESIの収録データを用いることで、被引用回数がトップ1%に入る注目論文群にのみ限定した研究動向を把握することが期待でき、Scopusの収録データを用いることで、世界中で発行されている論文の動向を広く捉えることが期待できる。また今回、性格の異なる2つのデータから算出した結果を並べて示すことにより、傾向の違いの有無についても確認できるようにした。

参1)
林﨑良英. "オミックス研究の現状と展望
(http://www.spc.jst.go.jp/hottopics/1006genome_biofunctional_analysis/r1006_hayashizaki.html)". Science Portal China. 科学技術振興機構.
参2)
Thomson Reuters "Essential Science IndicatorsSM"(ESI)
http://ip-science.thomsonreuters.jp/products/esi/
Thomson Reutersの論文データベース(Web of Science)に収録されている直近10年間の論文データから被引用回数トップ1%の論文を抽出したもの。
本コンテンツのデータ利用範囲:2008年~2012年
参3)
Elsevier B.V. “Scopusカスタムデータ”
http://www.elsevier.com/jp/online-tools/scopus
本コンテンツのデータ利用範囲:2008年~2012年
参4)
ESIの被引用回数は、2012年12月末時点、Scopusの被引用回数は2013年12月末時点のデータで計算。

まず初めに、オミックス研究を次の9つの階層に分類し、それぞれの検索語を定めた。

階層検索語
(ⅰ)フィジオーム、フェノーム、フェノミクスphysiome + phenome + phenomics
(ⅱ)インタラクトームinteractome
(ⅲ)メタボローム、メタボロミクスmetabolome + metabolomics
(ⅳ)グライコーム、グライコプロテオームglycome + glycomics + glycoproteome + glycoproteomics
(ⅴ)プロテオーム、プロテオミクスproteome + proteomics
(ⅵ)トランスクリプトーム、トランスクリプトミクスtranscriptome + transcriptomics
(ⅶ)エピゲノム、エピゲノミクスepigenome + epigenomics
(ⅷ)メタゲノム、メタゲノミクスmetagenome + metagenomics
(ⅸ)ゲノミクスgenomics

次に、これら9つのオミックスと掛け合わせる4つの生物種を選定し、検索語を定めた。

生物種検索語
(a)微生物microorganism + microbial + yeast + bacteria + fungi
(b)植物plant + Arabidopsis + oryza + wheat + lotus + maize + Zea mays
(c)動物animal + Planaria + urchin + paramecium + silkworm + mouse + rat + Xenopus + oryzias + ascidian + drosophila + monkey
(d)ヒトhuman + mammalia

その上で、2つの論文データベースを用いて論文タイトルとアブストラクトにそれぞれの検索語が含まれている論文を抽出し、最近5年間(2008年-2012年)における論文数と1論文あたりの被引用回数を算出し、ヒートマップで示した。
円の大きさは論文数、円の濃さは1論文あたりの被引用回数を表している。
例えば、小さくて色の濃い円は、論文数は少ないが1論文あたりの被引用回数が高い領域であることを示し、大きくて色の薄い円の場合は、論文数は多いものの1論文あたりの被引用回数はそれほど高くない領域であることを示している。

また、マップの左側(青のヒートマップ)の表示はESIで算出した結果、右側(赤のヒートマップ)の表示はScopusで算出した結果である。
すべてのマップは、プルダウン機能を使って2008年から2012年までの5年間の範囲で集計年を変更することができる。
マップ上の円にマウスオーバーすると、対象論文の抽出に用いた検索語や数値を確認することができ、これらの検索語や数値はCSVダウンロードボタンからエクスポートすることもできる。

論文数・1論文あたりの被引用回数

DB: ESI
集計年
DB: SCOPUS
集計年
現在マップ表示されているデータをCSV形式で保存します

出典

Thomson Reuters "Essential Science IndicatorsSM"および、Elsevier B.V. “Scopusカスタムデータ”を基に、JST J-GLOBAL foresightにて情報事業が集計

解説

このヒートマップは、縦軸にオミックス階層、横軸に生物種を置き、該当する論文の数を円の大きさで、1論文あたりの被引用回数を円の色の濃さで示したものである。
これにより、論文数からはオミックス研究の盛んな領域を、被引用回数からはオミックス研究の中でも近年特に注目されている領域を階層別、生物種別に把握することができる。

左側(青色)のヒートマップ【ESIで算出】

最近5年間(2008年から2012年)において、被引用回数トップ1%に入る注目論文群に限定した場合、論文数が最も多い領域は、「(ⅸ)ゲノミクス×(d)ヒト」(論文数:229)である。
またゲノミクスを除いた場合、最も発表論文数の多い領域は「(ⅵ)トランスクリプトーム、トランスクリプトミクス×(b)植物」(論文数:98)の領域である。

1論文あたりの被引用回数が最も高い領域は「(ⅶ)エピゲノム、エピゲノミクス×(a)微生物」(1論文あたりの被引用回数:251)である。また次に高い領域は「(ⅶ)エピゲノム、エピゲノミクス×(b)植物」(1論文あたりの被引用回数:133.1)となっている。ただし、これらの領域は円の大きさが示すように論文数がそれほど多くないため、ある特定論文の被引用回数の影響を大きく受けていることに留意する必要がある。

右側(赤色)のヒートマップ【Scopusで算出】

最近5年間(2008年から2012年)において、世界で発行される論文を広く対象とした場合に論文数が最も多い領域は、「(ⅴ)プロテオーム、プロテオミクス×(d)ヒト」(論文数:4,179)である。

1論文あたりの被引用回数が最も高い領域は、ESIでの算出結果と同様、「(ⅶ)エピゲノム、エピゲノミクス×(a)微生物」(1論文あたりの被引用回数:38)となっている。また、次に高い領域も「(ⅶ)エピゲノム、エピゲノミクス×(b)植物」(1論文あたりの被引用回数:27.3)と、ESIと同様の結果となっている。

エクスポートしたデータの活用例

CSVダウンロードボタンからデータをエクスポートすることにより、様々な閾値で領域を観察することができる。
下記の表は、最近5年間(2008年から2012年)の論文数と1論文あたりの被引用回数がともに中央値以上である領域(黄色セル)を洗い出し、ESIとScopusでの傾向の違いを見た例である。
ESIで算出した場合、論文数と被引用回数がともに中央値以上である領域が「植物」には存在しない一方で、Scopusで算出した場合には「動物」の領域に中央値以上の領域が存在していないという傾向のちがいがあることがわかる。

paradigm
J-GLOBAL foresight