文字サイズ

  • 大
  • 中
  • 小

JST指標サイエンスフロント導出に使用した論文データベースおよび方法論について

2012年5月公開版バックナンバー

論文データベース

  1. Thomson Reuters "Essential Science IndicatorsSM"1999-2009
  2. Thomson Reuters "Essential Science IndicatorsSM"2000-2010
  3. Thomson Reuters "Web of Science®"

サイエンスフロント導出方法論

導出方法

  1. 対象年(2006年~2009年)において、論文データベース1に存在せず、論文データベース2に存在する論文及びその被引用論文数がTOP0.5%にランキングされる論文から任意の2論文を抽出、論文データベース3の論文に共に引用されている数及び任意の2論文が単独で引用されている数を計算
  2. (1.1)より、コサイン係数Nを導出(コサイン係数は、類似度を計測出来る指標の一つである)
    導出式
    a,bは任意の論文を、f(a)、f(b)は任意の論文の被引用回数、f(a,b)は任意の論文が共引用される回数を表している。
  3. N>=0.3(コサイン係数の閾値の設定の仕方には議論があるが、ここでは0.3とした)で対象となるデータベースの全データで被引用数やNを計算。
  4. iiiの条件で抽出された論文をノード、論文と論文の連結関係をエッジで繋いで、ネットワークを可視化した。 (本サイトではグラフを可視化するために、Cytoscape Webというネットワーク化ソフトの一つを使用)
  5. クラスターを構成する論文数:4以上

今回分析対象となった論文は、データベース1作成時には含まれず、その後急速に被引用回数を伸ばしデータベース2の抽出時にTOP0.5%にランキングされた論文である。 よって、2011年時点で急速に展開している科学領域を見ている。

なお、Thomson Reutersが発表しているサイエンスフロントアワードは、5年間の高被引用度論文、TOP1%にランキングされている論文を対象に共引用分析を行っている。 コサイン係数の閾値は0.1(※)、クラスターを構成する論文数が5報以上という閾値を設定している。

※コサイン係数の閾値については、Thomson Reuters RESEARCH FRONT METHODOLOGYを参照。

J-GLOBAL foresight