米国立衛生研究所 (National Institutes of Health, NIH)はこのたび、2008年7月以降のPubMed Central(PMC)収録論文30万件について、テキストマイニング可能なXMLあるいはプレーンテキスト形式でのパッケージでのダウンロードが可能となったと発表した。
テキストマイニング可能なのはテキストのみで、図、表などは含まれない。
[ニュースソース]
NIH Manuscript Collection Optimized for Text-Mining and More - NLM 2015/12/4