KEGG|KEGG API 用法详解上篇

【KEGG|KEGG API 用法详解上篇】对于大多数的数据库而言,API接口可以方便的从数据库中检索数据。kegg 数据库的API 链接如下:

http://www.kegg.jp/kegg/rest/keggapi.html
API 其实就是一种约定号的URL 规则,通过特定的URL 返回不同的数据。kegg 的 API 的URL 构成如下:
http://rest.kegg.jp/operation/argument[/argument2[/argument3 …]]
前缀都是 http://rest.kegg.jp, 接下来就是对应的操作,kegg 一共提供了以下7种操作:
  1. info
  2. list
  3. find
  4. get
  5. conv
  6. link
  7. ddi
接下来详细看下每种操作的用法
info 主要用于展示每个数据库共有多少条记录的统计信息和于该数据相关的其他数据库,url 格式如下:
http://rest.kegg.jp/info/database
database = kegg | pathway | brite | module | ko | genome | genes | org | vg | ag | ligand | compound | glycan | reaction | rclass | enzyme | network |
variant | disease | drug | dgroup | environ
示例 : 查看pathway 数据库的基本信息
http://rest.kegg.jp/info/pathway
pathway KEGG Pathway Database path Release 85.0+/03-11, Mar 18 Kanehisa Laboratories 570,005 entries linked db module ko genome compound glycan reaction rclass enzyme network disease drug pubmed

list 列出数据库中所有的记录,或者列出指定条目的记录
对于list 操作,共有3种不同的URL 格式
第一种,查看数据库中所有的记录
http://rest.kegg.jp/list/database
database = pathway | brite | module | ko | genome | org | vg | ag | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | organism | medicus
示例:查看所有ko的信息
http://rest.kegg.jp/list/ko
ko:K00001E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1] ko:K00002AKR1A1, adh; alcohol dehydrogenase (NADP+) [EC:1.1.1.2] ko:K00003E1.1.1.3; homoserine dehydrogenase [EC:1.1.1.3]

第二种,只针对pathway和 module 数据库 ,查看特定物种的信息,格式如下
http://rest.kegg.jp/list/database/org
database = pathway | module
示例:查看human对应的所有pathway 信息
http://rest.kegg.jp/list/pathway/hsa
path:hsa00010Glycolysis / Gluconeogenesis - Homo sapiens (human) path:hsa00020Citrate cycle (TCA cycle) - Homo sapiens (human) path:hsa00030Pentose phosphate pathway - Homo sapiens (human)

第三种,查看数据库中的某几条记录,使用数据库中的标识符进行查找,多个标识符用+ 链接,最多1个URL 中允许查找10个
http://rest.kegg.jp/list/dbentries
dbentries = Entries of the following database
database = pathway | brite | module | ko | genome | org | vg | ag | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | medicus
示例:查看pathway 中 map00010 和 map00040 的信息
http://rest.kegg.jp/list/map00010+map00040
path:map00010 Glycolysis / Gluconeogenesis path:map00040 Pentose and glucuronate interconversions

find find 用于在数据库中根据关键词进行查找, 格式如下
http://rest.kegg.jp/find/database/query
database = pathway | brite | module | ko | genome | genes | org | vg | ag |
ligand | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | medicus
示例:根据关键词 shiga和toxin 查找相关的基因
http://rest.kegg.jp/find/genes/shiga+toxin
ece:Z1464stx2A; shiga-like toxin II A subunit encoded by bacteriophage BP-933W ece:Z1465stx2B; shiga-like toxin II B subunit encoded by bacteriophage BP-933W ece:Z3343stx1B; shiga-like toxin 1 subunit B encoded within prophage CP-933V

关于后面4种操作的用法,我们下一篇进行介绍,今天就到此为止。

    推荐阅读