Day11-生信人的20个R语言习题第5题-2019-06-20

5.理解toTable的用法 【Day11-生信人的20个R语言习题第5题-2019-06-20】原是描述:理解 head(toTable(hgu95av2SYMBOL)) 的用法,找到 TP53 基因对应的探针ID。

#先看一下hgu95av2SYMBOL是什么 ?hgu95av2SYMBOL # hgu95av2SYMBOL is an R object that provides mappings between manufacturer identifiers and gene abbreviations. 大致意思就是说,hgu95av2SYMBOL是一个R对象,它描述厂家的标记符(identifiers)与基因缩写之间的映射关系。

###### 再看一下toTable的用法 ?toTable These methods are part of the Bimap interface (see ?Bimap for a quick overview of the Bimap objects and their interface). #大致意思是说,toTable是一种能够以数据框的形式来操作一个Bimap对象的方法,也就是把Bimap对象转换为一个数据框,这些方法是Bimap interface方法的一部分。Bimap指的是一种映射关系,例如探针的编号与基因名称之间的映射,如下所示:

summary(hgu95av2SYMBOL) # 查看hgu95av2SYMBOL大致信息 # SYMBOL map for chip hgu95av2 (object of class "ProbeAnnDbBimap") # | #| Lkeyname: probe_id (Ltablename: probes) # |Lkeys: "1000_at", "1001_at", ... (total=12625/mapped=11471) # | #| Rkeyname: symbol (Rtablename: gene_info) # |Rkeys: "A1BG", "A2M", ... (total=59682/mapped=8595) # | #| direction: L --> R gene_id <- toTable(hgu95av2SYMBOL) head(gene_id) #这是一个数据框 # probe_idsymbol # 11000_atMAPK3 # 21001_atTIE1 # 3 1002_f_at CYP2C19 # 4 1003_s_atCXCR5 # 51004_atCXCR5 # 61005_atDUSP1 str(gene_id) # 'data.frame': 11471 obs. of2 variables: #$ probe_id: chr"1000_at" "1001_at" "1002_f_at" "1003_s_at" ... # $ symbol: chr"MAPK3" "TIE1" "CYP2C19" "CXCR5" ... filter(gene_id,symbol=="TP53") # 找到 TP53 基因对应的探针ID # probe_id symbol # 11939_atTP53 # 2 1974_s_atTP53 # 331618_atTP53 library(dplyr) filter(gene_id,symbol=="TP53") # 找到 TP53 基因对应的探针ID # probe_id symbol # 11939_atTP53 # 2 1974_s_atTP53 # 331618_atTP53

    推荐阅读