当前在线人数7805
首页 - 分类讨论区 - 学术学科 - 生物学版 -阅读文章
未名交友
[更多]
[更多]
文章阅读:小教程:从基因组数据到功能
[同主题阅读] [版面: 生物学] [作者:Farland] , 2013年09月13日16:20:23
Farland
进入未名形象秀
我的博客
[上篇] [下篇] [同主题上篇] [同主题下篇]

发信人: Farland (一杯茶), 信区: Biology
标  题: 小教程:从基因组数据到功能
发信站: BBS 未名空间站 (Fri Sep 13 16:20:23 2013, 美东)

很多朋友拿到芯片或二代测序结果(Microarray, RNA-Seq, ChIP-Seq, etc)后, 第一
个问题通常是“在我的实验中那些变化的基因有什么功能?”其实有很多工具可以解决
这个问题,但大多数生物学家仍需要很多帮助。所以我写了这个简单流程,希望对大家
有帮助。也欢迎高手指正并介绍其它好工具。
英文版链接:
http://goo.gl/ZlprLJ
步骤1 。原始数据分析

大多数时间,你拿到结果时会有基本的分析文件列出所有基因的表达值。
如果你只有原始数据,那么需要用相应软件处理。比如: GCRMA/RMA 分析表达芯片,
Homer/MACS分析 ChIP-Seq,  Cufflink/RSEM 分析RNA-Seq.

步骤2。筛选差异表达基因

经常你会看到结果中有Fold Change (或  log Fold Change), P-value, FDR (或
adjusted P-value 或 Q-value).  如果没有,你可以使用limma来分析芯片,用DeSeq,
EdgeR, 或CuffDiff来分析RNA-Seq.

筛选基因时我建议用Fold Change大于2 和FDR小于0.05。你可以调节临界值获得不同数
量的基因。 你可以用Excel 做这一步,或者用更先进的工具比如BxGenomicDB来轻松地
测试不同的筛选条件。
http://goo.gl/ptK899

如果筛选得到很多基因,你可以用变化量(Fold Change)选最显著的基因 (比如
Top100 out of 1000 genes)。 有时Top基因的功能更清楚。
如果筛选得到很少几个基因,可能是变化较小,或者你样品重复不够。先不要放弃,你
可以用一个比较宽松的临界值(FDR< 0.2 ,或只是使用P-value)来找出TOP几十个基
因。 记住你可能需要额外的证据(Array, NGS,或Q- PCR )来验证你的结果。

步骤3。确定功能

这步的基本思路是寻找在你从第二步得到的基因列表中富集的功能类别。富集的意思就
是在你的基因列表中出现频率大大高于背景(通常为基因组中的所有基因)。功能类别
常见的有Gene Ontology(生物过程,分子功能,细胞成分),KEGG通路, INTERPRO蛋
白domain等. 
有很多工具来找富集的功能,大概最流行的网上工具是DAVID
http://david.abcc.ncifcrf.gov/
BROAD的 GSEA (http://www.broadinstitute.org/gsea/‎)近年也很流行,但它目前仅可作为离线工具而且要化些时间熟悉。DAVID比较好用,把你的基因列表拷贝到网上就行。DAVID认得各种ID, 功能类别数据库也很全。从富集分析得到的结果一般是功能根据P-value或FDR排名。这里有一个从基因列表到DAVID分析的逐步流程。
http://goo.gl/OnHouD

如果你的基因列表很长(例如1000个或更多),你可以使用整个列表,但也可试试变化
最大的TOP基因 。 TOP100-300基因有时会给你一个更清晰的画面。如果您的基因列表
是非常小的( 〜10) ,你可能不会得到任何显著的富集功能。尝试步骤2中用
比较宽松的临界值以得到更多的基因(至少30〜50 ) 。

当你有一组很好的数据时,你会看到许多富集功能。但经常很多都是相似的功能重复很
多遍。幸运的是,DAVID有个Functional Annotation Clustering功能自动合并和显示
类似的注解,这使得生物功能更清晰,更集中。我强烈推荐这个工具。http://goo.gl/NpxG7l

最后,介绍了一个我们开发的功能富集在线工具。你只要把基因列表拷贝上就行。这个
工具除了分析常见的功能类别外,还包括GSEA用到的Molecular Signatures Database
(MSigDB)。如果你懒得学GSEA, 这个工具可以把你的基因列表和MSigDB做比较。
http://goo.gl/4AFZRo




--

※ 修改:·Farland 於 Sep 13 16:25:56 2013 修改本文·[FROM: 144.]
※ 来源:·WWW 未名空间站 海外: mitbbs.com 中国: mitbbs.cn·[FROM: 144.]

[上篇] [下篇] [同主题上篇] [同主题下篇]
[转寄] [转贴] [回信给作者] [修改文章] [删除文章] [同主题阅读] [从此处展开] [返回版面] [快速返回] [收藏] [举报]
 
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996