About 59

博客内所有文字、录相及图片,除声明转载外,本人拥有此博客内所有资料的版权。未经本人的明确许可,任何人不得复制或者转载或者制作镜像。如需授权,请以留言的形式与本人取得联系。

如果想留下你的博客(主题必须与生物信息,统计,计算机等相关),请留言。

友情链接

59 thoughts on “About

  1. Reply gao shan 4月 29,2011 8:46 上午

    您好,我是高山,在堪萨斯大学做博士后,在您百忙之中打扰,其实就是想邀请您加入我们的讨论群。该群建立在http://groups.google.com/group/chinese-bioinformatics,有时打不开,可以去google搜索一下,就可以找到链接。也可以直接发信到chinese-bioinformatics@googlegroups.com,所有人都可以看到。
    您的通信方式是我通过bioinformatics各类会议搜集的,如果您觉得不妥,可以回信,我立刻删除,以免日后打扰。
    针对学术会议在对于我们学术研究的提高起到很大作用的同时,也存在一些问题:1.学术会议流于形式,大部分传播一些概念,不求甚解,国内学者大部分精力忙于四处开会,真正得到吸收的知识有限;2.各实验室人力资源过于分散,各干各的,效率很低,无法真正形成交流。因此希望此群作为学术会议的有益补充,可以便于共享各种资源:大家自己的学习心得,研究成果,特别需要detail;大家参加会议讲座的视频,内部资料,手稿;组织讨论班,暑期学校的通知,接待,访问等等。这个群建立已经有1年了,得到了很多国内外生物信息学界前辈的支持,在此表示感谢,目前已有人数324人,是国内最大的。
    不想参加的可以回复,我保证绝不再次打扰,但请不要举报垃圾邮件,会影响很多人加入并交流
    当前我们群的主要任务是通过网络合作,建立自己的下一代测序数据挖掘平台,这将是未来生物信息学乃至整个生命科学的发动机。
    身处美国,亲身感受到下一代测序技术带来的影响,绝对是革命性变化。这么巨大的数据量,使我们可以用统计方法,更加准确的确定潜在靶点
    很多生物信息专家都转到了这一领域,现在主要瓶颈就是数据的标准化和后续处理,我们在硬件上是拼不过美国了,希望同行努力,一起在数据挖掘方面赶上来
    谢谢
    希望保持联系。
    高山

  2. Reply Joseph 8月 5,2013 7:59 上午

    又来请教您一个问题。我在用AnnotationForge包生成primeview.db后,发现后续将expressionset中probeID与gene symbol对应上时,有很多probeID无法对应到相应的gene symbol,仍然显示probeID。而实际上在原始的注释文件中该probeID是有对应的gene symbol的。请问是怎么回事呢?

    • Reply admin 8月 7,2013 9:10 上午

      如果你自己动手做桥联文件,会好一些,因为你可以做出多个不同数据库的桥联文件,然后把它们得到的结果都累加起来。你查看一下,对于primeview,有至少四至五种数据来源吧,我记不清了,你可以都做一遍,然后整合。

  3. Reply Joe 8月 28,2013 3:23 上午

    您好!请教您一个问题。
    单位的服务器不能连接外网,如果我安装package,如何避免不用下载源包自行安装的方法,(您也知道各个包的相互依赖关系太复杂了)?
    是否可以在我自己的电脑上建立一个镜像,然后服务器连接我电脑的镜像呢?
    谢谢

  4. Reply Joe 8月 28,2013 3:25 上午

    请教您一个问题,单位的服务器不能连接外网,如何给R装package呢?(不想下载了再一个个装,互相依赖关系搞不定)
    是否可以在我自己的电脑上建立一个镜像,然后服务器引用我这个镜像呢?谢谢

    • Reply admin 8月 28,2013 11:03 上午

      您好。请教不敢当。您的这个问题答案是肯定的。您需要设置两个镜像,一个是R的,一个是Bioconductor的。镜像的制作都非常简单,使用http://cran.r-project.org/mirror-howto.html, 及http://www.bioconductor.org/about/mirrors/mirror-how-to/上的帮助即可。设置好镜像之后,你在安装时调整安装镜像即可。

  5. Reply sciencezhu 2月 22,2014 10:54 上午

    你好!我最近想用R软件做一个heatmap图来显示基因的表达差异,但之前没用过这个软件,不知道从哪开始着手,希望你能给我指点一二,谢谢!

  6. Reply nodexy 3月 14,2014 1:22 上午

    不错,哈哈 加油!

    circos R/BioConductor alignment 都是干货啊

  7. Reply weihuang 6月 28,2014 12:56 上午

    请问我按照R语言与Bioconductor生物信息学应用书上编写的程序为什么出错
    > source(“http://Bioconductor.org/biocLite.R”)
    > biocLite(“limma”)
    > library(limma)
    > biocLite(“affy”)
    > library(affy)
    载入需要的程辑包:BiocGenerics
    载入需要的程辑包:parallel
    载入程辑包:‘BiocGenerics’
    下列对象被屏蔽了from ‘package:parallel’:
    clusterApply, clusterApplyLB, clusterCall, clusterEvalQ,
    clusterExport, clusterMap, parApply, parCapply, parLapply,
    parLapplyLB, parRapply, parSapply, parSapplyLB
    下列对象被屏蔽了from ‘package:limma’:
    plotMA
    下列对象被屏蔽了from ‘package:stats’:
    xtabs
    下列对象被屏蔽了from ‘package:base’:
    anyDuplicated, append, as.data.frame, as.vector, cbind,
    colnames, do.call, duplicated, eval, evalq, Filter, Find, get,
    intersect, is.unsorted, lapply, Map, mapply, match, mget, order,
    paste, pmax, pmax.int, pmin, pmin.int, Position, rank, rbind,
    Reduce, rep.int, rownames, sapply, setdiff, sort, table, tapply,
    union, unique, unlist
    载入需要的程辑包:Biobase
    Welcome to Bioconductor
    Vignettes contain introductory material; view with
    ‘browseVignettes()’. To cite Bioconductor, see
    ‘citation(“Biobase”)’, and for packages ‘citation(“pkgname”)’.
    > affybatch tb disease disease
    design TALL BALL
    1 GSM336974 1 0
    2 GSM336975 1 0
    3 GSM336976 1 0
    4 GSM336977 1 0
    5 GSM336978 1 0
    6 GSM336979 1 0
    7 GSM336980 1 0
    8 GSM336981 1 0
    9 GSM336982 1 0
    10 GSM336983 1 0
    11 GSM337071 0 1
    12 GSM337072 0 1
    13 GSM337073 0 1
    14 GSM337074 0 1
    15 GSM337075 0 1
    16 GSM337076 0 1
    17 GSM337077 0 1
    18 GSM337078 0 1
    19 GSM337079 0 1
    20 GSM337080 0 1
    > eset disease design contrast.matrix fit<-lmFit (eset,design)
    错误于as.vector(x, mode) :
    cannot coerce type 'closure' to vector of type 'any'

  8. Reply lylanxjy 7月 4,2014 12:36 上午

    您好!看了您的博客觉得您非常专业,想请问一个问题,谢谢!
    我在做基因芯片分析过程中,做到GO和KEGG分析时,发现需要给基因加上GO和KEGG注释,我是按下面这个网址上的代码进行的:http://seuzsl.blog.163.com/blog/static/218798052013491049169/?latestBlog

    按照里面的做法,
    使用这个函数和下列代码就可以获得AGI、GO和KEGG注释:
    library(plyr)
    results.anno <- results.sig[,1:2]
    for(i in 1:3){
    anno <- switch(i, hgu133plus2ACCNUM, hgu133plus2GO, hgu133plus2PATH)
    anno.label <- switch(i, "AGI", "GO", "PATH")
    mapped.probes <- mappedkeys(anno)
    mapped.present <- intersect(genes.sig, mapped.probes)
    mapped.anno <- as.list(anno[mapped.present])
    if(anno.label=="GO") mapped.anno <- get.GO(mapped.present, mapped.anno)
    mapped.anno <- llply(mapped.anno, unique)
    mapped.anno <- ldply(mapped.anno, paste, collapse="; ")
    colnames(mapped.anno) <- c("probe_id" , anno.label)
    results.anno <- merge(results.anno, mapped.anno, by.x = "probe_id", all = TRUE)
    }
    但是运行后出现:
    错误于`colnames<-`(`*tmp*`, value = c("probe_id", "AGI")) :
    'names'属性的长度[2]必需和矢量的长度[0]一样

    请您帮忙看一下是哪里出了问题可以吗?谢谢!

    • Reply admin 7月 7,2014 8:17 上午

      谢谢你的谬赞。因为信息太少,我无法重复。在遇到问题时,您可以试着先使用traceback()来查看问题所在的具体行。然后step-by-step查看。我怀疑你的错误在于mapped.anno出来的结果并不是一个两列的data.frame,而你却试图给它两个列名。

  9. Reply lylanxjy 7月 8,2014 2:35 上午

    您说的很对,因为我是按照网上查到的代码复制过来做的,遇到问题不知道该怎么修改代码。非常感谢您的认真回复!
    不知是否可以再麻烦您一下,哪里可以找到用R软件给探针序列加上GO和KEGG注释的操作指南,您可以告知一下吗?我好去找来认真学习,多谢您!

  10. Reply funnybomb 8月 12,2014 7:32 上午

    博主,你好!
    看了的文章,觉得非常有帮助,非常感谢!

  11. Reply yingjie 8月 20,2014 3:44 上午

    博主您好,想请教您一个问题,(我是初学者,如果问题很小白请不要见怪LOL)
    > .libPaths(“D:\\R-Projects\\R\\library”)
    > source(“http://bioconductor.org/biocLite.R”)
    >library(rae230a.db)
    错误提示是:
    载入需要的程辑包:org.Rn.eg.db
    Error : loadNamespace()里算’org.Rn.eg.db’时.onLoad失败了,详细内容:
    调用: sqliteNewConnection(drv, …)
    错误: RS-DBI driver: (could not connect to dbname:
    unable to open database file
    )
    错误: 无法载入程辑包‘org.Rn.eg.db’

    然后我就去载入org.Rn.eg.db了,但是还是错误
    > biocLite(“org.Rn.eg.db”)
    > library(org.Rn.eg.db)
    错误提示还是一样的:
    Error : loadNamespace()里算’org.Rn.eg.db’时.onLoad失败了,详细内容:
    调用: sqliteNewConnection(drv, …)
    错误: RS-DBI driver: (could not connect to dbname:
    unable to open database file
    )
    错误: ‘org.Rn.eg.db’程辑包或名字空间载入失败

    网上找不到类似的案例,没有头绪了请楼主帮忙解答,谢谢!

  12. Reply deuterium 8月 22,2014 1:09 下午

    您好,我在安装新版本的cufflinks-2.2.1时遇到如下问题,解压输入
    ./configure
    后,出现:
    checking for bamlib… configure: error: We could not detect the bam libraries (version or higher). If you have a staged bam library (still not installed) please specify $BAM_ROOT in your environment and do not give a PATH to –with-bam option. If you are sure you have bam installed, then check your version number looking in . See http://randspringer.de/bam for more documentation.
    我的samtools的版本是1.0,换成0.1.19也会出现该问题,我之前安装的cufflinks版本是1.3.0,运行正常。我的系统是ubuntu13.04。您能指导我一下这是什么原因吗?如何才能安装新版本得cufflinks吗?之前google得到的信息不足以解决该问题。

  13. Reply Fortcollins 8月 29,2014 6:12 下午

    您好,我想使用Circos来做一个link的图,但是按照您的教程,一直有错误产生。
    我构建了两个文件
    1:circos.conf
    含有两个物种染色体的数目长度信息

    2:link.txt
    含有对应的染色体位置信息

    每次运行都是错误,请给点意见!

  14. Reply 好态度 9月 15,2014 6:53 上午

    刚刚发现这个博客,博主实乃高人也。

  15. Reply 孙天辰 9月 26,2014 6:39 上午

    你好,请问我在运行下面的代码时,为什么会出现下面的错误信息makeDBPackage(“HUMANCHIP_DB”,affy=TRUE,prefix=”primeviewdb”,fileName=”PrimeView.na32.annot.csv”,baseMapType=”eg”,outputDir=”primeviewdb”,version=”1.0.0″,manufacture=”affymetrix”,chipName=”PrimeViewHumanGeneExpressionArray”,manufacturerUrl=”http://www.affymetrix.com”)
    Error in readLines(con) : cannot open the connection
    In addition: Warning message:
    In readLines(con) :
    cannot open file ‘PrimeView.na32.annot.csv’: Permission denied

  16. Reply lhtmed 9月 27,2014 7:45 上午

    你好,我是一名肿瘤科临床医生,目前研究的课题遇到困难,想通过生物信息学方法初步筛选出目的基因的上游调控基因,然后再体外验证,最后临床验证,现在生物信息学可否初步对目的基因的上游调控基因进行初步筛选?如果可能,不知是否可指导该如何下手?

    • Reply admin 9月 27,2014 8:16 上午

      对于上游调控基因筛选,我也几乎没有接触过。以前一般通过酵母双杂交(Y2H),酵母单杂交(Y1H),(这两者都是蛋白质水平), 细菌单杂交(B1H)(蛋白质与基因间相互作用)等手段筛选。因为很久没有做过实验了,所以对这方面的进展也不是很了解。

  17. Reply Ethan 10月 3,2014 9:04 下午

    欧老师,你好,请问R语言与Bioconductor生物信息学应用书中的代码可以在哪下载呢?160685613已经关了,而263733906也不加人。

  18. Reply Judy 11月 8,2014 9:05 上午

    This is an awesome blog. And the host is really a professional. I am new to R and bioconductor, however I would like to analyze the data myself. I got 15 microarray files from illumina humanHT 12v4 platform. There are 3 kinds, each kind has 5 files. For example in one kind, there are:
    nonorm_bkgdsubtracted.ppj
    nonorm_bkgdsubtracted.txt
    nonorm_bkgdsubtracted_AVGSignal.txt
    nonorm_bkgdsubtracted_AVGSignal.txt.fmt
    nonorm_bkgdsubtracted_HumanHT12.annotation.txt

    The other 2 are nonorm_nobkgdsubtract and Quantile-normalized_bkgdsubtracted.

    I wonder which one should I open in R and with which package? If there is any link for more information, I appreciate. Thank you again!

  19. Reply Wei Shen 12月 8,2014 8:38 下午

    还是要有个独立域名啊

  20. Reply YulongNiu 12月 15,2014 5:30 下午

    你好,是否能互相添加博客链接?这是我的博客地址,http://yulongniu.bionutshell.org/,主要记录生物信息学和Linux使用,谢谢。

  21. Reply Jenny Hu 1月 15,2015 11:26 上午

    您好!
    我非常欣赏你的博客,这里有很多NGS的知识和R语言等编程技巧.
    我做了一个BJC( bioinformatics Journal club)的博客和论坛.http://bio985.com/
    我想通过大家交流一些最新的生物信息paper,抓住前沿.
    希望可以交换友情链接.我的邮箱:hujinyutju@gmail.com

    • Reply admin 1月 16,2015 8:57 上午

      非常感谢您的留言以及友情链接交换的提议。因为您的网站运行时间过短,暂时我不能肯定您是否会坚持下去。所以,我希望您在网站运行三个月之后再次留言,至时我会非常欢迎交换链接。因此造成的不便希望您能理解。谢谢。

  22. Reply hydraphenix 2月 26,2015 12:58 上午

    感谢博主的分享,能问下是什么原因要关闭这个网站而要转到新浪博客上去呢?
    还有你是用什么搭建的这个网站啊,好像不是wordpress啊,我也好希望自己也有一个这样干净的网站啊。

  23. Reply hydraphenix 2月 26,2015 10:04 下午

    多谢您的回复!我也想将我的笔记做成这样的博客,也方便自己查阅。以后有什么不懂的再来请教。

  24. Reply 邬家栋 10月 12,2015 11:21 下午

    博主您好,想请教您一个关于笔记的问题。您这里所有的文章应该都是整理过的吧,想问下你平时都是怎样来记录你的笔记的啊,到什么程度才将笔记整理到您博客上来的呢?

    • Reply admin 10月 13,2015 12:02 下午

      随心所欲。你觉得可以拿来和人分享就可以了。分享以后还可以慢慢纠正修改的。反正是个人博客,又不是静止的书。

  25. Reply 邬家栋 12月 29,2015 7:58 上午

    欧老师您好,请问通过转录组测序获得的目的基因序列,怎么确定这个基因的CDS区?通过orffinder预测出的完整最长的这个orf可否认为是这个基因的CDS区?

  26. Reply Corey S. 4月 10,2016 7:45 上午

    您好,可否互相添加博客。博客地址为https://shanguangyu.com/,主要关于生物信息与数据挖掘,多谢。

  27. Reply xtw136 1月 10,2017 7:35 下午

    不好意思,我是计算机系的学生。毕业设计和生物信息学有关但之前没有基础。想参考您的生物信息学笔记进行学习,能否行个方便。谢谢

    • Reply admin 1月 11,2017 10:32 上午

      如果你觉得入门有困难的话,可以找相关的书籍来看,看书应该是最系统的。我的笔记早已经不知道在哪里了。

  28. Reply xtw136 1月 13,2017 2:05 上午

    那个我自己有找到一些,但我没那个需要和时间系统性学习。有搜索到你的部分笔记刚好符合我的需求

  29. Reply K-Liu 2月 6,2017 1:18 上午

    老师您好,请教一个问题,实在是不知道问谁了,我们在一篇文章中做基因差异表达分析时需要用到moderated t-tests ,DNASTAR中的ArrayStar可以做moderated t-tests 。看您有没有用过ArrayStar?我们在官网上下载的软件只能试用DNASTAR Lasergene中的子软件Molecular Biology,而Genomics中的ArrayStar却不能用,需要填写一个ArrayStar 的product key,希望您能提供一下帮助,非常感谢

  30. Reply 丁若凡 4月 24,2017 12:49 上午

    博主您好,这几年在您这学到了很多东西,非常感谢~
    建议您开个公众号,我相信很多人会给您进行打赏。

  31. Reply 董智瑀 5月 16,2017 12:19 下午

    老师您好!我最近想分析Affymetrix mirna 4.0的一个芯片,但readaffy后不能qc也不能标准化,显示缺少cdf。 我到affymetrix官网下了miRNA-4_0-st-v1_CDF文件,用makecdfenv包把内含的cdf文件做成package。我把这个package压缩成zip格式,但发现install完始终不能library这个包。希望您能提供一下帮助,非常感谢!

    • Reply admin 5月 19,2017 7:00 上午

      我假设你的包是成功做好了。安装的话,请在R中使用
      library(BiocInstaller)
      biocLite(“path/to/your/package”, repos=NULL, type=”source”)
      如果还是不能成功,再来问我。

Leave a Reply

  

  

  

%d 博主赞过: