posts - 431,  comments - 344,  trackbacks - 0

rcdk, 是在R下面集成了CDK工具包,以此来通过CDK生成的化学性质数据进行更深层次的统计分析,下面来看看在rcdk中如何进行多个化合物结构的聚类。

首先需要在R下面安装rcdk程序包,然后就可以进入命令行,进行如下操作:
>library("rcdk")   //加载包
>mols <- load.molecules("mymols.sdf")  //读取sdf文件
> fps <- lapply(mols, get.fingerprint, type="extended")  //生产fingerprint值
> fp.sim <- fp.sim.matrix(fps, method="tanimoto")   //建立矩阵
> fp.dist <- 1-fp.sim
> clustering <- hclust(as.dist(fp.dist))
> plot(clustering)

执行到这里,我们就得到了结果,如下图:

这里我选择的是50个化合物结构进行处理。是不是很方便~:)
posted on 2011-04-11 21:41 周锐 阅读(870) 评论(0)  编辑  收藏 所属分类: ChemistryCDKR

只有注册用户登录后才能发表评论。


网站导航: