使用CPC分析lncRNA

CPC是最早的从转录组中分析lncRNA的软件,很多lncRNA研究中用的都是它。它基于blast,把未知转录本和已知蛋白库对比,从而筛选出编码和非编码的转录本。CPC可靠性很高,缺点就是太慢太慢了,需要几天时间。CPC可以在网页版上提交任务,运行好了,将结果下载下来。

文章发表在Nucleic Acids Research:http://nar.oxfordjournals.org/content/35/suppl_2/W345.long
主页:http://cpc.cbi.pku.edu.cn/

CPC安装前需要:
CPC需要使用blast,它调用的是blastall,也就是老版本的blast,而不是新版本的blast+。
老版本的blast下载地址:http://yunpan.cn/cwGh5BSDbdYIe 访问密码 9df4
需要使用蛋白质库,UniRef90或者NCBI的nr都可以,用formatdb命令建库时,必须命名为”prot_db”, 且放在CPC安装目录下的data目录下面。

CPC的安装:
下载cpc-0.9-r2.tar.gz
tar -zxvf cpc-0.9-r2.tar.gz
cd cpc-0.9-r2/libs/libsvm
tar -zxvf libsvm-2.81.tar.gz
cd libsvm-2.81
make clean && make
cd ../..
tar -zxvf estate.tar.gz
cd estate
make clean && make

建立本地blast数据库:
cd cpc-0.9-r2/data
formatdb -i (your_fasta_file) -p T -n prot_db

运行CPC:
cd cpc-0.9-r2/
bin/run_predict.sh (input_seq) (result_in_table) (working_dir) (result_evidence)
run_predict.sh好像是远程blast,建议运行run_predict_local.sh,并把这个文件中blast_opts=”$blast_opts -a 2″; # 2CPUs, boost the performance这句话中的2,改成你实际电脑使用的CPU核数。