Chrome保存网页为图片

Google Chrome浏览器,可以很方便地将网页转换为PDF。右击网页空白处,在弹出的快捷菜单中选择”打印”,在”打印选项卡”中选择”另存为PDF”。
Chrome_tips_1
有时候网页太长,保存为PDF,分页显示很难看,想保存为图片怎么办呢?
Chrome有很多插件可以实现这个功能,这里推荐FireShot。在Chrome网上应用店,搜索”FireShot”,将它”添加至CHROME”。如果你不能访问Chrome网上应用店,考虑使用本站提供的翻墙工具
Chrome_tips_2
安装好FireShot之后,在地址栏右边会出现它的图标,点击这个图标就能使用FireShot将网页保存为图片了。FireShot支持捕捉整个页面、捕捉可见部分、捕捉选定区域,相当方便。我比较喜欢使用”捕捉选定区域”,它支持滚轮拖动,俨然一个加强版的QQ截图。
Chrome_tips_3

HTSeq

安装C/C++编译环境
Ubuntu缺省情况下,并没有提供C/C++的编译环境,运行以下命令安装:
sudo apt-get install build-essential
安装setuptools
setuptools可以更方便的创建和发布Python包,HTSeq的安装依赖setuptools
下载setuptools-20.3.1.tar.gz
tar zxvf setuptools-20.3.1.tar.gz
cd setuptools-20.3.1/
sudo python setup.py install
安装Cython
Cython是Python的C扩增,可以让Python程序更加高效。HTSeq依赖cython。
sudo apt-get install cython
安装Numpy
Numpy是Python科学计算基本库,提供了许多高级的数值编程工具。HTSeq依赖Numpy。
sudo apt-get install python-numpy
安装Zlib
Zlib是zlib是提供数据压缩用的函数库。pysam依赖Zlib。
下载zlib128.zip
unzip zlib128.zip
cd zlib-1.2.8/
./configure
make
sudo make install
安装pysam
pysam可以操作很多基因组数据,包括SAM/BAM/VCF/BCF/BED/GFF/GTF/FASTA/FASTQ。HTSeq依赖pysam。
下载pysam-0.9.0.tar.gz
tar zxvf pysam-0.9.0.tar.gz
cd pysam-0.9.0/
sudo python setup.py install
安装HTSeq
下载HTSeq-0.6.1.tar.gz
tar zxvf HTSeq-0.6.1.tar.gz
cd HTSeq-0.6.1/
sudo python setup.py install
报错

适合Python的Vim的配置

Vim的基本配置是在用户的Home目录下建立一个.vimrc配置文件,Vim根据该文件的设定,体现具体的定制内容。

vim ~/.vimrc

用于Python的配置:

syntax on
filetype plugin indent on

syntax on 不仅仅用在Python,在其他编程语言中也有作用,根据语言语法进行高亮显示。
filetype plugin indent on 当打开扩展名为.py的文件,遇到def或者if等Python关键字后再遇到换行,会将光标自动缩进到合适的位置。

使用Cytoscape分析和可视化网络(1)

获得网络数据
获得网络数据的方法有三种,第一种是通过检索蛋白相互作用数据库构建网络。
Cytoscape欢迎界面:
File-Welcome
如果启动时,没有显示欢迎界面,可以使用菜单”help” 》 “show welcome screen”打开。在欢迎界面,选择”From Network Database”,将弹出如下界面:
Cytoscape_from_database
在搜索框中输入基因或者蛋白的名称,点击”Search”, 在结果框中选择有记录的数据库,”Automatic Network Merge”(自动合并网络)可以选择,也可以手动合并网络,最后点击”Import”。下图是其中得到的一个网络:
Cytoscape_KCTD10
第二种得到网络的方法是通过Agilent Literature Search插件进行文本挖掘,通俗地来讲就是让机器帮你读文献。
安装Agilent Literature Search插件, 菜单”Apps” 》 “APP Manager”, 选择”Agilent Literature Search”, 点击”Install”进行安装,如下图所示:
Cytoscape_plugin_install
安装成功后,会在菜单”Apps”下,看到”Agilent Literature Search”,点击使用它,如下图所示:
Cytoscape_text_mining
“Terms”框这里依然输入”KCTD10″,”Max Engine Matches(最多读多少篇文献)”这里设置为100,其他参数这里不做修改,你可以根据需要自行设置,点击绿三角图标进行文本挖掘。 下图是通过Agilent Literature Search插件文本挖掘得到的网络:
KCTD10_text_mining
得到网络的第三种方法是从网络文件中导入,这里先介绍一下Cytoscape支持的网络文件格式。
.sif(Simple Interaction Format,简单相互作用格式)

nodeA interactionType1 nodeB
nodeA interactionType2 nodeC
NodeF

.sif是最直接的格式,用户可以通过文本编辑器定义网络。.sif的每一行包含三个标识,第一个标识是源节点,第二个标识是相互作用类型,第三个标识是目标节点。上面的示例文件表示,nodeA和nodeB通过interactionType1相互作用有一条边,nodeA和nodeC通过interactionType2相互作用有一条边,NodeF定义了一个节点,但是没有边。
.noa(节点文件)

AttributeName
nodeA = value1
nodeB = value2
nodeC = value1

第一行是属性名,例如’SubcellularLocation’,接下来的每一行包含一个节点名、等号、节点属性值,属性值可以是数值型也可以是字符型,例如’4.12’或者’nucleus’。
.eda(边文件)

AttributeName
nodeA (interactionType) nodeB = 0.56
nodeB (interactionType) nodeC = 0.918
nodeB (interactionType) nodeA = 0.3412

边文件跟节点文件类似,这里的边名由源节点、相互作用类型、目标节点组成。
表达值文件格式(Expression data file format)
需要将扩展名改为.mrna或者.pvals才能被Cytoscape识别,改为哪一个扩展名没有区别。

Gene Label Experiment1 Experiment2 Experiment1 Experiment2
geneA labelA valueA_1 valueA_2 pvalueA_1 pvalueA_2
geneB labelB valueB_1 valueB_2 pvalueB_1 pvalueB_2
geneC labelC valueC_1 valueC_2 pvalueC_1 pvalueC_2

表达值数据是一个矩阵,每一行代表一个基因或者蛋白在不同实验条件下的表达值。第一行是列标签,第一列是基因名,第二列是基因的描述,接下来的列是表达值,每一个实验一列。如果数据包含P-value或者其他衡量显著性的值,每一个实验则对应两列,第一列表达值,第二列P-value,这两列的列标签必须相同。使用jActiveModules插件分析功能模块时,表达值数据必须包含0(最显著)到1(最不显著)的P-value。
从文件导入网络:
欢迎界面中,选择”From Network File”;
或者在菜单中,”File” 》 “Import” 》 “Network” 》 “File”。
这里导入示例文件galFiltered.sif,这个文件包含在Cytoscape Nature Portocol的补充信息中。

使用Cytoscape分析和可视化网络(简介)

Cytoscape是一款用于分析和图形化展示网络的软件。Cytoscape最基本的组织形式是网络图,分子(基因或者蛋白)表示一个节点,分子间的相互作用表示一个边。Cytocape软件本身只提供一些基本的功能,更多深入分析的功能需要依靠插件。而Cytocape最具魅力的地方也在于它拥有丰富的插件,例如,用于GO注释的BiNGO,用于功能模块分析的jActiveModules,用于文本挖掘构建网络的Agilent Literature Search……
Cytoscape开源、免费、跨平台,可以从它的官网(http://www.cytoscape.org/)下载,并免费使用。当前最新版本为Cytoscape 3.3.0,需要先安装Java 8。
Cytoscape用户指南:http://opentutorials.cgl.ucsf.edu/index.php/Portal:Cytoscape3
Cytoscape相关文献:
1. Shannon, P., Markiel, A., Ozier, O., Baliga, N.S., Wang, J.T., Ramage, D., Amin, N., Schwikowski, B. and Ideker, T. (2003) Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome research, 13, 2498-2504.
2. Cline, M.S., Smoot, M., Cerami, E., Kuchinsky, A., Landys, N., Workman, C., Christmas, R., Avila-Campilo, I., Creech, M., Gross, B. et al. (2007) Integration of biological networks and gene expression data using Cytoscape. Nature protocols, 2, 2366-2382.
3. Smoot, M.E., Ono, K., Ruscheinski, J., Wang, P.L. and Ideker, T. (2011) Cytoscape 2.8: new features for data integration and network visualization. Bioinformatics, 27, 431-432.
4. Saito, R., Smoot, M.E., Ono, K., Ruscheinski, J., Wang, P.L., Lotia, S., Pico, A.R., Bader, G.D. and Ideker, T. (2012) A travel guide to Cytoscape plugins. Nature methods, 9, 1069-1076.
本教程依据07年和12年的两篇文献来写的,相当于一个中文简略版,建议大家直接读英文原文。
Cytoscape分析和可视化网络,大概可以分为五个步骤:
1. 获得网络数据(Obtain network data)
2. 探索网络并输出(Explore network and generate layout)
3. 用表达信息或者其他功能属性注释(Annotate with attribute and expression data)
4. 分析网络特征(Analyze network features)
5. 基因功能富集(Detect enriched gene functions)