一、NGSQCTooklit 使用
主要是去除dapter和低质量的碱基,并有统计结果
可以得到如下的结果
1,每个位置的碱基的平均质量
2,每个GC值对应的reads数
3,每个质量值对应的reads数
4,每个位置对应的碱基个数
5,每个位置对应的输入碱基位置和质检后的碱基个数
6,对质量的总结。
QC文件夹中包含了4支PERL程序,用于454 READS或ILLUMINA READS的QC,分别为:
IlluQC.pl 用于Illumina reads的QC。默认情况下去除掉含有primer/adaptor的reads和低质量的reads,并给出统计结果和6种图形结果。默认设置 (‘-s’ 参数) 碱基质量低于20的为低质量碱基;默认设置 ( ‘-l’ 参数)低质量碱基在reads中比例 >30% 的为低质量reads。程序运行例子:
$ perl $NGSQCHome/QC/IlluQC_PRLL.pl -pe r1.fq r2.fq 2 5 -p 8 -l 70 -s 20
IlluQC_PRLL.pl 和上一个程序没有多大区别,只是多了 ‘-c’ 参数来进行并行计算,增加程序速度。
454QC.pl 对454 reads进行QC。
454QC_PRLL.pl 和上一个程序一眼个,只是多了 ‘-c’ 参数来进行并行计算,增加程序速度。454QC_PE.pl 对paired-end测序的454 reads进行QC。
-pe 双端测序例:
-se 单端测序例:
-s 碱基质量低于20(默认设置)的为低质量碱基
-l 低质量碱基在reads中比例>30%(默认设置)的为低质量reads
-p 要使用的进程数量
-t 统计输出格式
-o 指定输出文件名或者是路径
-z 输出过滤后的高质量reads
同参数
-c 使用多个处理器进行计算增加程序速度