1.sam,bam的格式转换:
$samtools view -sb file.sam >file.bam $samtools view -sb file.sam -o file.bam #sam文件转换为bam,-s 输入文件为sam -b 输出文件为bam $samtools view file.bam>file.sam
$samtools view -h file.bam -o file.sam
#bam文件转换为sam文件
2.对bam文件进行排序
$samtools sort -n -o file.sort file.bam
#以reads的名字排序,输入file.bam 输出file.sort
3.对bam文件进行简单的统计
$samtools flagstat file.bam
#得到比对的统计结果,包括比对率等等。。
4.筛选特定的区域
#筛选不需要的flag值 $samtools view –F 4 file.bam –o file.filter.sam #限定比对质量值最小值 $samtools view –q 20 file.bam –o file.quality.sam #得到指定位置的sam文件 $samtools view file.sort.bam Chr1:1-5000 –o file.position.sam
5.对多个read重复mapping 到基因组上同一个区域时,只保留匹配度最高的
$samtools rmdup file.bam file.rmdup.bam
6.合并某个样本的多个重复实验的bam文件
前提:bam文件已排序
#! /bin/bash #合并test_L1.bam和test_L2.bam文件 samtools merge -h test.sam test_L1_L2.bam test_L1.sorted.bam test_L2.sroted.bam #合并test_L1.bam和test_L2.bam文件中的指定区域chr7 samtools merge -h test.sam -R chr7 test_L1_L2.bam test_L1.sorted.bam test_L2.sroted.bam
拒绝低效率勤奋,保持高效思考