PHRED = base caller; cross-match e seqclean para limpar vetor
Primeira parte – PSI-BLAST:
Segunda parte – Instalação PHRED:
Terceira parte – parametros phred:
· Veja nos tutoriais da turma passada.
· Copie arquivos de seqüenciamentos: $mkdir cromatos $cd cromatos $ls /home/treinamento/cromatos. Crie os diretórios de projeto, o diretório vetor e copie todo o conteúdo de cromatos.
· O PHRED usa os .esd dentro de chromat_dir: em cada projeto crie um, $mkdir chromat_dir $mv *esd chromat_dir/
· Rode de dentro de edit_dir: $cd edit_dir e use como entrada o diretório chromat_dir assim:
·
Linha: phred -id ../chromat_dir -sa
·
Linha com trim: phred -id ../chromat_dir -trim_alt "" -trim_cutoff
0.16 -trim_fasta -sa
· Varie o valor de trim_cutoff e veja o que ocorre, salve como teste_valor
Quarta parte – cross_match:
· Trabalhar dentro de edit_dir: junte os vetores $cat vetor1 vetor2 > vetores,fasta
·
cross_match nome_arquivo_saida vetor/vetores.fasta
-minmatch 12 -minscore 20 -penalty -2 -screen > arquivo_de_log
· o resultado é o screen e não o log!
Quinta parte – seqclean:
·
seqclean
tirar o vetor ao invés de mascarar com X.
·
formate o
vetor pois é feito um BLAST: $formatdb –i vetor –p F
–o T.
·
Linha: $seqclean sequencias -v vetor -o saida
Para casa: identifique com blast
no nr as seqüências do projeto_HaSH tratadas por cross_match
ou seqclean
[treinamento@maracatu ~]$ ls
aldolase.cds db linha_rps
CDD fosfogliceromutase_Ecoli linhas_formatrpsdb
close_gates.exe linha_awk phred-dist-020425.c-acd.tar
Cp linha_blastall proteome.H10B
cromatos linha_psi
$ /usr/local/BLAST/blast-2.2.17/bin/blastpgp -i fosfogliceromutase_Ecoli
-d db/uniprotkb_not_frag_1194900 -j 10 -a 4 -h 1e-5 -e 1e-5 -m 9 -o
uniprot_pld &
$ cat uniprot_pld | awk '{print $2}' | sort | uniq -c | sort -n -r -k 1,1