Treinamento em Bioinformática 2008


PHRED = base caller; cross-match e seqclean para limpar vetor


Primeira parte – PSI-BLAST:

 

Segunda parte – Instalação PHRED:

 

Terceira parte – parametros phred:

·        Veja nos tutoriais da turma passada.

·        Copie arquivos de seqüenciamentos: $mkdir cromatos $cd cromatos $ls /home/treinamento/cromatos. Crie os diretórios de projeto, o diretório vetor e copie todo o conteúdo de cromatos.

·        O PHRED usa os .esd dentro de chromat_dir: em cada projeto crie um, $mkdir chromat_dir $mv *esd chromat_dir/

·        Rode de dentro de edit_dir: $cd edit_dir e use como entrada o diretório chromat_dir assim:

·        Linha: phred -id ../chromat_dir -sa teste –qa teste.qual

·        Linha com trim: phred -id ../chromat_dir -trim_alt "" -trim_cutoff 0.16 -trim_fasta -sa teste –qa teste.qual

·        Varie o valor de trim_cutoff e veja o que ocorre, salve como teste_valor

 

Quarta parte – cross_match:

·        Trabalhar dentro de edit_dir: junte os vetores $cat vetor1 vetor2 > vetores,fasta

·        cross_match nome_arquivo_saida vetor/vetores.fasta -minmatch 12 -minscore 20 -penalty -2 -screen > arquivo_de_log

·        o resultado é o screen e não o log!

 

Quinta parte – seqclean:

·        seqclean tirar o vetor ao invés de mascarar com X.

·        formate o vetor pois é feito um BLAST: $formatdb –i vetor –p F –o T.

·        Linha: $seqclean sequencias -v vetor -o saida

 

Para casa: identifique com blast no nr as seqüências do projeto_HaSH tratadas por cross_match ou seqclean


 [treinamento@maracatu ~]$ ls

aldolase.cds                 db                                           linha_rps

CDD                           fosfogliceromutase_Ecoli          linhas_formatrpsdb

close_gates.exe            linha_awk                                phred-dist-020425.c-acd.tar

Cp                               linha_blastall                            proteome.H10B

cromatos                    linha_psi


$ /usr/local/BLAST/blast-2.2.17/bin/blastpgp -i fosfogliceromutase_Ecoli
-d db/uniprotkb_not_frag_1194900 -j 10 -a 4 -h 1e-5 -e 1e-5 -m 9 -o

uniprot_pld &

$ cat uniprot_pld | awk '{print $2}' | sort | uniq -c | sort -n -r -k 1,1

E-mail Miguel