Trabalhando com anotação de Pathways a sequencias de 454 (tumor de mama)

 

 

Acesse maracatu.icb.ufmg.br e liste o conteúdo de

$ ls /home/bacharelado/blast_aula/

1.     Olhe os arquivos p53 e MYC.pep

$ more /home/bacharelado/blast_aula/p53

2.     Conte as seqüências do diretório

$ cat /home/bacharelado/blast_aula/454data/tumor.seq | grep ">" -ce MYC.pep

3.     Copie as sequencias de p53 e MYC.pep e junte

$ cp /home/bacharelado/blast_aula/p53 . [opag]

$ ls

$ cp /home/bacharelado/blast_aula/p53 . [opag]

$ ls

$ cat p53 MYC.pep > proteínas

4.     Verifique os hits de p53 e MYC.pep juntos

$ blastall -p tblastn –i proteinas –d /home/bacharelado/blast_aula/454data/tumor.seq –e 1e-12 –m 8 –a 4 – F F –o proteinas.hits &

$ more proteinas.hits

$ cat proteinas.hits | awk ‘{print $2}’ | more

$ cat proteinas.hits | awk ‘{print $2}’ | sort | uniq –c | more

$ cat proteinas.hits | awk ‘{print $2}’ | sort | uniq –c | sort –n –r –k 1,1 | more

5.     Obtenha seqüências humanas no Kegg

$ wget ...

Obtenha tabelas com os Kegg Pathways

6.     Primeiro a lista de Pathways do H. sapiens

ftp://ftp.genome.jp/pub/kegg/genes/organisms/hsa/hsa_pathway.list

7.     Depois a tabela de Nomes dos Pathways

ftp://ftp.genome.jp/pub/kegg/pathway/map_title.tab

8.     Depois os fastas (nucleotídicos) para H. sapiens

ftp://ftp.genome.jp/pub/kegg/genes/organisms/hsa/h.sapiens.nuc

9.     E a lista de KOs para o H. sapiens

ftp://ftp.genome.jp/pub/kegg/genes/organisms/hsa/hsa_ko.list

(se quiser a lista geral tb tem, mas é redundante)

ftp://ftp.genome.jp/pub/kegg/pathway/ko/ko_map.tab

10.           E os nomes dos KOs

???

11.           BLAST e Análise – veja linhas na maracatu!

$ cat 454kegg | awk '{print $1}' | more | sort | uniq -c | sort -k 1,1 -n -r | more