Trabalhando com anotação de Pathways a sequencias de 454 (tumor de mama)
Acesse maracatu.icb.ufmg.br e liste o conteúdo de
$ ls /home/bacharelado/blast_aula/
1. Olhe
os arquivos p53 e MYC.pep
$ more /home/bacharelado/blast_aula/p53
2. Conte
as seqüências do diretório
$ cat
/home/bacharelado/blast_aula/454data/tumor.seq | grep
">" -ce MYC.pep
3. Copie
as sequencias de p53 e MYC.pep e junte
$ cp /home/bacharelado/blast_aula/p53 . [opag]
$ ls
$ cp /home/bacharelado/blast_aula/p53 . [opag]
$ ls
$ cat p53 MYC.pep > proteínas
4. Verifique
os hits de p53 e MYC.pep juntos
$ blastall -p tblastn –i proteinas –d /home/bacharelado/blast_aula/454data/tumor.seq –e 1e-12 –m 8 –a 4 – F F –o proteinas.hits &
$ more proteinas.hits
$ cat proteinas.hits
| awk ‘{print $2}’ | more
$ cat proteinas.hits
| awk ‘{print $2}’ | sort | uniq –c | more
$ cat proteinas.hits
| awk ‘{print $2}’ | sort | uniq –c | sort –n –r –k 1,1 | more
5. Obtenha
seqüências humanas no Kegg
$ wget ...
Obtenha tabelas com os Kegg Pathways
6. Primeiro
a lista de Pathways do H. sapiens
ftp://ftp.genome.jp/pub/kegg/genes/organisms/hsa/hsa_pathway.list
7. Depois
a tabela de Nomes dos Pathways
ftp://ftp.genome.jp/pub/kegg/pathway/map_title.tab
8. Depois
os fastas (nucleotídicos)
para H. sapiens
ftp://ftp.genome.jp/pub/kegg/genes/organisms/hsa/h.sapiens.nuc
9. E
a lista de KOs para o H.
sapiens
ftp://ftp.genome.jp/pub/kegg/genes/organisms/hsa/hsa_ko.list
(se quiser a lista geral tb tem, mas é redundante)
ftp://ftp.genome.jp/pub/kegg/pathway/ko/ko_map.tab
10.
E os nomes dos KOs
???
11.
BLAST e Análise – veja linhas na maracatu!
$ cat 454kegg | awk '{print $1}' | more | sort | uniq -c | sort -k 1,1 -n -r | more