Treinamento
em Bioinformática 2008
Gene Database – thanks to Tatiana Tatuzova
Fontes de seqüências de genes:
- Literatura:
procure em pubmed.com
artigos sobre “nanog AND Homo sapiens”. Verifique em “Links” entradas para
Gene, Protein (RefSeq),
etc. Compare 3:Park IH et al. com 5: Kochupurakkal BS. Descubra o taxonomy
ID para o Homo sapiens e para o nendertal.
- Protein:
procure em Entrez
Protein entradas com myoglobin AND Homo sapiens [organism]. Verifique
a aba “RefSeq”. Verifique a sugerida entrada Gene. Nela, explore as
entradas NM e NP. Em NM, clique em CDS e explore.
- TaxBrowser:
entre via www.ncbi.nlm.nih.gov
e pesquise Homo sapiens. Clique no número de seqüências de ESTs e adicione à pesquisa ...AND ORESTES para
quantificar o depósito feito pelo projeto genoma do câncer. Mude o display
para “Fasta”. Grave as seqüências com “Send to file”. Mande para sua pasta
na maracatu.
- Nendertal:
quais as seqüências protéicas de Nendertal? (procure em taxonomy). Explore
o link para Pubmed nessas seqüências.
- Structure:
faça o download em
Formato FASTA das seqüências de Homo sapiens com
estrutura resolvida por raio-X. Truque: vc não vai conseguir os FASTA no
Structure, procure pelas proteínas, imponha limit only from PDB. Salve na
maracatu.
- Genomas
bacterianos: em Taxonomy, iniciando por E. coli e abrindo Genomes
podemos chegar à entrada RefSeq NC_010473 que é o genoma da DH10B.
Clicando em genes listamos os 4357 genes. Mas e os FASTAs? Vc pode abrir
no menu “Protein links”, abrir a aba RefSeq (pois é claro que há entradas
redundantes) e pegar os FASTAs protéicos independentes. Vamos fazer uma
coleção de proteomas bacterianos! A outra opção seria definir seu
interesse pelo txid certo (Search “Protein” for “txid316385”) e limitar
RefSeq, ok?
- Alto
nível: vamos conhecer as bibliotecas formatadas para BLAST no NCBI.
Tente achar a área de download ou clique aqui. Agora
verifique as bases de dados disponíveis por FTP. Vamos fazer o download
direto na maracatu usando ftp ftp.ncbi.nlm.nih.gov
como anonymous e a senha será o seu e-mail. Use mget <arquivo>.
Vamos combinar o que baixar na aula.
- Trabalho
de casa: (a) salvar FASTA das enzimas da via glicolítica de txid316385
e txid9606 em dois arquivos multi-FASTA; (b) salvar na sua conta e
traduzir com vi (use man vi para os comandos) esta letra
de música.
- Trabalho de casa:
Literatura indicada: NCBI handbook
E-mail Miguel