ORFs e Introns
Exercícios:
- Entender o as fases de leitura ouvindo a música "corrente" de Chico Buarque (veja a letra)
- Visite o site ORF finder no NCBI e teste a seqUência com gi 120407067
- Se preferir peça REDRAW com janela mínima de 300 nt - qual é a fase de leitura que codifica a proteína?
- Clique sobre a ORF maior - isto abre uma pesquisa com BLASTp, clique em view report para ver o resultado de BLAST = mas antes disso, qual é a frame indicada para esta ORF?
- Volte ao gráfico de ORFs (back) e clique no botão Accept para aceitar a marcação de uma ORF
- Analise agora a ORF candidata na quinta linha. Aceita ou não?
- Fazendo manualmente: navegue para a página do BLASTx e entre o identificador gi 120407067 e faça um BLASTx contra a base de dados nr. Verifique qual eh a frame do alinhameno e onde esse alinhamento começa na seqüência.
- Explore agora o arquivo em formato GenBank da entrada Entrez Nucleotide 120407067. Onde está o início da tradução? (veja a descrição de CDS)
- Uma maneira de identificar o início da tradução é também buscando padrões como a transição "não codificante-codificante" feita pelo programa ESTscan, ou por busca direta do consenso de Kozak, que aponta ao ribossomo onde iniciar a tradução. Utilize este site TIS hunter com a seqüência da entrada 120407067 (obtenha em Entrez nucleotide)
- vamos tornar o trabalho mais dificil para o TIS hunter: faça um nucleotide BLAST (pode ser megablast) mas escolha como base de dados Expressed Sequence Tags.
- Clicando no gi do primeiro alinhamento vc navega para a página da EST. Pegue o FASTA dela e use no TIS hunter. Ele encontra o início correto da ORF?
- Há ESTs que estão alinhadas (veja novamente o BLAST) de maneira invertida (o Sbject começa pelo maior número e vai para o menor número) - o que isto significa?
- Faça um alinhamento da proteína p53 (gi:120407068) com as ESTs humanas usando o programa tBLASTn. Faça um algoritmo para determinar se (i) a EST está alinhada no sentido +/+ ou +/- e (ii) se a provável metionina está presente
- Programas de busca de padrões também são usados para verificar sites de spliging, à semelhança do TIS hunter.
- Alinhe com blast2seq a sequencia gi:51511734 (genoma) com a seqüência gi:8400738 (proteína) - e verifique os EXONs - atenção, mude a opção para BLASTx pois estamos alinhando um segmento genômico com a proteína. Veja como é diferente quando vc substitui a sequencia de cima por gi:8400737. Agora não há introns!
- Agora utilize o site de busca de padrões para predição de splice site com a seqüência do gi:5151173. Cuidado, este preditor não é tão recente quanto o TIS hunter e pode falhar! Assim, confie sempre em alinhamentos genoma-cDNA qdo possível!