ESTs, SAGE e RDA
Atividades:
- Diferenças e similaridades entre ESTs e ORESTES
- O fim de uma EST depende dos parâmetros de PHRED
- Número de ESTs no dbEST hoje
- Como descarregar ESTs
NCBI - Search "Nucleotide" for:
- Homo sapiens [organism] AND gbdiv_est [prop]
- Maior grupo individual de seqüenciamento de ESTs humanas:
Homo sapiens [organism] AND gbdiv_est [prop] AND ORESTES
- Primeiras ESTs Brasileiras:
Schistosoma mansoni [organism] AND gbdiv_est [prop] AND 1993 [pdat]
(ou use "Limit" para limitar a consulta por data de publicação
- Descarregue as ESTs de S. mansoni de 1993 e renomei para sm_ests_93. Transfira por SFTP (secure FTP) para biotec, conta lab, para um diretório com seu nome dentro da pasta "ests".
- Uma opção para formar uniques a partir das ESTs é utilizar o programa tgicl que clusteriza as ESTs e posteriormente forma contigs com Cap3.
A contagem de ESTs do mesmo cluster pode ser feita analisando-se o resultado de megablast
Primeiro formate as ests com
Separe somente aquelas comparações com alinhamento > 100:
cat ../miguel/hsa_megablast | awk '$4 > 100 {print $0}' | more
agora adicione um outro pipe para selecionar alinhamentos com mais de 96% de identidade
cat ../miguel/hsa_megablast | awk '($4 >= 100 && $3 != "100.00") {print $0}'| more
agora contearemos as repetições
cat ../miguel/hsa_megablast | awk '($4 >= 100 && $3 != "100.00") {print $1}' | sort | uniq -c | sort -k 1,1 -n -r | more
agora vamos recuperar a seqüência mais repetida com fastacmd
fastacmd -s T14491.1 -d sm_ests_1993 -o seq32
e vamos ver com quem ela alinha
megablast -i seq32 -d sm_ests_1993 -e 1e-10 -o hits32 &
agora inspecione o resultado hits32 e verifique a estrutura de DNA repetitivo desta seqüência.
- Vamos agora verificar quantas dão hit contra a base de dados KOG
blastall -i sm_ests_1993 -d /var/www/html/pct/db/kyva -e 1e-10 -p blastx -o sm_kog -m 8 &
UNIGENE DD
Uma maneira de explorar a expressão de unigenes já montados é utilizando a ferramenta do NCBI Digital Differential Display (DDD)
- Selecione Homo sapiens
- Clique abaixo de Edit... A em "New..." e agora vc tem dois pools para comparar
- Clique em Edit... A e selecione ADULT BRAIN e todas as outras entradas de brain (mude a Description para BRAIN e Accept changes)
- Clique em Edit... B e selecione todas as bibliotecas de muscle e skeletal muscle (mude a Description para muscle e Accept changes)
- Verifique a expressão diferencial de alguma proteína (clique nela e dentro de seu report clique em Expression Profile.
SAGE
É um método de documentação de tags de mRNA constituídas das bases subseqüentes (um número pequeno, cerca de dezenas) ao último sítio de uma dada enzima de restrição.
- Entre em SAGE Anatomic Viewer
- Entre com o gene symbol da catalase "CAT" e veja a tag para catalase, mapeada em 3 fontes diferentes.
- Clique no homemzinho e nos outros símbolos e verifique a expressão diferencial em tecido normal e tumoral. Qual o número de Tags normal?
- Compare com a contagem feita pelo Unigene
- Compare com a contagem feita pelo K-EST
- É possível também, similarmente ao DDD, comparar a freqüência de SAGE Tags
RaSH, RDA eoutras maneiras de clonar genes diferencialmente expressos
Experimento complementar: Verifique no site Kegg as seqüências humanas de enzimas da via glicolítica e conte o número de hits em ESTs humanas (servidora biotec, pasta ests). Escolha a via, acerte para Homo sapiens e clique em cada proteína e obtenha o FASTA dela clicando em NT seq (exemplo)