ESTs, SAGE e RDA


Atividades:
  1. Diferenças e similaridades entre ESTs e ORESTES
  2. O fim de uma EST depende dos parâmetros de PHRED
  3. Número de ESTs no dbEST hoje
  4. Como descarregar ESTs
    NCBI - Search "Nucleotide" for:
  5. Descarregue as ESTs de S. mansoni de 1993 e renomei para sm_ests_93. Transfira por SFTP (secure FTP) para biotec, conta lab, para um diretório com seu nome dentro da pasta "ests".
  6. Uma opção para formar uniques a partir das ESTs é utilizar o programa tgicl que clusteriza as ESTs e posteriormente forma contigs com Cap3.
    A contagem de ESTs do mesmo cluster pode ser feita analisando-se o resultado de megablast
    Primeiro formate as ests com
    Separe somente aquelas comparações com alinhamento > 100:
    cat ../miguel/hsa_megablast | awk '$4 > 100 {print $0}' | more
    agora adicione um outro pipe para selecionar alinhamentos com mais de 96% de identidade
    cat ../miguel/hsa_megablast | awk '($4 >= 100 && $3 != "100.00") {print $0}'| more
    agora contearemos as repetições
    cat ../miguel/hsa_megablast | awk '($4 >= 100 && $3 != "100.00") {print $1}' | sort | uniq -c | sort -k 1,1 -n -r | more
    agora vamos recuperar a seqüência mais repetida com fastacmd
    fastacmd -s T14491.1 -d sm_ests_1993 -o seq32
    e vamos ver com quem ela alinha
    megablast -i seq32 -d sm_ests_1993 -e 1e-10 -o hits32 & agora inspecione o resultado hits32 e verifique a estrutura de DNA repetitivo desta seqüência.
  7. Vamos agora verificar quantas dão hit contra a base de dados KOG
    blastall -i sm_ests_1993 -d /var/www/html/pct/db/kyva -e 1e-10 -p blastx -o sm_kog -m 8 &

UNIGENE DD
Uma maneira de explorar a expressão de unigenes já montados é utilizando a ferramenta do NCBI Digital Differential Display (DDD)
SAGE
É um método de documentação de tags de mRNA constituídas das bases subseqüentes (um número pequeno, cerca de dezenas) ao último sítio de uma dada enzima de restrição.
RaSH, RDA eoutras maneiras de clonar genes diferencialmente expressos
Experimento complementar: Verifique no site Kegg as seqüências humanas de enzimas da via glicolítica e conte o número de hits em ESTs humanas (servidora biotec, pasta ests). Escolha a via, acerte para Homo sapiens e clique em cada proteína e obtenha o FASTA dela clicando em NT seq (exemplo)