Artemis e ACT para Windows

 

*       Artemis V10 for Windows - Java?

 

*       ACT V7 for Windows
 

TUTORIAL ARTEMIS

 

O artemis é um programa desenvolvido pelo Sanger que permite visualizar e editar seqüências anotadas. Ele é FREE!

 

1. Instalar o programa artemis

O artemis é escrito na linguagem Java, então precisamos primeiro instalar no computador a versão windows do Java.  

http://java.com/en/download/index.jsp

 

Instalar a versão Windows do artemis

http://www.sanger.ac.uk/Software/Artemis/v10/

WWW:  Artemis V10 for Windows

 

ATENÇÃO: Se o arquivo for salvo com a extensão zip, não descompacte o arquivo. Renomeá-lo como .jar

 

2. O artemis reconhece arquivos do formato GenBank, EMBL, entre outros. O próximo passo é fazer a busca no Genbank da seqüência  a ser inspecionada no artemis.

 

Sequencias de T. brucei e L. major

http://www.ncbi.nlm.nih.gov/mapview/

*       Clicar na janela “Search” e encontrar a opção Trypanosoma brucei/Leishmania major

*       GO

*       Clicar no cromossomo 1 de T.brucei e cromossomo 20 de L.major

*       Download/View Sequence/Evidence

*       Baixar ambos formatos de cada sequencia – FASTA e Genbank

 

Sequencia de T. cruzi

*       No Nucleotide Entrez: http://www.ncbi.nlm.nih.gov/sites/entrez?db=nuccore&itool=toolbar

*       Buscar a scaffold de Trypanosoma cruzi 1047053517117

*       Baixar essa seqüência do GenBank. Precisamos do formato GenBank(Full)

*       Salvar a seqüência em um arquivo.

 

3. Para iniciar o artemis é só clicar no arquivo executável JAR.

 

4. Para abrir a seqüência no artemis, clicar em “File” , “Open” e selecionar o arquivo no formato do Genbank que vc salvou.

PS: para visualizar o arquivo, selecionar “All Files” na janela “Files of Type

 

Se aparecer a mensagem – there are warnings while reading – view now? à Clicar em NO

 

5. Vc pode fazer alterações, deletar e criar novos genes.

 

Para deletar – selecionar o gene e clicar na tecla "Delete“ do computador

 

Para criar novos modelos

 

Clicar numa janela aberta de leitura

Vá ao menu “Select“, clicar em “Open reading frame”

Vai aparecer uma caixa correspondente à janela aberta de leitura

Digite “c“

Vai abrir uma janela “Edit CDS        

Clicar em OK

Pronto, vc criou um "gene model“ !!

 

Veja de sua proteína predita possui uma metionina na posição 1. Para isso, clique duas vezes no gene que vc criou e observe a seqüência de proteína predita

 

Para ‘trimar’ a seqüência protéica predita ate a próxima metionina. Clicar no gene a ser “trimado” e depois CRTL t

 

6. Veja se sua proteína possui homologia com outra seqüência do Genbank

 

Para gerar o arquivo fasta da proteína predita

           

*       Selecione o gene

*       Vá no menu “View“, clicar em “Amino acids of selecion as FASTA”

*       Copiar a seqüência e rodar o blastp no NCBI http://www.ncbi.nlm.nih.gov/

           

Se não obtiver resultado significativo, deletar o gene

Se tiver resultado significativo e não for um gene na mesma janela de leitura de outro já anotado, escreva pro Sanger!!

 

ACT – Artemis Comparative Tool

 

O ACT é um programa baseado no artemis que permite visualizar comparações múltiplas de genomas. Ele também é FREE!

 

1. Para rodar o ACT precisa-se de pelo menos 3 arquivos. Dois arquivos com as seqüências a serem comparadas que podem ser anotadas (formato anotado do Genbank, por exemplo) ou não (fasta) e um arquivo de comparação entre as duas seqüências.

 

2. Nós já temos os arquivos das seqüências. Precisamos agora gerar o arquivo comparativo. Na verdade vamos gerar dois arquivos comparativos: seqüência de T.brucei versus L. major e seqüência de T.brucei versus T. cruzi.

 

a. Copiar na máquina maracatu os arquivos referentes às seqüências dos cromossomos T.brucei 1 e L.major 20 e da scaffold de T.cruzi 1047053517117 (arquivos .fasta, ou seja não anotados). Use o editor vi.

 

b. Vamos formatar a seqüência de T.brucei como banco de dados:

 

formatdb -pF -i Tb_Chr1.fasta

 

c. Vamos rodar o programa tblastx entre as seqüências de (Tb e Lm) e (Tb e Tc).

 

IMPORTANTE: deve-se rodar o blastall usando o parametro –m8

 

blastall -p tblastx -d Tb_Chr1.fasta -i Tc_1047035317117.fasta -m8 > Tb.vs.Tc

 

blastall -p tblastx -d Tb_Chr1.fasta -i Lm_Chr20.fasta -m8 > Tb.vs.Lm

 

O arquivo de saída deve ter o seguinte formato:

Lmajor_Chr20    Tbrucei_Chr1    69.19   977     301     0       97007   94077   277208  274278  0.0     1660

...

d. Para gerar o arquivo comparativo vamos precisar selecionar os seguintes campos:

Col.12: score

Col.3: % identidade

Col.7: Query start

Col.8: Query end

Col.1: Query sequence name

Col.9: Subject start

Col.10: Subject end

Col.2: Subject sequence name

 

Para gerar o arquivo comparativo com estes campos nesta ordem, vamos usar o comando AWK

 

awk -F "\t" '{if ($12>100) {print $12,$3,$7,$8,$1,$9,$10,$2}}' Tb.vs.Lm > Tb.vs.Lm.comparative

 

awk -F "\t" '{if ($12>100) {print $12,$3,$7,$8,$1,$9,$10,$2}}' Tb.vs.Tc > Tb.vs.Tc.comparative

 

O arquivo de saída deve ter o seguinte formato:

1660 69.19 97007 94077 Lmajor_Chr20 277208 274278 Tbrucei_Chr1

...

 

3. Abrir os arquivos comparativos com o vi e copiar num arquivo txt no Windows. Colocar no mesmo diretório dos arquivos anotados dos cromossomos Tb1 e Lm20

 

4. Agora estamos prontos para rodar o ACT usando a seqüência de T.brucei como referência na comparação dos genomas.

 

Clicar no arquivo act_v7.jar

Clicar em file à Open

Sequence file 1: seqüência anotada do cromossomo 20 de Lm

Comparison file 1: Tb.vs.Lm.comparative

Sequence file 2: seqüência anotada do cromossomo 1 de Tb

 

Clicar em “More files...”

Comparison file 2: Tb.vs.Tc.comparative

Sequence file 3: seqüência anotada da scaffold 1047053517117 de Tc