Artemis e ACT para Windows
Artemis V10 for Windows
- Java?
ACT V7 for Windows
TUTORIAL ARTEMIS
O artemis é um programa desenvolvido
pelo Sanger que permite visualizar e editar
seqüências anotadas. Ele é FREE!
1. Instalar o programa artemis
O artemis é escrito na
linguagem Java, então precisamos primeiro instalar no computador a versão windows do Java.
http://java.com/en/download/index.jsp
Instalar a versão Windows do artemis
http://www.sanger.ac.uk/Software/Artemis/v10/
WWW:
Artemis V10 for Windows
ATENÇÃO: Se o arquivo for
salvo com a extensão zip, não descompacte o arquivo. Renomeá-lo como .jar
2. O artemis reconhece
arquivos do formato GenBank,
EMBL, entre outros. O próximo passo é fazer a busca no Genbank
da seqüência a
ser inspecionada no artemis.
Sequencias de T. brucei
e L. major
http://www.ncbi.nlm.nih.gov/mapview/
Clicar na janela “Search” e
encontrar a opção Trypanosoma brucei/Leishmania major
GO
Clicar no cromossomo 1 de T.brucei e cromossomo 20 de L.major
Download/View Sequence/Evidence
Baixar ambos formatos de cada
sequencia – FASTA e Genbank
Sequencia de T. cruzi
No Nucleotide Entrez: http://www.ncbi.nlm.nih.gov/sites/entrez?db=nuccore&itool=toolbar
Buscar a scaffold de Trypanosoma cruzi
1047053517117
Baixar essa seqüência do GenBank. Precisamos do formato GenBank(Full)
Salvar a seqüência em um arquivo.
3. Para iniciar o artemis é
só clicar no arquivo executável JAR.
4. Para abrir a seqüência no artemis,
clicar em “File” , “Open” e selecionar o arquivo no formato do Genbank que vc salvou.
PS: para visualizar o arquivo, selecionar “All Files” na janela “Files of Type”
Se
aparecer a mensagem – there
are warnings while reading – view now? à Clicar em NO
5. Vc pode fazer alterações,
deletar e criar novos genes.
Para deletar –
selecionar o gene e clicar na tecla "Delete“ do
computador
Para criar novos modelos
Clicar numa janela aberta de leitura
Vá ao menu “Select“, clicar
em “Open reading frame”
Vai aparecer uma caixa correspondente à janela aberta
de leitura
Digite “c“
Vai abrir uma janela “Edit
CDS”
Clicar em OK
Pronto, vc criou um
"gene model“ !!
Veja de sua proteína predita possui uma metionina na posição 1. Para isso, clique duas vezes no
gene que vc criou e observe a seqüência de proteína
predita
Para ‘trimar’ a seqüência
protéica predita ate a próxima metionina. Clicar no
gene a ser “trimado” e depois CRTL t
6. Veja se sua proteína possui homologia com outra seqüência do Genbank
Para gerar o arquivo fasta da
proteína predita
Selecione o gene
Vá no menu “View“, clicar em
“Amino acids of selecion as FASTA”
Copiar a seqüência e rodar o blastp
no NCBI http://www.ncbi.nlm.nih.gov/
Se não obtiver resultado significativo, deletar o gene
Se tiver resultado significativo e não for um gene na
mesma janela de leitura de outro já anotado, escreva pro Sanger!!
ACT – Artemis Comparative
Tool
O ACT é um programa baseado no artemis
que permite visualizar comparações múltiplas de genomas. Ele também é FREE!
1. Para rodar o ACT precisa-se de pelo menos 3
arquivos. Dois arquivos com as seqüências a serem comparadas que podem ser
anotadas (formato anotado do Genbank, por exemplo) ou
não (fasta) e um arquivo de comparação entre as duas seqüências.
2. Nós já temos os arquivos das seqüências. Precisamos
agora gerar o arquivo comparativo. Na verdade vamos gerar dois arquivos
comparativos: seqüência de T.brucei versus L. major e
seqüência de T.brucei versus T. cruzi.
a. Copiar na máquina maracatu os arquivos referentes às seqüências dos
cromossomos T.brucei 1 e L.major 20 e da scaffold de T.cruzi 1047053517117
(arquivos .fasta, ou seja não anotados). Use o editor vi.
b. Vamos formatar a seqüência de T.brucei como
banco de dados:
formatdb -pF -i Tb_Chr1.fasta
c. Vamos rodar o programa tblastx entre as seqüências
de (Tb e Lm) e (Tb e Tc).
IMPORTANTE: deve-se rodar o blastall
usando o parametro –m8
blastall -p tblastx -d Tb_Chr1.fasta -i
Tc_1047035317117.fasta -m8 > Tb.vs.Tc
blastall -p tblastx -d Tb_Chr1.fasta -i Lm_Chr20.fasta
-m8 > Tb.vs.Lm
O arquivo de saída deve ter o seguinte formato:
Lmajor_Chr20 Tbrucei_Chr1 69.19
977 301 0 97007
94077 277208 274278
0.0 1660
...
d. Para gerar o arquivo comparativo vamos precisar selecionar os seguintes
campos:
Col.12:
score
Col.3:
% identidade
Col.7:
Query start
Col.8:
Query end
Col.1:
Query sequence name
Col.9:
Subject start
Col.10:
Subject end
Col.2:
Subject sequence name
Para gerar o arquivo comparativo com estes campos
nesta ordem, vamos usar o comando AWK
awk -F "\t" '{if ($12>100) {print $12,$3,$7,$8,$1,$9,$10,$2}}' Tb.vs.Lm > Tb.vs.Lm.comparative
awk -F "\t" '{if ($12>100) {print $12,$3,$7,$8,$1,$9,$10,$2}}' Tb.vs.Tc > Tb.vs.Tc.comparative
O arquivo de saída deve ter o seguinte formato:
1660 69.19 97007 94077 Lmajor_Chr20 277208 274278
Tbrucei_Chr1
...
3. Abrir os arquivos comparativos com o vi e copiar
num arquivo txt no Windows. Colocar no mesmo
diretório dos arquivos anotados dos cromossomos Tb1 e Lm20
4. Agora estamos prontos para rodar o ACT usando a
seqüência de T.brucei
como referência na comparação dos genomas.
Clicar no arquivo act_v7.jar
Clicar em file à Open
Sequence file 1: seqüência anotada do cromossomo 20 de Lm
Comparison file 1: Tb.vs.Lm.comparative
Sequence file 2: seqüência anotada do cromossomo 1 de Tb
Clicar em “More files...”
Comparison file 2: Tb.vs.Tc.comparative
Sequence file 3: seqüência anotada da scaffold 1047053517117
de Tc