Treinamento
em Bioinformática 2008
Seed
Linkage
Seed Linkage:
- Obtenha
o Seed Linkage aqui.
Entre em Downloads e copie o link “Scripts” para
salvar com wget em sua pasta aula_seed.
- Descompacte
com $tar –xvzf
seedlinkage.1.0.tar.gz
- Vamos usar 3 agrupamentos COG que temos usado para gerar árvores.
Entre na pasta que veio com o Seed Linkage chamada databases.
- Copie o arquivo fasta para ela:
$cp /home/treinamento/aula_seed/cog.fasta . [opag]
·
Vc tem que
formatar a database:
$formatdb –i cog.fasta –p T –o T
·
Por obséquio saia fora do databases $cd ..
·
Copie o arquivo de informação
taxonômica das seqüências
$cp /home/treinamento/aula_seed/cog.txid . [opag]
·
Aproveite e copie o arquivo de
informação de qual cog agrupa quais seqüências: cog.info
$cp /home/treinamento/aula_seed/cog.info . [opag]
Acesso ao MySQL:
·
$ mysql
-u Gabriel
·
mysql> create database seunome
·
mysql>
show databases;
·
mysql>
use seu_nome;
·
mysql>
show tables;
·
criar tabela para o Seed Linkage consultar os txid assim:
·
mysql> create table txid (id varchar(15),
txi varchar(8)); [atenção é txi mesmo]
·
mysql> load data local infile
'/home/seulogin/aula_seed/cog.txid' into table txid;
·
Pronto! mysql>exit
Rodando o Seed Linkage:
- Vamos utilizar todas as seqüências como Seed para formar o máximo de clusters, gerando o
arquivo de Seeds assim:
- $cat cog.txid | awk
‘{print $1}’ > seeds
- Configure o Seed
linkage:
- $vi config.php e dê “i" para INSERT
MODE
- Troque
$user=”username”; por $user=”gabriel”;
- Troque
$pwd=”password”; por $pwd=””;
- Troque
$mysql_db=”seedlinkage”;
por $mysql_db=”seunome”;
- Troque
$table_mysql=”proteomes”; por $table_mysql=”txid”;
- Troque
$multifasta_path=”./databases/proteomes.fasta”; por $multifasta_path=”./databases/cog.fasta”;
- Troque
os caminhos dos binários blastall, fastacmd e formatdb
para como está na macacatu: /usr/local/BLAST/blast-2.2.17/bin/blastall
- Agora vamos rodar com screen
para poder sair do terminal
- $screen php batch_seed_linkage.php –i
seeds –d cog.fasta –r 50 –s 50 –c 50 –l 0.3
- Para destacar do screen dê control + A; control + D. Para restaurar ao terminal dê screen –rf. Qdo acabar acabou.
- Olhe a saída seeds.clusters. Vamos juntar os clusters sobrepostos (desambiguar!):
- $php evaluate_similarity.php
seeds.clusters
Análise dos resultados:
- Olhe o resultado seeds.clusters.disambiguated e ache lindo
- Vamos colocar ela em banco
- $ mysql -u gabriel
- mysql>
use seu_nome;
- mysql>
show tables;
- criar tabela assim:
- mysql> create table result_sl (cluster int(11), txid
varchar(8), uniprot_ac varchar(15));
- mysql>
load data local infile
'/home/seulogin/aula_seed/seeds.clusters.disambiguated' into table
result_sl;
- criar tabela com o cog.info
que já baixamos
- mysql> create table info (uniprot_ac varchar(15), txid
varchar(8), cognum varchar(10), description text);
- mysql>
load data local infile
'/home/seulogin/aula_seed/cog.info’ into table info;
- Vamos consultar qual cluster Seed Linkage é de qual COG
- mysql>
select result_sl.uniprot_ac, result_sl.cluster, info.cognum from result_sl, info where result_sl.uniprot_ac = info.uniprot_ac order by cluster;
- Compare os clusters COG e Seed Linkage
- Pronto!
mysql>exit
E-mail Miguel