COG e outros agrupamentos de homólogos
Algoritmo:
·
Considere dois genomas
completos. Um proteína do genoma A tem seu melhor hit
BLAST no genoma B, não importa o score ou o E-value. Esta proteína do genoma B, quando alinhada com o
genoma A, estabelece um Bidiretional Best Hit (BBH). Elas só podem ser homólogas! A fundação de
um COG exige um triângulo. A<BBH>C<BBH>B<BBH>A
Buscas no COG:
·
A versão atual tem 66
genomas (chamar de “genomas” as espécies, cepas, etc.). A versão antiga tem o COGnitor. Teste!
·
Uma ferramenta disponível
no lab Biodados permite o BLAST em COG: Protein Classification Tool. Usando a
PCT, descubra a qual COG pertence a seqüência teste.
·
Visitando o COG versão atual,
verifique a categoria funcional M. Verifique a
distribuição do referido COG. Doido né?
·
As árvores que fizemos
utilizaram FASTAs
selecionados de alguns COGs.
·
O lab
Biodados têm um produto (UECOG) que é o COG
aumentado com clusters UniRef50, aumentando o número de seqüências e de espécies.
Proteínas de genomas incompletos são incluídas para enriquecer os clusters COG,
desde que um membro COG participe do agrupamento UniRef50. Navegue no UECOG
para conhecer o agrupamento que está sendo analisado.
Eram 11 entradas, agora são 66, todas de proteobactéria.
A página da categoria M
permite descarregar de forma prática os FASTAs.
KOG eucarioto:
·
A versão atual compreende alguns organismos apenas. Possui um
Kognitor. Teste!
·
A PCT também faz buscas no KOG. Teste
a mesma seqüência acima.
·
O lab
Biodados tem um serviço (K-EST) que permite a verificação da expressão medida
pelo número de ESTs por cada 100 mil
ESTs. Vc pode navegar pelas categorias funcionais.
Ou pode fazer buscas
(procure enolase). Ou pode fazer um BLAST. Vamos fazer um
BLAST dessas duas seqüências selecionando a área de CONSERVATION (ela mostra as ESTs associadas às
proteínas KOG do organismo, e também aquelas que seriam anotadas pelos demais).
Kegg Orthology:
·
Falaremos mais na próxima aula. Tb
agrupa ortólogos e parálogos.
Hj faremos uma prática buscando uma via e analisando sua expressão em
bibliotecas de cDNA
diferentes.
Seed Linkage:
·
É um programa do lab
Biodados que permite formar agrupamentos de genes homólogos mas não é preciso
que os organismos tenham genomas completos, nem é necessário fazer o BLAST de
todas as proteínas contra todas, ele se concentra nas que estão sendo agrupadas.
Testaremos
o Seed Linkage utilizando
três agrupamentos COG que foram usado tb para fazer árvores.