Treinamento em Bioinformática 2008


COG e outros agrupamentos de homólogos


Algoritmo:

·        Considere dois genomas completos. Um proteína do genoma A tem seu melhor hit BLAST no genoma B, não importa o score ou o E-value. Esta proteína do genoma B, quando alinhada com o genoma A, estabelece um Bidiretional Best Hit (BBH). Elas só podem ser homólogas! A fundação de um COG exige um triângulo. A<BBH>C<BBH>B<BBH>A

 

Buscas no COG:

·        A versão atual tem 66 genomas (chamar de “genomas” as espécies, cepas, etc.). A versão antiga tem o COGnitor. Teste!

·        Uma ferramenta disponível no lab Biodados permite o BLAST em COG: Protein Classification Tool. Usando a PCT, descubra a qual COG pertence a seqüência teste.

·        Visitando o COG versão atual, verifique a categoria funcional M. Verifique a distribuição do referido COG. Doido ?

·        As árvores que fizemos utilizaram FASTAs selecionados de alguns COGs.

·        O lab Biodados têm um produto (UECOG) que é o COG aumentado com clusters UniRef50, aumentando o número de seqüências e de espécies. Proteínas de genomas incompletos são incluídas para enriquecer os clusters COG, desde que um membro COG participe do agrupamento UniRef50. Navegue no UECOG para conhecer o agrupamento que está sendo analisado. Eram 11 entradas, agora são 66, todas de proteobactéria. A página da categoria M permite descarregar de forma prática os FASTAs.

 

KOG eucarioto:

·        A versão atual  compreende alguns organismos apenas. Possui um Kognitor. Teste!

·        A PCT também faz buscas no KOG. Teste a mesma seqüência acima.

·        O lab Biodados tem um serviço (K-EST) que permite a verificação da expressão medida pelo número de ESTs por cada 100 mil ESTs. Vc pode navegar pelas categorias funcionais. Ou pode fazer buscas (procure enolase). Ou pode fazer um BLAST. Vamos fazer um BLAST dessas duas seqüências selecionando a área de CONSERVATION (ela mostra as ESTs associadas às proteínas KOG do organismo, e também aquelas que seriam anotadas pelos demais).

 

Kegg Orthology:

·        Falaremos mais na próxima aula. Tb agrupa ortólogos e parálogos. Hj faremos uma prática buscando uma via e analisando sua expressão em bibliotecas de cDNA diferentes.

 

Seed Linkage:

·        É um programa do lab Biodados que permite formar agrupamentos de genes homólogos mas não é preciso que os organismos tenham genomas completos, nem é necessário fazer o BLAST de todas as proteínas contra todas, ele se concentra nas que estão sendo agrupadas. Testaremos o Seed Linkage utilizando três agrupamentos COG que foram usado tb para fazer árvores.


E-mail Miguel