Imagem meramente ilustrativa, 'Fotografia quase científica dentro da fantasia' -  (crédito: Flickr/Eladio Osuna )

Imagem meramente ilustrativa, 'Fotografia quase científica dentro da fantasia'

crédito: Flickr/Eladio Osuna


Pesquisadores do Reino Unido desenvolveram um banco de dados acessível ao público, o “Unknome“ (desconhecido), que lista milhares de proteínas pouco estudadas e codificadas por genes humanos. Ao atribuir uma pontuação de “conhecimento” a cada proteína com base no conhecimento científico existente, a plataforma ajuda os investigadores a explorar as funções destas proteínas, muitas das quais desempenham papéis críticos nos processos celulares.

Aprimorando o foco em proteínas desconhecidas

Esses pesquisadores britânicos desenvolveram um novo banco de dados acessível ao público e esperam vê-lo diminuir com o tempo. O banco de dados é fruto do trabalho de Matthew Freeman, da Dunn School of Pathology, Universidade de Oxford, Inglaterra, e Sean Munro, do Laboratório MRC de Biologia Molecular em Cambridge, Inglaterra, e colegas, e é descrito no revista de acesso aberto PLOS Biology. As suas próprias investigações de um subconjunto de proteínas na base de dados revelam que a maioria contribui para funções celulares importantes, incluindo o desenvolvimento e a resiliência ao estresse.

O sequenciamento do genoma humano deixou claro que este codifica milhares de sequências proteicas prováveis, cujas identidades e funções ainda são desconhecidas. Existem múltiplas razões para isto, incluindo a tendência de concentrar os escassos dólares de investigação em alvos já conhecidos, e a falta de ferramentas, incluindo anticorpos, para interrogar as células sobre a função destas proteínas.

Mas os riscos de ignorar essas proteínas são significativos, argumentam os autores, uma vez que é provável que algumas, talvez muitas, desempenhem papéis importantes em processos celulares críticos e possam fornecer informações e alvos para intervenção terapêutica.

Para promover uma exploração mais rápida de tais proteínas, os autores criaram uma base de dados desconhecida, que atribui a cada proteína uma pontuação de “conhecimento”, refletindo as informações da literatura científica sobre função, conservação entre espécies, compartimentalização subcelular e outros elementos.

Com base neste sistema, existem muitas milhares de proteínas cujo conhecimento é próximo de zero. Estão incluídas proteínas de organismos modelo, juntamente com aquelas do genoma humano. A base de dados é aberta a todos e personalizável, permitindo ao usuário fornecer seus próprios pesos para diferentes elementos, gerando assim seu próprio conjunto de pontuações de conhecimento para priorizar sua própria pesquisa.

Para testar a utilidade da base de dados, os autores escolheram 260 genes em humanos para os quais havia genes comparáveis em moscas, e que tinham pontuações de conhecimento de 1 ou menos em ambas as espécies, indicando que quase nada se sabia sobre eles. Para muitos deles, um nocaute completo do gene era incompatível com a vida na mosca; knockdowns parciais ou knockdowns específicos de tecidos levaram à descoberta de que uma grande fração contribuiu para funções essenciais que influenciam a fertilidade, o desenvolvimento, o crescimento dos tecidos, o controle de qualidade das proteínas ou a resistência ao estresse.

Os resultados sugerem que, apesar de décadas de estudo detalhado, existem milhares de genes de moscas que continuam a ser compreendidos mesmo ao nível mais básico, e o mesmo é claramente verdade para o genoma humano. Esses genes não caracterizados mereceram maior atenção. O banco de dados desenvolvido fornece uma plataforma poderosa, versátil e eficiente para identificar e selecionar genes importantes de função desconhecida para análise, acelerando assim o fechamento da lacuna no conhecimento biológico que o desconhecido representa.

O papel de milhares de proteínas humanas permanece obscuro e, no entanto, a investigação tende a concentrar-se naquelas que já são bem compreendidas. Para ajudar a resolver isso, esses pesquisadores desenvolveram então esse banco de dados Unknome, o qual classifica as proteínas com base no pouco que se sabe sobre elas, além de proporcionar triagens funcionais em uma seleção dessas proteínas misteriosas para demonstrar como o desconhecido pode impulsionar a descoberta biológica.