MCBio
Modelos computacionais para estabelecimento de meios e procedimentos metodológicos para análise de dados em bioinformática - MCBio
Projeto em colaboração com EMBRAPA Gado de Leite
Coodenador: Wagner Arbex
Resumo do Projeto
A tecnologia da informação utilizada como ferramenta pela pesquisa científica revolucionou as ciências biológicas, assim como fez com diversos outros campos da ciência e, considerando a quantidade exponencialmente crescente e a complexidade dos dados científicos que estão sendo gerados e que necessitam ser eficientemente manuseados, traduzidos, processados e comunicados, são necessários novos recursos computacionais para o tratamento eficaz de todo esse volume de dados que possibilite transformá-lo em conhecimento e, em seguida, como última instância desse processo, seja possível aplicar o conhecimento gerado para permitir ou incrementar avanços tecnológicos que, por sua vez, provocam a modernização dos setores produtivos. Juntamente com essa condição causadora da modernização, a tecnologia da informação ou, em específico, a computação assumiu um papel importante em todas as áreas, inclusive no mundo da pesquisa científica. A utilização de modelos computacionais e matemáticos como uma ferramenta para a pesquisa biológica faz com que seja possível não só a interpretação do conteúdo facilmente identificado em dados depositados em diversas bases, mas, também, com a utilização dos recursos computacionais apropriados para processar as grandes quantidades de dados científicos, possibilita a conversão de dados científicos em tecnologias, serviços ou produtos (TSP) inovadores para o usuário final, a partir da interpretação de relações entre os dados que não foram percebidas anteriormente. Nesse aspecto, a utilização de modelos computacionais e matemáticos adequados, fundamentados sobre técnicas de aprendizado de máquina, permite que várias questões científicas possam ser abordadas sob uma nova ótica de análise de resultados de pesquisas, como uma nova estratégia metodológica de observação desses resultados, com a proposta de que novas formas de análise possam trazer novas TSPs. A proposta de que sejam adotados modelos computacionais para essa análise, vem complementar métodos frequentemente utilizados, como a abordagem estatística que, em geral, baseia-se no teste de experimentos frente a uma hipótese anteriormente definida. Entretanto, as necessidades atuais dos projetos de pesquisas requerem a geração e avaliação de centenas e até milhares de hipóteses, o que faz com que somente sejam avaliadas por modelos computacionais. Esse cenário é ainda mais desafiador quando se percebe o quanto são complexos os conjuntos de dados atualmente gerados, cujas caraterísticas, entre outras, incluem grande volume de dados, onde conjuntos de dados da ordem de terabytes estão se tornando comuns; alta dimensionalidade, quando se trabalha com centenas ou milhares de atributos; heterogeneidade, visto que diferentemente de métodos tradicionais de análise, os modelos computacionais são adequados a dados de diferentes tipos, descontínuos e não categorizados; múltipla localização física dos conjuntos de dados, uma vez que é comum que esses conjuntos não se encontrem centralizados em um único local, mas distribuídos ou dispersos em diversos repositórios. Entre os pontos de promoção do desenvolvimento institucional relativos a essa proposta, destacam-se a aderência aos objetivos do IV PDU da Embrapa Gado de Leite, onde se lê, "contribuir para o avanço da fronteira do conhecimento e incorporar novas tecnologias, inclusive as emergentes"; o início de uma abordagem inovadora de investigação para os projetos de pesquisa da Embrapa Gado de Leite, tendo como partida trabalhos em bioinformática e biologia computacional e o estabelecimento de uma nova parceria e um novo grupo de trabalho entre a Embrapa Gado de Leite, a Embrapa Soja, a Embrapa Agroenergia, a Universidade Federal de Juiz de Fora , a Universidade Federal do Rio de Janeiro e a Universidade de Brasília.

