Escute esse artigo
Tempo de leitura: 4 minutos

 

Instituição de Ensino Superior: UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO ( BOTUCATU )
Programa: CIÊNCIAS BIOLÓGICAS (GENÉTICA) (33004064026P9)
Título: PREDIÇÃO DE FENÓTIPOS DE ESCHERICHIA COLI ATRAVÉS DE REDES BIOLÓGICAS E APRENDIZADO DE MÁQUINA
Autor: ESTHER CAMILO DOS REIS
Tipo de Trabalho de Conclusão: TESE
Data Defesa: 23/01/2015
Resumo:
Uma importante questão levantada logo após o primeiro sequenciamento completo do genoma de um organismo foi: quantos genes são essenciais para a vida celular? Experimentos de deleção individual realizados com a bactéria Escherichia coli revelaram que menos de 10% dos seus genes apresentam essa condição, ou seja, a inativação de cada um deles leva a total inviabilidade da bactéria. A teoria de redes fornece uma representação abstrata de um sistema biológico, onde o conjunto de nodos são os componentes biológicos (proteínas, genes, metabólitos, etc) e o conjunto de arestas são as interações de natureza biológica (interação física entre proteínas, interações metabólicas, interações de regulação transcricional, etc) que conectam cada dois componentes biológicos. A posição dos componentes biológicos em uma rede indica sua importância para a manutenção do sistema biológico. De forma geral, componentes localizados em posições centrais em uma rede biológica são aqueles componentes chaves para a integridade do sistema. Neste trabalho, decidimos investigar a posição dos restantes 90% dos genes considerados não-essenciais na rede integrada de interações gênicas (RIG) de E. coli. Especificamente, investigamos os genes condicionalmente essenciais, isto é, genes que são essenciais somente em determinadas condições de estresse. Além disso, investigamos também a posição na rede de pares de genes que constituem interações genéticas agravantes, isto é, pares de genes que quando deletados conjuntamente agravam a viabilidade do organismo. Utilizando uma abordagem puramente computacional baseada em aprendizado de máquina e propriedades topológicas da RIG, nós criamos modelos preditivos de árvores de decisão para definirmos como esses genes condicionalmente essenciais e as interações genéticas agravantes estão distribuídas na RIG. Ainda, uma lista com as probabilidades de classificação de cada gene/interação foi obtida. A avaliação do desempenho de nossos modelos demonstra que esta metodologia pode ser aplicada com sucesso na predição de genes condicionalmente essenciais auxotróficos e a compreensão das interações genéticas tem aplicações na compreensão de vias alternativas que podem ser úteis para aumentar a produção de metabolitos de interesse.

Palavras-Chave: Escherichia coli, aprendizado de máquina, predição de fenótipos.

Abstract: An important question raised after the first complete genome sequencing was: how many genes are essential for the cell life? Single deletion experiments carried out with the bacteria Escherichia coli unveiled that less than 10% of their genes are essential, which means that the inativation of each one leads to the total bacteria inviability. The network theory provides an abstract representation of a biological system, where a set of nodes are the biological components (protein, genes, metabolites, etc) and the set of edges are the interactions (protein-protein physical interactions, metabolic interactions, transcriptional regulational interactions, etc) that link each two biological components. The position of the biological components in a network indicates its importance for the maintenance of the biological system. In general, components located in central positions in a network are those key components for the system integrity. In this work, we decided to survey the position of the 90% genes considered not essential in integrated network of gene interactions (INGI) of the E. coli. Specifically, we investigated the conditionally essential genes, i. e. those genes essential under some type of stress. Moreover, we also investigated the network position of gene pairs that constitute aggravating genetic interaction, i. e. genes pairs that when deleted simultaneously aggravates the organism viability. Using a purely computational approach based on machine learning and topological properties of the INGI, we created preditive decision trees models to define how those conditionally essential genes and the aggravating genetic interaction are distributed in the INGI. A list with the probability of classification for each gene/interaction were obtained. The performance evaluation of our models demonstrates that this methodology can be applied with success in predicting conditionally essential genes. The prediction of genetic interactions also has applications in the understanding of alternative pathways which may be useful to increase the production of metabolites of interest

Keyword: Escherichia coli, machine learning, phenotypes prediction

Volume: 1
Páginas: 109
Idioma: PORTUGUES
Biblioteca Depositária: UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO ( BOTUCATU )
Autorização de divulgação: O trabalho possui divulgação autorizada
Anexo: genetica_do_2015_Esther_Reis
Área de Concentração: GENETICA
Linha de Pesquisa: GENÔMICA E PROTEÔMICA
Projeto de Pesquisa: CARACTERIZAÇÃO E SIMULAÇÃO DE REDES BIOLÓGICAS

 

Compartilhe!