Programação  
 
Conhecimento computador >> Programação >> Programação De Computador Idiomas >> 
Introdução às Técnicas de Classificação em Bioinformática
Bioinformática é a aplicação de técnicas de informática para o campo da biologia. Os objetivos da bioinformática são para auxiliar cientistas de vida na organização de dados biológicos e desenvolver as ferramentas informáticas necessárias para a descoberta de novas hipóteses científicas . Técnicas de classificação , também conhecidas como técnicas de agrupamento , são importantes em bioinformática , pois permitem a separação de vários dados biológicos com atributos semelhantes em conjuntos distintos. História

O tamanho dos dados biológicos tem vindo a crescer de forma exponencial, com a duplicação de informações observadas a cada 15 meses. Como resultado , as técnicas de ciência da computação e informática são usados ​​intensivamente no processamento e gestão de dados biológicos. O conceito fundamental em bioinformática é que a maioria dos dados biológicos têm características semelhantes e podem ser separados em grupos . Por exemplo , os genes de um organismo, podem ser classificadas em seus grupos funcionais , ou vias metabólicas . As proteínas também podem ser classificados com base nos genes que são expressos . Classificação ou agrupamento técnicas são necessárias na gestão de grandes bases de dados de dados genéticos e biológicos. Existem dois tipos principais de técnicas de classificação em bioinformática : . A hierárquicos e as técnicas de classificação K-means

Classificação Hierárquica

A técnica de classificação hierárquica organiza dados biológicos em um estrutura de dados em árvore . Os genes são expressos como nós na árvore , ao passo que cada uma das sub - árvore de nós representa um grupo ou um agrupamento de genes . A árvore pode ser enraizadas ou não enraizadas . Uma árvore enraizada é definida como uma árvore com apenas um único nó no topo. Em contraste, uma árvore não enraizadas tem vários nós de nível superior .
K- Means Classificação

A técnica de classificação mais complicada é a classificação k -Means , que tenta encontrar um conjunto de centros que minimizam a distorção erro quadrado entre os conjuntos de dados no espaço multidimensional. Um cluster é classificada pelo agrupamento de pontos relacionados ao seu centro mais próximo. O algoritmo de Lloyd é frequentemente utilizado na técnica de classificação k- Means. Neste algoritmo , os pontos de dados são dispostos aleatoriamente em grupos separados , que são posteriormente otimizadas para produzir as mínimas distorções erro quadrado locais.

Significado

proteínas Depois relacionados foram classificadas em grupos semelhantes , cientistas da vida pode usar essa informação para prever as propriedades de certas proteínas menos estudadas. Isto também é aplicável a outros aspectos da estrutura das proteínas . Outra utilização de técnicas de classificação é o de resolver o problema da determinação da árvore evolutiva de certos organismos com base nas suas sequências genéticas . A árvore evolutiva é construído a partir da sequência de DNA do organismo usando técnicas de classificação hierárquica ou k- médias.

Considerações

técnica de classificação hierárquica é relativamente simples e eficaz forma de agrupamento de dados biológicos. Em contraste , nenhum algoritmo eficiente existe no momento de escrita , que é capaz de executar a técnica de classificação k - efectivamente significa que o tamanho dos dados biológicos aumenta . Isto sugere que um grande poder computacional é muitas vezes necessária para realizar a classificação k -Means , que é um fator importante a considerar ao escolher a técnica de classificação para usar em aplicações de bioinformática .

Anterior :

Próximo : No
  Os artigos relacionados
·A importância de Estruturas de Decisão em Programaçã…
·Como depurar em DLL 
·Sobre o COBOL Língua 
·Como compilar SWC 
·Como excluir arquivos usando T-SQL 
·Como criar duas colunas Usando Div 
·Como acessar elementos de uma matriz bidimensional 
·Como contar a NaN em MATLAB 
·Como Fazer a saída Eclipse Console buffer maior 
·O que está perto PASCAL e FAR PASCAL 
  Artigos em destaque
·Como criar uma lista no GridView 
·Como calcular a soma dos números ímpares em Linguagem…
·Como corrigir o GCC Aviso declaração implícita de Fu…
·Como fazer um Mashup Web 
·Tipos de dados de atributos de variáveis ​​
·Como adicionar um cabeçalho para Datagrid 
·Como fechar uma janela órfão depois que um registro é…
·Como Reescrever uma Declaração Then_If 
·Como usar o CFC no ColdFusion 
·Como arredondar decimais em C + + 
Cop e direita © Conhecimento computador http://ptcomputador.com Todos os Direitos Reservados