FASTA é um formato baseado em texto usado em bioinformática para representar seqüências , especialmente aqueles de nucleotídeos e peptídeos , com pares de bases representadas por uma única letra. Uma sequência FASTA consiste na descrição de uma única linha , que se distingue por uma " maior do que " símbolo na primeira linha , seguido de um nucleótido de multi - linha ou sequência peptídica . Você pode extrair várias seqüências de um arquivo FASTA utilizando módulos especiais , ou add- ons, para a linguagem de programação Perl, conhecido como BioPerl , que foram especialmente desenvolvidos para lidar com o formato FASTA . Você também pode codificar manualmente um script Perl para corresponder a padrões em um arquivo ou usar outras ferramentas disponíveis para extrair seqüências FASTA . Coisas que você precisa
arquivo FASTA
editor Perl
BioPerl
ActiveState Perl
Biopieces
Mostrar Mais instruções
1
Inicie o seu Perl aplicação editor. Você pode usar um editor de texto simples , como o Notepad . Você precisará salvar o arquivo com uma extensão ". Pl" para indicar que ele é um programa Perl.
2
Extrair uma seqüência de um arquivo de várias FASTA através da realização de padrões coincidentes em Perl, digitando o seguinte código para o editor :
# /usr /bin /perlmy $ fasta_seq = shift ; my $ sequence = shift; my $ arquivo de trabalho = ` cat $ fasta_seq ` ; my ($ fasta_seq ) = $ arquivo de trabalho = ~ /( > $ seqüência [ ^> ] +) /s ; print $ fasta_seq ;
3
Extraia as seqüências do arquivo FASTA utilizando BioPerl . Você pode extrair várias seqüências , digitando o seguinte código para o editor :
# /bin /perl -w
usar Bio :: SeqIO ;
$ sequenceobject = Bio ! :: SeqIO -> new ( -file => " fasta_file_path " , formato => " fasta ");
A Bio :: módulo SeqIO fornece processamento seqüência perfeita. Você pode recuperar uma única seqüência usando a seguinte declaração :
$ retrievedsequence = $ sequenceobject -> next_seq ;
Você pode percorrer o objeto e recuperar várias seqüências , como segue:
while ($ retrievedsequence = $ sequenceobject -> next_seq ) {print $ retrievedsequence -> seq, "\\ n" ;}
4
Extraia as seqüências do arquivo FASTA utilizando o aplicação " Biopieces " , que é quadro que contém um conjunto de ferramentas modulares para manipulação de dados de bioinformática . Você corre comandar seus Biopieces na linha de comando
read_fasta -i fasta_file