O formato de arquivo FASTA é usado para armazenar os dados da seqüência de ácidos nucléicos ou peptídeos . Várias sequências podem ser armazenados em um único arquivo, chamado arquivo de multi- FASTA . Seqüências de dados é formatado como uma linha de cabeçalho curto identificando a seqüência e os dados de seqüência a seguir uma nova linha. Ao localizar os cabeçalhos seqüência em um arquivo multi- FASTA com comandos Perl , é possível extrair seqüências individuais de um arquivo multi- FASTA . Instruções
1
Abra um editor de texto com um arquivo de texto em branco para começar um novo programa Perl.
2
Inicie o programa , especificando o local do Perl em seu sistema. Isso normalmente é "/usr /bin /perl " ou " /usr /local /bin /perl . "
# /Usr /bin /perl
3
Import a "strict" e "File :: baseName " bibliotecas . O " File :: Nome base " biblioteca oferece suporte à análise de caminhos de arquivos e extensões. A biblioteca "strict" restringe construções inseguras , jogando um erro durante a compilação , em vez de em tempo de execução .
Uso strictuse File :: Nome base
4
Leia a variável argumento da linha de comando . Seu programa , você deve escolher para o nome " fasta_extract.pl ", vai esperar para ser dada a localização de um arquivo FASTA e parâmetros para escolher seqüências para extrair . O primeiro parâmetro será um nome de arquivo FASTA eo segundo será uma string para a correspondência de padrão . Variável argumento são acessados a partir da matriz " $ argv "
my $ fasta_file = $ argv [ 0]; . Meu $ pattern = $ argv [1];
5
Aberto o arquivo FASTA utilizando a função " open () " . . " . Arquivo FASTA Não é possível abrir \\ n"