O que é livro de código em termos de processamento de fala?

Software

* Rede de conhecimento computador >> Software >> Software de processamento de texto >> Content

No processamento da fala, um livro de códigos é uma coleção estruturada de unidades ou recursos representativos de fala. Essas unidades podem variar dependendo do aplicativo específico e do tipo de processamento de fala que está sendo executado. Eles são essencialmente um dicionário de "blocos de construção" usados para representar e manipular sinais de fala.

Aqui está um detalhamento de como os códigos de código são usados em diferentes contextos:

* Termalização do vetor (VQ): Esta é a aplicação mais comum. No VQ, um livro de códigos contém um conjunto de vetores (geralmente representando recursos espectrais como coeficientes cepstrais de Mel-Frequência-MFCCs). Esses vetores representam diferentes "protótipos" dos sons de fala. Durante a codificação, um vetor de recurso de fala é comparado aos vetores no livro de códigos, e o índice do vetor correspondente mais próximo é usado como uma representação compactada do discurso original. Durante a decodificação, esse índice é usado para recuperar o vetor correspondente do livro de códigos, reconstruindo uma aproximação do discurso original. O objetivo é obter compressão eficiente, mantendo a qualidade aceitável da fala.

* Modelos Hidden Markov (HMMs): Os código de código às vezes são usados no HMMS para reconhecimento de fala. Cada estado em um HMM pode ter um livro de código associado representando os recursos acústicos que provavelmente serão observados nesse estado. As probabilidades de observar vetores específicos do livro de códigos são usados durante o processo de decodificação para determinar a sequência mais provável dos estados HMM (e, portanto, as palavras reconhecidas).

* Reconhecimento/verificação do alto -falante: Os códigos podem armazenar recursos específicos do alto-falante. Por exemplo, um livro de códigos pode representar as características espectrais típicas da voz de um orador específico. Este livro de código pode ser usado para comparar com a voz de um orador desconhecido para determinar se é uma correspondência.

Em essência, um livro de códigos fornece uma representação quantizada e compacta do espaço potencialmente vasto de possíveis sons de fala ou características do alto -falante, permitindo armazenamento, transmissão e processamento eficientes dos dados de fala. A qualidade do processamento da fala depende muito da qualidade e design do livro de códigos, que geralmente envolve algoritmos de treinamento para criar representações eficazes.

Anterior : Você pode adicionar fórmulas a uma tabela calcula automaticamente os valores no Word 2016.?

Próximo : Diferença entre escritor de tipos e processador de texto?

Os artigos relacionados

·	Como imprimir uma planilha
·	Como Deixar Propriedades em branco em documentos do Wor…
·	Como inserir texto de arquivos em Word 2007
·	Como posso fazer um prospecto Com Tiras de corte
·	Como abrir o MS Office & Thesaurus Ortográfico
·	Como inserir colunas no meio de um documento do Word
·	Como Criar Cartão de Estudante Relatório que são ger…
·	Quantas palavras um programa de reconhecimento de voz p…
·	Como alterar a data impressa estatística em um documen…
·	Como aprender Dvorak Typing

Artigos em destaque

·	Como configurar uma área de trabalho remota em uma LAN…
·	Como construir um banco de dados no Microsoft Office Ex…
·	Como você detecta vírus sem usar antivírus?
·	Como remover Fundos no Photoshop CS
·	Como converter WMV para Qt
·	MS PowerPoint é considerado um sistema operacional?
·	Como configurar Classes em QuickBooks
·	Como colocar Sun irradia em uma imagem usando o Photosh…
·	Como fazer o download de um arquivo PDF no Internet Exp…
·	Qual é a diferença entre a opção de congelamento no…