Como posso otimizar meu código para cálculos de matemática rápida usando o compilador GCC?

Programação

* Rede de conhecimento computador >> Programação >> C /C + + programação >> Content

Otimizar o código para cálculos de matemática rápida com o GCC envolve várias estratégias, direcionando diferentes aspectos do processo de compilação e seu próprio código. Aqui está um colapso de técnicas eficazes:

1. Sinalizadores do compilador:

Estas são as otimizações mais impactantes. Você os adiciona à sua linha de comando de compilação (por exemplo, `g ++ -o3 -fast -math ...`).

* `-o`,` -o2`, `-o3`,` -Ofast`: Esses sinalizadores controlam o nível de otimização. `-O` é uma otimização básica,` -o2` é um bom equilíbrio entre velocidade e tempo de compilação, `-o3` é a otimização agressiva e` -fast` permite otimizações ainda mais agressivas, potencialmente violando os padrões IEEE 754 para a aritmética de ponto flutuante (veja abaixo). Comece com `-o2` ou` -o3`, a menos que você tenha motivos específicos.

* `-ffast-Math`: Isso é crucial para matemática rápida. Permite várias outras otimizações que podem acelerar significativamente os cálculos, mas podem comprometer a precisão estrita exigida pelo IEEE 754:
* Reordenação de operações: O GCC pode reorganizar os cálculos para melhorar a eficiência, mesmo que altere ligeiramente o resultado devido a limitações de precisão de ponto flutuante.
* usando funções matemáticas mais rápidas, mas menos precisas,: Pode substituir as funções matemáticas padrão (como `sin`,` cos`, `exp`) por aproximações mais rápidas.
* Supondo que as operações sejam associativas e distributivas: Isso permite reordenar e simplificar mais.
* Regras de aliases estritas relaxantes: Isso pode ajudar o compilador a fazer melhores otimizações em diferentes tipos de dados.

* `-march =nativo`: Este sinalizador diz ao compilador para gerar código otimizado especificamente para a sua arquitetura da CPU. Ele aproveita instruções e recursos específicos do seu processador, resultando em melhorias significativas de velocidade. Esteja ciente de que o código compilado com esse sinalizador pode não ser portátil para outras arquiteturas.

* `-mse`,` -mSse2`, `-mSse3`,` -mSSse3`, `-mse4`,` -mavx`, `-mavx2`, etc.: Esses sinalizadores permitem suporte para conjuntos de instruções SIMD específicos (instrução única, múltiplos dados). As instruções SIMD permitem o processamento paralelo de vários elementos de dados, acelerando drasticamente muitas operações matemáticas. Use os sinalizadores que correspondem aos recursos da sua CPU.

2. Otimizações no nível de código:

Mesmo com sinalizadores agressivos do compilador, o código bem escrito é essencial para o desempenho ideal.

* Use os tipos de dados apropriados: Escolha o menor tipo de dados que pode representar seus dados sem perda de precisão. Por exemplo, use `float` em vez de` duplo 'se a precisão de precisão única for suficiente.

* Vectorização: Estruture seus loops e dados para permitir que o compilador os vetore facilmente. Isso significa processamento de vários elementos de dados simultaneamente usando instruções SIMD. A auto-vetorização do GCC é muito boa, mas você pode precisar ajudá-lo usando alocações de memória alinhada e garantindo que as iterações de loop sejam independentes.

* identidades e algoritmos matemáticos: Use identidades e algoritmos matemáticos eficientes. Por exemplo, o uso de `Exp2 (x)` em vez de `exp (x)` pode ser mais rápido porque o primeiro é otimizado especificamente para poderes de 2. Considere bibliotecas especializadas para operações de matriz (como auto ou blas).

* Loop Unrolling: Urlll Loops manualmente (repetindo o corpo do loop várias vezes) para reduzir a sobrecarga do loop, mas esteja atento à pressão do registro. O compilador já pode executar essa otimização, portanto, teste antes e depois.

* Padrões de acesso à memória: Organize dados na memória para minimizar as perdas do cache. Acesse dados sequencialmente sempre que possível.

* função inline: Para funções pequenas e frequentemente chamadas, considere usar a palavra -chave `inline` para reduzir a sobrecarga de chamada de função. O compilador pode decidir não embalar de qualquer maneira, com base em sua própria análise de otimização.

3. Bibliotecas:

* Bibliotecas de matemática otimizadas: Use bibliotecas como Eigen (para álgebra linear), blas (subprogramas básicos de álgebra linear) e lapack (pacote de álgebra linear). Estes são altamente otimizados para várias arquiteturas e geralmente superam o código escrito à mão.

4. Perfil:

Após aplicar otimizações, use um perfil (como `gProf` ou perf) para identificar gargalos de desempenho. Isso ajuda a concentrar seus esforços nas partes do seu código que são mais críticas.

nota importante em `-ffast-Math`:

Embora o `-ffast-math` ofereça ganhos de desempenho significativos, isso pode levar a imprecisões. Se seus cálculos exigirem aderência estrita aos padrões IEEE 754 (por exemplo, em computação científica ou aplicativos financeiros), evite usar esse sinalizador ou verificar cuidadosamente os resultados em relação a uma versão não otimizada.

Comando de compilação de exemplo:

`` `BASH
G ++ -O3 -FFAST -MATH -MARCH =nativo -mavx2 my_math_program.cpp -o my_math_program
`` `

Lembre -se de adaptar os sinalizadores à sua CPU específica e aos requisitos de precisão do seu aplicativo. Sempre perfil e referência para garantir que suas otimizações melhorem o desempenho.

Anterior : Como a memórias é utilizada em algoritmos de programação dinâmica?

Próximo : Quando um programa inicia o endereço de memória da primeira instrução é colocado em parte da unidade de controle de microprocessadores chamada A (n).

Os artigos relacionados

·	Como link COBOL e C juntos no z /OS
·	Erros comuns na Turbo C
·	Como usar o GDB Com Eclipse
·	Como criar um aplicativo para iPhone para um RSS em um …
·	Como colocar números inteiros em ordem ascendente usan…
·	Definição de Abstração de Dados em C + +
·	Como Teach Yourself Visual C 6
·	Como formatar conteúdo dentro de um UIScrollView
·	Qual é a programação do computador C?
·	Jogos 3D Creator Tutorial

Artigos em destaque

·	Como medir o tempo em Python
·	Como adicionar uma superposição de imagem Com V3 Maps…
·	O que faz VBA Suporte para
·	Como adicionar um novo método no NetBeans
·	Como teste para Par ou Ímpar Números em MATLAB
·	Como ativar o Java em um Smartphone
·	Como usar um Matrix em Vb.Net
·	Uma máquina de escrever é considerada computador?
·	Como faço para criar um link para uma planilha externa…
·	Como executar uma importação Grande no MySQL