使用constexpr进行极致代码优化
首先来看一段代码:
int fib(int n)
{
if (n == 1 || n == 2)
return 1;
else
return fib(n - 1) + fib(n - 2);
}
int main()
{
int fib20 = fib(20);
return fib20;
}
这是一段很简单的代码,使用函数fib递归求一个数(20)的斐波那契值,并以结果在main函数中进行返回。
关于如何优化这个函数,相信网上有相当多的讨论,比如消除递归等等吧,但是就这段代码而言,我们对其进行编译,使用编译自带的最强优化:O3,那么我们可以得到的优化后的汇编代码:
$ clang -S -std=c++14 -O3 *.cpp
不错,编译后的汇编代码26行,相对已经很精简了,如果关闭优化(-O0)得到大约42的汇编代码,如果使用gcc编译的话,即使开启O3优化,也还是有250行的汇编代码,由此可见clang对C++进行非常好的编译优化能力。
然而针对上面的代码,我们还有其它的优化手段吗?当然,肯定是有的!下面我们对之前的代码稍微改变一下,如下所示:
#ifdef USE_CONSTEXPR
#define CONSTEXPR constexpr
#else
#define CONSTEXPR
#endif
CONSTEXPR int fib(int n)
{
if (n == 1 || n == 2)
return 1;
else
return fib(n - 1) + fib(n - 2);
}
int main()
{
CONSTEXPR int fib20 = fib(20);
return fib20;
}
然后在编译选项中加入 "-DUSE_CONSTEXPR",意思是定义宏USE_CONSTEXPR,下面是所用的编译命令:
clang -S -std=c++14 -O3 -DUSE_CONSTEXPR *.cpp
编译过的汇编代码如下:
现在的汇编代码仅仅只有3行,是不是很不可思议!
这里的关键是constexpr。该关键字在C++11中引入,在C++14中进行了改进,并使其可以支持多行函数,它表示常量表达式。与const一样,它也可以应用于变量,以便在任何代码试图修改该值时引发编译器错误。与const不同,constexpr还可以应用于函数和类构造函数。constexpr表示该值(或返回值)是常量,如果可能,会在“编译时”计算。