代码膨胀
代码膨胀(英语:Code bloat)是指代码有着不必要的长度、缓慢或者其他浪费资源的情况。代码膨胀可能是由于编写代码的语言、编译时所用的编译器,或者编写的程序员所致。因此,虽然代码膨胀通常指源代码存在不必要的部分(由程序员导致),但也可指生成的代码或者二进制文件文件有膨胀问题。
常见原因
通常来说,膨胀的代码是由于程序员使用了较多的代码行,而非解决问题的最佳方案。
程序员写出膨胀代码的部分原因有:
• 过度使用面向对象(OOP)结构,如类和继承。这可能导致麻烦且混乱的设计,用掉多于最佳解决方案的代码行。
• 不正确的使用设计模式——面向对象的开发人员可能在不需要使用设计模式的地方强行使用,从而导致问题。
• 没有用适当的封装方案使代码可重复利用,导致代码重复
• 宣告式编程——在命令式或面向对象语言中实现宣告式编程风格通常会导致代码膨胀。
• 过度的循环展开——不理智的过度优化性能。
• 过度使用多重If条件语句——而没有使用如查找表。
C++中采用的模板系统的一些原生实现是编译该语言的编译器之不足之处的例子。
实现此特性的原生编译器可以为使用的每个数据类型引入一个模板类版本的方法。但是,这也导致被编译的方法可能永远不会被用到,导致代码膨胀。更尖端的编译器和链接器能检测多余的副本并将其丢弃,或者避免产生它们,从而减少膨胀。因而,使用能放弃死代码的编译器可以使模板代码产生更小的二进制。
一些原生编译器推导膨胀的例子包括:
• 死代码——代码被执行,但从未被使用。
• 冗余计算——重新计算已经计算过的表达式。这种冗余计算经常在实现防止缓冲区溢出的“边界检查”代码时产生。尖端的编译器只将其计算一次,使用常用子表达式消除和循环不变代码外提技术消除冗余计算。
例子
下列ECMAScript算法有着大量的冗余变量、不必要的逻辑,以及低效的字符串连接。
而相同的逻辑可以用下列方式更有效地表达:
不同语言的代码密度
各种计算机语言的代码密度有着很大差别,以“紧凑”语言(例如领域特定语言、微软P代码、线程代码)编写的程序以及紧凑语言(以机器代码编写)的解释器通常比直接用机器语言编写程序消耗更少的代码量。
减少膨胀
减少代码膨胀的一些技术包括:
• 重构经常使用的代码序列为子程序,并从多个位置调用该子程序,而不是在各个位置上复制并粘贴这段代码。
• 重新使用已经被编写的子程序(可能利用附加参数),而不是从头编写它们的新代码。
参考资料
Warning: Invalid argument supplied for foreach() in /www/wwwroot/newbaike.com/id.php on line 280