我用C语言实现了牛顿分形。我想知道是否有人知道如何在不使用线程或多进程的情况下提高代码的效率。我试过展开while
循环,但它没有做太多。我还尝试使用-o1
、-o2
和-o3
进行编译,但效果不佳。如果你们有任何建议,请告诉我,谢谢。
typedef struct s_float2 {
float x;
float y;
} t_float2;
static t_float2 next(t_float2 z)
{
t_float2 new;
float temp_deno;
temp_deno = 3 * pow((pow(z.x, 2) + pow(z.y, 2)), 2);
new.x = ((pow(z.x, 5) + 2 * pow(z.x, 3) * pow(z.y, 2)
- pow(z.x, 2) + z.x * pow(z.y, 4) + pow(z.y, 2)) / temp_deno);
new.y = ((z.y * (pow(z.x, 4) + 2 * pow(z.x, 2)
* pow(z.y, 2) + 2 * z.x + pow(z.y, 4))) / temp_deno);
z.x -= new.x;
z.y -= new.y;
return (z);
}
static t_float2 find_diff(t_float2 z, t_float2 root)
{
t_float2 new;
new.x = z.x - root.x;
new.y = z.y - root.y;
return (new);
}
void init_roots(t_float2 *roots)
{
static int flag;
flag = 0;
if (flag == 0)
{
roots[0] = (t_float2){ 1, 0 };
roots[1] = (t_float2){ -0.5, sqrt(3) / 2 };
roots[2] = (t_float2){ -0.5, -sqrt(3) / 2 };
flag = 1;
}
return ;
}
void calculate_newton(t_fractal *fractal)
{
t_float2 z;
int iterations;
int i;
t_float2 difference;
static t_float2 roots[3];
fractal->name = "newton";
init_roots(&roots);
iterations = -1;
z.x = (fractal->x / fractal->zoom) + fractal->offset_x;
z.y = (fractal->y / fractal->zoom) + fractal->offset_y;
while (++iterations < fractal->max_iterations)
{
z = next(z);
i = -1;
while (++i < 3)
{
difference = find_diff(z, roots[i]);
if (fabs(difference.x) < fractal->tolerance
&& fabs(difference.y) < fractal->tolerance)
return (put_color_to_pixel(fractal, fractal->x, fractal->y,
fractal->color * iterations / 2));
}
}
put_color_to_pixel(fractal, fractal->x, fractal->y, 0x000000);
}
字符串
手动进行数学运算会比使用<math.h>
库更好吗?
3条答案
按热度按时间ia2d9nvy1#
是的,对于小整数指数使用
pow
是一个坏主意(因为它的相对complex operation involvinglog,exp,*,/
),简单地用*
计算它要好得多。在此之上,您使用同一变量的多个幂并再次计算它们,您可以重用较低的幂,例如change:字符串
进入:
型
这将降低操作的数量。
在此之上,你计算一切一遍又一遍的每个像素...
我假设你的代码看起来像这样:
型
而在
calculate_newton(t_fractal *fractal)
内部,你一遍又一遍地重新计算所有与x,y
位置相关的东西...如果你有y
循环外层,你可以计算所有的东西,每次y
改变一次,而不是做xs
次以上…为此,您应该将这些变量移动到fractal context/struct中在某些情况下,您可以避免使用
*
来计算递增值的幂(但是,如果从性能方面看它有任何意义,则取决于所使用的计算体系结构),请参阅了解如何执行此操作的详细信息。
最重要的是,如果你连续缩放/平移,你可以重用已经从前一帧计算的值,就像我在here for Mandelbrot中所做的那样
然而,如果没有并行性,这就是你所能做的一切...
使用并行性,除非你有很多核心CPU/计算机,否则它不会提高速度,使用GPU更好,请参阅:
在这里,你渲染一个覆盖你的视图的QUAD/矩形,并计算碎片着色器内的分形(对于GLSL来说,它或多或少是C语言,所以它与你已经拥有的没有太大区别)。
p1tboqfb2#
你应该从乘法开始计算幂,而不是使用
pow
函数:字符串
然后注意,你可以通过分解
(x2 + y2) * (x2 + y2)
来简化代数,它也是x4 + 2 * x2 * y2 + y4
:型
roots
应该在编译时预先计算。在C中,你应该只使用常量:型
d6kp6zgx3#
我的建议:
总成本中的一个关键因素是从每个起始点执行的迭代次数。回忆这些呢?我的意思是,对于每个处理的像素,保持迭代次数。但是在迭代时,当你到达一个已经处理过的像素时,假设剩余的迭代次数是相同的。
这是一个近似值,但无论如何都假定每个像素只有一种颜色。