matlab powf()函数奇怪行为

mhd8tkvw 于 2022-12-04 发布在 Matlab

关注(0)|答案(2)|浏览(255)

当x1m0 n1,的类型为int时，powf会以意外的方式产生奇怪的基数输出。例如，powf(-4,2)会传回16，但powf(-5,2)会传回24！！！
在一次长时间的计算中追踪了一个错误输出的根之后，我发现当输出类型为integer时，powf函数对奇数表现出奇怪的行为。

__global__ void intFoo( int* a) 
{
    *a = powf(*a, 2);
}
__global__ void doubleFoo( double* a) 
{
    *a = powf(*a, 2);
}

我可以在Matlab中调用这个内核（例如）：

!nvcc -ptx test.cu 
k1 = parallel.gpu.CUDAKernel('test.ptx', 'test.cu', 'intFoo');
k2 = parallel.gpu.CUDAKernel('test.ptx', 'test.cu', 'doubleFoo');
out1 = feval(k1, -4)
out2 = feval(k1, -5)
out3 = feval(k2, -4)
out4 = feval(k2, -5)

实验结果：

out1 = 16
out2 = 24 //This hasn't to be 25 !!??
out3 = 16
out4 = 25.000

编辑：

在调查了@Robert Crovella的建议后，我发现Matlab中的命令窗口显示out4=25.000，而变量窗口显示out4 = 24.9999981的内容。
每个人都应该非常小心，因为powf函数（24.9999981而不是25）的输出可能会出现一个小错误，该错误可能会传播并成为大型计算的问题

matlab

来源：https://stackoverflow.com/questions/54103146/strange-behavior-of-powf-function

2条答案

按热度按时间

0pizxfdo1#

我认为这是由于feval数据类型的不明智使用。
在我看来，feval将返回类型转换为与参数类型相同的类型。这是有意义的，因为返回类型是从指向该参数的传递参数的指针中提取的。
请注意，powf采用float参数并返回float，pow采用double参数并返回double。int量在CUDA数学API中没有单独的函数（原型），因此如果您使用它们，它们将被转换为浮点类型或从浮点类型转换而来。
以下是我在纯CUDA C++中看到的内容：

$ cat t32.cu
#include <math.h>
#include <stdio.h>

__global__ void Foo( int a, double b)
{
            float res = powf((float)a, 2);
            printf("powf_int: %d, %d, %f\n", a, (int)res, res);
            res = powf((float)b, 2);
            printf("powf_double: %f, %f, %f\n", b, (double)res, res);
            double dres = pow((double)a, 2);
            printf("pow_int: %d, %d, %f\n", a, (int)dres, dres);
            dres = pow((double)b, 2);
            printf("pow_double: %f, %f, %f\n", b, (double)dres, dres);
}

int main(){

        Foo<<<1,1>>>(-5, -5);
        cudaDeviceSynchronize();
}
$ nvcc -o t32 t32.cu
$ cuda-memcheck ./t32
========= CUDA-MEMCHECK
powf_int: -5, 24, 24.999998
powf_double: -5.000000, 24.999998, 24.999998
pow_int: -5, 25, 25.000000
pow_double: -5.000000, 25.000000, 25.000000
========= ERROR SUMMARY: 0 errors
$

请注意：
1.对于(-5,2)，CUDA powf返回24.999998
1.如果我们将其转换为int，它将被截断为24
1.如果我们将其转换为double，然后四舍五入到3位小数，正确的四舍五入结果将是25.000，正如matlab输出中显示的那样
建议：
1.别这样
1.不要将整数类型与浮点函数一起使用（尤其是转换结果）
1.如果你想平方某个东西，只要把它和它本身相乘就可以了。这肯定会比使用powf(x, 2)更快，而且可能也会更准确。
如果你想知道“为什么CUDA powf(-5, 2)返回24.999998？"，请在另一个问题中问这个问题。编程手册中定义了准确度，我有理由相信这福尔斯公布的误差范围内。Here是pow“怪异”的另一个例子。

赞(0）回复(0）举报 2022-12-04

7ajki6be2#

作为Robert Crovella的answer的附录：CUDA是C++的一个子集，因此提供了重载数学函数。特别是它提供了pow()的以下四个变体：

float pow (float, int); 
double pow (double, int); 
float pow (float, float); 
double pow (double, double);

如果你用cuobjdump --dump-sass检查这些变量的机器代码，你会发现使用了四种不同的实现。正如Robert Crovella指出的，对于平方的特殊情况，最好只使用乘法，但是如果你愿意，你当然可以使用pow()，如下面的代码所示（为了简洁起见，省略了错误检查）：

#include <cmath>
#include <cstdlib>
#include <cstdio>

__global__ void kernel (int ib, float fa, float fb, double da, double db)
{
    printf ("pow_float_int     = %15.8e\n", pow (fa, ib));
    printf ("pow_float_float   = %15.8e\n", pow (fa, fb));
    printf ("pow_double_int    = %23.16e\n", pow (da, ib));
    printf ("pow_double_double = %23.16e\n", pow (da, db));
}

int main (void)
{
    int ia = -5, ib = 2;
    float fa = ia, fb = ib;
    double da = ia, db = ib;

    kernel<<<1,1>>>(ib, fa, fb, da, db);
    cudaDeviceSynchronize();
    return EXIT_SUCCESS;
}

以上程序的输出应如下所示：

pow_float_int     =  2.50000000e+01
pow_float_float   =  2.49999981e+01
pow_double_int    =  2.5000000000000000e+01
pow_double_double =  2.5000000000000000e+01

赞(0）回复(0）举报 2022-12-04

我来回答

matlab powf()函数奇怪行为

2条答案

相关问题

热门标签

最新问答