CUDA：核函数不执行，错误检查出现“addKernel launch failed: invalid configuration argument”

开门见山。执行.cu文件时，发现根本没有执行核函数，在核函数后面加入下面代码：cudaError_t cudaStatus = cudaGetLastError();if (cudaStatus != cudaSuccess){fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cu...

千与千与千

4872人浏览 · 2019-11-21 14:47:17

千与千与千 · 2019-11-21 14:47:17 发布

开门见山。

执行.cu文件时，发现根本没有执行核函数，在核函数后面加入下面代码：

    cudaError_t cudaStatus = cudaGetLastError();
	if (cudaStatus != cudaSuccess)
	{
		fprintf(stderr, "addKernel launch failed: %s\n", cudaGetErrorString(cudaStatus));
	}

执行程序后，打印出错误提示：

addKernel launch failed: invalid configuration argument

看字面意思，我理解的是，网格和块的划分有错误，定义的块和网格的维度为：

int dimx_field = 8;
int dimy_field = 160;
dim3 block_field(dimx_field, dimy_field);
dim3 grid_field((NX + block_field.x - 1) / block_field.x, (NY + block_field.y - 1) / block_field.y);

又查了查自己GPU的性能参数，发现其中有一条：

Maximum number of threads per block：1024

但是根据自己的定义，块中的线程为1280，这就是问题所在了。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Js分割字符串(单个分割符、多个分割符、正则)

1.单个分割符1.1定义和用法split() 方法用于把一个字符串分割成字符串数组。1.2语法stringObject.split(separator,howmany)参数描述separator必需。字符串或正则表达式，从该参数指定的地方分割 stringObject。howmany可选。该参数可指定返回的数组的最大长度。如果设置了该参数，返回的子串不会多于这个参数指定的数组。如果没有设置该参数，

腾讯云开发者社区

curl

什么是curl命令？curl是利用URL语法在命令行方式下工作的开源文件传输工具。它被广泛应用在Unix、多种Linux发行版中，并且有DOS和Win32、Win64下的移植版本。如何在windows下使用curl命令？第一步：进入curl下载官网，下载合适的版本，我这里下载的是windows 64位的curl。其中我下载的zip文件。另外CAB文件也是压缩文件，这...

腾讯云开发者社区

Zynq7000 USB2.0协议解析及USB控制器详解

USB 2.0规范及控制器文章目录USB 2.0规范及控制器USB2.0Univerasl Serial BusUSBHostUSB总线接口标准总线信号USB拓扑结构数据流模型数据编解码和位填充USB逻辑部件USB时间基准USB 描述符USB设备USB设备供电方式USB设备分层USB设备插入检测机制USB设备状态USB总线枚举USB传输传输类型包(Packet)事务(transaction)传输(