cuda中的错误处理

cuda中的错误处理相关函数一共有4个:

  • __host__ __device__ const char* cudaGetErrorName( cudaError_t error ) 接受一个错误码,返回错误名称
  • __host__ __device__ const char* cudaGetErrorString( cudaError_t error ) 接受一个错误码,返回错误描述
  • __host__ __device__ cudaError_t cudaGetLastError( void ) 返回上一次cudaruntime调用时的错误码,并将cuda错误码设置为cudaSuccess
  • __host__ __device__ cudaError_t cudaPeekAtLastError( void ) 与上面功能一样,但是不会重置cuda的错误信息。

核函数被调用或者cuda API被调用时,都会返回一个错误码,如果返回的错误码为0,表示该调用没有出错,即cudaSuccess(错误名称),错误码一共有82个。

对于类似cudaMemcpy的API调用函数,可以使用cudaGetErrorString来进行错误检查; 对于核函数,其调用之后,必然会更新cuda Runtime的错误值,可以在核函数调用之后调用cudaGetLastError 进行核函数调用的错误检查。

由于CPU与GPU程序是异步执行的,所以为了避免获取到的核函数调用时的错误信息有误,应该在调用cudaGetLastError 函数之前使用cudaDeviceSynchronize() 对CPU进行阻塞,以同步GPU和CPU的线程,保证核函数已经调用完成。

以下是可以参考的错误处理核函数:

//API调用错误处理,可以接受CUDA的API函数调用作为参数
#define CHECK_ERROR(error) checkCudaError(error, __FILE__, __LINE__)
//检查CUDA Runtime状态码,可以接受一个指定的提示信息
#define CHECK_STATE(msg) checkCudaState(msg, __FILE__, __LINE__)inline void checkCudaError(cudaError_t error, const char *file, const int line)
{if (error != cudaSuccess) {std::cerr << "CUDA CALL FAILED:" << file << "( " << line << ")- " << cudaGetErrorString(error) << std::endl;exit(EXIT_FAILURE);}
}inline void checkCudaState(const char *msg, const char *file, const int line)
{cudaError_t error = cudaGetLastError();if (error != cudaSuccess) {std::cerr << "---" << msg << " Error---" << std::endl;std::cerr << file << "( " << line << ")- " << cudaGetErrorString(error) << std::endl;exit(EXIT_FAILURE);}
}

example:

//统计用于GPU计算的时间
cudaEvent_t start, stop;
CHECK_ERROR(cudaEventCreate(&start));
CHECK_ERROR(cudaEventCreate(&stop));
CHECK_ERROR(cudaEventRecord(start, 0));
CHECK_ERROR(cudaEventSynchronize(start));CHECK_ERROR(cudaMemcpy(dev_grid_in, grid_in, SIZE * sizeof(double), cudaMemcpyHostToDevice));
CHECK_ERROR(cudaMemcpy(dev_grid_out, grid_out, SIZE * sizeof(double), cudaMemcpyHostToDevice));for (int i=0; i<times; ++i) {kernel<<<grids, blocks>>>(dev_grid_in, dev_grid_out);std::swap(dev_grid_in, dev_grid_out);
}
cudaDeviceSynchronize();CHECK_STATE("kernel call");CHECK_ERROR(cudaMemcpy(grid_in, dev_grid_in, SIZE * sizeof(double), cudaMemcpyDeviceToHost));//计算统计的时间
CHECK_ERROR(cudaEventRecord(stop, 0));
CHECK_ERROR(cudaEventSynchronize(stop));
float elapsedTime;
CHECK_ERROR(cudaEventElapsedTime(&elapsedTime, start, stop));

参考:cuda编程中的错误处理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1559719.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

C++内部类和匿名对象

1.内部类 内部类就是定义在一个类的内部的类&#xff0c;比如 #include<iostream> using namespace std; class AA{ public:class BB {public:void print(const AA& A){cout << A.aa1 << " " << A.aa2 << endl;}private:}; priv…

Halcon OCR字符识别

create_text_model_reader创建一个文本模型描述要用于分割的文本find_text. 的parameter value文本分段方法的值为自动和手动. 通常&#xff0c;参数模式应设置为自动因为这种模式更稳定&#xff0c;需要更少 配置工作量。请注意&#xff0c;在这种情况下&#xff0c;还有一个…

tp6发送邮件功能如何实现?tp6的使用教程?

tp6发送邮件有哪些技巧&#xff1f;tp6发送邮件步骤与设置指南&#xff1f; tp6&#xff08;ThinkPHP 6&#xff09;作为一款流行的PHP框架&#xff0c;提供了强大的邮件发送功能&#xff0c;使得开发者能够轻松实现这一需求。AokSend将详细介绍如何在tp6中实现邮件发送功能。…

2024-10-10 问AI: [AI面试题]激活函数在神经网络中的作用是什么?

文心一言 激活函数在神经网络中扮演着至关重要的角色。它们的主要作用包括&#xff1a; 引入非线性&#xff1a; 神经网络中的每一层通常是由线性变换&#xff08;如权重矩阵乘以输入向量再加上偏置&#xff09;构成的。如果没有激活函数&#xff0c;多层神经网络将仅仅是一个…

google标签/注册页面/登录页面

1.怎么制作如下谷歌标签&#xff1f; HTML_code: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>D…

扭矩在各行各业的应用_SunTorque

【大家好&#xff0c;我是唐Sun&#xff0c;唐Sun的唐&#xff0c;唐Sun的Sun。一站式数智工厂解决方案服务商】 扭矩在众多行业中都有着广泛且重要的应用&#xff0c;以下为您列举一些&#xff1a; 在汽车行业&#xff0c;扭矩是衡量发动机性能的关键指标之一。发动机输出的扭…

Unity网络开发基础

概述 基础知识 网络开发必备理论 网络基本概念 IP、端口、Mac地址 客户端和服务器 数据通信模型 网络协议 网络协议概述 OSI模型 TCP/IP协议 TCP/IP协议 TCP和UDP 网络通信 网络游戏通信方案概述 通信前的必备知识 IP地址和端口类 域名解析 序列化和反序列化2进制 概述 字符编码…

linux 搭建sentinel

1.下载 linux执行下面的命令下载包 wget https://github.com/alibaba/Sentinel/releases/download/1.8.6/sentinel-dashboard-1.8.6.jar2.启动 nohup java -Dserver.port9090 -Dcsp.sentinel.dashboard.serverlocalhost:9090 -Dproject.namesentinel-dashboard -jar sentin…

【免费可视化仪表盘】轻松实现静态/动态数据可视化图表—积木仪表盘

在当今信息爆炸的时代&#xff0c;如何从海量数据中快速提取关键信息&#xff0c;实现高效决策&#xff0c;成为了企业和个人面临的重大挑战。而积木仪表盘&#xff0c;就如同一位智慧的导航者&#xff0c;为你轻松开启数据可视化的精彩之旅。 代码下载 https://github.com/je…

elementui+vue 多行数据的合并单元格

多行的合并&#xff0c;可以参考&#xff0c;改改就能用 html <template><el-table :data"students" :span-method"objectSpanMethod"><el-table-column prop"grade" label"年级"></el-table-column><el-…

BMS-绝缘检测

一、为什么要进行绝缘检测 前言&#xff1a;BMS绝缘检测是指对电池组与车体之间的绝缘状态进行实时监测和检测。为了确保电池组与车体之间的绝缘性能良好&#xff0c;防止漏电和短路等安全隐患&#xff0c;BMS绝缘检测系统能够及时发现绝缘故障&#xff0c;并采取相应的措施进…

MySQL 联合索引底层存储结构及索引查找过程解读

前言 大家好&#xff0c;我是 Lorin &#xff0c;联合索引&#xff08;Composite Index&#xff09;又称复合索引&#xff0c;它包括两个或更多列。与单列索引不同&#xff0c;联合索引可以覆盖多个列&#xff0c;这有助于加速复杂查询和过滤条件的检索。联合索引的列顺序非常…

接口测试-day3-jmeter-2组件和元件

组件和元件&#xff1a; 组件&#xff1a;组件指的是jmeter里面任意一个可以使用的功能。比如说查看结果树或者是http请求 元件&#xff1a;元件指是提对组件的分类 组件的作用域&#xff1a;组件放的位置不一样生效也不一样。 作用域取决于组件的的层级结构并不取决于组件的…

GIS前端工程师岗位职责、技术要求和常见面试题

文章来源&#xff1a;https://blog.csdn.net/eqmaster/article/details/141891186 GIS 前端工程师负责运用前端技术实现地理信息系统的可视化交互界面&#xff0c;以提升用户对地理数据的操作体验和分析能力。 GIS 后端工程师岗位职责 界面开发 负责 GIS 应用的前端界面设计…

打造智能洗衣店:Spring Boot订单管理系统

1系统概述 1.1 研究背景 如今互联网高速发展&#xff0c;网络遍布全球&#xff0c;通过互联网发布的消息能快而方便的传播到世界每个角落&#xff0c;并且互联网上能传播的信息也很广&#xff0c;比如文字、图片、声音、视频等。从而&#xff0c;这种种好处使得互联网成了信息传…

Ubuntu安装nvidia显卡驱动

一、安装依赖 1、更新 sudo apt update sudo apt upgrade -y 2、基础工具 sudo apt install -y build-essential cmake 图形界面相关 sudo apt install -y lightdm 注:在弹出对话框选择"lightdm" 下载nvidia驱动&#xff1a; 进入如下网址&#xff1a;http…

机器人末端的负载辨识

关节处的摩擦力变小了&#xff0c;导致系统的参数辨识精度会变高&#xff0c;因为动力学方程中的摩擦力项占的比例会变小。 为什么要有一个负载的参数辨识&#xff0c;因为对于整个系统来说&#xff0c;除了负载哈&#xff0c;其他关节都是不变的&#xff0c;出厂时都设置好了&…

Java基础-知识点

文章目录 数据类型包装类型缓存池 String概述不可变的含义不可变的好处String、StringBuffer、StringBuilderString.intern() 运算参数传递float与double隐式类型转换switch 继承访问权限抽象类与接口super重写与重载**1. 重写(Override)****2. 重载(Overload)** Object类的通用…

FFMPEG数据封装格式、多媒体传输协议、音视频编解码器

FFMPEG堪称自由软件中最完备的一套多媒体支持库&#xff0c;它几乎实现了所有当下常见的数据封装格式、多媒体传输协议以及音视频编解码器&#xff0c;提供了录制、转换以及流化音视频的完整解决方案。 ffmpeg命令行参数解释 ffmpeg -i [输入文件名] [参数选项] -f [格式] [输出…

速通!腾讯发布《2024大模型十大趋势》

【写在前面】 腾讯发布的《2024大模型十大趋势》报告在2024世界人工智能大会上引起了广泛关注。该报告深入分析了人工智能领域的最新进展&#xff0c;特别是大模型技术在不同应用场景中的潜力和影响&#xff0c;并预测了未来人工智能的发展方向。 “大模型技术发展方向 大模型…