Amicoyuan
  • 首页
  • 归档
  • 分类
  • 标签
  • 工具
  • 关于
  •   
  •   

JZ6 从尾到头打印链表

JZ6 从尾到头打印链表题目链接从尾到头打印链表_牛客题霸_牛客网 (nowcoder.com) 完整代码123456789101112131415161718192021/*** struct ListNode {* int val;* struct ListNode *next;* ListNode(int x) :*

2023-02-07
Algorithm
C++ 牛客

JZ5 替换空格

JZ5 替换空格题目链接替换空格_牛客题霸_牛客网 (nowcoder.com) 完整代码1234567891011121314151617181920212223#include <string>class Solution {public: /** * 代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值即可 * *

2023-02-07
Algorithm
C++ 牛客

JZ3 数组中重复的数字

JZ3 数组中重复的数字题目链接:数组中重复的数字_牛客题霸_牛客网 (nowcoder.com) 完整解答:set::count()是C++ STL中的内置函数,它返回元素在集合中出现的次数。由于set容器仅包含唯一元素,因此只能返回1或0。 用法:set_name.count(element) 参数:该函数接受一个强制性参数element,该元素指定要返回其计数的元素。 返回值:该函数返回1

2023-02-07
Algorithm
C++ 牛客

矩阵乘法最基础版本

矩阵乘法最基础版本数学原理示例 完整代码用A的第i行分别和B的第j列的各个元素相乘求和,求得C的第i行j列的元素,这种算法中,B的访问是按列进行访问的,代码如下: 12345678910111213//m是A矩阵的行,k是A矩阵的列,n是B矩阵的列double temp=0.0;for(int i = 0; i < m; i++){ //遍历C矩阵各行,其行数与A的行数相等

2023-02-06
HPC
Matrix GEMM

register关键字

register关键字12345678910int main(){ register int val = 100; //寄存器变量没有地址,不能取地址 val = 200; //可以被写入 printf("%d\n", val); // 在gcc编译器下 也不允许取地址 return 0;}//由于使用register关键字,直接将val存在寄存器内,因此v

2023-02-02
Algorithm
C/C++ register

BLISlab dgemm优化

BLISlab dgemm优化参考资料:Git地址:https://github.com/flame/blislab 视频教程:https://www.bilibili.com/video/BV1c94y117Uw?vd_source=3ae32e36058f58c5b85935fca9b77797【澎峰科技-张先轶老师】 阅读:tutorial.pdf【位于代码包中】 Step01.克隆项目到本

2023-02-02
HPC
Linux dgemm

CUDA线程管理

1.线程管理当核函数在主机端启动时,它的执行会移动到设备上,此时设备中会产生大量的线程并且每个线程都执行由核函数指定的语句。了解如何组织线程是CUDA编程的一个关键部分。CUDA明确了线程层次抽象的概念以便于你组织线程。这是一个两层的线程层次结构,由线程块和线程块网格构成,如图2-5所示。 由一个内核启动所产生的所有线程统称为一个网格。同一网格中的所有线程共享相同的全局内存空间。一个网格由多个线

2023-01-28
HPC
CUDA

CUDA内存管理

1.内存管理CUDA编程模型假设系统是由一个主机和一个设备组成的,而且各自拥有独立的内存。核函数是在设备上运行的。为使你拥有充分的控制权并使系统达到最佳性能,CUDA运行时负责分配与释放设备内存,并且在主机内存和设备内存之间传输数据。表2-1列出了标准的C函数以及相应地针对内存操作的CUDA C函数。 用于执行GPU内存分配的是cudaMalloc函数,其函数原型为: 1cudaError_t c

2023-01-17
HPC
CUDA

CUDA编程结构

CUDA编程结构CUDA编程模型使用由C语言扩展生成的注释代码在异构计算系统中执行应用程序。 在一个异构环境中包含多个CPU和GPU,每个GPU和CPU的内存都由一条PCI-Express总线分隔开。因此,需要注意区别以下内容。 主机:CPU及其内存(主机内存) 设备:GPU及其内存(设备内存) 为了清楚地指明不同的内存空间,在本书的示例代码中,主机内存中的变量名以h__为前缀,设备内存中的变

2023-01-17
HPC
CUDA

CUDA编程模型概述

CUDA编程模型概述CUDA编程模型提供了一个计算机架构抽象作为应用程序和其可用硬件之间的桥梁。图2-1说明了程序和编程模型实现之间的抽象结构的重要。通信抽象是程序与编程模型实现之间的分界线,它通过专业的硬件原语和操作系统的编译器或库来实现。利用编程模型所编写的程序指定了程序的各组成部分是如何共享信息及相互协作的。编程模型从逻辑上提供了一个特定的计算机架构,通常它体现在编程语言或编程环境中。 除

2023-01-17
HPC
CUDA
123456…11

搜索

Hexo Fluid
总访问量 次 总访客数 人