Amicoyuan
  • 首页
  • 归档
  • 分类
  • 标签
  • 工具
  • 关于
  •   
  •   

CMU 15-213 Lecture 01:Course Overview

2015 CMU 15-213 CSAPP 深入理解计算机系统 Lecture 01: Course Overview例子一:1234567891011typedef struct{ int a[2]; double d;}struct_t;double fun(int i){ volatile struct_t s; //volatile关键字

2023-03-13
Computer Organization
CMU CSAPP

2015 CMU 15-213 CSAPP 深入理解计算机系统

2015 CMU 15-213 CSAPP 深入理解计算机系统项目地址:EugeneLiu/translationCSAPP: 为 CSAPP 视频课程提供字幕,翻译 PPT,Lab。 (github.com) bilibili翻译:【精校中英字幕】2015 CMU 15-213 CSAPP 深入理解计算机系统 课程视频_哔哩哔哩_bilibili CSAPP:3e 官方链接 课程主页

2023-03-13
Computer Organization
CMU CSAPP

线性回归的梯度下降

线性回归的梯度下降 Goals在本实验中,您将: 使用梯度下降自动优化w和b的过程 Tools在本实验中,我们将使用: NumPy,一个用于科学计算的流行库 Matplotlib,用于绘制数据的流行库 在本地目录的lab_utils.py文件中绘制例程 12345import math, copyimport numpy as npimport matplotlib.pyplot as p

2023-03-13
Machine Learning
Tensorflow Machine Learning

代价函数

代价函数 目标在本实验中,你将: 你将实现和探索成本函数的线性回归伴随一个变量。 工具在本实验室中,我们将使用: NumPy,一个用于科学计算的流行库 Matplotlib,用于绘制数据的流行库 本地目录的lab_utils_uni.py文件中的本地绘图例程 12345import nunpy as np%matplotlib widgetimport matplotlib.pyplot

2023-03-12
Machine Learning
Tensorflow Machine Learning

如何使用AVX和AVX2处理数据(个人翻译)

1.文章来源Matt Scarpino(USA) Crunching Numbers with AVX and AVX2 - CodeProject 2.介绍在2003年,Alex Fr写了一篇优秀的文章[该文章现在已经被原作者删除],解释了如何使用Intel的流式SIMD扩展(SSE)执行SIMD(单指令,多数据)处理。SSE是英特尔处理器支持的一组指令,可对大量数据执行高速运算。 2008年,

2023-03-10
HPC
AVX AVX2

CUDA使用二维网格和二位块对矩阵求和

CUDA使用二维网格和二位块对矩阵求和在本节中,我们将使用一个二维网格和二位块来编写一个矩阵加法核函数。首先,应该编写一个校验主函数以验证矩阵加法核函数是否能得出正确的结果: 1234567891011121314void sumMatrixOnhost(float *A, float *B, float *C, const int nx, const int ny){ float

2023-03-09
HPC
CUDA

CUDA使用块和线程建立矩阵索引

CUDA使用块和线程建立矩阵索引通常情况下,一个矩阵用行优先的方法在全局内存中进行线性存储。图2-9所示的是一个8×6矩阵的小例子。 在一个矩阵加法核函数中,一个线程通常被分配一个数据元素来处理。首先要完成的任务是使用块和线程索引从全局内存中访问指定的数据。通常情况下,对一个二维示例来说,需要管理3种索引。 线程和块索引 矩阵中给定点的坐标 全局线性内存中的偏移量 对于一个给定的线程,首先可

2023-03-09
HPC
CUDA

CUDA组织并行编程

组织并行编程从前面的例子可以看出,如果使用了合适的网格和块大小来正确地组织线程,那么可以对内核性能产生很大的影响。在向量加法的例子中,为了实现最佳性能我们调整了块的大小,并基于块大小和向量数据大小计算出了网格大小。 现在通过一个矩阵加法的例子说明这一点。对于矩阵运算,传统的方法是在内核中使用一个包含二维网格与二位块的布局来组织线程。但是,这种传统的方法无法获得最佳性能。在矩阵加法中使用以下布局将有

2023-03-08
HPC
CUDA

CUDA给核函数计时

CUDA给核函数计时在内核的性能转换过程中,了解核函数的执行需要多长时间是很有帮助并且十分关键的。衡量核函数性能的方法有很多。最简单的方法是在主机端使用一个CPU或GPU计时器来计算内核的执行时间。在本节,你需要设置一个CPU计时器,并使用NVIDIA分析工具来计算执行时间。 用CPU计时器计时可以使用gettimeofday系统调用来创建一个CPU计时器,以获取系统的时钟时间,它将返回自1970

2023-03-07
HPC
CUDA

线性回归模型

线性回归模型MOdel Representation GoalsIn this lab you will: learn to implement the model f_{w,b} for linear regression with one variable NotationHere is a summary of some of the notation you will encounte

2023-03-06
Machine Learning
Tensorflow Machine Learning
123…11

搜索

Hexo Fluid
总访问量 次 总访客数 人