Quantization fundamentals
Hardware background
这部分内容主要探索量化的硬件背景以及如何让推理在设备上跑起来。 图1展示了神经网络中矩阵向量乘法 y = W x + b \boldsymbol{y}=\boldsymbol{W}\boldsymbol{x} + \boldsymbol{b} y=Wx+b的计算示意图,这是矩阵乘法和卷积的…
The Perceptron
注意:本文主要介绍preceptron(没有隐藏层)的工作原理,和具体的实例(具体的数据如何进行权重的迭代更新的),但是没有代码实现。preceptron一般是二分类,这里同样提到…
版权声明 本文原创作者:谷哥的小弟作者博客地址:http://blog.csdn.net/lfdfhl《ImageNet Classification with Deep Convolutional Neural Networks》是一篇在深度学习领域具有重要影响力的论文,由Alex Krizhevsky、Ilya Sutskever和Geoffrey E. Hinton等人撰写。该论文主要…
讲的是RNN:
1.RNN的基本概念:有记忆的neural network
案例:slot分类,比如地点啊,时间啊 有个订票系统,Slot Filling,听到用户说: I would like to arrive Taipei on November 2nd. 时…
文章目录 摘要1.CNN v.s. DNN2. why CNN ?原因1:Some patterns are much smaller than the whole image原因2:The same patterns appear in different regions原因3:Subsampling the pixels will not change the object 3. CNN架构的步骤3.1…
参考论文:Netural Machine Translation By Joinly Learning To Align And Translate
这篇论文应该是attention系列论文的鼻祖论文了, 引用量已经超多了吧!
背景
机器翻译方面的模型一般都会采用encoder-decoder的框架,对source…
目录
Convolution Netural Network
摘要
本节内容综述
CNN V.s. DNN
CNN架构提出的基础
1.Some patterns are much smaller than the whole image
2.The same patterns appear in different regions
3.Subsampling the pixels will not change the object
CNN的步骤
…