标准规范下载简介
GB/T 42382.1-2023 信息技术 神经网络表示与模型压缩 第1部分:卷积神经网络.pdfICS 35.040 CCS L 71
GB/T42382.1—2023
ZJM-003-3751-2021标准下载信息技术神经网络表示与模型压缩
GB/T 42382.1 202
引言·. 规范性引用文件 术语和定义…… 缩略语 约定. 5.1 规则 5.2 算术运算符 5.3 逻辑运算符 5 5.4关系运算符 5.5位运算符 5.7 数学函数 6 5.9 解析过程和解码过程的描述方法 神经网络模型的语法和语义……… 6.1 数据结构 6.2 语法描述 6.3语义描述.... 75 7.1多模型. 75 7.2量化…. 7.3剪枝 7.4结构化矩阵 解压过程(解码表示)……… 8.1多模型 112 8.2反量化 118 8.3反稀疏化/反剪枝操作· 128 8.4结构化矩阵 ..... 数据生成方法 138 138 9.2训练数据生成方法 139 9.3多模型…….…. 145 9.4量化. 150 9.5剪枝 169
184 10.1神经网络模型权重压缩位流的语法和语义.….… 184 10.2权重压缩位流的语法描述 189 10.3权重压缩位流的语义描述· 10.4 权重压缩位流解析过程· 10.5权重压缩位流解码.…...…. 11.1模型保护定义........... 11.2模型加密过程........... 11.3模型解密过程… 11.4密文模型数据结构定义. 射录A(资料性)专利列表·… *..*...246 参考文献.… 247
184 10.1神经网络模型权重压缩位流的语法和语义 184 10.2权重压缩位流的语法描述 189 10.3 权重压缩位流的语义描述 ·212 10.4 权重压缩位流解析过程 222 10.5权重压缩位流解码 233
11.1模型保护定义 241 11.2模型加密过程 11.3模型解密过程....…. *.243 11.4密文模型数据结构定义 附录A(资料性)专利列表 参考文献· 247
GB/T 42382.1 202
信息技术神经网络表示与模型压缩 第1部分:卷积神经网络
息技术神经网络表示与模型压
本文件规定了卷积神经网络离线模型的表示与压缩过程。 本文件适用于各种卷积神经网络模型的研制、开发、测试评估过程,以及在端云领域的高效应用, 注:对于本文件规定的表示与模型压缩方法不要求机器学习框架原生支持,可以通过转换、工具包等形式支持。
本文件规定了卷积神经网络离线模型的表示与压缩过程。 本文件适用于各种卷积神经网络模型的研制、开发、测试评估过程,以及在端云领域的高效应用 注:对于本文件规定的表示与模型压缩方法不要求机器学习框架原生支持,可以通过转换、工具包等形式支持
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引 件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单) 本文件。 GB/T5271.34一2006信息技术词汇第34部分:人工智能神经网络 3术语和定义 下列术语和定义适用于本文件。 3.1 编解码表示codecrepresentation 使用压缩技术减少模型的规模。 注:具体定义参考编解码表示,见第10章。 3.2 层layer 神经网络中的分级结构。 注:每个网络层包含多个个算子,例如输人层,卷积层,全连接层。 3.3 参考随机向量referencerandomvector 整个网络共存的基础符号向量。 3.4 多重INT4量化multipleINT4quantization 一种量化的方式,将一个张量量化为多个INT4张量的组合的量化方式。 3.5 封装表示encapsulationrepresentation 支出安全信息和身份验证等接口。 注:具体定义参考模型保护,见第11章。 3.6 分块结构化矩阵blockstructuredmatrix 可以分为多个块,且每个分块均按照某种规律排列的矩阵
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用 ,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适 文件。 GB/T5271.34—2006信息技术词汇 第34部分:人工智能神经网络
3.29 特有偏置specificoffsetvector 特有偏置向量 用一个神经网络处理多个不同任务,对任一任务而言,其不共享的偏置部分。 3.30 特有偏置向量列表listofuniqueoffsetvectors 用一个神经网络处理多个不同任务,除共享权重值以外的部分,也是多个任务不共享的权重部分的 组合。 3.31 循环矩阵circulantmatrix 循环矩阵是结构化矩阵的一种,排列规则为当前行/列为前一行/列的循环移位
特有偏置specificoffsetvector 特有偏置向量 用一个神经网络处理多个不同任务,对任一任务而言,其不共享的偏置部分。 .30 特有偏置向量列表listofuniqueoffsetvectors 用一个神经网络处理多个不同任务,除共享权重值以外的部分,也是多个任务不共享的权重部分的 组合。 .31 循环矩阵circulantmatrix 循环矩阵是结构化矩阵的一种,排列规则为当前行/列为前一行/列的循环移位
下列缩略语适用于本文件。 CNN:卷积神经网络(ConvolutionalNeuralNetwork DNN:深度神经网络(DeepNeuralNetwork) PQ:乘积量化(ProductQuantization)
本文件中使用的数学运算符和优先级与C语言使用的类似。但对整型除法和算术移位操作进 寺定定义。除特别说明外,约定编号和计数从0开始
算术运算符定义见表1。
逻辑运算符定义见表2
GB/T 42382.1 202
表2 逻辑运算符定义
关系运算符定义见表3
位运算符定义见表4。
赋值运算定义见表5。
数学函数定义见式(1)~式(10)
GB/T 42382.1 202
结构关系符定义见表6
以下函数用于语法描述。假定解码器中存在一个位流指针,这个指针指向位流中要读取的下一个 二进制位的位置。函数由函数名及左右圆括号内的参数构成。函数也可没有参数,
5.9.2保留、禁止和标记
6神经网络模型的语法和语义
神经网络结构数据结构定
符合GB/T5271.34一2006,其模型信息以及计算图的相关网络层结构的编码方式如图1所示。通过多 个字段的元信息和字段的值采用顺序相连或嵌套的方式进行压缩存储,字段的元信息中含有对这个字 段描述的所有信息。其中每个字段有required,repeated和optional三种格式,required表示该字段是 必须的,repeated表示该字段可以重复出现,optional表示该字段可选。
针对不同的数据类型,每组字段元信息和字段的值采用了不同的编码方式。
神经网络结构表示编码纟
GB/T 42382.1 202
行了详细的描述。相对于神经网络结构的表示,针对运算操作,这里将还有网络层参数单独存储,其基 本编码方式如图3所示:
神经网络参数的编码方
对于每个运算操作或者神经网络的每一节点,其tag字段对应每层自定义名字。每个操作对应多 个字段,分别表示每个节点所对应的多组参数。每组参数的key对应其关键字或名称,value字段存储 着对应数组。 对于图3中value的数据结构表示,对于数组的数据结构编码方式表示如图4所示。其包含基本 的数据类型、矩阵维度、各维度大小、各维度的跨度以及具体数据。要查找对应数值时消防工程钢结构面漆及防火涂料施工组织设计,可通过索引、数 据类型和各维度的跨度来从data中查找
图4数组数据结构编码方式
本条对神经网络表示的语法进行了定义,采用从粗粒度到细粒度的定义,即从模型结构定义、计算 图定义、节点定义等到张量的定义和基本数据类型的定义,逐层嵌套,构建了整个神经网络表示的基本 语法描述。 神经网络表示语法应按照标准规范实现,再由特定计算系统(深度学习平台及相关软硬件)完成,应 遵循以下原则。 a)宜考虑必要层级的定义,包含: 1)模型结构定义; 2)计算图定义; 3)节点定义; 4)张量定义:
5)基 基本数据类型定义。 b) 1 计算系统实现时,应对语法要素按实际需要做出调整,包含但不限于, 1)关键字(参数)命名; 2)运算符命名; 3)数据类型。
办公楼投标施工组织设计6.2.2模型结构定义
模型结构定义见表7。