对比以 ONNX 作为中间过度的方式,新 PyTorch 前端有以下特点:
(相关资料图)
目前 examle_input 支持的数据格式有:
· openvino.runtime.Tensor
· torch.Tensor
· np.ndarray
· listortuplewith tensors (openvino.runtime.Tensor/torch.Tensor/np.ndarray)
· dictionarywhere key is the input name, value is the tensor (openvino.runtime.Tensor/torch.Tensor/np.ndarray)
值得注意的是,以上两个例子导出的均为动态输入模型对象,如果想指定模型的输入 shape,可以再次添加额外的参数 input_shape/input, 将输入 shape 作为参数传入,选其一即可。案例可参考以下的实战部分。
最后,如果开发者希望导出静态 IR 文件以便后续使用,也可以调用以下接口,将 OpenVINO™ 的模型对象进行序列化:
2. 设置模型参数并转化为 OpenVINO™ 模型对象
由于 BERT 是一个多输入模型,这里额外添加了一个 input=input_info 参数,可以用来指定多输入模型中每一个 input 的 shape 以及数据类型。
3. 准备校验数据集,并启动量化
上一步中获得的 model 为 openvino.runtime.Model 类型,可以直接被 NNCF 工具加载
4. 编译量化后的模型对象,并进行推理
最终结果如下:
完整实例和性能精度比较,可以参考:
https://github.com/openvinotoolkit/openvino_notebooks/blob/main/notebooks/105-language-quantize-bert/105-language-quantize-bert.ipynb
- 没有“中间商赚差价”,OpenVINO™直接支持PyTorch模型对象
- “换装”改造 “亮”了“靓”了 世界快讯
- 【安全生产】子龙路社区全面排查生产经营场所燃气安全
- “红石榴·微课堂” 社保缴费一点通 环球报资讯
- 环球观察:“红石榴·微课堂” 社保缴费一点通
- “换装”改造 “亮”了“靓”了
- 【互动掘金】恒勃股份:正开拓布局汽车热管理系统相关产品
- 焦点快报!教育部:严防暑期学科类培训机构违规开班、非学科类培训机构“打擦边球”开展学科类培训等问题
- 南向资金今日净卖出73.59亿港元
- 住建部部长:进一步拓宽住房和城乡建设领域与金融机构的合作 世界快消息
- 预告:上海市政府29日10时举行新闻发布会介绍2023世界人工智能大会筹备等有关情况 热点在线
- 皇太极是谁 皇太极简介
- ai绘画用什么软件?快把这些软件收好 天天报道
- 关注:安徽师大暑期小学期:充电一“夏” 满格开学
- 风雨来袭 张店交警雨天执勤保畅通 资讯推荐
- 电商下乡让90后舞蹈女孩圆梦“甜蜜事业”|每日视点
- 世界信息:欠的网贷还不上会上门催收吗?网贷还不上可不可以慢慢还?|世界热点
- 新北洋:参股公司华菱电子创业板上市申请获受理-世界球精选
- 全球时讯:原粒半导体获数千万元种子轮融资
- 长春海关上半年侦办多起走私毒品进境案 焦点快看
- (高质量发展调研行)中国“医疗特区”博鳌乐城使用特许药械人群快速增长
- 新疆知名景区现代智慧配电网示范点建成投运 快资讯
- 中国饭店协会:端午节假期餐饮住宿消费活力持续释放
- 百事通!高质量发展调研行|海南离岛免税的“金名片”是如何炼成的?
- 天天最新:中国石化获浅层常压页岩气突破
- 中央网信办:即日起,开展为期2个月的“清朗·2023年暑期未成年人网络环境整治”专项行动_全球简讯
- 南向资金净卖出超50亿港元-焦点资讯
- 东方港湾:强烈谴责假冒但斌名义欺骗投资者的非法行为 全球实时
- 陕煤运销集团北方港累计销售煤炭突破800万吨
- 中国信通院副院长:我国5G基站总数已达284.4万个 实现“县县通5G”