T/UWA 010-2022 智能视频处理系统通用技术规范.pdf

T/UWA 010-2022 智能视频处理系统通用技术规范.pdf
仅供个人学习
反馈
标准编号:
文件类型:.pdf
资源大小:1.6 M
标准类别:电力标准
资源ID:384067
下载资源

标准规范下载简介

T/UWA 010-2022 智能视频处理系统通用技术规范.pdf

ICS:33.160 CCS:M60

UWA UHD World Association 世界超高清视频产业联盟

世界超高清视频产业联盟标

TCECS 850-2021 住宅厨房空气污染控制通风设计标准.pdf智能视频处理系统通用技术规范

世界超高清视频产业联盟

范围. 规范性引用文件, 术语和定义.. 缩略语... 概述.. 技术要求. 6.1智能视频画质提升. 6.1.1智能超分.. 6.1.2智能增强... 6.1.3智能插帧. 6.1.4智能HDR转换. 6.1.5综合画质提升. 6.2智能老片修复, 6.2.1划痕去除. 6.2.2噪点去除. 6.2.3智能上色.. 6.2.4综合修复提升. 6.3智能视频编辑.. 6.3.1特定子图像去除.. 6.3.2黑边裁剪. 6.3.3智能横竖屏转换.. 6.3.4智能字幕. 6.4智能视频编码.. 6.4.1内容自适应编码. 6.4.2ROI编码. 6.5视频格式... 6.5.1输入编码格式, 6.5.2输出编码格式. 6.5.3输入封装格式. 6.5.4输出封装格式.. 测试方法.. 7.1智能视频画质提升.. 7.1.1智能超分. 7.1.2智能增强. 7.1.3智能插帧. 7.1.4智能HDR转换. 7.1.5综合画质提升,

7.2智能老片修复, 7.2.1划痕去除, 7.2.2噪点去除 7.2.3智能上色 7.2.4综合修复提升.. 7.3智能视频编辑, 7.3.1特定子图像去除 7.3.2黑边裁剪. ? 7.3.3智能横竖屏转换. .8 7.3.4智能字幕 ? 7.4智能视频编码 ? 7.4.1内容自适应编码. 7.4.2ROI编码. .8 7.5视频格式. ..9 7.5.1输入编码格式. .9 7.5.2输出编码格式. .9 7.5.3输入封装格式. 7.5.4输出封装格式.. .9 付录A(资料性)测试项目和技术要求对照. .10 村录B(规范性)测试系统配置, .11 寸录C(规范性)源视频配置. ..12 C.1总则. 12 C.24K... 12 C.34K转25fps高清 12 C.44K转15fps高清. 13 C.54K转标清. 13 C.6内容自适应编码. C.7隔行.... .13 C.8老片... 13 C.9特定子图像. 13 C.10黑边.. .13 C.11横竖屏转换.. C.12字幕.. .14 付录D(规范性)技术指标计算公式. D.1 图像质量提升率. D.2召回率.. .15 D.3字错误率. 15 D.4VMAF标准差 15 D.5CRF模式下ROI编码的平均率变化... 15 D.6交并比. 16

本文件按照GB/T1.1一2020《标准化工作导则第1*分:标准化文件的结构和起草规则》的规 定起草。 本文件由世界超高清视频产业联盟提出并归口。 本文件起草单位:北京百度网讯科技有限公司、*国电子技术标准化研究院、*****电影卫星 频道节目制作*心、*国移动通信集团有限公司、*视奇云(北京)科技有限公司、上海交通大学、华为 技术有限公司、工业和信息化*电子第五研究所、*兴通讯股份有限公司、京东方科技集团股份有限公 司、*国信息通信研究院、杭州当虹科技股份有限公司、北京集创北方科技股份有限公司、广东博华超 高清创新*心有限公司、杭州趣看科技有限公司、百视通网络电视技术发展有限责任公司、深圳市洲明 科技股份有限公司、TCL实业控股股份有限公司、海信视像科技股份有限公司、阿里巴巴(*国)有 限公司、北京小米移动软件有限公司、北京锐马视讯科技有限公司、北京*科大洋科技发展股份有限公 司、北京市博汇科技股份有限公司。 本文件主要起草人:邢怀飞、孙齐锋、尤莉、李冉、查丽、邢刚、刘立军、宋利、曹菲菲、王冰、 连林江、韩松、宋飞、孙强、柳春旭、陈仁伟、李婧欣、赵晓莺、王建、黄林轶、尹芹、顿胜堡、刘明 玺、王晓明、王加良、蔡佳音、王亚军、陈勇、张晋芳、肖铁军、钱代友、郭佩佩、方晖、王金东、赵 鹏、樊磊、韦胜钰、何栋梁、李鑫、丁文鹏、汤毅、张尚荣、王烨东、张晓波、黄永衡、刘国栋、冯亚 楠、陈梅丽、张萌萌、陈冠男、翟梦冉、黄成、彭旭辉、白莹杰、张家斌、彭海。

智能视频处理系统通用技术规范

本文件规定了智能视频处理系统在智能视频画质提升、智能老片修复、智能视频编辑、智能视频编 码和视频格式等方面的通用技术要求,描述了对应的测试方法。 本文件适用于智能视频处理系统的设计、开发、测试和使用,

下列文件*的内容通过文*的规范性引用而构成本文件必不可少的条款。其*,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T9813.1计算机通用规范第1*分:台式微型计算机 GB/T9813.2计算机通用规范第2*分:便携式微型计算机 GB/T9813.3计算机通用规范第3*分:服务器 GY/T155高清晰度电视节目制作及交换用视频参数值 GY/T307超高清晰度电视系统节目制作和交换参数值 GY/T315高动态范围电视制作和交换图像参数值 GY/T340一2020超高清晰度电视图像质量主观评价方法 双刺激连续质量标度法

下列术语和定义适用于本文件。

智能视频处理系统intelligentvideoprocessingsystems 应用人工智能技术进行视频优化的系统。 注:视频优化包括但不限于视频画质提升、老片修复、视频编辑效率提升、视频压缩效率提升等,该系统可以基于 云平台或者终端进行实现。 3.2 内容自适应编码contentadaptiveencoding 根据对视频内容特性的分析生成最优码率和相应分辨率的编码配置的编码方法。 注:采用人工智能模型或机器学习模型,预测最优编码配置,实现在同等视频质量条件下的编码码率最低。 3.3 智能上色intelligentcoloring 应用人工智能技术将视频进行色彩渲染的方法。 3.4 划痕scratch 老的胶片上,由于胶片介质划伤造成的图像条状缺失;或者老的磁带上,由于磁头非正常接触导致 介质划伤带来的图像条状损伤;或者其他因素导致老片的条状损失。 3.5 噪点noise 视频上的颗粒状图像损伤。 注:噪点包括雪花噪声、椒盐噪声、高斯噪声、伪影、块效应、模糊和斑点等。

特定子图像specificsubimage 视频图像*具有特定含义的图像区域

下列缩略语适用于本文件。 CRF:恒定码率系数(ConstantRateFactor) CMAF:通用媒体应用格式(CommonMediaApplicationFormat) DASH:基于HTTP*输的动态自适应流(Dynamic Adaptive Streaming over HTTP) HDR:高动态范围(HighDynamicRange) HLS:HTTP直播流媒体(HTTPLiveStreaming) ROI:感兴趣区域(RegionOfInterest) VMAF:视频质量多方法融合评价(VideoMultimethodAssessmentFusion)

智能视频处理系统,在*统的视频处理基础上集成了基于人工智能的视频处理算法,主要用于视频 内容再生产场景和老片修复场景。从视频处理工作流角度,智能视频处理系统的功能架构主要包括智能 视频画质提升、智能老片修复、智能视频编辑、智能视频编码和视频格式。从系统逻辑实现的角度,技 术构成主要包括基础层、处理层、平台层和交互层。本文件按照视频处理工作流,结合逻辑实现,规范 了相关的技术要求和测试方法。测试项目和技术要求的对照应按附录A,各测试项目的测试系统配置应 按附录B,各测试项目的源视频配置应按附录C,各测试项目*技术指标的计算公式应按附录D。 智能视频处理系统功能架构如图1所示,主要包括智能视频画质提升、智能老片修复、智能视频编 辑、智能视频编码和视频格式五个功能模块。智能视频画质提升主要完成智能超分、智能增强、智能插 帧、智能HDR转换,实现综合画质提升。智能老片修复主要完成划痕去除、噪点去除、智能上色,实现 老片综合修复提升。智能视频编辑主要完成特定子图像去除、黑边裁剪、智能横竖屏转换和智能字幕, 智能视频编码主要完成内容自适应编码和ROI编码。视频格式主要规定输入编码格式、输出编码格式、 输入封装格式和输出封装格式

图1智能视频处理系统功能架构

智能视频处理系统技术架构如图2所示,主要由基础层、处理层、平台层和交互层四个技术集成 基础层主要包括计算、存储、网络和容器等基础设施。处理层主要包括视频编辑与合成、视频

图2智能视频处理系统技术架构

智能视频处理系统满足以下智能超分要求。 应支持标清SD(720X576)视频转高清HD(1920X1080)视频。 ? b) 应支持高清HD(1920X1080)视频转UHD超高清4K(3840X2160)视频。 C) 宜支持从高清HD(1920X1080)视频转UHD超高清8K(7680X4320)视频。 d) 至少应支持2倍的分辨率提升。 e) 宜支持4倍的分辨率提升。

智能视频处理系统满足以下智能增强要求。 a 应支持视频*图像边缘纹理的智能增强。 b) 应支持视频*文字边缘纹理的智能增强。 c) 宜支持特定ROI区域的自适应增强,如人脸, a 应支持对隔行视频的去隔行处理。

智能视频处理系统满足以下智能插帧要求。 a) 最小应支持2倍插帧。 h) 宜支持4倍插帧。

6.1.4智能HDR转换

智能视频处理系统满足以下智能HDR转换要求。 a) 应支持PQ、HLG两种HDR转换曲线。 b) 应支持从GY/T155到GY/T315的动态范围转换。 C) 应支持从GY/T155到GY/T307的色彩空间转换。 d) 应支持8bit位深到10bit位深的转换。 e) 应支持H.265、AVS2或AVS3编码格式*的一种。 f) 应支持在编码*写入HDR元数据。 g) 宜支持不同HDR标准之间的相互转换,如HLG转HDR10或HDRVivid等。

6.1.5综合画质提升

应用智能超分、智能增强、智能插帧和智能HDR转换*一种或多种处理后,输出的目标 视频的图像质量提升率不低于10%,图像质量提升率按附录D*公式(D.1)计算。

智能视频处理系统满足以下划痕去除要求。 2 应支持划痕智能检测,划痕智能检测的召回率不低于70%。召回率按附录D*公式(D.2) 计算。 b) 应支持划痕去除,划痕去除强度能按照阈值调整。 C) 宜提供可视化环境,支持人工辅助调整划痕检测结果,

智能视频处理系统满足以下噪点去除要求。 a) 应支持噪点智能检测。 ) 应支持噪点去除,噪点去除强度能按照阈值调整, ) 宜提供可视化环境,支持人工辅助调整噪点检测结果,

智能视频处理系统应支持智能上色

6.2.4综合修复提升

应用划痕去除、噪点去除、智能上色*一种或多种处理后,输出的目标视频比源视频的图像质量提 升率不低于10%,图像质量提升率按附录D*公式(D.1)计算。

6.3.1特定子图像去除

智能视频处理系统满足以下特定子图像去除要求。 一. 应支持特定子图像智能检测,特定子图像智能检测召回率不低于95%。召回率按附录D*公 式(D.2)计算。 b) 应支持指定区域的特定子图像智能去除

智能视频处理系统满足以下黑边裁剪要求。 应支持在视频图像左、右区域的黑边智能检测,黑边智能检测召回率不低于95%。召回率 附录D*公式(D.2)计算。 应支持指定区域的黑边智能裁剪。

6.3.3智能横竖屏转换

智能视频处理系统满足以下智能横竖屏转换要求。 日 应支持基于画面主体将横屏视频转换成9:16竖屏视频。 b) 存在多个画面主体时,智能选择画面主体进行裁剪。 C 视频场景频繁切换时或存在多画面主体裁剪时,输出画面平稳不抖动。

智能视频处理系统满足以下智能字幕要求。 a) 应支持视频*的语音自动生成字幕,语音自动生成字幕识别字错误率不高于10%。字错误率按 附录D*公式(D.3)计算。 b) 2 应支持ASS或SRT字幕格式文件

DB62/T 3157-2018 建筑工程绿色施工评价标准.pdf6.4.1内容自适应编码

智能视频处理系统满足以下内容自适应编码要求。 a) 应支持按视频场景进行智能内容自适应编码。 D 按7.4.1的测试方法,指定分辨率为高清HD(1920x1080)时,各目标视频片段的VMAF平 均分不低于91分且不高于94分,不同目标视频片段之间的VAMF平均分之差不超过2分。 C) 按7.4.1的测试方法,各目标视频片段*,单帧VMAF分数比VAMF平均分低5%以上的比 例不超过8% d) 1 按7.4.1的测试方法,内容自适应编码的各目标视频片段,对比同等码率下CBR转码的目标 视频片段,VMAF平均分至少提高3分,VMAF标准差降低至少40%。VMAF标准差按附录D *公式(D.4)计算。

智能视频处理系统满足以下ROI编码要求。 a) 2 应支持智能视频ROI编码。 b) 在CRF编码模式下ROI编码的平均码率变化应低于5%。CRF模式下ROI编码的平均码率变 化按附录D*公式(D.5)计算。 注:常见ROI区域内容包括人脸、人体、文字等。

6.5.1输入编码格式

智能视频处理系统满足以下输入编码格式要求。 a) 应支持不少于2种分发域输入编码格式,如H.264、H.265、AVS2等。 6 应支持不少于2种制作域输入编码格式,如AppleProRes 422、DNxHD一NxHR、XA IClass300/480等

6.5.2输出编码格式

[成都]体育*心空调系统施工组织设计(体育场、体育馆、游泳馆)6.5.3输入封装格式

智能视频处理系统满足以下输入封装格式要求。 日a) 应支持不少于5种分发域输入封装格式,如MP4、MOV、TS、FLV、AVI、MKV、3GP等。 ) 应支持不少于2种制作域输入封装格式,如Mov、MXF、AVI等

©版权声明
相关文章