ICE最早出现于1998年,但它的缺憾是没能提供一种可行的多媒体内容描述模式。作为主要电子出版物XML的内容与交换标准之一,只要它采用了合理的、规范的描述模式,就可以把平面媒体与电子出版物的内容一并纳入内容整合。而MXF外壳恰恰就可以担当此任,再借助MPEG-7的模式化语言描述,当初并不“吃香”的ICE协议,如今却能涵盖富媒体的内容资源,以至标准化的识别和检索。 图5 基于MPEG-7应用的数据逻辑 DEMO系统的数据逻辑流程如图5所示。通过图5联系图3所示的应用环境,系统包括特征抽取(分析)、描述本身和搜索引擎(应用)的3个组件所组成,以MPEG-7的标准化元素建立DDL的描述模式,然后将描述模式作为基础,产生下一个描述,再以自动的特征提取形成D与DS。当对比实体校正时,若自动提取不能可靠地表达实体,则采用交互提取工具;若提取的抽象层次更高,出现差值更大(越与实体不符),则以实体的静态元素为样本,通过DDL语言的实体过滤,实时反馈校正偏差。 描述子的不可视性是MPEG-7应用的难点,但经过MXF格式的数据变换以后,以SMPTE 336M KLV数据编码协议,提供专业广播电视视频环境的一种外壳格式,一方面包装MPEG-2数据流、DV数据流、YUV数据流以及PCM音频文件,另一方面装载多种媒体格式的数据库文件(同步或非同步模式),以MPEG-7编码描述元数据和描述子。这样,不仅提供了在更深层次上数据整合的载体和可读数据,也为富媒体时代准备了内容管理与内容整合的兼容性,还突破了在网络环境下因缺乏标准视频文件格式而受阻的窘况。 在MXF的DMS-1描述方案中,SMPTE与EBU元数据的定义有悖于MPEG-7编码描述时,则以校正的过滤方式实现装载,在还原时一并解码,如元数据对视频实体的并联时间线轨,则以校正时间线定位指针的反馈信息同时装载,在解码中预以校正。整个校正流程是:首先将D与DV置于上层数据,以DS进行实体校验,以承认CD变换模式的可靠性,由此成为视频数据包的搜索引擎,再以实际应用的统计规律寻找校正的对应关系,通过对视频图像的采集与分析,衍生物理元数据的描述标准(受控词汇库),以受控词汇的反馈,以与运动预测的差值补偿相仿的逆过程,逐步将误差调整归零,当被编辑的实际应用认可以后,就可以实现全自动的赋值及标引,达到准确表达视频实体。图6说明了建立对应关系的演化过程,通过层次化的逐项分析,在视频显示中得到准确赋值和校验后,数据整合的收敛就确立了。

例如图6中的纹理分析,运用广播测试素材的测试方法,对比人脸采集描述的准确度,以真实接受比(True Acceptance ratio,TA)和错误接受比(False Acceptance ratio,FA)作为指标,计算和评价相对人脸分析的2个参数: TA=正确检索人脸数目/人脸总数 FA=被错误判断的人脸数目/人脸总数 测试结果表明,对于一个包含广泛素材(超过5000张人脸)的序列集,可获得86%的TA,而FA仅为3%,而且这些FA是由于人脸遇到较大遮挡物,或由于特殊姿势而未包含纹理范围中。那么,就可以由此构成准实体的序列集,再以另一方向上其他层次的描述,进一步校正如运动轨迹、色度、亮度等方面的参数,即便再高的误判,也将被不断刷新的DDL所激活,使描述和识别完全趋向实体。这样一来,如前所述的单纯依赖《分类法》的弱点就得到了充分互补,从二维空间向多维的空间检索拓展,以自动的多模式标准化语言描述了内容,检索了素材。 另外,DEMO系统还利用RSS协议的信息聚合能力,在P2P模式的支持下,以点对点的需求将数据“拉入”多库模式的媒体内容库,再以分布式资产库的内容元数据交换和检索机制,在XML系列扩展标准的支持下进一步分类编目,一方面使服务对象顺利浏览这些资料,并通过内容整合占有这些资料,同时再构新节目和再造新业务;另一方面还可依据规范的目录信息采集,将特定的MXL及其扩展数据转换为标引条目,大大提高了针对《分类法》文档自动录入条目的编目效率。 |