|


通过图4辛迪加BPR视频整合全流程的逻辑描述,对比基于内容的跨媒体信息检索CMIR(Content-based Cross-media Information Retrieval),不仅将面向对象的内容检索由单一媒体的检索推向了各种媒体的综合检索,而且从内容的数据结构上,继承和封装了综合检索的内容。而且,在DEMO系统中除了物理元数据(场景符、镜头符、GPS坐标、时码等等)外,还在MXF(Meida eXchange File format,媒体数据交换格式)的基础上,引入了UMID(Unique Material Identifier,素材识别码)、XML(eXtended Markup Language,扩展标记语言)和RSS(Really Simple Syndication,聚合信息协议),其中UMID和XML构成重要的元数据。特别是在内容整合的元素层,以基于MPEG-7的描述机制,实现AV内容整合的数据应用。 UMID是由电影电视工程师协会(SMPTE)在2000年进行了国际标准化,成为全球唯一的视音频素材识别码。UMID不仅能提供数字媒体的检索应用,还兼容视频制作环境。在数字媒体中,大多数元数据由指定的数据库分别存储和管理,但还有一小部分元数据可以直接植入素材本身,以支持高效元数据的应用需求。为了将元数据为基础的离散条件,在元素层与素材层之间转化为收敛条件,并从本地网络中准确地检索并输出,就必须拥有全球唯一的识别码,而现存的视音频素材或内容的识别码,如ISAN/V-ISAN(ISO)、CRID(TV Anytime Forum)、CID(Content ID Forum)等等,分别是针对制作环境的识别方式,只有UMID是面向素材本身的。因而,通过UMID植入素材,虽然并不过多占用物理空间(只占用128个字节),却为面向对象的高效检索提供了纵向逻辑思维和检索的可能性。 对于网络化对象的应用,DEMO系统侧重解析和扩展XML。XML是SGML语言的一种压缩形式,其特点是比早期的超文本标识语言(HTML)在组织和表现信息的能力等方面具有更大的灵活性。因而被称为“允许创作者设计标记语言的元语言”。在XML基础上,DEMO系统建立规范的自定义标签,主要包括:NewsML(新闻型标记语言)、PRISM(Publishing Requirements for Industry Standard Metadata,工业标准元数据发布需求)和ICE(Information Content and Exchange,信息内容和交换)等。NewsML是国际新闻通信委员会(IPTC)在2000年10月批准的全球最新新闻语言标准,它对XML扩展成为描述和(或)包装多媒体新闻资源的一种文法,在多媒体新闻结构之上,以元素层的合理描述,定义新闻型标记语言的新闻条目(NewsML News Items),以多个统一资源定位器(Uniform Resource Identifiers,URLs)表达信息资源,并以统一资源名(Uniform Resource Name,URN)分配物理名称空间,但存在唯一的URN,以确保资源名字的唯一性和准确性。这样一来,对于网络资源的采集和标引就能够方便地使用一个服务代理,直接受理NewsML的有效载荷。而NewsML的元素,如典型的在线新闻、新闻视频和多媒体数据等,也就能遵照IPTC为NewsML所创建的文档类型定义(DTD),自动将XML元数据装载到NewsML的文档中。正如路透社Geert Linnebank总编辑所指:“NewsML预示真正多媒体消息节目的来临,并最终给客户提供想到何处访问及访问何种消息的极大选择空间。” 针对属于平面媒体和电子出版物的内容整合,DEMO系统向PRISM和ICE协议扩展XML。PRISM涵盖了从目录到内容,包括各种形式电子出版物和印刷出版物在内的各种媒体内容整合,再加上出版界早就支持SGML(XML的前身),并至今用于指导应用,使得XML的覆盖面从数据整合拓展到内容整合,将富媒体的内容划为共享的多库资源。而PRISM是通过提供标准化特性、受控词汇集和支持用户定义受控词汇集实现扩展机制,通过对内容及相关资源进行规范描述,定义基础元数据使用Dublin Core词汇表的RDF/XML文档,不仅扩展了XML和RDF(Resource Description Framework,资源描述框架),而且与纯RDF和日益流行的Dublin Core元素集相一致。实践证明,PRISM可以与大部分RDF工具以及NewsML工具包很好配合,以提供一个基于Java的工具集,既为他人定义自己的受控词汇表提供了方便,也为应用ICE协议指导RDF/XML文档向各个检索对象分发内容,并为网络条件下实现元数据管理和内容检索提供了前提。
|
|
|
|
|