多媒体数据语义建模与检索_论文

21 0 2年 第 1 期  9 S IN E&T C N L G   F R A I N CE C E H O O YI O M T O   N o本刊重稿 0   科技信息  多媒体数据语义建模与检索  霍 奕 ’ 刘红 运 ’ 马 曙光  陈敬 利 2 王 喜年  马海滨  ( . 北师 范大 学职 业技术 学院应 用信 息技术 系 河北 石 家庄 0 0 2 ; 1河 5 0 4  2河 北师范 大 学物理 科学与 信息 工程 学院 河北 石 家庄 0 0 2 ) . 5 0 4  【 摘 要】 媒体 资产 管理就是对各种类型的视频资料 、 音频资料 、 文字、 图表等媒体资料的数 字化存储 、 目 编 管理、 检索查询、 非编素材 转码 、   信息发布 , 以及设备和 固定 资产等进行全面管理 的系统。本文对媒 体资产 管理 中的视频数据的结构化分析 、 镜头关键帧检 测、 场景 聚类与场景  结 构 图进 行 了研 究 。   【 关键词】 视频 结构化分析 ; 多媒体检 索; 本体  0 引 言  采用先进的管理技术手段 . 把大量的视/ 音频资料变为可视 的、   可 控 的、 可得的内容 , 提供给全社会 . 可以使电视台等媒 体在信 息社会 中   充 当更重要的角色。现在 已经推 出的媒体资产管 理系统一般都 包括 :   采集 、 存储 、 管理 、 目和检索 、 编 信息发布等几部分 。 而在媒体资产管理  系统 中。 存储是核心 . 检索是关键  本文对多媒体资料本身的存储以及  元数据信息的存储 方法进行 了研究 . 重点研究 了视频 数据结 构分 析与  组织 : 对媒体资料库的检索 系统模型进行了研究 。   在进行 了镜头分割和镜 头聚类之后 . 以对视频建立场景转换 图  可 和多层树两种结构 。故事片有多条 主线 , 每条 主线有 比较完整 的故事  情节 . 每个故事又可 以分为故 事单元 : 故事单元 由具有共同拍摄地 点  或事件联系结合而成 的镜头组成 。在场景转换 图中. 每个 节点是一 个  故事单元( 包含几个镜头 的关键帧)结点 间的弧指明故事的流程[   , 2 1 。 对视频数据组织也可以建立 多层树 , 有情节层 和镜头层 两层 。情  节层 比镜头层更加抽象 . 以用情节代表 帧来表 示 . 可 情节代表帧 的选  取可以参见 ( ) 3 中镜头聚类的方法  1 视频数据组织与特征提取    本节研究 了视频数 据组织的关键技术 : 头边缘检测 、 镜 关键 帧提  取、 镜头聚类及建立场景转换 图和多层树  2 媒体 资料库的检索系统  基于本体 的语义信息检索的原理如 图 1 所示    。 本体库也叫知识库 . 般 由领域专家参 与完成 . 一 它建立 了相关 领  域的本体模 型; 收集媒体资料信息的源数据 , 照建立 的本体库 , 参 把收  f ) 头 边 缘 检测   1镜 集来的元数据存储在元数据库中 , 形成元数据描述 : 在查 询时 , 户输  用 为对视频进行有效 的组织 . 需要将视频分解 为基 本单 元 一 般认  入的查询请求经过查询转换器按 照本体库规定转换成相应 的格 式 . 在  为视频 的基本 物理单元为镜头 .它是摄像 机在一次连续操作 中得 到  本体的帮助下 映射到元数据描述 中并 匹配 出符合条件 的数据集 合 : 最  的, 也被认为是摄像 机在 同一场景下连续操作 得到的。两个 镜头间的  后将检索结果返 回给用户  切变是将两个镜头 直接连接在一起得到 , 中间未使用任何剪辑效果  切变一般对应在两帧图像 间某种模式 的突变 . 如场景亮度或颜色的改  资源 拥有 者  变 . 标或背景的运动以及边缘轮廓 的变化等  目 全局特征进行切变检测时将整幅帧 图像看作一个单元计算亮度  典 型的切 变检测 法有像素对 比较法 、 模板 比较法 、 似然 比较 法和直方  输 出  图比较法 。   图 1 基于语义的检 索原理 圈    最常用 的基于局部特征 的切变 检测方法是考虑 图像 中的边 缘或  轮廓 的信息 。在前后两帧之间有切变时 . 新进入视场的边缘会与原有  ( ) 体 库 建 模关 键 技 术   1本 的边缘不重叠且相距 比较远 . 而从视场消失的原有边缘也会与新来的  本体 建模应满足两个条件 : ①基于 x l m 语法特性 ; ②有 较强的表达  边缘相距 的比较远  通过分别计算连续两帧图像 中进入 和消失 的边缘  能力 , 同时兼顾推理功能 , 以满足智能检索的推理需求 。x 是一种资  ml 像素并 比较它们之间的距离就可 以检测切变  源描述语言 . 供了对资源 内容 的表示 . 提 同时也提供 资源所 具有 的结  f ) 头 关 键 帧  2镜 个镜 头的关键帧就是反 映该镜 头中主要信息 内容 的一帧或几  帧 图像 , 用关键帧来代表镜 头。 在存储容量有限时 , 可以通过仅存储关  键 帧达到数据压 缩的效果 : 另外用关键 帧代表镜头 . 对视 频可以用基  于 图像 的技术进行检索  由于场景 中 目标 的运动 或拍摄时摄像机本身 的变焦或摇镜头等  操作 . 一个镜头通常要用几幅关键 帧。关键帧应提供一个 内容尽量丰  富的概要 . 不同的帧 图像 比类似 的帧图像携带更 多的信息 . 以当要  所 提取 多幅关键帧时 . 主要考虑它们 之间的不相似性  提取镜头关键帧  的一种方法是从镜头中选取相关 度最小 的 k 帧作为关键帧。   () 3 镜头聚类  镜头 聚类的方法有基于模 式分类和针对特定 视频类型进行聚类  两种 方式 基于模式分类的方法可利用特征对模式进行分类 . 镜头聚  类需 要提取关键帧 的特征 .并把关键帧用对应 的特征空 间点表示 . 通  过将 特征空 间点聚集成团 . 然后再将 它们 映射 回原

相关文档

多媒体数据库语义检索的系统原型
多媒体数据语义鸿沟问题分析
基于本体与元数据的语义检索
基于语义模型的企业数据检索
基于语义模型的企业数据检索
数据库语义合取查询研究
基于语义关联的视频元数据检索
基于本体的关系数据库语义检索
电脑版