基于本体概念图的电子课本系统构造技术研究_论文

维普资讯 http://www.cqvip.com 20 年 第 l 期  08 计 算 机 系 统 应 用  基 于 本 体 概 念 图 的 电子 课 本 系 统 构 造 技 术 研 究  Re e c     ner tng a   —Tex book s s em  c s ar h on ge ai   n e — t  y t Te hnol ogy b s d  a e   on t e On o o y Co c p u l a r m    h   t l g   n e t a  Di g a 曾义聪  ( 长沙 民政职业技术 学院电子工程 系 长沙 40 0 ) ]0 4   摘 要 :提 出一 种在 We b上 自动构造 电子课本 学习 系统的方法。 学习者通过遍历域 本体库 的本体概念 图, 定  指 主题 层 次 , 导 主题 爬 取 We 引 b文 档 , 自动 构造 电 子课 本 , We 在 b上 学 习就 像 在读 一 本 书 。   关键 词 :本 体 本 体 概 念 图 电子 课 本 主 题 爬 取  1 引言    最 初 在 We b上 学 习 , 用 的 是 搜 索 引 擎 , 于  采 由 文献 [ ] 3 中的搜 索策 略采 用 随机  模型 , 于  中浪 基 网页权值 ( a e a k 排序 爬取 , 算方 法简单。适 用  Pg R n ) 计 于 用户不 能访问 网上所有 可能 的网页情况 下 , 用户  对 来说 , 优先访 问 “ 重要 ” 网页显 得 尤为 重要 , 在 爬取  但 过程 的开始 阶段不是 很有 效 , 一般 与其它方 法组合 使  用。   w b文档是 为 多种 用途而 制作的 , e 基于无遗 漏爬取 的  搜 索引擎 , 消耗 巨大 的存储和带 宽资源 , 同时 用户很 难  找 到他们特定需要 的 we b文档。   一 个理想 的解决方 法是采 用主题 爬取 技 术 , 集  收 指定主题 的 We b文档 , 造 电子课 本 ( 构 e—Txb o )  e to k , 让人们在 We b上学 习就 像在读 一本 书  。面对 信 息  的海洋 , 本体 ( n l y 作为一 种 能在 语义 和知 识 层  O to ) o g 次上 描述信息 系统 的概念模 型建模 工具 , 是一 个 日益  流行 的组织信 息 的方式。基于本 体 的信息 组织 , 它是  采 用语 义 内容 导向 的方法 , 非传统基 于链接 分析 为 而   导 向的方法。与此相适应 , 我们的主题爬取 过程 中, 更  需要 以语义 内容为导 向 , 使爬取过 来 的文档 与主题语  义更相关。   而文献 [ ] 4 中提 出 的智能 爬取 是采 用统计模 型 ,   在进行爬取 的过程 中尽 力学 习链接结构特 征。它利 用   了 入 链 ( lk g w b网 页 的 内 容信 息 , 选 U L 号  ii i ) e nn n 候 R记 信息 , 链 ( lk g) b网页或 兄 弟 (u lg ) 入 ii i we nn n s bn s 网页  i 其 它 行 为 , 测 候 选 U L 给 定 爬 取 有 用 的 概 率 。 但  预 R对 实 现 中 因 为 每 次 一 个 网 页 被 爬 取 , 们 需 要 分 析 它 入  我 链网页的 内容 , 这是 有点 麻烦 的事。文献 [ 4]的作者  利 用一 个启发 式的调 整 , 用侯选 者本 身的 内容代 替入  链网页的 内容 , 侯 选 者并 未 爬行 , 的 内容从 何 知  但 它 本 文介绍一种新颖 的方法 , 习者通 过遍 历域 本  学 体 库的本体 概念图 , 指定主题层次 , 采用基于本体 概念  图的主题爬 取 技 术爬 取 We b文档 , 自动 构造 电子 课  本。   道, 这是 文献[ ] 4 的作者有欠考虑 的地方。   所 有这 些 基 于 链 接 分 析 的 主 题 爬 取 方 法 共 同不 足  之处 是赋 予待爬取 的 U L R 对象 , 只是链接 结构方 面的  信息 , 而并 非真 正的语义信 息。   在 We b学 习方面 , 文献 [ ] 述 了允 许用户指 定  2描 2 相 关 工 作  在 主题爬取技术 方面 , 文献 [] 1 中的搜 索策略采 用   一 主题层次 , 系统 自动给他 们产 生完整 课本 。它的不 足  之 处 是 首 先 它 假 设 用 户 可 能 知 道 主 题 的纲 要 , 每 个  而 人 对 主 题 的 纲 要 理 解 深 度 不 同 , 而 指 定 的 主 题 层 次  从 个上下 文组合 图 , 允许 用户查询指 向特 定文档 的 网   页, 为种子 文档 构造一 个合 上下文 图和对 应各层 的分  准确程度不 同。其次是 只对搜索引擎 的结果按相 关性  类器 , 不足 之处是构 造过 程须 借助 搜索引 擎的部分 功  能, 并且计算 方法复 杂。   和重 要性进 行重 排 , 只在扩 充结果 集时才 应用 了主题  爬 取 技 术 , 没 有 考 虑 用 主 题 层次 引 导 爬取 。 但   Rsa hadDvl m n研 究开发 e r  n ee p et ec o 3  1 维普资讯 http://www.cqvip.com 计 算 机 系 统 应 用  20 年 第 1 期  08 本 文提 出一 种在 We b上 自动构 造 电子课本 学 习   系统的方 法 。学 习者可 通过 遍 历本 体 库 的本体 概 念  L是 NI q   的标签 , 它是描述 概念结 点 N 的少数关键  ” 字集 :   图, 加深对概 念 关 系 的理解 , 而构 造准 确 的 主题 层  进 次,

相关文档

主题图本体技术构建公安情报概念知识库研究
基于粗概念格模型的电子商务领域本体的构建研究
电子教材:概念、功能与关键技术问题
基于本体的语义搜索引擎的概念体系结构研究
基于概念图范式的工具知识模型文献管理体系构建
深刻的概念,美妙的图画——应用电子白板构建学生概念图的思考
基于用户自定义结构的电子档案管理系统设计与实现
网络中心电子战概念及其体系结构探讨
根据新教材、新理念、新课标构建开放性教学新体系
基于CRM理念构建电子政务系统
电脑版