基于校园网的信息资源搜索引擎系统的设计_论文


第3 卷第5 7 期  20 年 5   08 月 贵 州 工 业 大 学 学 报 (自然 科 学 版 )   J URN     O AL OF GUI HOU UNI RST     E HNOL GY Z   VE I Y OF T C O   Vo . 7 No 5 I3   .  Ma 2 0   v. 0 8 ( tr1S in eEdt n) Nau a  ce c  io   i 文章编号: 0 0 9 ( 0 8 0 0 6 0   1 9— 1 3 2 0 ) 5— 10— 3 0 基于校园网的信息资源搜索引擎 系统的设计  潘 大胜 黄 小龙  , (. 1 百色学院 物理与 电信工程 系, 广西 百 色 5 30 ;. 3 00 2 百色学院 数 学与计算机信 息工程 系, 广西百 色 5 30 ) 300   摘 要 : 园网在 网站 构建 、 校 应用环 境 以及 链接 结构 等许 多方 面与 互联 网有 着较 大的 区别 。需  要根 据校 园网站 的 网站 结构 、 息 资源分布 等特 点调 整 网页采 集 策略 , 进 页 面排 序 算 法 , 信 改 才  能提 高搜 索引擎的采 集效 率和 查询 准确度 。   关键词 : 园网 ; 索引擎 ; 校 搜 采集策略 ; 排序 算 法  中图分 类号 :P 9  T 33 文献标 识码 :   A 0 引  言    目前 , 许多校园网站建设 已具备相当的规模和水准, 形成了一个 以校园网为基础的信息资源共享和交流  的平台。它一方面将学校内部的计算机互联起来 , 实现网络信息管理、 资源共享 和信息交流; 另一方面作为  沟通校 内外 网络 的桥梁 , 为对外 交流 的窗 口。但是 , 成 网上 资 源分 布在 校 园 网的各 个角 落 , 户往 往无 法及  用 时准确地找到自己需要的信息, 这使得校园网上丰富的资源没有发挥应有 的作用。   虽 然互联 网上有 G ol、 og 百度 等较 为成功 的通 用搜索 引 擎 , 是 校 园 网有许 多 不 同于 互联 网的特 点 , e 但 为  此, 本文在对一些排序算法的研究和对校园网特点分析的基础上 , 设计了一种基于校园网信息资源搜索引擎  系统 。   1 校 园 网的 信 息资 源 分 布特 点  校 园 网是 以学 校为单 位 的内联 网(nrnt , It e)它与 互联 网(ne c) 同质 的。但 是 , 园 网的主 要 目的  a It t是 a r 校 是用于信息发布 , 例如教学资源、 办公信息、 内新闻等 , 校 在网站构建、 应用环境 以及链接结构等许多方面与  互联网有着较大的区别。以下是校园网信息资源分布的几个显著特点:   是 网页 间的链接稀 疏 , 均 出度 较低 。校 园网 的大部 分子 网站 由各 院系 自行 管理 和 维 护 , 般说 来 , 平 一   一 校 园网 网站 不需要 使用交 换链接 的方式 以获得商业 利 益 , 因此 网站 管理 员对 人站 链 接 , 网站 的反 向链 接 , 即   均 给予足够 的重 视 , 而对 网站 的出站链 接 , 网站外 出指 向其 他 网站 的链接 , 即 却往 往重 视不够 , 网页之 间 的链  接 相对较少 , 甚至 有些 网站很难从 其它 网站 的链 接到达 。   二是异构文本格式的网页比例高。校园网中通常包含教学资源 、 科研资料等各种资源 , 这些信息通常都  是 以 dep

相关文档

校园网中文搜索引擎系统的设计
基于校园网的人力资源信息管理系统设计
校园网信息资源搜索引擎的研究与实现
基于校园网的高校人力资源管理信息系统设计
基于Lucene的校园网搜索引擎的设计与实现
基于Lucene.Net校园网搜索引擎的设计与实现
基于信息过滤系统的个性化搜索引擎的设计
统计管理信息系统中指标引擎的设计与实现
基于教育信息资源的智能搜索引擎设计与实现
网络化制造资源主题搜索MRS系统的设计研究
电脑版