一种用于文本分类的特征选择方法_论文

I SN 1 0 — 0 4 S  09 34  E—mal e uf c c .e .a i: d @ c en tc   C m ue K o l g n  e h ooy电脑 知 识 与技术  o p tr n we eA dT c n l d g Vo ., . , c mb r2 08 P 1 6 —1 6   1 No 7 De e e   0 ,P . 7 2 7 4 4 ht : w w. n sn t n t / w d z .e.   p/ c Tl 8 — 5 — 60 6  5 9 94 e: 6 . 1— 9 9 3 + 5 5 60 6  一 种 用于文本 分 类的特征 选择 方法  周  ,卫  ,军 晗 赵 东,   一 季 (. 业 数 字 化 技 术教 育 部 工 程 研 究 中 心 , 1 企 上海 20 9 ; . 济 大 学 C D研 究 中心 , 海 20 9 3中 国石 化 股 份 有 限 公 司 茂 名 分 公 司 化 工 分部  0 0 2 2同 A 上 00 2;. 广 东 茂 名 55 1 ) 2 0 1  摘要: 文本 分 类 是 文本 信 息 处理 领 域一 个 非 常 重要 的研 究 方 向 , 了节省 文本 分 类 处理 中所 需的 存储 空 间和 运 算 时 间 , 为 在分 类之 前  用 高效 的 算 法减 少所 需分 析 的数 据 是 非 常 必要 的 。 文介 绍 了一 种 文 本分 类 中特征 降维 的 方 法。 传 统 的方 法 不 同 , 文 所 涉及 的 该 和 该   特征 是 从 句 子 中提取 的不 同长度 的词 组 , 然后 用 比数 比来 对 其进 行 特 征 选择 。 实验 结 果表 明 , 文提 出的 方 法 与 传统 方法 相 比 , 该 提  高 了文本 分 类的 准 确 率 。   关 键词 : 文本 分 类 ; 特征 提 取 ; 征 选择 ; 特 比数 比   中图分 类 号 : P 8 T 1  文 献标 识 码 :   A 文章 编 号 :o 9 3 4 (0 8 3 - 7 2 0   1 0 - 0 42 0 )4 1 6 - 3 A F a u eS lc i n M eh d f rTe tCa e 0 ia in   e t r   ee t   t o  o   x   t g r z t   o O ZH0U  n一 ZHA0  e— o g , i u   Ha   , W i d n   j  n l (. h  n ie r gRe a hCe t   r ne reDi t   c n lg , i s y o  d ct n T n i ie i , hn h i 0 0 2 C i 1 eE g e n   s r   ne f   t p s 百 a Teh oo y M n t   f u a o , o  ̄   v rt S a g a 2 0 9 , h— T n i ec r o E ri   l ir E i Un s y     n ; . s r   e tro  A T n i ie i , h n h i 0 8 4 C i a 3 C n  e o u & C e i lC roa o   o n   a 2 Ree c C ne fC D, o  ̄   v rt S a g a 2 1 0 , hn ; . h a P t l m ah   Un sy   i re h m c   op rt n Ma m g a i i B a c   h m c , o ig5 5 1 , hn ) r hC e a Ma m n  2 0  C ia n i l 1   Ab t a t sr c :Te t ae o z t n i a v r mp r n   i ci n i  e t n o ma o   r c s f l . n o d rt  a e s rg  p c   n   o u ig x   t g r a o       e i o t tdr t  n tx   f r t n p o es ed I   r e O sv  t a e s a e a d c mp t   c i i s y a e o i i   i o n t  n tx   ae o z t n i i n c s r O r d c   aawhc   e d t  e a a z d b   f c v   g r h b f r   ls f ai n T i p p r i i  e tct g r a o , t s e e s y t  e u e d t  ih n e  o b   n y e   y e e t e a o i m  eo e c s c t . h s a e   me i i    a l i l t ai i o   i r du e   eho   fd m e i na e u to o   aursf rtx   ae o z to nto c sam t d o   i nso l r d c n  ff t e   e tc t g r a n.U ni  h  r dto l  a t  e tr  ee n t satce i i e o i i l ke te ta i na w v. hefau e rf ri  hi ril s i     t   hrs  fdte e  e gh  x rc e  r m  e e e h n us  d  ai  O pr c s e t e slc o he p a e o   itr ntln t e ta td fo sntnc ,te   e od sr t t   o esfaur  ee t n.Ex rm e a  eul  

相关文档

一种改进的文本分类特征选择方法
用于文本分类的特征选择方法
一种用于贝叶斯分类器的文本特征选择方法
一种组合型中文文本分类特征选择方法
文本分类中一种特征选择方法的改进
中文文本分类中特征选择方法的研究
中文文本分类中特征选择方法的研究
中文文本分类中特征选择方法的比较
文档分类之特征选择方法的实验比较
电脑版