35分类目录源码 35分类目录文章搜索( 二 )



分类搜索建立在网络分类的基础上,了解分类搜索的原理,不能不首先了解网络分类体系 。分类标准、类目划分、类目设置、类目序列等,对分类体系的构建至关重要,决定着分类目录的性质和功能,影响着分类搜索的效率和效果 。系统性和实用性是对网络信息分类的基本要求,以学科性质为标准可以保证分类的系统性,以事物主题为标准体现了分类体系的实用性 。国内的分类搜索引擎如搜狗(搜狐)等,以学科分类为主,主题分类为辅,体现了系统性和实用性的完美结合 。网络分类体系的类目划分,多强调易用性原则,为了直观揭示和尽可能地减少检索中的点击次数,不惜牺牲系统性,允许在类目的同一划分过程中采用多个不同的划分标准 。类目的设置以方便使用和检索习惯为依据,为了引起网民的兴趣和关注,常常突破体系分类的规则,把热门主题或点击率高的类目置于较高级位或显著位置 。类目序列以检索频次为主要参考指标,首先列举检索频次较高的类目,突出重要或时尚主题,迎合网民的检索习惯与检索偏好 。网络信息分类有着强烈的时代特色和功利目的,它虽然注重系统性对稳定分类体系的重要作用,但更关注检索热点及其趋势变化;它虽然重视信息揭示和检索中的逻辑关联与认识意义,但更强调检索的简捷与方便 。

由于网络分类体系的特点,一些类系或类列已完全打破了体系分类的学科系统性,常规的浏览检索很难快速有效地找到目标网站,此时可以利用目录的数据库优势,用关键词直接进入某一类目,然后再在该类下浏览搜索 。

3、怎样进行分类搜索

进行分类搜索,首先要了解所使用的分类体系的特点及其类目设置,如Yahoo!是主题索引式指南(subject-based guide to web sites and web content),把全球网站按主题划分为14个大类,网站收录质量较高,学术性较强,编辑严谨,久负盛誉,尤其"China "类下的中文和国内网站极具参考价值 。搜狗(搜狐)是典型的主题分类目录,按学科或主题设置16个一级类目,50,000个主题分类,对中文网站收录最为全面,但二级以下同位类和网站列表没有固定的排列顺序(如按拼音或笔画),浏览查找多有不便 。Yahoo!和搜狗(搜狐)都具有地区与主题(学科)分面组配检索功能,都设置有大量的交替类目,可对网站进行多角度、多途径检索 。

分类搜索还需注意,由于网络分类没有统一的分类标准,同名类目或相似类目,在不同的分类体系中的类目含义不尽相同,因此性质相同或相近的网站在不同的分类体系中可能分属不同的大类,或同一大类的不同级位 。如与"太极拳"相关的网站,在搜狗(搜狐)中归入"体育健身"大类之中(体育健身>武术/搏击>太极拳),而雅虎中国则列于"休闲与生活"大类之下(休闲与生活 > 体育运动 > 武术 > 太极拳);"搜索引擎"在搜狗(搜狐)和雅虎中国中的大类归属相同("电脑网络"与"电脑与因特网"),但级位不同,分属三级(电脑网络>搜索引擎/分类目录 >搜索引擎 )和四级类目(电脑与因特网 > 因特网 > 搜寻与检索 > 搜索引擎),又如"心脏内科"在搜狗(搜狐)列有专类,而相关网站在雅虎中国中却分散在"健康与医药 > 疾病与症状 > 心脏病"和"健康与医药 > 医学 > 内科"两个类目下 。凡此种种,非专门的研究人员不可能对各种分类体系了如指掌,一般用户只能根据需要和爱好,选择一种分类搜索引擎,经常使用,以熟生巧 。

此外,进行分类搜索还要了解不同分类目录的网站收录特点,如雅虎中国以收录繁体中文网站见长,搜狗(搜狐)以本土化著称,分别为查找BIG5码网站和简体中文网站的首选 。

推荐阅读