4、待收录的网页或其它信息内容的复杂度的增加也在无形之中加大了确切分类的难度,如与ActiveX技术相关的文献就很难在Yahoo中确切归类。
5、为了编制高质量的主题目录并跟上网络资源发展的速度,必须投入相当大的人力、物力和财力,且对从事该项工作的人员的素质要求也日渐提高。否则,将无法很好地保证其主题目录的质量,也就从根本上无法提供优质的服务。
五、启示和建议
Yahoo 最关键也是最成功之处就在于它为搜索引擎,尤其是主题指南类的搜索引擎的设计和开发树立了“摸板”。借鉴Yahoo先进的搜索引擎经验,进一步完善网络信息资源尤其是中文信息资源的组织和管理,是历史赋予我们的责任。现就建立网上中文信息资源的高质、高效的“导航器”,提出以下几点建议:
1、Yahoo在数字化信息的组织中成功地应用分面分析的思想,建立起了一套完整、全面、等级层次鲜明的主题目录体系以提高信息组织的质量,这一点值得我们借鉴与学习。
目前,国内的许多中文引擎或者因没有分类路径入口,而不能跟上未来形势的发展;或者因目录体系缺乏必要的分类主题理论基础,而给信息的确切归类和准确检索带来了一系列的困难。我们并不一定要照搬Yahoo的分类模式。在具体的编制过程中,应从中国人的思维习惯、检索习惯出发,结合国内已有的主题分类的理论体系(如:《中图法》等),建立所需的分类框架。
2、应逐步增大数据库的规模,从而奠定成功的信息检索的物质基础。建议可以通过两种方式补充数据库的内容:一是鼓励用户将自己网页的地址(URL)通过联机表格递交,二是由自身的巡视软件不断去发现网上新出现的文件,将之归入数据库,在补充的过程中,也应注意数据库内容的定期更新。关于这一点,现在的一些中文搜索引擎做得还很不够,往往只知盲目地填充信息,却缺乏对库内容应有的维护工作,导致数据库庞大臃肿,检索效率低,信息内容陈旧,查准率差。
3、鉴于单纯依赖手工进行信息归类效率低的缺陷,应在这方面加强研究,考虑是否可将目前在文本环境中已经实现并在进一步完善的自动分类、自动标引和自动文摘等处理信息内容的手段用到网络信息资源的组织上来。手工和机器辅助的结合,定能提高工作效率,改善信息组织、管理的质量。
另外,应继续加强检索软件的研制和开发工作。WWW网页内容多由图像、动画、声音、视频等多媒体信息构成。应积极探索这一类信息的检索途径,而不仅限于关键词检索方式。目前,对多媒体信息的存储,标引和检索正日益引起计算机和信息管理领域人士的注意。应密切跟踪这方面技术的发展,并将其切实应用到中文引擎的检索软件的编制上来。
4、参与信息采集、筛选和组织工作的人员素质的高低将直接或间接影响到编制的主题分类体系的质量。因此,各个从事网络信息服务业的部门或企业,尤其是开发中文搜索引擎的部门或企业,应切实加强人员的培训,特别是加强他们在信息分类组织、计算机检索等方面的能力。网络信息资源的组织和开发是一项艰难而又富有前途的工作,广大的图书情报界人士、信息管理和计算机领域的专家应尽快转变观念,加入到开发的行列中来,从而不断提高队伍的素质。
雅虎免费收录程序
继雅虎推出付费收录模式Site Match之后,又推出一款新型免费收录模式。通过这种收录程序,用户只需输入顶级页面的完整的URL地址,雅虎的爬行程序就可以寻找到剩余的网页,并且在索引过程中自动检测并剔除死链接。
进入“免费收录”需要雅虎的注册帐户,进入后可以看到如下的说明:
“输入希望提交的网页完整URL地址,必须包含http://前缀(例如,http://www.Yahoo.com).只需输入网站的顶级页面,我们的爬行程序便可以搜索到你的网站中的剩余网页。我们将在索引过程中自动检测并剔除死链接。
所提交URL被程序索引到需要几周的时间,请耐心等待。”
与站点匹配相比较可以看到免费提交的网站不会受到质量复核,没有报告服务,虽然雅虎声明可以被爬行程序搜索到剩余的网页,但目前为之,我们还没有获得任何数据,说明雅虎对剩余网页的索引深度和数量。
目前雅虎提交的方式共有四种。登录雅虎搜索站点,在提交网站(submit your site)中,可以看到这四种提交方式,分别是Site Match(站点匹配);Pay-For-Performance(竞价 排名);Free URL submission(免费收录);Yahoo!Directory(雅虎目录收录)。具体描述如下:
* Site Match(站点匹配)保证收录进雅虎搜索数据库并显示在合作伙伴站点中;每24小时更新一次;提供跟踪报告,优化显示效果;站点复核保证相关性,有助于提高站点的显示效果。
* Pay-For-Performance(竞价排名):基于关键词的广告形式,保证在雅虎搜索及合作站点中排名显示。
* Free URL submission(免费收录):将网站收录进雅虎搜索的建议性方式。(需要注册帐户)。
* Yahoo!Directory(雅虎目录收录):将网站收录进雅虎目录的建议性方式。
Yahoo更新和最准确的登陆和发布页面 http://search.yahoo.com/info/submit.html
Yahoo!英文的基本收录标准
交费登录Yahoo英文网站的方法:
需要向Yahoo支付299美元(^内容或服务网站需支付美元$600,并且在Business and Economy/Shopping and Services/Sex下的适当目录申请)
1. 但即使是您支付了美元$299,也不保证您的网站一定被Yahoo收录;
2. 即使网站被Yahoo收录,也不保证是您递交网站时所选择的目录;Yahoo工作人员 有权更改目录;
3.即使网站被Yahoo收录,也不保证是你递交网站时所填写的注释,即网站说明。
而且,您的网站被Yahoo收录,或者被Yahoo拒绝收录,$299美元也将不被Yahoo退还。向Yahoo支付$299,仅意味着,Yahoo的编辑访问您的网站,以Yahoo的收录标准决定是否收录您的网站,并保证在7个工作日内答复您。
如果您的网站被拒绝收录,Yahoo的编辑将在7个工作日内通过电子邮件形式告诉您被拒绝收录的原因,您还有一次机会,在收到Yahoo给您发的拒绝信的30天内,您可以再次递交申请,这次您不用再交任何费用,如果这次您再次被Yahoo拒绝,您的网站将再也没有资格被收录到Yahoo目录里。
当您的网站被Yahoo收录后,您还必须每年向Yahoo支付美元$299,该费用是Yahoo的编辑对您的网站的复核费用,您必须在到期的前15个工作日支付下年的审核费用,如果您没有及时支付,您的网站将被从Yahoo的目录中删除。 自动门
被Yahoo收录的最低标准:
(1)如果是商业网站,网站必须具有正式的商业名字,并在网站显著位置显示。
(2)网站必须定位明确。
(3)网站没有被Yahoo目录收录。
(4)保证所递交网站,其内容在Yahoo目录里是“惟一”内容。比如,您已经向Yahoo递交了一个网站A,您又申请了一个域名,并又建立了一个网站 B,网站A与网站B内容相同或“换汤不换药”(虽然语言上有些改动,但实质上还是一个内容),这时您就不能再向Yahoo递交网站B。
(5)如果网站是有地域特征的网站,必须有详细的地址。
(6)没有‘正在建设网页’。
(7)您的网站链接全部有效,并指向相关内容。
(8)网站必须是英文网页,或者有英文版。
(9)您的网站兼容多种浏览器,比如,不是纯Java网站。
(10)您的网站必须24小时与互联网相连。
Site Match - Yahoo 站点匹配收录方式
Site Match(站点匹配)保证收录进雅虎搜索数据库并显示在合作伙伴站点中;每24小时更新一次;提供跟踪报告,优化显示效果;站点复核保证相关性,有助于提高站点的显示效果。
与之前的付费收录程序相同,此程序按照网站的规模分为两个版本。基本版本称为Site Match,适合于少于1000URL的网站。自助服务的工作格式与Inktomi的前Site Submit程序相似。可以直接通过Overture直接注册此程序,也可以通过授权代理商。
Site Match 定价基于提交年费,首个URL交纳$49,第2-10个URL费用为$29/个,第11-999个URL费用为$10/个。除了用于复核的年费还应支付点击费用。大多数URL的点击费用为15美分,属于特定目录(如旅游)的URL点击费用为30美分。
对于规模超过1000URL的网站,雅虎提供了Site Match Xchange程序,无须年费,只需按照所属目录支付每点击不超过1美元的点击费用。
设为主页

无忧公告: