当前位置: 首页 > 中文网络报刊资料的检索技巧
中文网络报刊资料的检索技巧

作者: 邢志宇
摘 要:介绍了四种中文网络报刊资料检索的途径,总结了检索与免费获取网络报刊资料的方法和技巧。

互联网的普及和网络搜索技术的发展为查找文献资料提供了极大的便利。网络环境极大地拓展了文献检索的时空范围,也对检索技能提出了更高的要求。掌握搜索引擎及其检索技巧就可以在正确的地方,采用便捷的方法,以最小的成本,获取最需要的网络资源。笔者长期从事网络导航和网络资源检索工作,在中文网络报刊资料检索方面稍有心得,愿与网络搜索爱好者共享并乞指正。

中文报刊资料的检索可从报刊网站检索、新闻门户网站检索、搜索引擎检索和相关数据库检索等四方面入手。

1、报刊网站检索

公开发行的中文报刊大多已有专门的电子版网站或固定网页,大致提供三种类型的站内检索模式:即“回朔型”检索、“主题型”检索和“综合型”检索。

回朔型检索是以“往期回顾”、“过刊查询”等形式,按日期对往期报刊进行回朔性检索;主题型检索可对报刊内容以关键词进行特性检索,以作者、标题等进行特定篇章检索;综合型检索则是在同一检索页面提供按时间、作者、标题、关键词、版面、栏目等检索入口,同时兼有日期回朔和关键词检索两种功能。从使用角度讲,“主题型”功能最受欢迎,使用频率最高,可能是受版权影响或维护因素,提供“主题型”检索的报刊不多,一些报刊网站的“主题型”功能时开时闭,极不稳定;“回朔型”功能仅能够从“确切日期”查询“已知”资料,只能在已知题名和出版日期的情况下使用,仅可作为辅助检索手段,使用率也较低;还有一些报刊网站干脆不建数据库,仅在相关栏目下标注“更多...”或“more...”,就更无检索价值了。

2、新闻门户网站检索

新闻门户网站检索主要用于查找报载资料。国内较大的综合新闻门户网站都有一定规模的媒体联盟,依托众多媒体实现新闻共享,利用其自建数据库和专门的搜索引擎,可以检索联盟内各媒体的实时新闻和相关资料。各门户网站采用的搜索技术不同,搜索引擎亦各具功能和特色,但其共同特点是其搜索结果不同程度地包括了本站以外众多网络媒体(尤其是报纸的电子版)的相关内容,如“搜狐”新闻搜索(http://dir.sohu.com/dir_news.html)、“新浪”新闻搜索(http://cha.sina.com.cn/tools/news/)、“雅虎”新闻搜索(http://cn.search.yahoo.com/newssrch/)、新华网(http://www.xinhuanet.com/)新闻搜索等等。中国新闻网、中国互联网新闻中心与各省新闻网站因只能进行“站内检索”或“ 本站检索” ,因此对报载资料检索不具实际意义。

3、搜索引擎检索

检索期刊篇章多使用搜索引擎的“网页搜索”功能,检索报载资料主要使用“新闻搜索”并辅以网页搜索功能。通常而言,新闻搜索引擎(或搜索引擎的新闻检索)所指的“新闻”,绝非新闻学特指的狭义的“新闻”,而是报载资料(广告除外)的集合称谓。在检索实践中,凡查询报载资料,专业人员大都会首先使用新闻搜索引擎或搜索引擎的新闻搜索功能。

目前国内最为著名和常用的新闻搜索引擎是百度(http://news.baidu.com/)和中国搜索(http://www.chinasearch.com.cn/index-news.htm)。

百度新闻搜索引擎是“世界上最大的中文新闻搜索平台,每天发布80000--100000条新闻,新闻来源包括500多个综合和地方新闻网站、专业和行业网站、政府部门和组织网站、报刊杂志广播电视媒体网站”。百度新闻每5分钟对互联网上的新闻进行自动更新,并根据内容为每篇新闻提供一个地区属性,据此可以检索全国34个省市自治区的即时地方新闻(http://news.baidu.com/location.html)。

由中国搜索发起的中国搜索联盟是一个以搜索引擎应用为核心的开放型联合体,联盟的协议成员已发展到1000余家,几乎包括了所有的国家与省级报刊网站,以及有一定访问量的地方与行业报刊网站。中国搜索的“第三代智能搜索引擎”每十分钟更新一次新闻内容,是“是目前全球数据更新频率最高的中文搜索引擎”之一。

由于二者的搜索技术不同,其语法功能、对搜索词的要求亦有些许差异,搜索结果的页面要素也各有特色,而信息来源和更新频率不同则必然导致同一词语检索,二者搜索结果的不同,或此多彼少,或此有彼无、或彼此重复。因此,二者需配合使用,以尽可能避免漏检和重复,保证搜索结果的尽可能全面。

4、相关数据库检索

目前几乎已无可免费使用的中文报刊数据库,但我们可以利用商业报刊数据库的免费题录检索和某些高校提供的试用数据库来获取有关中文报刊资料。

4.1、免费题录数据库检索

商业报刊数据库都采用分级授权服务,为提高访问量和最终实现赢利,都提供免费题录检索功能。我们正是利用这一免费服务,获得报刊资料的诸如篇名、作者、原载报刊名、年卷日期等外在信息,然后再选用相应报刊网站的“往期回顾”功能,最终检索到特定资料。

常用的商业中文报刊数据库有:中国资讯行的“中文媒体库(1)、(2)”、“中国经济新闻库”(http://www.chinainfobank.com),资讯行每天对全国1000余家媒体、国外几十家中文媒体适时监测、标引,目前已拥有100亿汉字总量、近1000万篇文献的庞大网上数据库,并以每日逾2000万汉字的速度更新;维普“中文科技期刊数据库 ”、“中文科技期刊引文数据库”、“中国科技经济新闻数据库”( http://www.tydata.com),收录有中文报纸1000种,中文期刊12000种;中国期刊网的“中国期刊全文数据库(8973828多篇)”、“中国重要报纸全文数据库(2653741多篇)”、“中国重要会议论文全文数据库(33000多篇)”(http://www.cnki.net);上海图书馆的“中文社科报刊篇名数据库”( http://www.digilib.sh.cn/dl/zgbk/bkwb.htm 免费注册)、“全国报刊索引数据库(社科、科技)”( http://202.194.124.134/bksy/logon.htm 用户名:lib, 密码:lib )收录了全国哲学社会科学期刊6000多种,报纸200余种,基本上覆盖了全国邮发和非邮发的报刊,堪称特大型文献数据库。此外,还有中国人民大学的“人大报刊复印资料全文数据库”,但需下载按装用户终端组件和检索软件,才能使用。

4.2、试用数据库检索

一些高校图书馆经常提供有关数据库试用,一般数据库在试用期间无特别限制,可以查找资料原文。我们可以利用搜索引擎找到试用网址。如以“中国资讯行+试用”为检索式,可查到浙江某学院,社科院等不少没有IP限制的有全文查阅权限的数据库试用网址,类似的还有维普等数据库。

有的高校对试用数据库设置IP限制,我们可以先通过代理服务器(Proxy)进入校园网,然后再找到试用数据库。

此外,搜索引擎的某些特殊语法在中文报刊资料检索中也有着不可忽视的作用。搜索引擎的site:检索语句和" "(英文引号)短语检索即是查找报刊资料常用的辅助检索方法。

以google、百度为例:site:语句的功能是把搜索结果局限于某个具体网站或者网站频道,或者某个域名。site:检索语句的组成方法是,在site前或域名后空一格输入关键词,site后的冒号为英文字符,冒号后不留空格输入网站、网站频道或域名。例如,河南报业网的关键词检索功能早已关闭,从其所属报刊中查找“钧瓷”(中国五大名瓷之一,产于河南省禹州市)资料,即可用“钧瓷 site:hnby.com.cn”检索。对没有关键词检索功能的报刊网站进行“site:”命令检索,会得到意外的惊喜和收获。

" "的功能是进行自然语句检索,在英文引号内输入报刊资料中已知的只言片语,搜索引擎就会为您找到资料全文。

中文报刊资料的检索,亦不可忽视境外中文网络资源。查找港、澳、台地区和国外中文网络报刊资料一般可分为两个步骤:首先利用搜索引擎找出中文报刊网站,然后对报刊网站进行站内检索。

在搜索引擎中用“台湾+中文报刊”、“美国+中文报刊”、“华文报刊”等以地区或国家与相关关键词组成的检索式搜索,可以得到港、澳、台地区和各国中文报刊列表、华文报刊网站以及海外华文报刊信息数据库的网址,在了解和分析相关网络资源的基础上,便可以使用专门搜索引擎和站内搜索工具来检索和获得有关报刊资料。在实际检索过程中,如遇到一些网站被屏蔽而无法进入的情况时,可采用“曲径通幽”之法,利用代理服务(Proxy)“得其门而入”。

中文报刊资料的网络集散、分布有其自身的特点、规律和内在联系。中文报刊资料检索的关键是要对网络资源有透彻的了解和准确的把握,作到心中有数,才能取用自如。搜索引擎和检索技巧是从浩淼网络资源中寻找、提取特定信息的工具和手段,“工欲善其事,必先利其器”,只有熟练掌握搜索工具和灵活运用检索技巧才能在网络检索中有的放矢、事半功倍。