kl800.com省心范文网

毕业论文开题报告


研究生学位论文开题报告

学 专 学 姓

院: 业: 号: 名:

导师姓名: 导师职称:

2014 年

9 月 24 日

基于全文本共引分析的信息资源聚合方法与应用研究
一 选题背景与研究意义
(一) 选题背景 1. 共引分析的发展 16 世纪后期,论文引用制度形成,参考文献成为学术论文的第二特征,是合理进行学 术科研交流的必要部分[1]。1961 年, 《科学引文索引》创刊,国际参考文献格式逐渐规范化, 引文分析法随之成为文献计量学中的常用方法。1973 年美国情报学家 Henry Small[2]和苏联 情报学家 I.V.Marshakova 提出了共引的概念,之后,国内外众多学者纷纷利用 SCI、SSCI 等检 索工具进行共引分析。 共引分析已经成为一种普遍的文献计量分析方法, 其不仅可以用来揭 示科学结构的发展及变化, 在研究前沿分析、 领域分析、 科研评价等方面得到了很大的应用。 传统的引文分析以科学文献中的脚注或尾注形式的参考文献(引文)为数据源,通过统 计其被引频次分析作者、文献以及期刊的学术影响力。然而,传统的研究套路忽略了引文在 文献中的具体引用情况(比如引用次数、引用位置和引用语境等)以及作者的引用动机等重 要信息。在进行共引分析时,共引频次的计算方法是主要限于题录数据,并没有考虑共引层 次(共引的位置距离)以及在同一篇文献中的多次共引。共引距离及共引频次等信息可以从 文献全文数据中抽取,HTML、XML 等结构化的全文数据可直接对引用位置、引用内容等进 行标识, 通过编程就可以自动抽取被标识信息, 使得对大样本数据的有效分析变得可行且容 易。之前全文数据难以获取,随着互联网和信息技术的发展,全文数据的在线获取变得越来 越容易,网上免费生物医学数据库 PubMed 已提供 XML 格式全文数据,世界三大科学期刊 论文数据库 Springer、Elsevier 和 Wiley 也都开始提供全部或部分 XML 格式的全文阅读和下 载。利用全文数据来进行细粒度的共引分析,将成为引文分析发展的必然方向。 2. 知识经济社会的发展 进入二十一世纪, 科技的进步、 社会的发展使得我们已经进入一个全新的知识经济时代, 深化知识服务, 营造高效的知识传递与交流环境, 已经成为信息服务业和知识经济发展的迫 切需求。 随着互联网技术的发展, 科学文献出版量的日益剧增, 信息资源存在载体形式不同、 来源不同、语义丰富、学科各异等特点,如何在复杂的信息资源之间建立起有机联系,对信 息资源进行深层次的揭示、聚合,进而为信息资源用户提供知识服务,已成为当今图书情报 界的热点研究问题。如何揭示和实现信息资源基于知识层面上的关联,最终实现知识服务, 更好地满足用户的需求,显得十分重要。 聚合是对信息资源聚集和融合的一个过程,聚集是指将不同类型的信息资源聚集整合, 融合则是将信息资源进行深层次的理解和认识并有机地整合(基于内部关联)在一起。信息 资源可以看成是文献、 学者及他们之间的关联所形成的一种知识网络体系, 其关联可以有多 种测度方式,从信息计量学出发,可以利用知识单元件的共现来测度,而共引关系就是共现 的一种。利用信息资源知识单元间的这种内部关联对信息资源进行聚合,对于发现学者、文 献之间的共同研究主题、 研究方法及知识交流模式, 进而揭示科学结构的发展及变化都有着

重要的理论和实践意义。 (二) 研究意义 通过国内外文献调研发现, 国内外利用全文数据进行共引分析的研究很少, 将其与聚合 研究相结合的研究更是没有。本文对国内外基于全文数据的共引分析的理论和方法进行介 绍,并将其引入到信息资源聚合当中,最后利用实际数据加以应用,具有一定的理论意义和 实践意义,具体表现如下: 1. 有利于共引关联强度算法的改进 传统的共引分析利用共引次数来度量文献对的关系强度, 共引频次的计算方法是主要限 于题录数据, 将参考文献同等对待。 但是在全文数据中参考文献之间的关系有了更多的测度 方式。比如,参考文献在全文中的多次共引、参考文献在全文中的共引距离都是有效的测度 方式。在引用位置的划分和赋值形成统一标准的基础上对共引强度(共引距离)进行赋值, 能在很大程度上提升共引分析的效果。 2. 有利于扩展信息资源聚合的研究方法 信息资源聚合中计量分析方法的引入, 信息计量学中资源聚合方法的提出及其应用, 能 够扩展计量学、 数字资源聚合领域的理论体系和研究方法, 有助于将计量学领域的文献聚类 方法和知识工程领域的知识聚合相联系,促进学科的交叉融合和深入发展。 3. 有利于促进知识服务水平 通过基于共引关系的资源深度聚合,优化信息资源的知识组织,促进知识流动,能够显 著提升知识服务的能力和水平。

二 国内外研究现状
通过对国内外文献的研读,笔者认为国内外对本领域的研究主要包括以下几个方面: (一) 全文本引文分析研究 全文数据运用于引文分析已有数十年历史, 在前期, 由于全文数据的不易获取和难以解 析,研究多依赖于手工操作,研究样本量少,研究效果较差;近几年,尤其是一些数据库开 始提供 XML 格式的全文数据后, 相关研究越来越多, 研究方法也从前期的手工操作逐渐向自 动化发展。具有代表性的研究者主要有 Small H、陈超美、胡志刚等。相关研究一部分集中 在引用理论和引用行为的研究,主要通过引用内容进行分析,比如 Garfield 在 1962 年运用 文献全文进行引用行为分类研究[3]; 另一部分集中在引用量化的研究, 主要是通过引用位置、 引用频次等进行研究, 比如 Voos 与 Dagaev 的研究 以及 McCain 与 Turner 的研究[5]。笔 者通过对国内外相关文献的研读, 将全文本引文分析研究总结为引用频次分析、 引用位置分 析和引文内容分析三个方面。 1. 引用频次分析 引文分析通过统计引文频次来分析作者、 文献以及期刊的学术影响力, 然而引文与引用 并不是一一对应的, 一篇引文可以被同一文献多次引用或零引用, 一个引用位置也可以同时 引用多篇引文, 被引用多次的参考文献对于施引文献具有更重要的影响, 而一个位置引用多 篇文献则是为了说明引用的可靠性, 科学文献创作中这种引文与引用之间的多对多关系是必 要的。早期,Garfield、Bornmann 和 MacRoberts 兄弟等引文分析开创者就对引文频次的可
[4]

靠性提出质疑, 认为单纯使用引文频次来进行评价是有局限性的, 还应该考虑引文被提及的 次数; Herlach 认为文献的多次提及是引文与施引文献间联系的特征之一[6]; Voos 和 Dagaev 认为引文对施引文献的影响可以用引用次数来计算。据统计约有 1/3 的参考文献被引用不止 一次,Ding Ying 等对期刊《美国社会信息科学和技术》进行研究,发现其每篇参考文献平均 被引用 1.6 次[7]; 胡志刚[8]等统计 Journal of Informetrics 期刊中 350 篇文献的引用次数和引文 篇数,发现二者的分布高度相似,引文篇数高的文章引用次数也高。其中 217 篇文章的引用 个数大于引文篇数,109 篇文章的引文篇数大于引用个数,说明在一定程度上二者呈现出相 对独立性。 胡志刚等将引用频次应用到文献检索结果排序中,检索准确率达到 56.5%[9],高于 CRM 系统的 42%[10];Ding Ying 等利用引文频次和引用频次统计高被引论文,发现结果具有很大 的差异性,在前 20 篇高被引论文中有 35%不同,在前 100 篇中差异率高达 48%[7];胡志刚[8] 等发现, 利用统计被引频次的方法可以更好地预测和挖掘将来新的高被引论文。 一些经典文 献的引用经常是出于尊重其学术地位,一般只引用一次,所以在新的统计方法中排名下降, 而新的高影响力文章排名上升。 这种新的方法降低了一些经典文献的干扰, 更容易识别出最 新发表的高影响力文章,用于科学评价与预测具有更好的效果。 2 引用位置分析 文献作者出于不同的目的在不同位置进行引用, 例如, 引言部分的引用一般是介绍研究 背景和论文相关主题已有研究, 方法部分的引用是对已有方法的证实或修正, 结论部分的引 用则是强调结果的意义和缺陷。因此“引用位置分析”假设引用的位置与该引用对文章的影 响程度大小有关。Cano 在 1989 年最早将引文位置作为变量进行了文献计量分析[40],国内外 学者就引用位置进行了多方面的研究, 以期进一步确定引用位置如何影响引文与施引文献的 关系。 引用位置的变量可用引用距文章开头的长度 (单词数或占文章总长度的百分比) 或引用 所在的文章章节来表示,如胡志刚等就将引文位置表示为引言、研究方法、研究结果和讨论 等四类[11]。引文在文献中并不是均匀分布的,Cozzens[12]发现引用在综述部分的分布最密集, 其次就是引言部分; 胡志刚等对 Journal of Informetrics 期刊中 350 篇文献进行位置分布研究, 发现 50%的引用出现在文章的前 30%部分。高被引文献更倾向于被引用在文献的前面部分, Ding Ying 等发现高被引文献大都是被引用在文章的前言和综述部分[18]; 胡志刚等统计 Hirsch 在 2005 年发表的高被引文献“An Index to Quantify an Individual’s Scientific Research Output” 的被引情况,发现 50%的引用出现在文章的前 10%部分(其中 33.1%是施引文献的第一个引 用) ,与普通文献此比率(前 30%)相比,高被引论文的引用更加偏前。高被引论文的这种 引用分布规律说明作者倾向于将重要的文献优先重点引用, 因而可以利用引文位置来预测高 影响力文献,在进行引文分析时,也应该考虑给前面部分的引用赋予更高的权值。 引用位置也被应用到共引分析中。主要包括以下两个方面:①共引层次划分。共引分析 认为如果 A 同时引用了 B、C,D 同时引用了 E、F,则 B 与 C、E 与 F 相似,且相似强度是相 等的。但是文献的共引层次是不一样的,Elkiss 和 Liu 认为共引有句子内、段落内、章节内 和文章内四个层次
[13]-[14]

;Gipp 等则将共引分为五类:在同一句子中、在同一段落中、在同

一章节、在同一期刊、在同一期刊的不同版本中[15]。不同层次的共引强度是不相同的,Elkiss

发现细粒度层面上的共引文献比粗粒度层面上具有更强的相似性, 如在同一句子中共引的文 献比在同一章节中共引的文献更相似,Liu 也发现句子层面的共引强度是最大的。②共引距 离。Boyack 将两篇共引文献引用位置的最短距离作为一个因素纳入共引分析,发现纳入共 引距离的概念之后,共引聚类的效果比原来提升了 30%[16];Gipp 等还为每类的共引强度赋 予权值,分别为 1,1/2,1/4,1/8 和 1/16,Callahan 等用同样的方法给共引距离赋权值为 1,2,3,4,8[17],提升了共引分析效果。 3 引文内容分析 引文内容是文章中引用该引文的语句内容, 引文特征及其对于施引文献的影响可以通过 引文内容及其上下文的语义来识别。 学术论文的标准规范要求, 文献间的引用需要在正文中 进行标记,如果文献 A 引用文献 B 的内容,就必须在文献 A 中对引用的内容进行标记,引 用标记的上下文便能够在一定程度上表征出 A 与 B 的关系。引文内容正是指施引文献中为 了标记出被引文献的内容,而在引用标记符号所出现的位置前、后截取的几个词或几句话。 Nakov 将引文内容理解为“citances”,即引用语句及其附近的句子;Small 将引文内容定义为 引文语句及其附近的两到三句话; Mei 将引文内容的长度定义为引文语句前 2 句加上引文语 句后 3 句的内容[18]。Small 很早就对引用内容进行了分析[19]-[21],他通过分析化学学科的高被 引论文的引用内容, 发现化学学科高被引论文多是研究实验基本操作规范的文章, 而不是研 究学科前沿问题的论文。在 1979 年,他还对共被引文献在施引文献中的引用内容进行了分 析[22],近来又利用共被引的引用内容进行了情感分析[23]-[24]。引文内容还应用于摘要总结, Nanba 和 Okumura[25]基于一篇文献中所有引文的引用内容来总结该文献的主要内容;Mei 和 Mohammad[26]发现利用引文的引文内容总结的文献内容与利用这些引文的摘要来总结的 结果具有很大的差异。 Garfield、 Cano 等运用引文内容进行了引用功能分析, Garfield 在 1962 年运用文献全文对引用行为进行分类[27];Cano 、Frsig 等[28]-[31]利用文本挖掘、情感分析等 技术对引用动机进行了分类;Teufel 等[30]利用自然语言识别技术对引用内容进行情感分类, 构建了自动识别引用功能的系统。他们将引用功能分为四类: 指出不足、 对比、继承、 中立, 自动地将每个引用分到不同的类,通过检验发现利用情感分类来识别引用功能是十分可靠 的。 (二) 共引关系及其测度研究 “共引”的概念最早是在 1973 年由美国情报学家 Henry Small 提出,两篇(两篇以上) 文献同时被其他文献引用,就称这两篇(多篇)文献为共引关系或同被引关系[2],同被引的 文献在研究主题上具有相似性, 为了度量两篇论文的相似程度, 又提出了共引强度或关联强 度的概念, 通过共被引次数来度量, 两篇文献的共引强度越强, 两者在研究主题上就越相似。 除了文献共被引, 1981 年 White 和 Griffith[32]首次提出了作者共引, 利用作者间的共引关系, 描绘了 39 位情报学家在情报学科领域的相对学术地位和学科结构。McCain[33]在 1991 年首 次以期刊为单位进行了共引分析, 考察经济学领域相关期刊的结构关系。 国外以文献共被引、 作者共被引、期刊共被引三个方向展开了大量的研究。1983 年,汤世国将引文分析方法引 入国内,开启了国内共引分析的先河,2005 年之后,国内出现共引分析研究的热潮。 引文分析在前沿分析、领域分析、科研评价等方面得到了广泛的应用,但其研究方法却 是按照统一的方法模式来进行:①构建共被引矩阵;②将该矩阵转化为相似系数矩阵,利用

Pearson 相关系数法;③进聚类;④结果分析。2003 年 Ahgern[34]等发表《共被引相似性测度 的必要条件——特别以皮尔逊相关系数为证》提出了对 Pearson 相关系数的质疑,由此展开 了关于共被引分析方法的讨论热潮,Leydesdorff[35]、邱均平[36]、王玉玲[37]等进行了引文分析 方法改进的相关研究。 一些学者在研究中提出, 文献的共引层次是不一样的, 不同层次的供应其相似强度是不 相同的,利用共被引频次来度量共引强度是不合理的。Elkiss 和 Liu 认为共引有句子内、段 落内、章节内和文章内四个层次
[38]-[39]

;Gipp 等则将共引分为五类:在同一句子中、在同一

段落中、在同一章节、在同一期刊、在同一期刊的不同版本中 [40]。不同层次的共引强度是 不相同的,Elkiss 发现细粒度层面上的共引文献比粗粒度层面上具有更强的相似性,如在同 一句子中共引的文献比在同一章节中共引的文献更相似,Liu 也发现句子层面的共引强度是 最大的。Boyack 将两篇共引文献引用位置的最短距离作为一个因素纳入共引分析,发现纳 入距离因素之后,共引聚类的效果比原来提升了 30%[41];Shengbo Liu[42]首次正式提出了“共 引距离”的概念;Gipp 等还为每类的共引强度赋予权值,分别为 1,1/2,1/4,1/8 和 1/16, Callahan 等用同样的方法给共引距离赋权值为 1,2,3,4,8[43],提升了共引分析效果。 (三) 信息资源聚合研究 信息资源在载体、来源、语义等方面的复杂特性,使得人们已经无法满足于将相互关联 的分布式异构数据源进行简单的集成和封装。 与传统数据集成相比, 人们对信息在语义和知 识上的需求增加,通过语义分析,对信息资源进行深层次上的关联,抽取具有相同概念或语 义的数据,进而将资源分类或分成具有内部关联的集合,这就是聚合。 国外关于聚合的研究比较成熟, 研究主要集中在三个方面: ①信息资源聚合系统的建设、 工具平台的开发。Bainbridge、Witten 等[44]在数字图书馆多语种接口语言、互操作标准、分 布式数字图书馆的管理复杂性具体技术问题上做出了杰出贡献;②信息组织、信息服务、知 识服务的研究。如 Nurul Amelina 等[45]设计了自动语义抽取系统(AME),用户可以搜索一个 概念,并察看这个概念与其他概念之间的关系。这些关系可以通过“显示文本”功能被追溯 到原始文件中的来源句子; ③本体、 语义网等技术在各学科领域信息资源聚合中的应用研究。 Chen 等[46]近年来深入研究了数字图书馆语义理论, 并将其在工程医学,生物医学,微观经济学 等领域中加以应用和实现。 国内相关研究分为三种主要类型:①基于内容的聚合。王晓光在 2009 年提出了共词网 络,从关键词共现的角度上揭示了科学文献间的内部关联 [47];邱均平、王菲菲从共现和耦 合关系出发,探讨了馆藏文献资源深度聚合模式[48];杜晖系统地阐述了耦合与学术信息资 源聚合的关系, 提出了基于耦合关系的学术信息资源聚合应用的框架, 并将其在具体的学科 领域中进行实现[49]。② 基于利用过程的资源聚合。将文献间的引用关系作为文献的内部关 联因素进行聚合,如邱均平、董克以 WOS 数据库中研究 XML 的论文为例研究了引文网络 中的文献聚合方法[50]。③基于知识的资源聚合。其核心思想是利用社会网络分析、语义分 析、本体等技术对信息资源进行聚合分析,如何超、张玉峰构建了基于本体的馆藏数字资源 语义聚合与可视化模型,利用本体提供的语义知识进行深层次的馆藏数字资源语义聚合[51]。 (四) 研究现状述评 通过对国内外相关研究的调研, 可以看到目前国内外相关研究已经比较成熟, 但仍存在

以下问题: 共引位置的划分和赋值尚未形成统一的标准。 一是引用位置的划分, 包括距篇首的单词 数、引用距篇首长度所占百分比以及引用所在的章节等划分方法,太笼统的划分(如划分为 4 部分)使得研究变得更容易,但分析深度也相应较浅,太细致的划分(如 100 部分)则使 研究变得相当复杂, 分析效果提升却不大, 如何根据实际情况来确定合理的划分标准是以后 要解决的问题之一。二是共引距离的赋值,有的研究者以 1/2 为变量(1,1/2,1/4,1/8……) , 有的研究者以 1 为变量 (1,2,3,4,8) , 也未形成统一的标准。 由于不同位置的引用重要性不同, 如何根据不同位置的引用赋予不同的权值也将是以后要解决的难题之一。 三个主题融合的研究欠缺。 国内外关于三个主题的研究已经有很多, 但是将三者结合起 来的研究几乎没有, 如何在全文本数据的视角下将共引关系在信息资源聚合上进行应用, 仍 有待进一步研究。

三 研究内容纲要
本文共分为五章,内容如下: 第一章:引言。主要阐述了论文的研究背景、意义以及国内外研究现状,简要说明了论文的 研究数据、研究结构、研究方法和创新点。 第二章:全文本共引分析理论与方法。介绍了全文本共引分析法的产生背景、相关理论、研 究内容、研究数据、研究方法等进行了详细的总结介绍。 第三章:全文本共引聚合方法。首先介绍了聚合的相关理论及研究内容,接着论述了共引与 聚合的关系,解读二者之间的有机联系,主要从文献共引和作者共被引两个方向展开,之后 对传统共引聚合的关联强度计算方法、相关系数计算方法、方法体系等进行详细的介绍,最 后基于传统共引聚合方法,结合共引距离得出基于全文数据的共引聚合分析方法。 第四章:实证研究。通过从 Elsevier 开放存取数据库获取 XML 格式的全文数据,利用第四章 构建的分析方法, 从文献共被引和作者共被引两个方面进行实证分析, 并与传统分析方法得 出的结果进行比较分析,最后进行应用分析。 第五章:总结与展望。简要说明本文的研究结论、研究不足和研究展望。 论文大纲如下: 1 引言 1.1 选题背景与研究意义 1.2 国内外研究现状 1.2.1 全文本引文分析研究 1.2.2 共引关系及其测度研究 1.2.3 聚合理论研究 1.3 研究对象与数据来源 1.4 研究内容及研究方法 1.5 本文创新之处 全文本共引分析理论与方法 2.1 全文本共引分析理论 2.1.1 全文本引文分析背景及定义

2

3

4

5

2.1.2 共引关系与共引距离 2.1.3 全文本共引分析研究内容 2.2 研究数据 2.2.1 非结构化全文数据 2.2.2 半结构化全文数据 2.3 研究方法 2.3.1 文本挖掘 2.3.2 自然语言处理 2.3.3 情感分析 全文本共引聚合方法 3.1 信息资源聚合理论 3.1.1 信息资源聚合的概念 3.1.2 信息资源聚合的研究内容 3.2 共引与聚合的关系 3.2.1 文献共被引与聚合的关系 3.2.2 作者共被引与聚合的关系 3.2.3 基于共引关系的聚合模式 3.3 传统共引聚合分析方法 3.3.1 关联强度的计算方法 3.3.2 相关系数的计算方法 3.3.3 共引聚合分析方法体系 3.4 基于全文本的共引聚合分析方法 3.4.1 共引距离测度标准及方法 3.4.2 关联强度计算方法 3.4.3 相关系数计算方法 3.4.4 基于全文本的共引聚合分析方法体系 实证研究 4.1 数据获取与处理 4.2 数据分析及结果 4.2.1 传统共引聚合分析结果 4.2.2 基于全文本的共引聚合分析结果 4.2.3 对比分析 4.3 全文本共引聚合应用分析 4.3.1 专家推荐服务 4.3.2 文献推荐服务 4.3.3 专题检索服务 总结与展望 5.1 本研究的主要结论 5.2 本研究的不足 5.3 研究展望

四 研究方法
本文将主要运用到一下一些研究方法: (一)文献调研与归纳法。本文收集了大量国内外相关文献,对相关领域的理论、方法 进行了系统化的归纳整理,为本文的研究课题提供了研究基础和理论依据。 (二)对比分析法。本文在传统共引聚合分析方法的基础上,构建了基于全文本的共引 聚合分析方法,并在实证中将两种方法进行对比分析,以期找出后者的优点。 (三)统计分析法。本文在进行共引分析的过程中,用到了相关分析、聚类分析、关联 规则等方法。 (四)理论与实证结合研究法。在理论分析的基础上,运用了实证研究法,从更直观、 更具体的层面来对相关问题进行了探讨。

五 研究进度安排
(1)2014 年 6 月下旬,结合研究生阶段所学内容,搜集相关资料,确定研究主题,并 初步拟订查阅文献的计划。 (2) 2014 年 7 月—9 月上旬, 查阅相关文献形成论文思路, 撰写开题报告和论文提纲。 (3)2014 年 9 月下旬—12 月,熟悉论文中涉及到的预备知识,掌握论文的写作方法, 完成论文理论部分内容; (4)2015 年 1 月—2 月,搜集数据,做好实证分析,完成论文的实证内容; (5)2015 年 3 月,论文修改、整理、打印等工作; (6)2015 年 4 月,论文答辩准备及论文答辩。

六 创新点
本研究主要有以下创新点: (1) 共引关联强度测量方法创新 传统共引分析的关联强度通过共引频次来测量, 共引频次的计算方法是主要限于题录数 据,并没有考虑共引层次(共引的位置距离)以及在同一篇文献中的多次共引。本文所研究 的共引分析, 将利用全文本数据信息全面的特点, 在测量共引关联强度时将结合共引频次和 共引距离来进行,相比而言,该方法更加准确有效。 (2) 共引距离测度方法创新 目前关于共引距离的测度方法并没有一个统一的标准。 对于共引距离的赋值, 有的研究 者以 1/2 为变量(1,1/2,1/4,1/8……) ,有的研究者以 1 为变量(1,2,3,4,8) ,且其赋值的依 据并没有进行一个说明。 本研究中, 笔者拟结合两个引用之间单词数占整篇文献单词数的百 分比来进行共引距离的测度。 (3) 研究内容创新 本文将全文本引文分析、 共引分析、 信息资源聚合分析结合研究, 利用全文数据的特点,

将共引关联强度度量方法加以改进,并将其运用到资源聚合中去。通过本课题的研究,能够 为信息资源用户提供更高质量的知识服务,有利于知识的交流和共享。

七 参考文献
[1] Kaplan N. The norms of citation behavior: Prolegomena to the footnote [J]. American Documentation, 1965, 16 ( 3) : 179-184. [2] Small H. Co-citation in the Scientific Literature: A New Measure of the Relationship Between Two Documents[J]. Journal of American Society for Information Science.1973(24): 265-269. [3] Garfield, E. Can citation indexing be automated? [J]. Essays of an Information Scientist. 1962, 13(1): 84–90. [4] Voos H, Dagaev K.S. Are all citations equal? Or, did we op. cit. your idem? [J]. Journal of Academic Librarianship, 1976, 1(6):19–21. [5] McCain K.W., Turner K. Citation context analysis and aging patterns of journal articles in molecular genetics. Scientometrics, 1989,17(1):127-163. [6] Herlach G. Can Retrieval of Information from Citation Indexes be Simplified? Multiple Mention of a Reference as a Characteristic of the Link between Cited and Citing Article [J]. Journal of the American Society for Information Science, 1978, 29(6):308-310. [7] Ying Ding, Xiaozhong Liu, Chun Guo, Blaise Cronin. The distribution of references across texts: Some implications for citation analysis [J]. Journal of Informetrics, 2013(7):583-592. [8]胡志刚,陈超美,刘则渊,侯海燕. 从基于引文到基于引用——一种统计引文总被引次数 的新方法[J]. 图书情报工作, 2013, 57(21):5-10. [9] Shengbo Liu, Chaomei Chen, Kun Ding, Bo Wang, Kan Xu. Literature retrieval based on citation context [C]. //Facultas Verlags- und Buchhandels AG. Proceedings of the 14th International Society of Scientometrics and Informetrics Conference. Vienna: University of Vienna. 2013:1139-1159. [10] He Q, Pei J, Kifer D. Context-aware Citation Recommendation [C]. The International World Wide Web ConferenceSteering Committee. proceedings of the 19th International World Wide Web Conference. Raleigh: IW3C2. 2010:421-430. [11] Zhigang Hu, Chaomei Chen, Zeyuan Liu. Where are citations located in the body of scientific articles? A study of the distributions of citation locations [J]. Journal of Informetrics. 2013(7):887-896. [12] Cozzens S. E. What do citations count? The rhetoric-first model [J]. Scientometrics, 1989, 15(4):437–447. [13] Elkiss A, Shen S, Fader A, Erkan G, States D, Radev D. Blind men and elephants: What do citation summaries tell us about a research article?[J]. Journal of the American Society for Information Science and Technology, 2008, 59(1):51-62. [14] Shengbo Liu, Chaomei Chen. The proximity of co-citation [J]. Scientometrics. 2012, 91(3):495–511.

[15] Gipp Bela, Beel Joeran. Identifying related Documents for Research Paper Recommender by CPA and COA [C]. // Int Assoc Engineers. Proceedings of World Congress on Engineering and Computer Science. San Francisco: INT ASSOC ENGINEERS-IAENG. 2009: 636-639. [16] Kevin W. Boyack, Henry Small, Richard Klavans. Improving the Accuracy of Co-citation Clustering Using Full Text [J]. Journal of the American Society for Information Science and Technology. 2013, 64(9):1759–1767. [17] Callahan A, Hockema S, Eysenbach G. Contextual cocitation:Augmenting cocitation analysis and its applications[J]. Journal of theAmerican Society for Information Science and Technology, 2010, 61(6):1130–1143. [18] Mei Q. Zhai C. Generating impact-based summaries for scientific literature [C].// The Ohio State University. The Proceedings of ACL-08: The 46th Annual Meeting of the Association for Computational Linguistics. Columbus: ACL. 2008:816-824. [19] Small H. Cited documents as concept symbols [J]. Social Studies of Science, 1978(8):327–340. [20] Small H. Citation context analysis [J]. Progress in communication sciences. 1982(8):287–310. [21] Norwood, Small H. The significance of bibliographic references [J]. Scientometrics. 1987, 12(5–6):339–341. [22] Small H. Co-citation context analysis: The relationship between bibliometric structure and knowledge [C].// ASIS&T Governance, Conference Committee. Proceedings of the 16th ASIS Annual Meeting . Medford: Knowledge Industry Pubns . 1979: 270-275. [23] Small H. Interpreting maps of science using citation context sentiments: A preliminary investigation [J]. Scientometrics2011(8):373–388. [24] Small, H. (b). Text mining of citations for emerging scientific communities [OL]. Talk presented at Mapping and Measuring Scientific Output, Los AlamosNational Laboratory, 2011.05.11. Available online at: http://mediazone.brighttalk.com/comm/ReedElsevier/78d7d945a8-24781-4950-26860 [25] Nanba H. Okumura M. Towards multi-paper summarization using reference information [C]. //IJCAII. The proceedings of 16th International Joint Conference on Artificial Intelligence. Stockholm: MORGAN KAUFMANN PUB INC. 1999:926-931 [26] Mohammad S. Dorr B. Egan M. Hassan A. Muthukrishan P. Qazvinian V. Radev D. Zajic D. Using citations to generate surveys of scientific paradigms [C].// Proceedings of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistic. Stroudsburg, PA: Association for Computational Linguistics. 2009: 584-592. [27] Garfield, E. Can citation indexing be automated? [J]. Essays of an Information Scientist. 1962, 13(1): 84–90. [28] Cano V. Citation Behavior: Classification, Utility, and Location [J]. Journal of the American

Society for Information Science, 1989, 40(4): 284-290. [29] Frsig R E. Citation Classification Based on Genre: The Significance of the Textual Location of Citations [D]. Copenhagen: Royal School of Library and Information Science, 2011. [30] Teufel S, Siddharthan A, Tidhar D. Automatic Classification of Citation Function [C].// Association for Computational Linguistics. Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing ( EMNLP’06)[C]. Stroudsburg, PA: Association for Computational Linguistics, 2006: 103-110. [31] Pham S B, Hoffmann A. A New Approach for Scientific Citation Classification Using Cue Phrases [C].// Gedeon TD, Fung LCC. Proceedings of the 16th Australian Conference on Artificial Intelligence. BERLIN, GERMANY : Springer-Verlag Berlin , 2003: 759-771. [32] H D White, B C Griffith. Author Co-Citation: A Literature Measure of Intellectural Structure[J]. Journal of the American Society for Information Science, 1981(32):163-171. [33] K W McCain. Mapping Economics through the Journal Literature: An Experiment in Journal Co-Citation Analysis[J]. Journal of the American Society for Information Science, 1991(42)290-296. [34] Ahlgren P, Jarneving B, Rousseau R. Requirements for a cocitation similarity measure, with special reference to Pearson’s correlation coefficient[J]. Journal of the American Society for Information Science and Technology, 2003, 54(6):550-560. [35] Leydesdorff L, Vaughan L. Co-occurrence Matrices and Their Applications in Information Science: Extending ACA to the Web Environment[J]. Journal of the American Society for Information Science and Technology, 2006, 57(12):1616-1628. [36] 邱均平,马瑞敏,李晔君. 关于共被引分析方法的再认识和再思考[J]. 情报学报,2008, 27(1):69-74. [37] 王玲玉. 文献共引分析中的关联强度和相关系数改进研究[D]. 郑州大学,2011. [38] Elkiss A, Shen S, Fader A, Erkan G, States D, Radev D. Blind men and elephants: What do citation summaries tell us about a research article?[J]. Journal of the American Society for Information Science and Technology, 2008, 59(1):51-62. [39] Shengbo Liu, Chaomei Chen. The proximity of co-citation [J]. Scientometrics. 2012, 91(3):495–511. [40] Gipp Bela, Beel Joeran. Identifying related Documents for Research Paper Recommender by CPA and COA [C]. // Int Assoc Engineers. Proceedings of World Congress on Engineering and Computer Science. San Francisco: INT ASSOC ENGINEERS-IAENG. 2009: 636-639. [41] Kevin W. Boyack, Henry Small, Richard Klavans. Improving the Accuracy of Co-citation Clustering Using Full Text [J]. Journal of the American Society for Information Science and Technology. 2013, 64(9):1759–1767. [42] Shengbo Liu, Chaomei Chen. The proximity of co-citation[J]. Scientomertics, 2012(91):495-511. [43] Callahan A, Hockema S, Eysenbach G. Contextual cocitation:Augmenting cocitation analysis

and its applications[J]. Journal of theAmerican Society for Information Science and Technology, 2010, 61(6):1130–1143. [44] Buchanan G, Bainbridge D, Don, KJ, Witten IH. A new framework for building digital librarycollections[C]. //Proceedings of the 5th ACM/IEEE Joint Conference on Digital Libraries. New York, 2005: 1139-1149. [45] Nurul Amelina Nasharuddin, Jamaliah abdul Hamid, Hamidah Ibrahim. Visualizer for concept relations in an automatic meaning extraction system [J]. The Journal of information and Knowledge management systems,2008(2):232-240. [46] Chen HC, Schalz B, Ng T, Martinez J, Kirchhoff A, Lin CT. A parallel computing approach to creating engineering concept spaces for semantic retrieval; the Illinois Digital Library Initiative project[P]. IEEETransactions on Pattern Analysis and Machine IntelIigence[I996]. [47] 程齐凯,王晓光. 一种基于共词网络社区的科研主题演化分析框架[J]. 图书情报工作, 2013(8) :95-96. [48] 邱均平,王菲菲. 基于共现与耦合的馆藏文献资源深度聚合研究探析[J]. 中国图书馆学 报,2013(3) :25-33. [49] 杜晖. 基于耦合关系的学术信息资源深度聚合研究[D]. 武汉大学,2013. [50] 邱均平, 董克.引文网络中的文献深度聚合方法与实证研究—以 WOS 数据库中 XML 研究论文为例[J]. 中国图书馆学报,2013(2) :111-119. [51] 何超,张玉峰. 基于本体的馆藏数字资源语义聚合与可视化研究[J]. 情报理论与实践, 2013,36(10): 73-76.


赞助商链接

大学本科毕业论文开题报告范例_图文

大学本科毕业论文开题报告范例 - 南京审计学院毕业论文(设计)开题报告 论文题目 学生姓名 指导教师 顾惠 互联网金融对商业银行的影响及其应对策略 学号职称 讲师 专业...

毕业论文开题报告_图文

毕业论文开题报告 - 中共贵州省委党校 研究生毕业论文开题报告 论文题目 研究生姓名 学号 墨子兼爱思想及其现代意义研究 导师姓名 所在教学点 学科专业年级发 ...

本科毕业论文开题报告.doc

本科毕业论文开题报告.doc - 本科生毕业论文开题报告 学专导学学 院业师生号 金融学院 金融学 庞海峰 李少华 B200304631 2007 年 04 月 22 日...

软件毕业设计开题报告_图文

软件毕业设计开题报告 - 基于Android的掌上校园系统的设计与实现... 软件毕业设计开题报告_工学_高等教育_教育专区。基于Android的掌上校园系统的设计与实现 ...

《毕业论文开题报告各种范文》_图文

毕业论文开题报告各种范文》 - 毕业论文开题报告范文 毕业论文(设计)开题报告 学生姓名: XXXX学号:XXXXXXX院 (系):XXX专业 汉语言文学专业 题目: 解析张爱...

南京艺术学院学士毕业论文开题报告

南京艺术学院学士毕业论文开题报告_文学_高等教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 南京艺术学院学士毕业论文开题报告_文学_高等教育_教育专区。南京艺术...

平面设计专业毕业设计开题报告_图文

毕业设计(论文)开题报告 学生姓名: 专业: 学号: 设计(论文)题目: 作品:HELIOS 食品类一系列包装 论文:浅析包装色彩的设计魅力 指导教师: 年 月 日 毕业设计(...

毕业论文开题报告_图文

湖北民族学院 毕业论文开题报告书 学生姓名: 专班业: 级: 公共事业管理 110840215 论文题目: 提升我国地方政府公信力 的路径研究 指导教师: 填表日期: 2011 年...

思政专业毕业论文开题报告

运城学院 本科生毕业论文开题报告论文题目关于高校大学生诚信教育的调查与分析 ——以运城学院为例 学生姓名 韩振峰 系、 专业 政法系 思想政治教育专业 指导教师 ...

毕业论文开题报告

毕业论文开题报告_管理学_高等教育_教育专区。浙江理工大学本科毕业设计(论文)开题报告 班级 课题名称 工程管理 10 级(2)班 姓 名 杜健楠 PPP 项目风险分担研究...