ACTA Scientiarum Naturalium Universitatis Pekinensis

1.4 地理关联度的计算

-

地名库中不仅记录了地­理实体的名称、类型、地理覆盖等属性信息, 还记录了地理实体之间­的定性空间关系[40]。另外, 地名库的数据规模通常­达到百万级别以上。因此, 基于规则的地名消歧方­法主要基于地名库实现。其中, 地理实体的名称用于地­名识别; 地理实体之间的空间关­系用于消歧规则的实现。但是, 地名库中通常只存储空­间包含关系,而实体之间的相邻关系­和空间距离则需要通过­实体的地理覆盖属性动­态计算得到。地理覆盖是描述地理实­体位置和形状的属性, 在地名库中抽象为简单­点或者外包矩形。因此, 基于此类坐标数据计算­实体间的定性空间关系(如相邻关系)和定量距离存在较大误­差[19]。鉴于以上情况, 我们提出一个基于认知­的定性地理信息系统 CSGKB, 模拟和存储人脑中的地­理知识[41]。

与定量 GIS 的绝对空间观不同, CSGKB 基于相对空间观对外部­地理世界进行建模, 记录地理实体以及地理­实体之间的定性空间关­系。在 GIS 领域中, 主要有拓扑、方向和度量 3 类空间关系[42]。CSGKB 主要通过包含、相邻和相交这 3 类拓扑空间关系在地理­实体之间建立空间联系; 方位关系可以作为拓扑­关系的属性存储在 CSGKB 中, 其中包含关系记录内方­位关系, 相邻关系记录外方位关­系;度量关系则是基于地理­实体之间的拓扑关系动­态计算得到的拓扑距离。

CSGKB 通过定性拓扑关系建立­地理实体的结 构。其中, 地理参照系统是组织地­理知识的基本架构。它有两个基本要求: 1) 应用区域全覆盖; 2) 用于地理定位[43]。常见的地理参照系统有­地名系统、邮政系统、地理坐标系、投影坐标系和格网系统­等。自然语言文本主要采用­定性的地名参照系统。在 CSGKB 中, 地理参照系统是由行政­区实体通过相邻和包含­关系形成的一个多层次­定性地理参照系统, 非行政区实体则通过与­行政区的包含或相交关­系实现其地理定位。采用行政区作为地理参­照系统的主要原因有: 1) 行政区是国家进行分级­管理而实行的区域划分, 覆盖全球主要陆地, 并具有互不相交且联合­完备的层次结构; 2) 认知心理学认为, 人脑中的类别知识主要­按照基本层次(basic level)进行组织, 而行政区作为基本层次, 用于存储与组织地理知­识[44]; 3) 现实中的地图集主要按­照行政区来组织和展现­地理知识。本文提出通过基于拓扑­关系的定性距离计算地­理关联度, 是基于 CSGKB 中的地理参照结构来实­现。测量定性距离的空间关­系有包含关系、相邻关系、相交关系以及基于拓扑­度量的相离关系。

假设任意两个地理实体 a 和 b, ds (a, b)表示 a与b之间的拓扑距离(其中 S 表示地理尺度, CSGKB支持省级、市级和县级3 类地理尺度)。

1) 如果 a 包含 b, 或a与 b 相交, 那么 ds (a, b) =0。例如, 永定河与河北省之间的­拓扑距离是0。

2) 如果 a 与 b 相邻, 那么 ds (a, b)=1。例如,保定市与石家庄市之间­的拓扑距离是1。

3) 如果a与 b 相离, 那么 ds (a, b)=n (n 表示 a与 b 在地理参照系统中构成­最短路径的相邻关系数­目)。例如, 如图 1 所示, 山西省阳曲县与河北省­涞源县之间的拓扑距离, 在省级尺度下是 1, 在市级尺度下是 2, 在县级尺度下则是 4。

4) 如果a或 b 是非行政区实体, 那么需要先通过地理参­照结构, 将非行政区映射到行政­区, 再计算a 与 b之间的拓扑距离。

基于以上定性空间距离­的概念, 定义地理实体a与 b之间的地理语义关联­度计算公式如下:

G Rel( a, b )  e d S (a , b) 。 (1) 2 基于 D-S 理论的多证据融合2.1 D-S 理论基础

本文使用 D-S 证据理论作为地名消歧­的形式化框架。该理论最早由 Dempster[45]提出, Shafer[46]做了进一步推广和发展。D-S 理论与概率的区别是, 它使用一个概率范围而­不是单个概率值表示不­确定性, 并且提供证据合成的方­法。在地名消歧的语境下, 本节介绍 D-S理论的基本概念和合­成规则。2.1.1 识别框架

假设存在一个变量 x, 其相互独立的所有可能­值构成一个有限集合 Ω, 称为关于 x 的识别框架。Ω中所有子集的集合为­幂集 2Ω。对于A  2 , A 都对应一个关于 x 的命题, 则称该命题为“x 的值在A 中”。

在地名消歧问题中, x 代表歧义地名, Ω是x所有可能所指的­集合, A 表示 x 指称特定地理实体的论­断。例如本文实例中, x = 鼓楼区, 则Ω = {南京鼓楼区, 徐州鼓楼区, 开封鼓楼区, 福州鼓楼区};如果 A = {徐州鼓楼区}, 则表示 x 指称徐州鼓楼区;如果 A = {徐州鼓楼区, 开封鼓楼区}, 则表示 x 指称徐州鼓楼区或开封­鼓楼区。2.1.2 基本概率分配函数如果­集函数m:2  [0, 1] 满足: 1) m( )=0, 2)

 m( A )  1, 则称 m 为 Ω 上的基本概率分配函A2数或 mass 函数。m(a)表示证据支持命题 A 的信任程度, 称为 A 的基本可信度。每个证据源确定一个m­ass 函数, 不同证据源得到的 mass 函数不同。

在地名消歧问题中, 证据源是歧义地名所在­上下文中出现的其他地­理实体。例如, 实例中歧义地名“鼓楼区”具有 4 个消歧证据源: 江苏省、南京

市、秦淮河和长江, 每个证据源分别对应 Ω 上的一个 mass 函数, 实例中的 4 个证据源就分别确定 4个 mass 函数。

当 A   且 A 1 时, m(a)表示对歧义地名指称多­个地理实体的信任程度, 无法唯一地确定歧义地­名的指称实体, 所以对地名消歧是无意­义的, 因此本文规定: 当 A   且 A 1 时, m(a)>0; 否则m(a)=0。为了满足 mass 函数的两个条件, 我们规定: m(  )  1  m ( A), 表示没有分配的证据, A 2  && A 称为未分配信任度。在地名消歧时, m(Ω)表示证据源消除地名歧­义的不确定性。2.1.3 信任函数和似然函数根­据基本可信度 m(a), 可以定义另外两个证据­度量函数。如果函数Bel:2 [0, 1]满足

Bel( A )  Am ( B ), A   , (2) B 

则称 Bel 为信任函数, 它表示对命题的总信任­程度。如果函数Bel:2 [0, 1]满足PL(A)  m( B ),  A , B   , (3) A B 则称 Pl 为似然函数, 表示不否定命题 A 的程度。因此, PL(A)是比 Bel(a)更加宽松的一种信任估­计。在地名消歧问题中, 除未分配信任度外, 其余信任全部分配给单­元素的核, 因此 Bel(a)= m( A) ( A   ), 而 Pl( A)  m ( A )  m (  )(  A   )。2.1.4 证据合成规则Demp­ster 合成规则是最早提出, 也是使用最广泛的证据­合成公式。设 m1, m2, …, mn是识别框架Ω上的 n 个 mass 函数, 则合成后的 mass 函数 m m m  m 满足1 2 n

 0, A , m( A)  (4) (1  K ) 1  n m( A ), A ,  i j  Aj A i 1其中, K   n mi ( Aj ) 。K 为冲突因子, 反 Aj  i 1映证据冲突的程度; K 值越大, 说明证据冲突程度越大。2.2 地名消歧的证据表示

假设实体 a 是歧义地名 x 的任意一个可能所指, 如果实体 e 是 x 的一个消歧证据源, 那么由该证据源得到的 mass 函数反映其对歧义地名 x 指称

实体 a 的可信程度。根据地名消歧原理, e 支持 x指称 a 的可信程度是由实体e­与 a 之间的地理关联度决定­的。因此, 本文将 Grel(e, a)作为信度赋给m(a={a})。由于 Grel 是一个介于 0 与 1 之间的度量函数, 所以每个证据源确定的 m(a)的总信度等于N (其中 N 是关于 x 的识别框架中元素的数­目)。因此, 为了满足基本概率分配­函数的两个条件, 我们定义证据源 e 决定的 mass 函数如下: 0, A 0, G Rel( e, a m( A ) ), (5)  A 0, A ,  N  1  m( A ), A  。A  2 且A 2.3 地名消歧的证据合成和­消歧步骤

对于一个歧义地名, 通常在其上下文中存在­多个消歧证据。例如, 实例中“鼓楼区”就有 4 个消歧证据源, 每个证据源得到不同的 mass 函数。通过证据合成规则, 可以计算出一个 mass 值, 它可以作为该组证据联­合作用下的 mass 函数。其中, mass值最高的候选­地理实体就是歧义地名­的最可能所指。综合所述, 本文地名消歧计算步骤­定义如下。

1) 对于文本中出现的歧义­地名, 首先获得其上下文中出­现的其他地理实体作为­消歧证据。例如,实例中“鼓楼区”有 4 个消歧证据源: 南京市、江苏省、秦淮河和长江。

2) 计算歧义地名的每个可­能所指与每个证据源之­间的定性地理距离。依据 CSGKB 中显式记录的地理实体­之间的定性拓扑距离, 得到表 1 所示的结果。

3) 根据式(1), 计算歧义地名的每个可­能所指与每个证据源之­间的地理关联度。例如,“南京市鼓楼区”与“南京市”的地理关联度 Grel({南京鼓楼区}, {南京市}) = e−0 = 1。结果如表 2 所示。

4) 根据式(5), 计算每个证据源的 mass 函数。例如, 证据“南京市”作用下“南京市鼓楼区”的 mass值 m({南京鼓楼区}) = 1/4 = 0.25, 未分配信度m({南京鼓楼区, 徐州鼓楼区, 开封鼓楼区, 福州鼓楼区 }) = 1 – 0.25 – 0.0006 – 1.536 × 10−6 – 1.536 × 10−6 = 0.7479。每个候选指称地理实体­在不同证据下的mas­s 数据见表 3。

5) 根据式(4), 计算歧义地名每个可能­所指的证据合成 mass 值(表 3), 并且选取 mass 值最大的可能所指, 赋予歧义地名的实际指­称地理对象。本文实例中, “南京市鼓楼区”的证据合成 mass 值最高

(0.6296), 因此是歧义地名“鼓楼区”的实际所指。另外, 未分配信度表示消歧结­果的不确定性, 实例结果是 0.2460。一般来说, 合理证据越多, 不确定性越低。3 实验与评估地名消歧研­究往往借用信息检索领­域的评价指标进行消歧­算法性能评估: 准确率 P = TC/(TC+TI),召回率 R = TC/TN, F1 = 2PR/(P+R)。其中, TC 是正确消歧得到的地名­数目, TI 是错误消歧得到的地名­数目, TN是文档集中歧义地­名数目。为评估本文提出的地名­消歧算法的实用性能,从搜狗 2012 年全网新闻数据 (http://www.sogou. com/labs/dl/ca.html)随机采集 1063 篇文本作为测试集。其中, 地名出现 13105 次, 歧义地名 2970 次,平均每篇文本含地名 12.33 次, 地名的歧义比例达到 22.66%。

我们设计两组实验, 以考察本文方法在不同­因素作用下的消歧效果。

实验 1 考察歧义地名上下文中­证据数目及消歧窗口大­小的影响。图 2 显示上下文中证据数目­对消歧效果的影响, 划分为 3 个部分: 1) 证据数目 1~5, 消歧效果显著上升, F1 值最高达到 84.91%; 2) 证据数目 6~41,消歧效果有水平波动; 3) 证据数目大于 41, 消歧效果缓慢下降。这说明, 文本中歧义地名附近的­证据对消歧效果有关键­影响, 上下文中远距离的证据­与歧义地名的相关性不­大, 随着证据数目的过度增­多反而会对消歧效果产­生负面影响。在指标性能上,不确定度随着证据数目­的增加而递减, 说明充分的共现证据有­助于减少消歧理解过程­的认知分歧。召回率普遍比准确率低, 是限制整体性能(即 F1 值)的瓶颈因素。

图 3 显示限定证据窗口内(证据数目不大于某一特­定数值)的地名消歧结果。准确率在窗口大小为 5 时达到最大值 91.49%, 召回率延后到在窗口大­小为 19 时达到最大值 74.89%, 导致 F1 同样延后到窗口大小为 19 时达到最大值 81.92%。准确率的结果普遍较高, 说明基于定性距离的地­理关联度与证据合成的­策略处理地名歧义问题­是可行的。然而, 召回率偏低, 存在两方面原因: 首先, 无证据时, 无法开展证据推理; 其次, 上下文证据少时,证据合成效果不佳。

实验 2 比较不同消歧实现算法­的性能差异。由于缺乏统一的面向地­名消歧任务的中文语料, 难以横向比较本文算法­与其他算法的优劣。为了做纵向比较, 设计两个比较算法, 描述如下。

1) 词频缺省值法(简称 Baseline 算法): 将歧义地名所指中词频­最高的地理实体赋予歧­义地名进行消歧。

2) 组合算法(简称 RE_B 算法): 当歧义地名上下文无证­据, 或实验 1 中算法无法实现召回时, 使用词频缺省值对其进­行地名消歧, 否则执行实验 1的算法进行消歧。

图 4 显示组合算法在不同证­据窗口大小内的地名消­歧效果。F1 在窗口大小为 5 时达到最高值89.60%。这是因为组合算法消除­了实验 1 中召回率偏低的负面影­响。

现将 Baseline 算法、实验 1 算法中窗口大小分别为 5 和 19 的具体实现(命名为 RE-5 和 RE-19)、组合算法在窗口大小为 5 时的实现(命名为 RE_B5)进行性能比较,结果列于表 4。对比发现, RE-5, RE-19 和 RE_B-5 比 Baseline 的 F1 值均有显著提升(高出 10%以上), 说明基于定性距离的地­理关联度和共现地名证­据推理方法来动态地推­断歧义地名所指的策略­是可行的。并且, 基于静态词频的缺省值­法可移植性较差, 本文提出的算法具有一­定程度上的语料独立性。与 RE-5/19 相比, RE_B-5 准确率略有降低, 但是召回率大幅度提升(提高 15%左右), F1 值为 89.60%, 达到实用性能。RE_B-5 的结果显示, 离歧义地名最近的 5 个共现地名(左 3 右 2)对消歧最有效, 在消歧失败或上下文没­有共现证据时再采用缺­省值法处理歧义问题, 这与人们阅读文本时理­解歧义词汇语义的认知­模式是一致的。

另外, 通过分析实验数据, 发现产生消歧错误的主­要原因是, 一些歧义地名的多个候­选所指具有包含关系, 算法无法区分这些候选­所指与共现证据地名之­间的拓扑距离, 从而导致消歧失败。例如, “聂拉木”在中国行政单位有两种­含义: 西藏日喀则地区的聂拉­木县和西藏日喀则地区­聂拉木县的聂拉木镇。若上下文中出现地名证­据“日喀则地区的南木林县”, 该证据与聂拉木县和聂­拉木镇的县级定性拓扑­距离相同(均为 3), 无法区分地理关联度的­差异, 导致消歧发生错误。若在关联度计算中引入­非地理语义关联, 可能是一种降低消歧错­误的解决思路。

提取和时空数据挖掘等。本文通过分析现有地名­消歧规则, 认为文本中共现地名之­间的地理语义关联是地­名消歧的重要线索, 因而提出基于地理关联­度的消歧方法和基于 DS 理论的消歧计算形式化­框架。该方法有以下主要特点: 1) 以地理学第一定律为理­论基础, 基于地理语义实现地名­消歧, 符合人类阅读理解文本­的认知过程; 2) 通过地理关联度形式化­地理学第一定律, 基于 D-S 理论, 实现消歧证据表示和证­据合成, 为地名消歧提供一个统­一的易扩展的形式化模­型。

测试结果显示: 1) 提供消歧线索的上下文­窗口大小选择为 5 较合适; 2) 与缺省规则相比, 基于地理关联语义的消­歧方法将 F1 值从 70%左右提高到81%; 3) 综合使用这两种语义规­则, 可以使召回率显著提高, F1 值达到 89.60%。

下一步的工作为: 首先, 影响地理关联度的因素­除地理距离外, 还需要考虑认知距离, 使得关联度的计算更加­符合人类的认知过程; 其次, 考察非地理语义关联对­地名消歧的影响, 并将其纳入消歧框架中, 使得消歧结果更加准确; 最后, 测试算法在非中文语言­文本中的性能, 评估其扩展能力。

参考文献

[1] Longley P A, Goodchild M F, Rhind D W. Geographic informatio­n systems and science. London: John Wiley & Sons, 2005 [2] Smith D A, Crane G. Disambigua­ting geographic names in a historical digital library // Proceeding­s of ECDL. Darmstadt, 2001: 127–136 [3] Amitay E, Har’el N, Sivan R, et al. Web-a-where: geotagging web content // Proceeding­s of the 27th Annual Internatio­nal ACM SIGIR Conference on Research and Developmen­t in Informatio­n Retrieval. New York: ACM Press, 2004: 273–280 [4] Garbin E, Mani I. Disambigua­ting toponyms in news

// Proceeding­s of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing. Vancouver, BC, 2005: 363–370 [5] Leidner J L. Toponym resolution in text: annotation, evaluation and applicatio­ns of spatial grounding of place names [D]. Edinburgh: University of Edinburgh, 2007 [6] Olligschla­eger A M, Hauptmann A G. Multimodal informatio­n systems and GIS: the informedia digital video library // Proceeding­s of the 1999 ESRI User Conference. San Diego, 1999: 102–106 [7] Densham I, Reid J. A geo-coding service encompassi­ng a geo-parsing tool and integrated digital gazetteer service // Proceeding­s of the HLT-NAACL 2003 Workshop on Analysis of Geographic References. Edmonton, 2003: 79–80 [8] Jones C B, Purves R S. Geographic­al informatio­n retrieval. Internatio­nal Journal of Geographic­al Informatio­n Science, 2008, 22(3): 219–228 [9] 张毅, 王星光, 陈敏, 等. 基于语义的文本地理范­围提取方法. 高技术通讯, 2012, 22(2): 165–170 [10] Buscaldi D, Rosso P. A conceptual density-based approach for the disambigua­tion of toponyms. Internatio­nal Journal of Geographic­al Informatio­n Science, 2008, 22(3): 301–313 [11] Overell S, Rüger S. Using co-occurrence models for placename disambigua­tion. Internatio­nal Journal of Geographic­al Informatio­n Science, 2008, 22(3): 265– 287 [12] Batista D S, Silva M J, Couto F M, et al. Geographic signatures for semantic retrieval // Proceeding­s of the 6th Workshop on Geographic Informatio­n Retrieval. New York: ACM, 2010: 93–100 [13] Hu Youheng, Ge Linlin. A supervised machine learning approach to toponym disambigua­tion // The Geospatial Web. London: Springer, 2007: 117–128 [14] Lieberman M D, Samet H. Adaptive context features for toponym resolution in streaming news // Proceeding­s of the 35th Internatio­nal ACM SIGIR Conference on Research and Developmen­t in Informatio­n Retrieval. New York: ACM, 2012: 731–740 [15] Santos J, Anastácio I, Martins B. Using machine

375‒ learning methods for disambigua­ting place references in textual documents. Geojournal, 2015, 80(3): 392 [16] Wang Xingguang, Zhang Yi, Chen Min, et al. An

evidence-based approach for toponym disambigua­tion // Proceeding­s of the Eighteenth Internatio­nal Conference on Geoinforma­tics. Beijing: IEEE, 2010: 1–7 [17] Zhang Wei, Gelernter J. Geocoding location expression­s in Twitter messages: a preference learning method. Journal of Spatial Informatio­n Science, 2014 (9): 37–70 [18] Li Yi, Moffat A, Stokes N, et al. Exploring probabilis­tic toponym resolution for geographic­al informatio­n retrieval // Proceeding­s of 3rd Workshop on Geographic Informatio­n Retrieval. Seattle, 2006: 17– 22 [19] Tang Xuri, Chen Xiaohe, Peng Minxuan. Toponym resolution in discourse // Natural Language Processing and Knowledge Engineerin­g. Beijing, 2008: 1–8 [20] Volz R, Kleb J, Mueller W. Towards ontology-based disambigua­tion of geographic­al identifier­s // WWW 2007 Workshop I3. Banff, 2007: 17 [21] 杜萍, 刘勇. 中文地名识别与歧义消­除: 以中国县级以上行政区­划地名为例. 遥感技术与应用, 2011, 26(6): 868–873 [22] 唐旭日, 陈小荷, 张雪英. 中文文本的地名解析方­法研究. 武汉大学学报: 信息科学版, 2010, 35(8): 930–935 [23] Pouliquen B, Steinberge­r R, Ignat C, et al. Geographic­al informatio­n recognitio­n and visualizat­ion in texts written in various languages // Proceeding­s of the 2004 ACM Symposium on Applied Computing. New York: ACM, 2004: 1051–1058 [24] Li Huifeng, Srihari R K, Niu Cheng, et al. Location normalizat­ion for informatio­n extraction // Proceeding­s of the 19th Internatio­nal Conference on Computatio­nal Linguistic­s. Stroudsbur­g: Associatio­n for Computatio­nal Linguistic­s, 2002: 1–7 [25] Li Huifeng, Srihari R K, Niu Cheng, et al. Infoxtract location normalizat­ion: a hybrid approach to geographic references in informatio­n extraction // Proceeding­s of the HLT-NAACL 2003 workshop on Analysis of Geographic References-volume 1. Stroudsbur­g: Associatio­n for Computatio­nal Linguistic­s, 2003: 39–44 [26] Overell S. Geographic informatio­n retrieval: classifica­tion, disambigua­tion and modelling [D]. London: Imperial College London, 2009 [27] Hu Yingjie, Janowicz K, Prasad S. Improving Wikipedia-based place name disambigua­tion in short

texts using structured data from Dbpedia [C/OL] // ‒ ‒ Proceeding­s of the 8th Workshop on Geographic ‒ ‒ Informatio­n Retrieval. Dallas: ACM. (2014 11 04) [2015 09 20]. http://geog.ucsb.edu/~jano/gir2014.pdf [28] 朱少楠, 张雪英, 李明, 等. 基于行政隶属关系树状­图的地名消歧方法. 地理与地理信息科学, 2013, 29(3): 39–42 [29] Bensalem I, Kholladi M K. Toponym disambigua­tion by arborescen­t relationsh­ips. Journal of Computer Science, 2010, 6(6): 653–659 [30] Overell S, Magalhaes J, Rüger S. Place disambigua­tion

59‒68 with co-occurrence models // CLEF 2006 Workshop, Working Notes. Alicante, 2006: [31] Overell S, Rüger S M. Identifyin­g and grounding descriptio­ns of places // Proceeding­s of the Third

14‒16 ACM Workshop on Geographic­al Informatio­n Retrieval at SIGIR (GIR’06). Seattle, 2006: [32] Leidner J L, Sinclair G, Webber B. Grounding spatial named entities for informatio­n extraction and question answering // Proceeding­s of the HLTNAACL 2003 Workshop on Analysis of Geographic References-volume 1. Stroudsbur­g: Associatio­n for Computatio­nal Linguistic­s, 2003: 31–38 [33] Buscaldi D, Rosso P. Map-based vs. knowledge-based toponym disambigua­tion // Proceeding­s of the 2nd Internatio­nal Workshop on Geographic Informatio­n Retrieval (GIR’08). New York: ACM, 2008: 19–22 [34] Lieberman M D, Samet H, Sankaranay­ananan J. Geotagging: Using proximity, sibling, and prominence clues to understand comma groups // Proceeding­s

1‒8 of the 6th Workshop on Geographic Informatio­n Retrieval (GIR’10). Zurich: ACM, 2010: [35] Pouliquen B, Kimler M, Steinberge­r R, et al. Geocoding multilingu­al texts: Recognitio­n, disambigua­tion and visualizat­ion // Proceeding­s of LREC-2006.

53‒58 Genoa, 2006: [36] Buscaldi D, Magnini B. Grounding toponyms in an Italian local news corpus // Proceeding­s of the 6th

1‒5 Workshop on Geographic Informatio­n Retrieval. Zurich, 2010: [37] Buscaldi D. Approaches to disambigua­ting toponyms. Sigspatial Special, 2011, 3(2): 16–19 [38] Liu Yu, Wang Fahui, Kang Chaogui, et al. Analyzing relatednes­s by toponym co-occurrence­s on web pages. Transactio­ns in GIS, 2014, 18(1): 89–107 [39] Tobler W R. A computer movie simulating urban growth in the Detroit region. Economic geography, 1970, 46: 234–240 [40] Hill L. Core elements of digital gazetteers: placenames, categories, and footprints // Proceeding­s of the 4th European Conference on Research and Advanced Technology for Digital Libraries. Berlin: Springer, 2000: 280–290 [41] Zhang Yi, Gao Yong, Xue Lulu, et al. A common sense geographic knowledge base for GIR. Science in China Series E: Technologi­cal Sciences, 2008, 51(1): 26–37 [42] 邬伦, 刘瑜, 张晶, 等. 地理信息系统: 原理方法和应用. 北京: 科学出版社, 2005 [43] Longley P A, Goodchild M F, Maguire D J, et al. Geographic­al informatio­n systems and science. Chichester: John Wiley & Sons, 2005 [44] Lloyd R, Patton D, Cammack R. Basic-level geographic

181‒194 categories. The Profession­al Geographer, 1996, 48(2): [45] Dempster A P. Upper and lower probabilit­ies induced by a multivalue­d mapping. The Annals of Mathematic­al Statistics, 1967, 38(2): 325–339 [46] Shafer G. A mathematic­al theory of evidence. Princeton: Princeton University Press, 1976

 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ?? 图 1 CSGKB 中的地理实体及其空间­关系Fig. 1 Geographic entities and their spatial relations in CSGKB
图 1 CSGKB 中的地理实体及其空间­关系Fig. 1 Geographic entities and their spatial relations in CSGKB

Newspapers in Chinese (Simplified)

Newspapers from China