[00037335]基于网络爬虫的地名数据库维护方法
                
                    
                        交易价格:
                        
                            面议
                        
                    
                    
                        所属行业:
                                                
                        
                            软件
                        
                        
                        
                    
                    
                        类型:
                        发明专利
                    
                    
                    
                        技术成熟度:
                        正在研发
                    
                    
                    
                    专利所属地:中国 
                    专利号:201110158956.0
                    
                    
                        交易方式:
                        
                        
                        
                            完全转让
                        
                        
                        
                            许可转让
                        
                        
                        
                            技术入股
                        
                        
                        
                            完全转让
                        
                        
                        
                        
                    
                 
                
                    
                        联系人:
                        应亮
                    
                    
                    
                    
                    所在地:江苏 南京市
                    
                        - 服务承诺
 
                        - 产权明晰
 
                        - 
                            资料保密
                            
 对所交付的所有资料进行保密 
                         
                        - 如实描述
 
                        
                    
                 
             
            
            
         
        
            
                
技术详细介绍
            
            
                本发明公开了一种基于网络爬虫的地名数据库维护方法,主要包括两个部分:基于网络爬虫的空间敏感网页获取和网页文本中地名信息解析。具体步骤分为:基于Google搜索引擎服务的空间敏感网页获取;基于空间主题相关度的空间敏感网页过滤;基于DOM技术的网页解析;基于CRF模型的网页文本中地名识别;采用地名数据库匹配的方式,从网页文本中获取新地名;地名的空间位置信息解析。本发明的方法能有效解决当前地名数据库建设中非标准地名和小颗粒度地名缺乏、地名时效性较低和相对位置信息缺失、地名数据库更新维护周期长、成本高、效率低下等问题,可广泛应用于数字城市建设、空间位置服务、空间信息检索、自然语言处理等领域。