中国专利搜索 世界专利搜索 专利分类查询 专利引用检索 专利族检索
登陆 | |

一种投入驱动的容错的基于数据图谱、信息图谱和知识图谱架构的智能语义搜索方法
有权
阅读授权文献

Input-driven and fault-tolerant intelligent semantic search method based on data atlas, information atlas and knowledge atlas framework

申请号:201710435186.7 申请日:2017-06-10
摘要:本发明是一种投入驱动的容错的基于数据图谱、信息图谱和知识图谱架构的智能语义搜索方法,属于分布式计算和软件工程学技术交叉领域,主要用于解决使用搜索引擎过程中面对非确定不保真信息情况下的决策问题。引入数据图谱、信息图谱和知识图谱三层架构,将网络上资源进行组织,根据用户的预等待时间和计划支付金额建立用户的投入模型,通过语义分析理解用户检索信息的倾向性,按照不同倾向搜索的次数根据每个倾向的比重分配用户投入。根据每次搜索的条目数以及每项条目对应资源的熵值计算该倾向资源的可靠性,虚假信息以及失效信息会随着递进搜索的次数被排除,将资源返回给用户后,获取用户反馈,若用户不满意,提示用户增加投入继续递进搜索。
Abstract: The invention provides an input-driven and fault-tolerant intelligent semantic search method based on data atlas, information atlas and knowledge atlas framework, and belongs to the cross technical field of distributed computation and software engineering. The method is mainly used for solving the decision problem under the circumstance of facing uncertain non-fidelity information in the process of using a search engine. The method introduces three layers framework of data atlas, information atlas and knowledge atlas to organize the resources on the network. According to users' pre-waiting time and planned payment amount, the method establishes a user input model, and analyzes to comprehend the tendencies of the user search information by semantics. Depending on the search number of the different tendencies, the method allocates the user inputs according to the proportion of each tendency. According to the item number of per-search and the entropy of each item corresponding to resources, the method calculates the resource reliability of the tendency, and excludes false information and failure information following the number of progressive search. After the resource is returned to the user, the user feedback is obtained, and if the user is not satisfied, the method prompts the user to increase the input to continue the progressive search.
申请人: 海南大学
Applicant: UNIV HAINAN
地址: 570228 海南省海口市美兰区********(隐藏)
发明(设计)人: 段玉聪 邵礼旭
Inventor: DUAN YUCONG; SHAO LIXU
主分类号: G06F17/30(2006.01)I
分类号: G06F17/30(2006.01)I
  • 法律状态
2019-07-30  授权
2017-11-24  实质审查的生效 IPC(主分类):G06F 17/30申请日:20170610
2017-08-29  公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
  • 其他信息
主权项  1.一种投入驱动的容错的基于数据图谱、信息图谱和知识图谱架构的智能语义搜索方 法,其所包含的步骤如下:
步骤1)根据已有资源,建立处理资源框架;
步骤2)获取用户投入的金额(M)和预等待时间(T),建立用户投入模型,预等待时间决 定搜索的次数(S_times)、每次搜索的项数(S_items)和每项要搜索的时间(Pert_item),本 发明设定每次搜索的项数和每项要搜索的时间是固定的:
(1)
步骤3)获取用户搜索需求,允许用户以自然语言文本描述的形式输入其信息需求;
步骤4)提取用户搜索需求关键词;
步骤5)遍历处理资源架构,搜索相关资源,根据步骤4提取出的关键词,遍历处理资源 架构,寻找相关资源;
步骤6)判断能否找到相关资源,若不能找到,在知识图谱上通过关系推理挖掘新的实 体和关联关系,增强图谱结点密度和边密度,更新处理资源架构,然后重新遍历处理资源架 构,寻找资源;
步骤7)构建模糊倾向性词汇表,模糊倾向性词汇指的是 “可能”、“或许”这种倾向性不 确定的词语;
步骤8)对找到的资源根据倾向性按照正向和反向进行分类,答案中包括模糊倾向词汇 表中词汇的资源视为无用资源;
步骤9)根据步骤(8)得到的两种倾向性资源,统计正向资源和反向资源在资源总数所 占的比重(weight),其中Resource表示正向资源数,Resource表示反向资源数, Resource表示资源总数:
(2)
(3)
步骤10)根据步骤9得到的正反双向资源所占权重分配用户投入,确定正向和反向搜 索分别要花费的时间和金额,进而确定正反双向搜索分别要递进搜索的次数:
(4)
(5)
步骤11)根据步骤8得到的资源按照资源中的关键词进行关联因素递进搜索,并计算得 到信息的熵值,熵值范围是0到1,熵值越大,信息倾向越分散,可信度越低,资源是有时效性 的,是按照某一关联因素进行递进搜索时,在Tk时间下得到的资源的熵值,pi是每类答案出 现的概率,Entropy表示按照某一关联因素进行递进搜索时,在不同时效下得到资源的加权 平均熵值,Timeliness是Tk时间资源的时效性,Ts是资源开始出现的时间,Tt是资源终止传 播的时间,Tc是当前搜索者搜索资源的时间:
(6) 1
(7)
(8)
步骤12)根据步骤9得到的递进搜索项的熵,计算资源可信度Confidence,本发明设定 在搜索前正反倾向的资源可信度都为1,n是搜索的次数,m是每次搜索的条目总数,itemi表 示条目i,是按条目i递进搜索得到的资源的熵:
(9)
步骤13)根据步骤10得到的资源的可信度,判断正向资源可信度和反向资源可信度的 比值是否大于阈值T或小于1/T,该阈值可根据学习算法得到,若可信度比值满足阈值条件, 返回可信度大的资源给搜索者;否则步骤11遍历处理资源架构继续递进搜索;
步骤14)获取用户反馈,若用户对答案不满意,提示用户是否增加投入重新检索,若用 户增加了投入,返回步骤10重新分配正向和反向投入比例,继续递进搜索。
公开号  107103100A
公开日  2017-08-29
专利代理机构  
代理人  
颁证日  
优先权  
 
国别 优先权号 优先权日 类型
CN  201710435186  20170610 
国际申请  
国际公布  
进入国家日期  
  • 专利对比文献
类型 阶段 文献号 公开日期 涉及权利要求项 相关页数
SEA  US2013226846A1  20130829  全文 
SEA  CN104035917A  20140910  全文 
SEA  CN104866593A  20150826  全文 
SEA  CN103488724A  20140101  全文 
SEA  CN105653706A  20160608  全文 
SEA  CN106156090A  20161123  全文 
注:不保证该信息的有效性、完整性、准确性,以上信息也不具有任何效力,仅供参考。使用前请另行委托专业机构进一步查核,使用该信息的一切后果由用户自行负责。
X:单独影响权利要求的新颖性或创造性的文件;
Y:与检索报告中其他 Y类文件组合后影响权利要求的创造性的文件;
A:背景技术文件,即反映权利要求的部分技术特征或者有关的现有技术的文件;
R:任何单位或个人在申请日向专利局提交的、属于同样的发明创造的专利或专利申请文件;
P:中间文件,其公开日在申请的申请日与所要求的优先权日之间的文件,或会导致需核实该申请优先权的文件;
E:单独影响权利要求新颖性的抵触申请文件。
  • 期刊对比文献
类型 阶段 期刊文摘名称 作者 标题 涉及权利要求项 相关页数
  • 书籍对比文献
类型 阶段 书名 作者 标题 涉及权利要求项 相关页数