当前位置: 首页 > 软件库 > 程序开发 > 搜索引擎 >

元搜索引擎

授权协议 GPL
开发语言 Java
所属分类 程序开发、 搜索引擎
软件类型 开源软件
地区 国产
投 递 者 杨成礼
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

元搜索引擎

原搜索引擎是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索和谷歌搜索善加利用,以小搏大,站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索和谷歌搜索来实现,比如网站的新闻采集,比如技术、品牌的新闻跟踪,比如知识库的收集,比如人机问答系统等,我之前做的一个准确率达百分之九十几的人机问答系统的数据源,其中一部分就是充分利用了百度搜索和谷歌搜索。在此演示的技术的基础上,可以容易地扩展到其他的搜索引擎,可以借鉴使用的NekoHTML+XPath或JSoup+CSSPath技术,轻松获取页面的自定义的内容。

应用领域:

1、采集人物信息
2、采集电子报纸
3、使用NekoHTML和XPath解析百度搜索返回结果
4、使用JSoup和CSSPath解析百度搜索返回结果
5、使用Google AJAX API获取谷歌搜索结果

  • 一.引言   随着网上信息资源的膨胀发展,传统搜索引擎在搜索引擎的查全率和查准率方面很难满足用户的要求。为了查询相关的内容,用户经常是同时使用多个搜索引擎查询相同内容,然後在各个搜索引擎的结果中综合出最适合自己的内容。这对于熟练的检索人员而言,可能不是什么难题,但是对于一般的网上信息搜集者来讲,肯定比较困难。因此如何准确选择搜索引擎、如何减轻学习与操作负担、如何有效利用多个搜索引擎的"集成"资源与

  • 常用元搜索引擎 1 、 qbSearch http://www.qbsearch.com/ ) 2 、 Query Server http://www.queryserver.com ) 3 、 Turbo10 http://turbo10.com/ ) 4 、 Dogpile http://www.dogpile.com/ ) 5 、 Webcrawler http://www.webcrawl

  • 一、全文搜索引擎是什么?     计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。     全文搜索引擎主要有:Lucene、Elasticsearch、Solr。    Lucene,是一个开放源代码的全文检索引擎工具包,不是一个完整的全文检索引擎,而是一个全

  • 常见的搜索引擎包含三类,分别是全文(关键字)搜索引擎、目录(分类)搜索引擎、 元搜索引擎。 其中,全文搜索引擎的原理是先由服务器端搜集网络中的网页,组建数据库;用户在浏 览器界面输入关键字后,服务器根据用户输入的关键字与数据库中的网页进行全文匹配;最 后按照匹配的结果进行排序后,反馈至浏览器界面。该搜索引擎的核心特点是范围广、更新 及时、查询速度快,但准确性差。 目录搜索引擎的原理是事先搭建多中分

 相关资料
  • 搜索引擎分为两部分: 时间筛选 和 搜索引擎 (详情) 1.时间筛选 便捷按钮有今日、昨日、前日、上周 X、近七天,并且能自定义选择时间段来得出想要的结果报表 2.搜索引擎 (时间段详情) 选择日期,查看来自对应时间段内,各个搜索引擎的访问量比例

  • 我有大量相同类型的实体,每个实体都有大量属性,并且我只有以下两种选择来存储它们: 将每个项存储在索引中并执行多索引搜索 将所有enties存储在单个索引中,并且只搜索1个索引。 一般而言,我想要一个时间复杂度之间的比较搜索“N”实体与“M”特征在上述每一种情况!

  • lucene 和 es 的前世今生 lucene 是最先进、功能最强大的搜索库。如果直接基于 lucene 开发,非常复杂,即便写一些简单的功能,也要写大量的 Java 代码,需要深入理解原理。 elasticsearch 基于 lucene,隐藏了 lucene 的复杂性,提供了简单易用的 restful api / Java api 接口(另外还有其他语言的 api 接口)。 分布式的文档存储

  • 搜索引擎 关键参数 报告 method metrics(指标, 数据单位) 其他参数 搜索引擎 source/engine/a pv_count (浏览量(PV)) pv_ratio (浏览量占比,%) visit_count (访问次数) visitor_count (访客数(UV)) new_visitor_count (新访客数) new_visitor_ratio (新访客比率,%) ip

  • 更改历史 * 2018-05-07 胡小根 初始化文档 1 历史、现状和发展 1.1 历史 1.2 现状 1.3 发展 难点:预测发展方向。 2 安装和使用 2.1 安装 2.2 使用 创建index和type 上传单条数据 批量上传数据 查询 2.3 示例 2.4 最佳实践 难点:最佳实践,超出于示例,应该归纳总结出积累的技巧。 3 同类技术对比 难点:归纳比对项 参考资料 El

  • 我使用< code > Hibernate Search 4 . 5 . 1 编写了< code>Spring web-app。当我尝试搜索时,它返回一个条目列表。我认为索引中的问题。用于索引的目录已创建,但实体保存文件后,目录中的文件不变。 这是我的Spring配置文件 我的实体文件