通元智能搜索引擎
luyued 发布于 2011-03-08 10:12 浏览 N 次通元智能搜索引擎简介
通元智能搜索引擎(Gpower SmartSearch),融合了高效的全文检索引擎和非结构化文档(Word、HTML、PDF等)分析技术,可轻松实现本地文件系统检索、数据库精准检索和一个(或多个)网站的站内搜索。所支持的数据源包括:文件系统、Internet网站、关系数据库、FTP服务器等。Gpower SmartSearch通过内嵌的Spider,能定期监控网站、数据库等信息变化情况,对发生变化的信息进行增量索引、差量索引。在检索时,不仅能够对数据源内容进行全文检索,而且还能对网页、office文档的各类属性进行特征检索。高级版本还支持拼音检查、相关词检索以及中英文单词拼写检查等高级功能。Gpower SmartSearch能为用户提供有价值的信息检索服务,是一个功能强大其稳定高效的企业级搜索引擎。
应用领域
站内检索
大部分网民在第一次访问一个网站的时候,往往是首先进行站内搜索,如果搜索结果没有他们想要的,则有13%的消费者会马上离开,去别的网站寻找。Gpower SmartSearch可为网站,建立一套站内搜索,方便用户在网站海量数据中快速查找信息。
垂直搜索引擎
目前,垂直搜索引擎正成为互联网发展的下一个热点。比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索。
采用Gpower SmartSearch,实时索引企业已有的资料库,并结合互联网信息抓取技术,成为构建垂直搜索引擎的基础。
企业搜索
企业内部有各种文件、OA系统、客户关系管理系统等多种资料,采用Gpower SmartSearch,为企业搭建统一的信息检索门户。
系统总体结构
一个好的搜索引擎,就是要精确、快速找到客户想要的信息,具体表现为
极高的准确性
查全率,能确保满足要求的每笔资料都能检索到
智能性,能主动猜测用户的意图
支持多种数据源,包括文件、网页、数据库
四大亮点
精准的中文分词算法
采用与清华大学合作开发的分词算法,支持对中文、英文、数字的混合分词。中文分词有效地消除中文歧义,中文单词识别准确率达到99%以上。智能识别中文人名单词,数量词,Email、URL等信息,为用户提供更精准的检索结果。
智能搜索
采用相关度分析技术,使相关度高的结果排在前面,低的排在后面。对检索单词进行智能提示:包括拼写检查、相关词建议等,有效的帮助用户找到想要的信息。拼音检索,方便客户的查询输入。二次检索,逐步缩小结果范围,锁定自己需要的结果。
100%查全率
结合智能分词技术和字词混合技术,确保查询结果无一漏掉。查询结果无论多少,都能检索到。Google只有前100页,baidu只有前76页。
支持多种数据源
系统除了支持文件系统、Internet网站,还能对主流的关系数据库(Oracle,SQL Server,DB2等)、FTP服务器等进行索引。其灵活的数据源接口可以扩展,如对邮件系统、知识库等进行检索。
七大特色
极高的检索性能
在G级数据集合上达到亚秒级检索速度
支持大量的并发用户检索
增量索引,确保索引速度快
索引空间膨胀率<0.5
非结构化文档统一检索
可以支持检索静态网页、动态网页、文件系统的目录文件等。支持对各种格式化文档的检索(如PDF,Word,Excel,PPT等文件)。
增量索引和自动索引
采用增量更新方式对内容进行更新,即每次检查数据变化时,只对新添加或发生变化的数据进行更新,索引性能明显优于只能进行完全更新的系统。
系统维护管理工具采用自动和人工两种方式,支持远程维护和管理,通过设置任务计划可以实现远程无人值守的维护更新托管方式。更新及时,可以达到分钟级自动监测,支持增量更新,确保检索最新的资料。
可以任意排序
对于输出结果,可以根据字段进行排序,比如相关度、点击率、日期等,方便用户快速找到需要的资料。这是与google、baidu等搜索引擎重要区别的特征
系统默认排序按照相关度排序,相关度排序以检索词与网页的相关性为依据对检索结果排序,相关性是对词频、词位(词在文章中出现的位置)、以及文件大小等因素综合评价的结果;时间排序则可以保证把最新的数据优先输出。
全面支持Web服务
系统全面支持Web服务,可以方便与各个系统(包括.NET系统)集成,100%满足企业、政府检索的需要。支持XML输出,可应用于RSS。开放的API,支持二次开发。
J2EE平台的检索引擎
采用纯Java语言开发,全面支持J2EE,可运行于Windows、UNIX、Linux平台,在内核上采用先进的多级索引、缓存技术,性能卓越。是唯一全面支持J2EE平台的搜索引擎。安全、稳定是J2EE的最大特色。
管理方便,使用简单
采用B/S架构,维护管理端用浏览器即可,无需安装任何客户端。管理方便,对于数据库索引提供配置向导。检索显示模板任意定制,可视化编辑器。在配置好初始的数据源后,系统可以定时更新数据源中发生变化的信息,不需要人工干预。
- 06-16· [转载]趣图!聪明大象那些
- 06-16· 1.85玉兔元素长期稳定_传奇
- 06-14· 玉兔-(宝塔诗)
- 06-14· “与”之辩证系列组诗(
- 06-09· 股指期货概念股
- 06-09· 弘业股份的分析报告
- 06-09· 600128(弘业股份): 期货
- 06-09· 人民币贬值受益品种(三
- 06-09· 弘业股份(600128)
- 06-09· 老庄论股之参股股指期货
- 06-09· [原] 七绝 贺喜
- 06-09· 弘业股份:强势特征明显
- 06-07· 通元内容管理系统CMS( Gp
- 06-07· 通元四室两厅两卫
- 06-07· 王府井通元国际花园住房
- 06-07· 海盐县公安局通元派出所
- 06-06· 侍王府通元庙
- 06-03· [接洽方法] 18611265670
- 06-03· 海马郑州5款新车将亮相车
- 06-03· 海马和马自达渊源