【垂直搜索引擎定制】

功能及特点:

(1) 核心技术
A.分布式多线程+多进程反防爬的快速Spider技术
B.网页块分析/正文抽取技术
C.网页自定义规则的信息抽取
D.分类/聚类
E.快速中文分词技术, 日文分词技术
F.产品识别/产品消重
G.支持多语言(中文、英文、日文等)/编码格式自动识别
H.搜索引擎与数据库无缝集成
I.分布式系统、支持亿级数据检索
(2) 功能列表
A.常用功能
添加采集网站
启动/停止采集
索引数据结构定义
采集规则定义
抽取规则定义
系统信息浏览
B.数据采集
分类管理
网站管理
网站地址管理
URL发生器
地址过滤规则
采集规则定义
抽取规则定义
文件获取规则定义
C.数据处理
数据库连接定义
字段映射关系
D.产品识别
独创的机器模糊识别结合人工审批技术
识别管理系统
E.索引系统
词库定义
登录新词
词库浏览
添加屏蔽词
屏蔽词列表
索引数据结构定义
切分设置及权重定义
F.检索系统
分布式/单机设置
内存高速索引模块
各种检索规则(按相关度/时间/查询/综合)
G.后台管理
安全登陆
管理员角色/权限设定
采集线程数/深度/时间间隔
数据查看/增删改
日志管理
(3) 特点
A.全自动
我们的垂直搜索系统,支持从信息采集到索引建立到最后满足各种查询的信息展示,快速方便
B.高准确度
100%的搜全率和招回率。独一无二的产品识别技术保证98%以上的产品识别率(适用于价格比较等应用)。
C.数据库完美支持
支持各种主流数据库,如MSSQL、Access、MySQL、Oracle、DB2、Sybase等。 我公司现在是美国mysql公司在华独家认证及培训代理.
D.高速的检索速度
内存索引,高速cache技术使得检索在毫秒级别的时间内完成.
E.分布式支持
分布式系统支持,可承受更大数据量。达10TB级别。
F.灵活应用的支持
我们5年的搜索引擎开发经验证明:无论你是做何种领域或行业垂直搜索,无论你要使用的何种数据要达到何种效果。我们的系统都可以针对性的灵活调整采集策略,索引建立方式,识别方式,最精准的满足需求快速信息搜索的需要。
(4) 成功案例
比价购物搜索 - 易价网http://www.yijiawang.com.cn
易价网收录了国内200多家知名购物网站中的共计1千多万件商品,并对商品价格进行自动匹配和每日更新,同时提供多种检索方式,让消费者轻松体验比价购物的乐趣。

报价联系

本产品主要按客户需求提供定制服务,具体报价欢迎来电咨询:
021-63410128  3105 分机 王先生