|
先进的web服务架构 定时定点的抓取目标信息资源 可抓取局部栏目信息块 高效的并行分析与抓取算块
随着信息时代的到来,全球经济一体化已大势所趋。面对信息量日渐膨胀,如何快速高效的捕捉有价值信息来支持自身的发展,辅助工作、业务需要和战略决策已成为公司、企业、政府机关等行业的当务之急。北大方正技术研究院推出的方正智思网络雷达则是为了适应市场需求,提供互联网信息获取、管理和利用的最佳产品。
系统架构 方正智思网络雷达信息捕获系统采用了Web服务架构,用户可以远程配置雷达服务器。可以实现多个用户同时监控雷达服务器的工作状态。

方正智思网络雷达系统结构图
方正智思网络雷达信息捕获系统的工作流程分为四个阶段: n 信息规划:设定信息来源,确立信息获取任务; n 信息采集:从互联网抓取网页信息,并进行标准化分析处理; n 信息分析:对采集的信息进行数据挖掘,目前包括自动分类、自动提取关键词和自动消重; n 信息服务:将信息及分析结果存储下来,按照用户的需要提供信息。

方正智思网络雷达工作流程示意图
功能特点 方正智思网络雷达信息捕获系统由四个部分组成:网络雷达服务器、网络雷达配置程序(即客户端)、方正智思知识管理平台软件、方正博思内容管理平台软件。 n 方正智思网络雷达服务器:是系统的核心,运行在服务器的后台服务程序,负责按照用户配置的信息进行互联网信息抓取。 n 客户端配置程序:用于对雷达服务器进行系统配置,配置抓取信息的任务,并可以监控服务器的运行状态 n 方正智思知识管理平台软件:用于对抓取的信息进行数据挖掘服务,目前主要提供自动分类、自动消重和自动提取关键词三项服务; n 方正博思内容管理平台软件:用于存储抓取下来经过知识管理系统处理后的信息,展现给用户提供服务。

方正智思网络雷达软件操作界面
技术特点 n 先进的架构:基于方正博思内容管理平台和方正智思知识管理平台 n 采用先进的Web服务架构 n 对信息源全面监控,任何新信息的更新会被立刻抓取捕获下来 n 可定时定点的监控目标网站,抓取目的网站资源 n 支持对图片内容的抓取 n 支持对网页页面的局部栏目信息块的抓取 n 可视化的待抓取内容定制与属性提取配置 高效的并行分析与抓取算法
您若有任何的宝贵意见和疑难,可致电跟我们联络。 联 系 人:李梅艳 电话:010-82529178 邮箱:li_meiyan@founder.com
|