互联网(舆情)信息监控系统白皮书技术白皮书.doc

上传人:仙人指路1688 文档编号:2880811 上传时间:2023-03-01 格式:DOC 页数:20 大小:1.14MB
返回 下载 相关 举报
互联网(舆情)信息监控系统白皮书技术白皮书.doc_第1页
第1页 / 共20页
互联网(舆情)信息监控系统白皮书技术白皮书.doc_第2页
第2页 / 共20页
互联网(舆情)信息监控系统白皮书技术白皮书.doc_第3页
第3页 / 共20页
互联网(舆情)信息监控系统白皮书技术白皮书.doc_第4页
第4页 / 共20页
互联网(舆情)信息监控系统白皮书技术白皮书.doc_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《互联网(舆情)信息监控系统白皮书技术白皮书.doc》由会员分享,可在线阅读,更多相关《互联网(舆情)信息监控系统白皮书技术白皮书.doc(20页珍藏版)》请在三一办公上搜索。

1、互联网(舆情)信息监控系统IMonitor for Internet技术白皮书二一年一二月目 录一、前言3二、系统简介3三、为什么选择迅奥?4四、监控需求分析4五、系统特点65.1优越监控性能65.2标准的监控流程85.3监控流程概述(如上图)95.4新闻热点监控95.5新闻评论监控95.6BBS热点监控10六、系统架构116.1监控采集技术126.2监控分析146.3监控匹配156.4监控管理16七、关于迅奥217.1先进的技术227.2广泛的客户群体227.3显著的优势23八、部分客户23一、 前言当今社会,互联网蓬勃发展。随着网民的不断增长,越来越多的人把互联网作为获取信息的首选渠道。一

2、批有影响力的门户网站和BBS逐渐成为网民最常使用的互联网服务站点。然而,在互联网蓬勃发展的同时,也不断地产生一些问题。少数不法份子借助互联网开放自由的特点,传播暴力、色情内容,危害青少年身心健康;更有甚者把互联网作为反动、邪教活动的工具,散布谣言、蛊惑民心,公然以政府为敌,对社会的安定团结造成极大的危害。长期看来,如不对其加以监管,势必会影响社会信息化的发展,甚至会造成社会腐化和思想倒退的严重后果。党中央非常关心百姓心声,对互联网信息服务的健康发展一直非常重视。目前,已形成以国务院新闻办为中心,各省市外宣办为下级节点的监控体系。监管更从立法到行业普改,逐渐形成完备的监控格局。面对日新月异的互联

3、网技术发展,不断膨胀的互联网信息,还有其他不断出现的相关新问题,都要求监管机构以更新的技术和更快的反应速度来应对变化,武装自己,以保障中国互联网产业的持续、健康发展。迅奥作为国内优秀的互联网企业,拥有业界领先的搜索核心技术。凭借多年积累的海量信息处理和应用经验,震撼推出IMonitor互联网信息监控系统,并迅速成为业界领先的解决方案。迅奥的目标是成为国内互联网监管标准,为信息产业的健康发展做出应有的贡献。二、 系统简介系统的总体设计规划出发点来自于在互联网监管工作过程中实际存在的各种问题。系统的目标也正是为互联网监管带来实际的帮助,提高监管效率、完善监管质量;实现对互联网舆论及热点的监控、分析

4、。通过这款监控系统软件,无论是热点、BBS热帖还是违规监查的突发事件,都可以在简短的学习过程后,通过方便友好的系统配置,全面掌握所有的目标信息,从而把监控人员的工作重点从花费大量的时间寻找目标信息推进到对监控信息的深入分析和及时采取应变对策的监控过程。三、 为什么选择迅奥?北京迅奥科技有限公司是一家从事互联网信息应用技术的软件公司。迅奥是一家专注于海量信息处理的技术提供商,亦是专注于政府、企业消费信息的服务提供商。迅奥公司(原中搜.企业应用事业部)从事信息技术研发已有近十年的历史,客户遍及政府、媒体、大中型企业,致力于互联网信息抓取、全文搜索及信息的人工智能分析等多项网络信息技术的潜心研究。迅

5、奥互联网信息监控系统正是融合了多项前沿的信息处理技术所形成的产品。本产品的优势在于我们对互联网监控需求的深刻理解以及强大的技术实力和多年产品积累的保证。该产品秉承迅奥对产品及服务品质一贯的高要求,处处体现出企业旺盛的生命力和无尽的创造力,是客户价值的典范。四、 监控需求分析系统价值在于帮助用户解决互联网监管面临的实际问题。由于需求的特殊性,迅奥在系统设计阶段通过长达六年的需求调研,基本上完整的了解用户的实际需求;通过听取专家意见,吸取业界经验,从资源、技术、发展规划等方面进行了综合地分析;在产品设计上充分考虑了客户价值,力求使迅奥监控系统能够充分满足客户的需要,并把真正帮助客户解决监控工作中出

6、现的实际问题作为首要任务。监控需求产生的主要背景是互联网在国内的快速普及导致互联网影响力的不断加大,从而带来的一系列意识形态的新问题。为了能够正确地引导舆论,保障经济建设有良好的政治文化氛围,国家有关互联网内容监管机构对监管的体系和监管技术也提出了更高地要求。根据对市场深入了解和分析,我们发现主要的需求有两类:第一类是政府部门,主要需求是对互联网内容发布进行监管;另一类是互联网服务运营商。他们之间是监管与被监管的关系,面临的是监察违规和防范违规的问题,共同的目标是防止互联网成为非法信息的传播渠道,维护互联网产业健康发展。政府新闻主管部门对互联网舆情监管有较高要求,希望可以实时了解互联网中有哪些

7、热点以及社会上的某些突发事件对百姓的影响,随时掌握是否有别有用心的人,利用互联网散布谣言、鼓惑民心,误导普通网民大众,以便及时采取相关措施把网民舆论引导到正确的道路上来。大多数新闻网为网民提供新闻评论渠道,供网民表达对新闻的观点,而一些不法分子利用这个渠道散布诽谤,甚至反动言论。网站服务商面对主管部门的监管要求,需要对大量的评论进行内容筛选,传统的人工方式的效率不高,工作量庞大,导致经常不能对所出现的问题进行及时反馈,这是面临的主要突出问题。在BBS上,网民可以畅所欲言,对社会上的事件愤愤不平,群情激昂。老百姓最关心什么?他们都在议论什么?有哪些社会不公平现象是群众最难以忍受的?在BBS上基本

8、上都能够得以具体体现。因此,对以BBS为代表的互联网服务的即时监控,是互联网舆情监控的重点。许多事件的连锁反应和不断扩大大多是通过BBS渠道蔓延的,在此过程中,如果政府及相关监管部门能够及时发现问题,正确引导舆论,那么对于控制突发事件的局面,维护社会安定团结的大环境是非常必要的。论坛BBS是网民最常使用的互联网服务之一,具有开放和自由的特点,这种特点导致BBS中很容易滋生传播非健康非主旋律的不良内容。如何发现、有效防范并进而打击邪教、反动、色情及其他不良信息通过这种特殊的渠道进行传播是政府监控工作需要一直长抓不懈的工作重点和难点。五、 系统特点l 支持新闻热点发现、新闻评论监控。l 支持监控专

9、题。监控人可方便定制、管理自己的监控专题。l 支持监控报警。即使无人值守,也不会错过重要事件。l 全面支持BBS违规监控,自动统计跟帖量、浏览量,实时了解BBS热点。l 支持关键词模糊匹配。无论是同音词、相关词,甚至出现了不完整或是不完全匹配的情况,都可被有效监控,避免遗漏违规情况。l 支持灵活的优化机制,对处理器和带宽的占用率更低,使单机支持更大的监控范围。l 先进的监控下载技术,通过自动分析技术、模板技术、JS解析技术支持更广泛的监控需求。l 支持报表生成,并可按用户要求定制符合用户要求的报表。l 具有较高系统稳定性。具备完整地日志功能,可详细的显示系统状态,便于系统管理和维护。5.1 优

10、越监控性能系统拥有较高的资源利用率,可以在相同配置的硬件和带宽环境下拥有较高的监控性能,有效缓解因硬件及带宽限制为处理海量数据造成的压力。高速增量更新迅奥的新闻更新技术性能可以达到同时监控数千家网站。被监控网站所发布的新内容,几分钟内就可被系统收录和刷新。面向监控的全文库技术由于监控需要进行大量的数据吞吐,即使大型的关系型数据库也无法满足应用的要求,因此监控数据的管理采用的是全文库技术。系统不但集成了业界领先的全文库技术,更在此基础上为监控系统特殊要求进行了改造和优化。监控即时处理技术:传统的监控方式是将待处理的监控数据先放到本地,再进行监控处理。经过对监控应用特点的分析,我们采用了相比更好的

11、方案,即对采集到的数据直接进行监控分析,把其中一些明显没有价值的内容尽可早地通过分析剔除掉,系统只保留分析后的有效数据。这种方法的实现可以很好的优化系统的监控性能。理想的监控质量为了提高互联网信息监控的智能化程度,系统首次将人工智能、模糊匹配等技术应用于监控领域,提高了监控的质量,有效地避免系统在监控中的漏报、错报的问题。支持模糊匹配监控违规内容发布时,有些内容为了逃避监控,常常使用暗语及不完整的表达方式,甚至音同字不同。这样大大增加了监管难度,如果使用传统的技术是很难有效监控的。系统率先使用模糊匹配技术,支持对多种违规情况进行有效监控。5.2 标准的监控流程示意图元素说明:#元素名称元素说明

12、备 注1互联网指系统的监控对象,泛指各种类型的被监控网站对境外网站的监控,需要通过代理服务2防火墙指网络安全设备,保障互联网访问中的安全3监控信息库指系统监控数据及监控结果存放单元,以供日后查找、分析4互联网信息监控系统监控主系统5系统管理员指监控系统的管理和维护人员6监控结果分析处理指系统按照管理员定义的“监控需求”通过监控分析后产生的监控结果,供监管部门决策参考7监控报表对监控结果通过报表形式保存或打印8监管人员指系统监控功能的日常使用者5.3 监控流程概述(如上图)如上图“监控流程示意图”所示,标准系统使用流程是这样的:(”标号”为示意图中元素编号)首先由系统管理员5初始化系统,部署监控

13、目标。定义监控源分类,设置初始监控源,分配监管人员8账户。监管人员8可随时在管理员5设置的监控范围下开展监控工作,每一位监管人员可独立指定自己监控分类及监控专题。监控系统4按照用户设置监控要求对互联网1进行持续的监控,并返回监控结果(监控报表)。监管人员8可随时将监控结果总结,并生成监控报表7,提交相关决策部门参考6。长期积累的监控数据形成内容丰富的监控信息库5,可供随时查询,或进行趋势和历史数据研究分析。5.4 新闻热点监控如何鉴别新闻热点,一直以来都是互联网分析过程的难点和重点。系统在分辨热点新闻的时候主要参考了以下几个特征:首先应是各网站力推的信息,受到网站编辑的青睐,会在短时间内被多家

14、网站转载。其次是网民非常关注的信息,有较大的浏览量和评论量。同时信息的出处、类型、在网站中出现的位置也会从另一方面反应信息的价值。5.5 新闻评论监控互联网服务存在许多优越性,一个重要的特点就是可实现交互,网民通过网站留下自己的见解和观点,实现了网民与网站、网民与网民的讨论。这一特征是传媒发展的一个重要的里程碑,标志传媒进入了互动时代。针对这一特点,系统通过对新闻评论的监控分析,可以得到准确的舆情动态,了解用户真正关心的问题和他们对事件真实的态度和想法。5.6 BBS热点监控BBS论坛开放、自由的特点,一直是违规内容监管的重点。系统具备强大的BBS监管功能,通过JS解释、模板分析技术,使BBS

15、类网站的监控质量有很大提高。针对BBS的舆情监控,系统提供了热点分析功能。通过对BBS中帖子的转载量、点击量进行统计,可即时发现论坛中的热点。六、 系统架构互联网信息监控技术是一项全新的信息处理技术,是在“互联网信息下载技术”和“全文搜索”技术的基础发展出来的。信息监控系统的工作原理是将被监控内容自动下载到监控服务器,由系统根据用户定义的监控需求进行监控分析,从中发现违规内容,同时分析出信息的热点。监控质量的关键是尽可能快速、全面的发现待监控内容;其次要对监控内容进行精确的处理,并对监控结果进行分析,最终生成可提交决策用的监控报表。由于互联网监控的数据量非常巨大,处理时需要巨大的数据吞吐性能,

16、必然离不开支持海量数据管理的搜索引擎技术。从应用需求的角度,还需要形成一套符合监控流程和人员使用习惯的应用逻辑,以构成完整的系统体系。系统使用JAVA语言,基于Struts架构开发,符合J2EE规范。基本上JAVA支持的平台,如:Windws Server 2000/Linux/UNIX平台均可部署。通过JDBC技术支持主流数据库系统,如:My SQL、SQL SERVER、ORACLE;应用服务器支持:Tomcat、Resin、Weblogic、WebSphere。6.1 监控采集技术监控采集是互联网应用技术的一个分支,用于对互联网网页信息的抓取。面向监控的采集模块有一定特殊性,需要具备:“

17、快速、全面、准确、大范围”的特点;需要支持高强度的下载压力。因此模块需要支持良好的下载控制和优化机制。为了实现达到良好的性能,我们设计了抢先式多线程技术。这是下载Spider比较理想的技术。它是同蜘蛛一样行动的程序,该程序通过页面中的URL链接检查更新页面。链接验证不仅处理HREF对象,还会包括JavaScript、INPUT等对象中的连接。通过不断更新的URL队列,合理分配下载线程。即时性指标因为历史信息不是监控的重点,所以监控的即时性指标就十分重要。即时性是指对信息监控的时效性,是内容出现到被监控到的最短周期,也是监控质量的重要指标。互联网上每时每刻都会产生大量的信息。根据权威分析数据,通

18、常一条新闻发布10分钟后在互联网上的转载次数可达520次,同时可被约200位网民阅读,随着信息存在时间的延长,信息被阅读的次数将呈几何积数增长。因此尽可能早地发现并阻止违规信息传播显得尤为重要。为此我们设计了一系列优化机制,以达到最理想的监控效率。索引页识别技术索引页通常指包括很多信息链接的导航页,如新浪的NEWS.SINA.COM.CN新闻中心。此页面中包含大量的新闻列表及子栏目的链接地址,大量最新新闻链接会在此页中反应出来,以此类推,网站的子栏目也会有下级索引页。因此只要有效地判断并发现此类索引页面,并有针对性的更新链接,就可有效降低监控周期。更新侦探技术更新是通过对索引识别页的分析产生更

19、新列表,因此需要在较短的周期不断更新页面,通过链接排重判断页面的更新情况。本系统中采用了矢量标记技术,可将页面更新判断的效率及资源占用率压缩到最低,甚至不需要完全下载页面就可完成更新判断。下载排重技术Spider在网际“爬动”时,会下载大量的重复信息,如不进行排重处理,就会下载大量的重复信息,既占用了系统资源又会占用大量的网络带宽,大量无效信息的存在,也会严重影响服务质量。排重的级别,根据不同的需要特点分为:URL排重、标题排重、正文排重,三个级别。URL排重即将已经下载页面的链接列表保存下来,并逐次与下载链接列表进行比对,以防止重复下载。标题排重是“URL排重”的补充,因为许多网站会把一条完

20、全相同的新闻发到不同的栏目,同时网站之间的新闻转载也很常见,这样就会造成很多相同标题的信息存在。因此,有必要在“URL排重”之后再进行标题排重。由于大多数情况,信息在进行转载的时,标题进行了重新调整,例如某新闻标题为:“国际媒体盛赞中国金牌日 出众表现赢得好评”,转载后被改名为:“国际媒体盛赞中国金牌日 表现赢得好评”或由于页面格式的变化,系统自动取到的标题也会略有变化。这样的情况如果进行完全匹配,有可能因为中间多了个空格,少了几个字,而判断不出是相同的新闻。因此在本系统中,“标题排重”方法采用的是模糊匹配方式,只要达到80%以上相似度就认为是相同的标题。正文排重正文排重是在“URL排重”和“

21、标题排重”之后的进一步排重处理措施,主要用于精确下载和精确排重。这种方法是对正文计算出MD5码进行比对来实现的。使用正文排重同时也存在网页正文提取质量难以控制的问题,并且文档内容在转载后很有可能已经被变动。为了达到较好的排重效果,系统采用计算文章的矢量特征值,通过正文之间的矢量特征对正文进行相似度的比对,排除与已采集文章相似度最大的文章。不同的“排重”手段可适合不同的监控应用,需要消耗不同的系统资源。从信息监控的特性,采用URL链接和标题组合排重的方式就可满足监控应用需求。信息监控系统采用的机制是在链接下载前对URL链接进行排重,在链接下载后再对标题进行模糊排重。因为监控面对大量BBS、网页页

22、面信息,信息精确抽取的困难较大,会直接影响排重质量,并且会占用大比例的系统资源,起到作用只是避免数量极少的重复监控的问题。因为正文排重在监控中是有选择地使用。6.2 监控分析监控分析泛指信息从互联网下载后,对其进行的一系列违规检查及处理工作。主要流程包括:监控匹配、监控排除、结果查看、监控处理、信息归档等环节。6.3 监控匹配监控匹配是指按照用户定义监控需求,同互联网上采集的信息进行比对,以发现监控情况。过程中除了需要提供高性能,更重要是监控质量。系统的目标是不放过一条需要监控的信息。为此我们做了大量的工作,首先们分析一下监控情况的表现形式:#监控情况说明1完整匹配在监控信息中出现了完整的监控

23、关键词,即为匹配成功。示例:监控“钓鱼岛”事件,被监控内容中出现了“钓鱼岛”词汇,即完成匹配2同音词匹配在网上这种同音不同字的情况比较普遍,并且这类的情况也是需要被监控的。示例:监控“钓鱼岛”事件,而一些被监控信息中出现 “钓余岛”这样的同音字,表达了同样的意思,因此也需要被监控。3监控词不完整系统支持匹配不完整的关键词。示例:监控关键词为国家领导人“江泽民”,而网上的信息可能是:“江者民”或江z民,因此也属于被监控范围。4暗语、网上词汇网上有许多“暗语、网语”的信息表达方式,这类信息也是网上监控的重点。完整匹配情况这种情况在监控中比较常见,也比较容易定义监控的特征。如同搜索引擎一样,用户输入

24、搜索关键词,包括完整关键词的页面就会被全部找到。同音词匹配情况在对网上信息监控时,经常会出现词中某字以同音字的方式存在,按完整匹配的方式,这种情况的被监控信息就不会被轻易发现,从而造成可能漏查的现象。系统在对关键词匹配的同时,通过拼音词表对关键词进行转换,并将转换后的关键词组参与监控比对,这样就可以使音同字不同的情况也能够被有效监控。监控词不完整的情况这种情况一般指关词中有部内容不能确定,需要通过一种宽松的方式进行匹配。可以设置表达式和通配符来处理。暗语、网词因为网络上暗语和网络词汇很多,而且经常会在很短的时间里出现大量的新词汇,代表一些新的含义。针对这种情况,系统还没很好的自动发掘的解决方案

25、,但是系统为用户提供了相关词表的维护手段和方法。用户通过自定义方式定义暗语的含义和同类词汇,这样用户在监控一个常规词汇的同时,系统就会将相关的暗语词汇同时参与监控匹配,这样就可以大大提高监控的准确性和全面性。6.4 监控管理系统是按照模块化设计的,模块之间的设置及数据交换通过管理模块有机的结合在一起。如上图所示,监控管理包括信息源管理、下载管理、监控专题管理、监控报警四大模块。监控管理的数据流程为:第一步:通过监控源管理定义待监控信息源,通过定义监控属性特征,告诉系统需要监控哪些网站。第二步:下载管理通过对用户指定监控源的下载,为监控专题提供数据准备。第三步:被监控源在监控下载的同时,按用户监

26、控专题定义的监控需求,完成对信息流的处理,形成监控结果,并入用户监控专题。第四步:系统需求即时生成监控报表,在无人值守的情况下,用户还可对监控专题定制监控报警(提醒服务)。这是监控的基本过程,监控数据的生命周期为:从监控情况被发现到监控结果被用户确认或信息超时被自动清除。由于监控管理是系统的核心模块,所以模块的实现机制和设计原理也是系统实现的关键,下面将就模块的主要特点逐一介绍:监控源管理“监控源”泛指被监控的对象,该系统的监控对象主要为互联网信息载体,包括新闻、BBS等以HTML为格式标准的信息发布站点。“管理”指对监控的增加、删除和修改操作。监控源管理中通过定义监控源的类型,对数据进行有机

27、的分类。支持通过搜索的方式快速定位监控源。下载管理“下载”泛指从指定监控源将待监控信息下载到本地,并等待进一步的监控处理。下载管理中的数据流向为:从监控源设置中得到监控对象定义,以入口地址信息与监控源建立链接;下载后的数据同时进行页面分析和链接分析;将链接进行“排重”后放入链接管理队列;“内容页”通过页面解析以及保存“原页快照”后,将处理结果进行保存。链接建立信息下载过程中存在多种状态,包括初始化链接、建立链接、下载数据、完成下载和错误处理等状态。还有一些情况,如数据源保护、数据下载失败、下载超时、源数据未生成等情况。其中下载初始化是由系统完成,下载过程及错误返回受到网络因素的影响。从应用中希

28、望将数据尽可能全面的捕获到,但工作过程中会受到:“访问无效”、“下载失败”等多种情况的影响。监控系统是无法影响监控源的,只能通过相应机制提高下载的质量,这就体现了链接建立的重要性。它与“监控队列管理”模块紧密结合,自动处理包括下载重试、监控源自动用户登录、网络代理等机制,目的是为了得到更高的采集质量。页面解析下载后的数据是一类格式化文本,从内容上一般包括:待监控区域、广告信息、版权信息、相关链接信息等。其中待监控区域和下级链接是我们需要处理的内容,主要包括监控内容、监控内容图片、相关下级链接。由于这部分内容会搀杂在整个HTML页面中,所以需要相应地解析技术,通过基于特征内容的剥离手段,得到监控

29、所需要的内容和相关链接列表。以上就是页面解析模块的主要功能。内容排重数据下载是通过一种机器人程序(Spider)来实现的,主要原理是通过遍历监控源的方式进行链接寻找。因为监控源的状态是无序和随机的,因此经常会下载到同一个链接。为了解决这个问题,系统设计了复杂的多重“排重技术”,从而避免了信息的重复下载。队列管理因为在目前的技术水平下,网络的访问速度要比系统处理速度慢许多,从而会导致大量待下载链接被生成后放入下载队列,等待系统陆续下载。脚本解析监控源的情况经常会发生变化,同时存在着很多特殊的情况,有些严重的问题可能还会影响到下载的质量,特别是BBS的监控重点多以JavaScript程序生成链接,

30、对于这种情况,系统仅仅通过标准的“页面解析”方式是无法生成链接的,因此为了提高这种特别信息格式的采集质量,系统设计了“脚本解析”模块。通过自动解析或手工定义解析模版的方式,系统得以较好地解决了这方面的问题。快照保存大多搜索引擎服务都提供“快照服务”,因为互联网的上内容很容易因时效性等原因被删除或消失。而在信息监控应用中,因为可能会涉及到对违规信息的取证问题,所以使得快照保存功能具有更加重要的意义。在本系统中,不但提供了页面文字信息快照保存,还提供对页面中附件信息的保存,这样内容中可能涉及违规的图片等信息也会被系统记录下来,可使取证工作更加完整。由于快照下载特别是带附件的快照保存,对资源、带宽的

31、占用都会比较大,因此系统支持有选择性的保存快照,即可定义只保存监控匹配成功的信息快照。监控专题管理监控专题是监控服务的重要表现形式,通过定义监控关键词组和监控规则,通过系统筛选出监控结果。“监控专题”可以通过监控分类有机管理起来,支持对“监控专题”名称进行快速查询。专题定义完成后,用户通过查看监控专题内容,得到监控结果。监控报警用户定义监控需求后,系统会自动完成监控过程。但对一个全天候服务程序,只通过监控专题查看监控结果的被动方式显然是不够的。因此系统中设计了针对监控专题的信息报警服务, 即便在没监控人员离开的情况下,也不会错过违规事件。七、 关于迅奥北京迅奥科技有限公司是一家从事互联网信息应

32、用技术的软件公司,它的前身是中搜.企业应用事业部。迅奥是一家专注于海量信息处理的技术提供商,亦是专注于政府、企业消费信息的服务提供商。 迅奥位于北京市海淀区中关村科技园区,是经国家认定的高新技术企业。迅奥公司核心团队是由拥有多年从事海量信息处理、全文检索、搜索引擎等领域研究和开发的研发人员和具有丰富经营管理经验的管理人员组成。公司专注于海量信息的获取、处理、文本挖掘、个性化服务等核心技术研究、开发、应用和服务。相继推出具有自主知识产权的“企业搜索引擎系统”、“全文检索系统”、“信息挖掘系统”、“互联网(舆情)信息监控系统”、“企业竞争情报系统”等系列信息处理软件产品,以及“消费信息集中服务平台

33、”的服务产品等。企业使命:专注于一流的海量信息处理的软件技术研究、开发和应用;持续创新,提供最令顾客满意的卓越的产品服务,推动信息服务产业发展,成为互联网时代的顾客最可信赖的伙伴;要成为一家中国最大的政府、企业消费信息的服务提供商而努力。企业价值 通过为顾客的投资实现满意的效益,保障企业健康发展和永续经营,从而为股东赢取长期稳定的投资回报,成为员工提供有持续吸引力去实现价值的平台。企业宗旨 关注顾客,恪守承诺, 倡导协作,力求创新,真诚合作,提倡共赢。迅奥的技术: 1 互联网海量信息搜索技术2 基于全文检索的智能化分词技术和检索结果智能排序技术3 基于智能化的自动摘要技术4 文本挖掘的智能分类

34、、聚类技术5 概念联想网络的用户关注分析模型技术6 个性化服务技术等。迅奥的优势: 团队优势:有一支从事多年海量信息处理、全文检索、搜索引擎等领域研究和开发经验的技术团队,大部分成员来自著名搜索引擎厂家核心人员。 技术优势:迅奥具有完整的信息搜索技术、全文检索技术、搜索引擎技术、文本挖掘技术、个性化信息服务技术等并将这五项技术整合成不同的产品。 服务优势:提倡用户为中心,个性化专业服务;用户的满意才是我们的成功。7.1 先进的技术与一般的搜索引擎相比,具有网页覆盖率高、数据更新快、支持中文模糊查询、强大的个性化查询、智能查询、内容相关性分析、便利的专业信息查询等优势,被公认为第三代智能搜索引擎

35、的代表。7.2 广泛的客户群体我们拥有十分广泛的用户群,拥有最大的中文搜索引擎的强力品牌。由于我们在网络安全和监控方面的大量经验和背景,媒体和政府部门构成我们的典型客户群:政府:公安部、国务院新闻办、中国互联网新闻中心、浙江在线(浙江省新闻办)、长城在线(河北省新闻办)、广州天河区政府、上海长宁区政府、宁夏新闻办等。媒体:新浪、网易、TOM、中华网、263、中国计算机报、计算机世界、深圳报业集团、中国石化报等。大型企业:清华文通、深圳彩虹集团、中创集团、三星、汉王等。7.3 显著的优势迅奥是一支在搜索技术上奋斗十年、创新十年的队伍,拥有全球领先的智能化搜索技术、造就领先业界的核心竞争能力。迅奥十年建设、管理和使用自己的信息检索系统的经验,对本项目课题的研究给予了有力的保证,也是保障研究成功的重要基础之一。迅奥完备的技术支持系统致力解决用户不同级别的问题,从创新技术研发到重点项目服务和管理都有一套完整的组织方法,对解决软件问题有独到之处。我们相信,迅奥所具备的领先技术将在互联网全面监控领域最大程度地发挥效用,为各地的新闻中心提供更有效更实用的信息服务。八、 部分客户国务院新闻办深圳市新闻办河南外宣办重庆新闻出版局湖州市宣传部青海省宣传部舟山市宣传部陕西省宣传部等

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号