当前位置:信息安全资讯首页 >> 文摘 >> 金山毒霸陈睿:木马防御与可信认证技术

金山毒霸陈睿:木马防御与可信认证技术

2007-11-27 16:19:42  作者:  来源:金山毒霸  浏览次数:153  文字大小:【】【】【

编者按:这不是一篇厂商的新闻稿,这是一位领导反病毒团队的技术总监,对7年来反病毒反木马作战的技术总结。稍懂技术的读者看完本文,相信会对未来反木马技术有更深入的理解。


木马防御与“可信认证”技术


主讲:毒霸技术总监 陈睿


2007.11.16

主持人:首先感谢大家百忙之中参加08反病毒趋势沟通会,今天有媒体的朋友,还有民间反病毒高手,因为今年我们反病毒的技术发生很多变化,现在就请我们毒霸的技术总监陈睿先生讲一下08年反病毒趋势。

陈睿:大家下午好,这个机会挺难得的,因为这么多专业圈子里的朋友聚在一起,讲之前还是想先说几句,第一个我为什么来?其实我是在珠海,因为毒霸的研发部门在珠海,来一趟北京不是特别容易,我也不是特别爱出差,来的契机是因为我上周来过一次,给了我一堆记者朋友问的问题,有各种各样的、五花八门的问题,有些问题我看了以后还是很难回答,比如主动防御技术未来发展方向、您认为防御技术现在是不是成熟,我解释为什么这些问题很难回答,我当时说了一下我的一些观点,刘峰他们热情邀请我这周再来一趟,需要讲一讲金山自己的技术立场,以及金山的技术观点,所以我觉得这个机会我要这儿讲,并不是讲我们做的产品,这不是一个产品宣传会。我可能更多的是讲我作为一个技术人员我的技术观点或者叫金山的技术观点,可能不会讲太多厂商的观点,我尽量站在圈子外说一说我对于木马防御技术现在和未来发展的一些认识,我也非常期望各位能够一起跟我来探讨这个问题。因为我觉得反病毒说大点,包括木马防御、整个信息安全,杀毒软件本身每什么好说的,可能有些小孩觉得杀毒软件很神秘,但是各位都不会这么觉得,它只是一个工具,比较值得说的是该朝哪个方向做。按我做这个行业比较郁闷,为什么?这个行业没什么创意,你不可能有创意,因为你是被动的,当一个威胁没有出来之前你不能造出一个来防御它,你针对的是现在存在的,还有对未来病毒木马趋势做一个预估,当然这个预估也不一定是真的,因为木马创造者不会跟我商量他做什么木马。我做这个行业这么久还是感觉有一些蝴蝶效应在,我们其实还是挺被动的一个行业,木马怎么做我们就怎么跟他们干,就是一个很单纯的事,所以杀毒软件本身没有什么好讲,比较值得讲的是我们为什么这么做,以及为什么我们这么做成功概率更大。

今天讲的主要点比较少,就四点,讲任何的安全技术之前肯定不能只提这个安全技术,可能要提它的防御对象,所以我会谈一谈我对木马防御的一些看法,还有目前行业内木马防御的方案,我也说一说我个人的一些见解,第三我会重点介绍毒霸最近做的可信认证技术,因为这个技术近期才跟媒体见面,我过来把这个技术介绍一下。最后讲一讲我对于木马防御技术未来发展的一些个人观点。在这个过程中我还是很希望各位如果有意见和想法可以直接提出,我们可以用探讨的方式来聊一聊。

广泛应用于商业软件的反病毒技术



说到木马防御,我得先讲一讲反病毒技术与木马技术的异同,为什么这么讲,因为现在国内所有软件,包括金山毒霸,大家习惯把它称作杀毒软件,国外的软件名字习惯成为安全软件,国内为什么习惯成为杀毒软件,因为安全软件在过去二十年最主要面对的对象是病毒,病毒的出现应该是比较早的事,87、88年计算机病毒开始流行,到现在刚好二十年时间,现在广泛应用于商业软件反病毒技术木马、启发搜索和虚拟机,像诱饵、通用版病毒都是在这二十年时间涌现过的技术,还有以前××的安全码,这些技术可能最终被证明挺适用于商业软件,这三种技术未必是最好的,商业软件用的技术一定要运营成本低,比如说毒霸为一千万用户服务,如果一个运营成本十块钱,我们肯定会亏本。因为病毒的特点是自我复制,病毒是比较容易在技术上技术判定,根据我国一般主旋律的书计算机安全条例上对病毒的定义是能够自我复制的一段集散及指令,这个很容易在技术上界定,所以上面三种技术都能够做到对病毒对症下药。

特征码不用介绍了,因为这个技术挺直观,因为病毒的特点是自我复制,计算机是不会创造的,就算有些病毒变形、变种、加壳、换马甲等等,但我们总能找到他们的特征,所以特征码是很合适的,它可以干掉病毒的大部分变种。启发搜索这个技术不内比较少,这个技术是欧系厂商做的比较好,它最大的一个特点就是基于统计和推理,在里面融入了AI的算法,其实整个思路很简单,最简单启发式搜索是五万个病毒放在一起,一百万个正常文件,你找五百万个病毒的相同性,对一百万个文件也找相同性,你会发现他们有相匹配,这个是启发式搜索,这个在2000年达到很高的成就,欧系厂商对病毒率可以达到90%,这基本上就可以成为一个商业技术。第三虚拟机比较全,去年有厂商对虚拟机进行了一轮商业包装,虚拟机技术是模拟器,安全行业里虚拟机技术更多进行的是模拟代码执行的作用,是模拟一段代码进行执行。虚拟机最大的作用是用在什么地方,一个是变形,因为变形用虚拟机做很合适,我要取得变形病毒展开以后的情况,我们认为同一段代码只有一个结果,所以要据的它占快之后的情况用虚拟机比较合适,我觉得虚拟机主要用在脱壳上。现在对于反病毒的一个技术观点,我觉得反病毒技术已经比较成熟了,它的标志基本上能够满足用户的需求。比如说去年熊猫烧香刚出来两个小时之内,厂商都可以做出很完善的解决方案。

所以未来技术的发展就两个方面,第一个是响应速度,就是能不能把响应速度从两个小时减到一个小时甚至减到十分钟,降低响应速度是提高自己的安全解决能力。第二是技术对抗,技术对抗是一个很民工的体力活,他加壳我脱壳,他加密我解密,提高这种能力。所以反病毒技术现在是比较成熟了。

木马很嚣张,用户很无助,厂商很无奈




为什么现在很多用户仍然抱怨病毒杀不掉,因为用户不懂,这都不是病毒杀不掉,而是木马杀不掉,或者是流氓软件清不掉,因为木马防御技术现在远远不如反病毒技术成熟。其实任何工作都是这样做,一个新的需求出现先拿成熟的技术应付,当成熟技术不能应付以后又出新技术,当新技术应付不了再出新技术,所以现在木马正处于这样一个阶段,现在所有厂商试图用反病毒成熟技术减轻脱壳木马,它对于木马的效果远远不如病毒。

第一个特征码对木马作用非常小,因为木马传播是手工投放,手工投放就郁闷,它可以改程序。今天投放完了以后,明天可以把程序改一改再投放,特征码作为一种静态识别技术对于改程序适应面很窄;你如果要提取特征码首先得抓住贼,但是木马不会出现一个熊猫烧香遍地开花这种情况,他是每个城市都不同这种情况,所以特证码效果很差。

第二个启发式搜索对木马也不行,因为它更多是基于人工智能分类,虽然不知道你是不是病毒,他觉得你像,为什么觉得你像,是类似于推理觉得像,基于过去对病毒数据的学习,这个就要求我们查杀对象技术深的相似性,但是木马没有固定的技术特点,因为木马的共性是特征是社会工程学,他欺骗伪装,这些都不能用一个很固定的技术特点来界定,所以启发式搜索对木马识别率较低。

第三个虚拟机也不行,因为他很慢。第四个是给我们造成巨大困扰的就是木马作者很勤奋,因为他们有巨大的商业利益驱动,一个木马投放放一马收回来十几万,再放一马就二十万,我觉得我的收入远远达不到这个,所以木马的更新非常快,他一天升级十次,我们最多升级三次。现在我觉得这个行业最郁闷的一个问题是什么?犯罪的利润要比抓贼的利润高。大家都知道在市场经济时代这意味着什么,这意味着犯罪的技术提升要比抓贼技术提升快。随着互联网应用的发展木马的比例越来越高,但是反病毒厂商对木马的防御能力一直徘徊在比较低的水平,但是木马的发展和木马的比例包括木马对用户的危害越来越高,这个也是带来一个很不和谐的因素。这是总结说现在就是用户很无助,厂商很无奈。其实对于单个木马解决不难,但是做通用方案现在解决起来有瓶颈。

“主动防御”是一个目标,而不是指某种特定的技术。“主动防御”的定义是:无需用户干预,防御潜在威胁。



主动防御这个东西过一年就会来一糟,05年的时候××站出来说你们在玩过期药,我在主动防御,我也为这个专门来北京一趟。我想说明我的一个观点,主动防御是个目标,不是某个特定的技术,主动防御跟防病一样,是一个目标诉求,而不是一个特定的技术,主动防御就是防护潜在的威胁,或者叫未知的威胁。我特敏感未知病毒这个东西,所以我一般都避免提未知病毒。

主动防御的思路最主要是针对特征码提出的,因为特征码的思路是响应威胁,做安全就是两种思路,一种是响应式和预防式,特征码的思路是响应式,它的思路是先发现威胁,然后把精力放在如何提高响应速度、如何提高响应方案的质量,还有降低响应成本。而主动防御思路应该是预防威胁。其实响应式和预防式在八十年代已经提出了,但是我觉得从外面来看毫无疑问预防式这种思路更美好,更接近于我们对美好事物的追求,但是为什么这么多年过去了,现在还在炒主动防御?案例来说主动防御应该是一种很成熟的技术,为什么还在炒?我下面说一些我理由。

主动防御不是技术,它是目标,属于主动防御技术范畴的有几种,第一个是主机入侵防御,它是来源于IDS,更多得用在黑客防御攻击上。还有程序规则审核,比如vista的uac就是。还有系统保护和应用程序保护,比如XPSP2的DEP,它防止注入代码在里面执行。还有就是恶意行为识别。现在大家提主动防御更多的是提它的最后一点就是恶意行为识别,为什么?主动防御为什么这么热?不是说技术比较新,直接原因是现有反病毒技术对于木马防御功能很差,所以大家看到属于主动防御范畴的技术对木马防御有很好的效果。其实主动防御的思路对病毒有没有效?一样有效。为什么病毒时代主动防御不火,原因是那个时代这种技术已经很好的满足用户需求,所以这个技术本身不是一种新技术,最近火是因为以前大红大紫的特征码、启发式搜索、虚拟机不行了,然后人们才把目光转向主动防御。所以所有的反病毒厂商都公认主动防御是下个阶段重点投入,因为在现有反病毒厂商再想压榨性价比已经不可能了,比如说脱壳和虚拟机,虚拟机能不能做的更好?可以,但是它已经做到一个90%的技术,再往前做5%、6%很难,但是对于主动防御的想象空间很大。现有技术都不能够达到主动防御的目标,因为主动防御一个很重要的理念是无需用户干预,但是现在属于主动防御的技术对用户的干预的要求都很高。

我觉得炒安全技术本身是一种不是特别科学的做法,我觉得安全技术最多能够达到满足用户所有的安全需求,本身也不是一种特眩的东西,其实最终检验安全软件是靠数据,而不是靠传播。杀毒软件跟卖药和卖保健品相同的地方是玩玄学,大家一把牛皮吹开了就特别收不住,因为这本身是一种黑匣子的技术,这个很没意思。

木马的“技术不可判定性”


主动防御现在面对的最大问题是什么?木马的技术不可判定性,这是我个人观点,但我很坚持,我两年前就一直这么认为。为什么这么说?木马是伪装成正常程序进入用户电脑,进行破坏或者盗取用户信息。比如说蠕虫利用网络进行复制和传播的程序,你很容易对它进行技术界定,但是对于木马如何用技术界定伪装,这是一个很大的难题。比如,一个防止键盘记录的工具,本身它里面有一段对键盘过滤驱动检测的程序,这个可以防止木马直接挂底层的键盘过滤驱动,拦截用户的键盘输入,这个从技术上很好做,但是如果我设计一个木马,我发现一个网游运行的时候,我就画一个跟这个网游一样的框直接贴进去,顿时这个防御技术够会失效?为什么?这叫木马吗?叫木马,就是伪装成正常程序,但是在技术上很难正常判定。但是人为什么一眼就可以看到,因为人想问题跟计算机想问题是不同的。现在的计算机智能已经很高了,你问问题计算机回答,就发现计算机很多问题都能对答如流,还会隐藏自己一些计算机的优点,比如你问他特繁复的问题他会伪装起来不回答,但是你问他W倒过来是什么字母,小孩都知道是M,但是计算机不知道,所以计算机想问题跟人想问题有很大的不同。人判定问题不仅从技术,还要从道德、法律综合因素考虑,比如灰鸽子,灰鸽子说技术上他不是木马,但是网民不同意,我们还判定他是木马。事实上安全厂商对木马判定的依据是该程序主观有害。

现有厂商对于木马的防御解决方案比较简单,第一杀毒引擎加特征码,这个占的比例有七成;第二程序规则审核恶意行为识别,这个涉及前面讲的AI的问题,可以把代码写的很庞大,我们可不可以认为所有改EXE关联的程序都是木马,我说可以,所以说现在的恶意行为识别可以识别很基础的。杀毒引擎最後的结果是判定木马,程序审核结果是找到可以文件,然后提示用户清楚木马。为什么现在主动防御的相关技术实现有问题,这个如果做的太强对用户扰扰很大,所有厂商对于这块的强弱都有自己的衡量标准,毒霸这个提示就做的比较弱一些。


 



如何有效提升木马防御能力



这个框架在近一两年内可能不会变,在现有技术水平下要提升木马的防御能力只能提高两个关键点,第一个是特征码的识别率,第二个是如何减少恶意识别对用户的骚扰,尽可能做到自动判定。

金山毒霸的“可信认证”技术


可信认证技术的实现就是为了解决前面的问题,它到底是个什么东西呢?它本身是一个互联网上部署的文件收集系统,这个和珠海的研发病毒处理系统是整合的。这个系统可以自动或者手工分析的方式,快速将收集到的文件分类成白名单和黑名单。毒霸2008会直接连接这个系统,会将用户计算机上可以文件软件反馈。如果用户参与金山毒霸系统安全增强计划的话,用户计算机上的可疑文件会直接上报给该系统,这些文件会被我们有限处理,给用户反馈结果,并加入毒霸特征库,进一步提高用户主机系统的安全性。现在每次升级毒霸都会标名升级特征,曾经在我们每周升级一次病毒库,一次就一两百个,过着你种田我织布的感觉,那个时候很多人还会潜心研究一些安全技术,但是现在我们每天升级的特征可能都是两千个,这并不是我们技术提高了,还是木马太多了,人民群众写木马的积极性太高,以至于我们病毒库都放不下。优化了体积之后,我们木马的特征已经很小了,后来病毒库又增肥到十几兆,现在优化到更小,平均二十几字节,但是还扛不住。今年我们统计了一下木马有五十万左右,明年是什么情况,明年如果按照这个趋势一定是迅猛增长,而且是可持续性发展,明年木马样本堆个百八十万没问题,它甚至可以这么上升,随着你的收集手段上升,你会发现越来越多。

所以我们去年痛定思痛想到一点,过去为什么用特征码,是因为病毒是少数派,我们可以对他进行人民民主战争,我们认为除了病毒其它都是良民,但是现在木马越来越多,我现在甚至怀疑正常文件挑出来还没有木马多,所以我们思路是倒过来。还有一种很方便的是互联网虽然文件多,我对用户的数据文件、文本文件,就是二进制可执行文件,我们的斗争对象繁殖速度比google还少,第二互联网上90%的二进制可执行文件是一样的。为什么?大部分网民机器上就是QQ、魔兽、暴风没有多少了,这样的计算机与其找哪些文件有问题,还不如挑出来哪些文件没问题,他自己不会编译,也不会修改二进制,所以可信认证技术是基于这样一个假设,那就是我们认为互联网上的文件能够被收集完的,这些文件只要收集到了部门内部就瓮中捉鳖,迅速用工业化的方法把文件分成白名单和黑名单,它不是白就是黑,不会出现花文件,因为这是人判定的。比如主动防御是在机器上判定,这个文件是木马的可能性90%,这是程序判定,但如果是人判定的话不是白就是黑。这是第一个思路。

第二个思路,我们辛辛苦苦的在珠海那边处理的木马是不是用户最关心的木马,现在木马很多,这跟病毒不一样,病毒我们是斩尽杀绝,但是对于木马的态度是什么,把真正威胁用户的木马给解决了。现在有厂商宣称七十万木马特征,这个是没有异议的,但是七十万木马特征到现在有多少活的,一个星期两个星期,还有多长,这个对用户是没有用的,我收集的传奇木马对于打魔兽(的用户)是没有用的。只要用户加入这个计划凡是可疑性文件会上报可信认证系统,互联网上对文件处理周期是四到七天,如果被金山毒霸报上去的处理是两天之内,我认为目前人工只能只能达到一个目标,就是分类。目前人工职能只有能进行分类,所以我们就用它分类这一部分。

其实毒霸2008的框架还是很传统的,只不过在最后一节加了可信认证,加可信认证不是一种翻天覆地的变化,但是能够很好的提升用户体验,为什么?我刚才讲了两个关键的问题,在现有框架下要解决两个关键技术点。第一如何提高特征码识别率,既然现在我们都在用特征码就要把它做好。第二如何对恶意行为判定尽可能的自动化?可信认证基本上就是为这两个目的来服务的。判定安全可能是现在所有的厂商都做不到,因为本地病毒库所有杀毒软件只能判定可以或者是不安全,而不能判定这个文件是安全的,但是假如我们把判定放在服务端,有服务支持,完全可以判定这个文件安全,因为这个文件我曾经收集过,现在在珠海我们每天通过互联网爬虫跟用户上报,每天收复不重复的文件是10G,这个数字并不大,为什么?现在硬盘很便宜,这个跟搜索厂商对网页的活来讲的话我们还是比较轻松的。因为搜索在海量数据方面比我们更痛苦。

第二可以直接判定木马,相当于在主动防御的环节不仅可以判可疑,可以判安全、可以判木马,加了这两个环节之后对于用户的提示处理会少的多,精度也会大的多。本身可信认真系统可以极大提高在特征码方面的竞争力,因为特征码的来源是样本,而可信认证是海量样本收集,可以极大提高毒霸在特征码方面的竞争力。现在我们每天收集的样本会过一套自动化处理系统,那个系统内部代号叫水银,无孔不入。每天把我们收集上来的文件用其它厂商的杀毒软件和金山进行对比,我认为说明一个杀毒软件是否有用的唯一的方式是数据。但是问题是什么?问题是现在好像最适合搞评测的应该是杀毒厂商,因为所有的评测机构都没有我们那么好的评测环境,但是杀毒厂商又不能说这个事。

这个是毒霸2008与上一代反病毒产品的对比,这个会在上面加上可信认证。做安全行业有很多的苦闷,其中有一个就是信任危机,为什么?你不知道该信谁,微软的操作系统太开放了,你查到这个文件没病毒你是不是都怀疑是不是有病毒保护壳?现在做安全一个很大的问题就是信任危机,但是可信认证就是提供了一个信任根,它真正的能够实实在在检测机器上哪些东西是安全的。可信认证这个技术方向才起步,所以讲得可能比较简单,未来得展望还是比较丰富的。


 


“可信认证”技术的优势


它的技术优势,第一个是海量数据库,比本地数据精细程度更高,因为本地病毒库要考虑到体积问题,精细程度不可能特别高,对于病毒来说我觉得本地病毒库是绰绰有余,但是对于木马来说本地特征库是远远不能满足需求的。这儿再说一说对人工智能的理解,我们发现一帮人在学校里面研究计算机翻译,二十年的成果还不如google一年的结果,因为要做人工智能必须海量的数据,必须基于统计才能做出判断。人的认识也是这样,比如我在这里讲木马,因为我做了七年,如果我这一辈子只用过这一台电脑,并且我没有看过别人怎么用电脑,我知不知道什么叫木马?我也不知道。所以我不会指望一个程序只在一台机器上运行就能帮你判定什么是木马,所以这个是现有人工智能发展方向问题。第二个可信认证技术是响应速度快。我对安全的一些观点是认为响应很重要,所以金山毒霸里面做及时升级,时时升级有多快?以小时为周期,但是可信认证技术是以毫秒为单位。第三,它能够确定用户计算机上哪些文件是安全的,这个能弥补现在大多数反病毒厂商不能做的一件事。第四是WEB2.0,迅雷为什么快?因为用迅雷的用户多,越多迅雷就越快。可信认证也是,用的用户越多,杀毒能力越强。

具体的技术过程很简单,有些功能听起来土,真的很有用,有些功能听起来眩但是真没啥用。功能跟名字没啥关系,比如启动检测这个超级有用,因为对于木马我们最痛苦的是它的技术共性抓不住,第一点它一定会自启动,它的最高境界是来无影去无踪,所以启动项检测超级有用。我们打开毒霸清理专家现在检测有六百多项,如果有木马一定在这里,因为它是自启动的。对于可信认证系统上的文件会反馈客户端,如果不存在我们会判定他是否开启了信任安全加强计划,如果开启会把文件上报,进行分析,最后判定该文件是否安全,判定完了以后在分类端置入黑、白名单。


 



对木马防御技术的发展观点


现在杀毒厂商是保安,不是警察,警察是具有合法性的,警察能带枪,保安不能带,只能带铁棍,杀毒厂商没有特权,而凭的是人多。现在做木马的时代,一个心理健康的人也做木马,为什么?不就为了收益。(笑:现在房子这么贵,猪肉又涨价)。所以对于木马技术的防御,未来得发展第一步还是靠操作系统安全性的提高,这是首要的,让我们至少达到两个目的,第一让杀毒软件有一个可以信任的平台,微软告诉我这一级以下微软就进不来,我就严防死守一级,所有问题都解决了。第二特别希望微软能够对反病毒厂商开特权,让我们也拿上枪,现在我们是拿着铁棍跟别人拿刀的打。毒霸不仅要杀毒还要安全贴心,但是木马可以不稳定。操作系统安全性提升是未来防御发展的基础。

第二是互联网厂商运营能力的提高,我认为木马的猖獗是暂时的,随着操作系统安全性的提高,微软做的还可以,vista在安全方面的态度是值得赞扬的。对抗还是会趋于平衡。第三还是杀毒厂商在防御系统技术对抗能力跟木马平衡。对于木马防御技术发展的观点,就是本地特征码会消失,本地特征码在未来只对病毒有用,但是对木马的本地特征码消失,特征码对于木马不是特别有效的技术,如果一个木马一定会在两个月或者四个月以后变种的话,那么我们为什么还要把这个特征码留在用户的计算机上,浪费他的硬盘空间,降低我们查杀速度,所以我认为木马本地特征码消失。
第三个也是我明年在珠海重点进行的工作,就是识别恶意行为的AI,我认为识别恶意行为更多的是需要转向服务端。就是恶意行为不能在本地判定,但是我们可以把恶意行为描述出来讲给服务端听,他有一个分析反馈。


主持人:感谢资深的反病毒总监陈睿的演讲,听着很玄妙,每年新产品发布的时候我都觉得时间更美好了一些,更共产主义了,什么问题都能解决,每次陈睿讲到前面都觉得魔高一丈,后面都觉得道高一尺。昨天我们2008已经上线公测了,我想大家可能有一些不明白的地方,所以欢迎大家踊跃提问交流。


记者:这个可信技术一定要联网吗,金山毒霸测试运行效率还是不错的,因为网络带宽的影响会不会影响到查杀的效率,另外它的用户代码数量会不会减少?


陈睿:效率问题我们会考虑,所以进行可信认证是异步,我们对于本地病毒库的搜索程度程度是主测的,我们在测定这个文件是否安全之前我们是不准它进入,异步这个行为在后台进行,这是对安全性和用户效率的一种折中。


记者:那么一些先驱会不会牺牲掉?


陈睿:这些东西现在也是死,木马跟治艾滋病有相似之处,艾滋病是有了药也是死,有了药先用的一部分人可能会被药死,肯定头一部分人为后面的人做贡献。第二个问题这个跟特征码库大小没关系,最终可信认证服务端结果还是会变成特征码下载到本地,这样可以保证用户安全效率,因为本地更快。我们现在可信认证和病毒库的关系是可信认证的黑名单与病毒库一一对应,到未来的关系很可能是本地病毒库是可信认证黑名单的一个映射。我们现在珠海进行木马生存周期的研究,因为病毒没有生存周期,但是木马的生存周期是抗投放,这个研究比病毒更难,所以我们在进行木马生存周期的研究,如果这个达到比较好的效果,我们就敢大胆减少本地病毒库的体积。



记者:您明年重点在木马AI做一些研究,您是打算在支持部还是…,您觉得哪方面投入精力会更大?

陈睿:有的时候走的晚不是坏事,毒霸在主动防御上走的比较晚,因为各种各样原因,刚好可以让我们看得比较清楚一些,我个人技术观点,本地AI这条路走不通,本地AI可以做到四五十分,但是五十分和四十分的东西,对商业用户来说它的价值不是很大,可能更多的不是想用一种算法固化在本地来做,可能更多的是用一种行为特征库。而这种行为特征库跟我们可信认证也会保持比较紧密的联系。我们现在可信认证所收集的还只是文件,下一步我们准备收集更高的两个纬度,第一个是文件与文件之间的关系,比如说哪些文件容易存在于同一台机器上。第二是文件所触发的行为。把这些都收集下来以后,真正有效的AI是统计。比如google,以前我们做机器翻译的时候更多的思路是让程序模拟语言逻辑,但是最后的效果会发现在少数测试样本下还可以,但是在大量的测试样本下不是很有逻辑,因为计算机比人有逻辑,其实人说的话互联网上都有,就看你是否能找到它,所以它翻译的时候是拼句子,只要把这些句子拼起来更像人说的话,所以未来AI发展方向应该是这个方向。比如计算机同样判定一个MD5的文件有一千个文件名,它成为木马的概率会很高,当我们服务端的行为我们发现在一个很短的时间内大量的机器出现一个文件的时候,那么这个文件不是一个大的软件版本更新就是一个大的病毒暴发,如果我们发现有大量的用户在发送同样的邮件的时候,这个邮件也很有可能是病毒。其实它的判定我可能更相信用这种方式来判定。比如对于垃圾邮件的判定,每个人用手敲的邮件一定是不相同的,如果有大量相同的邮件流传那一定是垃圾邮件,这个是站在比较宏观的角度来看。


记者:我是不是可以理解为,您的意思想建立一个比较全面庞大的知识库,它不是复杂还是要简洁。


陈睿:我觉得客户端的代码一百行跟十万行是一样的。


记者:你提到黑白名单,还有一些灰色地带怎么界定?


陈睿:对于杀毒软件不存在,它不是白就是黑。


记者:那么对于一些防御软件


陈睿:可信认证是人判定,它可能带有一个厂商观点,我们认为它是恶意的,我们会把它判定为恶意,同样的厂商可能认为恶意行为较小,就不会判定。所以有的产品会判定有害,有的产品会判定无害。


记者:您在最后提到包括微软在内的一些操作系统厂商应该提升自身安全性,微软也是在朝这方面努力,包括早前微软出过单机版杀毒软件,七月份又推出了针对企业级的安全解决方案,业内有消息说微软杀毒引擎部分整合了专业杀毒厂商的杀毒引擎。不知道您是否获悉这个消息?第二金山毒霸未来会不会配合微软做这方面的合作,有没有合作意向。第三如果微软真正达到可以保护自己Windows平台的能力,那么对金山毒霸未来发展有没有什么影响?


陈睿:我看过,但是还没装过,不知道它跟其他的杀毒引擎可以整合。每一家杀毒厂商跟微软关系都不错,因为我们需要从微软那里得到一些支持,比如vista,如果没有微软支持找的速度会很慢,但是如果提供它会帮你检测哪儿有问题,所以跟微软的关系每家杀毒厂商都是不错的,现在微软很鼓励独立软件开发商,那么它的一统江湖的日子就会继续下去。至于合作如果他有兴趣我们当然也会比较有兴趣,因为微软的影响力在北美一带还是很强的,这是更多的考虑进入国际市场一个比较好的契机。第三个问题,我们非常希望微软加强Windows的安全,我们做的东西跟他做的东西是两码事,我们现在是帮着微软做很多东西,其实不干他的活我们的活也干不完。比方说漏洞的问题,我们如果不帮他补漏洞我们也有大量的活要干,本身他的操作系统在安全方面有一些过于宽容和友善,经常会冒出一两个未公开的API有超级大的威力,他如果把这些事都做好了,我们自己的事本身也干不完。第二其实现在的安全威胁影响操作系统的已经是少数了,更多的是在影响用户的互联网生活。比如说现在如果看一个木马,可以认为这个木马写得稳定高效可靠,是一个相当标准的程序,但是如果在用户机器上运行,他用所有合法手段窃取你的密码,因为更多的木马流行的手段不是一种安全隐患,也不是安全漏洞,而是完全合法的方式,他就跟骗子一样,他根本不撬锁也不砸玻璃,他说我是李嘉诚的外孙,最近想跟你投资等等,我们发现大多数网民网游被盗是因为他一个朋友发给他一个图片,打开一看令人喷血,但其实那是一个exe,他就中了,这个一点办法都没有,因为它是一个合法程序。所以我们做的事跟微软做的事不一样。现在杀毒厂商日子很难过,因为全世界的木马制作者联合起来开会,但是全球杀毒厂商还在互相攻击,这是个很难的局面。


记者:现在很多木马程序用注入的方式来做,这种你们需要查杀吗?


陈睿:80%,现在我们在内部有一个,尝试用很通用的方法拦截检测所有…,这个在毒霸发布那天会出一个公测。我在研发管理方面比较想尝试学习互联网厂商,进行一些简单及时有效的小的解决方案,这个是顺应用户需求的。


主持人:我们今天除了专业媒体,还有个人网站的领袖可以代表网民,问一下。


网站:我们是做下载站点的,毒霸在我们上面下载量也很大,用户对杀毒软件是杀毒能力跟系统资源占用,我们系统资源占用有没有新的技术。


陈睿:资源占用两方面,一方面是内存占用,还有一方面是杀毒软件挂进系统一些关键技术点,所以会造成文件系统、网络运营效率降低。内存占用的主要的问题是在于特征库太大,所以对特征库我们在减肥。可信认证这一块经过实验比较成功的话,我们会尝试筛选一部分过期特征出来,在不影响用户体验的前提下还能保证我们有比较高的查杀效率。第二点对于接入点的挂接,文件监控的效率、网络防火墙的效率,现在毒霸珠海项目组在进行监控提速的小项目,通过这个小项目可以把以前监控速度提高不少,这个不属于安全发展方向,是属于通用软件很通用的工作。


网站:现在在网页上面有很多规模不是很大的插件病毒,也不是病毒,它可能在下载的时候下载几十万次,它暂时不发作,可能半年以后才发作,这种金山是当时就查杀,还是发作的时候再查出。第二网上流行一些金沙毒霸盗版,它们以后会不会享受可信认证。


陈睿:盗版一样享受可信认证,盗版正版区别就在于我们服务会有不同,但是金山一直在版权控制上不抠门,所以金山毒霸盗版比较多也是这个原因。第一个问题看发作是什么样的定义,假如在用户机上安装的时候不作恶,其实这个比较像去年的流氓软件,他如果本身不作恶我们不会管,但是我们会在清理专家里面可以让用户看到它,并且让用户卸载它。如果它本身作恶的话我们会把它列入我们高危病毒程序属于查杀范畴。可信认证对于这块的帮助是对插件的收集效率非常高,因为启动项检测,插件是启动项,我们对启动项的定义是所有非用户主动运行就会起来的东西,这一块如果它半年以后作恶的话我们会及时解决,不作恶我们会把它列为多余的插件,让用户手动卸载,在毒霸里面不做病毒处理。


记者:可信认证是不是可以理解为以前厂商主动收集文件,现在是用户来提供。在用户提供的时候,金山毒霸这个时候会做一些什么?收集我们会有一个判断吧,会不会什么都收集,这种情况下是不是有隐私泄露的问题。


陈睿:我们做这个的时候找了公司的法务仔细论证了这个问题,因为金山现在是上市公司,上市公司比较怕这些麻烦。但是我们关注的仅仅是二进制可执行文件,这个本身泄密的概率非常的低,如果我们去关注它的输入、关注它的文档、关注邮件的话泄密概率是有的,但是我们关注的是二进制可执行文件这个非常低,我相信用户也不会把自己的一段隐私写到魔兽的主程序例。我们有比较严谨和法律描述,不管用户看不看的懂,我们描述了,所以这个不存在这个问题,还有即使是针对隐私,我们每天收集上来很多文件也没工夫去看。第二是不是客户端收集文件,这个只是我们一部分,我们更多关注的还是网上爬文件,比如如何判定黑白名单,可能是下载网站一个一个往下爬,因为所有二进制文件都不是用户做的,他之所以有是因为网上肯定就有一份。我们是从网上扒,我们再对这个文件进行分类。用户不需要把他机器上的文件扒下来,更多的是当他触发了恶意行为之后,比如我观察到一个文件在释放病毒,那么它是不是病毒?有可能是,也有可能不是,它是病毒的概率很高。比如迅雷也有可能释放病毒,但更多的他有可能是一个病毒的升级程序,所以这部分的收集我们精度很高,不会大量从用户机上扒文件下来,但是我们很定点、很精确的把触发这类文件的东西收集上来。


收集的时候我们本地也有AI,如果本身比较高危,就像网页挂马跟释放的拦截,我们即使不能判定是不是,我们也会提示用户在挂,如果发现一个进程在释放病毒我们会拦,这些操作会有,但是我们会把我们不能判定为病毒或者木马的文件送上去。还是需要有用户干预的地方,但是会少。我们会在一些很值得用户干预的地方会提示,比如他的IE在执行一个临时目录文件,这个文件也不知道是干吗的,那么它挂马的概率就极高。


记者:目前国内厂商在木马防御技术上有差别吗?


陈睿:技术上完全一样,完全同质化,现在对于木马之所以用户感觉不同,有可能几个原因,第一个原因心理作用,第二个原因就是运营能力,比如说我拿到样本多,我的能力就强,样本少我的能力就弱。第三是用户体验,体验做好了也能够放大技术的能力,但是从技术本身来讲,国内厂商在防木马上是一个水平,完全同步化。今天除了我讲的这个东西稍微新鲜以外,其他的东西每家厂商都差不多。


记者:可信认证概念和信誉认证是不是类似的一种概念?他们当时是通过收购了一家国际性的厂商获得这个技术整合。百度在网页收集上有先天的优势和技术,现在Google也在做这方面内容,那么我们和微软不一样的新的突破口,这对于我们安全企业来讲意味着什么?


陈睿:现在及时整个行业都面临一点,现在用户在哪里,现在的用户不在Windows上,现在的用户在互联网应用上,所以Google、百度这类的厂商如果做安全的话,他远远比微软这类厂商做安全更有竞争力,因为我刚才特别提到了一点,互联网厂商运营能力的提升我把它摆在操作系统安全性的提高一个重要性上,为什么?现在全国50%的用户下载是用迅雷,如果迅雷把安全做好是不是比微软更有用?百度在搜索的时候直接把含有木马的网站滤掉,那么用户也没有机会接触到有木马的网站啊。可能对于我们来说杀毒软件永远不会失业,但是我们的发展有可能会被侵吞,就像Google在侵吞微软的发展空间一样,我们的发展是被离用户更近的,有更多用户数据的厂商侵吞,而且他们做的程序更实用更小巧,而且一定免费,这是一个担心,但是一定要化压力为动力,做IT心理素质不好点那还得了。为什么网易做搜索、搜狐做搜索、新浪做搜索,逼上梁山,必须得做,所以我们必须在用户搜索下更多的投入,在未来我们找到自己的发展空间,要不然我们只能像微软一样成为一个很传统的产业链的一部分,最终我们的使命会变成一个单一目标,就是如何进一步降低运营成本,因为本身你的价值被压小,只有不断降低运营成本才会取得更高利润。所以在我看来这些厂商绝对比微软有威胁。


信誉认证做的更多类似于信产部搞的安全资质认证,更多的侧重于企业应用跟行业应用,是确保整个应用链的安全,而且对于他来说木马不是他唯一的问题,它有一部分是防人的。而对于我们这个,其实毒霸还是挺专注的,可信认证不是解决安全问题,就是为了解决木马的问题,就是解决木马的识别和判定问题,甚至跟杀木马没关系,因为木马判定出来未必能把木马杀得掉,因为现在所有的木马都有加壳、有反杀,跟操作系统能多亲密就多亲密,很难把他从操作系统里面拿掉。所以可信认证代表金山毒霸的一个技术观点,它就是能够提高木马的判定,你说它加到毒霸2008里面,毒霸的查杀速度会一日千里的提高,这也不会,它是解决一个问题。有无数先烈找安全的特效药失败了,我觉得安全没有特效药,安全就是把有可能出问题的环节尽可能做到严谨,最终用户的安全不是因为杀毒软件做的好,而是因为操作系统更安全,杀毒软件很尽职,互联网安全厂商安全意识很到位,所以他很安全。


记者:最近很多企业在收购数据防泄露,比如说一个木马也杀不掉,最终为了窃取数据,那么数据防泄露是不让木马进来吧数据拿走,那么我们金山做了哪些尝试?

陈睿:其实这个跟主动防御的目标是一致的,不仅是防泄露,我觉得对于用户来说,最好这两种技术在他的机器上都有体现,这样更安全一些。目前毒霸主要的注意力还是集中在木马的判定,说一句类比的话我们只管抓贼,贼杀了死咱们就把他当杀人犯抓了,咱们不能防他杀人。这也是一种思路。当然了类比不等于见死不救,我们的重点不是做他的贴身保镖,我们重点是做警察,但是当警察看到贼在杀人的时候一定会制止,正像所有的杀毒软件里面都有主动防御方向的技术,因为主动防御技术的点不是面而是行为,但是这个不会作为这个产品最大的卖点。杀毒产品最大的卖点还是能判定木马,最好在木马还来不及作恶之前判定,所以响应速度很重要,判定的精度也很重要。

责任编辑:gxis_admin


相关文章
 

最新文章

更多

· 维护网络安全需完善立法...
· 无线异构网络的关键安全技术
· 未来网络安全十大趋势
· 美成立网络司令部 掌控核...
· 银行卡产业信息安全体系...
· 卡巴斯基举办论文大赛
· 推动互联网发展 国家力量...
· 个人信息保护国内外解决...
· 挑战与机遇 我国信息安全...
· 从MSN中断五国服务谈国家...

推荐文章

更多

· 维护网络安全需完善立法...
· 无线异构网络的关键安全技术
· 未来网络安全十大趋势
· 美成立网络司令部 掌控核...
· 银行卡产业信息安全体系...
· 卡巴斯基举办论文大赛
· 推动互联网发展 国家力量...
· 个人信息保护国内外解决...
· 挑战与机遇 我国信息安全...
· 从MSN中断五国服务谈国家...

热点文章

更多

· 未来网络安全十大趋势
· 维护网络安全需完善立法...
· 无线异构网络的关键安全技术

友情链接

更多 >>

广西信息网络安全报警网站 南宁市公安局网络警察支队 广西壮族自治区民政厅 国家计算机病毒应急处理中心 广西金普威科技有限责任公司
蓝盾信息安全技术股份有限公司 珠海捷郎菱网络科技有限公司 中国互联安全网 广西顶佳计算机信息有限公司 全国信息网络安全协会联盟
数谷网
桂ICP备05007911号