模型不是产品,而是能力,能力要结合“场景”。

周鸿祎:“把大模型拉下神坛,把‘免费’贯彻到底”

2024-07-31 17:09:49发布     来源:多知网    作者:Mint  

  多知网7月31日消息,360集团创始人周鸿祎在ISC.AI2024第十二届互联网安全大会数字安全峰会上宣布360安全大模型正式免费。

  “我们要把大模型拉下神坛,把‘免费’贯彻到底,不仅为个人用户提供免费服务、为中小企业提供免费服务,而且要在行业内,第一个宣布安全大模型免费,让人人都能获得大模型带来的技术红利”, 周鸿祎表示。

  周鸿祎在现场指出,安全大模型要与安全业务深度融合,模型不是产品,而是能力,能力要结合“场景”,产品化才能发挥价值。

  “为了训练360安全大模型,我们投入了20年安全数据知识积累、10年AI技术沉淀、80名AI算法专家、100名安全专家、利用5000卡算力资源,花费了200多天进行训练调优。可以说,360安全大模型集360多年沉淀和全部功力于一身,就像一位在山中闭关修炼多年的‘高手’。这位‘高手’目前已在终端、安全运营、安全服务等诸多业务场景落地实践。”

  现场,周鸿祎也分享了360安全大模型在真实业务场景中取得的突破,通过对全网安全数据和知识进行提炼、压缩和蒸馏,360安全大模型实现对全网安全知识的深度理解。

  未来,在大模型的帮助下,本地安全大脑“无需联网”,在封闭网络中也能获得全网数据和知识的帮助。

  “我们要把免费贯彻到底,不仅为个人用户提供免费服务、为中小企业提供免费服务,而且要对购买360标准产品的用户免费提供大模型标准能力,对已经购买360产品的用户免费升级安全大模型。让人人都能获得大模型带来的技术红利,实现安全行业新质生产力变革。”周鸿祎表示。

  另附周鸿祎演讲全文:

  感谢各位领导、各位专家、各位安全行业的同仁,很多人给我发微信关心我的手断了没有,感谢大家的关心,很幸运我的手没什么大问题。

  昨天闹了一个笑话,到今天想想反应了安全行业人的特点。

  一是安全的人都很执着,碰到什么先琢磨问题。二是有比较二的精神,要亲身试验、亲身钻研,所以以后大家在实验物理安全问题不要拿自己的手做实验,火腿肠和黄瓜可能更合适一点。

  今年是第十二届ISC大会,ISC创办大会的时候就希望它不是360自己的闭门客户销售大会,而是成为行业盛会,成为行业的风向标。

  感谢大家12年来对我们的支持和参与,今年升级为ISC.AI,刚才几位专家和几位领导的发言也提到,安全和AI已经紧密的交织在一起,AI会带来更多的安全问题,同时AI又可以成为安全可能性的解决问题的手段和技术。所以,今年我觉得一定是人工智能的元年,人工智能未来会掀起一场工业革命。

  回顾过去12年我一共讲了12次主题,每次说能够踩住安全行业新的风向,能够找到行业在那一年的痛点和刚需。今天就分享一下360在安全大模型方面的思考和成果。

  我的演讲风格比较像数字人,板着脸讲缎子,大家都说我太缺乏感情了。我今天也煽煽情,讲几个小故事。

  我办ISC的时候受美国的启发,每年参加ISC是全球行业的盛会,我们希望把ISC办成中国的ISC。

  2020年3月份,我冒着疫情在旧金山参加ISC,没想到是我最后一次参加ISC。我接到一个电话说赶快让我回国,公司要宣布一些事情怕你有风险,我就莫名其妙的买了机票回来了,刚一落地360宣布发现了美国的APT攻击,后来ISC取消了我们公司的参会资格。

  不仅仅是因为这件事,后来我们陆续捕获了情报机构对关键基础设施、科研单位、政府机构长达十余年的网络渗透和攻击,打破了西方国家对我们原来单向透明的优势。

  很多人可能不知道,大家知道中国有不少公司被实体清单制裁,但我们是很少见的被美国双重制裁。2022年美国国会有国家网络安全的报告,12次提到360,认为360为中国最具威胁的网安企业。所以,我们这个行业确实用心的很多,但是销售做的好还得靠吹牛。

  我们是这个行业里唯一被美国制裁的公司,可能从反面也证明了360确实有一些技术能力和实力,我们坚定不移的站在维护网络安全的第一线。

  2016年为了与国家利益保持一致,深度参与国家网络安全建设,360从美股退市,原来360可能是一家美股上市公司,有很多投资人是外资。退市之后回归国内变成全内资的民营企业,所以回归国内之后,我们也摆脱了很多束缚,取得了很多成果。最重要的是探索了数字安全上的中国方案,破解了看不见国家级网络攻击的卡脖子难题,累计捕获了境外国家级APT组织54个,其中360独立首次发现并命名的占98%。

  我们也首创了实网实战实冰攻防的理念,支撑国家级的攻防,完成国家战略科技攻关。回国以后我们虽然做民家企业,但是也成为了国家的重要战略力量。

  但是,取得成果的背后,我也要吐吐槽诉诉苦,不要得意,10年累计投入了将近300亿人民币,研发投入等于网络安全行业里超过第二名到第十名的总和。算力的投入在全国有200个数据中心,20万台服务器,1万匹智算中心算力,有2000位核心专家,数万位签约专家,亚洲最大的高级白帽子黑客团队。数据积累总规模达到2.2EB、每天新增1.5PB、总样本量320亿、恶意样本52亿,网络测绘数据总量300亿条,有的同行很激进,把公司里的现金转成营收账款。

  360至今形成了比较奇葩的商业模式,用互联网广告的收入、补贴安全业务,这里我也特别感谢广大的用户支持,你们为国家在看广告。

  投入巨大、压力巨大,但是360并不后悔,我们会继续持续投入为国家网络安全贡献力量。

  现在AI的浪潮势不可当,我觉得来了对我们来说是一次工业革命的机会,对安全行业也是一个机会。大模型重塑所有的行业、所有的产品,英伟达成为全球市值第一,意味着大模型时代的来临。我们能不能利用AI实现安全技术的突破,360虽然取得了一些成绩,但是花了巨大的代价,AI能不能帮助我们降本增效。

  行业有个共识,2023年是模型之年,百模大战解决了模型从无到有,从0到1的过程。2024年不要卷模型了,要看应用,我们看到最重要的场景就是“安全”。

  我们分析一下安全行业有很多痛点能用AI解决。

  比如海量的数据分析难、快速的处置难、追踪溯源,安全专家人力不足,有了大模型之后,这些痛点都能够得到快速的解决,这是我们的期望。

  同时AI也带来了新挑战,包括两个层面,一是AI一定会成为坏人的工具,包括如何编写攻击软件、编写钓鱼网站。网络安全是人跟人的对抗,未来会生成人和机器的对抗,最后发展成机器和机器的对抗。

  所以,我觉得必须要用AI应对AI升级的安全问题。

  大模型自身的安全风险也带来前所未有的挑战,这个我就不细讲了,因为不是今天讨论的关键,我要根据吴世忠院士的PPT把我的改一下。

  我有一个观点,AI带来的安全问题用传统安全思路解决是不行的,因为AI比传统的软件要聪明。所以对AI就得用魔法打败魔法,以模治模,必须用大模型解决大模型的安全问题。

  我们的结论是AI做安全,既解决安全的老问题,就是传统安全问题,也要解决安全的新问题。

  最近大家都在关注自动驾驶,我前几天还特意体验了一下无人驾驶出租车。我觉得用AI重塑安全,本质上是AI建立的路标是否能做到自动驾驶,自动驾驶从L1到L5设了5个级别。

  最近自动驾驶有突破大家都知道,原来是基于规则,特斯拉雇了上千名工程师到处写规则,但总会遇到没有想到的规则,就会改软件。现在自动驾驶行业引入大模型,引入了流行很时髦的算法叫“端到端”,实际从规则驱动变成学习驱动,只要你有足够多的数据,通过数据和知识的训练,就能让自动驾驶取得比较大的突破。

  我倒不是做广告,昨天夹我手的那辆车拉着我在路上开了30多分钟,各种复杂的路况,全程脱离方向盘居然能开下来,让我确实觉得自动驾驶可能在明年就会实现真正的无人驾驶。

  所以,安全也应该提出这样的L1-L5的目标,看一看用AI是不是让安全整个发现和运营实现自动驾驶。

  借鉴传统汽车的自动驾驶,安全上也一定要走大模型的发展之路,所以发展安全大模型,是安全迈向自动驾驶的必由之路,也一定是成功之路。

  但是大模型做起来容易,做好了很难。

  一个基本的事实,现在很多同行拿一个开源大模型训一点安全知识,做一个百科问答,这是造不出真正的安全大模型,只能够副驾驶坐一个像教练一样做指引,但是并不能自动的帮你开车。实际效果都还限于宣传,离实用还是有距离。

  为什么打造安全大模型难在哪?

  首先,刚才两位院士讲了跨学科,光是做安全,但是没有做互联网大模型、大数据的经验,是没有做搜索、做自然语言处理的经验技术,光是用开源模型改可能不太行。

  二是现在证明模型不光是越大越好,一定规模的大模型知识含量、知识密度、知识准确度越高,效果越好。所以,要有海量高质量的安全知识,数据不等于知识,把很多知识训练大模型,会把大模型训练傻,数据要经过提炼才能变成知识。三是与安全业务深度融合,我们提出来大模型要变成打造新质生产力或者新质战斗力核心引擎的时候,是不能做聊天机器人和副驾驶的,它更多是像玩具和助理,知道与安全业务深度融合才能提高效能。

  360是国内唯一具备AI能力和安全能力双重优势的厂商,我们有自研千亿的大模型360智脑,有性能堪称千亿的数据极左模型,打造了知识管理、情报分析等一系列模型。

  360花了那么多钱干了什么?这些年有世界上最大的知识安全库、安全专家团队、全领域强覆盖的实战安全场景。我们能够发现那么多国家级的APT,能够支撑国家级的网络演习,每天通过全球十亿终端,每天都在跟大量黑客、网军做斗争,所以场景特别丰富。

  实话说,过去一年里我们的大模型也面临着学习的过程,最开始我们也很兴奋,以为大模型无所不能,什么都能干。我们大概接了100多个PoC,最后70%的项目都失败了。等我们总结了方法之后,才形成一些成功的项目,才总结了一些经验。

  实际上有5个误区:

  一是做大模型不要宏大叙事,总想脱离具体场景搞一个宏大的产业大模型,实际是很难交付的;

  二是不要追求万能,很多企业老是想做万能大模型,说解决所有的问题,事实上大模型做不到;

  三是有人以为有大模型就可以把原来的IT系统,原来的数字化系统一脚踢掉,这个错了,大模型只是个大脑,可能只有嘴巴和耳朵,加上原来的IT系统,大模型才能有手跟脚,才能进入自动驾驶状态;

  四是很多单位认为做大模型可以弯道超车,跳过数字化阶段,但是一个单位如果没有数字化的积累,就没有数据,就没有知识,是做不出自己的大模型;

  五是微软创造性的提出Copilot是比较合适,但是在业务上Copilot的模式我们认为不是很适合,不要迷信用户提示词,提示词是目前中国用户、企业用户使用人工智能最大的障碍。

  简单总结方法论,关键的问题是找到问题的关键,只要我们改变思路,不追求全能大模型,而是一个大模型在企业里找到一个场景,找到一个细分的切口,一个模型干一个事,就不要期望做一个模型,又能写诗又能作画还能脑筋急转弯,还能解决企业和政府之间的问题,这是不现实的。所以找垂直场景。

  二是由多个专业模型组合起来工作,每个模型都可以更小,如果按照这个思路,很多问题就迎刃而解。我们不要建立对模型参数的迷信,OpenAI只是大模型发展的一条路、一种方向,它的目标是要卷万亿、百万亿等模式,我们做参数百亿就够用,不需要那么大的参数,算力上也不需要百卡、千卡,有的时候几卡甚至单机,单个4090就可以跑起来。

  所以在成本上不需要上千万、上亿的资金,很多企业有百万、几十万的钱就可以开始有自己的大模型。

  能力上,目前开源的模型,国内提供的模型能力即使跟GPT-4有点差距,但足够好用了,这样做出来的模型响应速度更快,用户体验也更好。

  比如360AI浏览器,原来用一个千亿模型速度很慢,现在换了5个百亿模型共同支撑,速度提高了10倍。最重要的解决数据安全问题,保障企业的数据安全,模型一定要私有化部署,这样的模型对人才、训练、工具的要求都降低了很多。

  所以,360安全大模型是这套方法论的最佳实践。模型不再是问题之后,最重要的找明星场景,明星场景就是在企业里看向上对付决策者,向下考虑基层员工,对外考虑客户和产品服务,对内考虑内部管理流程。在这里找4个10倍,能不能找到一个场景,减少10倍的人力,降低10倍的成本,提高10倍的效率,提升10倍的体验,按这个思路找痛点。

  目前用成功大模型的案例,很多国外的,都是在已有的场景中用AI赋能和改进。所以我们在安全上找了6个场景,攻击的检测、运营的处置、追踪溯源、知识管理、数据保护大模型、代码安全与漏洞分析,训练了6个专家模型。

  这个简单讲一下,找场景是第一个要点,第二个是知识管理,知识密度和知识质量是实现智能化升级的关键。

  当模型出现涌现,并不是模型越大越好,现在证明对知识的要求非常高,但是很多公司知识散落在企业内部非常碎片化,有很多知识是数据里要进行二次加工,有些知识在员工大脑里,如何把这些知识捕获下来,实际是非常重要的。

  方法论第三,我们讲专家协同。因为要实现一个功能,需要有一套技术架构,把多个大模型进行协同工作,传统的MoE架构只能实现简单的任务路由分发,专家模型之间不能协同,难以胜任复杂任务。所以用大脑多功能分区的原理,首创了CoE的架构,所谓CoE就是专家协同,使得多个专家模型形成整体。

  方法论四,构建重要的智能体。就是所谓Agent框架,大模型和人脑非常类似,但是至今比不上人脑的原因,人脑有快思考、慢思考两种方式。大模型常见的是快思考,问2+2等于几,他脱口而出。但是真的有复杂的问题,比如写一篇论文、做分析,人类是需要慢思考,需要调动规划和反思、逻辑推理能力,速度慢,准确性高。大模型目前就是孤零零的大模型,只有快思考没有慢思考的能力,我们创造性的提出用Agent的框架打造慢思考的系统,通过知识和工具、增强大模型的规划,打造大模型的慢思考的能力。

  方法论五:融合工作流。企业大模型不是顾问,不能靠做一个聊天机器人解决问题。所以需要通过工作六软件和用户原来的IT系统融合贯通,相当于把大模型看成工作节点和原来企业的组织人员不同的业务用工作流连在一起。现在国际上看,工作流软件的重要性越来越重要。

  最后讲一下效果,这套方法论的指导下,我们打造了360安全大模型,经过对比和测试,在安全能力上超过了GPT-4,我说的是安全能力,其他的能力不跟它比,因为它是全能冠军,我们是专项冠军。

  为了训练安全大模型,实际安全大模型是6个小模型,我们投入了20年积累了安全数据知识积累,10年AI技术沉淀,80名AI算法专家,100名安全专家,调度了5000卡算力A800和H800的算力资源,200天的训练调优。

  下面介绍两个方面的专家能力,一是360的攻击检测专家模型。传统的攻击检测更多通过特征和规则,只能做到发现已知的已知,没有能力发现已知的未知和未知的未知。

  这次通过数据量大加人力分析,发现速度发展慢。原来基于规则驱动,这次改成学习驱动,高密度的训练数据,基站的训练、关联日志、攻防图谱,端到端的能力,已知到未知的能力。利用未知的未知,用360本质训练语料,我们可以发现异常痕迹的发现。

  再介绍一下运营处置专家模型。长期以来运营安全每天都有无数的报警,过滤掉不必要的报警之后,所有的报警都需要有大量的安全运营人员进行处理。国内面临的情况是很多企业虽然买得起安全设备,但是没有足够的人手运营。

  未来五年国内安全人才缺口和网约车司机不一样,网约车职业过胜,我们真正缺口是达5000万。为数字安全专家、自动化处置安全事件解决人手不足的问题,推动运营从辅助驾驶走向自动驾驶,我们实现了8个自动化,自动检测、自动检测、自动宿愿、自动追踪、自动评估影响面、自动处置、自动验证、自动报告。

  我反复强调,这一年大家有很多争论,但是大家趋于共识,模型不是产品,模式是能力,能力要结合场景,产品化才能发挥价值。所以我们看看模型是怎么结合我们的场景?

  EDR是老产品,有了大模型的加持,波或APT猎杀高端能力上有明显提升。

  上周开始的演习行动第一天,通过大模型就捕获了针对一家企业的0Dai攻击。用安全大模型猎杀,过去需要高级专家花费数天以及数月完成,现在在大模型的帮助下,可以实现分钟级对海量化的猎杀。

  我们把大模型和安全大脑结合起来,以某大型央企的数据为例,它有15万台服务器的资产规模,过去盘点资产需要30天,现在只需要2天,过去25类数据员,700多台安全设备需要耗时15天,现在2天可以完成。

  过去1天的告警日均1万条,现在过滤到1000条待处理。所以,这些数据过去复盘报告需要耗时1天,生产生成报告平均需要耗时10分钟。过去每人每天处置事件近50个,三四百人的运营规模团队,一半多人做告警分析处理,现在每人每天可以处理事件200个,人效提高300%,这是我们期望达到的目标。大模型直接跟生产力、跟企业的业务直接挂钩。

  360现在做安全即服务,我们认为这是未来的趋势。

  所以,我们也用安全大模型进行赋能,某世界500强公司下属300家子公司,今年安全大模型赋能之后,仅用了1名专家,配合数字安全报告提交5份,仅1个专家超越了去年8个专家。

  我们借用自动驾驶L1-L5,360已经具备L4,大部分安全运营工作通过工作流的方式自动完成,为通向未来全自动驾驶奠定坚实的基础。安全上我们不是跟人抢饭碗,我们要弥补安全行业的人才巨大缺口。

  这次实现了有两个最后的亮点,一是重大突破,过去360安全大脑在封闭网络下不能用,需要跟云端的大数据威胁情报全面打通,这就限制了单位对我们的使用。

  这次我们把全网安全数据支持做了提炼、压缩和蒸馏,整个大模型赋能下,不需要实时联网,也能够实现非常强大的查杀功能,将来在部队、监管敏感环节下,360安全大模型+本地大脑,也能实现对全网数据和知识的利用。

  最后一个事,我一直说把大模型拉下神坛,把免费贯彻到底,不仅为用户提供免费服务,为中小企业提供免费服务。我第一个宣布安全免费,产品集成了大模型的能力,对购买360标准产品用户的免费提供大模型标准能力,产品加量不加价,对已经购买360产品用户,也可以免费升级安全大模型。所以我们的目标,让人人都用得起大模型带来的技术红利,实现安全行业的新质生产力的变革。

  所以,我们不希望大模型成为少数厂商掌握在手里奇货可居的赚钱利器。如果每个企业用得起专业的大模型,我们非常强烈的支持开源,这对整个中国所有企业的生产力的提升都会有帮助。

  最后,请大家扫码,进一步了解和适用360安全大模型。人工智能是我遇到的第一个技术,在企业里从老板到员工,可能都需要进行科普、都需要使用。现在不想花钱,想简单在公司科普360,想科普人工智能的最好方法是试用360AI搜索和AI浏览器。

  如果还不够就关注我的账号,听我讲陈词滥调,谢谢大家!