AI界,苦AI久矣。 面对大规模的、碎片化的场景需求,算法泛化能力弱、依赖人工、成本降不下来的AI厂商,只能通过“天价”来维持生计。 而残酷的是,“天价”的制定者们——AI应用层厂商们深耕AI多年,仍找不出一条规模化的商业模式,陷入“做一单亏一单”的泥沼。迄今为止,烧了600多亿元的AI四小龙,仍未逃出亏损的魔咒。 对于该境况,欧洲科学院院士、ACM/IEEE/OSA Fellow、考拉悠然创始人申恒涛认为,尽管AI应用厂商们内部高手云集,但由于AI技术开发效率极低,落地成本极高,大部分AI企业都很难盈利。 据底层技术资深玩家考拉悠然的数据显示,以往的传统开发,需进行包括需求分析、数据探查等19个流程,同时该流程需要至少七类工程师进行长达3-6个月的代码级开发。而由于泛化能力的缺失,一旦场景更改,AI厂商们又要让这七类工程师,耗费下一个3-6个月将19个流程跑完。 周而复始,这一场烧钱游戏,陷入了死循环。 为打破“一碰AI就亏损”的魔咒,考拉悠然潜心研发底层技术试图釜底抽薪:研发业界首款多模态人工智能操作系统码极客,减少开发流程,降低开发门槛。 2022年底ChatGPT问世,为AI界送来“解药”。大模型优化了泛化能力不足等问题,成本降低指日可待,自此,AI 2.0时代正式拉开帷幕。 现阶段,各个大厂的游戏方式是,用重投入博取“诗和远方”——推出通用大模型,下放至自己的各个业务。截止6月13日,仅仅是国内已有6个大模型发布。 而深耕底层技术多年的考拉悠然,试图挖掘出另一种游戏方式——做多模态行业大模型并首度提出“AI FOR AI”,为“诗和远方”铺路。 考拉悠然利用自身积累多年的底层技术打造AI生产工具平台码极客,并率先在业界发布三个多模态行业大模型:工业检测大模型、安全生产大模型、高空视频大模型,协助行业龙头挖掘AI价值。 本文试图探究,大模型如何催生了AI 2.0时代?AI 2.0时代,需要怎样的AI厂商?AI厂商们该如何让AI扭亏为盈成为事实?
随着深度学习、机器学习来临,以科大讯飞为代表的语音识别技术厂商,与以AI四小龙为代表的计算机视觉厂商打开AI 1.0时代的大门。 在那时,国内大部分AI项目落地是以项目制形式,主要包括需求阶段、数据阶段、训练评估阶段、部署阶段。其中,数据阶段和训练评估阶段最耗时耗力,一个项目往往需要专家团队驻场数月完成。 可以发现,“数据”二字,是项目制模式驱动的核心。于是,AI厂商在收集和标注数据上哐哐砸钱,但收效甚微。 数据集和诸多模型各成“孤岛”缺乏纵效,泛化能力差,导致单个模型难以处理复杂和多变的真实场景。同时,AI 1.0时代缺少像互联网时代Windows和Android一样的规模化能力去降低应用开发的门槛。 于是,由于泛化能力、规模化能力的缺失,此前的AI厂商,皆以项目先行,技术后补,投身于各自的教育、医疗、安防等场景。AI 1.0时代,AI厂商尚未真正实现商业上的成功。 2022年11月底,大模型呼啸而来,让整个AI界“欣喜若狂”——让通用人工智能看到了未来的曙光。自此,AI正式迎来2.0时代。 解决泛化能力的秘笈,是“预训练-微调”方法。该方法利用大规模无标注数据通过自监督学习预训练语言大模型,得到基础模型,再利用下游任务的有标注数据进行有监督学习微调模型参数,实现下游任务的适配。 基于该方法,大模型具备更强的泛化能力,能够让“能下五子棋但不能下象棋”的“AI智障”,在未来,精通棋牌甚至是策略类项目。也就是说,大模型可以支撑各类不同应用,有效缓解碎片化开发、反复建模的困境。 同时,仅有后期微调阶段需要标注数据,相较于AI 1.0时代全流程依赖于标注数据而言,省去不少人力、时间成本,基于此,AI厂商能够花更多时间在研发底层技术上。 由于泛化能力弱而笼罩在AI厂商头上的“雾霾”,被大模型的这股“飓风”吹散了,人们开始畅想着,AI 2.0时代的模样。 据中金证券显示,目前业内专业人士为AI 2.0时代绘制的蓝图是大模型+小模型并存——大模型解决通用场景下的问题,小模型解决长尾场景下的问题。 与中金证券的研判类似,考拉悠然认为,未来的AI格局,将由少量执行通用任务的基础(通用)大模型+高价值执行专业任务的专用大模型+执行工作流的AI执行器组成。 (未来AI格局图源:考拉悠然) 通用大模型在通识数据中不断磨练自身的“学习”能力,该能力将下放给专用大模型,同时,将行业专有数据、业务知识“投喂”给专用大模型,形成“一通多专”的大模型格局。在这之中,AI执行器将不断为专用大模型提供反馈,执行流程,让其成为真正的行业AI专家。 在通用大模型的加速下,AI 2.0时代正式起航,专用大模型以及AI执行器,也将展露各自的价值。
畅想十分美好,但基于种种因素,AI 2.0时代故事的开局,仍是“苦涩”的。 大模型吹散了由泛化能力差导致的“雾霾”,却没能吹倒路上的荆棘丛。据亿欧智库调研发现,数据或基本设施制约、场景碎片化、技术成熟度低是AI落地中TOP3的阻碍,而大模型仅仅缓解了数据制约、场景碎片化问题。 而对于其他问题,大模型“爱莫能助”——其只是打开了各个应用及其数据之间的通道,让AI会的更多。 无论是基本设施制约还是技术成熟度,归根结底,都得看底层技术这一“后备军”实力够不够硬。 现阶段,AI的基本设施,即提供算力的数据中心、服务器、芯片等,面临着“资源有限且缓慢增长,但需求却在飞快增长”的境况。 据IDC预测数据,未来五年,全球算力规模将以超过50%的速度增长,到2025年整体规模将达到3300EFlops。而2025年全球物联网设备数将超过400亿台,产生数据量接近80ZB,且超过一半的数据需要依赖终端或者边缘的计算能力进行处理。 (全球算力增长速度明显落后于数据量增长 图源:中国银河证券研究院) 面对“基础层算力已然跑不过应用层数据的需求”现状,除了提高算力利用率之外,别无他法——提高AI的开发效率,即提高每一份算力的“贡献值”。 技术成熟度便更不用说了,只有在底层硬件、训练框架、算法模型、通用技术上大力投入,才能解决生产效率问题——如果不投入底层技术,AI项目难以摆脱以重人力方式落地的限制。 故,AI 2.0时代需要新的底层基础设施,高强度的底层技术投入是解决生产效率问题的必经之路。 而这条路的走向,也尤为关键。大模型固然全面,但我们需要警惕的是,其解决不了“动物是否健康、车辆是否正常运行、河坝是否稳固”等极具场景化且专业性的问题。 申恒涛院士举了个较为贴切的例子——大模型更像是九年义务教育,学了一大堆通识信息,但若要其落地在例如金融、计算机等行业,还是要经受大学四年及以上的专科教育。 故,市场亟需标准化、模块化的工具降低开发门槛,简化流程,让算法快速落地;也需要多个行业专用大模型,让算法“专业对口”,踏踏实实落地。 谁能探得扭亏为盈的曙光? 在AI 2.0时代,AI产业玩家皆基于各自禀赋,呈现出不同的解决方案。 科大讯飞、AI四小龙这类综合解决方案厂商,基于常年项目制模式经验和技术积累,为客户提供一条龙服务。 例如商汤科技,利用集合计算基础设施、深度学习平台、模型层的AI基础设施SenseCore底层平台,提供标准化、端到端的人工智能模型生产流程,应用于智慧商业、智慧城市、智慧生活、智慧汽车等场景,同时各个场景都有相对应的平台。 这,是大玩家的游戏方式:建数据中心提供算力、打造深度学习工具提供底层技术支撑,为每一个场景定制平台…… 而这一条龙服务背后,是高昂的研发投入。从2018年至2022年,商汤科技分别投入研发费用8.49亿元、19.16亿元、24.54亿元、36.14亿以及40.14亿元。代价是,5年巨亏438亿元。 大玩家负重前行,既要确保场景落地的业务流程万无一失,也要保证底层技术研发不能落后,还要时时向资本市场交上一个满意的答卷,让资本为其持续投资。 大玩家尚且需要底层技术厂商的支持,更何况能烧得起亿级资金的,耗得起时间的玩家,少之又少。AI厂商们亟需成熟的底层技术厂商,为其提供高效率的工具。 早早布局底层技术的考拉悠然,玩得更为轻巧。 轻巧,是其目的更为纯粹——提供低成本、高效的AI工具。考拉所提供的码极客平台,集“模型高效生成、算法效果领先、开发门槛低”于一身。 (码极客具体运作流程及核心优势 图源:考拉悠然) 据考拉悠然CEO沈复民表示,“模型高效生成、行业精准赋能”是码极客平台的核心竞争力。码极客可以更高效率地实现从生成行业大模型到应用的流程。 一个具体的案例是,原先需要七个工种的算法工程师花上3-6个月的时间,去跑19个流程,现阶段,基于码极客平台,便仅需三个工种的练习时长2-3个月的本科生花上一周的时间,去跑5个流程。 此外,码极客可以在行业应用过程中萃取行业知识,通过反馈使行业大模型迭代升级,令其变得更“懂行”,在行业应用落地时便更能精准地解决业务痛点。 而这一轻巧的AI工具背后,是考拉悠然实实在在的重布局。在算法、算力、数据这三个层面,考拉悠然每一块都在蓄力,奋力解决AI公司落地的“疑难杂症”。 在算法层面,基于团队在多模态技术领域长达二十多年的技术沉淀,已然掌握业内的先进技术,在多模态数据对齐、跨模态数据检索和行业大模型生成等方面有20+世界第一的技术; 在算力层面,基于码极客平台效率高这一特性,开发门槛大幅降低,开发效率大幅提高,算力利用率大幅提高,对于算力的消耗,将在控制范围之内; 在数据层面,考拉悠然能通过亲自下场为行业龙头客户定制企业专属大模型、或是与行业信息化公司、行业ISV合作,获取多个行业“know-how”知识; 基于这三个层面的重布局,考拉悠然已经链接AI产业合作伙伴,构建发展生态,共同为行业客户赋能。 现阶段,为解决大模型不够专业问题,基于码极客核心算法,考拉悠然首度发布三个多模态行业大模型: 工业检测大模型 考拉悠然针对工业检测细分场景复杂、数据匮乏的难题,推出工业检测大模型。以工业检测大模型为基础,考拉悠然首创国内首个“注册式AI”工业检测系统。只需将1-3类缺陷样本注册到大模型中,就可以对新类型的缺陷实现准确检测。目前基于工业检测大模型推出了“高精度、高速度、高准度”的“三高”智能检测平台及设备,检测精度可达到0.2um,已广泛应用到京东方等屏幕显示及半导体芯片制造企业,助力客户生产效率提升10%以上。 考拉悠然瞄准大型制造生产企业的安全管控需求推出安全生产大模型。以安全生产大模型为核心打造AI管控平台,帮助企业实现对工人、设备、环境、物料等要素的智能化管控,解决了传统安全管理及时性差、人力成本高和管理效率低等问题,现已被中国烟草、中国建材等大型企业引入使用。根据某企业的实际测算,通过应用考拉悠然的安全生产AI管控平台,人员成本减少了近50%,事故上报率同比下降超过80%。 高空视频大模型 考拉悠然针对电力巡检、国土保护、河道治理、森林防火等业务场景推出高空视频大模型。现阶段主要借助中国铁塔覆盖全国的高空站址,基于高空视频大模型打造AI预警平台,通过AI算法赋能传统通信塔升级为具有智能瞭望能力的数字塔。目前考拉悠然已经与中国铁塔总部签署3.5亿元框采协议,成为其全国最大的算法供应商。同时也在四川、广西、云南、安徽陆续开展对应的AI平台和算法部署。 可以看到,在各家都在蹭热点争做通用大模型的当下,考拉悠然选择了另一条路径——推出行业专用大模型的MaaS服务平台去赋能千行百业。 这也是因为,并不是所有厂商都能够吃好通用大模型这碗饭,仅仅是大模型每天的运营成本就已经难以负担。 基于算法、算力、数据、资金等维度考虑,国内或许仅有百度、华为、阿里、字节等大厂玩得起。大厂基于自身的业务需求,强大的资金、技术储备,去打造通用大模型无可厚非:一旦AI提升其业务的效率与效果,形成降维打击,其前景必然可观。 而纯粹的AI厂商们,选择去打磨专用大模型和执行工作流的AI执行器,是最能够将AI技术落地的战略路径。在不断输入行业数据的基础上,通过标准化、规模化的平台与工具,把AI落地效率提升了,也就能够实现低成本但高价值的效果。 结语 AI产业,即将迎来一场鏖战:各个行业正提出大规模、多元化、场景化的AI市场需求,AI产业急需一场生产力革命去改变产业发展遇到高成本、低效率的瓶颈现状,让AI产业早日迎来盈利时刻。 大模型的到来,揭开了这场生产力革命的序幕,底层技术与多模态行业大模型,将成为接下来的重头戏。 在这场戏之中,谁能够踏踏实实将AI技术落到实处,提供专业的多模态行业大模型,救AI厂商、行业客户于水深火热之中,谁便能挖到更多的金子,让扭亏为盈成为现实。 “一切的一切,都是技术创新为先,客户价值创造为本,技术创新与行业需求充分结合才能实现AI的价值。值得欣喜的是,大模型技术的突破正在快速拉动行业需求,AI将成为所有行业的生产力引擎”沈复民说道。 在AI 2.0时代,考拉悠然将基于二十多年多模态AI技术的积累,与客户、行业伙伴一起经历一场高效的AI生产力革命之旅。假以时日,多模态AI行业大模型将在越来越多的行业落地生根,真正为行业降本增效,实现数字化转型。
免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性,如内容不当,请联系我们qq980047777及时修正或删除。谢谢! http://chinasyjjw.com |