大模型的中场战事,深入垂直行业腹地

头条 >
科技云报道
分享

自从OpenAI于2022年11月推出ChatGPT后,一场波及全球科技界的“AI海啸”就此爆发。


(资料图片仅供参考)

自今年以来,国内已有超过30家企业入局大模型赛道。从百度“文心一言”、阿里“通义千问”的发布,到网易“玉言”、科大讯飞“星火”、昆仑万维“天工”等的推出,再到腾讯“混元”、京东“ChatJD”、华为“盘古”等的预告。互联网巨头、科技公司纷纷秀出“肌肉”,谁也不想在这场大模型混战中掉队。

在由OpenAI引发的这场狂奔中,大模型的发展阶段已经从“通用”迈入“垂类”。如果说通用大模型是大模型发展的初期阶段,那么垂直场景应用则可以视为“中场战事”。

在该阶段,应用与场景先行,倒逼垂直领域的大模型飞跃发展。不少医疗、金融、教育等行业内拥有用户数据积累的企业,已开始基于大模型“底座”,训练适配自身的垂类模型,比如近期由上海联通、华山医院联合开发的Uni-talk、医联“MedGPT”、云知声的“山海”等。

大模型路线分化

大模型让人类感受到的智能,是就像人类自身的学习那样,通过通用知识和逻辑能力的训练,具备了解决各种问题的能力。

大模型也有这种能力,基于文本语料采用无监督学习训练的模型可以用少量的监督样本,用于各类机器学习任务,比如图片分类、翻译、对话、写代码等,这样的能力就是所谓的通用能力。

当大模型发展到一定阶段,各领域企业意识到,其通用能力已无法承载更为专业的领域,比如医疗、金融等,每一个领域都是独立的知识体系,具备极为庞杂的知识量,显然仅靠通用大模型无法满足垂直领域的需求,这也为大模型之后发展路径的分化埋下了伏笔。

事实上,通用大模型发展至今,面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功的且可对外商业化输出的通用大模型,要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性等核心优势。

另外,训练基础模型的成本也是非常之高,做一个千亿级的大模型,需要单机群万卡以上的算力。从国内外来看,真正做通用模型的公司并没有那么多。相反,训练垂直领域模型所需要的代价和资源远远小于从零开始做通用模型。

因而,从商业逻辑的角度来看,大部分公司不具备做通用大模型的能力,巨头更适合做通用大模型,拥有丰富场景数据积累的公司更适合做垂域模型。

垂类大模型以深度解决行业需求为主,即企业在自己擅长的领域训练适合自己的“产业版GPT”。这类大模型生成的内容更符合特定垂类场景的需求,质量更高。

当前,已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。比如,彭博社根据自身丰富的金融数据资源,基于GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。

由此,大模型赛道目前出现了三类厂商:一类对标GPT的通用大模型,聚焦基础层的厂商;一类是在开源大模型基础之上训练垂类大模型,聚焦垂直行业的企业;另一类则是专注具体应用的纯应用公司。

通用VS垂类

从通用大模型到垂类大模型,是大模型技术发展到一定阶段的必然结果。

垂直大模型的发展主要体现在各个领域的模型性能持续提升,例如语音识别的错误率逐年下降,自然语言处理的语义理解能力不断提升等。通用大模型则在多任务学习、迁移学习等方面取得了显著进展,已经成为自然语言处理领域的重要研究方向。

比如,生物大模型能够提高AI制药效率。国外的研究报告显示,AI可以将新药研发的成功率提高16.7%,AI辅助药物研发每年能节约540亿美元的研发费用,并在研发主要环节节约40%至60%的时间成本。根据英伟达公开资料,使用AI技术可使药物早期发现所需时间缩短至三分之一,成本节省至两百分之一。

在产业角度来看,通用模型就是“百科全书”,能够有问必答,能够适用不同的产业土壤,而垂直模型类似于单领域的专家,虽然专业,但受众注定是少数人。

从演进路径上看,垂类模型是在通用大模型基础上训练而来,如果撇开通用大模型,垂类大模型不复存在。垂类模型强调领域的Know-How,对于特定领域来说,需要针对该领域的任务做指令学习。行业不同,场景不同,指令学习的区别也极大。比如,泛互联网行业更关注营销、推荐的效果,金融更领域更关注风控、可信、以及营销的效果。

两者的最大区别在于,垂类大模型在资源投入、成本投入等方面的要求下降了,但额外要求是行业Known-How,即对这个行业的知识要求提高了。

而从成本方面考量,通过通用大模型微调实现的垂类大模型相较通用大模型是“几何级别的下降”。根据国金证券的测算,在模型微调阶段,由于训练量级较小,仅为万级,相关的算力成本相比之下可忽略不计。

以斯坦福大学于2023年3月发布Alpaca为例,这是一个基于LLaMA-7B基座,应用5.2万指令对模型微调训练而来的对话类语言模型。该模型基于8块A100微调,微调时长3小时,算力成本不超过300元。

由于垂直应用大模型更符合垂类场景的需求、质量比通用大模型更高,也让众多企业看到了其中的机会。

医联近日发布了自主研发的基于Transformer架构的国内首款医疗大语言模型——MedGPT,其主要致力在真实医疗场景中发挥实际诊疗价值,可实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。

5月,微盟正式发布基于大模型的AI应用型产品WAI,该产品已正式上线包括话术生产、短信模板、商品描述、种草笔记、直播口播稿、公众号推文、短视频带货文案等25个实际应用场景。

作为聚焦物联网与医疗两大领域的人工智能企业,云知声正式发布山海大模型。该大模型针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强,这样模型既具备了通用应用水平,也针对特殊场景与领域进行了能力的加强。

山海大模型不仅在中文环境下的表现要好于GPT-4,甚至在医疗等个别场景下的表现效果,也已经开始优于GPT-4。目标是在今年内达到ChatGPT的通用能力水平,并在医疗、物联、教育等多个垂直领域的能力上全面超越GPT-4。

云知声创始人、CEO黄伟指出,在AI 1.0时代,虽然基于深度学习,每家都有强大的技术,但整体上并没有本质改变AI用于分类的任务,分类种类的增加仍然处在量变阶段,限制了AI创造价值的上限。

而在大模型引领的AI 2.0时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。

云知声创始人、CEO黄伟

AI对于复杂逻辑理解能力大幅增强,扭转了用户对于AI“人工智障”的刻板印象,也让更多人接受人工智能,为大模型的广泛应用创造的条件。

“大模型所谓的‘思维链’能力,可以告诉用户推导的过程,从而知道中间过程里有哪些东西是错的,优化的时候就可以获得提示了,而不是像过去一样只能看见和调整参数的权重。”

云知声创始人兼CTO梁家恩表示,但就目前而言,大模型仍然是有限的东西,但对于没有见过的东西,大模型会生成“似是而非”的回答,而随着AI生成能力的不断增强,但校验会更加困难,这也让AI行业需要不断去探索新的解决方法。

相信随着越来越多企业入局,垂直大模型在各个行业和细分领域中将大量涌现。而那些能将一个垂直领域做专、做透,用高质量的数据持续优化模型,跑通商业闭环,构建起产业生态的企业,最终将把价值链做到足够长。

【科技云报道原创】

转载请注明“科技云报道”并附本文链接

原文标题 : 大模型的中场战事,深入垂直行业腹地

标签:

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表中国财投网的观点和立场。

相关热点

资讯播报

大模型的中场战事,深入垂直行业腹地
西安好人彭华:一位坚持在“幕后”的健康守护者_全球实时
热点在线丨仅用5个月 今年全国快递业务量已达500亿件
市场监管总局发布5种儿童用品消费提示|全球今日报
全球球精选!廓尔喀怎么读(廓尔喀拼音)
环球微头条丨国家乡村振兴局:推动帮扶产业提质增效巩固脱贫成果
剩余期限和剩余存续期的区别是什么?什么是基金剩余期限?
10万买基金一年赚多少钱?1万基金一天能赚多少?
新发基金募集是什么意思?新发基金募集期适合买吗?
基金开放买入卖出是什么意思?基金买入卖出都要收手续费吗?
富士康收购夏普的原因是什么?富士康收购夏普哪一年?
张备:提升数据安全保障能力 护航数字经济健康发展
有手就行!PS全新工具实现“对话式P图” AI应用风口已然到来
锦州市打造千亿级新材料产业集群 招商推介会在京举行 当前热点
苹果MR细节浮现 或成其“史上最复杂硬件” 传代工商已被要求7月前开工 天天看热讯
澳门5月份幸运博彩毛收入155.65亿澳门元 同比上升365.9% 百事通
【世界播资讯】机构看中这些股 近五日大手笔净买入!
世界观点:南雄市纪委监委“五室联审” 严把党风廉政意见回复关
6月券商金股陆续出炉:“中特估”成热门金股聚集地
每日热门:Counterpoint Research:一季度中国智能手表出货量降至12个季度以来最低水平
【环球快播报】6月1日香港银行间同业拆借利率(Hibor)
区块链首个国标来了!概念股名单出炉
比亚迪供应商尚阳通冲刺IPO:坐享新能源车红利!
环球观速讯丨全球化对中国的影响英语作文_全球化对中国的影响
随着美国开启夏季驾驶季节,汽油价格上涨
揭秘神舟十六号载人飞船上的航天科技
OPPO Reno10系列开售,销量创新高,2499元起长焦人像备受关注
浙江海宁:乡村电影节里的共富新路子
杭州建德:“小工坊”带动共富路_全球微头条
扩大就业渠道促消费动能提升
世界最资讯丨山东沂源:打造“低碳”村庄 助力乡村发展
“非遗+”推动文化传承 产业助力乡村振兴
世界实时:国家乡村振兴局:推动帮扶产业提质增效巩固脱贫成果
【世界快播报】2023年6月1日保险行业每日新闻
日本经济复苏又一迹象!日企连续第四个季度增加支出_天天亮点
今日播报!一张图:2023/06/01黄金原油外汇股指"枢纽点+多空占比"一览
燃油附加费降价了
小破孩头像 情侣(小破孩头像)-环球新视野
全国水库安全度汛电话抽查工作全面启动
曲线腐败(关于曲线腐败介绍) 实时
低成本手机附件测血压“触手可及”-天天快播
神舟有新知丨增强现实技术+陆空多机位 神十六发射精彩画面是这样拍摄出来的
“长二F”如何为航天员“开门”
【世界快播报】3D打印技术造出新型钛合金
环球关注:局地突遭“烂场雨”,如何做好小麦抢收烘干晾晒?
优化法治化营商环境 助力经营主体依法合规经营(法治头条·“法治护航高质量发展”调研行③)-每日报道
【东海期货6月1日产业链日报】能化篇:中国数据疲软主导,油价大幅下行
当美联储考虑降息 菲律宾比索有望成东南亚最强势货币
打造比理想更理想的大五座SUV,新摩卡DHT-PHEV 6月1日来袭
当前讯息:2022~2023年广东省退休人员养老金调整方案最新消息 广东省养老金调整方案计算公式一览表
好看的群头像qq群可爱_好看的群头像
交大昂立二次提示“戴帽”风险,还未确定年审机构 环球简讯
天天视讯!谅解书在什么情况下才可以签
全国共有少先队员11467.1万名
亚洲最大推力试车台具备双工位700吨级发动机试验能力
今日Word数学公式编辑器 MathType下载及使用教程_新资讯
环球热议:英雄为国再出征——记神舟十六号航天员
南方多地持续高温 气象专家:台风“玛娃”是幕后推手
国家乡村振兴局:推动帮扶产业提质增效巩固脱贫成果-全球热点评
世界观察:乘“舟”赴约,开启梦想新篇
【东海期货6月1日宏观金融日报】:经济和通胀降温,美联储加息预期大幅下降 当前头条
债务上限法案在美国众议院轻松通过
世界时讯:好玩的东西的折法_好玩的东西
阿里影业业绩:2023财年经调整EBITA盈利2.95亿元,同比增加106%_全球热门
*ST新纺股价创新低,公司收年报问询函
*ST中捷收到合同纠纷案应诉通知书,公司曾遭监管处罚|天天热点评
百亿A股董事长突遭立案调查!刚刚,跌停! 当前热讯
中信建投期货6月1日贵金属早报:避险情绪升温 贵金属小幅上涨_世界快消息
世界今日报丨请防范!河北发布大风蓝色预警信号
起点股票入门需要了解什么?股票新手入门指南有哪些?
支付宝还信用卡手续费是多少?支付宝信用卡还款手续费怎么算?
土地储备贷款为什么叫停?土地储备贷款期限最长不超过多少年?
采矿权抵押率上限是多少?采矿权质押在哪个部门办理?
固定资产融资如何办理?固定资产融资费用怎么算?
高位放量下跌是什么意思?高位跌停洗盘和出货的区别有什么?
美国五大投行都有谁?五大投行的破产顺序依次是什么?
存款证实书可以质押吗?存款证实书有效期是多久?
邮政储蓄银行八大板块业务是啥?中国邮政储蓄银行创建历史介绍
宏观经济调控主要有哪些手段?宏观经济调控的主要目标是什么?
很多人在用的叮咚买菜关停了两城业务,杭州用户受影响吗?-焦点速看
全球要闻:江淮钇为3:抢发“Model Q”?CTC技术剑指特斯拉!
天天最新:劲嘉股份实控人乔鲁予被于都县监察委员会立案调查并留置 公司深耕烟草行业
每日头条!人均GDP远超北上深!逃离大城市,卖了房子,在这些小城无忧生活
事发上海地铁!“女生深夜举吊瓶赶地铁”引全网关心,本人发声 环球快报
科普|莫要轻视无症状的胆囊小结石
环球热文:38℃!广西连日迎接高温“烤验” 热腾腾的日子将持续到下周
同有科技(300302)5月31日主力资金净卖出54.24万元-每日时讯
每日报道:鲜沐科技玩转hotelex上海展 紧跟潮流趋势赋能行业未来
世界观天下!名单揭晓!达州,四线城市!
今日最新!长安期货6月1日早间看盘
最新快讯!长安期货6月1日原油早评:美债法案通过投票,加息预期高涨压制油价
【速看料】23股公布2023年上半年业绩预告 15股预增
仙佑医药膏药加快智能化 改造升级加快市场发展
“跳蚤市场”欢乐多 当前播报
天天热点评!生态环境部争取年内重启CCER 千亿碳配额市场前景广阔
今日六一儿童节 微信上线“卖萌”“带娃”全新状态
广西超常规为平陆运河建设提供自然资源要素保障
苹果4s越狱多少钱_iphone4s专卖店给越狱吗多少钱_天天热讯
快报:德银警告违约浪潮即将到来 将在2024年达到顶峰
天天最新:油价再度疲软 欧佩克+会宣布进一步减产吗?分析师持不同看法

相关推荐

精彩推送

3