从领域大模型应用的各种架构方式可以看到其应用效果受到多方面因素的影响,可以用公式进行表示如下:
大模型应用效果=(通用模型+调参效果)*(向量知识库+提示词)^智能代理
其中最重要的是大模型本身的能力。目前大模型能力参差不齐,有实力的公司还在不断暴力训练更大的模型,另有知名高校和团队也同时在探索模型优化方法,试图融合其他算法,以高质量的小数据训练出超水平的大模型,对下游应用而言,需要跟随发展的步伐,尽可能选择当下最优秀的大模型进行尝试,否则就无法了解其所具备的知识、能力和发展潜力。
前不久国内发布了首批通过《生成式人工智能服务管理暂行办法》备案的八个大模型,他们是:百度的文心一言,抖音的云雀,清华智谱的 GLM2,中科院的紫东太初,百川公司的百川大模型,商汤的日日新,上海 MiniMax 的 ABAB 大模型和上海 AI 研究院的书生通用大模型,不在名单上的阿里通义千问、讯飞的星火、实在智能的TARS以及更多的模型通过备案也只是时间问题,国外的大模型如著名的 OpenAI 的 GPT-3.5/4、Falcon 的 1800 亿参数大模型和 Meta的开源大模型 LLaMA-2 的几个版本都将通过代理并经过合规性开发之后进入国内,许多闭源模型用来训练的数据并未公开,但效果都不错。基座大模型的爆发式增长意味着大模型应用的大发展时代即将到来。
好的通用大模型可以不经过调参直接使用,结合其它方法也能在一定程度上解决领域问题,当然有一类好的大模型也特别适合调参,对于金融、医疗、法律这样具有广阔市场的领域,常有更加丰富的特定细分任务,并具有非常丰富的数据,值得加工成特定格式或进行特定的标注,经过经验丰富的调参高手微调之后,常常能取得很好的效果。这也是非常值得做的。
采用提示词技巧和框架发挥大模型已有的能力,或利用向量知识库方式使大模型具备本来没有的知识,都逐渐成为大模型应用开发的常规操作,涉及数据类型、向量算法、向量数据库解决方案(Pinecorn、Chroma 等)、应用开发框架等,各方面技术都在快速成熟中。
目前大模型应用不仅能够提供对话、翻译、文字生成、文本提取以及分析能力,还能够以 API 方式开放这些能力被其它应用所调用,或者调用其它应用的 API 实现各类业务流程的自动化,即实现“智能体”(又称为智能代理)的功能,另外还可以用到很多大模型的多模态能力,在文本、图像、音视频等媒体之间任意切换组合,图书馆服务尤其需要这方面的能力,这些能力有赖于大模型本身素质的提高,以及领域应用开发能力的进步,为智慧图书馆的未来发展提供了极大的潜力和非常丰富的想象空间。