目前,大模型技术在金融领域占据主导地位。加快大模型技术创新,可缓解金融行业在风控、办公等诸多方面的难题。对此,度小满持续加强大模型技术布局,提升自身技术实力,并于近日宣布“轩辕”系列新增开源6B、13B、70B三种参数12款金融大模型,“轩辕”系列大模型拥有远超同参数水平的金融能力。度小满通过对大模型技术的研发与布局,为推动金融行业稳健发展贡献一份力量。
度小满“轩辕”可进一步降低大模型的应用门槛
3月11日,度小满宣布“轩辕”系列金融大模型新增开源6B、13B、70B三种参数12款金融大模型。这12款大模型具有“以小搏大”的实力,在用户信息分析、业务数据洞察等十余种金融实际任务评测中,达到自身2倍甚至5倍参数量的模型水平。
三种参数的基座模型、对话模型、int4量化模型、int8量化模型完全开源,开发者可在GitHub、HuggingFace、Model Scope等开源社区内下载使用。
在“轩辕”模型矩阵中,70B及以上模型适合针对需要深度分析、复杂指令执行以及全方位Agent调用的场景,而6B、13B的模型则更加适用于对响应速度有高要求、面向小规模场景和单任务的应用。”轩辕”6B-4-bit量化Chat模型则以其低推理部署成本,进一步降低大模型的应用门槛。
专注中文金融领域任务FinanceIQ大模型金融自动评测集显示,在注册会计师(CPA)、银行从业资格、基金从业资格、证券从业资格等多项金融领域考试中,“轩辕”展示出金融领域专家的水平。
“轩辕”系列大模型在训练方式上进行了多项创新,例如将人类偏好对齐技术引入了金融大模型训练。通常多数垂类大模型仅在微调阶段引入特定领域数据,但这种方法在实际应用中常常显示出局限性,金融行业的复杂性要求模型能够更深入地理解并适应行业特定的需求。为此,度小满构建了涵盖通用性、安全性和金融特性的Prompt数据集,并组织了专业的标注团队对成对的回答进行偏好标注,从而收集到了一批高质量、广覆盖的偏好数据,并通过一系列实践、分析和改进成功完成了奖励模型和后续的强化训练。
“轩辕”金融大模型已经应用在度小满各个业务场景中
度小满在2023年5月开源国内首个千亿级中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首。本次度小满”“轩辕””模型矩阵再次升级,十亿-百亿-千亿参数全覆盖,实现多场景任务适配。
业内普遍认为,金融大模型的价值体现在其能否在核心业务场景中发挥实际作用,如通过综合分析用户信息以支持风险评估、刻画客户画像等。目前,”轩辕”金融大模型已经应用在度小满各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。在代码助手方面,用大模型辅助生成的代码,采纳率能够达到42%,帮助公司整体研发效率提升了20%;在客服领域,大模型推动服务效率提升了25%。
通过大模型等创新技术解决金融各大场景中的难题,是助推金融行业创新发展的关键一环。度小满聚焦大模型等各项前沿科技,在技术领域开展了一系列探索与实践。此次“轩辕”系列新增开源6B、13B、70B三种参数12款金融大模型,是度小满在大模型领域的又一次全新尝试。未来,度小满还将在大模型领域不断创新,为推动大模型在金融行业落地提供新思路。