投资 >

大模型试水投研场景,如何防止“一本正经地胡说八道”_全球快资讯

2023-07-03 19:02:24   来源:21世纪经济报道

21世纪经济报道记者  陈植  上海报道

AI大模型技术正应用在越来越多金融场景。

仅仅在投研提效领域,多个大模型产品悄然面世。


(资料图片)

近日,恒生聚源推出基于大模型技术的投研工具平台WarrenQ,致力于重新赋能“搜、读、算、写”的投研全流程场景,进一步提升投研效率。

与此同时,多家金融科技平台也推出基于大模型的投研提效工具,即在通用大模型基础上引入指令微调或提示工程,自动生成各类报告与图表摘要,提升投研人员的信息获取效率。

一位券商投研人员向记者透露,目前他们正在测试多款大模型投研工具的性能。

“整体而言,这类产品若要显著提升投研效率,还需解决诸多实际操作瓶颈,比如大模型技术自动生成的信息是否具有即时性、能否做到信息溯源、是否支持二次编辑与多人协同工作,能否一键快速分享等。”他告诉记者。尽管当前大模型投研工具的技术路径不一,但他们通过测试发现,具备自主庞大数据库与良好大模型训练成效的相关工具更受欢迎,因为它不但精准快速解决投研人员的个性化信息收集检索要求,还能方便投研人员轻松进行内容加工,进而大幅提升投研效率。

恒生电子董事长刘曙峰向记者表示,尽管大模型技术带来“语控万物”、“大才能强”等变化,但在金融垂直领域,其应用仍面临知识信息时效性、数据安全与隐私保护、具体应用支持等方面的局限。因此,金融行业需建设行业大模型以承接垂直领域的特定需求。

“未来,金融行业大模型能落地的场景非常多,除了投研,还有投顾、客服、运营、合规、交易等。但它的应用难点在于协同,特别是数据协同,各种数据如何打通,将是非常具体且困难的问题。”他指出。因此,金融机构要部署应用大模型,需从选模型、估规模、建场景三大步骤入手,构建金融行业大模型与基于大模型的全新数智产品,为金融行业应用大模型提供新范式。

防止大模型“一本正经地胡说八道”

AI大模型技术正悄然“改变”投研生态。

有机构调研显示,在投研领域,众多金融机构面临诸多痛点瓶颈——60%分析师遇到数据碎片、数据孤岛、投研工具繁杂等困扰;50%基金经理遇到信息爆炸、重点信息不突出等挑战;80% 金融机构管理层感到研究团队不透明,知识沉淀难等问题。

于是,越来越多金融科技平台寄希望大模型技术破解这些投研痛点瓶颈。

当前,大模型投研工具主要分成两类,一是在现有通用大模型GPT4.0基础上直接引入“提示工程”与“指令微调”,以此自动生成上市公司公告财报要点信息与行业报告核心内容,提升投研人员信息获取效率;二是“从头做起”——将自身数据库通过大模型技术进行大量预训练,再引入指令精调与提示工程技术,让自动生成的内容能进一步满足投研人员的个性化信息检索收集需求。

记者多方了解到,投研人员最担忧大模型投研工具会产生两大问题,一是一本正经地“胡说八道”,二是自动生成的相关内容明显“过时”,无法满足投研建模要求。

要解决上述两大问题,绝非易事。

恒生聚源副总经理白雪告诉记者,为了满足数据即时性要求,WarrenQ在数据层与模型层的基础上,加入涵盖NL2SQL、搜索接口、指标计算、向量数据库等插件层,确保大模型产品能即时调用最新的数据以反映最新的金融市场动态与行业变化趋势等。

记者获悉,要防止大模型“一本正经地胡说八道”,金融科技机构还需开展大量预训练与指令微调。比如在预训练环节,大模型时常会“自由发挥”,自动生成很多“天马行空式”的内容信息,于是开发人员通过不断调整指令与反复预训练,教会大模型如何正确识别提问语义与自动生成相应的专业精确回答,确保大模型能不再“答非所问”。

此外,大模型投研工具能否具备“实用性”,还在于它是否具备支持查看原文、研报图表抽取、OCR识别、支持二次编辑、文档信息挖掘等功能。

白雪告诉记者,针对投研环节的数据分析与智能处理实际需求,WarrenQ推出了两款AI工具,分别是WarrenQ-Chat和ChatMiner。前者主要借助大模型叠加搜索与恒生聚源金融数据库,通过对话指令,帮助投研人员高效获取金融行情、资讯和数据,且每一句自动生成的对话都支持原文溯源,还可以生成金融专业报表,从而将传统投研的“搜读算写”流程转变成“Chat读算写”,提升投研人员的信息获取效率;后者则主要发挥金融文档挖掘器功能——即大模型和向量数据库会根据投研人员个性化需求,对相关文档进行快速解读与精准检索定位,自动生成提取关键信息,提升投研人员对海量文本数据的整合归纳提炼效率。

一位正研发大模型投研工具的金融科技平台人士向记者直言,其研发难度远远超过预期。仅在数据库建设、大模型技术选用、大模型预训练等方面,企业都走过不少弯路,

“这背后,是金融科技平台需全方位比拼数据、算力与算法。只有数据库越全越庞大、算力更强、算法模型更高效的大模型投研工具才有望脱颖而出。”他直言。

在白雪看来,大模型时代的产品化服务与落地,可以持续做好三件事:一是加强数据获取的精准性、数据更新的即时性;二是提升大模型及其精准的意图识别能力,做到自然语言到数据、自然语言到指令的精确映射,即“语控万数”、“语控万物”;三是用好向量数据库,将私域知识库与大模型结合起来做好产品与服务。

金融行业大模型的征途

在多位业内人士看来,AI大模型技术能否成功应用在投研、投顾、客服、运营、合规、交易等金融场景,另一个关键成败因素是金融科技平台能否构建专业的金融行业大模型。

一位奇富科技人士指出,金融行业因其行业特殊性,对训练数据质量、模型生成效果、数据安全合规等方面有着更高要求。首先,金融行业大模型需全面掌握金融专业术语,理解客户意图,在与客户对话过程能精确提取线索(即客户想了解的信息),并给出兼顾专业性与合规性的应答;其次,金融行业大模型必须在准确性和适用性两个方面做到极致,因为在金融领域,大模型自动生成的内容是不能出现“任何错误”的。

在他看来,要实现上述要求,金融科技平台需向金融行业大模型注入足够全面庞大的数据进行反复预训练,才能实现“回答精确”与“话术合规”。

“公司在信贷领域所积累的逾5000万份征信报告及解读、月均逾350万的用户深度对话,以及涵盖900多个行业、逾3000个标签属性的逾1600万家企业金融行为数据,加之所衍生的知识图谱与专业知识,都被纳入金融行业大模型的数据基础。”这位奇富科技人士向记者直言。

恒生电子首席科学家白硕告诉记者,金融行业大模型的研发,的确离不开庞大的金融数据支撑。恒生电子所打造的金融行业大模型LightGPT已使用逾4000亿tokens的金融领域数据(包括资讯、公告、研报、结构化数据等)、以及逾400亿tokens的语种强化数据(包括金融教材、金融百科、政府报告、法规条例等),并以此作为大模型二次预训练的“语料”,支持逾80项金融专属任务指令微调,进一步提升金融行业大模型的准确理解能力。

白雪告诉记者,大模型投研工具的研发成败,很大程度取决于“语料”的丰富度与专业性。因为投研人员都希望自动生成的内容信息能尽可能多地涵盖当前市场各种动态与观点,这都需要金融科技平台不断向大模型注入最新的各类精准的金融语料,并实时链接映射到数据库,令大模型投研工具自动生成的内容能最大限度“与时俱进”。

值得注意的是,一个行之有效的金融行业大模型光有庞大专业的数据库是不够的——除了与之配套的算力算法等金融基础设施,它还需解决诸多挑战,包括能否做到轻量化部署、能否在金融专业问答、逻辑推理、超长文本处理能力、多模态交互能力、代码能力等金融大模型能力评测领域取得不俗表现,并保证内容和指令的合规安全等。

上述金融科技平台人士向记者透露,这令众多金融机构倍感压力——若在传统AI模型基础上研发金融行业大模型,几乎是很难完成的任务。因为传统AI模型与大模型技术在数据、模型、模型开发方式、业务应用、适用场景及成本等方面完全“不同”——相比传统AI模型的作坊式操作、研发周期长、通用性低等特点,大模型技术开创性地提出预训练模式,以流水线的模型开发方式可泛化多应用场景,实现高通用性。

“两者截然不同的特点,预示着金融机构需要持续投入大量资金资源,持续强化金融行业大模型的预训练成效,才能令它更精准高效地匹配投研、投顾、客服、运营、合规、交易等金融场景各类业务需求。”他直言。

白硕告诉记者,目前LightGPT计划在9月底完成新一轮的金融能力升级,并支持金融机构通过私域任务数据定制化“精调”大模型,从而打造机构专属的大模型,满足个性化需求。

在刘曙峰看来,在大模型时代,“数据+算法+算力”正构成新范式的基本要素。金融行业更需促进大模型产业上下游合作,为金融数智化提供更强有力的技术支撑。

标签:

相关阅读

大模型试水投研场景,如何防止“一本正经地

投资

AI大模型技术正应用在越来越多金融场景。

2023-07-03

打新资金离场不改基本面价值,湖北科投REIT

投资

7月1日,也是产品上市次日,中金湖北科投光谷产业园REIT(下称“湖北科

2023-07-03

环球关注:阿斯巴甜“潜在致癌风波”搅动代

投资

中国网财经7月3日讯(记者陈琼)世界上最常用的人工甜味剂之一——阿斯巴

2023-07-03

鄂股动态丨湖北能源拟投资超百亿元在陕西投

投资

日前,湖北能源(000883 SZ)发布公告称,公司将在神木、定边、靖边、

2023-07-03

5月香港零售业总销货价值临时估计为345亿港

投资

智通财经APP获悉,7月3日,香港政府统计处发表2023年5月零售业销货额临

2023-07-03

大模型试水投研场景,如何防止“一本正经地胡说八道”_全球快资讯

投资

AI大模型技术正应用在越来越多金融场景。

2023-07-03

打新资金离场不改基本面价值,湖北科投REIT破发当日即获增持护盘丨REITs金融实务-全球今日报

投资

7月1日,也是产品上市次日,中金湖北科投光谷产业园REIT(下称“湖北科

2023-07-03

环球关注:阿斯巴甜“潜在致癌风波”搅动代糖行业 本月中旬将发布结论

投资

中国网财经7月3日讯(记者陈琼)世界上最常用的人工甜味剂之一——阿斯巴

2023-07-03

鄂股动态丨湖北能源拟投资超百亿元在陕西投建1900MW光伏发电项目

投资

日前,湖北能源(000883 SZ)发布公告称,公司将在神木、定边、靖边、

2023-07-03

5月香港零售业总销货价值临时估计为345亿港元 同比上升18.4%-今日观点

投资

智通财经APP获悉,7月3日,香港政府统计处发表2023年5月零售业销货额临

2023-07-03

世茂集团前5月合约销售额238.6亿元 美元债重组方案草案已发送 热讯

投资

于2023年1月至5月期间,集团累计合约销售总额约为人民币238 6亿元,累

2023-07-03

快报:共推“健康中国在基层”关爱行动 罗益生物与南方财经全媒体集团达成战略合作

投资

肾综合征出血热是一种以老鼠传播为主的严重自然疫源性传染病,疾病负担

2023-07-03

世界头条:胡锡进: 有人因为我那天入市管它叫“胡锡进底”,我不敢承受

投资

胡锡进今日盘后发文称,今天股市涨了1 31%,老胡真是高兴。我个人持仓

2023-07-03

又见顶流娱乐明星塌房!手握超40家代言,蔡徐坤商业价值崩塌在即?燕京啤酒踩雷,希望各位股民理智一点

投资

在“一夜情、应堕胎事件”爆料一周多之后,一直三缄其口、淡化处理的的

2023-07-03

看点:瑞士6月通胀降至1.7% 市场依旧维持央行加息预期

投资

智通财经APP获悉,瑞士政府周一公布的数据显示,瑞士6月份通胀降至1 7%

2023-07-03

遇见旗袍是于万千人群中的惊鸿一瞥 沿途洒满了爱的芬芳

旗袍,中国和世界华人女性的传统服装,被誉为中国国粹和女性国服。虽然其定义和产生的时间至今还存有诸多争议,但它仍然是中国悠久服饰文化

北京市电影院有序恢复开放 周五预售部分场次已满座

7月21日,北京市政府发布《北京市电影局关于在疫情防控常态化条件下有序推进电影院恢复开放的通知》,宣布全市低风险地区影院,可于7月24日

近期持续强降雨影响 第46届武汉渡江节因长江水位过高取消

武汉7·16渡江节组委会14日发布公告,由于长江武汉关水位超警戒水位,按照规定取消2020年第46届武汉7·16渡江节。受近期持续强降雨影响,

“非遗”普及受众最看重“动手”参观大师工作室非常享受

过去一段时间,国家级非遗项目灰塑传承人邵成村,多次在陈家祠等工作现场,向身边那些带着好奇目光的人们讲解灰塑的种种技术细节:草根灰、

璧山冷酒夜市 丰富市民夜间文旅活动

7月13日,位于璧山区南门唐城夜市街区的璧山冷酒夜市开街。这是璧山区打造夜间经济消费载体、培育夜间经济活动品牌的举措之一。璧山市民一

年内两市超过500家上市公司完成回购 累计回购金额超332亿元

近期A股市场持续震荡,不少上市公司或其重要股东推出回购、增持计划,用真金白银力挺股价。记者根据同花顺数据统计,今年以来,两市超过500

持续发力补链强链加大研发抢占市场 渝企跑出“加速度”

玥湖路渝快电充换电站 一辆新能源汽车,离不开研发、动力、配套等多个环节。作为汽车制造重镇,重庆在这些环节的多个板块上,正在加速奔跑

重启上市公司资本运作 康佳集团去年半导体业务营业收入为3.22亿元

近日,康佳集团正式对外发布2021年年度业绩报告。2021年,康佳集团实现全年营收491 07亿元,归属于母公司的净利润为9 05亿元,同比增长89 5

伟禄集团连续6年增长 去年营收同比增长37.5%

深港通标的之一的深圳企业伟禄集团近日公布2021年业绩。财报数据显示,伟禄集团全年营业收入11 95亿港元,同比增长37 5%,连续6年稳步增长;

龙头企业去年净利倍增 整个行业营收规模有望创造历史新高位

近日,面板龙头TCL科技、京东方分别发布2021年度业绩快报,两家企业去年归属于上市公司股东的净利润分别增长129 3%、412 86%,实现超过百亿

深圳国企全力为市民 守好“菜篮子”“米袋子”保障量足价稳

疫情防控形势下,民生物资供应是否充足成为市民最为关注的问题之一。连日来,深农集团、深粮控股等企业,充分发挥国企担当,全力为深圳市民