支付宝申请基于强化学习训练大语言模型专利,提高训练速度
创始人
2026-04-10 14:10:09
0

国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“基于强化学习训练大语言模型的方法及装置”的专利,公开号CN121835810A,申请日期为2025年12月。

专利摘要显示,本说明书实施例提供一种训练大语言模型的方法及装置,针对当前的大语言模型,可以基于GRPO强化学习的框架,设置评测要点集,利用自身对其输出和评测要点集的各条评测要点进行比较,从而确定模型奖励。如此,可以不设置额外的奖励模型,从而无需外部请求,提高训练速度。另外,评测要点集可以多个评测要点,在根据评测要点集确定模型奖励过程中,可以按照输出数据与评测要点集的比较结果,融合为复合的奖励评价分数,根据奖励分数确定优化目标优化大语言模型,从而可以减缓奖励破解的问题。

天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目67次,财产线索方面有商标信息92条,专利信息5000条,此外企业还拥有行政许可60个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

相关内容

热门资讯

闲置手机不知如何处理?伟通科技... 在数码产品迭代加速的时代,旧手机处理成为许多用户的困扰,而手机回收行业的兴起为这一问题提供了有效解决...
北京市教委:把“人工智能+教育... 文/于玉金 4月10日,教育部等五部门联合印发了《“人工智能+教育”行动计划》(下称“《行动计划》”...
王毅是否会与金正恩会面?外交部... 4月10日,外交部发言人毛宁主持例行记者会。有记者提问,今天是王毅外长访问朝鲜的第二天。他是否会与朝...
千呼万唤始出来,DeepSee... 市场终于等到了DeeSeek V4的发布。 市场消息显示,DeepSeek创始人梁文锋近日在内部沟通...
“辽*8888*”真奔驰车陪葬... 近日,一则关于“辽宁辽阳市有人为逝者用真奔驰轿车陪葬”的信息热传。多条视频显示,多名人员在一座墓碑附...
阿里认领HappyHorse视... 蓝鲸新闻4月10日讯 4月10日,阿里巴巴方面确认,近期备受关注的HappyHorse视频模型系其推...
大疆影石冲突始末 影石自成立之初就将目光锁定已是行业巨头的大疆;在内外变化与压力下,大疆开始重视外部竞争。过去几个月里...
重磅!郑州出台8条楼市新政 【大河财立方消息】 4月10日,郑州市住房保障和房地产管理局发布《关于进一步稳定房地产市场的通知》。...
报名从速!郑州17家单位公益性... 4月10日,记者从郑州市人社局获悉,2026年市本级城镇公益性岗位公开招聘正在进行。市人力资源和社会...
浙江征求意见:力争到2030年... 【大河财立方消息】 近日,浙江省经济和信息化厅发布公告,就《浙江省促进生物医药产业高质量发展的指导意...