支付宝申请基于强化学习训练大语言模型专利,提高训练速度
创始人
2026-04-10 14:10:09
0

国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“基于强化学习训练大语言模型的方法及装置”的专利,公开号CN121835810A,申请日期为2025年12月。

专利摘要显示,本说明书实施例提供一种训练大语言模型的方法及装置,针对当前的大语言模型,可以基于GRPO强化学习的框架,设置评测要点集,利用自身对其输出和评测要点集的各条评测要点进行比较,从而确定模型奖励。如此,可以不设置额外的奖励模型,从而无需外部请求,提高训练速度。另外,评测要点集可以多个评测要点,在根据评测要点集确定模型奖励过程中,可以按照输出数据与评测要点集的比较结果,融合为复合的奖励评价分数,根据奖励分数确定优化目标优化大语言模型,从而可以减缓奖励破解的问题。

天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目67次,财产线索方面有商标信息92条,专利信息5000条,此外企业还拥有行政许可60个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

来源:市场资讯

相关内容

热门资讯

原创 中... 尹希这个名字,或许并不是每个人都熟悉,但在科学圈内,他曾经是被反复提起的“少年天才”的典型代表。早在...
伊美谈判相关斡旋方21日在埃及... 新华社德黑兰6月19日电(记者陈霄 沙达提)据伊朗伊斯兰共和国广播电视台19日报道,埃及和巴基斯坦当...
减少国家干预,古巴通过170余... 据凤凰卫视报道,古巴总理马雷罗6月18日在会上公布了170多项举措,并获得一致通过。这些举措旨在减少...
郑州一汽车用品商城起火,有楼栋... 极目新闻记者 李贤诚6月19日晚,郑州市金水区居民陈先生反映,离他家百余米处的宏达国际车业广场突发火...
伊朗外长:美应对任何违反谅解备... 当地时间6月19日,伊朗外长阿拉格齐与巴基斯坦副总理兼外长达尔通电话。双方就地区局势交换了意见。通话...
科技创新如何改变普通人的生活 科技创新, 听起来好似实验室里那种高深莫测的课题, 事实上呢, 它已然静悄悄地走入了你我的平常生活里...
校长喊你吃饺子!大学最香最暖的... 又是一年毕业季,离别依依,情意浓浓。在这离别时刻,大连东软信息学院校长郭权走进食堂,挽起袖子,与毕业...
全球可用模型第一!智谱上线并开... 国产大模型慢慢追上来了! 6月17日,智谱上线并开源新一代旗舰大模型GLM-5.2,主攻“长程任务...
全球智能手机销量连续第九周同比... 【CNMO科技消息】市场研究机构Counterpoint Research最新发布的周度销量追踪数据...
2026年抱箍太阳能路灯区域深... 抱箍太阳能路灯是一种无需预埋基础、通过抱箍结构直接固定在现有灯杆上的太阳能照明产品,其安装灵活、适配...