正文 StableVicuna 凤凰 V管理员 /2024-01-12/72阅读/0评论 0112 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习(RLHF)训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本,它是一个指令微调的 LLaMA 130亿模型。官方网址:chat.lmsys.org/ 前往官网 本站所有文章、图片、资源等如无特殊说明或标注,均为来自互联网或者站长原创;版权归原作者所有,仅作为个人学习、研究以及欣赏!如若本站内容侵犯了原著者的合法权益,可联系我们进行处理,邮箱:i-hu@foxmail.com