首页 > 生活学习 > 生活学习 > 快手发布大模型产品“可图”,使用扩散模型以提升画质

快手发布大模型产品“可图”,使用扩散模型以提升画质

发布时间:2024-06-01 17:12:54来源: 15210273549

5月31日消息,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。值得注意的是,可图只需一张图片和几秒钟时间,便可生成一套AI图像。

在2024年一季度财报电话会上,快手首席执行官程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。

从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可保留人像的自然特征,一键生成各种风格的人像作品。目前,可图已上线10余种AI形象定制风格玩法。另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、创意十足的绘画作品。用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。

可图文生图作品。图|受访者供图

快手大模型团队的技术能力为产品提供了支撑。据官方介绍,“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,引入了经过优质专家标注的图文数据集,以提升模型性能表现。

去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。

生活学习更多>>

苹果可折叠手机iPhone Flip显示屏将更省电 有望成为顶尖折叠机 苹果iOS 19或将迎来重大界面革新 苹果开启无接口iPhone研发?最大障碍已扫清 招41人!衢江区事业单位招聘 南京市2025年事业单位 统一公开招聘工作人员公告 拟招聘139人!宜宾应届毕业生国资专聘行动正在报名 北京市人大常委会机关所属事业单位公开招聘2025年应届毕业生公告 通州区2025年事业单位拟招聘224人 运城市中心医院诚聘英才 20个岗位60人,期待您的加入 洛龙区、孟津区发布 最新招聘公告 公开招聘公益性岗位人员 共计138人 公安部新闻传媒中心 2025年度公开招聘公告(在职人员) 甘谷县中医医院2025年 公开招聘编外工作人员公告 TCL洗衣机再破行业天花板 发布会或将曝光洗衣黑科技,告别手洗 TCL C12K震撼上市,开启第四代液晶电视新纪元 TCL发布AI超级筒“大眼萌”Pro系列洗衣机 1.31洗净比 高铁1.5Gbps极速狂飙 辽宁移动携手中兴打造全国首条5G-A智算高铁 2025雄安未来之城场景汇国际机器人大赛对接推介会在江苏省苏州市召开 全球首次,宇树科技G1机器人完成侧空翻!王兴兴,拟获表彰!俞敏洪曾称:王兴兴是个天才 “流浪”长达286天之后,两名美国宇航员抵达地球,滞留期“加班费”约人民币8300元 Boss直聘崩了!网友:突然就什么都没有了,刷新都没用 特步创始人“90后”长女出任公司CFO,曾获伦敦大学学院经济学学士学位 苹果:主力合约跌 2.66% 库存去库放缓 TCL新品电视来袭,终于告别烦人的反光了! 深圳TCL智能家庭科技申请门锁交互专利,有效提升门锁使用性能 北京这晚,站在孟子义旁边的卢靖姗,把人情冷暖体现的淋漓尽致 北京市郊铁路东北环线启动环评,长59公里、设站16座 阅文集团2024年亏损2亿元,打造爆款“庆余年”“人世间”的新丽传媒成“吞金兽” 490余家单位提供2万余个招聘岗位 公开招聘!涉及机关、上市公司、学校! 科技日报社2025年度公开招聘7名应届高校毕业生