首页 > 媒体生活 > 媒体生活 > 快手发布大模型产品“可图”,使用扩散模型以提升画质

快手发布大模型产品“可图”,使用扩散模型以提升画质

发布时间:2024-06-01 17:12:54来源: 152102

5月31日消息,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。值得注意的是,可图只需一张图片和几秒钟时间,便可生成一套AI图像。

在2024年一季度财报电话会上,快手首席执行官程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。

从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可保留人像的自然特征,一键生成各种风格的人像作品。目前,可图已上线10余种AI形象定制风格玩法。另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、创意十足的绘画作品。用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。

可图文生图作品。图|受访者供图

快手大模型团队的技术能力为产品提供了支撑。据官方介绍,“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,引入了经过优质专家标注的图文数据集,以提升模型性能表现。

去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。

媒体生活更多>>

TCL C12K系列惊艳登场!万象分区技术精准控光,画质绝了! TCL、华为、韶音、云鲸等多家品牌厂商将携新品亮相AWE2025 中兴通讯2025年度第六期超短期融资券将于3月28日兑付本息501,841,095.89元 日赚5.3亿元!腾讯2024年盈利大增68%,计划回购800亿港元股份 苹果专利革新Apple Watch:可拆卸充电,健康监测永不中断 白天电视看不清,抗反光电视选哪个?第四代液晶电视TCL C12K正解 TCL智家获融资买入0.30亿元,近三日累计买入0.92亿元 电动车有新政策!4月起执行,电动车、三轮、四轮车都在内 未来,在北京就能看酒泉卫星发射了 甘肃精准发力促进民营经济发展壮大 招50人!山东华宇工学院发布2025年度博士人才招聘公告 2025年周口市中心医院专职消防员招聘公告 中兴通讯与沙特TAWAL 建立新合作伙伴关系,推动数字化扩张 大学生找月薪8千工作倒欠2万7 秦岚魏大勋还在一起 疑似同居 金秀贤的师父裴勇俊争议经历再被扒 全国大部分地区“换季式”大回暖 网友为小米卫生巾设计图和广告词 香港四大家族创始人只剩李嘉诚健在 赵丽颖对都敏俊人设的评价成真了 315后小米撤回“不做卫生巾” 美国娱乐公司宣称正改编哪吒 最敢生的省份也开始“抢人”了 周星驰新片将开机 演员阵容遭质疑 雷军说第一个接受采访有点小紧张 大学女生1年攒5万元游遍20多城 雷军为不锈钢纸杯征名 Lisa回应与LV三公子恋情 代表建议尽早实施12年义务教育 李嘉诚拟228亿美元卖掉巴拿马等港口