新娘无悔的爱第二部:原班人马回归,经典爱情再度升华!
大家今天跟大家唠唠我最近在搞的“新娘无悔的爱”第二部,这可不是啥言情剧哈,是我自己捣鼓的一个AI项目,主要就是用AI来生成新娘主题的图片,然后搞点小互动啥的。第一部反响还不错,所以这回就想玩点更花的。
最初的想法:
我就寻思着,现在AI绘画这么火,能不能让大家自己定制新娘形象?比方说,输入一些关键词,像“古典”、“优雅”、“现代”之类的,AI就能生成符合你要求的新娘图。这样一来,想过过当新娘瘾的,或者想找点婚礼灵感的,不都能来玩玩嘛
技术选型:
这块儿我纠结好一阵子。Stable Diffusion、Midjourney、DALL-E 2,我都试个遍。还是觉得Stable Diffusion最灵活,可定制性强,而且开源,方便我二次开发。至于编程语言,Python肯定是首选,谁让它库多!
具体步骤:
- 数据收集: 我先是疯狂地搜集各种新娘的图片,从婚纱照到婚礼现场,能找到的都扒下来。然后人工筛选,把那些质量差、风格不统一的都踢掉,留下大概几千张。
- 模型训练: 接着就是重头戏——模型训练。我用收集来的图片,对Stable Diffusion进行微调。这过程可太痛苦,显卡跑得呼呼的,电费蹭蹭往上涨。好在跑几天,总算出个能用的模型。
- 界面开发: 为方便用户使用,我还做个简单的Web界面。用Flask搭建的,简单易上手。用户可以在界面上输入关键词,选择风格,然后点击生成按钮,就能看到AI生成的新娘图。
- 互动功能: 这回我想加点互动功能,让用户不光能看图,还能玩起来。我打算做一个“新娘换装”的小游戏,用户可以把自己喜欢的婚纱、发型、配饰拖拽到新娘身上,看看效果。这部分还在开发中,到时候再跟大家分享。
踩坑记录:
- 模型训练太慢: 一开始我直接用CPU跑模型,那速度,简直慢到怀疑人生。后来换GPU,速度才提上来。所以说,搞AI,硬件很重要!
- 生成图片质量不高: 刚开始生成的图片,要么是五官扭曲,要么是颜色失真。后来我调整训练参数,加大数据集,才慢慢改善。
- 界面交互不友 我自己觉得界面挺好看的,结果给朋友试用,他们说太复杂,不知道怎么操作。看来用户体验这块,还得好好研究。
目前进度:
目前模型训练基本完成,Web界面也搭建好。互动功能还在开发中,预计下个月能上线。到时候我会把项目代码放到GitHub上,大家有兴趣可以一起玩。
这回“新娘无悔的爱”第二部,对我来说是一次不小的挑战。从数据收集到模型训练,再到界面开发,每一步都充满困难。但也是一次很有趣的经历,让我学到很多新的东西。希望我的分享能给大家带来一些启发,也欢迎大家多多交流!
由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权,根据《信息网络传播权保护条例》,如我们转载的作品侵犯了您的权利,请您通知我们,请将本侵权页面网址发送邮件到qingge@88.com,我们会做删除处理。