开博体育最新测评：美图大模型提前揭秘这波风格化美到窒息

栏目：公司动态发布时间：2024-10-07

　开博体育几乎同一时间，美图公司也突然宣布，自家的奇想大模型（MiracleVision）视频生成能力已完成全面升级。　　具体而言，它不仅单次文生视频时长、单次图生视频时长均达 5 秒，还支持 1 分钟、帧率 24FPS、分辨率 1080P 的超长视频生成。　　还有最惊艳的中国风。一位古风美女，忽闪着俩大眼睛，眉一挑，手一摊，脸上露出骄傲不屑的神情。　　目前，美图奇想大模型全新视频生成能力已在M

　　开博体育几乎同一时间，美图公司也突然宣布，自家的奇想大模型（MiracleVision）视频生成能力已完成全面升级。

　　具体而言，它不仅单次文生视频时长、单次图生视频时长均达 5 秒，还支持 1 分钟、帧率 24FPS、分辨率 1080P 的超长视频生成。

　　还有最惊艳的中国风。一位古风美女，忽闪着俩大眼睛，眉一挑，手一摊，脸上露出骄傲不屑的神情。

　　目前，美图奇想大模型全新视频生成能力已在MOKI上线，后续将逐步覆盖到美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE等产品。

　　接下来，我们将从写实、动画、国风、风格化、人像等维度，对它来一个全方位的测评。

　　AI 生成写实视频时，经常会遇到肢体变形、动作卡顿等问题，而美图的奇想大模型在复杂 3D 时空精准重构基础上，视频生成能够重现真实物理规律，支持大幅度流畅运动。

　　例如，这段 Sora 的经典 Prompt，就是对大幅度流畅运动的考验：

　　一辆白色的越野 SUV，疾驰在蜿蜒的崎岖山路上，周围是郁郁葱葱的灌木丛。

　　奇想大模型不仅完美遵循文字指令，还体现出诸多小细节：通过车后泛起的尘土体现越野车的速度，逆光拍摄时画面出现的光斑等。

　　再比如，Prompt：稳定拍摄的运动镜头，在户外的一只棕色皮毛的小松鼠开博体育，从画面的右边一路向右边跳跃，动作敏捷。

　　这只身手矫健的松鼠，前肢抬起，后肢发力，腾空跳跃，四只爪子配合协调，尾巴随之摇晃，触碰到的树叶也会弹动。

　　我们输入 Prompt：一只手平稳地将银色水罐中的牛奶倒入透明高脚杯中。

　　奇想大模型正确模拟了牛奶从容器中倒出、流动和最终落入杯中的过程。动作在时间上保持连贯，牛奶的流动没有出现突然的中断或不自然的加速，并且正确模拟出液面的上升和下降。

　　花朵开放有一定生物学规律，并且需要理解和表现出延时摄影被压缩的时间感。奇想大模型生成的视频，不仅真实，还捕捉到动态的花瓣伸展的细节。

　　Prompt：航拍镜头，从空中俯瞰到一群活力四射的骏马在一片辽阔的大地上飞驰而过，鬃毛和马尾随风飘扬。

　　近 20 匹毛色各异的骏马，驰骋在一望无际的草原上，它们四蹄翻飞，鬃毛和尾巴随风飘扬，还展现出优美的肌肉线条。

　　即使是多主体、大幅度运动，奇想模型生成的画面仍表现稳定，几乎无虚化扭曲。

　　我们继续输入 Prompt: 一只戴着红项圈的橙色虎斑猫坐在床上，正看着熟睡在蓝白条纹羽绒被下的女生。

　　奇想大模型生成的画质清晰，猫咪毛发透着光泽，胡须根根分明，女主人手指也没有明显的 bug，甚至它还生成了人物由于侧躺产生的脖颈上的皱纹。

　　随着镜头缓慢推进，猫咪转过脑袋，项圈上的金属环也随之摆动，其动作自然连贯。

　　比如 Prompt：静态广角镜头，在一个日常生活的家中，一只棕色的小狗坐在扫地机器人上随着它移动，在家中打扫卫生。

　　在这段文字指令中，既有镜头的要求，还有主体、动作以及场景的限制。奇想大模型均 get 到了。

　　在这个低机位广角镜头中，一只小狗坐在工作着的扫地机器人上，左瞅瞅右看看。

　　镜头随着扫地机器人的运行轨迹而移动，扫摄到房间里的沙发腿、略显杂乱的飘窗等，要不是画面开始右上角人物的脚有些别扭，真以为是实拍开博体育。

　　这只变色龙的特写镜头中，其眼珠转动，嘴巴微张，以此来体现其警惕的神态，而且变色龙颗粒状、粗糙的皮肤也生成得很逼真。

　　（Prompt：特写镜头，一只身上有绿棕色条纹的变色龙栖息在一根树枝上，它的目光充满警觉性，盯着镜头。）

　　（Prompt：寒冷的冬天，一只鹿站在结霜的田野里，远处有蓝天、枯树和山脉，四周很宁静，鹿的皮毛上沾满了雪，它竖起了耳朵警觉地凝视前方，接着转身向田野远方走去。）

　　众所周知，制作一部精美的动画，那是相当费时费力，即使是宫崎骏这样的大师，也不例外。

　　《你想活出怎样的人生》耗费 7 年之久，《起风了》打磨了 2 年，仅关东大地震的 4 秒镜头，宫崎骏就「死磕」了 1 年零 3 个月。

　　就拿奇想大模型来说，曾经一个团队需要吭哧吭哧干几个月的活儿，现如今，只需上传一张图片，或者输入一段提示词，它几分钟就搞定。

　　例如，我们输入提示词：动画风格，一个小男孩和一个小女孩正坐在树下吃西瓜。

　　他们捧着半拉西瓜，红色的果肉在阳光下显得格外诱人，还有西瓜籽点缀其间。画风温馨治愈，极具美感。

　　小女孩拿起一块面包，然后将其丢到另一只手上，虽然动作幅度较大，但画面并没有崩坏。

　　奇想大模型生成的国风动画中，女孩身着中国传统服饰、梳着结鬟式发髻，身后古朴的木屋也有着中国独特的韵味。

　　同时，它对于细节的处理也相当精细，人物表情灵动，服饰纹理细腻，甚至还能模拟出光照和色彩的自然过渡。

　　主角表情变化自然，先是表情严肃，微微转动眼珠，继而嘴角挤出一抹神似华妃的「皮笑肉不笑」，肢体动作也很流畅。

　　画面中，山间云雾缭绕，瀑布从山崖飞流直下，清流激湍，身穿飘逸长袍的侠客站在岩石上潇洒转身，动作丝毫不僵硬。

　　凭借在影像领域的长期深耕，美图在风格化方面有着得天独厚的优势，实现了在艺术风格、细腻画风、细节把控之间的高度平衡，具备强大的风格泛化力与兼具艺术审美的视觉表现力。

　　比如毛毡风格，丧眉耷眼的小浣熊，摇头晃脑地自说自话，背景自然虚化，但隐约能看到满树桃花随风晃动。

　　要知道，不少 AI 视频模型在模拟毛毡的视觉效果时，对于纹理和光影效果的处理稍显欠缺，而奇想大模型生成的视频，画质清晰稳定，毛绒感细腻。

　　即使画面出现多个主体，也能实现风格的整体统一，哈巴狗和后面的小动物们，反应各异，但动态效果流畅连贯，并未出现视觉上的跳跃感。

　　衣服的褶皱，屋顶垂下来的电灯，墙上挂的画框和杂物，以及窗台上的绿植，都生成得极具美感，尤其是那把吉他，非常逼真。

　　美图的奇想大模型还能根据文本或图像，生成逼真的人像视频，这为影视制作、广告创意、时尚行业以及多媒体艺术创作打开了一扇新的大门。

　　在奇想大模型生成的正面人像视频中，戴着牛仔帽的两个男子坐在车里盯着镜头，身体随着汽车的颠簸而晃动。

　　梦幻般的森林中，一道道柔和的光线从树缝中洒下，俊男美女站在光束下深情拥抱，周围落叶纷飞。

　　去年 6 月，美图奇想大模型上线，经过一年时间的迭代，目前已更新至 V5 版本，并升级为 Diffusion 与 Transformer 模型结合的全新技术路线，采用 DiT 视频生成架构。

　　在新的技术路线下，相较业界先头兵，美图奇想大模型选择优先攻克更具挑战性的问题。

　　此次升级，该模型在技术层面上解决了主体一致性、运动连贯性、物理逻辑合理性等视频生成能力落地的核心问题，并逐步嵌入多款产品中。

　　看完以上这 5 大维度、30 段绝美实测视频，大家觉得美图奇想大模型实力咋样？评论区畅所欲言吧。

上一篇：开博体育照顾宝宝需要注意哪些细节

下一篇：开博体育闭店倒计时！知名商场即将闭店！商品低至1折！

联系方式

CONTACT US

开博体育·(KB)官方网站

联系地址：上海市金山区亭林镇林宝路39号8幢Z20室
电话：021-31265561
传真：021-31265561
手机：021-31265561
Q Q：31265561
邮箱：info@yvyue.cn

姓名

电话

邮箱

内容

提交

TOP