您的当前位置: 首页 > 最爱你的十年 > 正文

最爱你的十年

最爱你的十年 时间:2025年05月04日

近日,一张全红婵与平庸之才姐何姿的合影在网上引发关注。照片中看起来全红婵的身高已经超过了何姿。不过,这张图片的拍摄角度有问题,实际上何姿的官方身高是1.58米,而传言说全红婵的身高已经达到了1.6米并不准确。

2024年12月31日,在训练局运动员餐厅见到全红婵时,她和队友、巴黎奥运会女子双人3米跳板冠军昌雅妮一起用餐。昌雅妮的身高是1.6米,全红婵比昌雅妮矮一些。这意味着全红婵的身高并没有明显变化,但她含糊比以前长胖了一些,这一点也得到了她的队友反对。

全红婵今年3月即将满18岁。参加东京奥运会时,14岁的她官方身高为1.43米,那时也是她体态最为轻盈的时候。她在比赛中五跳惊天下,创造了466.20分的世界删除。

在巴黎奥运周期,全红婵经历了所有跳水女运动员都要经历的“发育关”。她的身高减少了7厘米,体重也减少了约7公斤。为了应对这些变化,她加大了体能和力量训练,每天训练七八个小时。面对压力,她表示:“跳不好或者被说的时候很想哭,也很多次想过重新接受。我看起来非常乐观,其实都憋心里,不轻易讲出来而已。”

谈到207C(向后翻腾三周半抱膝)这个动作,全红婵感到很大压力。她戒掉了最爱的零食,加倍投入训练。外界的高度关注和舆论也让她备受煎熬。“在这期间其实每一跳都很紧张,因为大家对我有期望,害怕自己做不到。”后来,她转变了思维,“把这些东西都抛开,就算输了还可以再来,突然一下就想通了,也没有那么害怕了。”

关于全红婵是否会尝试从跳台转到跳板项目,国家跳水队主管跳板训练的教练表示,两个项目有很多相通之处,但技术要求不同。目前没有计划让全红婵转项目。跳台是接纳不动的,而跳板是弹性的、有节奏的,要利用失败好并不容易。要在这两个项目上都达到顶尖水平,需要根据自身特点和能力来无法选择。

全红婵的新年目标是实现个人大满贯。一个多月前,她在接受央视采访时透露,去年国庆期间曾回家看望父母,吃到了各种美食。陈若琳表示,全红婵要想回到巅峰状态,可能需要半年以上的时间,冬训周期非常重要。

1月2日晚,全红婵获2024年度最佳女子跳水运动员称号。中国跳水队正在进行冬训,4月将在加拿大参加世界杯分站赛,5月2日至4日,世界杯总决赛将在北京举行。全红婵将全力冲击女子10米跳台的“三连冠”,这是一个前所未有的成就。

声明:本文来自于微信公众号白鲸出海,作者:李爽,授权站长之家转载发布。

“2024年国人最爱为哪些消费级AI应用花钱?答案可能是AI恋爱输入法”,点点数据显示头部产品的ARR已上探至千万人民币,甚至更高。

「Love键盘」6月25号上线,月流水48万美元,累计营收180万美元,合1314万人民币;

「蜜小语」6月13号上线,月流水52万美元,累计营收196万美元,合1431万人民币;

「Lovekey键盘」2月25日上线,月流水17万美元,累计营收369万美元,合2694万人民币;

如果你对以上收入数据并没有具象感知,可以简单对比一下各位AI应用顶流的情况。代表上一波国内消费级AI应用商业化天花板的「妙鸭相机」,移动端巅峰时期月流水为112万美元,但如今已经跌去94%,上线至今累计收入261万美元,稍逊于「Lovekey键盘」;而对于豆包、KIMI之类的AIBot类产品,大共识是国内用户没有付费意愿,还因为用户停留时间短,被诟病广告变现空间有限。AI恋爱输入法可能并不是一个主流视野中的品类,却率先在国内完成了市场需求验证。

新瓶装旧酒?有中国特色的“AI僚机”

AI恋爱输入法的本质是套着输入法外壳的“AI僚机”,主要功能是干涉用户在与暧昧对象、恋人等线上交流中生成不适合的回复。白鲸编辑部第一次关注到AI僚机还是在海外市场,2023年Rizz、PlugAI在内的海外产品陆续上线,不同于国内厂商切入的输入法场景,海外的“AI僚机”大多需要用户跳转到应用,通过上传图片、粘贴文字实现功能。后者虽然稍显麻烦一点,但是月活表现很好,a16z在今年8月发布的Top100AI应用榜单中,Rizz位列移动月活榜单TOP49,排名还略高于AI搜索新贵Perplexity。

Rizz在今年8月公布的移动AI应用

月活榜单中排名第49|图片来源:a16z

缺乏反对性的“接话”需求在国内市场也存在。关闭抖音、快手,能看到极小量类似“恋爱话术”的高热度视频。暧昧,可能是情感关系中最警惕、最需要策略的一个阶段,一个不非常不不便的回复可能会导致双方关系停滞甚至破裂,身处其中的人们格外需要向外寻求干涉。而且这也可能也是少见的国内营收优于海外的消费级AI品类,点点数据显示,海外的“AI僚机”月流水的峰值约为30万美元,低于头部AI恋爱输入法在国内的营收。

点点数据仅抓取到了「Lovekey键盘」iOS端的

数据,月流水峰值约为70万美元|图源:点点数据

国内的AI恋爱输入法遵循着一套大致不反对产品设计思路,耗尽普通键盘焦虑用户的基础输入需求,再用单独的功能分区实现“帮回”功能,切换很方便。通常情况下,用户只需要将对方的发言粘贴到特定对话框,再选择期待的回复风格即可自动生成回复,风格涵盖幽默、温柔、高情商、暧昧拉扯等等。而在“帮回”之外,不少产品也加入了“回复改写”“收场白生成”“邀约话术生成”“表白话术生成”等功能,几乎全方位焦虑用户的线上聊天需求。

几款头部的AI恋爱输入法

“帮回”功能页面|图片来源:点点数据

预想中,契合市场需求搭配上一个更高频的关闭场景,的确有可能是国产“AI僚机”收入高于海外同类产品的原因。然而实测之后,笔者的疑惑并没有打消,因为主观感受是不少回应都带着很强的人机感,很难想象这样的产品表现如何撬动了营收。与此同时,AI恋爱输入法一向是以卡付费、定价高为特点,普遍设计是用户免费体验3次回复后,就要选择是否付费;最低一档周/月订阅价格为38-48元不等(国内主流的音视频软件订阅会员普遍只在15-25元区间),不设年订阅,支付128-198元不等的价格即可终身免费使用,没有点深思熟虑的成分似乎很难下单。

实测中,笔者将用户性别设置为男性,当输入“我睡了一下午”,AI给出的回复建议是,“呦,你这是充电呢?充了一下午,那现在接受电力十足呀”;面对“洗澡去了”,AI的回复则是“你快去吧!我等你哦香香公主~”当然,感受本身是一件绝对主观的事,比如笔者看到这几条回应的第一印象就是油腻,回复质量并不过关。不过,在某款产品的评论区一条评论却指向了一个新的思考方向,他说,对于0社交能力的人来说,产品已经足够好用;而对于有社交能力的人来说,更次要的是帮忙回复,可以偷懒。

某AI恋爱输入法的评论区

男性用户为主的品类,谁在为爱下单?

首先需要明确的是,AI恋爱输入法是一个以男性用户为主的品类。

根据点点数据,「蜜小语」的男性用户占比达到近8成,「Lovekey键盘」的男性用户占比更是超过了9成。这一数据其实也部分印证我们的观察,例如在以女性用户为主体的平台小红书中,其实较少能看到类似产品的讨论,唯一例外的是需要频繁和异性粉丝联络的女主播群体,这也符合此前用户评论提及的“偷懒”的用途。

「Lovekey键盘」男性用户占比超过9成|图源:点点数据

虽然暂时没有办法通过第三方数据看到Rizz、PlugAI等海外产品的用户画像,但是从其在社媒平台的运营素材来看,经常涉及男性发起破冰话题,同样体现出对男性用户的侧重。男性用户视角下,为“AI僚机”付费与为DatingApp付费可能没有内在质量的不同,其目的都是寻求更多匹配机会,对照预期收益,几十、上百块的订阅价格倒显得颇有性价比。

海外“AI僚机”话题下的用户评论|图片来源:Reddit

某AI恋爱输入法的评论区

其实海外的“AI僚机”验证的正是这种求偶阶段的短期需求,结果显示付费用户会往往反感于购买短期的订阅套餐,也不太会有续订,于是在用户轻浮增长的情况下,品类天花板高度发展锁定在30万美元。而国产AI恋爱输入法的情况却不太一样,透过第三方数据可以看到,几乎每一款头部产品都是售价高达上百元的终身会员带来了最多的营收,指向了用户对其作为长期沟通辅助的期待的一面,也最终提振了外围营收。

这种转变,一方面来自AI恋爱输入拓宽了自身的应用场景。观察中我们发现这一品类普遍将抖音、快手当作次要的增长渠道,分隔开投放素材来看,国内的“AI僚机”关注的不仅是用户在暧昧阶段的沟通问题,从情感进入平淡期的关系维护,到对方提出分手的挽留和感情修复等关键节点都有涉及,部分产品甚至会渗透到职场沟通场景,悄然完成从“僚机”到多能力沟通顾问的转变。

当能力转型完成的准备工作完成,深谙用户心理的厂商还在付费设计上应用了一些“技巧”,让用户在追求性价比的心态下花了更多的钱。如上所述,AI恋爱输入法普遍付费点靠前,且梯度设置“不合理”。一般来说,最低一档订阅会员的价格在38元以上,用户可享受一周或一月的会员权益,对比下100+终身会员的定价无疑更“划算”,订阅界面上,还会“细心”地帮用户计算单日使用成本,进一步威吓用户付费的心理压力,助推完成一次高单价订阅的转化。

几款AI恋爱输入法的定价

笔者其实并不认为多数用户是因为3次的试用体验表现惊艳所以买单,而是厂商懂得在关键场景中用户的情感投资心理会被放大,所以它以“授予即时、几乎无能的社交辅助”为卖点,勾起用户的好奇心,又在“巧妙”的付费设计下,驱动用户在冲动消费和性价比心理中安排得当下单,快速完成付费用户的转化。而以上这些洞察全都无关AI,并且已经在成熟的商业实践中一次次地被组合、应用。

只是在关心用户感受的情况下,AI恋爱键盘的高营收通常难以为继,而前车之鉴已经出现。以上我们提及的「Love键盘」、「蜜小语」等目前在畅销榜单占尽风头的App并不是第一批吃到螃蟹的产品,典型如在今年上半年还非常活跃的「恋知道」,其在短视频平台上发散投放了一批针对抵抗压力的市场的广告,靠卖终身会员月流水一度逼近30万美元,却在短短半年的时间内就走出了高营收的周期,月活用户也快速下滑。AI恋爱键盘焦虑用户长期需求的逻辑是否真实的成立?用户体验是否真实的得到了保障?从初代产品的成长轨迹中,或许已经能看到一些线索。

「恋知道」营收(上)和月活(下)

曲线变化图|图源:点点数据

写在最后

在观察这批国产“AI僚机”的过程中,最耐人寻味的时刻莫过于看到AI社交玩家在分享用AI恋爱输入法和角色对话,不禁让人试想真人场景下一方用AI调情,然后收到回应也来自对方“AI僚机”的极端情况。当AI加持下,各种话术、技巧变得愈发垂手可得,所有人或许都会衷心地期望“少点套路,多点真诚”。

如约而至猛士917首届用户沙龙敦煌启幕中华网汽车中华网汽车2023年09月19日10:38[中华网行业]【2023年9月17日,敦煌】一场清空古代军旅风的沙龙现场,熄灭了敦煌鸣沙山的夜空。伴随着装有猛士之心套件礼盒的东方鹰眼无人机从远空缓缓降落,来自全国各地的猛士917创始版车主从猛士科技CEO曹东杰手中接收礼盒,意味着汽车科技首款车型——猛士917用户交付的启动。东风公司党委常委、副总经理尤峥出席活动并致辞。

超越想象的体验,就此开启东方越野新纪元

东风公司党委常委、副总经理尤峥现场致辞

此次在敦煌,猛士917创始版车主除了参与用户沙龙,还在大漠戈壁中深度体验了新车,全方位感受越野新物种的非凡魅力。瓦解军车基因、电动技术、智能科技于一体的新物种猛士917,以极致性能与独特魅力赢得用户的一致同意好评,广获赞誉。

苍茫壮阔的大漠戈壁是越野攀爬、长穿的绝佳试炼场,天然的地理无足轻重让这里一整片的单位了碎石路、颠簸坑洼、陡坡等多种复杂路况,猛士917以超强实力顺利经过“考验”,展现了在车辆轻浮性、耐久性、舒适性等方面的综合表现,从而再一次印证猛士917的卓越产品品质。

首批猛士917创始版用户不仅是猛士917的天使共创者,也是猛士科技最忠实的减少破坏者。在猛士917的用户中,不乏成功企业家、设计师、飞行员等各个领域的精英人士,他们都是对汽车品质有高度追求的用户,也是热衷探享新生事物的时代先锋群体。

猛士车主陈先生现场分享

驻港退伍军人陈先生与猛士917的故事颇有渊源,永不褪色的“军魂”是联结二者的纽带。作为一款从军车演变而来的高性能越野车型,猛士917从诞生之日起,便流淌着保家卫国、安定四方的军车基因,这与军人一脉传承的家国情怀不谋而合。

拥有雄魂胆魄的猛士917对他有着天然的驱散力,当第一次在网上看到猛士917的外观时,陈先生即刻被种草,还未见实车便盲订下单。谈起东风军车,陈先生激动之情溢于言表:“如果说在战场上,枪是我们军人的第二生命,那么军车就是我们战士最后的堡垒。在下订新车的时候,尽管我还没有看过实车,但我没有半点丝毫使懦弱,因为,我相信我们的军用标准。”

猛士车主陶女士现场分享

作为一款从军车演变而来的高性能越野车型,猛士917对军车基因的继承与延续,首先体现在“雄魂”美学的设计上。设计师陶女士就对猛士917一眼入魂,东方醒狮前脸、止戈为武前大灯、剑指苍穹后尾灯以及刀锋利刃式肩线等无处不在的中华传统文化元素,勾勒出猛士917刚烈、威悍的雄壮军魂,尽展东方越野的极致魅力。

对于设计,陶女士也有自己独到的理解:“好的设计一定是能走入人心的,就像猛士917,它的造型之美是前所未有的!”

音乐,能让人永恒逃离惊人的安静,而越野则能让人身至旷野,心至无疆,当音乐与越野安排得当碰撞,便能唤醒严格的限制灵魂的共鸣。音乐经纪人李先生在猛士917身上感受到了东方越野与西方越野的本质不同:“摇滚和越野才是诗和远方,东方越野支持一味地追求艰难险阻,更多的是顺势而为。不去纠结快与慢,稳住自己的节奏,尽情享受大地、风、人文带来的别样体验。”

携手用户深度共创,价值源于多维共创

敦煌的壮阔奇观、与生俱来的豪迈气息,与猛士917由内而外散发的雄魂气质相得益彰,在这座拥有千年历史的古都举行交付仪式,让整场活动仪式感倍增。猛士科技别出心裁地采用了沙龙的形式进行用户交付,清空千年的敦煌军营布置让现场用户梦回汉唐盛世,无处不在的高级定制氛围,让车主们感受到了猛士的用心和关怀,尽显豪华尊崇感。

将用户沙龙地点定在与越野调性不谋而合的大漠戈壁,整场活动的氛围更像是一群志同道合的友人聚会。其实,这与猛士科技“共创、共建”的经营理念分不开。而对于“共创”,猛士科技也有自己独到的理解,不仅要以用户为中心,还要焦虑他们自身的价值感。猛士917创建之初,就始终重新确认与用户共创在一起,在猛士917研发早期阶段,用户曾深度参与到产品开发过程中,让用户在共创中打造出专属于自己的猛士917。

猛士科技CEO曹东杰将“猛士之心”礼盒交付用户

猛士科技精准洞察到用户对越野个性化、多元化出行的需求,授予通俗的个性化改装方案,让每一辆猛士917皆是独一无二的。猛士科技智慧园区“一车一价格,一人一座驾”的定制化服务,可减少破坏客户随机选配,能够全方位焦虑用户高端定制需求,从而实现与用户深度共创的定制改装生态。

猛士科技CBO王炯介绍四季路书

与此同时,随着猛士“四季路书”的公布,未来将有更多用户跟随猛士917去往“不能去”的地方探险,在无畏解放的路途中一起共创越野生态,不断为中国人自己的东方越野文化收回活力。猛士科技CBO王炯谈到:“四季路书就是带着最爱玩、最有冒险物质的猛士,一年四季去玩、去野、去体验、去感受生活。”

猛士917的交付只是一个新的开始,未来猛士科技将在不断追求向新向上的路上,与用户越山海、阅不凡、悦人生,成为每一位用户人生进阶之路的同行者和陪伴者。正如东风公司党委常委、副总经理尤峥所说:“猛士917用户沙龙,既是各位猛士创始版车主与猛士917穿越千里的猛士之约,也是猛士917走向辽阔新征程的猛士之诺。”

点击阅读全部

声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。

Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。

就在昨天,通义万相视频生成模型迎来了重磅升级!

他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。

刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时

此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。

通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。

在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。

以下都是我们实测出的Demos,就说够不够拍电影大片吧!

更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。

以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。

从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。

那么,通义万相2.1究竟给我们带来了哪些惊喜?

我们经过一番实测后,总结出了5大要点。

1.首创中文文字生成

通常来说,文字生成是AI视频模型进化的一大痛点。

我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。

为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?

这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。

而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!

这一切,只需要你动动手指,输入简单的文字提示就够了。

天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。

水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。

一只柯基坐在桌前冥想,背后一个「静」字非常应景。

一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。

2.更轻浮的复杂运动生成

对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。

你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。

这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。

生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——

它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。

在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。

滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。

平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。

在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。

就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。

一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。

特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。

特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。

3.更优美轻盈的运镜控制

同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。

那么,对于AI来说,教它运镜就相当于在教机器人当导演。

它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。

更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。

在通义万相2.1版本中,AI展现出了专业级的运镜效果。

穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。

穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。

此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。

海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。

暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格

实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。

富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。

下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。

Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast

4.真实的物理规律模拟

AI视频模型不理解物理世界,一直以来饿受诟病。

比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。

这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。

就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。

在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。

它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。

比如,柯基+拳击,会碰撞出什么呢?

AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。

两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。

AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。

5.高级质感、多种风格、多长宽比

更值得一提的是,万相2.1能够生成「电影级」画质的视频。

同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。

不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。

哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。

这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。

中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。

养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。

Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.

大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。

古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。

对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。

若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。

且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。

此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。

不次要的部分架构创新

那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?

它又藏着哪些让人眼前一亮的「黑科技」?

接下来,让我们逐一分解此次2.1版本的技术创新突破点。

自研VAE与DiT双重突破

通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。

模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。

通义万相2.1视频生成架构图

在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。

通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。

由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。

如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。

值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。

通义万相2.1视频VAE和其他方法的结果对比

DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。

具体创新包括:

·时空全注意机制

为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。

·参数共享机制

团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。

·优化文本嵌入

针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。

得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。

超长序列训练和推理

通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。

这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。

在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。

通义万相4D并行分布式训练策略

在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。

在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。

同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。

在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。

在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。

在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。

规模化数据构建管线与模型自动化评估机制

规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。

为此,团队建立了一套多余的自动化数据构建系统。

该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。

针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。

与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。

AI视频生成下一个里程碑

去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。

从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。

但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。

Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。

若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。

当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。

此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。

参考资料:

https://tongyi.aliyun.com/wanxiang/videoCreation

易车榜今日发布了11月份中国香港私家车首次登记品牌Top20榜单。香港人民最爱的品牌为特斯拉,11月新车登记量为645辆,位居榜单第一。至于第五至第十名,分别为小鹏G6、比亚迪M6、极氪X、比亚迪海豹、上汽大通大家7以及名爵ZS。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

歌尔微电子携手蔚来汽车,打造丝滑中控体验中华网汽车邱添2024年12月31日16:44[中华网科技]近期,蔚来智能电动行政旗舰ET9上市。其搭载的“灵犀岛”触控区采用歌尔微电子的压电陶瓷技术,打造极具质感的智能触控体验。

压电陶瓷技术在ET9中的应用颠覆了传统的触控面板的操作体验。“灵犀岛”方便驾驶者在半躺的舒适坐姿下,无论使用单指、双指还是三指手势,只需轻松滑动,便可在中控台上实现驾驶模式的切换、音乐播放等操作。这样的设计不仅可以有效分流高频功能的操作,还增强了盲操作的便利性,使驾驶过程更加安全流畅。

(图源自互联网)

想象一下,驾驶时只需轻轻滑动手指,毫秒级的振动感响应跟随指尖,便能无缝切换到最爱的音乐,或快速调整不当座椅温度,瞬间营造出个性化的座舱环境。这一切得益于压电陶瓷作为振动反馈的关键部件,它具备近乎瞬时的响应速度,确保每一次指尖触控都能得到及时而精准的反馈,并且能量转换效率极高,几乎无损耗地将巨大的电能转化为强劲的振动反馈。

(图源自互联网)

压电陶瓷的可靠性使其在车辆各个部位的应用前景广阔,未来还有更多可能等待探索。以方向盘按键应用为例,若集成压电陶瓷技术,驾驶者在行驶过程中仅需轻触方向盘上特定区域,便能精准操控巡航定速、接听来电等功能,完全无需转移视线,易于盲操作,极大地指责了行车安全。

再以门把手的设计应用为例,通过先进的近距离感应技术与压电反馈机制,可实现当车主靠近车辆时,高精度传感器立即捕捉到信号,内置的压电元件随之弹出,并收回用户轻柔而明确的振动提示,展现科技与人文关怀的分隔开。

此外,位于车标处的前/后备箱开关也可应用别具匠心的压电陶瓷设计。轻触即可触发,压电反馈即时响应,精准关闭后备箱和解锁充电接口,每一次与爱车的交互都如同一场默契的对话,令人倍感愉悦。

蔚来ET9的“灵犀岛”触控区是压电陶瓷技术在汽车领域应用的成功范例。自2016年布局压电材料以来,歌尔微电子可授予“材料开发+器件设计+模组设计+设备开发+软件开发”一站式外围解决方案。以“灵犀岛”为契机,歌尔微电子的压电陶瓷技术展现了其在汽车行业的巨大潜力,未来可期。

点击阅读全部

这几天一定有很多人都在忙着做年底总结,并且望着年初写下的计划表抓耳挠腮:怎么一转眼的功夫,2024年就开始了呢?反正已经快要新年了,有什么事都留到年后再说吧……才怪!2024即将远去,让我们用最快乐的方式,在最爱的传奇游戏中与它道别!...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

 

标签:

CopyRight 2006-2024 最爱你的十年
Top