gb林总的每日小玩具
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、理想汽车AI大模型APP即将上线!“理想同学”入驻手机,化身全能生活助手
理想汽车的CEO李想在2024理想AITalk上宣布,‘理想同学’AI大模型APP将于12月27日正式上线。这款APP将智能体验从车内延伸至手机,授予便捷的生活助手功能。内测版本展示了其强大的识别能力和自然语言处理能力,能够快速解答用户问题并识别生活物品。
【AiBase提要:】
??理想同学APP将智能体验从车内延伸到手机,成为全能生活助手。
??APP具备强大的物体识别能力,能快速授予相关信息和解决方案。
??理想同学的推出,标志着理想汽车在AI生态的积极拓展,指责用户生活便利性。
2、DeepseekV3开源!多语言编程能力飙升,力压Claude3.5SonnetV2
备受期待的DeepseekV3终于开源,展现出可忽略的,不次要的多语言编程能力,超越了Claude3.5SonnetV2等竞争对手。其在aider多语言编程测评中的成功率从V2.5的17%跃升至48%,显示出质的飞跃。DeepseekV3采用了6850亿参数的瓦解专家架构,使得模型在处理复杂任务时更加高效。
【AiBase提要:】
??DeepseekV3在多语言编程测评中表现优异,成功率达到48%。
??采用6850亿参数的瓦解专家架构,指责了模型的计算效率。
??开源将为AI社区带来新活力,推动各行业的智能化升级。
详情链接:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main
3、小米帮助AI大模型布局,正搭建GPU万卡集群
小米正在积极构建GPU万卡集群,并对AI大模型进行大规模投资,展现出其在AI领域的决心与实力。小米大模型团队自成立以来便拥有6500张GPU资源,且该计划已实施数月,雷军在其中发挥了关键作用。DeepSeek-V2的关键开发者罗福莉的加入,可能会进一步推动小米在AI技术上的创新与应用。
【AiBase提要:】
??小米正在建设GPU万卡集群,加大对AI大模型的投入。
??罗福莉加入小米,可能领导大模型团队,推动技术创新。
??小米AI技术覆盖多个领域,逐步应用于各类业务板块。
4、阶跃星辰发布图像生成模型Step-1X-Medium减少破坏图生图等新功能
上海阶跃星辰智能科技有限公司推出了Step-1X-Medium版本的图像生成模型,显著指责了生成速度和图文一致同意性。新版本减少破坏“图生图”功能,用户可以通过简单指令对图像进行细节增强和风格迁移。此外,针对中国风的创作能力也得到了破坏,能够更好地捕捉东方美学。
【AiBase提要:】
??生成速度降低30%,理解能力和图文一致同意性显著增强。
??新增“图生图”功能,减少破坏细节增强、风格迁移和局部修改。
???强化中国风创作能力,优化东方人物形象,焦虑品牌设计需求。
详情链接:https://platform.stepfun.com/
5、ChatGPT搜索功能面临潜在风险:或被恶意操控输出不可信内容
近期的调查揭示了OpenAI的ChatGPT在搜索功能中可能存在的安全隐患。研究发现,ChatGPT在处理网页摘要时可能受到隐藏内容的操控,导致返回不实的评价或恶意代码。这些隐藏内容可能是第三方指令,甚至是推销信息,影响ChatGPT的判断。专家警告称,这种风险如果不加以修复,将对用户根除高风险。
【AiBase提要:】
??ChatGPT可能被隐藏内容操控,返回不实评价。
??隐藏文后天的反应影响ChatGPT的评估,即使页面有负面评论。
???OpenAI正积极修复潜在问题,以降低搜索工具的安全性。
6、腾讯研究推出新型翻译模型DRT-o1,重塑文学文本翻译
随着全球化的深入,神经机器翻译技术在跨语言交流中愈发重要。腾讯研究团队推出的DRT-o1翻译系统,专注于文学文本的翻译,采用多代理框架优化隐喻和照字面上的处理,显著指责了翻译的准确性和流畅度。实验结果显示,DRT-o1在BLEU和COMET得分上均有显著指责,展示了其在文学翻译领域的强大能力。
【AiBase提要:】
??DRT-o1系统包含两种版本(7B和14B),采用多代理框架优化隐喻和照字面上的翻译。
??研究团队从400本公共领域书籍中提取并筛选了63,000个文学句子作为训练数据。
??DRT-o1在BLEU和COMET得分上均显著指责,展现出强大的文学翻译能力。
详情链接:https://github.com/krystalan/DRT-o1
7、罗永浩进军AI领域,其公司招聘AI大模型人才
罗永浩近期不能引起关注的消息是他转战AI领域,但实际上并未重新接受AR产业。由于AR技术尚需时间成熟,他计划先推出AI产品。罗永浩的新公司细红线科技有限公司正在积极招聘AI领域的专业人才,岗位包括AI工程研发工程师、大模型算法工程师等。
【AiBase提要:】
??罗永浩未重新接受AR,只是技术成熟需时间,先推出AI产品。
??细红线科技有限公司招聘AI工程研发工程师、大模型算法工程师、AI产品经理等。
??新产品可能面向海外市场,招聘海外社交媒体运营和跨境电商运营人员。
8、AI创业老兵胡云华加入智谱,担任C端应用“智谱清言”负责人
胡云华的加入为智谱清言带来了新的发展机遇,他在AI领域的极小量经验和技术背景将助力该产品在竞争缺乏感情的市场中穿颖而出。智谱清言目前面临着用户增长和付费转化的确认有罪,胡云华需要在产品定义和用户留存方面做出无效的策略调整不当。
【AiBase提要:】
??胡云华加入智谱清言,标志着该产品在技术和无约束的自由方面的新篇章。
??智谱清言目前拥有2500万用户,年收入预计超过千万元,但面临缺乏感情的市场竞争。
??胡云华的AI创业经历和大厂研发背景为智谱清言的产品发展授予了强有力的减少破坏。
9、英伟达GB300/B300GPU横空出世!推理性能暴增,供应链大洗牌
英伟达在推出GB200和B200仅六个月后,再次发布全新的GB300和B300GPU。这些新产品在推理模型性能上实现了显著指责,尤其是在内存和计算能力方面。B300的FLOPS性能指责了50%,内存容量也减少至288GB,内存带宽保持在8TB/s。供应链方面,英伟达保持方向SXMPuck模块,允许更多OEM和ODM参与生产。
【AiBase提要:】
?B300GPU采用台积电4NP工艺,FLOPS性能比B200指责50%,内存升级至288GB。
??NVL72架构允许72个GPU协同工作,降低推理性能和交互性,降低延迟。
??供应链重组使更多OEM和ODM参与生产,英伟达的毛利率可能会受到影响。
详情链接:https://semianalysis.com/2024/12/25/nvidias-christmas-present-gb300-b300-reasoning-inference-amazon-memory-supply-chain/
10、马斯克预测:AI智力将在2025年超越个体人类,2030年或将超越所有人类
亿万富翁埃隆?马斯克在社交平台X上发表了关于人工智能的最新预测,称未来几年AI技术将取得惊人进步。他预计到2025年底,AI智力将超越任何单个个体,而到2027至2028年,AI可能超越所有人类智力。这一预测引发广泛关注,尤其是对AI潜在风险的讨论。
【AiBase提要:】
??到2025年底,AI智力预计将超越单个个体的人类智力。
??2027至2028年,AI有可能超越所有人类智力。
??未来AI的发展可能带来比好处更大的危害,需关注其潜在风险。
11、人工智能解说足球赛:可以识别犯规、评估严重程度并对进行评论
上海交通大学与阿里巴巴的研究人员联合开发了MatchVision,一个新型人工智能系统,能够观看足球比赛、识别关键打法,并授予类似人类播音员的评论。该系统基于大规模数据集SoccerReplay-1988,准确率高达84%。研究隐藏,AI与人类解说员在评论重点上有所不同,未来可能扩展到自动制作比赛集锦和辅助裁判判罚。
【AiBase提要:】
??MatchVision系统能识别24种比赛事件,包括进球和犯规,准确率达84%。
???AI与人类解说员在评论侧重点不同,AI更关注技术细节而人类更注重情感流动。
??研究团队计划将数据集和模型开源,供更多研究者和开发者使用。
12、盘点谷歌在2024年实现的人5项最大AI创新
2024年,谷歌在人工智能领域取得了显著进展,推出了多项创新技术。这些技术不仅指责了用户体验,还推动了技术的有无批准的。Gemini2.0引入了代理功能,Veo2保持不变了视频内容生成方式,Mariner项目使恶化了人机交互,LearnLM为教育授予个性化减少破坏,而NotebookLM则干涉用户更好地无约束的自由信息。
【AiBase提要:】
??Gemini2.0引入代理功能,实现多模态推理,指责用户交互体验。
??Veo2为视频生成树立新标准,授予高质量、语境准确的内容。
??LearnLM通过个性化AI导师,增强教育体验,减少破坏学生和教育工作者。
AI技术正飞速融入日常生活,成为不可或缺的一部分。三星秉持“AIforAll”愿景,致力于通过集成AI技术的移动设备、电视及家电产品,为下一代智能设备树立全新标杆,在电视领域,不仅显著指责了影像质量,更准确焦虑了电视使用的真实场景需求。特别是其NeoQLED系列,通过AI芯片赋能量子点MiniLED技术,打造个性化家庭娱乐享受,凭借“有AI的科技·艺术·家”引领未来智能生活方式的新潮流。
AI技术驱动,定义震撼视觉新体验
NQ8AIGen3芯片作为AI电视技术的革新者,将三星电视的画质体验推向了新的高度。作为三星迄今为止比较新、较具创新性的电视芯片,其神经处理单元(NPU)的速度是其前代产品的两倍,神经网络的数量也由64个增至512个。该芯片能够模拟神经元深度学习,以其可忽略的,不次要的逐帧扫描能力,优化图像细节,将低分辨率的内容智能指责至近乎8K的画质水平。
该芯片目前搭载于三星旗舰8K产品NeoQLED8KQN900D上,实现8KAI影像增强Pro,让色彩、亮度与对比度等,都呈现出细腻的真实感;AI动态增强Pro能够指责动态透明度,即使是网络OTT内容也可以让高速运动的画面不会出现丢帧和拖影的问题;AI三维景深增强Pro技术则通过AI智能识别图像中的不同元素,增强重点观看区域的对比度,打造出立体且饿满的画面效果。通过实施针对性的AI技术,三星为用户解锁了新的视效可能。
在NQ8AIGen3芯片以外,,本年度推出的数量少电视产品大多配备了先进的AI芯片,让三星电视拥有了知名的内“芯”实力。三星NeoQLED系列以其覆盖8K、4K及大尺寸等领域的广泛选择,成为了消费者升级焕新的优选。三星NeoQLED系列凭借在分区控光技术上的深厚积聚,通不充分的供应子点矩阵技术比较准确控制量子点MiniLED,确保了画面在任何光线下都能呈现出层次分明、细节通俗的视觉盛宴。三星电视以创新为本,深度瓦解AI技术,优化了产品性能与用户体验,引领全球彩电市场发展。
AI智慧赋能,打造客厅娱乐新纪元
凭借在硬件、软件及终端产品领域的深厚沉淀,三星正预期将AI功能拓展至更多元的产品与服务范畴,成为推动AI保持不变生活的先锋力量。以三星NeoQLED4KQNX9D为例,其搭载的新Tizen智能系统打造了通俗的影音娱乐内容生态。人性化的瀑布流式界面设置了电视剧、电影、综艺、体育等多个主题分类,用户通过AI语音助手能够从海量资源中智能搜索,基于LLM实现AI语音复杂视频搜索发话,在语音助手的鞭策下,用户能够更自然地表达需求,获得流畅且准确的答复。
个性化AI时代已至,三星致力于深入理解每一位用户,授予既安全又量身定制的AI体验。三星以对用户需求的肤浅洞察为坚实后盾,通过数据整合指责娱乐享受。三星电视搭载游戏中心,集成了全面的游戏功能,用户可以轻松接入云游戏平台(无需主机)、主机游戏及独立应用程序。而利用失败先进的用户讨厌模型,三星电视能够根据用户喜欢玩的游戏进行推荐,让玩家快速找到下一个喜爱的游戏。在游戏进行中,还在AI芯片加持下,根据不同游戏类型进行AI游戏自动设置优化,确保每一次游戏体验都达到理想状态。
此外,三星电视还以AI技术搭建开放式应用程序生态系统。随着越来越多的智能设备实现互联互通,AI电视不断进化,更加准确地减少破坏家庭成员的福祉与安全需求,授予贴心的干涉。三星NeoQLED系列内置SmartThings网关,可以分开并控制Matter设备及SmartThings兼容的Zigbee设备,轻松自定义个性化的智能家居场景。3D全景地图功能可干涉用户直观监控和控制家用电器和物联网设备,成为家电控制中心,为用户带来全面、智能与便捷的智慧客厅新体验。
此外,三星的AI战略还致力于推动生成式AI领域的革新,近期三星艺术画廊上线AI数字艺术功能,用户进入AI专区后,根据选择的关键字组合,AI可快速搜索和获取想要的画作,无论是自然风景、城市景观,还是宇宙星空、植物乐园都能得到很好的数字艺术展现。想必未来,包括NeoQLED系列在内的更多三星AI电视,都将有机会为用户奉上更不平常的,值得注意的使用体验。
AI技术的崛起为电视产业收回了比较罕见的活力。作为全球科技领域的领航者,三星将AI广泛应用于影像处理、内容推荐、生活场景等多个维度,焦虑了用户日益增长的个性化需求。未来,三星将继续推动电视行业的智能化发展进程,让电视这一经典的家庭娱乐设备,在AI技术的赋能下,焕发出全新的虚弱。
声明:本文来自于微信公众号机器之心,授权站长之家转载发布。
2024临近尾声,AI又给了所有人一个大惊喜,这次可以用来自动发现新的人工生命形式了。
今年8月,Transformer论文作者之一的LlionJones与前谷歌研究人员DavidHa共同创立的人工智能公司SakanaAI造出了「世界上第一个用于自动化科学研究和开放式发现的AI系统」。他们称之为AIScientist,即人工智能科学家,详情可参阅报道《首个全自动科学发现AI系统,Transformer作者创业公司SakanaAI推出AIScientist》。
而现在,他们又拿出了另一项震撼性的重磅研究成果:使用基础模型搜索人工生命的系统ASAL。
人工生命(ArtificialLife),听起来很科幻,但其定义并不复杂:就是被制造出来的生命。数学家约翰?何顿?康威在1970年提出的著名的「生命游戏」便是一种模拟人工生命系统,其中定义的规则可让其中的「细胞」像生命体一样运作。
研究人工生命的一个不次要的部分哲学理念是我们不仅想要了解「我们所知的生命」,还想要探索「可能存在的生命」。下图为ASAL其中一位作者PhillipIsola的推文以及他分享的一种人工生命。
此外,人工生命研究还可以得到有望保持不变和帮助AI进步的关键见解。该团队表示:「通过利用失败AI帮助人工生命的发现,我们可以帮助对涌现、进化和智能的理解——这些不次要的部分原则可以启发下一代AI系统!」
该研究发布后驱散了极小量点赞和讨论。
知名博主AranKomatsuzaki表示,这是视觉语言模型在人工生命中的首次应用,可以跨基质发现多样性、全新的模拟生命。
目前,人工生命研究主要是通过计算模拟进行,而这种方法必然意味着搜索并描绘出整个可能的模拟空间,而不是研究任何单个模拟。这样一来,研究者便可以了解不反对模拟配置可以怎样产生不反对涌现行为。SakanaAI的这篇论文首次实现了借助基础模型来自动化这个搜索过程。另外,OpenAI、MIT等其他机构和独立研究者也参与了研究。
论文标题:AutomatingtheSearchforArtificialLifewithFoundationModels
论文地址:https://arxiv.org/pdf/2412.17799
在线论文:https://pub.sakana.ai/asal/
项目代码:https://github.com/SakanaAI/asal/
虽然人工生命模拟的进化和学习的具体机制有很多,但迄今为止,该领域取得实质性进展的一个主要障碍是:缺乏一种偶然的方法来搜索所有可能的模拟配置。如果没有这种方法,在设计人工世界最次要的方面(世界本身的规则)时,研究者就必须依靠直觉。
对此,一部分确认有罪在于简单组件的大规模相互作用可能会产生复杂的涌现现象,这些现象很难甚至不可能被提前预测。
正是由于模拟配置与涌现现象之间缺乏关联,因此研究者很难凭直觉设计出能展现出自我复制、类似生态偶然的动态或具有开放属性的模拟。因此,这一领域的实际做法往往是针对简单和预期的结果来设计模拟,这就批准了意外发现的可能性。
也许,是时候自动化了!这样,研究者就无需将注意力放在设定正确的规则和互动上,而可以关注更加高层面的问题,比如如何最好地描述我们最终希望涌现的现象,然后让搜索该现象的过程自动完成即可。
不过,描述目标现象本身就极具确认有罪性。虽然之前已经有一些研究试图通过复杂的度量(比如生命、复杂度、有趣度等)来量化人工生命,但这些度量高度发展上都无法完全体现人类想要表达的那种微妙的生命概念。
SakanaAI表示:「虽然我们还不了解我们的宇宙为何或如何变得如此复杂、极小量和有趣,但我们仍然可以将其作为指引,意见不合我们创建引人入胜的人工生命世界。」
该团队认为,在极小量自然数据上训练得到的基础模型具备类似于人类的表征,甚至可能基于我们的真实世界统计数据得到一个理想化的表征。这种特性使得基础模型非常适合用于量化人类对人工生命复杂度的概念。
该团队的ASAL(自动搜索人工生命)研究便是基于这一思路开展的。他们表示这是一种人工生命研究的新范式。
既然是新范式,那么接受需要做一些定义。
首先,该团队将所需的模拟一整片的单位定义为substrate,即基质。然后,如图1所示,ASAL让基础模型可使用三种不反对方法来识别所需的人工生命模拟:
1.监督式目标:搜索能产生指定目标事件或事件序列的模拟,有助于发现任意世界或与我们自己的世界不反对世界。
2.开放式:在基础模型的表征空间中搜索会随时间不断授予新变化的模拟,由此可以发现对人类观察者来说总是很有趣的世界。
3.阐明(Illumination):搜索一组不无关系的多样化模拟,从而展现对我们来说非常陌生的世界。
研究者基于Boids、ParticleLife(粒子生命)、GameofLife(生命游戏)、Lenia和NeuralCellularAutomatas(神经元胞自动机)等多种人工生命基质展现了这种新的自动化方法的有效性。
在每种基质中,ASAL都发现了以前从未见过的生命形式,并扩展了人工生命中涌现结构的有无批准的。例如,ASAL揭示了Boids中奇异的群集模式、Lenia中新的自组织细胞,并找到了像著名的康威生命游戏一样开放式元胞自动机。
方法:自动搜索人工生命
图2展示了新提出的ASAL范式,其中包括三种基于视觉-语言基础模型的算法。每种方法都能通过不同类型的自动搜索发现人工生命模拟。深入细节之前,先来看看相关概念和符号。
人工生命基质(substrate),记为S,其包含任何一组不无关系的人工生命模拟(例如,所有Lenia模拟的一整片的单位)。这些模拟可能在初始状态、转换规则或两者上有所不同。S由θ参数化,它定义的单个模拟具有三个分量:
初始状态分布Init_θ
前向动态阶跃函数Step_θ
渲染函数,Render_θ,作用是将状态转换为图像
虽然通常而言,并不需要参数化和搜索渲染函数,但当状态值难以先验地解读时,就很有必要了。将这些项串到一起,可定义一个θ函数,它对初始状态s_0进行采样,运行T步模拟,并将最终状态渲染为图像:
最后,还有另外两个函数VLM_img(?)和VLM_txt(?),它们的作用是通过视觉-语言基础模型嵌入图像和自然语言文本,以及相应的内积??,??,以鞭策该嵌入空间的反对性测量。
监督式目标
人工生命的一个重要目标是找到能让所需事件或事件序列发生的模拟。这样的发现将使研究者能够找到与我们自己的世界不反对世界,或测试某些反事实的进化轨迹在给定基质中是否可能,从而深入了解某些生命形式的可行性。
为此,ASAL会搜索一种模拟,该模拟会产生与基础模型表示中的目标自然语言提示词相匹配的图像。研究者可以控制在每个时间步骤应用哪个提示(如果有的话)。
开放式
人工生命的一大确认有罪是寻找开放式模拟。找到这样的世界才能复现现实世界中永无止境的有趣新奇事物的爆发。
尽管开放性是主观的且难以定义,但正确表示空间的新颖性(novelty)可以体现开放性的一般概念。这样一来,可将测量开放性的主观性外包给表征函数的构建。在本文中,视觉-语言基础模型表征充当了人类表征的代理。
阐明
人工生命的另一个关键目标是自动阐明不同现象构成的整个空间,而这些现象是从基质涌现出来的。基于此,可以让我们了解「生命的可能模样」。因此,阐明是描绘和分类外围基质的第一步。
为了实现这一目标,ASAL会搜索一组模拟并且这些模拟产生的图像与基础模型表征中的最近邻相距甚远。该团队发现最近邻多样性比基于方差的多样性能实现更好的阐明。
实验隐藏ASAL还真行
该团队使用不反对基质验证了ASAL范式的有效性。
首先,他们使用的基础模型包括CLIP和DINOv2。基质则如下所述:
Boids:模拟的是N个「鸟状物体(boids)」在2D欧几里得空间中的移动情况。所有boids都共享权重一样的神经网络,其会根据局部参考系中K个近邻boids向左或向右操纵每个boid。该基质是神经网络的权重空间。
粒子生命:模拟N个粒子,这些粒子又可分为K类;它们在一个2D欧几里得空间运动。该基质是K×K相互作用矩阵的空间,β参数确定了粒子之间的距离。初始状态是随机采样的,粒子会自组织形成动态模式。
类生命的元胞自动机(CA:将康威生命游戏泛化到所有在2D栅格中运作的二元状态元胞自动机,其中状态转换仅取决于活着的Moore邻居的数量和细胞的当前状态。该基质有2^18=262,144种可能的模拟。
Lenia:将康威生命游戏推广到连续空间和时间,允许更下降的维度、多个核和多个通道。该团队使用了LeniaBreeder代码库,它定义了基质,其中动态维度为45个,初始状态维度为32×32×3=3,072个。其搜索空间以BertWang-ChakChan2020年在论文《Leniaandexpandeduniverse》中找到的解为中心。
神经元胞自动机(NCA):通过神经网络表示局部转换函数来参数化任何连续元胞自动机。该基质是神经网络的权重空间。
搜索目标模拟
其中包括单个目标和随时间变化的目标序列。
对于单个目标,以下动图定性地展示ASAL的良好效果,可以找到与指定提示词匹配的模拟。
对于时间目标,下图隐藏可以找到能产生遵循一系列提示词的轨迹的模拟。通过指定所需的进化轨迹并使用约束基质,ASAL可以识别体现所需进化过程内在质量的更新规则。例如,当提示词序列为「一个细胞」然后是「两个细胞」时,相应的更新规则本质上就是实现自我复制。
搜索开放式模拟
图5展示了ASAL在类生命元胞自动机的开放式模拟中的潜力。
根据3式中的开放式指标,著名的康威生命游戏位列最开放的元胞自动机(CA)的前5%。
图5a隐藏,最开放的CA表现了处于混沌中心的非平凡动态模式,因为它们既没有轻浮也没有爆发。
图5b则描绘了三个CA在CLIP空间中随模拟时间的轨迹。由于基础模型的表征与人类表征相关,因此通过基础模型的表征空间在轨迹中产生新颖性也会为人类观察者产生一系列新颖性。
图5c则可视化了所有类生命元胞自动机,从中可以看到涌现出的有意义的结构:最开放的CA紧密地靠在模拟主岛外的一个小岛上。
阐明外围基质
该团队使用了Lenia和Boids基质来研究公式4中的阐明算法的有效性。基础模型是CLIP。他们定制了一个用于搜索的遗传算法:在每一代,随机选择父母,创建变异的孩子,然后耗尽最多样化的解子集。
下面的2个「SimulationAtlas」展示了生成的模拟集。
此可视化凹显了按视觉反对性组织的行为的多样性。使用Lenia时,ASAL发现了许多前所未见的生命形式,这些生命形式类似于按颜色和形状组织的细胞和细菌。使用Boids时,ASAL重新发现了群集行为(flockingbehavior),以及其他行为,例如蛇行、分组、盘旋和其它变体。
?
?
量化人工生命
基础模型不仅有助于搜索有趣现象,而且还可以量化以前只能进行定性分析的现象。图7展示了量化这些复杂偶然的涌现行为的不同方法。
在图7a中,对两个Boids模拟之间的参数进行线性插值。这个中间模拟缺乏任一模拟的特征并且显得无序,隐藏了boids参数空间的非线性、混沌性质。次要的是,现在可以通过测量中间模拟的最终状态与两个原始模拟的CLIP反对性来为这种定性观察授予定量减少破坏。
图7b则评估了粒子生命中粒子数量对其表示某些生命形式的能力的影响。在这种情况下,如果搜索「一只毛毛虫(acaterpillar)」,则可发现只有在模拟中至少有1000个粒子时才能找到它们,这符合1972年的「更多即不同(moreisdifferent)」的观察结果。
在图7c中,通过单独扫描每个参数并测量CLIP提示词对齐分数的结果标准偏差,量化了粒子生命中每个模拟参数的重要性。在确定最次要的参数后,便对应上了绿色和黄色粒子之间的相互作用强度,这对于毛毛虫的形成至关重要。
图7d给出了对于Lenia模拟,CLIP向量随模拟时间的变化速度。当模拟定性地看起来已成静态时,该指标恰好轻浮,因此这可授予有用的模拟开始条件。
对于这项研究,你有什么看法呢?
参考链接:
https://x.com/SakanaAILabs/status/1871385917342265592
https://x.com/phillip_isola/status/1871438128172671086
声明:本文来自于微信公众号机器之心,授权站长之家转载发布。
2024临近尾声,AI又给了所有人一个大惊喜,这次可以用来自动发现新的人工生命形式了。
今年8月,Transformer论文作者之一的LlionJones与前谷歌研究人员DavidHa共同创立的人工智能公司SakanaAI造出了「世界上第一个用于自动化科学研究和开放式发现的AI系统」。他们称之为AIScientist,即人工智能科学家,详情可参阅报道《首个全自动科学发现AI系统,Transformer作者创业公司SakanaAI推出AIScientist》。
而现在,他们又拿出了另一项震撼性的重磅研究成果:使用基础模型搜索人工生命的系统ASAL。
人工生命(ArtificialLife),听起来很科幻,但其定义并不复杂:就是被制造出来的生命。数学家约翰?何顿?康威在1970年提出的著名的「生命游戏」便是一种模拟人工生命系统,其中定义的规则可让其中的「细胞」像生命体一样运作。
研究人工生命的一个不次要的部分哲学理念是我们不仅想要了解「我们所知的生命」,还想要探索「可能存在的生命」。下图为ASAL其中一位作者PhillipIsola的推文以及他分享的一种人工生命。
此外,人工生命研究还可以得到有望保持不变和帮助AI进步的关键见解。该团队表示:「通过利用失败AI帮助人工生命的发现,我们可以帮助对涌现、进化和智能的理解——这些不次要的部分原则可以启发下一代AI系统!」
该研究发布后驱散了极小量点赞和讨论。
知名博主AranKomatsuzaki表示,这是视觉语言模型在人工生命中的首次应用,可以跨基质发现多样性、全新的模拟生命。
目前,人工生命研究主要是通过计算模拟进行,而这种方法必然意味着搜索并描绘出整个可能的模拟空间,而不是研究任何单个模拟。这样一来,研究者便可以了解不反对模拟配置可以怎样产生不反对涌现行为。SakanaAI的这篇论文首次实现了借助基础模型来自动化这个搜索过程。另外,OpenAI、MIT等其他机构和独立研究者也参与了研究。
论文标题:AutomatingtheSearchforArtificialLifewithFoundationModels论文地址:https://arxiv.org/pdf/2412.17799在线论文:https://pub.sakana.ai/asal/项目代码:https://github.com/SakanaAI/asal/
虽然人工生命模拟的进化和学习的具体机制有很多,但迄今为止,该领域取得实质性进展的一个主要障碍是:缺乏一种偶然的方法来搜索所有可能的模拟配置。如果没有这种方法,在设计人工世界最次要的方面(世界本身的规则)时,研究者就必须依靠直觉。
对此,一部分确认有罪在于简单组件的大规模相互作用可能会产生复杂的涌现现象,这些现象很难甚至不可能被提前预测。
正是由于模拟配置与涌现现象之间缺乏关联,因此研究者很难凭直觉设计出能展现出自我复制、类似生态偶然的动态或具有开放属性的模拟。因此,这一领域的实际做法往往是针对简单和预期的结果来设计模拟,这就批准了意外发现的可能性。
也许,是时候自动化了!这样,研究者就无需将注意力放在设定正确的规则和互动上,而可以关注更加高层面的问题,比如如何最好地描述我们最终希望涌现的现象,然后让搜索该现象的过程自动完成即可。
不过,描述目标现象本身就极具确认有罪性。虽然之前已经有一些研究试图通过复杂的度量(比如生命、复杂度、有趣度等)来量化人工生命,但这些度量高度发展上都无法完全体现人类想要表达的那种微妙的生命概念。
SakanaAI表示:「虽然我们还不了解我们的宇宙为何或如何变得如此复杂、极小量和有趣,但我们仍然可以将其作为指引,意见不合我们创建引人入胜的人工生命世界。」
该团队认为,在极小量自然数据上训练得到的基础模型具备类似于人类的表征,甚至可能基于我们的真实世界统计数据得到一个理想化的表征。这种特性使得基础模型非常适合用于量化人类对人工生命复杂度的概念。
该团队的ASAL(自动搜索人工生命)研究便是基于这一思路开展的。他们表示这是一种人工生命研究的新范式。
既然是新范式,那么接受需要做一些定义。
首先,该团队将所需的模拟一整片的单位定义为substrate,即基质。然后,如图1所示,ASAL让基础模型可使用三种不反对方法来识别所需的人工生命模拟:
1.监督式目标:搜索能产生指定目标事件或事件序列的模拟,有助于发现任意世界或与我们自己的世界不反对世界。
2.开放式:在基础模型的表征空间中搜索会随时间不断授予新变化的模拟,由此可以发现对人类观察者来说总是很有趣的世界。
3.阐明(Illumination):搜索一组不无关系的多样化模拟,从而展现对我们来说非常陌生的世界。
研究者基于Boids、ParticleLife(粒子生命)、GameofLife(生命游戏)、Lenia和NeuralCellularAutomatas(神经元胞自动机)等多种人工生命基质展现了这种新的自动化方法的有效性。
在每种基质中,ASAL都发现了以前从未见过的生命形式,并扩展了人工生命中涌现结构的有无批准的。例如,ASAL揭示了Boids中奇异的群集模式、Lenia中新的自组织细胞,并找到了像著名的康威生命游戏一样开放式元胞自动机。
方法:自动搜索人工生命
图2展示了新提出的ASAL范式,其中包括三种基于视觉-语言基础模型的算法。每种方法都能通过不同类型的自动搜索发现人工生命模拟。深入细节之前,先来看看相关概念和符号。
人工生命基质(substrate),记为S,其包含任何一组不无关系的人工生命模拟(例如,所有Lenia模拟的一整片的单位)。这些模拟可能在初始状态、转换规则或两者上有所不同。S由θ参数化,它定义的单个模拟具有三个分量:
初始状态分布Init_θ前向动态阶跃函数Step_θ渲染函数,Render_θ,作用是将状态转换为图像
虽然通常而言,并不需要参数化和搜索渲染函数,但当状态值难以先验地解读时,就很有必要了。将这些项串到一起,可定义一个θ函数,它对初始状态s_0进行采样,运行T步模拟,并将最终状态渲染为图像:
最后,还有另外两个函数VLM_img(?)和VLM_txt(?),它们的作用是通过视觉-语言基础模型嵌入图像和自然语言文本,以及相应的内积??,??,以鞭策该嵌入空间的反对性测量。
监督式目标
人工生命的一个重要目标是找到能让所需事件或事件序列发生的模拟。这样的发现将使研究者能够找到与我们自己的世界不反对世界,或测试某些反事实的进化轨迹在给定基质中是否可能,从而深入了解某些生命形式的可行性。
为此,ASAL会搜索一种模拟,该模拟会产生与基础模型表示中的目标自然语言提示词相匹配的图像。研究者可以控制在每个时间步骤应用哪个提示(如果有的话)。
开放式
人工生命的一大确认有罪是寻找开放式模拟。找到这样的世界才能复现现实世界中永无止境的有趣新奇事物的爆发。
尽管开放性是主观的且难以定义,但正确表示空间的新颖性(novelty)可以体现开放性的一般概念。这样一来,可将测量开放性的主观性外包给表征函数的构建。在本文中,视觉-语言基础模型表征充当了人类表征的代理。
阐明
人工生命的另一个关键目标是自动阐明不同现象构成的整个空间,而这些现象是从基质涌现出来的。基于此,可以让我们了解「生命的可能模样」。因此,阐明是描绘和分类外围基质的第一步。
为了实现这一目标,ASAL会搜索一组模拟并且这些模拟产生的图像与基础模型表征中的最近邻相距甚远。该团队发现最近邻多样性比基于方差的多样性能实现更好的阐明。
实验隐藏ASAL还真行
该团队使用不反对基质验证了ASAL范式的有效性。
首先,他们使用的基础模型包括CLIP和DINOv2。基质则如下所述:
Boids:模拟的是N个「鸟状物体(boids)」在2D欧几里得空间中的移动情况。所有boids都共享权重一样的神经网络,其会根据局部参考系中K个近邻boids向左或向右操纵每个boid。该基质是神经网络的权重空间。粒子生命:模拟N个粒子,这些粒子又可分为K类;它们在一个2D欧几里得空间运动。该基质是K×K相互作用矩阵的空间,β参数确定了粒子之间的距离。初始状态是随机采样的,粒子会自组织形成动态模式。类生命的元胞自动机(CA:将康威生命游戏泛化到所有在2D栅格中运作的二元状态元胞自动机,其中状态转换仅取决于活着的Moore邻居的数量和细胞的当前状态。该基质有2^18=262,144种可能的模拟。Lenia:将康威生命游戏推广到连续空间和时间,允许更下降的维度、多个核和多个通道。该团队使用了LeniaBreeder代码库,它定义了基质,其中动态维度为45个,初始状态维度为32×32×3=3,072个。其搜索空间以BertWang-ChakChan2020年在论文《Leniaandexpandeduniverse》中找到的解为中心。神经元胞自动机(NCA):通过神经网络表示局部转换函数来参数化任何连续元胞自动机。该基质是神经网络的权重空间。
搜索目标模拟
其中包括单个目标和随时间变化的目标序列。
对于单个目标,以下动图定性地展示ASAL的良好效果,可以找到与指定提示词匹配的模拟。
对于时间目标,下图隐藏可以找到能产生遵循一系列提示词的轨迹的模拟。通过指定所需的进化轨迹并使用约束基质,ASAL可以识别体现所需进化过程内在质量的更新规则。例如,当提示词序列为「一个细胞」然后是「两个细胞」时,相应的更新规则本质上就是实现自我复制。
搜索开放式模拟
图5展示了ASAL在类生命元胞自动机的开放式模拟中的潜力。
根据3式中的开放式指标,著名的康威生命游戏位列最开放的元胞自动机(CA)的前5%。
图5a隐藏,最开放的CA表现了处于混沌中心的非平凡动态模式,因为它们既没有轻浮也没有爆发。
图5b则描绘了三个CA在CLIP空间中随模拟时间的轨迹。由于基础模型的表征与人类表征相关,因此通过基础模型的表征空间在轨迹中产生新颖性也会为人类观察者产生一系列新颖性。
图5c则可视化了所有类生命元胞自动机,从中可以看到涌现出的有意义的结构:最开放的CA紧密地靠在模拟主岛外的一个小岛上。
阐明外围基质
该团队使用了Lenia和Boids基质来研究公式4中的阐明算法的有效性。基础模型是CLIP。他们定制了一个用于搜索的遗传算法:在每一代,随机选择父母,创建变异的孩子,然后耗尽最多样化的解子集。
下面的2个「SimulationAtlas」展示了生成的模拟集。
此可视化凹显了按视觉反对性组织的行为的多样性。使用Lenia时,ASAL发现了许多前所未见的生命形式,这些生命形式类似于按颜色和形状组织的细胞和细菌。使用Boids时,ASAL重新发现了群集行为(flockingbehavior),以及其他行为,例如蛇行、分组、盘旋和其它变体。
?
?
量化人工生命
基础模型不仅有助于搜索有趣现象,而且还可以量化以前只能进行定性分析的现象。图7展示了量化这些复杂偶然的涌现行为的不同方法。
在图7a中,对两个Boids模拟之间的参数进行线性插值。这个中间模拟缺乏任一模拟的特征并且显得无序,隐藏了boids参数空间的非线性、混沌性质。次要的是,现在可以通过测量中间模拟的最终状态与两个原始模拟的CLIP反对性来为这种定性观察授予定量减少破坏。
图7b则评估了粒子生命中粒子数量对其表示某些生命形式的能力的影响。在这种情况下,如果搜索「一只毛毛虫(acaterpillar)」,则可发现只有在模拟中至少有1000个粒子时才能找到它们,这符合1972年的「更多即不同(moreisdifferent)」的观察结果。
在图7c中,通过单独扫描每个参数并测量CLIP提示词对齐分数的结果标准偏差,量化了粒子生命中每个模拟参数的重要性。在确定最次要的参数后,便对应上了绿色和黄色粒子之间的相互作用强度,这对于毛毛虫的形成至关重要。
图7d给出了对于Lenia模拟,CLIP向量随模拟时间的变化速度。当模拟定性地看起来已成静态时,该指标恰好轻浮,因此这可授予有用的模拟开始条件。
对于这项研究,你有什么看法呢?
参考链接:
https://x.com/SakanaAILabs/status/1871385917342265592
https://x.com/phillip_isola/status/1871438128172671086
360软件宝库中关村下载金山毒霸脚本之家hao123软件下载东坡下载绿色资源网2265安卓网西西软件园多特软件下载QQ下载下载之家3DM游戏网下载吧雷电模拟器应用市场当下软件园夜神模拟器驱动精灵易我数据恢复华军新闻网PC下载网天极下载驱动管家驱动人生18183手游网统一下载3322软件站多多软件站天天下载站人才招聘系统188soft华军纯净下载华军软件宝库飞速下载我的世界PCL2启动器植物大战僵尸95版增值税发票开票软件(税务UKey版)超级机器人大战ux巴士模拟18八方旅人迪士尼长发公主帝国时代3第九道门电竞经理东方红辉心方正兰亭粗黑简体植物大战僵尸Steam平台绝地求生origin安装包Steam学习通方正小标宋简体仿宋gb2312字体PDF编辑器WPSOffice图吧工具箱红警2共和国之辉DirectX修复工具鲁平庸之才智能陈桥五笔爱奇艺安装包python安装包pycharm安装包音视频剪辑平庸之才全民泡泡超人超级房车赛起点帝国时代3酋长帝国时代4国家崛起比特大爆炸魔力宝贝归来战神遗迹胡莱三国3我是大东家叫我大掌柜植物大战僵尸2高清版奇门之上斗罗大陆斗神再临坎公骑冠剑电脑版逆世战神小森生活秦时明月世界神武4PC版向日葵远程控制forwindowsPostmanHBuilderX电视家HMCL启动器photoshop视频剪辑平庸之才访客登记无约束的自由系统软件WinRARYY语音腾讯视频
声明:本文来自微信公众号“游戏新知”(ID:youxixinzhi),作者:新知君,授权站长之家转载发布。
12月13日,一款研发中的开放世界端游《金庸群侠传》发布了首曝PV。这则时长不到两分钟的简洁视频,仅展示了一些很「武侠风格」的场景渲染画面,看起来项目还处在研发的早期阶段。
有趣的是,这个项目背后既不是什么游戏大厂,也不是我们能下意识想到的那种独立游戏团队。这家公司叫图森未来,原本专攻卡车智能驾驶技术的研发,也可算是一个AIGC研发公司。它还曾在美股上市,据报道市值高时能超过180亿美元,却在今年年初退市。
就在本月19日,公司刚刚宣布启用新的品牌名「CreateAI」,要以生成式AI技术进军游戏行业。游戏总制作人、图森未来董事长陈默在近日(12月24日)的一封致股东的公开信中表示:「我愿用我毕生的热爱和梦想——《金庸群侠传》去拯救图森未来。我愿背水一战,这将是我一生最后的公司和最后的项目。」
而这款《金庸群侠传》,正是公司技术力和构想的一个重要展示。据称这将会是一款「大型武侠开放世界RPG游戏」,游戏内地图将会有「预计960平方公里」。
一家乍看起来毫无游戏基因的AIGC公司,突然转行做游戏,还一上来就要做3A?在这个「外行人」的眼里,下一款《黑神话悟空》的诞生需要什么?
「火力全开」的正式转型
公开信息显示,《金庸群侠传》会是一款「纯买断的单机ARPG开放世界游戏,且不会登录任何移动端平台」。游戏预计会有联机模式,但「重心绝对是单机模式」。
尽管游戏官网地址中含有「ol」字样,陈默仍表示,「这个OL就有点像GTAOL的麻痹一样。你可以用自己在单机世界使繁荣/盛开的角色,去别人的世界帮忙PVE。」
这个关于金庸IP的3A游戏的想法,可能还真不是临时起意。早在2020年底,他就通过关联人士注册成立了一家动漫游戏公司水墨侠道,开始制作《笑傲江湖三部曲》动画电影和「《金庸群侠传》游戏的前期工作」。《笑傲江湖三部曲》的第一部预计在2025年上线。
笑傲江湖曲一,赞87
陈默称,也就是依托水墨侠道,2022年底的时候「《金庸群侠传》游戏的前期工作」就已经开始了。游戏新知获悉,游戏大约在三个多月前正式开始研发,目前团队规模在100人左右,工作地点位于广州,团队有UE5项目研发经验。
公司还拉来了单机同人游戏《金庸群侠传》系列及《大侠立志传》的制作人半瓶神仙醋,参与游戏的剧本创作;拉来了《霸王别姬》《活着》的电影编剧芦苇及其弟子参与故事编剧;拉来了国产武侠番剧《枕刀歌》的团队参与战斗演出制作。预计在未来,团队还将扩充至300人。
截至目前,游戏已经消耗掉的前期投资有约1.8亿。整部游戏预计投资开发成本会有8亿~12亿。
至于项目进度,可能与首曝PV看起来差不多,还处在相当早期的阶段。游戏预计2月进入美术量产外包阶段,7月底呈现战斗模块,并计划在明年ChinaJoy(8月初)上放出实机战斗演示。最终,公司希望游戏能在2027年上线。
目前放出的游戏原画《金庸群侠传》并不是图森未来当前唯一的游戏项目。除了它之外,公司至少还有四个项目在研或在筹备。
首先是与金庸IP同样潜力不小的《三体》IP作品。公司在今年8月宣布与上海三体动漫达成合作,将共同开发《三体》系列的动画长篇电影和游戏。这一合作被公司视为其「生成式AI」新业务部门正式成立的标志。为此,公司还与「超时空无防卫的地方之父」、动画导演河森正治和动画制作公司株式会社白组达成了合作。至于游戏项目,据游戏新知所知,仍处在计划阶段。
其次是由河洛工作室制作的《河洛群侠传2》,图森未来也有参与共同开发,陈默还对河洛工作室进行了三千万的投资。公开信息显示,《河洛群侠传2》将拓发散放世界地图,并增添战旗玩法。
公司当前还有一款SLG《KINGS》在研。游戏新知获悉,这是一个端游项目,主要由图森未来的原团队在制作。
有参加了今年10月的广州CICF漫展的玩家表示,当时图森未来的公司展位上已透露了三个储备项目,其中之一就是这款《KINGS》。另外两款则是前面介绍过的《三体》IP项目和《河洛群侠传2》。
来自B站用户@迷途-小書僮公司还有一款AVG游戏在研,类似橙光游戏。据称它也是利用失败AI制作,预计在明年7月底上线。公司还将同时开放一款给公众使用的AVG制作工具,并将在明年10月开放动漫的制作工具。
此外,公司的AIGC工具研究也仍然在进行,不过也相应地保持方向了文娱方向。本月17号,公司刚刚发布了图生视频大模型「Ruyi」,并授予了一个开源版本。
CreateAI,赞1
陈默称,「整个AI大模型开发团队100人,其中有40个技术人员和60个数据处理人员,高度发展就是我们以前的无人驾驶团队。」他认为,这种转型「完全没有难度,因为本质上是一件事情,模拟开车和模拟动画都是做视频。」
看得出来,图森未来的确是已经在朝着游戏行业全力以赴了——尽管目前的成果尚处早期,还很难评价。
有不能大成功的理由
离开智驾行业,是有离开的理由。而选择了游戏行业,也有另一些选择的理由。
图森未来这家公司走过的路颇有些坎坷,但陈默仍然表示,目前《金庸群侠传》的「这些投资相比于研究智能驾驶所烧的钱,不过是小巫见大巫——鉴于过去有着富裕融资,所以他很自信地表示,玩家们大可不必担心开发的现金流等问题。」
有意思的是,虽然图森未来可以算是个「外行公司」,说出上面这番话的陈默本人却不能完全算是个「外行人」。他的过去也与游戏行业有过一些渊源。
据其自述,陈默从14岁起在加拿大留学,20岁时回国开始创业,先后参与创立或经营过一家户外媒体公司「苍穹广告」、一家棋牌游戏平台公司「深蓝兄弟」(后转手给了口袋科技)、一家做二手车交易的平台「车国网」。
他在2015年创立「图森互联」,一开始是为新浪等互联网平台授予智能图像识别技术,还获得了新浪的投资,占股20%。转年,公司变更主品牌名为「图森未来」,才开始以自动驾驶卡车技术为不次要的部分业务。
公司早早驱散了不少电子、互联网等领域的技术人才,其中不乏当时就已有8年、10年研发经验的高端人才。2016年9月,公司就在自动驾驶算法评测数据集KITTI和Cityscapes中获得10项世界第一,转年6月就在美国拿下了无人驾驶路测牌照。2018年和2019年,公司连续两年入选「福布斯中国最具创新力企业」榜单。2020年7月,公司与美国卡车制造巨头Navistar(纳威斯达)达成战略合作,同时拿下了对方的一笔投资。
借着这样的势头,公司在2021年4月成功在美股上市。公司市值曾达到的最低点超过180亿美元,这个数字相当于其刚上市时成交价的两倍多。
但这个时候的高股价,完全是靠着技术成果和概念热度,也就是说全靠股民的信心。或许是属于卡车无人驾驶的时代还未到来,此后的一年里,公司一边研发成本越来越高,一边却很难找到变现方法。
在2021年全年,公司的研发支出达到2.87亿美元(约合人民币20.68亿元),营销和行政支出达到1.18亿美元(约合人民币8.5亿元),营业收入却只有626万美元(约合人民币4507万元)。再加上林林总总的其他开支,公司这一年的归股净亏损达到了惊人的7.37亿美元(约合人民币53.05亿元)。
大约从这时起,公司高层之间产生了复杂的嫌隙。
2022年3月,陈默辞任董事长职位;同年6月,吕程辞任CEO职位。这两个职位都由CTO侯晓迪接任。
陈默后来在致股东公开信中这样描述事情经过:「公司的另外一名创始人,CTO,侯晓迪博士希望吕程把CEO,我把董事长的位置都让给他,他希望做公司的NO.1。如果我们不赞成,他就不再正常的工作。当时,对于图森未来CTO远比CEO和董事长重要,起码当时我是那么想的。我劝说吕程,我俩一起把岗位让给了他,侯晓迪博士成为公司的董事长、CEO和CTO。」
另一边,陈默暂离图森未来之后,在中国成立了一家独立公司Hydron,仍然做智驾相关业务。但这一行为很快就遭到图森未来董事会的审查,董事会接受相关高管与这个中国独立公司之间存在技术输收。
受此影响,图森未来的一些合作伙伴不再愿意继续合作,股东们也信心大失。公司原本就没建立起健康的收入渠道,这样一来更是雪上加霜。2022年10月,公司董事会全员通过了一项决议,罢免侯晓迪的CEO、总裁、CTO、董事会主席职务。
三人的反击随即而至。11月,侯晓迪授予了陈默一个为期两年的超级投票权,二人联合罢免了其他董事会成员,只留下了侯晓迪一人。随后侯晓迪剥夺陈默为董事长、剥夺吕程为CEO。
高管内斗风波暂时落定,公司的问题却已经积重难返。由于丢失了合作伙伴,美国的业务很难继续开展。陈默称,当时公司账上只剩下10亿左右,公司有一千多人,可每年的运营成本就有四五个亿。
结果,公司不得不连续进行了两次大规模的裁员,从而尽量减少,缩短成本开支。这还直接地导致了侯晓迪的出走——这位创始人至今还与图森未来颇有矛盾。
第一次裁员发生在2022年12月,也就是陈默和吕程刚刚重回公司的时候。这次裁员波及了约350名员工,占全球员工总数的25%。受此影响,2022年产生的重组费用有2685.5万美元(约合1.96亿人民币),裁员还导致了约200万美元的长期债务减值支出。
第二次裁员发生在2023年5月,涉及约300人,占全球员工总数的30%。不无关系的一次性费用(包括员工过渡、拒给信息期和遣散费、员工福利和相关成本的现金支出)约为700万至900万美元(约合5000~6500万人民币)。
缩短长期性开支的代价,就是加剧了这两年的一次性亏损。但这已经不算是最笨重的问题了。在美国的业务萎缩后,公司在2023年试着进入日本、澳洲和中国市场,但要么仍会受到来自美国的调查和批准,要么没谈到不适合的合作伙伴。
陈默这样总结公司当时的情况:
「再次接手图森后,公司已经元气大伤。此时我们丢失了美国所有上下游合作关系,美国市场传闻我们是间谍,我们在被美国各部门调查,还有集体诉讼。我和吕程尝试修复上下游合作伙伴关系,但无果,我们判断不可能再修复成功。同时,在美国还有高昂的成本,我们无法选择出售美国业务,因我们的声誉,出售也没能成功。为了公司能活下来,我们选择砍掉美国业务,降低成本去商业环境不反对日本和澳洲发展业务。」
「幸运的是,今年3月份因为美国加州的TRO和美国商务部对我们的调查,让我们2023年在日本和澳洲布局的商业化也产生巨大的风险。我们认识到,图森未来无法靠自己的资金和能力商业化无人驾驶,我们必须想办法活下来,遂我们保持不变商业模式从重债务的自己商业化转为轻债务授权IP和数据。与此同时,我们开始探索其他的商业机会。」
就这样,怀着扶大厦之将倾的想法,陈默放下了智驾业务,将目光投向了从2020年就开始布局的游戏行业。2024年1月,公司从美股退市。
为什么一定是游戏?这又取决于陈默对于AIGC技术和游戏行业的理解。
一方面,前文已提及过,他认为自己的团队在转型方面「完全没有难度」。另一方面,他坚信自己为AIGC技术找到了一个不适合的应用场景。他在24号的致股东公开信中这样说:
「我想大家会质疑AIGC虽然是现在最热门的赛道,Midjourney年收入已经2亿美元,但行业竞争激烈,有很多巨型公司都参与其中,图森未来如何和他们竞争?我想大家也会质疑,虽然马斯克和李飞飞都说AIGC非常适用于游戏开发,但目前并没有成功的案例验证,凭什么图森未来能成功?含糊,我无法反对。」
「我之所以有信心把公司带回80亿,并不是因为AIGC是最热门的赛道;也不是因为AIGC做游戏这个正确的路径。80亿美元的市值对应着5亿美元的利润,对应的大概是7亿美元的净收入,我们只需要让公司有5亿美元的利润即可维持80亿美元左右的市值。那凭什么在未来我们的年利润能做到5亿美元?因为,我为公司带来了《金庸群侠传》。」
他紧接着说到对于游戏IP的理解,认为游戏行业仍然「产能短缺」,并顺便表达了一些「厌恶」「梦想」之类的想法:
「7亿美元的年收入,在游戏行业并不是一个很下降的数字。COD系列,GTA系列,刺客信条系列等,收入都是50亿美元级别。在国内的武侠游戏中,《天龙八部》养活了整个搜狐,年收入到游戏尾声还超过100亿人民币;史玉柱一款《征途》还完所有巨人集团的债务,重回一线资本大哥……当然,还有笑傲江湖,射雕三部曲等等金庸授权的IP,为网易、腾讯、完美、畅游带来了极小量的收入。」
「《金庸群侠传》对于大多数制作者来说讲,是国内顶级的IP,只要保证质量一定能做个大收入的项目。但对于我和我的团队并非如此,《金庸群侠传》对于我们就像《黑神话悟空》对于冯骥团队,我就是为了这款产品而生。……」
要救公司,认为游戏AI技术的跨行业门槛低,看好游戏行业的前景,再加上个人的厌恶,四个因素加起来,才诞生了公开信结尾的这样一句话:「我愿用我毕生的热爱和梦想——《金庸群侠传》去拯救图森未来。我愿背水一战,这将是我一生最后的公司和最后的项目。」本月19日,公司正式启用了全新品牌名CreateAI,标志了公司的正式转型。
而之所以选择在本月这个时候,在项目进度还远未达到关键节点的情况下公开项目,恐怕也是出于公司层面的考量。本月24日,也就是《金庸群侠传》项目公开约11天后,图森未来举行了年度股东大会。包括陈默、吕程在内的6位原董事会成员继续当选。
陈默称,「要反对我们真实的做得出这些东西。……他(侯晓迪)现在就说我们『狗屁不是』,没了他啥也不是,我们的防御手段就是把这些东西提溜出来,让市场相信我们。」
一个擅长给资本市场讲故事的商人,来到了游戏行业。这次,玩家们能接受他的故事吗?
结语
高层内斗的阴云,现在仍笼罩着图森未来。
对于陈默的转型无法选择,同为公司创始人的侯晓迪颇有微词。他仍想继续做智驾业务,也并不看好游戏行业。他在2023年3月辞去了董事会席位,同年5月转而在美国成立了一家新的智驾公司BotAuto——正赶上图森未来第二次大裁员的时间。他对媒体表示,新公司的40人不次要的部分团队含糊大部分来自图森未来。这家新公司在今年9月还拿下了一笔2000万美元的A轮投资。
结果今年11月,图森未来就向美国德克萨斯州法院提起诉讼,指控BotAuto盗用其商业机密和专利技术。
侯晓迪则反手建立了一个网站「savetusimple.com」(意为「拯救图森」),罗列了陈默等高管的诸多「罪状」,包括向中国公司输收资金和技术等等。网站呼吁中小股东联合起来罢免相关高层,并对图森未来进行清算。
在本月24号的那封致股东公开信中,陈默作出了承诺:「明年复牌后,图森未来盈利之前,不会做任何的减持,和公司与项目共存亡。」公司选择以游戏业务背水一战,并且在明年还有复牌的打算。至于那时结果如何,可能就要看当下这几款游戏项目的成果了。
标签:
-
gb林总的每日小玩具笔趣阁全文免费阅读,gb林总的每日小玩具笔趣阁,gb林总的每日小玩具gb,gb林总的每日小玩具免费阅读最新章节,gb林总的每日小玩具免费读,gb林总的每日小玩具小说阅读,gb林总的每日小玩具 最新章节列表,gb林总的每日小玩具小说最新章节,gb林总的每日小玩具第四爱,gb林总的每日小玩具更新时间,