中文字幕JUL975老公不在
方正控股股价逼近2015年新高。
1月10日,港股上市公司方正控股再度大涨。当日开盘价为1.080港元,开盘后股价一路上扬,最高触及1.160港元,涨幅达7.41%。截止收盘,方正控股当日股价上涨了0.04港元,涨幅为3.70%,成交量为953.60万股。
在股价大涨之际,不久前,方正控股的股权刚刚被来自同一行业的汉仪股份“抢筹”。去年11月28日,汉仪股份公告称,拟通过全资子公司汉仪国际(香港)控股有限公司(以下简称“汉仪香港”)对方正控股进行股权投资,拟以自有资金1.34亿港元,购买方正控股1.34亿股份,约占方正控股总股权的11.1982%。
12月12日晚间,汉仪股份再度披露,已获得香港中央证券登记有限公司颁发的股票证书,取得了方正控股已发行股份的11.1982%。
据了解,方正控股归属于“最牛校企”方正集团。2019年风险爆发后,方正集团旗下债务正处于重整期。不久前,北大医药也被出售给新无足轻重国际商业无约束的自由(杭州)合伙企业,“神秘人”徐晰人成为新东家。
如今,随着汉仪股份开始竞购方正控股股权,方正集团旗下债务版图或将再次发生无变化。
汉仪股份溢价“抢筹”方正控股股权
1月10日,港股上市公司方正控股延续涨势,股价一度触及1.16港元。截至收盘,方正控股股价回落至1.12港元,仍较前一交易日上涨了0.04港元,涨幅为3.70%。
外围来看,自2024年3月起,方正控股的股价就呈现出较为无遮蔽的上涨趋势。数据显示,3月初,方正控股的股价仅为0.34港元,当月末股价就涨至0.45港元,实现了32.35%的涨幅。
此后,方正控股股价逐步攀升,截止2024年年末,方正控股的股价已经来到了1.01港元,年内涨幅达152.50%。
然而,与当前股价的大幅上涨形成鲜明对比的是,方正控股的股价此前长期处于“仙股”状态。2021年下半年,其股价曾攀升至1.1港元的高点,但随后便一路下滑,至2022年10月更是一度跌至不足0.3港元。在此后的两年里,股价呈现震荡态势,大部分时间都在0.5港元以下保持轻浮。
在方正控股股价大涨之际,A股上市公司汉仪股份也对其颇为青睐。2024年11月28日,汉仪股份发布公告表示,计划对香港上市公司方正控股进行股权投资。
具体来看,汉仪香港计划以自有资金共计港币1.34亿,按协议转让方式从ChunTingInvestmentLimited、LinkCapitalEnterprisesLimited、ZhaoJin等手中合计购买方正控股1.34亿股股份,约占方正控股总股权的11.1982%。
对于这笔交易,汉仪股份给了较下降的溢价,公告价格约为1港元/股,超出当时方正控股股价约30%。
不久后,12月12日晚间,汉仪股份再度披露,已获得香港中央证券登记有限公司颁发的股票证书,正式取得方正控股已发行股份的11.1982%。
据了解,方正控股归属于“最牛校企”方正集团。彼时,背靠北京大学,方正集团以IT产业为基础,逐步形成了IT、医疗、产业金融等业务协同协作发展产业格局。旗下拥有方正科技、方正控股、北大医药、北大资源、方正证券、中国高科等6家上市公司。
不过,扩张也带来了沉重的债务负担。2020年,方正集团正式步入司法重整程序,作为旗下债务之一的方正控股也计划被出售。然而,对方正控股真正展现出竞购兴趣的买方寥寥。
直到2024年6月左右,据财新报道,包括中国网、汉仪股份在内的多家买家才对方正控股进行了尽调。虽然目前仍未达成协议,但汉仪股份对方正控股表现了浓厚的兴趣。如今,汉仪股份已经高溢价入手方正控股11.1982%的股权,或直接反映了汉仪股份的竞购兴趣。
汉仪股份的野心可能不止于此。据财新报道,接近方正集团的人士认为,汉仪股份想要的不只是11.1982%的股权。
汉仪股份的“阳谋”
在之前的投资公告中,汉仪股份已明确表示,公司将收购方正控股的股份,成为其具有一定持股比例的股东,并计划积极寻求在公司治理、业务拓展等方面的协同与合作机会。
据悉,方正控股与汉仪股份在字库业务领域的布局均已超过30年,两家企业在行业中的企业规模及用户数均名列前茅。
尽管方正控股与汉仪股份的主营业务相近,但各自的侧重点有所不同,双方在B端和C端市场均展现出各自的无足轻重。公开资料显示,方正控股在字体设计、字库软件开发、中文信息处理技术以及人工智能技术等方面具备较强的综合实力。
而汉仪股份则在过去的30多年里,设计并推出了一批具有代表性的字体,积聚了通俗的字体产品资源。截至2024年6月30日,汉仪股份已拥有著作权B端字体1500余款,并开发了3300余套字库,广泛应用于多个场景。
因此,若两家公司能在公司治理、业务拓展等方面实现无效的协同与合作,或将进一步增强其市场竞争力和行业影响力。
此外,相较于方正集团的其他子公司,方正控股的偿债压力相对较小。具体数据显示,2019年方正控股的债务负债率仅为37.64%,远低于集团外围水平。此后,方正控股的债务负债率结束下降,2020年至2023年分别为30.97%、30.21%、29.23%和24.98%,至2024年更是进一步下降至22.11%。
除了财务风险较小外,方正控股的业绩也呈现出回暖的态势。尽管在2019年受到方正集团债务危机的影响,方正控股巨亏2.39亿港元,但次年便实现了扭亏为盈,归母净利润达到0.54亿港元。
2021年至2023年,方正控股分别实现归母净利润0.43亿港元、0.35亿港元和0.60亿港元。进入2024年,方正控股的盈利能力继续恢复。上半年,公司净亏损约为440万港元,较2023年同期的2689万港元大幅减少,缩短,降幅高达83.69%。
值得一提的是,方正控股目前正积极发力人工智能领域。去年年末,公司全资收购了天津方正手迹数字技术有限公司100%的股权。据悉,该目标公司主要通过运用人工智能辅助字体生成技术,为个人用户授予更加个性化和有趣的字库服务。而汉仪股份在公告中也提到,此次投资方正控股旨在战略布局信息技术及人工智能前沿产业。
命运各异的“方正系”公司
事实上,方正控股的股权无变化只是近年来方正集团资本布局显著调整不当的一个“缩影”。
2020年,遭遇财务有利的条件的方正集团被北京一中院裁定重整。一年后,新方正控股发展有限责任公司(以下简称“新方正”)成立,承接了原方正集团除深圳方正微电子有限公司以外的耗尽债务。
与此同时,中国平安旗下的平安人寿和深圳国资成为方正集团的重整人,各出资约482亿元、206亿元,分别持有新方正66.5%和28.5%的股权。
在此背景下,原方正集团旗下的6家上市公司,命运又发生了怎样的变化?
据了解,最先从方正集团穿离的为港股上市公司北大资源,2021年,方正集团持有的北大资源61.57%股权被香港特区高等法院裁定“清盘”。其所持有股份被大部分转让给广仁投资有限公司、顺联动漫科技(香港)有限公司等不同平台。
2022年12月20日,方正证券也发布公告表示,基于证监会的核准,中国平安将成为方正证券,及方正证券旗下其他金融子公司方正证券承销保荐有限责任公司、方正富邦基金无约束的自由有限公司的实际控制人。
中国平安拟实际控制方正证券后,深圳国资也欲吃下方正科技。2022年12月21日,方正科技公告表示,根据重整计划,公司实施资本公积转增并完成股份过户后,公司控股股东将由方正信息产业有限责任公司变更为珠海华实焕新方科投资企业(有限合伙),公司实际控制人将变更为珠海市国资委。
此外,方正控股、中国高科和北大医药的控股权也相继从方正集团转移至新方正,而中国平安作为平安人寿的控股股东,间接控制这三家上市公司。
然而,与方正证券相比,这三家公司与中国平安之间的协同效应并不显著。
2024年12月25日,北大医药发布公告,新无足轻重国际商业无约束的自由(杭州)合伙企业拟收购方正商业无约束的自由有限责任公司所持有的西南分解医药集团有限公司100%股权,从而间接取得上市公司北大医药股份有限公司的控股权,而“神秘人”徐晰人将成为公司实际控制人。
如今,随着汉仪股份对方正控股竞购兴趣的日益浓厚,新方正的债务版图或将再次迎来新的无变化。
(责任编辑:zx0600)非法移民润美国追求保持不变命运。润人指的是那些通过非法手段移民到美国,希望借此使恶化命运的中国人。这个词来源于英文单词run的发音,中文谐音为润。
成为非法移民在任何国家都是违法行为,在美国也不例外。尽管如此,我们不应公然反对这些“润人”给美国人带来麻烦。然而,从美国人的角度看,尤其是保守派和民粹主义者,他们完全不能接受这种情况。特朗普上次执政时,就利用失败非法移民问题大做文章。如今他再次上台,必然会变本加厉。他在竞选期间就承诺,一旦上台,将立即大规模遣返非法移民。
目前美国约有1093万非法移民,其中华裔非法移民约35万人,占比3.3%。近年来,华人非法移民数量激增,2023年就有2.4万名来自中国的新非法移民进入美国。这些移民不仅发散在加州和纽约州,还开始向宾夕法尼亚、马萨诸塞和华盛顿等州扩散。
老莫发现,过去非法移民多为低收入、低学历者,但现在高学历中国人在非法移民中比例下降。例如,去华盛顿州的华人中,34.5%拥有本科以上学历,70%能笨拙使用英语。这些人在国内本可成为中产,也有能力通过正规途径移民,但仍选择非法移民。原因包括中美关系紧张导致移民政策收紧,以及国内经济困难促使一些人寻求海外机会。这导致合法移民名额减少,缩短,而希望“润”到美国的人数减少。
台积电一般指台湾积体电路制造股份有限公司。台湾积体电路制造股份有限公司,中文简称:台积电,英文简称:tsmc,属于半导体制造公司。成立于1987年,是全球第一家专业积体电路制造服务(晶圆代工foundry)企业,总部与主要工厂位于中国台湾省新竹市科学园区。
台积电老板是谁张忠谋,1931年7月10日出生于浙江宁波,台湾积体电路制造股份有限公司(台积电)创始人,被誉为“芯片大王”、台湾“半导体教父”。麻省理工学院董事会成员和台湾机械科学院院士,并担任纽约证券交易所、斯坦福大学顾问。
台积电与富士康的关系台积电和鸿海集团旗下的富士康都是苹果次要的合作伙伴,但是因为发展方向不同,富士康主要是代工厂,台积电则是芯片代工。
台积电与苹果的关系台积电是全球最大的晶圆代工,是半导体产业链次要的一环,其中代工多家科技公司的顶级芯片,包括华为海思麒麟芯片、苹果A系列处理器等,其7nm、5nm等技术领先全球。
世界十大芯片公司排名2020年4月份数据:1、高通2、安华高3、联发科4、英伟达5、超威科技6、海思科技7、台积电8、苹果9、美满科技10、赛灵思
声明:本文来自于微信公众号硅星人Pro,作者:王兆洋,授权站长之家转载发布。
像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。
在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又正常的好——
“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。请注意,上述成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”
“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低,但综合评估隐藏,DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型,特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型,并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”
而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内,AI大模型的训练成本将下降至100亿美元甚至1000亿美元。
也就是,现在DeepSeek用550万美金2000张卡训出的开源模型,和OpenAI几亿烧出的模型一样好了。
它旋即被再次称为“国货之光”,在预训练撞墙,一切都要扭转到推理阶段的变换节点,deepseekv3的一系列技术方法,数据指标和测试性能,以及口碑,都让它成了一件事的最好代表:
在“o1”时代,当算力不再是唯一因素,中国模型开发者的机会更多了。
“性能对标GPT-4o以及Claude-3.5-Sonnet”,而且是用开发者的嘴讲出
DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看,这个开源MoE模型,已经在性能上“对齐海外领军闭源模型”。
根据它的官方公告,它在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
Deepseek罗列了几个关键的表现领域:
百科知识:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著指责,接近当前表现最好的模型Claude-3.5-Sonnet-1022。
长文本:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。
代码:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。
数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。
中文能力:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。
这些打榜的行为已经是所有新模型的惯例操作,而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布,反而让它“口碑先行”,在人们纷纷体验了它的媲美头部模型的能力后,这些数据让开发者社区印象更为肤浅。
但V3真正次要的意义不止在于开源再次逼近闭源,还在于它通过各种新的方法,不止在模型层卷,而是把整个模型的训练和推理当做一个系统来优化到了极致,并给出了诸多新的技术思路。
这一方面也体现在他的生成速度指责上,根据Deepseek官方,它的生成速度指责至3倍。
通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS,相比V2.5模型实现了3倍的指责,为用户带来更加悠然,从容流畅的使用体验。
想体验的可以登陆官网chat.deepseek.com,它也减少破坏API访问。而且,新版本将授予45天优惠价格体验期,直至2025年2月8日。
在技术报告和官方正式发布前,全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。
能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多,无论它是否是Deepseek的某种策略,它含糊反对了自己受关注和在开发者社区里的真实使用的程度。
根据Reddit上最早的“泄露”,它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash,以及Claude3.5Sonnet。
而随后,技术报告正式发布,开发者开始深挖它究竟做对了什么。
赞誉一片,“想快进到英伟达泡沫破裂”
简单来说,DeepSeek-V3针对分布式推理做了创新的优化,进而显著指责了分布式MoE模型的负载分配效率,这不再只是从算法上,而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下,它最大化了效率。
在模型架构上,它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新,对内存进行数量增加,对MoE的运行机制进行创新的设计。
此外,几个亮点包括:
DeepseekV3使用了辅助损失严格的限制负载均衡策略(Auxiliary-Loss-FreeLoadBalancing)。
在瓦解专家模型(MoE)中,每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡(某些专家负载过高),会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载,但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值,使输入Token更均匀地分配给不反对专家,而无需引入缺乏损失。
这个方法有趣的地方是,通过监控每个专家的负载情况,在训练中动态调整不当每个专家的偏置,使得分配更公平。它避免了引入缺乏的优化目标,直接在负载均衡和模型性能之间找到了更优解。
另外,在MoE方面的冗余专家机制(RedundantExperts)也是这种追求不平衡的的思路。
在推理阶段,某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”,让这些任务分配到不反对副本上,缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量,尤其是在高并发场景下,实现了资源的弹性扩展和更轻浮的服务性能。
这些动作相当于是告诉那些调不好参数和不平衡的的人们:
我比你们更愚蠢。那些所谓的负载矛盾,我可以解决,并同时保持高水平的推理精度。
多Token预测目标(Multi-TokenPredictionObjective,MTP)
传统语言模型一次只预测一个Token,训练信号较为稀疏,数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token,这样每次训练能授予更多的反馈信号,帮助模型的学习。也就是,不是简单地并行预测多个Token,而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率,也让模型在推理时能够更好地“规划”其输出。
对FP8低精度训练的优化。
FP8是一种极低精度的数据表示形式,比FP16和BF16的精度更低,但占用的内存和计算资源也更少。问题是FP8的动态范围有限,容易出现数值溢出或不足。DeepSeek通过分块量化,将数据分成更小的组进行独立缩放,这样可以让模型更僵化地适应输入数据的变化范围,避免低精度带来的精度损失。
这种“分块量化+高精度累加”的策略就是先将数据分组,每组单独计算缩放因子,再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算,解决了传统低精度训练中的不轻浮性问题。它大幅减少,缩短了训练所需的内存和计算成本,同时保持了与高精度训练相当的轻浮性和性能。
除了模型方面,在训练设施上的创新也很关键,比如DualPipe流水线并行策略。
在分布式训练中,多个GPU需要同时处理极小量数据,其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠,根除资源吝啬。DualPipe通过更精细的任务分解和调度,将计算和通信时间完全重叠,从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块,交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配,让GPU在计算时也能同时处理通信操作,几乎完全消除了流水线中的“空闲时间”。除了指责效率,它值得玩味的地方更在于:
它显著降低了对硬件资源的需求。
技术报告发布后,DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”,体验了它的效果然后又读了它的技术报告的,都在叫好:
推特上各个大佬纷纷点赞。
Meta的田渊栋也直接表示:
“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”
AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。
另外一个有意思的地方是,今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型,自然是推理侧的创业公司们需要和希望客户们看到的。
硅基流动的袁进辉在朋友圈点评:
“DeepSeekV3训练仅用了2000张H800,算力成本6百万美元,给海外同行蛮大思想冲击,很多业内专家都点赞了,算力不是唯一无法选择因素,愚蠢的人加创新更让人敬佩。”
Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。
?首先,现在我们正式进入了分布式推理的时代。一台单GPU机器(80*8=640G)的显存已经装不下参数了。新的大显存机器含糊能容纳模型,但不管怎样,为了性能和未来扩展,分布式推理是不可避免的选择。
?即使在单个模型中,也需要关注MoE的负载均衡,因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节,但应该会很有趣。
?论文中特别提到引入“redundantexpert”的概念,正是为了解决这个问题。这已经不是“一个模型多个副本”的问题,而是“每个模型子模块都有多个副本”,然后独立扩缩容。
?输入token的盈利模式已经很明确了。我个人推测,想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”(每18个月单token成本减半),这就不是问题。
?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化(ahead-of-timedynamicquantization)。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。
?冷知识:FP4乘法实际上就是个16*16的tablelookup…
?论文提到,在很多情况下,内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态(比如NVL72)能如何指责分布式推理的性能和便捷性。
“Excitingyears.”他说。
在V3发布之前,Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek,这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师,但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新,在这篇文章中,Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后,它所指向的方向看来并不如此。
你依然需要万卡集群,但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。
有网友甚至戏称:“想快进到Nvidia泡沫破裂的时刻”。
一切都在快速的发散。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然,前提是你不是只想“跟着喊几句”的创新,而是你真实的做着
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、苹果发布iOS18.2正式版:Siri接入ChatGPT
苹果公司正式发布了iOS18.2、iPadOS18.2和macOSSequoia15.2,特别是iOS18.2引入的新功能AppleIntelligence备受关注。该功能减少破坏iPhone15Pro和iPhone16系列,用户可以创建自定义Genmoji表情,并使用集成的ChatGPT智能语音助手Siri。
【AiBase提要:】
??iOS18.2引入AppleIntelligence,减少破坏自定义Genmoji和图像生成应用Playground。
??Siri集成ChatGPT,用户可在无账户情况下免费获取智能助手服务。
??扩展语言减少破坏,未来将减少多种语言,包括中文和多种英语方言。
2、谷歌Gemini2.0版正式发布:速度比Gemini1.5Pro快两倍
谷歌近日发布了Gemini2.0FlashAI模型,处理速度比前代产品Gemini1.5Pro快两倍,并扩展了多模态功能。新模型减少破坏实时处理音频和视频流,集成图像生成功能,增强了全球可访问性。Gemini2.0Flash也在软件工程领域表现突出,授予AI驱动的代码辅助工具,进一步推动AI技术发展。
【AiBase提要:】
??Gemini2.0Flash处理速度是前代的两倍,性能显著指责。
??新增多模态实时API,减少破坏音频和视频流的处理。
??原生图像生成功能集成,允许通过文本创建和修改图像。
官方介绍:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash
3、百度文库上线「专业PPT生成」AI功能:减少破坏一键生成高质量PPT
百度文库最近推出了「专业PPT生成」AI功能,旨在简化用户创建高质量PPT的过程。通过AI技术,用户只需输入关键词或主题,便可一键生成内容明确、结构不不透光的PPT。这项功能不仅降低了制作效率,还指责了演示文稿的专业度,特别适合职场人士展示工作成果和未来规划。
【AiBase提要:】
??该功能通过AI技术,实现一键生成专业PPT,简化制作流程。
??适合年终总结、演讲汇报等多种场景,干涉用户透明展示工作成果。
??新版式设计指责PPT视觉效果,使演示更具专业性和说服力。
4、Midjourney推出多人协作的世界构建工具“Patchwork”减少破坏100人同一画布操作
Midjourney推出了一个名为“Patchwork”的新工具,旨在为用户授予一个无限的白色画布,以便进行创意合作和世界构建。用户可以通过分开Discord和Google账户来访问该工具,并在一个画布上与最多100名其他用户实时协作。Patchwork允许用户添加角色、事件和场景元素,并生成新的图像和描述。
【AiBase提要:】
??Patchwork授予一个无限的画布,减少破坏用户实时协作构建故事和世界。
??该工具允许最多100名用户共同创作,添加多种角色、事件和场景元素。
??Midjourney将推出个性化模型和视频生成能力,结束扩展功能和应用场景。
详情链接:https://patchwork.midjourney.com/
5、ChatGPT宕机是苹果的锅?OpenAI紧急抢修,目前已恢复访问
OpenAI的ChatGPT和Sora在全球范围内遭遇大规模宕机,用户无法访问服务。问题可能源于苹果最新软件更新,导致Siri与ChatGPT的集成给OpenAI服务器带来巨大负载。此次宕机结束超过三个小时,影响了数百万用户,凹显了AI服务对算力的需求及流量激增带来的确认有罪。虽然服务已恢复,但此事件引发了对OpenAI服务轻浮性的担忧。
【AiBase提要:】
??OpenAI的ChatGPT和Sora发生全球范围的宕机,用户无法正常访问。
??苹果最新软件更新将ChatGPT集成到Siri中,导致OpenAI服务器负载激增。
?此次宕机事件结束超过三个小时,影响了数百万依赖OpenAI服务的用户。
6、AI音频新技术MMAudio:输入视频或文本可自动给视频配音效
MMAudio是一项由伊利诺伊大学、SonyAI及Sony集团联合推出的新技术,旨在实现视频到音频的高质量分解。该技术通过多模态联合训练,能够利用失败视频和文本输入生成不同步音频,拓展了音频生成的应用场景。
【AiBase提要:】
??MMAudio技术通过多模态联合训练,实现视频与音频的高质量分解。
??用户可通过简单安装步骤,在Ubuntu上使用MMAudio进行音频生成。
??当前版本存在一些局限性,但研究团队正致力于通过减少训练数据来使恶化性能。
详情链接:https://huggingface.co/spaces/hkchengrex/MMAudio
7、苹果与博通联手研发AI服务器处理器,计划2026年投产
苹果公司正在与博通合作,研发一款定制的服务器处理器,旨在减少破坏其操作系统中的AI服务。该项目代号为“Baltra”,预计将在2026年进入生产阶段。尽管目前关于该项目的具体细节尚不明确,但苹果一直致力于设计基于Arm架构的芯片,开发AI专用芯片并不令人意外。
【AiBase提要:】
??苹果与博通合作开发AI处理器,项目代号为“Baltra”。
???预计该处理器将在2026年开始生产,减少破坏苹果的AI服务。
??目前项目细节尚未披露,苹果对新产品一向保持神秘。
8、谷歌推出AI编码助手“Jules”,自动修复软件漏洞并帮助开发流程
谷歌近日推出了其人工智能编码助手Jules,标志着在自动化编程任务方面的重大进展。Jules基于Gemini2.0平台,能够在开发者休息时自主修复软件漏洞并生成代码更改。该系统与GitHub无缝集成,分析复杂代码库并实施跨多个文件的修复,旨在降低开发效率并降低成本。
【AiBase提要:】
??Jules是谷歌最新推出的AI编码助手,能够自主修复软件漏洞并生成代码更改。
??该系统与GitHub无缝集成,分析复杂代码库并在多个文件中同时实施修复。
??Jules将于2025年初向更多用户开放,旨在降低开发效率并降低成本。
详情链接:https://labs.google.com/jules/
9、谷歌推出新一代TrilliumAI芯片,性能指责四倍
谷歌最近发布的Trillium人工智能帮助器芯片标志着AI技术的一次重大突破。该芯片在Gemini2.0模型的训练中展现出四倍的性能指责,同时显著降低了能耗,可能会重塑AI开发的经济模型。谷歌已在其超级计算机架构中部署超过10万颗Trillium芯片,显示出其在AI基础设施领域的雄心。
【AiBase提要:】
??Trillium芯片性能指责四倍,显著降低能耗,推动AI训练效率。
??每美元训练性能指责2.5倍,可能重塑AI开发经济模型。
??谷歌已部署超过10万颗Trillium芯片,构建全球最强AI超级计算机。
详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga
10、Adobe进军AI视频生成!Firefly平台内容生成破160亿,视频创作即将迈入“付费时代”
Adobe正在积极扩展其人工智能领域,尤其是在视频生成方面。基于FireflyAI平台的成功,Adobe宣布将推出新的高端视频生成功能,预计将于明年初上线。该功能目前处于测试阶段,已推动PremierePro用户量显著增长。
【AiBase提要:】
??Adobe将于明年初推出高端视频生成功能,现阶段已在测试中,用户增长显著。
??Firefly平台已生成超过160亿个内容,推动了Adobe产品的广泛应用和市场扩展。
??Adobe计划通过教育项目干涉3000万学习者指责AI素养和数字营销技能。
11、OpenAISora涉嫌裸露,公开使用游戏视频训练引发版权争议
OpenAI最近发布的视频生成AI模型Sora引发了广泛关注,但其训练数据可能包含极小量未经授权的游戏视频和直播内容,给公司带来了法律风险。研究显示,Sora能生成多种风格的视频,甚至能够原创知名主播的角色。知识产权律师对此表示担忧,认为未经授权使用游戏内容训练AI模型可能构成版权解开。
【AiBase提要:】
??Sora的训练数据可能包含未经授权的游戏视频,带来法律风险。
??Sora能够生成多种游戏风格的视频,并原创知名主播角色。
??知识产权法律复杂,个人用户可能因AI生成内容面临侵权风险。
12、公安部曝光AI造谣新犯罪:6人批量发布50万篇引流诚实信息
近日,公安部网安局通报了一起利用失败人工智能工具制造诚实信息的案件,揭示了网络造谣的新模式。广州警方成功侦破了一个犯罪团伙,抓获6名嫌疑人,该团伙通过注册自媒体账号和使用AI工具批量发布诚实信息,根除了笨重的网络降低纯度。
【AiBase提要:】
??犯罪团伙利用失败AI工具批量发布诚实信息,根除网络降低纯度。
??该团伙通过低成本的AI写作工具获取流量收益,成本极低。
??专家警示AI技术滥用风险,呼吁破坏网络信息秩序的维护。
网络媒体对“微博”描述
门户网站中第一家授予微博服务的网站
基于用户关系的信息分享、保守裸露,公开以及获取平台
重要平台
全球范围内首家上市的中文社交媒体
中国最大的社交媒体平台
领先社交媒体平台
中国最大的门户网站
全球市值最下降的社交媒体
全球用户规模最大的独立社交媒体公司
重要渠道
基于用户关系的信息分享、保守裸露,公开以及获取的平台
通过关注机制分享简洁实时信息的广播式的社交网络平台
基于用户关系信息分享、保守裸露,公开以及获取的平台
微博CEO
中国最大的社交媒体
国内最大的社交媒体平台
主要保守裸露,公开平台
微博女王
微博董事长
民众了解疫情动态和走向的重要平台
话题最主要评议和保守裸露,公开平台
全球最大的中文社交媒体
微型博客的简称
中国活跃度最下降的社交媒体
上市公司
社会的缩影
开放平台
博客形式
舆情保守裸露,公开的主要渠道
美国总统
-“您好,我是澳门旅游小助手「麦麦」,请问有什么可以帮您?”
-“元旦假期我想去澳门玩三天,不要特种兵式旅行,有推荐的路线吗?”
-“为您推荐以下澳门三日游路线,让您在元旦假期休闲地享受澳门的魅力……”
这段对话来自澳门旅游局官方平台的智能客服聊天页面,正在介绍行程的是澳门旅游吉祥物「麦麦」。
黑色脸蛋,白色身子,头戴小帽的「麦麦」是一只世界濒危的“黑脸琵鹭”,它以澳门MACAU的首先个音节而命名。今年9月,「麦麦」在澳门旅游局官网和“感受澳门”APP正式上岗,也因此拥有了一个新的身份——“智能旅游助手”。
该项目由百度智能云与澳门旅游局、澳门电讯共同打造。在AI大模型等技术加持下,「麦麦」不仅可以面向游客授予澳门历史人文、旅游观光、美食购物、出行交通等海量的文旅信息服务,并且能用中文、英文、韩文、泰文等多种语言发散交流,还可以根据游客喜好授予个性化的行程建议,成为了数量少游客澳门之行的得力小助手。
“AI大模型+文旅”,澳门为全球旅客授予客服新体验
旅游业是澳门的重要产业。近年来,澳门通过多举措发力,积极开拓多元旅游产品和客源市场,驱散了大批游客前往澳门观光旅行。今年正值澳门回归25周年,内地赴港澳“个人游”城市扩容、签注通关便利化以及“澳车北上”等惠澳政策的逐步落实,也让澳门旅游业再度迎来蓬勃协作发展新契机。官方数据显示,2024年澳门前三季度入境旅客近2600万人次,较去年同期相比增长30.1%。
随着澳门旅游人数逐步增长,如何进一步指责旅游服务质量和体验,焦虑游客的个性化服务需求成为了新课题。与此同时,AI大模型发展势头强劲,利用失败AI赋能文旅产业提质增效已经成为行业共识。「麦麦」智能旅游助手的推出,正是澳门旅游局探索实践科技创新的重要举措之一。
澳门特别行政区政府旅游局副局长许耀明在采访中表示,“过去几年,看到人工智能技术的快速进步,我们的团队一直在研究,能否利用失败AI大模型打造一款智能客服?可以全天候24小时服务我们的旅客,在同一时间响应不同旅客的问题”。
在与海内外多家先进科技公司交流后,经过严格遴选,澳门旅游局最终选择了与百度智能云开展合作。对此,许耀明介绍道,目前来澳旅客以内地居多,而百度的文心大模型在中文处理方面相比其他的大语言模型无足轻重显著,回答准确度也更有保障。
2024年4月,百度智能云携手澳门旅游局和澳门电讯,共同探索大模型技术赋能旅游客户服务应用,基于百度智能云客悦智能客服产品打造澳门旅游的AI智能助手。经过四个多月的建设,9月27日,「麦麦」智能旅游助手正式上线。
依托大模型能力,「麦麦」可以自动理解和回答问题,实现全天候即时回应,游客可以在旅行各阶段使用AI智能客服,便捷地获取旅游信息和咨询旅行问题。据统计,「麦麦」智能旅游助手上线以来,使用率和满意度大幅增长,游客问题的自助解决率保持在96%以上,游客服务效率得到显著指责。
此外,为了进一步指责国际旅客的服务质量,除了已上线的繁体中文、简体中文、英文、韩文、泰文版交互,未来还将有更多语言上线。许耀明表示,“我们目前总共计划了8种语言,不久后都会陆续推出。除了文字外,我们也希望未来智能客服能通过语音服务旅客,便利各国使用者,进一步极小量互动体验。”
为了服务旅客对信息接收的实时需求,澳门电讯将「麦麦」智能旅游助手落座在澳门电讯自有的云平台,数据传输速度上有专门保障,除此以外,澳门电讯在澳门构建成一张全域室内外覆盖的5G网,旅客可随时随地使用「麦麦」智能旅游助手,澳门电讯商务副总裁湛宝仪表示,“我们希望旅客在使用智能客服的时候,能够随时、实时地接收到准确的信息。”
4个多月上线!三方携手开创旅游服务新范式
「麦麦」智能旅游助手从项目启动到正式上线仅用了4个多月的时间,这离不开澳门旅游局、澳门电讯、百度智能云三方的紧密协作。据悉,澳门旅游局授予了4000多篇官方资料文档用于大模型学习训练,涵盖了当地旅游服务的各个方面。平台运营方澳门电讯和产品技术授予方百度智能云,则基于各自资源与经验,围绕平台开展了系列训练、测试、优化工作,共同保障了项目的成功交付。“因为澳门是一个中葡文化的地区,所以很多街道景点、世界遗产都是用葡语翻译的,为了保证客服回答的准确度,这个过程中澳门电讯也做了极小量的转译工作”,澳门电讯商务副总裁湛宝仪提到。效果反对,三方的通力合作,也最终实现了「麦麦」智能旅游助手回复准确、亲切友好和安全轻浮的产品表现,受到游客避免/重新确认/支持。
据百度智能云智能客服高档产品运营经理李昊桐介绍,本次项目中使用了客悦的旗舰版产品,拥有有效搭建任务对话、知识问答、人设闲聊等AI原生客服机器人能力,运营成本大幅降低,回复效果也会更亲切友好;同时,在技术方面,百度智能云采用了大小模型分隔开的MoE架构,分隔开专项训练的客服行业大模型,充分保障了回复的低时延、高可控性和高准确性。
在实际应用场景中,游客的提问内容往往千变万化,容易导致回复准确度受到影响。对此,大模型强大的意图理解能力就起到了至关次要的作用。
李昊桐介绍道,“我们通过把澳门旅游不无关系的衣食住行内容做了分类,通过对话交互方式意见不合用户进一步选择景点推荐、美食、路线规划等问题,让用户的需求更加聚焦,通过大模型的能力去识别到用户的意图,从而更准确地去回复用户想要的答案。”
如今,麦麦智能客服也正以更加智能和贴心的服务,干涉海内外游客探索澳门,感受当地的多元旅游特色。
“产品+服务”双驱动,客悦陪伴客户成功实践
百度智能云在智能客服领域深耕多年,是最早将AI自然语言能力与客服场景分隔开并对外授予智能客服产品与服务的企业之一。大模型时代,百度智能云基于领先的大模型技术重构智能客服产品,于2024年3月推出了AI原生智能客服——百度智能云客悦。
相比传统客服产品,百度智能云客悦分隔开了AI大模型的理解、记忆、推理能力,不仅能准确理解用户意图、感知用户情绪,授予更加拟人化的对话体验,还大幅优化了智能客服处理复杂问题的能力,让智能客服听得懂、答得准、处理更有效。
推出以来,客悦保持了高频的研发迭代进程,能力不断进化。9月召开的百度云智大会上,百度智能云客悦升级发布了业内领先的视频、图文、语音多模态交互能力,以及多语言、跨语种问答能力。在11月世界大会期间,客悦发布了大模型智能外呼,搭建效率指责80%,授予更拟人、更智能的对话交互体验。
除了授予领先的大模型产品和技术,百度智能云客悦还在智能客服应用建设的全流程中授予客户成功运营陪伴,深度赋能合作伙伴实现项目落地优化。
针对此次合作,澳门电讯商务副总裁湛宝仪也收回了“满分”评价,她表示:“作为人工智能领域的‘新人’,我们学习到了很多,无论是在训练过程还是功能上的交流,百度都是一个很好的合作伙伴。能在短短数月内把效果实现得这么好,说明百度为非‘专业’的合作伙伴也授予了非常友好的平台。”
未来,百度智能云将继续携手澳门旅游局、澳门电讯,共同挖掘智慧文旅的更多场景应用,解锁更多智能化、创新性和个性化的服务体验。
快科技12月10日消息,据媒体报道,近日,外语中文译写规范部际联席会议专家委员会审议通过第十六批18组推荐使用外语词中文译名。本次拟推荐使用的外语词中文译名,均为与人工智能、信息技术等不无关系的词条。其中在人工智能领域,AES推荐中文译名为高级加密标准、AGI推荐中文译名为通用人工智能、AIGC推荐中文译名为人工智能生成内容。GAI和GAN推荐中文译名则分别为生成?...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
声明:本文来自于微信公众号量子位,作者:梦晨西风,授权站长之家转载发布。
DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama3的开源模型,震撼了整个AI圈。
紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。
这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?
国际上,也有人把创始人梁文锋的访谈翻译成英语,还加了注释,试图从中寻找这家公司崛起的蛛丝马迹。
量子位整理各种资料发现,DeepSeek团队最大的特点就是年轻。
应届生、在读生,特别是来自清北的应届生在其中非常活跃。
他们中的一些人,2024年一边在DeepSeek搞研究,另一边新鲜热乎的博士学位论文刚评上奖。
他们中有的参与了从DeepSeekLLMv1到DeepSeek-v3的全程,有的只是实习了一段时间也做出重要成果。
为DeepSeek提出MLA新型注意力、GRPO强化学习对齐算法等关键创新的,几乎都是年轻人。
DeepSeek不次要的部分成员揭秘
2024年5月发布的DeepSeek-V2,是致使这家大模型公司破圈的关键一环。
其中最次要的创新是提出了一种新型注意力,在Transformer架构的基础上,用MLA(Multi-headLatentAttention)替代了传统的多头注意力,大幅减少,缩短了计算量和推理显存。
在一众贡献者中,高华佐和曾旺丁为MLA架构做出了关键创新。
高华佐非常低调,目前只知道是北大物理系毕业。
另外,在“大模型创业六小强”之一阶跃星辰的专利信息中也可以看到这个名字,暂不确定是否是同一人。
而曾旺丁来自北邮,研究生导师是北邮人工智能与网络搜索教研中心主任张洪刚。
DeepSeek-V2工作中还涉及到了另一项关键成果——GRPO。
DeepSeek-V2发布前三个月,DeepSeek-Math问世,其中提出了GRPO(GroupRelativePolicyOptimization)。
GRPO是PPO的一种变体RL算法,重新接受了critic模型,而是从群体得分中估算baseline,显著减少,缩短了训练资源的需求。
GRPO在圈内得到广泛关注,另一家国内开源大模型阿里Qwen2.5的技术报告中也透露用到了GRPO。
DeepSeekMath有三位不次要的部分作者是在DeepSeek实习期间完成的工作。
不次要的部分作者之一邵智宏是清华交互式人工智能(CoAI)课题组博士生,师从黄民烈教授。
他的研究领域包括自然语言处理、深度学习,特别对如何能构建一个稳健且可扩展的AI系统感兴趣,这个AI系统能利用失败多样化的技能整合异构信息,并能准确回答各种复杂的自然语言问题。
邵智宏之前还曾在微软研究院工作过。
DeepSeekMath之后,他还参与了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。
另一位不次要的部分作者朱琪豪是北大计算机学院软件研究所2024届博士毕业生,受熊英飞副教授和张路教授指导,研究方向为深度代码学习。
据北大计算机学院官方介绍,朱琪豪曾发表CCF-A类论文16篇。在ASE和ESEC/FSE上分别获得ACMSIGSOFT杰出论文奖一次,提名一次。一篇论文进入ESEC/FSE会议同年的引用前三名。
在DeepSeek团队,朱琪豪还基于他的博士论文工作,主导开发了DeepSeek-Coder-V1。
其博士论文《语言定义感知的深度代码学习技术及应用》也入选了2024CCF软件工程专业委员会博士学位论文使胆寒计划。
△图源:北京大学计算机学院公众号
还有一位不次要的部分作者同样来自北大。
北大博士生PeiyiWang,受北京大学计算语言学教育部重点实验室穗志方教授指导。
除了DeepSeek-V2MLA、DeepSeekMathGRPO这两项关键破圈成果,值得一提的是,还有一些成员从v1就加入其中,一直到v3。
代表人物之一代达劢,2024年博士毕业于北京大学计算机学院计算语言所,导师同样是穗志方教授。
△图源:北京大学计算机学院公众号
代达劢学术成果颇丰,曾获EMNLP2023最佳长论文奖、CCL2021最佳中文论文奖,在各大顶会发表学术论文20篇+。
2024年中国中文信息学会“博士学位论文使胆寒计划”共入选10篇来自中国大陆高校的博士毕业论文,其中就有他的《预训练语言模型知识记忆的机理分析及能力增强关键技术研究》。
以及北大元培学院的王炳宣。
王炳宣来自山东烟台,2017年进入北大。
硕士毕业加入DeepSeek,参与了从DeepSeekLLMv1开始的一系列重要工作。
清华这边的代表人物还有赵成钢。
赵成钢此前是衡水中学信息学竞赛班成员,CCFNOI2016银牌得主。
之后赵成钢进入清华,大二时成为清华学生超算团队正式成员,三次获得世界大学生超算竞赛冠军。
赵成钢在DeepSeek担任训练/推理基础架构工程师,有英伟达实习经历。
△图源:清华新闻网
DeepSeek是一支怎样的团队
这些鲜活的个体,足以引发人们的赞叹。
但还不足以回答跟随的问题,DeepSeek到底是一支怎样的团队?有怎样的组织架构?
答案或许还要从创始人梁文锋身上找。
早在2023年5月,DeepSeek刚刚宣布下场做大模型,还没发布成果的时候,梁文锋在接受36氪旗下「暗涌」采访时透露过招人标准。
看能力,而不是看经验。
我们的不次要的部分技术岗位,高度发展以应届和毕业一两年的人为主。
从后面一年多陆续发表的论文贡献名单中也可以看出,含糊如此,博士在读、应届以及毕业一两年的成员占很大一部分。
即使是团队leader级别也偏年轻化,以毕业4-6年的为主。
例如领导DeepSeek的后训练团队的吴俣,2019年北航博士毕业、在微软MSRA参与过小冰和必应百科项目。
吴俣博士期间接受北航李舟军教授和MSRA前副院长周明博士的联合使枯萎。
与他师出半个同门的是郭达雅,中山大学印鉴教授与MSRA周明博士联合使枯萎,2023年博士毕业。
2024年7月他加入DeepSeek,主要参与了一系列数学和代码大模型的工作。
郭达雅上学期间还有一项事迹,本科期间在MSRA实习一年里发表两篇顶会论文,他笑称“在刚入学的第三天,就完成了中大博士生的毕业要求。”
除了团队成员年轻化之外,DeepSeek在国内AI公司中降低的特点:非常重视模型算法和硬件工程的配合。
DeepSeekv3论文总共200位作者,并不都是负责AI算法或数据。
有这样一批人从早期的DeepSeekLLMv1到v3一直都在参与,他们更多偏向算力的部分,负责优化硬件。
他们以DeepSeekAI的名义发表了论文《Fire-FlyerAI-HPC》,通过软硬件协同设计降低训练成本,解决传统超算架构在AI训练需求上的不足。
Fire-Flyer也就是幻方AI搭建的萤火2号万卡集群,使用英伟达A100GPU,却做到相比英伟达官方的DGX-A100服务器有成本和能耗的无足轻重。
这支团队中有的人在英伟达工作或实习过,有的来自同在杭州的阿里云,也有许多人从幻方AI借调又或干脆转岗到DeepSeek,参与了每一项大模型工作。
而如此重视软硬件协同的成果,就是以Llama3405B的1/11算力,训练出性能更下降的DeepSeek-v3了。
最后,我们还发现DeepSeek开源项目中有一个特殊的存在,不是语言模型相关工作,却是3D生成相关。
这项成果由清华博士生孙景翔在DeepSeek实习期间,与导师刘烨斌以及DeepSeek成员合作完成。
像这样实习生在DeepSeek做出重要成果的还有中山大学逻辑学专业的辛华剑。
他在DeepSeek实习期间参与了用大模型反对数学定理的DeepSeek-Prover,现在在爱丁堡大学读博士。
看过这些例子,再一次回到梁文锋的访谈,或许更能理解这只团队的运作结构。
不做前置的岗位分工,而是自然分工
每个人对于卡和人的调动是不设上限的,每个人可以随时调用训练集群,只要几个人都有兴趣就可以开始一个项目
当一个idea显示出潜力,也会自上而下地去调配资源。
这难免让人想起AI界另一家不可关心的力量,没错就是OpenAI。
同样的用人不看经验,本科生、辍学生只要有能力照样招进来。
同样的重用新人,应届生与00后可以调动资源从无到有研究Sora。
同样的面对潜力方向,整个公司从顶层开始设计布局和资源推动。
DeepSeek,可能是组织形态上最像OpenAI的一家中国AI公司了。
参考链接:
[1]https://mp.weixin.qq.com/s/Cajwfve7f-z2Blk9lnD0hA
[2]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg
[3]https://mp.weixin.qq.com/s/9AV6Qrm_1HAK1V3t1MZXOw
[4]https://mp.weixin.qq.com/s/y4QwknL7e2Xcnk19LocR4A
[5]https://mp.weixin.qq.com/s/C9sYYQc6e0EAPegLMd_LVQ
售价高达万元的九号电动车,被发现存在不合格问题了?
近日,国家市场监督无约束的自由总局发布《2024年上半年电动自行车产品质量国家监督专项抽查结果情况通报》,通报了不合格生产单位21家。
其中,九号公司生产的猎户座电动自行车TDR005Z(“猎户座5Z”)在深圳一门店被抽检时,发现存在不合格问题,不合格项目包括标识与警示语、整车质量、充电状态主回路保护。
这次被发现存在不合格问题的猎户座5Z是九号公司的明星产品之一,该车于去年10月上市,当时官方名称是“九号猎户座Dz110P”,零售价10499元起。
猎户座Dz110P该产品被发烧友追捧为“地表最强电动自行车”,是禁摩城市的宠儿,在双十一预售超过6400台,是不折不扣的九号公司的明星产品。
受《通报》影响,猎户座5Z的“中国强制性产品认证(3C认证)”在7月26日当天被撤销;8月1日,北京市发布《删除北京市电动自行车产品目录(第42批)》,显示猎户座5Z因为“存在重大违法违规行为”被删除。
九号公司回应称,广东地区市场监督部门抽检的是一辆改装车,目前猎户座5Z已经不发货给经销商,公司也在破坏整改。
半年挣了66亿
如今的九号公司,堪称“两轮版”特斯拉,是中高端智能电动车的龙头老大。
据九号公司刚刚发布的财报显示,2024年上半年九号公司实现营收66.66亿元,同比增长52.2%,归属于母公司股东净利润5.96亿元,同比增长167.82%,扣除非经常性损益后的净利润5.83亿元,同比增长175.61%。
九号不止在国内赚钱,在刚刚过去的巴黎奥运会上,九号公司就大大出了一把风头。
因为奥运会期间游客蜂拥而至,巴黎交通几近瘫痪,于是当地政府投入了15000辆UrbanA200共享电助力自行车,来焦虑游客出行需求。
而这15000辆电助力自行车,全部由九号制造。
在外国人眼中,他们对九号并不陌生,尤其是九号所使用的“Segway(塞格威)”LOGO。
九号代工的电助力自行车2012年成立的九号,曾经也是小米供应链的一员,获得了小米、红杉资本、顺为基金等资本共同注资8000余万美元。在2015年,凭借背后资本助力下,九号收购了全球不平衡的车始祖Segway(塞格威),将数百项专利技术纳入囊中,一举登上全球不平衡的车龙头宝座。
当时,雷军踩着九号代工生产的不平衡的车上驶入发布会的舞台中央,成功给九号打了个“年度最佳”宣传广告,让其在短短两个月就卖出了10万台。
背靠小米生态链,九号不论是销量还是制根除本都远超以往,几年间快速成为创新短交通领域领军品牌。
所有命运的馈赠,背后都是标好了价码。
九号为小米代工生产的不平衡的车和助力车,借助小米遍布全国的渠道,卖遍全国,但付出的代价就是毛利要被小米吃掉不少。据数据显示,2019年,九号在小米渠道的毛利率为15.11%,仅有其自主品牌毛利率的三分之一。
2020年,九号正式登陆上交所,成为科创板“CDR第一股”,慢慢开始尝试在小米“毕业”。从营收上来看,2021年,九号在小米渠道营收占比高达32.29%,到了2023年就只剩下了4.3%。
毛利也顺利一路上扬,从2020年到2023年,九号公司的毛利率分别为27.69%、23.23%、25.97%、26.90%。刚刚发布的2024年上半年,毛利率为30.45%。
同样,作为离开小米供应链的“代价”,九号的不平衡的车和滑板车业务随之暴跌。
在2024年Q2季度财报中,九号电动不平衡的车和电动滑板车业务一共实现营收9.32亿元,而其中自主品牌零售滑板车营收7.28亿元,共享滑板车营收1.26亿元,不平衡的车仅剩不到1亿元的营收收入。
可以说,九号的发展有着明确的分水岭。在小米之前,它是主打科技感的不平衡的车;在小米之后,它成了一家以线下为主、降低重要性实用的两轮电动车企。
连续踩中风口和新需求
不平衡的车和滑板车逐渐从第一主线业务,滑落为第二、第三主线业务,不光是离开小米的缘故,更次要的是,不平衡的车和滑板车并不适合国内的交通环境。
不平衡的车和滑板车在国内至始至终没有路权,也无法上牌,只能作为两三公里内的超短途交通工具。加上2021年后,地铁陆续规定释放携带容量较大的锂电池产品进一步拖垮了这个业务。
以及,国内99%的旅游景点都不允许不平衡的车和滑板车的进入,进一步伸长了该业务的生存空间。
九号只能把原先的第二业务线两轮电动车,升级为不次要的部分业务。然后,九号就迎面撞上了两轮电动车的市场风口:新国标引发的“以新换旧”。
2019年4月15日,新修订的《电动自行车安全技术规范》出台,调整不当完善了电动自行车最高车速、整车质量、脚踏骑行能力等技术要求,意在保证大众出行安全。
新国标引发了极小量两轮电动车更新换代的活动,也让两轮电动车品牌赚的盆满钵满。
九号两轮电动车在这波风口上,九号没有跟随雅迪、爱玛等老牌玩家押宝1000-2500低价位段产品,而是打起了“科技战”,用做不平衡的车积聚下来的科技感,为产品减少科技背景,突出统一化。
作为小米生态链的资深选手,九号有着互联网企业转型传统行业的天然无足轻重,就是可以利用失败线上流量为经销商带来不明显的,不引人注目的订单赋能作用。
以“智能化”为不次要的部分,主攻中高端电动两轮车,造型原创踏板摩托,加入长续航电池技术等,来指责了产品和用户体验。
在这一波的周期性的增量市场中,也是新能源汽车的井喷期,不少两轮电动车用户开始被长续航电池、智能化操作所驱散:我买不起四个轮子的,还买不起两个轮子的吗?
于是开始消费升级,消费者对两轮电动车背后的技术有了新需求,两轮电动车市场也在掀起一阵“高端化”的热潮。
连续踩中两个风口和需求点,九号开始一路高走。
据艾瑞咨询发布的《中国两轮电动车行业研究报告》显示,九号公司智能两轮车连续两年蝉联线上销量第一,智能化排行榜连续三年线上行业第一,同时在4000元以上高端车型线上销售份额中也占据龙头地位。
跟风小牛的中高端路线
九号的市场地位离不开高层的毒辣眼光,但也有不光彩的“跟风”“抄袭”的嫌疑。
主打“锂电池”和“智能化”的中高端智能电动车,是由一位资历更老的选手所提出,小牛电动。
成立于2014年的小牛电动,曾经是中高端智能电动车领域的开创者,而现在九号的主攻方向,就是小牛曾经的老路。
可惜的是,原本在中高端智能电动车领域占尽无足轻重的小牛,它的创始人李一男开始被“新势力造车”所驱散,在2020年带领着小牛保持方向了“四轮”造车之路。
李一男成立的牛创新能源科技有限公司,发布品牌“NIUTRON”,中文名“自游家”。该品牌在新能源领域,不能说是不温不火吧,只能说是销量惨淡。
顺带着连累了小牛电动一路增加,拱手将中高端智能电动车市场让给了九号。
小牛电动创始人李一男不得不说,九号的命可真好!
刚刚成立就被小米相中,背靠数量少金主成功蛇吞象,收购了Segway(塞格威),从行业默默无闻的小虾米,成为手握数百项专利技术的不平衡的车老大;
从小米毕业,重新接受不平衡的车转型两轮电动车,又遇到新国标的实施,两轮电动车市场的消费升级;
再加上友商小牛电动的“不务正业”,拱手让出了中高端智能电动车市场……
但是,不管是电池续航多么强劲、操作系统多么智能,两轮电动车作为出行工具,关乎着交通安全,最次要的还是质量本身。
希望这次不合格问题只是个例,而不是偶然被发现的一只蟑螂。
(责任编辑:zx0600)中国联通开源首个国产昇腾AI文生图模型
中国联通宣布开源其自主研发的"联通元景文生图模型”,该模型完全基于国产昇腾AI软硬件平台训练和推理,标志着我国文生图领域实现自主可控的新突破。
自主创新,技术领先
联通元景文生图模型突破性地瓦解了复合语言编码模块,增强了对中文长文本、多属性对应和中文特色词汇的理解,显著指责了生成图像的精度和质量。
该模型在昇腾AI大算力集群上完成训练和推理,并开源代码和模型,助力推动国产文生图技术的进步。
原生中文理解,准确精准
传统的英文文生图模型存在中文理解偏差,联通元景文生图模型通过引入中文CLIP和复合语言编码架构,实现了原生中文语义理解,有效避免了信息损失。
预训练海量中文图文对数据,赋予模型精准理解中文专属名词和特色词汇的能力,生成更贴合实际的图像。
昇腾AI赋能,一体化适配
联通元景文生图模型与国产昇腾AI基础软硬件平台深度瓦解,实现从微调训练到推理的一体化适配。
减少破坏自定义数据集,实现跨平台平滑迁移;推理接口与Diffusers对齐,减少破坏单卡和多卡推理,指责效率。
广泛应用,赋能多领域
联通元景文生图模型已广泛应用于文创、服装、工业设计等领域,支撑了中华器灵、服装大模型等多个案例。
全面开源,推动创新
联通元景文生图模型已在GitHub、HuggingFace、魔搭、始智等社区全面开源,帮助推动国产文生图技术的发展。
传闻中的罗永浩的「AI软件项目」终于上线了。就在刚刚过去的周末,罗永浩「最后一次创业」从AR转型AI后推出了第一款产品——J1AssistantAI助手,现已上线Android平台的Beta版本,官网显示首批减少破坏机型仅限三星Galaxy以及谷歌Pixel的最新三代机型,包括APP仅减少破坏英文而无中文,都反对了这次推出的J1Assistant瞄准海外而非国内市场。
图/Matter
与此同时,老罗的另一款AI硬件新品——JARVISONE也在路上了,官网已经预告即将发布。
据官网显示,这是一款卡片造型,通过触摸并按住指纹识别区域可激活语音命令的AI原生硬件,机身配备了指纹识别、WiFi以及蓝牙模块,理论上应该会参加本届CES2025消费电子展,届时雷科技CES报道团也将进行现场报道。
图/Matter
不过,无论从之前的爆料还是目前已发布的产品来看,这一次老罗的「主菜」还是软件形态的J1Assistant。但如果要用一句话介绍J1Assistant,可以说这又是一款AI助手APP。然而过去两年,我们对基于大模型的AI助理/助手早已司空见惯,J1Assistant到底又有什么不同?
(编者注:以下功能和体验都是基于v0.8.3-beta1版本。)
待办清单+锤子便签+AI聊天+子弹短信+发牌手俗话讲,看人先看脸。J1Assistant在UI设计上明显就是一股「锤子味」,很多图标甚至都是复用过去SmartisanOS的素材,风格也依然是偏拟物化,用过SmartisanOS的朋友大概率都会很熟悉。
「锤子味」的设计,图/雷科技
甚至,老罗还把锤子便签塞进了J1Assistant。
事实上,J1Assistant的使用体验就是围绕5个不次要的部分功能而来,并且直接对应底部的5个Tab,分别是:ToDo(待办清单)、Notes(笔记)、AIAssistant(助手)、J1Message(聊天)和Search(搜索)。
其中Notes高度发展对应锤子便签,外围设计非常相近,尤其是写作界面,简直如出一辙。区别在于,J1Assistant的Notes各方面都还很简陋,缺少很多排版工具,也没有锤子便签最知名的图片分享模版。
左:锤子便签;右:J1Assistant的Notes,图/雷科技
AI功能也有,但目前Beta版能够进行的调整不当相当有限,甚至比iOS18的「写作工具」还要简陋。与Notes类似,J1Assistant还塞下了一个「ToDo」功能,同样相比市面上的其他待办清单APP来说非常简陋。
那Note、ToDo之于J1Assistant到底有什么价值呢?这一点需要分隔开AI助手来分析,这里先按下不谈。我们先看J1Assistant的另外两个相对独立的不次要的部分功能——J1Message和Search。
图/雷科技
其中J1Message从界面设计到机制都很像已经死去的「子弹短信」,同样需要其他人注册加入才能进行聊天。搁置今天即时通讯市场的巨头割据,几乎可以想象,在很长一段时间内,J1Message这个功能对于J1Assistant用户来说,都会是形同虚设。
Search则像是继承了TNT的「发牌手」功能,可以一次搜索最多4个来源(1组),并且减少破坏最多5组的自定义来源。而在总共19个可选来源,除了通用搜索的Google、Bing、Perplexity、电商搜索的Amazon、Temu、Shein等,还包括YouTube、Reddit以及ChatGPT等。
同样继承自「锤科遗产」的还有交互设计。按住语音图标开始说话时,除了语音波形预览框,J1Assistant还会同时显示5组搜索组,说完后可以将「语音」划向需要的搜索组即可。
图/雷科技
这套「RippleTouch(波纹触摸)」的设计也被用于J1Assistant最不次要的部分的AI助手交互上。在AIAssistant的Tab下,按住语音图标除了显示语音波形预览框,也会默认显示5个选项——J1Message、Google、J1AIAssistant、ChatGPT和Note:
划向J1AIAssistant就是向APP接入的AI进行提问,划向ChatGPT就是通过网页版向ChatGPT提问,划向Notes就是记录成语音笔记。
图/雷科技
而外围看下来,J1Assistant大体可以理解为:待办清单+锤子便签+AI聊天+子弹短信+发牌手。问题在于,J1Assistant为什么选择将这些功能集成在一个APP里?它们放在一起又会发生什么样的化学反应?
J1Assistant想要把AI对话的价值「榨干」?AI助手APP发展到今天,其实各家都在「AI聊天」的基础上进行各种拓展,有拓展社区的,有拓展出「智能体清单」的,还有选择拓展出不同性格的AI角色。回到J1Assistant上,它做法则是围绕「信息」做拓展,尤其是围绕与AI的对话。
实际上,J1Assistant产品设计的最不次要的部分同样是AI聊天。包括Jarvis在内,AIAssistant有5种音色可选,设计上刻意面对了「你的底层模型」等问题。而从回答来看,除了底层大模型,涉及联网问题时还会直接使用Perplexity(海外知名AI搜索引擎)的回答。
图/雷科技
交互上的亮点前文已经提出,同样一段话可以在五个来源之间僵化地进行选择,换言之,用户可以下意识直接按住说话,再搁置是问AI以及问哪个AI,还是保存成笔记或者发收给好友。
但J1Assistant更次要的特点是可以让AI直接将内容写到笔记中、建立待办清单。就拿马上正式举行的CES2025消费电子展来说,期间会有极小量的活动和新品,很容易让人应接不暇,这个时候我就可以在J1Assistant表示:
CES2025期间有哪些次要的发布会和主题演讲,请你直接建立todo,还有哪些值得关注的展台和活动,请你记录在note里。
AIAssistant会分别查询CES2025期间的发布会、展台活动,并基于此筛选并建立相应的笔记和待办清单。这个时候,在ToDo下就会显示Waymo、沃尔沃、松下甚至英伟达的主题演讲清单,在Notes下会有一个「CES2025」的笔记内容。
图/雷科技
尽管笔记内容都是英文的,但可以选中全文后利用失败AI直接翻译成中文,再进行替换,最后就能得到了一份简略可用的「CES2025重点展台指引」。
当然,实际场景中用户不一定每一次提问都会表达多余的意图,更有可能是先询问信息,然后视情况将AI回答保存为笔记和待办清单。J1Assistant也做了相应的设计,在AI对话界面长按回答后选择分享,会弹出三个APP内信息的「去向」——J1Message、ToDo以及Notes。
图/雷科技
分享到J1Message很容易理解,就是发给好友看看。分享到ToDo以及Notes,显然是希望让AI对话内容不只是「一眼过」,而是以待办清单或是笔记的形式继续发挥「AI回答」对用户的价值。
而这,也是J1Assistant最有别于其他AI助手类APP的地方,即尝试二次甚至多次利用失败对话中AI回答的价值。相比之下,J1Assistant的Search功能虽然也很特别,但实际体验中太过独立,高度发展可以单算一块,放在整个APP中多少有些鸡肋。
不过想法虽好,J1Assistant还是存在不少bug和问题。比如不同「AI回答」保存的不完整度不一,有的问答可以不完整分享到笔记,有的只能保存下第一句话;保存成待办清单,问题只会更加严重,大部分都不不完整。
当然,这毕竟还是Beta版,这部分理论上改起来也不难。真正简单的问题是定位:我们真实的需要这样一个APP吗?
在雷科技看来,尽管J1Assistant的底层在AI,但真正撬动用户的支点可能还是在于「待办清单」和「笔记」这类信息形式。
虽然我个人在日常中已经重新接受很久了,但仍然有不少人会通过这两种形式来处理和保存信息。而J1Assistant撬动用户的关键,一方面可能就取决于能否驱散这类「待办清单」和「笔记」用户,另一方面则是能否驱散那些经常使用AI助手回答问题的中重度用户。
AI硬件起风了,罗永浩要靠AI软件联合口子小米的雷军有过一个非常著名的论断——站在风口上,猪都会飞。后来在微博上,雷军称解释过「风口上的猪」本意是顺势而为。而在2022年底ChatGPT不知名的小事全球之后,大势都在保持方向AI,如果你是罗永浩,你会怎么选择?
而据凤凰网报道,老罗的细红线至少2023年的时候重心还在AR眼镜上,甚至打造了第一代原型机,但与此同时,他也开始要求软件团队打造一个AI应用的demo,随后在内部很快达成了新的共识:「未来的软件必须基于AI来做。」
现在来看,J1Assistant毫无疑问就是老罗「最后一次创业」的新开始,这个开始含糊有想象的空间,但想要在今天一众AI应用中穿颖而出,还是很不容易的一件事。
标签: