
发布日期:2024-12-20 13:51 点击次数:68
偷偷撸改成什么了
(图片开端:钛媒体 AGI 裁剪林志佳拍摄)
跟着 AI 大模子赛谈进入"深水区",苹果智能(AI)遴荐中国 AI 大模子配合一事激发关注。
12 月 19 日音书,有报谈称,苹果正在和腾讯、字节杰出商谈,将两家公司的 AI 模子混元(元宝)、豆包大模子整合到在中国销售的 iPhone 开荒中,但谈判仍处于早期阶段。在此之前,苹果 AI 与百度配合音书不胫而走,但如今却表现两家企业配合存在一定拦阻。
对此,腾讯方面"不予置评",18 日钛媒体 AGI 曾向字节杰出旗下火山引擎总裁谭待研讨关连议题,他修起称,"国内安卓手机份额比苹果更高",并未进一步平直修起此事。
值得一题的是,12 月 19 日,北京智源东谈主工智能研究院(智院研究员)发布国表里 100 余个开源和买卖闭源模子多份评测收尾,行动本年英伟达群众第二大买家、领有 23 万张 GPU 的字节杰出豆包大模子名列三甲,话语模子收尾字节杰出的豆包 Pro、百度 ERNIE 4.0 Turbo 模子位居第一、第二;视觉话语模子方面,OpenAI GPT-4o 与刚刚发布的豆包 · 视觉并吞模子 Doubao-Pro-Vision 位列第一和第二名,才略位列第一梯队,远超大模子"六小虎"、百度、腾讯等公司研发的多款 AI 大模子。
"字节豆包太猛了,不管是干预照旧自身(流量)资源,这给大模子‘六小虎’(智谱、百川、零一、月之暗面、MiniMax、阶跃星辰)带来很大压力。"一家 AI 大模子公司里面东谈主士告诉钛媒体 AGI 现存看法。
在 OpenAI o1 大模子压力下,互联网大厂发力 AI 大模子时代和买卖化,一经对 AI 行业形成一定承压。
对此,19 日下昼,智源研究院副院长兼总工程师林咏华对钛媒体 AGI 默示,字节豆包、快手在大模子才略上的上风有两方面:一是话语模子自己要束缚的"数据飞轮"进行教师,而大厂有自然、很强的流量上风,无疑模子才略更强,尤其是主不雅评测上还可以;第二、文生图、文生视频模子规模,字节快手的上风在于高质地短视频数据层面,比拟非互联网厂商有昭彰上风。
林咏华强调,将来大模子平台会分化成两类,即"基础通用大模子"和"智能体开荒平台"。在这其中,通用基座模子具有一定的投资挑战,需要更多资源,而国内有实力的机构包括阿里通义千问、清华系企业(智谱、月之暗面等),上海 AI Lab 等都在执续迭代底层模子平台,这对于 AGI 发展十分紧迫。
收尾 12 月 19 日收盘,百度(9888.HK)跌 4.16%,腾讯(0700.HK)涨 2.27%。
字节豆包、腾讯混元青出于蓝,苹果在考验中国大模子时代
面前苹果公司正对字节杰出、腾讯、百度等公司张开一场全面的注视,提神考验中国 AI 大模子时代实力,并从 "公论场" 中进行筛选评估。
据路透 12 月 19 日报谈,苹果公司正与腾讯、字节杰出就将其东谈主工智能模子整合到在中国销售的 iPhone 中进行谈判,但关连磋商尚处于绝顶早期的阶段。
在此之前,苹果公司尝试与百度进行配合,积极探索通过百度"文心一言"大模子来为中国用户引入 AI 功能。不外,两边的配合并非一帆风顺,有报谈称,苹果为国行版 iPhone 适配百度大模子时遭受了诸多问题,比如 AI 在常见使用场景中,就无法给出准确的修起。
事实上,本月,苹果运行在其开荒中实行 OpenAI 的 ChatGPT,行动 Apple Intelligence 家具的一部分,该家具允许 Siri 语音助手行使该聊天机器东谈主的专科学问,包括处理用户对于相片和文档(如演示文稿)的查询。
然则,由于 ChatGPT 在中国无法使用,苹果需要寻求土产货配结伙伴以兑现其 AI 功能,但苹果智能中国配结伙伴执续发生变化。
一朝苹果 iPhone 能内置字节杰出的"豆包"、腾讯的"混元"大模子时代的话,会对这两家公司 AI 业务发展具有很紧迫的影响。
本年 3 月,苹果公司财报骄横,其一经领有杰出 22 亿台活跃的苹果开荒,比客岁加多近 4 亿台。另据摩根士丹利论述骄横偷偷撸改成什么了,Apple Intelligence 功能将成为苹果开荒多年升级周期的"显赫催化剂",将来两年,iPhone 出货量将杰出 5 亿部,掂量 2025 财年、2026 财年出货量分裂为 2.35 亿、2.62 亿部。
站在苹果角度看,中国 AI 大模子时代才略和干预力度犀利常紧迫的"两环"。而在这其中,字节杰出、腾讯都领有很强的阛阓竞争才略。
其中,大模子时代才略层面,字节杰出"豆包"青出于蓝,名列前矛。
林咏华坦言,国内 AI 大模子行业运行出现"分层",有更多公司模子的教师才略达到"应用的可能性";也有一些公司也在往 AGI 标的、往限制更大、开源标的发展。本年度两期评测当中,2024 年 5 月假话语模子 56 家,到年底 12 月减少到 46 家,多模态在 5 月是 32 家,到 12 月增至 42 家。
12 月 19 日,基于群众 800 多个开闭源模子,智源研究院发布最新大模子评测平台 FlagEval 收尾,包含 20 多种任务,90 多个评测数据集,超 200 万条评测题目。收尾骄横,主要包括话语、视觉话语、文生图、文生视频、语音话语大模子概括及专项评测等九个方面。
其中,话语模子:字节杰出 Doubao-pro-32k-preview、百度 ERNIE 4.0 Turbo 位居第一、第二;在话语模子客不雅评测中,OpenAI o1-mini-2024-09-12、Google Gemini-1.5-pro-latest 位列第一、第二,阿里巴巴 Qwen-max-0919、字节杰出 Doubao-pro-32k-preview 位居第三、第四,Meta Llama-3.3-70B-Instruct 排名前五。
视觉话语多模态模子:OpenAI GPT-4o-2024-11-20 与字节杰出 Doubao-Pro-Vision-32k-241028 先后最初于 Anthropic Claude-3-5-sonnet-20241022,阿里巴巴 Qwen2-VL-72B-Instruct 和 Google Gemini-1.5-Pro 紧随自后。
文生图多模态模子:腾讯 Hunyuan Image 位列第一,字节杰出 Doubao image v2.1、Ideogram 2.0 分居第二、第三,OpenAI DALL · E 3、快手可图次之。
文生视频多模态模子:快手可灵 1.5(高品性)位列第一,字节杰出即梦 P2.0 pro、爱诗科技 PixVerse V3、MiniMax 海螺 AI、Pika 1.5 排名第二至第五名。
语音话语模子:专项评测收尾骄横,阿里巴巴 Qwen2-Audio 位居第一,香港华文大学 & 微软 WavLLM、清华大学 & 字节杰出 Salmon 位列第二、第三,Nvidia Audio-Flamingo,MIT & IBM LTU 均进入前五。
K12 学科磨真金不怕火:概括得分相较于半年前擢升了 12.86%,而在英语和历史文科试题的证明上,已有模子超越了东谈主类考生的平平分,合座来说,阿里、OpenAI、阶跃星辰模子证明不俗。
此外,FlagEval 大模子角斗场,是智源研究院本年 9 月推出的面向用户绽放的模子对战评测处事,共有 29 个话语模子、16 个图文问答多模态模子、7 个文生图模子、14 个文生视频模子参评,最终 OpenAI、快手、字节杰出、腾讯的大模子排名前哨;模子辩白平台 FlagEval Debate 方面,Anthropic Claude-3-5-sonnet-20241022、零一万物 Yi-Lighting、OpenAI o1-preview-2024-09-12 为前三名;金融量化往来评测收尾骄横,深度求索 Deepseek-chat,OpenAI GPT-4o-2024-08-06,Google Gemini-1.5-pro-latest 位列前三。
很昭着,与好意思国 OpenAI 的竞争中,从模子层,到软硬件协同鼓吹,字节杰出已站稳 AI 大模子头部地位。
本年 11 月的群众月活跃排名榜上,豆包 App 的 MAU(月活跃用户数)接近 6000 万,仅次于 OpenAI 的 ChatGPT,位列群众第二;收尾咫尺,豆包大模子日均 tokens 使用量杰出 4 万亿,发布 7 个月以来增长杰出 33 倍。
12 月 18 日,火山引擎总裁谭待通知,豆包视觉并吞模子输入价钱仅为 0.003 元 / 千 tokens,1 块钱可处理 284 张 720P 的图片,比行业价钱低廉 85%。
谭待对钛媒体 AGI 表示,咫尺国内安卓手机大部分都在和豆包配合,敌手机厂商来说,会在某些场景用豆包,某些场景用其他的大模子,省略某一个场景混杂使用,对企业用户来说,详情也需要一个多云省略多模子的政策,"最终照旧才略更好、成本更低,就会用谁,这笔账就很好算。"
谭待强调,面前字节并不关注阛阓竞争,因为大模子阛阓仍处于早期阶段,更多是场景、需求是否被得志。恒久来看,大模子 C 端和 B 端、臆造和推行天下场景都应该是皆头并进发展。
"这个阛阓还在很早期,可能千分之一刚刚开荒出来。这个期间其实无须祥和竞争的问题,需要祥和的是用户的需求有哪些还莫得被得志。"谭待默示,最枢纽的是能弗成把东西作念好,把决策的落地应用作念好。"咱们有期间跟客户说,你每家都碰侥幸,然后就知谈跟谁来作念,这是一个很当然的好意思瞻念,况且也不触及话语权高和低的问题。"
林咏华默示,2024 年下半年,AI 大模子发展更聚焦概括才略擢升与本色应用。多模态模子发展速即,知道了不少新的厂商与新模子,话语模子发展相对放缓。模子开源生态中,除了执续坚决开源的海表里机构,还出现了新的开源孝敬者。同期,收获于文本大模子的进步,语音话语模子才略擢升稠密,遮蔽面更全,但在具体任务上与人人模子还存在一定差距,合座而言,性能好、通用才略强的开源语音话语模子偏少。
林咏华强调,部分 AI 大模子公司一经转向了 Agent 应用层标的,将来要是提高效果、形成更平庸应用的话,需要 AI 公司在推理端发力。
OpenAI CEO 奥尔特曼(Sam Altman)曾断言:"咱们会有越来越好的模子,但我以为下一个稠密突破将是 AI Agent 智能体。"
本年采购 46 万张 GPU 卡,AI 大模子企业加快"内卷"干预
除了时代才略,字节杰出、腾讯依然"卷"算力,两家合计买了 46 万张英伟达 GPU 芯片,成为英伟达群众第二大买家。要知谈,本年英伟达总销售数目才达到 200 万张 AI GPU 盘算卡。
具体来说,研究机构 Omdia 论述骄横,微软本年采购了约 48.5 万片英伟达 Hopper 架构的 H100/H200 GPU 盘算卡,是其 2023 年购买的同代英伟达 AI 处理器数目的三倍多,比肩排名第二是两家中国公司——字节杰出、腾讯,都分裂采购约 23 万片英伟达 GPU 芯片,超越 Meta、亚马逊和谷歌等好意思国科技巨头。
上述论述骄横,到 2024 年,群众科技公司将在处事器上破耗约 2290 亿好意思元,其中微软的成本开销 310 亿好意思元,亚马逊的成本开销 260 亿好意思元,数据中心基础体式前十大买家投资占比达 60%。
Omdia 云盘算和数据中心研究总监 Vlad Galabov 默示,到 2024 年,处事器开销限制约 43% 将流向英伟达,"咱们一经接近峰值了。"
微软 Azure 群众基础体式高等总监斯皮尔斯 ( Alistair Speirs ) 默示,"致密的数据中心基础体式绝顶复杂,是成本密集型形态,需要多年的磋商。因此,预测咱们的增长将在那里,并留出小数缓冲空间,这很紧迫。"
谭待则以为,AI 的出现让总共的基础架构从 CPU 转向 GPU 为中枢,从而使得"云原生"见识变得十分紧迫。"咱们以为将来 10 年其实 AI 云原生是更紧迫的事情,将来可能从基础架构规模即是很大的变化,从云原生到 AI 云原生,火山但愿作念成这块的领军企业。"
谭待强调,AI 大模子的场景很紧迫,不仅需要平台和算法,况且需要处事,匡助企业辩认 AI 大模子使用场景,从而作念好 AI 时代落地。
2019一本大道香蕉大在线林咏华指出,咫尺优秀、开源的话语模子一经发展到了一个基础才略水平,再出现昭彰的增长详情不是特等容易,并非拼更大的参数或更多的数据,而是需要更多潜入的革命才略。咫尺,话语模子就进入到一个"深水区",原因在于"深水区"有更大的收益、革命难度。但多模态模子层面,一些基础才略照旧有昭彰的增漫空间,来岁多模态模子会比比皆是。
掂量将来,林咏华强调,AI 大模子"数据"并莫得所谓的"花费"。十年前,互联网数据占群众数据量份额接近 5%,如今到 2021 年 -2024 年降至 1.3%,但群众使用华文上网的东谈主数一直没变约 19%,是以稠密的互联网华文数据形成了"孤岛",因此,突破 AI 模子教师的数据孤岛将变得十分枢纽,而"合成数据"措置的是更复杂的问题和标的,是愈加高效产生数据的一种形势。
"咫尺,国内的 AI 视频生成模子的证明其实与外洋(sora)出入无几。"林咏华称,2025 年,FlagEval 评测体系的发展将进一步探索动态评测与多任务才略评估体系。
(本文首发于钛媒体 App,作家|林志佳,裁剪|胡润峰)