关于 AI 烧钱,,,,,业内撒播着种种令人瞠目结舌的数字。。。。。xAI 花了凌驾 10 亿美元建起 Colossus 超算集群;;;OpenAI 的月度算力账票据称高达数亿美元;;;Anthropic 最近几轮融资拿到的钱,,,,,在公众眼里险些已经和「GPU 时数」直接画上了等号。。。。。
但最近,,,,,我听了一期 Latent Space 播客,,,,,采访工具是 xAI 前研究员 Ethan He——Ethan 在 2025 年中加入 xAI 时,,,,,面临的是一个没有基础设施、没有数据、没有现成模子的白纸状态,,,,,然后用三个月时间和一支小团队,,,,,从零搭建出了 Grok Imagine 视频天生系统,,,,,做到了其时业内的一流水准。。。。。
从零到一,,,,,最先训练一个视频大模子,,,,,需要花几多钱???????先假设你的团队有矿,,,,,GPU 算力随便用。。。。。即便云云,,,,,你可能依然低估了这件事的巨量本钱。。。。。
假设你要训练一个天下级的视频天生模子,,,,,去网上爬取了 10 亿条视频,,,,,每条平均 5MB——这已经是相当守旧的预计了。。。。。光这一项,,,,,你就需要 5PB(拍字节)的存储空间。。。。。凭证 AWS S3 的定价,,,,,5PB 标准存储,,,,,每个月约莫 10 万美元。。。。。
在训练视频模子之前,,,,,业界通行的做法是先用 VAE(变分自编码器)把视频压缩成「潜在空间」的特征向量——由于一段视频睁开成像素,,,,,可能有几十亿个 token,,,,,任何 Transformer 都处置惩罚不了,,,,,必需先压缩成模子能明确的一连向量。。。。。
Ethan 说,,,,,从互联网下载 10 亿条视频的带宽用度,,,,,在 AWS 上比存储这些视频还贵。。。。。每次训练,,,,,数据都要从存储层拉到盘算层跑一遍。。。。。视频模子的训练不像语言模子那样训完就完了——要迭代,,,,,要调参,,,,,要测试差别的数据配比,,,,,每一次实验都意味着把全量数据再过一遍。。。。。实验跑得越多,,,,,这笔钱就乘以响应的倍数。。。。。
大语言模子的训练数据是文本,,,,,体积相对轻量,,,,,并且训练完成之后,,,,,原始数据基本就完成了使命——你不需要重复拉取全量语料来做推理或微调。。。。。但视频数据完全差别:体积是文本的几个数目级,,,,,并且每一次训练实验都要把全量数据完整过一遍。。。。。
这就形成了一个相互咬合的困局:你需要快速迭代来提升模子质量,,,,,但快速迭代意味着频仍搬运数据,,,,,而频仍搬运数据在公有云上的账单会把你压垮。。。。。
Ethan 自己的轨迹就是一个注脚。。。。。他在 NVIDIA 加入构建了 Cosmos 天下模子,,,,,做着做着意识到,,,,,视频模子保存和语言模子类似的「规模定律」,,,,,尚有很大的提升空间。。。。。他其时面临的选择,,,,,外貌看是「我需要更多 GPU」,,,,,但同样要害的一句话他没明说——他需要一个不必按 AWS 账单算钱的地方,,,,,来存放和搬运数据。。。。。这也是他去 xAI 的基础缘故原由之一,,,,,而 Colossus 给了他谁人情形。。。。。
关于没有自建基础设施的团队来说,,,,,这笔账是怎么算的???????每个月几百万美元的数据本钱,,,,,叠加在 GPU 算力之上,,,,,意味着哪怕你有一流的算法团队,,,,,哪怕你募到了足够的资金,,,,,只要你还在用公有云,,,,,你就是在用一个无底洞的账单跟敌手的自建机房赛跑。。。。。
在大语言模子领域,,,,,「开源 vs 闭源」的竞争打得相当强烈,,,,,Llama 系列的泛起让许多小团队也能在语言模子上打出有竞争力的产品,,,,,甚至逼着 OpenAI 和 Anthropic 一直压低 API 价钱。。。。。但在视频天生领域,,,,,我们看到的名堂截然差别:能一连做出顶尖视频模子的,,,,,基本只有 Sora、Veo、可灵这些背靠巨量资源的团队,,,,,没有一家是靠开源社区在车库里跑出来的。。。。。
许多人把这归结为「数据和算力的差别」。。。。。这虽然没错,,,,,但 Ethan 展现的这组数字告诉我们,,,,,问题比这更深:视频 AI 的基础设施本钱,,,,,从一最先就把竞争的门槛,,,,,锁死在了少少数玩家的高度上。。。。。
这和半导体行业的逻辑有几分相似。。。。。台积电之以是难以撼动,,,,,不但由于它们有更好的设计,,,,,更由于一座新晶圆厂需要几百亿美元的前期投入,,,,,这道门槛自己就是最好的护城河。。。。。视频 AI 的护城河,,,,,就是那数十 PB 的数据基础设施和每月转动爆发的带宽账单。。。。。
视频扩散模子相对「愚钝」,,,,,它只会凭证文字形貌照单全收地天生画面,,,,,形貌写「一只猫」,,,,,它就天生一只猫,,,,,站在纯白配景前,,,,,纹丝不动——由于你没有告诉它配景是什么、猫在做什么。。。。。
真正明确用户意图、把「一只猫」扩写成一段细腻的镜头语言形貌的,,,,,是背后谁人做「提醒词重写」的大型语言模子。。。。。Ethan 说,,,,,在 Cosmos 时期,,,,,他一经用一个「快乐的羊」做测试:不经由提醒词重写,,,,,天生出来的画面极其 CGI、毫无质感;;;加上重写之后,,,,,效果判若云泥——而整个视频扩散模子自己,,,,,并没有爆发任何改变。。。。。
这意味着,,,,,决议一家公司在视频 AI 领域能走多远的,,,,,不但是视频模子的参数规模,,,,,而是能否同时撑起语言模子和视频模子这两套基础设施,,,,,并让它们有用协同。。。。。
提醒词重写的 Agent 化、让语言模子像「指挥官」一样调理多个视频天生工具、用 FFmpeg 这类古板软件处置惩罚中心环节——这些偏向的配合逻辑是,,,,,把「语言模子的推理本钱」和「视频扩散模子的天生本钱」分层盘算,,,,,让每一次视频天生的挪用越发精准,,,,,镌汰无效的盘算和数据搬运。。。。。
Ethan 对「视频 Agent」的走向相当笃定。。。。。他展望今年年底将泛起一个拐点——当 Agent 天生的视频质量能够稳固抵达「可投放商业广告」的水准,,,,,企业才会真正愿意为之买单,,,,,整体的本钱结构也会随之演变。。。。。
在 AI 这个赛道上,,,,,「真正的壁垒」每隔一段时间就会轮换一次。。。。。先是参数目,,,,,然后是训练数据规模,,,,,然后是对齐手艺,,,,,然后是推理效率。。。。。现在,,,,,视频 AI 正在展现下一道壁垒——不是某种神秘的算法突破,,,,,而是一份冷冰冰的基础设施账单。。。。。
WWDC26 开。。。。。,,,,6 月 9 日午间 12:00,,,,,极客公园直播间带你解读:会发光的 Siri 来了,,,,,换上谷歌大脑还算苹果吗???????一直把门关得最紧的苹果,,,,,为什么自动向模子厂洞开大门???????库克在 AI 落伍的节点接班,,,,,留给888集团又会是一个什么样的苹果???????
《女人用了震动棒会增加腹压吗》选材与谋篇能力:在写自己喜欢的小动物时,两个班76孩子有73个能够像《猫》那样写一个优点再写一个小毛病,如“它很忠诚,每天等我回家;但它也很调皮,把我的袜子叼到床底下”。一个班35个孩子写敬佩的骆驼,32人尝试了“欲扬先抑”结构,真实的表达了对骆驼的情感。谈到球队丢球时是否已经有所松懈,马丁内斯表示:“我不这么认为。下半场我们通过运动战打进了两个球,这已经说明了问题。但我们不能在这种情况下吃到红牌,因为南美球队本来就很容易把比赛带入对抗和情绪当中。另外,我认为那次动作不该是红牌,因为双方球员都没有暴力行为。不过我们不会拿这个当借口,这场比赛也正好帮助我们在心理层面做好准备。”《女人用了震动棒会增加腹压吗》禁忌5词元出海的背后,离不开国内算力基础设施与硬件配套实力的稳步增强。原本抽象的电力资源、算力资源,如今变成能够计价、交易、跨境交付的数字化服务产品。词元,是人工智能大模型为了高效处理数据,把数据进行拆分后的最小信息单元。词元出海,即依托国内智算中心,以应用程序接口向境外用户输出大模型推理算力。今年以来,伴随海外AI需求激增,这项数字出海业务迎来高速增长。
20260609 ? 《女人用了震动棒会增加腹压吗》贵定县交通局作为行政管理部门,虽然对于事发道路具有法定的管护义务,但亦不能苛求其24小时在各道路进行巡查。而且依照《中华人民共和国公路法》第四十五条规定,跨越、穿越公路修建桥梁、渡槽或者架设、埋设管线等设施的,以及在公路用地范围内架设、埋设管线、电缆等设施的,应当事先经有关交通主管部门同意,故贵定县交通局对架设管线行为仅是同意与否,其同意的行为亦不代表其需承担法律责任,故贵定县交通局不应承担责任。《被迫成为试用员后BY我不吃鱼百度云》另一个原因是,这次 AI 的解法用到了较深的代数数论知识。这个领域学习门槛很高,很少有组合数学家会专门投入大量时间学习这些方法,只为了尝试解决一个特定的组合问题。反过来,代数数论专家虽然也有人考虑过这个问题,但他们对组合数学和离散几何的了解又未必足够深入。
20260609 ? 《女人用了震动棒会增加腹压吗》3月31日,民众在日本东京的日本防卫省门前集会抗议政府在熊本县和静冈县部署具备“对敌基地攻击能力”的远程导弹图:新华社《行情网站WWW/大全百度搜》据《记录报》报道,葡萄牙前国脚、巴黎圣日耳曼名宿保莱塔谈到了努诺-门德斯、若昂-内维斯、维蒂尼亚和贡萨洛-拉莫斯之间的默契。他认为,这4名刚随巴黎圣日耳曼完成欧冠卫冕的葡萄牙球员,将在2026年世界杯上让葡萄牙国家队受益。