在上个月与大家分享的AI 2023上半年小结文章当中,我提到Meta藉由LLaMA已经在AI开源社群取得了相当程度的领导地位。现在Meta趁胜追击,今天大动作推出LLaMA 2,要更加巩固自己的地位。
相较於第一代的LLaMA(喇嘛,我还是喜欢这个名字),喇嘛二代用了两兆个token(可以简单当做是文字的数量) 来训练,并且提供了4096字数的前後文输入长度,比前一代长了一倍。
最近AI的研究社群很爱比长度,大家在拚语言模型一次可以吞下去的token数量,因为这有助於语言模型展现出更完整的前後文推理,让这些AI表现更好。
OpenAI的ChatGPT、Anthropic的Claude,和一些刚刚发表的研究宣称,已经将token长度已经分别扩展到3万2768、10万和100万。LLaMA 2看起来似乎短了点,不过别忘了,这当中唯一开源的就只有LLaMA 2。
Meta在公布LLaMA 2的论文当中提到,LLaMA 2的能力依旧不如GPT-4。不过,这恰恰凸显出OpenAI的一个大麻烦:未来,每个企业都要有一个自己的AI大脑作为运作中心,但这个AI大脑并不需要像GPT-4这麽强大、这麽昂贵。
企业要的是客制化、能够解决自己商业问题、「学有专精」的AI就好,他们并不需要一个无所不知的AI天神。GPT-4给OpenAI去玩就好。
所以从上半年以来,自从「缩小大脑」(也请参考我之前的文章)的AI军火竞赛开始以来,整个趋势不仅还在加速当中,LLaMA 2又是达成了一个新的里程碑,因为LLaMA 2不仅完全开源,而且Meta在今天还发表了一个非常重要的合作。
Qualcomm与Meta携手,将把LLaMA 2放在你的手机晶片里面,2024年这件事情将会成真,意味着Meta在AI的边缘运算市场取得了先发优势。其他Big Tech公司像是Google、Apple、Amazon在这边暂时落後了一步,并没有与LLaMA 2相对应的竞争开源模型。
别忘了当年Google是靠着Android这个开源软体,应是把手机的作业系统市占率给寡占了下来,Meta当年错失了手机的发展机会,只能依附在Apple和Google的生态上,时不时在隐私权和广告商业模式上被刁难,一直以来三家公司的争吵从来没有平息过。
今年以来祖老板毅然决然不再谈元宇宙,把整艘Meta大船转了一个大弯全力拥抱AI,靠着(意外泄漏的)LLaMA第一代打开了一个新的竞争局面,有机会更深入到我们每个人的手机里面去(是还要多深入?)。
别忘了我们一直以来在讲的,任何的数位生意,打的都是一个生态系的战争,而Meta整合AI晶片、开源AI模型、搭配原有的强大网路效应这3个重要武器,在Google和OpenAI / Microsoft两个巨头对撞之时,横空出市打开了一个新的AI战场,打算一路从社群网路应用,垂直往下钻到你的手机运算晶片里面。
至此,已经验证了我之前提到的,任何人说Meta在整个 AI 战争当中缺席或是落後,是完全错判情势。
Meta不是後发先至,而是从一个完全不同的竞争角度切入这场AI大战。大家现在还时不时在嘲笑祖老板的元宇宙,不过他真的很厉害,而且我一直主张,AI 的发展只会加速元宇宙的发展,几年後回头来看的话,祖老板只是暂时绕个路而已。
外传Meta已经在内部测试把LLM大语言模型大规模布署在messenger上面,身为一个全世界最大的对话平台,要大量创造出现在很夯的虚拟人(digital human),没有比Meta旗下平台更适合的地方,我也相当肯定Meta会快速切入这块市场。
所以近来如雨後春笋般出现的生成式AI公司,像是character.ai这家虚拟人公司也倍感压力,毕竟科技巨头一旦跟上来,摆摆尾巴,这些公司都会直接被扫到受重伤。
网路效应终究还是Big Tech们掌握的最有利护城河,下半年将会是这些科技巨头的主场,纯粹靠着生成式AI技术创业,至今却没有明显护城河的生成式AI新创,包括OpenAI在内,都会面临极大的竞争压力。
随着LLaMA 2的重磅发布,产业界也将各自带开,遍地开花拿着越来越多的开源模型建构自己的AI应用,那些小心翼翼、把「独家大语言模型」当做商业秘密和主要竞争优势的公司,像是OpenAI或是Anthropic,如果不再尽快建构出整个AI生态系,成为新的网路入口,将会被Big Tech既有的生态压着打,最好的下场也许顶多是被吞噬成为一部分。
建构新的生态系谈何容易,这些公司下半年将面临关键的生死存亡时刻。
真的好快。
本文经程世嘉授权转载,原文刊载於此