今天随便翻了翻X,看到了 Sam Altman 7月底发的一篇推文,说的是他在 Washington Post 上的一篇文章,Who will control the future of AI? ,从他说的 U.S. need to maintain its lead in developing in AI
来看,就显然可以看出他不会是那种希望全球共同发展AI的和平主义者,而是更希望美国进行独裁的支持者。之前对于他的各种新闻我也看过了很多,更对于 OpenAI 的发展也是越来越抱有怀疑态度,尤其是从之前的内部动乱到后来 Karpathy 大神的离职,感觉 OpenAI 逐渐就是变成他的 CloseAI,而且现在无论是闭源的 Anthropic 还是开源的 Meta ,都隐隐有着超越之势,也许不久的将来,OpenAI 会被拉下神坛。
他的这篇文章主要是有这么几个观点:
- 美国的 AI 公司和行业需要制定强有力的安全措施,以确保我们的联盟在当前和未来的模型中保持领先地位,并使我们的私营部门能够创新;
- 基础设施决定 AI 的命运;
- 必须制定一个连贯的 AI 商业外交政策,包括明确美国打算如何实施出口管制和外国投资规则,以全球构建 AI 系统;
- 需要创造性地思考建立新模型来确立开发和部署 AI 规范的世界,特别关注安全性并确保全球南方和其他历史上被落下的国家的角色。
从他的角度来思考,他希望美国作为 AI 领域的领导者其实也是合理的,就像我们也会希望中国能达到行业的领先地位。但从这一点可以看出,我们国内的开发者们的确需要考虑不要过分依赖国外的模型或服务,可以将目光也放到国内的一些厂家,虽然一开始我也觉得国内这些大模型公司只是为了一些 KPI 而强行退出的大模型一定很难用,但从这一年各家的成果以及体验来看,和他们相比还不是无法越过的差距。
从 GPT3.5 发布至今, 实力最强劲的还是 OpenAI 和 Anthropic 两家,尤其最近 Anthropic 的发展趋势也有隐隐超过 OpenAI 的意思,我也不止一次在考虑要不要把 ChatGPT 的会员停掉换到 Claude , 但目前还在等到他将 OpenAI 彻底击败的时刻。而国内现在的大模型公司则是百花齐放,而且头部企业也有将自己的模型进行开源或部分开源,比如 Qwen2 还登顶了 HuggingFace 的 LLM Leaderboard ,虽然最近发布的LLaMA 3.1 可能更强,但由于它不支持中文,因此我想最强的开源中文大模型可能还是得属于 Qwen2 。
从 LLaMA 不支持中文的特性也许也能看到一丝跟 Altman 一样的想法,就是美国需要维持模型中的领先地位,这么大参数规模的模型,就算进行中文微调,感觉也不一定能达到英文的水平,那么具体对于国内开发者或企业而言,也许就不会是首选的开源模型。
不过这并不意味着国内开发者就没有好的选择。相反,国内的大模型生态正在快速发展,并且逐渐涌现出一批优质的模型。例如,除了 Qwen2,还有深度求索的 Deepseek, 智谱的 ChatGLM等,都在特定领域表现出色,并且在中文处理上有着天然的优势。对于需要进行中文大模型任务的开发者和企业,这些模型显然是更好的选择。
我个人现在算是忠实的 Deepseek 拥护者,因为没有足够的硬件支持,使用的是他的API,现在是只要有大模型API调用的需求,我首选就是 Deepseek, 而且就在8月2日,他们还上线了硬盘缓存 的能力,我在半个月前还有问他们客服多轮对话的 token 计算问题来着,因为多轮对话每次都要把前面轮次的所有内容全部传进去,导致 token 的使用还挺大的,没想到这么快他们就上线了缓存能力,本来就是比白菜价还白菜价的费用,现在更是划算了。(深度求索打钱😄)。
当然闭源的模型产品如月之暗面的 Kimi, 字节的豆包,都是有着比较好的用户体验,我平常使用的比较多的国内闭源模型产品就是 Kimi,至少从模型表现上还是不错的,尤其是进行文章的阅读以及之前我自己写的 Paper-Agent ,都是使用Kimi的模型能力。
在这样的背景下,国内开发者应该更加关注本土化的发展机遇和挑战。尽管目前国内外在AI技术上的差距仍然存在,但这种差距正在逐渐缩小。通过积极参与开源社区,推动技术共享与合作,国内的AI生态系统有望在未来几年内实现更大的突破。作为个人开发者或者中小型企业也许没有参与基座大模型的战场,但从模型的应用上,还是有着很大的市场空间。
虽然想要真正的进行模型商业使用,如果不使用模型产商的api而是进行私有的训练或部署,小体量的模型很难上战场,大体量的又承担不了成本。可未来会一直维持这样的尴尬境地么?我想不会,正如最近贾扬清说的 Is LLM model size re-walking the path of CNNs?
以及 Karpathy 说的 LLM model size competition is intensifying… backwards!
,未来大模型的发展可能会逐渐变成尺寸越来越小的模型,而硬件的发展也有着黄仁勋的黄氏定律(虽然咱国内不一定能用上最强版本),因此对于大模型行业,资源成本应该是逐步降低的趋势的。
最后,尽管美国在AI领域拥有显著的先发优势,但全球AI技术的竞争格局正在发生变化。各国在技术创新、政策制定和市场应用方面的互动与博弈,将深刻影响AI的未来发展路径。对于每一位AI从业者而言,如何在这一快速变化的环境中抓住机遇,实现技术与应用的创新,是一个值得深思的问题。