每日文摘
每日教程
生活就像海洋,只有意志坚强的人,才能到达彼岸。
每日文摘
每日教程
首页
名言
文案
人物
标签
著作
推荐
搜索
—— 请按键盘
空白键
开始游戏 ——
梁文锋
DeepSeek创始人
梁文锋,男,1985年出生,广东省湛江市吴川市覃巴镇米历岭村人,浙江大学毕业,拥有信息与电子工程学系本科和硕士学位。杭州幻方科技有限公司、DeepSeek创始人。
我更关注一项技术是否提升了社会效率,以及我们是否能在行业价值链中找到自己的优势。只要最终目标是提升效率,就是有意义的。很多竞争都是阶段性的,过于纠结于短期竞争,反而容易迷失方向。
梁文锋
未来的世界很可能是一个高度分工协作的世界。基础AI模型需要持续创新,而大公司也有自身的局限,并不一定最适合承担这一角色。
梁文锋
在总结主流Attention架构的关键演化规律后,突然灵感迸发,设计出了一种新的替代方案。但从想法到现实,是一个漫长的过程。我们组建了团队,花了几个月时间验证它的可行性。
梁文锋
说实话,我们并不太在意。降价只是顺手而为。提供云服务并不是我们的核心目标,我们的目标是实现AGI。目前,我们还没有看到真正突破性的解决方案。大公司虽然有用户,但它们的“现金牛”业务也束缚了自身,给了创业公司颠覆它们的机会。
梁文锋
首先是训练效率的差距。我们估算,中国目前最好的模型,在算力相同的情况下,可能需要两倍的计算资源才能达到全球顶尖模型的水平。这是由于架构和训练策略的差距。其次是数据利用效率,中国的模型大约只有全球最优水平的一半,也就是说,同样的结果需要两倍的数据和计算量。两者叠加,意味着整体资源消耗是四倍。我们的目标是不断缩小这个差距。
梁文锋
如果目标是做应用,采用Llama的架构快速上线产品是合理的选择。但我们的目标是AGI(通用人工智能),这要求我们探索新的模型架构,以在有限的资源下实现更强的能力。这是规模化发展的基础性研究。除了架构,我们还深入研究了数据筛选和类人推理能力,这些都在我们的模型中有所体现。而且,Llama的训练效率和推理成本相比全球最前沿的标准,至少落后两代。
梁文锋
抢用户并不是我们的主要目标。我们降价的原因有两个:首先,在探索下一代模型架构的过程中,我们的成本下降了;其次,我们认为AI和API服务应该是人人都能负担得起、随时可用的。
梁文锋
其实没有什么“难以捉摸的天才”,只是来自顶尖高校的应届生、博士生(甚至是四五年级的实习生),以及一些有几年经验的年轻人。
梁文锋
目前没有短期融资计划。我们真正的挑战从来不是资金,而是高端芯片的出口禁令。
梁文锋
技术没有秘密,但复制需要时间和成本。英伟达的GPU没有什么神秘之处,但要赶上他们,就必须重建团队、追赶下一代技术——这才是真正的护城河。
梁文锋
最终会剩下2-3家AI创业公司。目前大家都在“烧钱”,但能活下来的,一定是那些战略清晰、执行力强的公司。其他的可能会转型。价值不会消失,只是会以不同的形式存在。
梁文锋
过去30年,我们更关注利润,而不是创新。但创新不仅仅是商业驱动的,它需要好奇心和创造的野心。我们被过去的习惯束缚住了,但这只是一个阶段。
梁文锋
更多的投资并不一定能带来更多的创新。如果资本堆砌就能推动技术突破,那大公司早就垄断了所有创新。
梁文锋
我们没想到定价会是如此敏感的问题。我们只是按照自己的节奏,计算成本后合理定价。我们的原则是不亏本销售,也不追求过高利润。目前的定价仅在成本之上保留了一定的利润空间。
梁文锋
创新当然成本高昂,而过去我们倾向于采用现成技术,主要是因为中国的发展阶段所限。但今天,中国的经济规模以及字节跳动、腾讯等巨头的盈利能力,已经具有全球影响力。我们真正缺乏的不是资金,而是信心,以及组织高水平人才进行有效创新的能力。
梁文锋
DeepSeek依然是完全自下而上的。我们也不预先设定角色,分工是自然形成的。每个人都带着自己的经验和想法,不需要被推动。当他们遇到挑战时,会自发地拉上别人讨论。不过,一旦某个想法被证明有潜力,我们就会从上层投入资源,推动它的发展。
梁文锋
DeepSeek V2完全是由本土人才打造的。目前,全球前50的AI人才可能确实不在中国,但我们希望自己培养出这样的团队。
梁文锋
我们从未想过要成为颠覆者,这一切只是意外发生的。
梁文锋
朱啸虎是自洽的,但他的打法更适合快速赚钱的公司,你看美国最赚钱的公司都是厚积薄发的高科技公司。
梁文锋
在美国每天发生大量创新里,这是非常普通的。他们之所以惊讶,是因为这是一个中国公司在以创新贡献者的身份加入到他们游戏里去。毕竟大部分中国公司习惯follow而不是创新。
梁文锋
«
1
2
...
13
14
15
16
17
18
19
20
21
22
»