对于中国人工智能新创DeepSeek近期推出同名App,在短时间内吸引大量用户下载,其标榜开源使用的人工智能模型「DeepSeek V3」性能超越Meta的Llama 3.1,更与Anthropic的Claude-3.5、OpenAI的GPT-4o性能相当,同时模型背后所需硬件算力更远低于市场其他竞争对手,而开发成本甚至不到600万美元,并且吸引市场关注的情况,OpenAI执行长Sam Altman表示将持续聚焦当前研究路线,并且强调算力依然重要。 DeepSeek的横空出世,同时标榜能以不到600万美元成本打造人工智能模型,同时也强调其人工智能仅需少许算力、费用即可运作,让众多科技业者声称人工智能必须花费数千万,甚至破亿美元价格才能建造的说法变得尴尬,甚至也造成NVIDIA过去以来推崇以GPU作为训练加速器的作法开始被质疑,导致NVIDIA等业者的股价受冲击。 不过,Sam Altman稍早透过「X」发表看法,则认为DeepSeek的人工智能模型表现确实令人有深刻印象,但也强调OpenAI将推出性能表现更好的人工智能模型,同时更说明算力依然是人工智能技术发展重要基础。 而OpenAI研究副总裁陈信翰 (Mark Chen)也透过「X」指出DeepSeek透过数据最佳化方式控制执行成本,更暗示OpenAI也能以相同方式实现,甚至能以更大优势降低成本,同时强调低成本运作模型不见得能有更高性能表现。 至于其他对于DeepSeek的看法,前Google执行长Eric Schmidt则认为DeepSeek的出现,意味中国业者能以更少资源与美国大型科技业者竞争,同时也呼吁美国扩大开源人工智能模型发展力道,借此在全球人工智能技术竞争转折点取得优势,前Intel执行长Pat Gelsinger也在其对于DeepSeek的看法中提及开源重要性,更认为DeepSeek有助于重塑日渐封闭的人工智能模型建置流程。 另一方面,不少看法也认为DeepSeek凸显当前以数据最佳化、蒸馏处理过的小型人工智能模型,在特定领域、条件下的运作性能堪比,甚至超越大型人工智能模型的情况,使得更多业者更愿意针对特定运算情境、需求打造更符合运算需求的小型人工智能模型,另外也有看法指出DeepSeek创办人梁文锋最主要目的并非放在更长远的发展目标,而是希望以此争取更多投资机会。 |