DeepSeek在技術實力、成本效益、人才管理、組織創新及逆境應對

内容目錄
| DeepSeek如何在困境中的
農曆年前,總部位於杭州的AI公司「DeepSeek(深度求索)」,發布了一個推理模型DeepSeek-R1。這一模型橫空出世,猶如農曆年初二於維港上空舉行的煙花匯演,瞬間照亮了整個科技界的夜空。
DeepSeek-R1在數學、程式碼及推理基準測試中,甚至超越了矽谷最先進的模型。在數學和推理方面,DeepSeek-R1更是壓倒了OpenAI的最新成果。而最令矽谷科技巨頭感到不安的,是以下兩大顛覆性成就:
低成本:R1的開發成本不到600萬美元,僅為Meta訓練Llama 3.1的十分之一。
開源透明:DeepSeek完全開放源碼,並提供免費網頁供公眾使用,所有技術細節和步驟均公開發表,這種透明的作風相較於矽谷公司顯得尤為突出。
筆者對人工智能的了解有限,但在閱讀了多篇報導後,對DeepSeek創辦人梁文鋒的管理策略印象深刻,值得各中小企業主借鑒。
(一)用人唯才

梁文鋒在接受採訪時,分享了他對用人的幾個觀點:
能力優先:DeepSeek的核心職位由應屆及畢業一兩年的年輕人擔任,招聘時只看能力而非經驗。衡量新人的能力不僅依賴院校背景(主要來自清華、北大),還會考慮競賽成績,金獎以下的作品不予考慮。曾面試過DeepSeek的應屆生如此評價其招聘風格:「只招1%的天才,去做99%中國公司做不到的事情。」這使得139人的團隊中,每位成員都獨當一面,才華橫溢。
重用本土人才:梁文鋒表示,「V2模型沒有海外回來的人,都是本土的。前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。」
多元學歷背景:雖然DeepSeek是AI公司,但其人才來源不僅限於電腦專業。例如,一名物理系畢業的成員曾表示,自己是偶然自學電腦,「由於工作太前沿,幾乎沒有什麼參考資料,一切問題都是自己設計方案並實踐解決。」此外,DeepSeek還曾招聘文科人才,職位名為「資料百曉生」,提供歷史、文化、科學等知識,以協助技術人員提升AGI模型的能力。
(二)簡化組織架構
自成立以來,DeepSeek一直維持「淡化職級、極為扁平」的文化。成員根據具體目標組成不同研究小組,組內成員之間沒有上下級關係,而是根據各自擅長的領域進行自然分工,遇到困難時共同討論。這種扁平化的組織結構促進了跨部門合作和快速決策,使員工能更迅速地響應市場變化。各個團隊在專案中擁有較大的自主權,提升了員工的積極性並促進了創新。梁文鋒提到,自然分工的一個成果便是關鍵架構「MLA(多頭潛在注意力)」的誕生,最初這只是年輕研究員的個人興趣,因其潛力而調動資源發展,最終取得了重大突破。
(三)把困境視為機會
面對美國的禁運,中國所有AI公司無法購買最先進的晶片,DeepSeek只能使用低配置的H800晶片。這反而促使DeepSeek壓低了生產成本。缺乏先進硬件的情況下,他們從軟件著手,想出更有效的方法來訓練模型,最終成功突破技術瓶頸,以更少的運算資源執行複雜的邏輯推理任務。面對美國的禁運,反而激發了DeepSeek的創新潛力,猶如年輕的牧童大衛擊敗了巨人歌利亞一樣。困境迫使企業創新,而創新則造就企業成功。

(四)要創新,不追隨潮流
由於最初的目標就是AGI(通用人工智能),DeepSeek從未以跟隨為策略,與其他商業類公司選擇追隨全球最先進模型的做法截然不同,DeepSeek更注重在模型結構層面上進行從0到1 的創新。在接受採訪時,梁文鋒明確表示:「我們覺得現在最重要的是參與到全球創新的浪潮裡去。過去很多年,中國公司習慣了別人做技術創新,我們拿過來做應用變現,但這並非是一種理所當然。這一波浪潮裡,我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。」
免責聲明: 以上只一般是建議,如遇特殊問題,還是先諮詢專業人士獲取意見。
Comentários