史東讀老書:DeepSeek相關三問三答

Q1 為什么DeepSeek出來以后,國家那么積極鼓勵使用?

基于NFL的基本理論(如果還不理解NFL的理論精髓,可以參考前面的文章自己和DeepSeek聊一聊),能力的增長是與問題領域、領域經驗相關的,一個問題領域中,經驗越充分,解決這個領域中問題的方法和能力就越靠譜。
只有積極使用,才能讓DeepSeek變得更強大。

Q2 為什么說“只有積極使用,才能讓DeepSeek變得更強大”?

這句話的關鍵詞是“只有積極使用”,就像之前Google的《Attention is All You Need》一樣,很多人都理解成了Attention很重要,沒認為是 All You Need。
“只有積極使用”,是因為:

  1. 基于書面知識的訓練遇到了天花板:去年下半年,Meta的一系列研究表明:基于人類書面知識訓練的大模型,能力已經達到了一定的頂峰(這個Paper我當時沒有保存——或者說是保存了忘記放哪里了——現在怎么也搜不到了)。按照NFL的理論,不能在這個方向上繼續投入了,性價比不高,就要找一些出路。
  2. 基于快速訓練的技術的發展:強化學習、蒸餾,為提高訓練效率給出了很好的方法。
  3. 需要轉變訓練的問題領域:從知識訓練這個單一的問題領域,轉變到應用領域。之前幾百年的書面知識訓練完成了,下面就是鋪天蓋地的實際應用領域的問題丟給他,這個問答、運用的結果可以繼續微調和訓練大模型。——這也就回答了,為什么關鍵研發、新材料、新技能等等創新領域的業務,不能使用公共大模型的原因,這些對話材料不久就會變成語料重新訓練大模型,你跟他之間對話所產生的創意、創新,都將成為大模型的記憶,公開給用戶了。

Q3 可是我都不知道怎么用大模型啊?

還記得1997年的自己,從學校打著鋪蓋到達連云港市第二人民醫院,學了3年的理論知識,即將進入臨床實習。說句實話,老師也不知道我們這批學生將來會怎樣。我自己更不知道自己將來會怎樣。
唯一一個理念就是:好好活,做有意義的事。
從醫到從事營銷再到從事IT,都是用而知不足,不足而學,學再用,層層迭代。再加上一點不知疲倦。

大模型本身是通了電就能用的,他沒有疲倦的壓力,那不知道怎么用大模型的問題不在知不知道,而是用得少了、隨便用用就放棄了。或者說句難聽的就是,用戶的水平不行——一將無能累死三軍。(用戶對于大模型其實就是工作中的頂頭上司,用戶給的方向錯誤、局限、偏見嚴重,大模型的產出就不行)。

所以,我類比今年的現像就是:
DeepSeek就是個大學,培養了對標北大、清華、耶魯的大學生(距離加州伯克利還有點距離,請允許我對認知科學有成就的大學的一些個人偏見)。
現在開源了,就像這些大學生只要想招,就可以到崗,作為實習生、管培生,分配到任何想要的崗位上去。能不能用好這些頂級大學生,就要看帶教老師的能力了。
我見到一個程序員,跟DeepSeek聊完以后,向我反饋:TMD!聊出了一個開發小組,從產品到UI到架構師到數據庫工程師到前端到后端,都能搞定,甚至還能幫我跟客戶懟兩句URS,之前客戶都說我IT不懂業務,現在我問問DeepSeek業務是啥,URS是否合理,合理的理由是什么,不合理的理由是什么。都能說得頭頭是道。拿著這個去開會,心里有底。——注意很多人都是被人懟敗了回來亡羊補牢去問DeepSeek,這沒用,這個程序員是在接到通知后,在會前問了DeepSeek,就像戰場上提前爬到了上制高點。

所以說,多年以后,這個一流大學的大學生能混成什么樣,主要看帶教老師了。實際上,有很多人,不具備帶教的能力,在用DeepSeek的時候總是找不到下手的地方。

算了,先到這吧,原本還有兩個話題,一是關于相關產業的現像,前面也都提了,感覺不好說得太透,比如為什么現在各個大模型廠家都要做大模型入口,鼓勵你使用他們的大模型,還是免費的,其實就是為了套取訓練材料。二是為什么中央會反對用國外的大模型,前面也提及了。為什么中央會如此鼓勵大模型使用,他們的決策一看就是符合NFL的理論的,是走在科學治國的路線上的。

這一個多月都在為DeepSeek的端到端的工程化忙碌,好不容易休息一天。
本來每年正月十五之前就會安排的當年的第一次山地騎行,也推遲到了今天,很幸運,天氣很好,完美地騎了一圈。

wollaston
2025年03月22日
于連云港

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,283評論 6 530
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 97,947評論 3 413
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,094評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,485評論 1 308
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,268評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,817評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,906評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,039評論 0 285
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,551評論 1 331
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,502評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,662評論 1 366
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,188評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,907評論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,304評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,563評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,255評論 3 389
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,637評論 2 370

推薦閱讀更多精彩內容