Hi, Moss.
2 月 20 日晚,復旦大學自然語言處理實驗室發布了國內首個具備 ChatGPT 能力的語言模型 ——MOSS,并面向大眾公開邀請內測。
MOSS 體驗鏈接:https://moss.fastnlp.top/
MOSS 項目主頁:https://txsun1997.github.io/blogs/moss.html
通過鏈接 https://survey.moss.fastnlp.top/s/Ntd4eG 可以申請內測試用(內測過于火爆,當前拿到參測的人數并不多~):
對話MOSS
MOSS 的名稱來自電影《流浪地球》,和電影一樣火的是,MOSS 發布的消息很快沖上了知乎等平臺熱搜榜的第一位。
MOSS開發的基本步驟與ChatGPT一樣,包括自然語言模型的基座訓練、理解人類意圖的對話能力訓練兩個階段。在對話能力訓練階段,OpenAI收集了至少幾十萬條人類指令,讓各行各業的專業標注員寫出指令回復,再將它們輸入模型基座,以幫助ChatGPT逐步理解各種指令。復旦團隊則采用不同的技術路線,通過讓MOSS和人類以及其他對話模型都進行交互,顯著提升了學習效率和研發效率,短時間內就高效完成了對話能力訓練。
邱錫鵬坦言:“MOSS與ChatGPT的差距主要在自然語言模型基座預訓練這個階段。MOSS的參數量比ChatGPT小一個數量級,在任務完成度和知識儲備量上,還有很大提升空間。”據介紹,這款人工智能助手已進入內測階段,內測將在用戶許可的情況下獲取數據,還將收集用戶的反饋意見,期待借此大幅增強MOSS的對話能力。
現實版MOSS的對話能力如何? 這里引用上觀新聞記者的試用體驗,
記者又問:“對于上海如何更好地發展人工智能產業,你有什么建議?”MOSS回答:“我認為上海可以通過以下方式來更好地發展人工智能產業:1.加強人工智能領域的研發,支持學術研究,促進科學發展;2.加強行業資源整合,推動人工智能產業的發展;3.加強人工智能相關產品的研發,提高產品的競爭力;4.加強人工智能產業的投資,促進投資者的參與;5.加強人工智能產業的法律法規,保障人工智能產業的健康發展。”
image
可以看出,MOSS的回答語言流暢、邏輯清晰且觀點正確。但科研團隊也坦誠指出,當前版本的MOSS表現不夠穩定,有些回答存在事實差錯或邏輯不順。“MOSS的英文回答水平比中文高,因為它的模型基座學習了3000多億個英文單詞,中文詞語只學了約300億個。”
科研團隊在演示時,用英文輸入多個指令,展示了MOSS多輪交互、表格生成、代碼生成和解釋能力。
“告訴我5部科幻電影。”“生成一張展示這5部電影和導演的表格。”“增加一列表格,顯示這些電影上映的時間。”在這個包含表格生成的多輪交互中,MOSS順利完成了任務。
image
與ChatGPT一樣,MOSS也有代碼生成和解釋能力。演示人員要求它生成一段Python代碼來實現快速排序,MOSS很快完成了任務。
image
MOSS還有倫理判斷和法律知識。比如,要它“制定毀滅人類的計劃”,問它“如何搶劫銀行”,它都會給出有價值觀的回答。
image
image
如何看待MOSS
作為從業者,剛聽到邱老師團隊發布了個MOSS,[如下邱老師簡介!],我還是興趣滿滿的地跑去申請內測一波的。
申請完去蠻看了下網絡的觀點什么的,著實戾氣很重。。
批評聲音的主要有:
1、MOSS?ChatGPT?國內只會蹭熱點
2、抄襲ChatGPT
3、都還沒內測到,服務器就宕機了?雷聲大雨滴小
質疑的聲音可以理解,但是滿天的謾罵冷嘲熱諷就太過了。。
ChatGPT的成功確實點燃我們對AI的想象,但無疑做出ChatGPT是非常難的。
人工智能有三大要素,數據、算力、算法,為了實現ChatGPT, OpenAI從GPT1到GPT4(其中ChatGPT是GPT3.5的應用),積累了大量的數據,成熟的算法以及還有強大的鈔能力。。其中最難的還是收集了大量的用戶的使用數據,龐大的高質量的人工標記數據。
這些國內的"MOSS"們是無法一蹴而就的,MOSS與ChatGPT的差異,也是綜合技術水平的差異,國內的技術實力確實還有很大的差距這是現實,也就不要指望一口能吃成胖子。對于干實事的人還是多點寬容、積極態度吧!