復旦MOSS團隊回應內測,因中文廣告太多致水平不夠高[MOSS]?
() 2月21日消息:日前復旦團隊發(fā)布國內首個類ChatGPT模型MOSS,但MOSS上線后不久官網(https://moss.fastnlp.top/)就顯示服務器流量過載。
圖片截自MOSS
2月21日,MOSS官網發(fā)布公告稱,MOSS還是一個非常不成熟的模型,距離ChatGPT還有很長的路需要走。團隊初的想法只是想將MOSS進行內測,沒有想到會引起這么大的關注。復旦MOSS團隊表示,由于計算資源不足,也沒有相關的工程經驗,造成了非常不好的體驗和第一印象,向大家致歉。在完成初步的驗證之后,MOSS會將的經驗、代碼、模型參數(shù)開源出來供大家參考。
據上觀新聞報道,目前,MOSS的最大短板是中文水平不夠高,主要原因是互聯(lián)網上中文網頁干擾信息如廣告很多,清洗難度很大。為此,復旦大學自然語言處理實驗室正在加緊推進中文語料的清洗工作,并將清洗后的高質量中文語料用于下一階段模型訓練。