4 月 19 日消息 阿里巴巴達摩院發布超大規模語言模型 PLUG,該模型參數規模達 270 億,是目前全球規模最大的中文純文本預訓練語言模型。
官方表示,PLUG 集良好的語言理解與創造性文本生成能力于一身,在小說仿寫、詩歌生成、智能問答等長文本生成領域表現突出,其目標是通過超大模型的能力,大幅提升中文自然語言技術在各類任務中的表現,取得超越人類表現的性能。
接下來,PLUG 將擴大參數規模至 2000 億級,并進一步提升文本生成質量。
IT之家了解到,達摩院語言技術實驗室研究員黃非表示:“現在預訓練語言模型的發展趨勢包括更多的訓練數據、更廣的數據領域、跨模態信息的融入等。模型能力正變得越來越強大,在生成理解等方面也正逐步接近人類水平。但在邏輯推理、情感表達方面,語言模型的能力還有待進一步提升。后續期待語言模型融合除文本信息以外更廣泛的人類知識,能作為認知智能的技術基座,在更多場景中得到廣泛應用。”