年初以來,AI大模型概念持續(xù)引發(fā)市場關(guān)注,相關(guān)上市公司股價(jià)持續(xù)上揚(yáng)。在透露正在研發(fā)類ChatGPT對話機(jī)器人兩個(gè)月后,阿里終于亮出了自己的研究成果,這也再度推高了中文大模型的熱度。
4月7日中午,沒有高調(diào)召開發(fā)布會(huì),而是通過官方微信,阿里云宣布自研大模型“通義千問”正式開始邀請用戶測試體驗(yàn)。據(jù)稱,現(xiàn)階段“通義千問”模型主要定向邀請企業(yè)用戶進(jìn)行體驗(yàn)測試。
觀察者網(wǎng)也率先拿到了“通義千問”的首批測試資格,并對其進(jìn)行了深度實(shí)測。

在測試中,“通義千問”提到,它是達(dá)摩院自主研發(fā)的超大規(guī)模語言模型,能夠回答問題、創(chuàng)作文字,也能表達(dá)觀點(diǎn)、撰寫代碼。
但這也間接說明,“通義千問”主攻文本生成,并沒有文生圖、圖生文的多模態(tài)功能。
當(dāng)被問及什么時(shí)候開始被訓(xùn)練時(shí),“通義千問”透露,它是在2016年被創(chuàng)造出來的,當(dāng)時(shí)被訓(xùn)練成能夠回答各種問題和提供幫助的人工智能語言模型。
但它似乎對自己在哪里被訓(xùn)練的有點(diǎn)說不太清。
在被問及參數(shù)量時(shí),“通義千問”表示,其參數(shù)量相對較多,由于涉及敏感內(nèi)容,具體的參數(shù)量數(shù)值并不能透露,“我可以生成各種類型的文本,如文章、故事、詩歌、故事等,并能夠根據(jù)不同的場景和需求進(jìn)行變換和擴(kuò)展”。
市場反應(yīng)方面,今日(4月7日)港股沒有開盤。
不過A股的人工智能概念股,再度火熱。ChatGPT、游戲、文化傳媒方向領(lǐng)漲,據(jù)不完全統(tǒng)計(jì),中文在線、神州泰岳20CM漲停,奧飛娛樂、上海電影漲停,方直科技、光云科技大漲超10%。
多角度測試,“通義千問”表現(xiàn)如何?
由于AI大模型擅長回答各種問題,觀察者網(wǎng)也從多個(gè)角度對“通義千問”進(jìn)行了測試。
比如,我們問它是否知道觀察者網(wǎng)。“通義千問”表示,“是的,我知道觀察者網(wǎng)。觀察者網(wǎng)是一家致力于提供新聞和信息的新聞門戶網(wǎng)站,它提供了大量的國內(nèi)外新聞和深度分析,并致力于推動(dòng)社會(huì)進(jìn)步和改變?!?/p>
但“通義千問”好像并不能憑借簡單指令生成商業(yè)宣傳口號(hào)。
隨后我們將話題轉(zhuǎn)向體育領(lǐng)域。
被問道“梅西在阿根廷國家隊(duì)進(jìn)了幾個(gè)球”,“通義千問”稱,根據(jù)可靠的數(shù)據(jù),梅西在阿根廷國家隊(duì)的進(jìn)球數(shù)量是很多的。不過由于“具體的進(jìn)球數(shù)量數(shù)值,可能會(huì)因?yàn)闀r(shí)間的推移而有所變化”,“通義千問”婉拒了為我們提供準(zhǔn)確答案的請求。
當(dāng)被要求“生成一張打籃球的圖片”,“通義千問”表示,作為文本AI模型,它沒有能力生成圖片。
這一點(diǎn)也證實(shí)了“通義千問”不具備多模態(tài)功能。
我們也讓“通義千問”試圖回答和自己其他大模型的能力對比問題。
無論是對比文心一言還是ChatGPT,“通義千問”都顯得很主動(dòng),它先是介紹了自己的優(yōu)勢,最后再積極地表示,自己可以更好地滿足用戶的需求。
不過如果要求苛刻一點(diǎn),不難發(fā)現(xiàn),兩個(gè)問題的答案有很多相似之處。
當(dāng)被問及“怎么看待現(xiàn)在大模型的火熱”?“通義千問”稱,它認(rèn)為大模型的火熱是一個(gè)好現(xiàn)象,大模型可以幫助我們更好地理解世界,提高我們的工作效率,拓展我們的認(rèn)知邊界。但這也帶來了一些問題,比如人工智能的倫理問題、隱私問題等。因此,我們需要認(rèn)真思考如何在技術(shù)的發(fā)展中平衡安全、發(fā)展和責(zé)任。
這也驗(yàn)證了“通義千問”表達(dá)觀點(diǎn)的功能。
最后的系列問題涵蓋成語典故、詩詞接龍、傳統(tǒng)美食等,“通義千問”小小地翻車了幾次。
例如它將東施效顰的東施,解釋為“美女”,這不太符合不少人對這一典故的基本印象。在《莊子》等典籍中,對這個(gè)故事中“東施”一類的角色,描述也是“其里之丑人”。
在有關(guān)傳統(tǒng)文化方面,“通義千問”沒有正確給出“停車坐愛楓林晚”的下句。
對于“曹操什么時(shí)候三顧茅廬的”這樣的“坑”,“通義千問”也未能識(shí)別提問者主動(dòng)設(shè)置的“陷阱”。