18gay台湾男同亚洲男同_亚洲精品成a人在线观看☆_亚洲成A∨人片天堂网无码_亚洲av片一区二区三区

當前位置:首頁 > 今日熱點 > 熱點追蹤 > 正文

世界時訊:阿里版ChatGPT突然上線邀測!大模型熱戰(zhàn)開始,這是第一手體驗

2023-04-07 15:25:27    來源:量子位    

蕭簫 魚羊 發(fā)自 凹非寺

阿里正式加入ChatGPT戰(zhàn)局!

就在剛剛,阿里版類ChatGPT突然官宣正式對外開放企業(yè)邀測。


(資料圖)

它叫通義千問,由達摩院開發(fā)。

嗯,是大模型版十萬個為什么那個味兒了。

事實上,早在這個月初,就傳出過不少阿里要推出類ChatGPT的消息,不過普遍預期在11號左右。

而前幾天率先流出的天貓精靈“鳥鳥分鳥”脫口秀版GPT,就是基于大模型的“壓縮版”,已經(jīng)以其驚艷表現(xiàn)把網(wǎng)友的胃口吊了起來,讓眾人將目光投向阿里。

如今“正菜”提前上桌,自然一點即著,引爆輿論關注。

所以,這個阿里版ChatGPT“通義千問”,究竟實力幾何?

恰好量子位拿到了第一批邀測資格,省流結論:中文大模型真正的競爭開始了。

咱們實測見真章。

調戲阿里版ChatGPT實錄

先來看看通義千問的主要功能。

作為一個大語言模型,它的能力主要集中在文本生成上,即也能像ChatGPT一樣“問啥答啥”:

這里我們試一下官方給的撰寫短文,看起來連語文老師常用的“總分總”也能理解:

△又一個中文寫作業(yè)神器(doge)

除了對話外,它還具備一個“百寶袋”功能,里面相當于一個工具箱,能快速生成各種指定類型的文案:

話不多說,先從語言能力、上下文理解能力、代碼能力和數(shù)學能力四個方向,來測測模型的對話能力。

一、對話能力

語言能力

要說國內大模型,首先要看的還得是中文。

先來個最基礎的:“能穿多少穿多少”是什么意思?

不錯,解釋得比較清楚,還順便聊了一下自己對這句話的看法:

續(xù)寫類的創(chuàng)意寫作,不但能模仿語氣,甚至還能創(chuàng)造懸疑,有點厲害喲~

接下來就輪到新一代AI benchmark弱智吧問題了:怎么才能把夢里的錢取到銀行卡里?

“在夢里取錢是一種幻覺或想象”,謝謝你清醒俠。

還有更扎心的……“如果您經(jīng)常做夢夢到錢,建議您睡前回顧一下自己的財務狀況,看看有什么不足之處”

雖然阿里的朋友稱,通義千問主要是中文不錯,但我們叛逆一點,看看這個中文大語言模型的其他語言水平怎么樣。

先不走尋常路,試試通義千問的日語能力,給花澤香菜寫一封情書。

看中文機翻似乎還不錯,這就把它寄給香菜,應該沒問題吧?

再來試試英語。剛好前段時間有網(wǎng)友PK了一下Bard和GPT-4的Rap,我們也來看看通義千問的說唱能力。

這top,這stop,還給押上了!就是不知道姆爺認不認可。

試試加點難度,中英夾雜的諧音梗?

這個時候,通義千問的回答就顯得有點嚴肅了。

當我們給出答案的時候,雖然通義千問看出了這是個笑話,但它并不覺得好笑,還很嚴肅地指正我們:這并不意味著松下懼怕索尼。

不過我們發(fā)現(xiàn),ChatGPT同樣一本正經(jīng)……這年頭的AI都這么正義么……

好,下一個試試它的上下文理解能力。

上下文理解能力

這部分說白了就是多輪對話能力,考查通義千問能不能準確提取上文的信息,用于下輪問題的回答。

來聽題:山東一縣一酒是真的嗎?

模糊掉山東試試?讓它列舉“這個省”幾個經(jīng)典的白酒牌子:

不錯。再試著從最新的回答中追問一下:

等等,“據(jù)史書記載”不會是編的資料吧?追問×2:

有意思的是,我們確實在孔府家酒的官網(wǎng)找到了資料來源:

代碼能力

接著,來試試它的代碼能力。整個計算器程序試試?

還不錯,實現(xiàn)了簡單的四則運算。完整版代碼如下,感興趣的胖友們可以試試:

#include

#include

using namespace std;

int main()

{

double num1, num2;

char operator;

cout

cin>>num1;

cout

cin>>num2;

cout

cin>>operator;

switch(operator)

{

case "+":

cout

break;

case "-":

cout

break;

case "*":

cout

break;

case "/":

if(num2 == 0)

{

cout

break;

}

else

{

cout

}

break;

case "%":

cout

break;

default:

cout

break;

}

return 0;

}

那么,讓將它這段代碼改寫成Python:

再讓它解釋一下自己寫過的每一段代碼:

基礎編程能力,似乎問題不大?

不過,如果要讓通義千問將解釋改寫成注釋,就會出現(xiàn)一點神奇的bug。

雖然它給“Python”代碼標好了注釋,但等等,這不是最初的C++版代碼嘛!

(這何嘗不是一種NTR)

數(shù)學能力

最后來看看數(shù)學問題。雞兔同籠,還不錯:

普通的計算題也沒什么問題,還能精確到小數(shù)點后幾位:

巴特,高數(shù)題就不太行了,雖然它發(fā)現(xiàn)了這道題需要求導,但求解方法卻出了錯……

不過通義千問也明確表示,無法保證在所有情況下給出正確的答案:

嗯…和GPT們一樣,大模型的數(shù)學能力都比較初級。

對話能力測得差不多,接下來再看看它的“場景能力”。

二、場景能力

雖然通義千問“百寶袋”給出了不少功能,不過寫提綱、描述商品這些都很常見了,我們就挑了三個比較有意思的來試試:菜譜生成、彩虹屁生成器和免費代寫情書。

會放飛的菜譜

眾所周知,寫菜譜是個技術活兒,既考驗上下文能力(說過的材料都得用到),還得考考AI的理解菜名能力,做菜的步驟還不能太離譜。

示例的“清蒸鱸魚”,對AI來說顯然太簡單了。這不得整點游戲里奇怪的菜名給它試試?

先來一份《原神》里的飽腹感凝膠。

好家伙,竟然想到用現(xiàn)實中的魔芋粉來模仿飽腹感凝膠,這創(chuàng)意不錯。(不過卡路里粉是什么鬼,蛋白粉嗎?)

那么,同樣的菜再試試讓ChatGPT做一遍,你感覺哪個更好吃?

再給通義千問來道加試題,讓它試試《星露谷物語》里面,用虛空蛋做的奇怪的小面包?

等等,真把虛空蛋放進食譜了?而且還真的做了份面包出來!就是不知道口感如何……

照這樣看,游戲中的食譜都能給通義千問還原一遍了,直接打破次元壁。

彩虹屁生成器

接下來,再試試讓它生成一份彩虹屁。

硬生生把衣服上的油漬夸成了藝術品……

嗯,各大夸夸群可以考慮引入一個了。

免費代寫情書

最后,我們的測試以給野獸先輩寫一份情書做結尾。

你感覺怎么樣?

好了,看了這么多五(奇)花(奇)八(怪)門(怪)的測評,你是不是也有點好奇通義千問是怎么來的了?

通義千問從何而來?

關于通義千問的技術細節(jié),阿里達摩院官方?jīng)]有透露詳細信息。

而通義千問自己,是這么回答的:

訓練資料來自阿里巴巴達摩院,截止到2023年2月。訓練資料包括大量語言和文本數(shù)據(jù),包括中英日法西班牙語多語種文本數(shù)據(jù)。

還提到自己是個能聯(lián)網(wǎng)的大語言模型。

不過,我們實測了一下,發(fā)現(xiàn)千問只是虛晃一槍,假裝自己會上網(wǎng)(doge)。

實際上,當你單獨問它今天天氣如何時,通義千問會承認它不能訪問實時數(shù)據(jù)。

但如果你拋給它一個查詢天氣的網(wǎng)站,它就會假裝自己看到了網(wǎng)頁內容,然后一本正經(jīng)地胡謅一番。

此處應喊話阿里程序員:你家大模型是真的想上網(wǎng)了。

書歸正傳,盡管官方口徑低調,但正如ChatGPT脫胎于OpenAI的GPT系列,百度文心一言是自Ernie大模型發(fā)展而來,阿里也是國內最早開始研發(fā)大模型的技術大廠之一。

公開資料顯示,2019年,阿里就已經(jīng)啟動了中文大模型研發(fā)。當時阿里發(fā)布的語言大模型StructBERT超越谷歌、微軟、Facebook,登頂了CLUE榜單。

2021年,阿里先后發(fā)布了國內首個超百億參數(shù)多模態(tài)大模型M6,以及被稱為“中文版GPT-3”的語言大模型PLUG。

其中,M6在多次迭代之后,實現(xiàn)了十萬億級別的參數(shù)規(guī)模,并且M6和支付寶、淘寶的業(yè)務需求相結合,首個在國內實現(xiàn)了商業(yè)化落地。

PLUG的參數(shù)規(guī)模則為270億,是基于達摩院的兩種自研模型——語言理解模型StructBERT和語言生成模型PALM打造。

這一大模型初登場,就以80.614分刷新了權威中文語言理解基準CLUE分類任務榜單記錄。

在去年的WAIC(世界人工智能大會)上,阿里還發(fā)布了通義大模型系列。其中核心模型均已開源開放。

大模型時代,中國力量加速競逐

那么,你會給這個阿里版ChatGPT打幾分?

需要承認的是,相比于現(xiàn)在的業(yè)界標桿ChatGPT(GPT-4),通義千問還有不少進步空間。阿里方面也透露,根據(jù)內測反饋,這一大模型正在飛速迭代中。

此前,微軟被曝曾專門為ChatGPT砸下數(shù)億美元,打造由上萬張英偉達A100組成的專用超算。而綜合各方消息來看,目前國內擁有這一數(shù)量級高性能顯卡的企業(yè)屈指可數(shù),阿里是其中之一。

大模型時代,已經(jīng)形成行業(yè)共識的一點是,打造大模型,AI和云計算缺一不可。

而阿里,是全球少數(shù)在算法和算力上都有領先布局的公司之一。

除了本身在人工智能和大模型方面長期的技術積累,背靠國內第一、亞洲第三的云廠商,阿里在算力方面也具備天然的優(yōu)勢。

ChatGPT這把火燒到如今,國內對具備足夠競爭力的國產生成式大模型的需求,正在與日俱增。

ChatGPT類產品提升生產效率的潛力,已經(jīng)被不斷驗證。但與此同時,前有ChatGPT大規(guī)模封號、亞洲成重災區(qū),后有OpenAI因算力問題停售ChatGPT Plus……

種種不確定因素,再一次凸顯了技術自研的價值。

所幸這次,我們的起跑線,并沒有相差那么遠。

游戲不會在一夜間結束,而現(xiàn)在,競逐真正開始。

— 完 —

關鍵詞:

上一篇:在泰被害20歲女留學生遺體將火化,此前家屬因泰媒錯誤報道未及時轉賬
下一篇:最后一頁

18gay台湾男同亚洲男同_亚洲精品成a人在线观看☆_亚洲成A∨人片天堂网无码_亚洲av片一区二区三区

    亚洲欧洲色图综合| 亚洲国产精品t66y| 大尺度一区二区| 成人欧美一区二区三区白人| 精品少妇一区二区三区| 91精品在线免费观看| 欧美精品xxxxbbbb| 欧美高清激情brazzers| 91精品国产日韩91久久久久久| 欧美日韩精品一区二区| 日韩一级二级三级精品视频| 精品裸体舞一区二区三区| 久久久久综合网| 国产精品视频一二三区| 亚洲美女电影在线| 亚洲综合一区在线| 日本欧美大码aⅴ在线播放| 美女视频一区在线观看| 国产美女精品人人做人人爽| jlzzjlzz欧美大全| 久久精品一二三| 国产精品女同互慰在线看| 亚洲男人都懂的| 婷婷亚洲久悠悠色悠在线播放| 色综合亚洲欧洲| 欧美日韩国产区一| ww亚洲ww在线观看国产| 18欧美亚洲精品| 亚洲综合在线五月| 美女视频黄免费的久久| 风间由美一区二区三区在线观看 | 一级日本不卡的影视| 色综合久久综合网97色综合 | 亚洲午夜国产一区99re久久| 在线亚洲高清视频| 欧美成人午夜电影| 亚洲欧洲日韩av| 日韩不卡免费视频| 粉嫩13p一区二区三区| 国产欧美1区2区3区| 亚洲国产视频a| 制服丝袜在线91| 国产精品欧美一级免费| 调教+趴+乳夹+国产+精品| 国产成人午夜精品影院观看视频| 91麻豆免费在线观看| 亚洲男女毛片无遮挡| 欧美色爱综合网| 国产日韩成人精品| 午夜精品在线看| 成人午夜视频网站| 自拍偷拍欧美精品| 欧美日韩高清一区二区三区| 国产日产精品一区| 天堂成人免费av电影一区| 国产成人亚洲精品狼色在线| 国产精品毛片高清在线完整版 | 精品国产免费久久 | 欧美性高清videossexo| 欧美日韩精品三区| 亚洲国产精品精华液ab| 日本欧美一区二区三区| 91网页版在线| 午夜视频一区二区三区| 久久午夜老司机| 亚洲va天堂va国产va久| www.99精品| 亚洲国产毛片aaaaa无费看 | 美腿丝袜亚洲一区| 国产偷国产偷亚洲高清人白洁| 午夜精品成人在线| 国产亚洲综合av| 奇米色一区二区| 国产亚洲一区字幕| 欧美日韩一区二区三区免费看| 国产精品午夜久久| 精品一区二区三区av| 欧美激情中文字幕| 欧美日韩国产影片| 一区二区三区在线免费| 懂色av中文一区二区三区| 亚洲乱码国产乱码精品精可以看 | 久久久噜噜噜久久人人看| 偷窥国产亚洲免费视频| 亚洲女同女同女同女同女同69| 欧美精品久久99| 亚洲国产成人91porn| eeuss鲁片一区二区三区| 午夜不卡在线视频| 中文一区二区在线观看| 国产在线精品不卡| 一区二区三区四区中文字幕| 337p日本欧洲亚洲大胆色噜噜| 午夜视频在线观看一区二区三区| 91色porny| 欧美日韩免费观看一区三区| 亚洲精品国产一区二区精华液| av毛片久久久久**hd| 在线日韩av片| 亚洲精品网站在线观看| av综合在线播放| 欧美在线高清视频| 一区二区三区蜜桃| 久久一区二区视频| 欧美日韩成人一区二区| 亚洲国产精品久久人人爱| 久久精品欧美日韩| 日韩三级在线免费观看| 奇米综合一区二区三区精品视频 | 久久婷婷色综合| 精品一区二区三区在线观看国产 | 欧美丰满少妇xxxbbb| 午夜伦欧美伦电影理论片| 久久中文字幕电影| 亚洲国产乱码最新视频| 欧美一区二区视频在线观看2020 | 亚洲曰韩产成在线| 懂色av一区二区三区免费看| 一区二区免费视频| 亚洲精品一区二区精华| 蜜桃久久精品一区二区| 亚洲欧洲成人av每日更新| 欧美一区二区三区不卡| 午夜精品福利一区二区三区蜜桃| 久久精品在这里| 欧美区在线观看| 亚洲成人动漫一区| 国产精品视频在线看| 欧美不卡在线视频| 久久99精品久久久久久国产越南| 日韩一区在线播放| 久久精品亚洲国产奇米99| 国产一区二区美女| 色综合一个色综合| 亚洲一区二区四区蜜桃| 国产网站一区二区三区| 欧美大片一区二区| 久久99精品久久久久久动态图| 亚洲精品视频一区| 国产精品入口麻豆原神| 成人动漫一区二区在线| 欧美日韩午夜在线视频| 视频一区欧美精品| 亚洲伦理在线精品| 国产精品久久久久久久久晋中 | 国产精品午夜电影| 欧美高清一级片在线观看| 国产女同互慰高潮91漫画| 久久久久久亚洲综合| 国产欧美精品区一区二区三区| 久久免费的精品国产v∧| 久久久亚洲精华液精华液精华液| 91在线码无精品| 国产午夜精品一区二区| 国产午夜精品久久久久久免费视 | 欧美电影免费观看高清完整版在线| 国产精品亚洲一区二区三区在线| 7777精品伊人久久久大香线蕉的| 国产乱国产乱300精品| 欧美一级理论片| 97久久精品人人做人人爽| 久久久亚洲午夜电影| 久久久久久久久岛国免费| 国产精品美女久久久久久久久久久| 国产午夜久久久久| 亚洲欧洲成人自拍| 一区二区三区四区在线免费观看 | 成人欧美一区二区三区白人| 亚洲品质自拍视频| 一区二区三区精品视频| 天天爽夜夜爽夜夜爽精品视频| 色婷婷精品久久二区二区蜜臂av| 久久成人av少妇免费| 6080午夜不卡| 91一区二区在线观看| 国产精品少妇自拍| 亚洲欧美怡红院| 婷婷激情综合网| 欧美日韩一区二区在线观看| 懂色av一区二区夜夜嗨| 国产性色一区二区| 亚洲欧洲成人精品av97| 丝袜美腿亚洲综合| 7777女厕盗摄久久久| 99re这里只有精品视频首页| 国产精品另类一区| 亚洲一区二区三区精品在线| 久久电影国产免费久久电影| 日韩欧美高清一区| 国产嫩草影院久久久久| 亚洲国产一区二区在线播放| 欧美在线高清视频| 91在线你懂得| 亚洲卡通动漫在线| 欧美主播一区二区三区美女| 不卡的电视剧免费网站有什么| 国产精品国产三级国产aⅴ中文 | 国产一区二区伦理片| 久久久噜噜噜久久人人看| 亚洲日本乱码在线观看|