近期一款名為“GPT-4”的人工智能聊天機(jī)器人迅速走紅,這一款人工智能聊天機(jī)器人幾乎能像人一樣來聊天,你問什么它都能給出準(zhǔn)確的答復(fù),甚至能幫你改代碼,可以幫你原創(chuàng)論文等,以至于很多學(xué)生都開始關(guān)注它,那么這么強大的“GPT-4”,它背后的“大佬”是誰呢?現(xiàn)在就讓我來給你講講你比GPT-4更NB,它背后的公司——OpenAI
OpenAI的發(fā)展歷程
OpenAI旗下的AI產(chǎn)品
達(dá)爾·E
達(dá)爾·E于2021年2月發(fā)布,達(dá)爾·E從文本創(chuàng)建圖像,達(dá)爾·E是12億個參數(shù)版本的GPT-3經(jīng)過訓(xùn)練,可以使用文本-圖像對的數(shù)據(jù)集從文本描述生成圖像。
我們發(fā)現(xiàn)它具有多種功能,包括創(chuàng)建動物和物體的擬人化版本,以合理的方式組合不相關(guān)的概念,渲染文本以及對現(xiàn)有圖像應(yīng)用轉(zhuǎn)換,像GPT-3一樣,達(dá)爾·E 是一個轉(zhuǎn)換器語言模型,它將文本和圖像作為包含多達(dá) 1280 個令牌的單個數(shù)據(jù)流接收,并使用最大可能性進(jìn)行訓(xùn)練,以一個接一個地生成所有令牌,達(dá)爾·E能夠為探索語言構(gòu)成結(jié)構(gòu)的各種句子創(chuàng)建合理的圖像。
1. 控制屬性
達(dá)爾·E 可以以多邊形形狀呈現(xiàn)熟悉的對象,這些形狀有時在現(xiàn)實世界中不太可能出現(xiàn);可以將各種植物,動物和其他物體的紋理映射到三維實體上。
2. 繪制多個對象
達(dá)爾·E 正確響應(yīng)某些類型的相對位置,但不能正確響應(yīng)其他類型的相對位置,而達(dá)爾·E 確實對少量對象的屬性和位置提供了一定程度的可控性,成功率可能取決于標(biāo)題的措辭方式。
3. 可視化透視和三維
達(dá)爾·E 還允許控制場景的視點和渲染場景的3D樣式,達(dá)爾·E可以在各種不同的視圖中繪制每種動物,通常能夠根據(jù)所選的3D樣式修改每個動物的表面,為了進(jìn)一步推動這一點,DALL·E能夠從一系列等距的角度在每個角度重復(fù)繪制一個知名人物的頭部,并發(fā)現(xiàn)我們可以恢復(fù)旋轉(zhuǎn)頭部的平滑動畫。

我們提示達(dá)爾·E 帶有描述知名人物的標(biāo)題和顯示以特定角度繪制的帽子的圖像的頂部區(qū)域。然后,我們問達(dá)爾·E 以完成給定此上下文信息的圖像的其余部分。我們反復(fù)這樣做,每次將帽子旋轉(zhuǎn)幾度,發(fā)現(xiàn)我們能夠恢復(fù)幾個知名人物的流暢動畫,每一幀都尊重角度和環(huán)境照明的精確規(guī)范。
4. 可視化內(nèi)部和外部結(jié)構(gòu)?
達(dá)爾·E能夠繪制幾種不同類型對象的細(xì)粒度外部細(xì)節(jié)。這些細(xì)節(jié)只有在近距離觀察物體時才會顯現(xiàn)出來。

5. 動物插圖?
達(dá)爾·E 將將人體部位適應(yīng)動物。例如,當(dāng)被要求畫蘿卜擤鼻涕、喝拿鐵或騎獨輪車時,DALL·E經(jīng)常在合理的位置畫頭巾,手和腳。

6. 達(dá)爾·E還有很多功能在此就不一一列舉
DALL·E2
于2022年4月6日發(fā)布新的人工智能系統(tǒng)DALL·E2,達(dá)爾·E2是一個人工智能系統(tǒng),可以從自然語言的描述中創(chuàng)建逼真的圖像和藝術(shù),它可以組合概念、屬性和樣式,可以將圖像擴(kuò)展到原始畫布之外,從而創(chuàng)建廣闊的新構(gòu)圖。

當(dāng)然比較每個模型時,達(dá)爾·E2優(yōu)于達(dá)爾·E1。
ChatGPT
ChatGPT于2022年11月30日發(fā)布,是一種對話式 AI,可以與您聊天、回答后續(xù)問題并挑戰(zhàn)不正確的假設(shè)。

GPT-4
GPT-4于2023年3月14日發(fā)布,GPT-4,這是OpenAI在擴(kuò)展深度學(xué)習(xí)方面的最新里程碑。GPT-4 是一個大型多模態(tài)模型(接受圖像和文本輸入,發(fā)出文本輸出),雖然在許多現(xiàn)實世界場景中的能力不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平的表現(xiàn)。
視覺輸入
GPT-4 可以接受文本和圖像的提示,這與純文本設(shè)置并行,允許用戶指定任何視覺或語言任務(wù)。具體來說,它生成文本輸出(自然語言、代碼等),給定由穿插文本和圖像組成的輸入。在一系列域(包括包含文本和照片的文檔、圖表或屏幕截圖)上,GPT-4 表現(xiàn)出與純文本輸入類似的功能。此外,它可以通過為純文本語言模型開發(fā)的測試時技術(shù)進(jìn)行增強,包括少數(shù)鏡頭和思維鏈促使。圖像輸入仍然是研究預(yù)覽,不公開可用。
可操縱性
GPT-4用戶可以通過在“系統(tǒng)”消息中描述這些方向來規(guī)定他們的 AI 風(fēng)格和任務(wù),而不是具有固定冗長、語氣和風(fēng)格的經(jīng)典 ChatGPT 個性。系統(tǒng)消息允許 API 用戶顯著自定義其用戶體驗在范圍內(nèi)。
局限性
盡管具有功能,但GPT-4具有與早期GPT模型類似的限制。最重要的是,它仍然不完全可靠(它“幻覺”事實并犯推理錯誤)。
OpenAI布局的未來
OpenAI是一個非常有前途的人工智能研究機(jī)構(gòu),它在深度學(xué)習(xí)、自然語言處理、機(jī)器人等多個領(lǐng)域都取得了很好的成果。未來幾年,OpenAI將繼續(xù)發(fā)揮其在人工智能領(lǐng)域的領(lǐng)先地位,推動人工智能技術(shù)的發(fā)展和應(yīng)用。
以下是OpenAI布局的未來可能性:
1. 推動人工智能技術(shù)的研究和發(fā)展。OpenAI將繼續(xù)在深度學(xué)習(xí)、自然語言處理、機(jī)器人等領(lǐng)域進(jìn)行研究,進(jìn)一步提高人工智能技術(shù)的水平和應(yīng)用范圍。
2. 推進(jìn)人工智能技術(shù)的商業(yè)化應(yīng)用。OpenAI將積極探索人工智能技術(shù)在各個行業(yè)的商業(yè)化應(yīng)用,為社會帶來更多的價值。
3. 加強與大學(xué)、企業(yè)等合作。OpenAI將與各大高校、企業(yè)等建立更緊密的合作關(guān)系,共同推動人工智能技術(shù)的研究和應(yīng)用。
4. 推動人工智能技術(shù)的普及和應(yīng)用。OpenAI將積極宣傳和普及人工智能技術(shù),讓更多人了解和應(yīng)用這項技術(shù),推動人工智能技術(shù)的發(fā)展和應(yīng)用。
總而言之,OpenAI將繼續(xù)投入大量的人力、物力和財力,推動人工智能技術(shù)的發(fā)展和應(yīng)用,為人類帶來更多的福利和改變。
ONE MORE THING
咪豆AI圈(Meedo)針對當(dāng)前人工智能領(lǐng)域行業(yè)入門成本較高、碎片化信息嚴(yán)重、資源鏈接不足等痛點問題,致力于打造人工智能領(lǐng)域的全資源、深內(nèi)容、廣鏈接三位一體的在線科研社區(qū)平臺,提供AI導(dǎo)航網(wǎng)、AI版知乎,AI知識樹和AI圈子等服務(wù),歡迎AI未來兒一起來探索。