比GPT-4更NB,幫你捋捋它背后的公司OpenAI

近期一款名為“GPT-4”的人工智能聊天機(jī)器人迅速走紅,這一款人工智能聊天機(jī)器人幾乎能像人一樣來聊天,你問什么它都能給出準(zhǔn)確的答復(fù),甚至能幫你改代碼,可以幫你原創(chuàng)論文等,以至于很多學(xué)生都開始關(guān)注它,那么這么強大的“GPT-4”,它背后的“大佬”是誰呢?現(xiàn)在就讓我來給你講講你比GPT-4更NB,它背后的公司——OpenAI

OpenAI的發(fā)展歷程

  • OpenAI是在美國成立的人工智能研究公司,于2015年12月11日成立,全稱為“Open Artifical Intelligence”。
  • 于2016年4月27日發(fā)布OpenAI Gym Beta;這是OpenAI成立后發(fā)布的第一個項目,它由一套不斷增長的環(huán)境(從模擬機(jī)器人到雅達(dá)利游戲)和一個用于比較和復(fù)制結(jié)果的網(wǎng)站組成。OpenAI Gym提供了一套多樣化的環(huán)境,從簡單到困難,涉及許多不同類型的數(shù)據(jù)。同年的12月5日發(fā)布Universe,這是一個軟件平臺,用于測量和訓(xùn)練 AI 在全球游戲、網(wǎng)站和其他應(yīng)用程序中的一般智能。
  • 于2017年7月20日發(fā)布Proximal Policy Optimization算法即近端策略優(yōu)化(PPO),其性能與最先進(jìn)的方法相當(dāng)或更好,同時更易于實現(xiàn)和調(diào)整。PPO 因其易用性和良好的性能而成為OpenAI的默認(rèn)強化學(xué)習(xí)算法。同年的8月11日發(fā)布Dota 2(刀塔2)。
  • 于2018年2月20日研究防止惡意使用AI,4月9日發(fā)布OpenAI憲章,6月11日,OpenAI公布了一個在諸多語言處理任務(wù)上都取得了很好結(jié)果的算法,即著名的GPT,這也是該算法的第一個版本。GPT是第一個將transformer與無監(jiān)督的預(yù)訓(xùn)練技術(shù)相結(jié)合,其取得的效果要好于當(dāng)前的已知算法。這個算法算是OpenAI大語言模型的探索性的先驅(qū),也使得后面出現(xiàn)了更強大的GPT系列,7月30日強化學(xué)習(xí)技巧。
  • 于2019年2月14日提升語言模型GPT-2,模型GPT-2或生成式預(yù)訓(xùn)練轉(zhuǎn)換器2是一種無監(jiān)督轉(zhuǎn)換器語言模型,3月11日開放人工智能有限合伙人,4月15日OpenAI五人擊敗Dota 2世界冠軍,4月25日發(fā)布深度神經(jīng)網(wǎng)絡(luò)MuseNet,7月22日微軟投資OpenAI并與其合作,8月20日跟進(jìn)GPT-2,9月17日研究多代理交互中的緊急工具使用;10月15日研究用機(jī)械手解魔方,11月5日發(fā)布GPT-2:1.5B 版本。
  • 于2020年4月14日,發(fā)布了Microscope,這是一個用于分析神經(jīng)網(wǎng)絡(luò)內(nèi)部特征形成過程的可視化工具,也是OpenAI為了理解神經(jīng)網(wǎng)絡(luò)模型所作出的努力,4月30日發(fā)布神經(jīng)網(wǎng)絡(luò)Jukebox,6月11日開放人工智能應(yīng)用程序接口,6月10日發(fā)布了GPT-3,為下一代應(yīng)用提供了動力,超過300個應(yīng)用程序通過API提供GPT-3驅(qū)動的搜索、對話、文本完成和其他高級AI功能。
  • 于2021年1月5日研究連接文本和圖像神經(jīng)網(wǎng)絡(luò)CLIP,同日研究從文本創(chuàng)建圖像神經(jīng)網(wǎng)絡(luò)DALL·E ,2021年2月推出了DALL·E,3月4日研究人工神經(jīng)網(wǎng)絡(luò)中的多模式神經(jīng)元,8月10日發(fā)布開放人工智能法典Codex,Codex 精通十幾種編程語言,現(xiàn)在可以用自然語言解釋簡單的命令并代表用戶執(zhí)行它們,從而可以為現(xiàn)有應(yīng)用程序構(gòu)建自然語言接口。
  • 于2022年3月開發(fā)GPT-3.5,GPT-3.5基于GPT-3,但在人類價值觀的特定政策范圍內(nèi)工作,僅比以前的版本少1億個參數(shù)3倍,4月6日發(fā)布新的人工智能系統(tǒng)DALL·E2,11月30日研究ChatGPT:優(yōu)化對話的語言模型,ChatGPT 是從GPT-3.5系列中的模型進(jìn)行微調(diào)的。
  • 于2023年3月14日發(fā)布了爆火的GPT-4
  • OpenAI旗下的AI產(chǎn)品

    達(dá)爾·E

    達(dá)爾·E于2021年2月發(fā)布,達(dá)爾·E從文本創(chuàng)建圖像,達(dá)爾·E是12億個參數(shù)版本的GPT-3經(jīng)過訓(xùn)練,可以使用文本-圖像對的數(shù)據(jù)集從文本描述生成圖像。

    我們發(fā)現(xiàn)它具有多種功能,包括創(chuàng)建動物和物體的擬人化版本,以合理的方式組合不相關(guān)的概念,渲染文本以及對現(xiàn)有圖像應(yīng)用轉(zhuǎn)換,像GPT-3一樣,達(dá)爾·E 是一個轉(zhuǎn)換器語言模型,它將文本和圖像作為包含多達(dá) 1280 個令牌的單個數(shù)據(jù)流接收,并使用最大可能性進(jìn)行訓(xùn)練,以一個接一個地生成所有令牌,達(dá)爾·E能夠為探索語言構(gòu)成結(jié)構(gòu)的各種句子創(chuàng)建合理的圖像。

    1. 控制屬性

    達(dá)爾·E 可以以多邊形形狀呈現(xiàn)熟悉的對象,這些形狀有時在現(xiàn)實世界中不太可能出現(xiàn);可以將各種植物,動物和其他物體的紋理映射到三維實體上。

    2. 繪制多個對象

    達(dá)爾·E 正確響應(yīng)某些類型的相對位置,但不能正確響應(yīng)其他類型的相對位置,而達(dá)爾·E 確實對少量對象的屬性和位置提供了一定程度的可控性,成功率可能取決于標(biāo)題的措辭方式。

    3. 可視化透視和三維

    達(dá)爾·E 還允許控制場景的視點和渲染場景的3D樣式,達(dá)爾·E可以在各種不同的視圖中繪制每種動物,通常能夠根據(jù)所選的3D樣式修改每個動物的表面,為了進(jìn)一步推動這一點,DALL·E能夠從一系列等距的角度在每個角度重復(fù)繪制一個知名人物的頭部,并發(fā)現(xiàn)我們可以恢復(fù)旋轉(zhuǎn)頭部的平滑動畫。

    我們提示達(dá)爾·E 帶有描述知名人物的標(biāo)題和顯示以特定角度繪制的帽子的圖像的頂部區(qū)域。然后,我們問達(dá)爾·E 以完成給定此上下文信息的圖像的其余部分。我們反復(fù)這樣做,每次將帽子旋轉(zhuǎn)幾度,發(fā)現(xiàn)我們能夠恢復(fù)幾個知名人物的流暢動畫,每一幀都尊重角度和環(huán)境照明的精確規(guī)范。

    4. 可視化內(nèi)部和外部結(jié)構(gòu)?

    達(dá)爾·E能夠繪制幾種不同類型對象的細(xì)粒度外部細(xì)節(jié)。這些細(xì)節(jié)只有在近距離觀察物體時才會顯現(xiàn)出來。

    5. 動物插圖?

    達(dá)爾·E 將將人體部位適應(yīng)動物。例如,當(dāng)被要求畫蘿卜擤鼻涕、喝拿鐵或騎獨輪車時,DALL·E經(jīng)常在合理的位置畫頭巾,手和腳。

    6. 達(dá)爾·E還有很多功能在此就不一一列舉

    DALL·E2

    于2022年4月6日發(fā)布新的人工智能系統(tǒng)DALL·E2,達(dá)爾·E2是一個人工智能系統(tǒng),可以從自然語言的描述中創(chuàng)建逼真的圖像和藝術(shù),它可以組合概念、屬性和樣式,可以將圖像擴(kuò)展到原始畫布之外,從而創(chuàng)建廣闊的新構(gòu)圖。

    當(dāng)然比較每個模型時,達(dá)爾·E2優(yōu)于達(dá)爾·E1。

    ChatGPT

    ChatGPT于2022年11月30日發(fā)布,是一種對話式 AI,可以與您聊天、回答后續(xù)問題并挑戰(zhàn)不正確的假設(shè)。

    GPT-4

    GPT-4于2023年3月14日發(fā)布,GPT-4,這是OpenAI在擴(kuò)展深度學(xué)習(xí)方面的最新里程碑。GPT-4 是一個大型多模態(tài)模型(接受圖像和文本輸入,發(fā)出文本輸出),雖然在許多現(xiàn)實世界場景中的能力不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平的表現(xiàn)。

    視覺輸入

    GPT-4 可以接受文本和圖像的提示,這與純文本設(shè)置并行,允許用戶指定任何視覺或語言任務(wù)。具體來說,它生成文本輸出(自然語言、代碼等),給定由穿插文本和圖像組成的輸入。在一系列域(包括包含文本和照片的文檔、圖表或屏幕截圖)上,GPT-4 表現(xiàn)出與純文本輸入類似的功能。此外,它可以通過為純文本語言模型開發(fā)的測試時技術(shù)進(jìn)行增強,包括少數(shù)鏡頭和思維鏈促使。圖像輸入仍然是研究預(yù)覽,不公開可用。

    可操縱性

    GPT-4用戶可以通過在“系統(tǒng)”消息中描述這些方向來規(guī)定他們的 AI 風(fēng)格和任務(wù),而不是具有固定冗長、語氣和風(fēng)格的經(jīng)典 ChatGPT 個性。系統(tǒng)消息允許 API 用戶顯著自定義其用戶體驗在范圍內(nèi)。

    局限性

    盡管具有功能,但GPT-4具有與早期GPT模型類似的限制。最重要的是,它仍然不完全可靠(它“幻覺”事實并犯推理錯誤)。

    OpenAI布局的未來

    OpenAI是一個非常有前途的人工智能研究機(jī)構(gòu),它在深度學(xué)習(xí)、自然語言處理、機(jī)器人等多個領(lǐng)域都取得了很好的成果。未來幾年,OpenAI將繼續(xù)發(fā)揮其在人工智能領(lǐng)域的領(lǐng)先地位,推動人工智能技術(shù)的發(fā)展和應(yīng)用。

    以下是OpenAI布局的未來可能性:

    1. 推動人工智能技術(shù)的研究和發(fā)展。OpenAI將繼續(xù)在深度學(xué)習(xí)、自然語言處理、機(jī)器人等領(lǐng)域進(jìn)行研究,進(jìn)一步提高人工智能技術(shù)的水平和應(yīng)用范圍。

    2. 推進(jìn)人工智能技術(shù)的商業(yè)化應(yīng)用。OpenAI將積極探索人工智能技術(shù)在各個行業(yè)的商業(yè)化應(yīng)用,為社會帶來更多的價值。

    3. 加強與大學(xué)、企業(yè)等合作。OpenAI將與各大高校、企業(yè)等建立更緊密的合作關(guān)系,共同推動人工智能技術(shù)的研究和應(yīng)用。

    4. 推動人工智能技術(shù)的普及和應(yīng)用。OpenAI將積極宣傳和普及人工智能技術(shù),讓更多人了解和應(yīng)用這項技術(shù),推動人工智能技術(shù)的發(fā)展和應(yīng)用。

    總而言之,OpenAI將繼續(xù)投入大量的人力、物力和財力,推動人工智能技術(shù)的發(fā)展和應(yīng)用,為人類帶來更多的福利和改變。

    ONE MORE THING

    咪豆AI圈(Meedo)針對當(dāng)前人工智能領(lǐng)域行業(yè)入門成本較高、碎片化信息嚴(yán)重、資源鏈接不足等痛點問題,致力于打造人工智能領(lǐng)域的全資源、深內(nèi)容、廣鏈接三位一體的在線科研社區(qū)平臺,提供AI導(dǎo)航網(wǎng)、AI版知乎,AI知識樹和AI圈子等服務(wù),歡迎AI未來兒一起來探索。

    ?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
    【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
    平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

    相關(guān)閱讀更多精彩內(nèi)容

    友情鏈接更多精彩內(nèi)容