Prisma產品體驗報告

有了Prisma,人人都可以是藝術家!

當?shù)厍蛏系娜艘话朐谟肞okemon Go追皮卡丘的時候,剩下的一半在用Prisma修圖!

Prisma是由俄羅斯的一個4人組成的創(chuàng)業(yè)團隊研發(fā)的圖片處理app,從研發(fā)到上線僅幾個月就用戶量驚人。
Prisma拯救了世界上最不會拍照的人,哪怕只是隨便一拍的爛片,只要在Prisma里過一手,都能變成掛得上墻的藝術作品。

今天就來說說這個神奇的APP以及它背后的故事!

一:來說說APP

  • 產品名:Prisma
  • 版本號:Version 2.2.4.118
  • 設備:MI 5
  • OS:Android 7.0


分析方法:互聯(lián)網產品的五個層次

戰(zhàn)略層:

1.功能簡介

Prisma是一款來自俄羅斯的修圖工具類APP,可以通過軟件背后強大的神經網絡算法(CNN)依據(jù)你所給素材生成一張指定藝術風格的圖片!

2.人群畫像

年齡分布

性別分布

在年齡分布上,用戶大都集中在20-40歲之間,屬于互聯(lián)網用戶中最活躍的力量,占比達到了70%;在性別分布上主要以男性用戶為主,男性占比75%,女性25%。(* 數(shù)據(jù)來源:百度指數(shù))


區(qū)域分布

用戶主要分布在北上廣深杭等發(fā)達較發(fā)達的地區(qū)(* 數(shù)據(jù)來源:百度指數(shù))

3.需求分析

基本需求:圖像處理,藝術化加工圖片;
期望需求:修圖成果分享和互動;
興奮需求:成為網絡紅人,制作影集,簽約成專業(yè)攝影師;

范圍層:

4.產品功能

  • 1.素材拍攝于獲取
  • 2.圖像處理
  • 3.社交分享與訂閱
  • 4.賬號信息管理

功能關系:Prisma的功能可以是說簡單可用。APP支持即時拍攝的圖片和本地圖片進行處理,通過Facebook或prisma賬號擴張社交互動功能,同時可以查看管理發(fā)布的照片以及訂閱作者和粉絲。

5.功能范圍

  • 1.素材拍攝于獲取

通過調取Camera接口,可以即時的拍攝照片;同時可支持自拍和后置拍攝兩種拍攝方法(后置支持控制閃光燈);在即時拍攝照片獲取素材的同時Prisma還支持調取本地圖片。在素材獲取這一點上Prisma和其他常用的圖片工具APP沒有較大差別和突破,功能易用且簡潔!


  • 2.圖像處理

Prisma應用了深度學習--卷積神經網絡算法的黑科技,實現(xiàn)了對圖片的高度藝術化的圖片處理。其實現(xiàn)原理和Alpha Go類似,都是機器算法通過對現(xiàn)實世界的學習和結構,輸出再造的和模仿的作品。簡單的說,通過對大師們的作品的學習,他將我們給它的圖片按照習得的大師們的風格進行模仿和再造,就好似藝術大師為你親手繪制一般。具體的算法原理第二大節(jié)我會深入的分析。

Prisma提供了39種藝術風格供用戶選擇,在圖片完成制作時支持通過左右滑動以調節(jié)藝術化的程度的大??!


這里需要吐槽一下Prisma的處理響應速度,由于需要將圖片傳入云端進行計算和重繪后再傳回本地,其處理一張圖片的速度大概在10s左右。這點的體驗不是特別好,畢竟在快節(jié)奏的今天,10s足以讓人不想第二次打開這個應用!

  • 3.社交分享與訂閱

通過Facebook賬號授權或注冊Prisma賬號,你就可以瀏覽和訂閱更多其他作者的作品集??梢詫崿F(xiàn)點贊、評論、分享、LBS等社交功能!社交屬性的加入為Prisma商業(yè)實現(xiàn)增加了更多的可能!
FEED界面下分為DISCOVER以及FOLLOWING兩個項目;




DISCOVER界面下又分為Trending&Most Recent兩個List。Trending以瀑布流的形式隨機的向用戶展示其他用戶發(fā)布的圖片;Most Recent以瀑布流的形式向用戶展示其他用戶發(fā)布的最近圖片;



瀏覽查看其他用戶作品的同時可以實現(xiàn)點贊、評論、分享、LBS等社交功能!

FOLLOWING中隨機向用戶推進熱門活躍的圖片作者,以供用戶訂閱。
  • 4.賬號信息管理

通過瀑布流的方式管理自己拍攝和發(fā)布的圖片,同時可以查看和管理自己的訂閱和粉絲。對于現(xiàn)在prisma較為輕量級的賬戶數(shù)據(jù),這個的賬戶管理方式,無疑是簡單而且有效的。


結構層:

6.產品結構

Prisma產品結構.png

框架層&表現(xiàn)層:

7.框架及UI設計

Prisma采用了時下流行的Tabbar的導航方式,上方有3個Tab,分別是“CAMARA”、“FEED”、“PROFILE”,均支持滑動或點按切換。這種導航適用于用戶頻繁在不同Page之間切換,優(yōu)點是用戶切換成本低,但缺點是會占用一定高度,用戶的操作可視化面積降低。



整個APP的UI給人一種簡潔淡雅的感覺,沒有更多的花紋和圖片的裝飾,大范圍的使用了白色的主題顏色以及黑色系的非襯線字體。這樣的UI設計使得APP看起來十分的簡約淡雅,而在功能方面又有十分強大的算法的技術支撐,可以說Prisma是一款內外兼修、雖小卻美的APP。

8.功能建議

1.優(yōu)化圖像處理速度;
2.視頻處理功能;
3.針對天朝的本地化;
4.增值服務;
5.增強社交化程度,建立社群;
6.優(yōu)化FEED圖片瀏覽的瀏覽時間成本,增加圖片分類和分組;

9.總結

作為一個工具類應用,Prisma的技術性很強,這也是它的核心競爭力,也是它能火爆朋友圈的關鍵(連俄國總理都用它修圖)。Prisma的APP功能很輕,UI簡潔淡雅,總的來說就是兩個詞:“簡單&好用”。
無論是UX還是功能方面Prisma都做的不錯,且APP做的很純凈,沒有任何的商業(yè)元素的存在,但這恰恰也是現(xiàn)在眾多工具類應用的困境:沒有較強的商業(yè)化可行方案。如何實現(xiàn)持續(xù)性的盈利和商業(yè)變現(xiàn)是Prisma團隊仍需繼續(xù)攻克的難題。

再聊聊APP背后的故事

1.Prisma不是美圖秀秀

相信很多人用過美圖秀秀,里面的各種濾鏡也可以讓圖片變得五彩斑斕,可能你也理所當然的以為Prisma是美圖的加強版而已,然而事實上大錯特錯!
簡單的說Prisma是按照你提供的主體文件內容和風格圖片的樣式,重新“繪制”一副新的圖片!你可以這么理解:Prisma是一個藝術家,當用戶給他一張照片,和一個風格之后,他就會按照你給的照片的內容和你要求的風格現(xiàn)場畫出新的圖片,然而這個神秘的藝術家就是:深度學習算法—卷積神經網絡(CNN)的黑科技!

2.神秘黑科技--卷積神經網絡深度學習算法


Prisma應用的算法來自2016年的一篇論文CVPR 2016 Oral Paper Image Style Transfer Using Convolutional Neural Networks
論文提到的主要思路是,用19層(那個下圍棋的Alpha Go也就13層)的卷積神經網絡提取圖片的內容特征或風格特征,然后將源圖片A的內容和源圖片B的風格進行融合,“畫出”一張帶有B圖片風格特征和A圖片內容特征的目標圖片。

Prisma的所做的風格轉換是機器視覺領域一直在研究的一個問題,稱為texture transfer (紋理轉換),其目標為將源圖片的風格合成進目標圖片中同時保留目標圖片的語意內容。本質上來說,將圖片的內容和風格分離并不一定是一個定義明確的問題 (Well-defined problem),這是因為并不能準確定義出圖片中的哪部分屬于內容,哪部分屬于風格,很有可能內容與風格是交織在一起,沒有辦法進行分離。所以圖片的內容和風格是否可以完全分離這還是一個待解的問題,如果可以,那么用什么樣的方法呢?

Prisma背后的技術基于一篇今年CVPR oral文章 “Image Style Transfer UsingConvolutional Neural Networks”,其實早在Prisma引爆大眾市場的半年前,此方法的巧妙及其驚人效果已經引起在學術界引起了廣泛關注。眾所周知在如今的人工智能領域引起革命的深度學習技術已經將眾多任務推向了實用的水平,而Prisma用的技術也不出意外的基于深度神經網絡,它的系統(tǒng)核心是利用神經表征來分離,再組合隨機圖片的內容和風格,以此來實現(xiàn)一個可用來描繪藝術圖像的算法。它的基本想法是利用一個多層的卷積神經網絡(CNN)抽象出給定繪畫作品里一些高級的隱藏特征用來模仿繪畫風格,并把這個繪畫風格應用到一個新的圖片上。

而在紋理轉換領域,之前傳統(tǒng)方法之所以沒能取得這么驚人的效果的本質原因在于之前非深度學習的方法只能獲取到目標圖片低層次的圖片特征,這導致這些方法無法獨立的對圖片的語意內容和風格的變化進行有效的建模,從而無法很好的對兩者進行解耦和合成。而深度神經網絡之所以可以在眾多領域中取得驚人效果,正是由于其可以抽取出高層次的信息表征。Prisma所使用的方法之所以能成功就是很巧妙的利用了深度神經網絡抽取高層圖片表達的能力,能在幾十秒內把一張普通的照片轉變成一副極具藝術特色的現(xiàn)代畫作或者西方名畫風格作品。

下面將采用論文中的兩個示意圖完整剖析其中的奧妙。


正如上文所說風格轉換需要對圖片的內容和風格進行單獨的表示,上圖中的分別將源圖(風格提供方)和目標圖(內容提供方)輸入到由多層卷積層和池化層組成的深度神經網絡中。對于目標圖直接使用卷積的響應在每一層中進行重建,可視化的結果為紅色框中的結果,可以看出在低層的重建圖像幾乎和目標圖一致,而越高層網絡重建出來的圖像的一些細節(jié)的像素被丟棄而那些圖片高層次的語意內容被保留。而源圖計算每一層的卷積的特征圖(feature maps)的相關系數(shù)來重建出風格的特征表示,從綠色框的可視化結果可以看出,這種抽取風格表示的方式在不同網絡層成功提取出不同尺度的風格特征。



上圖講解了深度神經網絡如何對風格和內容表示進行單獨的建模,接下去就可以使用監(jiān)督學習的深度神經網絡進行風格的轉換了。圖中左右兩邊的網絡用于抽取源圖的風格表示和目標圖的內容表示,而中間的網絡用于對風格進行合成,論文使用的是白噪聲圖片作為啟始圖,思想是通過左右兩個網絡提供的風格和內容表征進行監(jiān)督學習,使得輸入圖片每一層抽取出來的風格表征和高層抽取出來的內容表征和左右兩個網絡相應網絡層重建出來的表征越來越一致,如此通過標準的隨機梯度下降算法,不斷迭代使得白噪聲圖片變成最終想要的合成圖。使用數(shù)學表達去描述上述思想就是需要構造一個損失函數(shù)(紅框所示),此損失函數(shù)是由風格損失項和內容損失項兩者線性組成,其中alpha和belta分別代表風格和內容的權重比例,若alpha/belta高則生成圖會更凸顯出內容而風格化會少一些,低則生成圖會風格化強烈但是內容被稀釋,這也是Prisma提供用戶調節(jié)的原理所在。風格損失項和內容損失項的具體細節(jié)可以參見論文。當有了損失函數(shù),就可以對圖像向量求解梯度,進而使用后向傳遞算法就可以對輸入的圖像不斷進行更新從而進行風格轉換(綠框所示)。

另外,通過在提取圖像風格特征之前先改變圖像的大小,可以通過控制-style_scale參數(shù)該從圖像中提取哪種藝術特征。(三幅圖像從左到右,-style_scale=2.0、1.0、0.5)



除此之外,Prisma還可以使用超過一種風格圖像來混合多種藝術風格。(下圖分別為:"The Starry Night" + "The Scream", "The Scream" + "Composition VII")



或者在使用多個風格圖像的時候,可以控制混合的程度來呈現(xiàn)不同的圖像類型。

還可以在保留顏色的前提下改變圖像風格,比如說,如果你設置參數(shù)-original_colors 1,系統(tǒng)輸出的圖片會保留原圖的顏色(如下圖)。



以上就是Prisma背后的全部技術原理,當我們剖析一下發(fā)現(xiàn)其實里面的原理并不復雜,對于熟悉深度學習的人來說不出一周就可以復現(xiàn)出其中的算法。但最重要的是體會到此算法成功的核心在于利用了深度學習網絡對于高層語意信息的表達能力,同時巧妙的構造出損失函數(shù),其他的就只是順水推舟的使用深度神經網絡進行求解而已。

Prisma利用AI算法來修圖雖然很酷,但是也有一定的缺陷。

比如說,一定要在有網絡狀態(tài)較好、網絡較快的狀態(tài)下才可以使用順暢,因為需要在線加載繪畫風格圖像以及用戶提供的內容圖片需要發(fā)送到遠程的服務器上進行人工智能計算后再傳回來,所以,相對其他修圖軟件,它的圖片編輯速度慢很多,一般都需要等待幾十秒才可以看到預覽效果。

另外,因為所有的圖片處理都是在云端完成,所以會有少部分用戶遇到使用人數(shù)過多,服務器過載的情況。


Prisma的意義在于以藝術的名義用流行的方式把深度學習的能力展現(xiàn)給了大眾,雖然如今眾多的人工智能公司使用AI技術去服務大眾,但像Prisma這樣如此火熱的引爆大眾對于如今人工智能技術的驚訝還十分少見。但我想這只是一個開始,人工智能技術正在向各個領域進發(fā),無論是高科技領域如自動駕駛,機器人,還是一些偏門的領域,如藝術,社會公益,都會不斷看到人工智能帶來的實惠和驚喜。

PS:關于卷積神經網絡的技術分析來源自網絡和簡書相關文章,侵刪!

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容