- 作者:Chris Dixon
- 時間:2015年2月1日
- 原文:The idea maze for AI startups
- 翻譯:梅晨斐,校驗:曾樑
“想法導(dǎo)圖”的意思是,一家特定領(lǐng)域的創(chuàng)業(yè)公司需要思考的產(chǎn)品關(guān)鍵要素和利益權(quán)衡。
”一個好的創(chuàng)始人能夠明確區(qū)分那條路能通向成功,哪種選擇可能導(dǎo)致失敗。而不合格的創(chuàng)始人只能沉浸在“電影、音樂、文件共享、P2P、圖片社交”等一大推名詞當(dāng)中,而對整個行業(yè)的歷史一知半解,對這個領(lǐng)域里現(xiàn)在的玩家和已經(jīng)倒閉的玩家都不熟悉,對可能帶來領(lǐng)域變革的技術(shù)也不清楚。“ - Balaji Srinivasan, Market Research, Wireframing and Design
我覺得整理一份我感興趣領(lǐng)域的“想法導(dǎo)圖”很有意思。下面是我對”人工智能“這個領(lǐng)域的一些想法,之后將逐一詳解每個模塊:

"擁有80-90%準確度的最簡可行產(chǎn)品”。一種傳統(tǒng)的說法是:“機器學(xué)習(xí)是一種非常有用的技術(shù),能夠解決幾乎所有問題?!?而對大部分我們遇到的問題來說,構(gòu)建一個能夠達到80-90%精準度的模型也并不復(fù)雜。模型構(gòu)建完成之后,我們獲取反饋、募集資金、獲得數(shù)據(jù)、快速消亡。大部分情況下,構(gòu)建一個精準度達到八成的模型只需要幾個月,但是如果要繼續(xù)優(yōu)化并且提高精準度的話,可能需要好幾年的時間。(順便提一句,這就是為什么一些大型公司做出類似Watson或自動駕駛汽車的產(chǎn)品原型并沒有花很多時間。但是關(guān)鍵是,看他們?nèi)绾翁幚砟?0-20%的邊緣情況。即如何處理在光線不充足的條件下,突然闖出的一條狗。)
面臨這種情況時,你有兩種選擇。1、繼續(xù)提高精準度,企圖接近100%,2、在現(xiàn)有精準度的條件下,馬上開發(fā)產(chǎn)品,產(chǎn)出的是所謂“有錯誤但可接受的用戶體驗”。
蘋果iOS系統(tǒng)上的自動補齊,以及Google搜索引擎上的自動填充推薦,就是剛才提到的第二種選擇的產(chǎn)品代表。當(dāng)然,你可以質(zhì)疑Google的搜索引擎自動填充并不是非常典型的代表,因為Google在你輸入搜索關(guān)鍵詞的時候,會自動為你提供10個可能相關(guān)的搜索建議,而不是直接給你一個相關(guān)性最高的結(jié)果。但是,構(gòu)建這個一個并不完美的系統(tǒng)并不意味著妥協(xié)。但是,不同的精準度要求意味著產(chǎn)品在架構(gòu)選擇上的區(qū)別。(特別是,當(dāng)你需要人工和機器一起工作的時候,反饋延時是非常重要的,而這點也會影響技術(shù)架構(gòu)的選擇。)
好的,讓我們假設(shè)你選擇第一條路,繼續(xù)提高產(chǎn)品的精準度。接下來具體該如何操作呢?你無法通過簡單的算法提高精準度。唯一可操作的方式是,你需要有大量的練習(xí)數(shù)據(jù)來幫助你調(diào)整產(chǎn)品模型,所以數(shù)據(jù)是這一切的關(guān)鍵。因為,一、我們已經(jīng)有了精準的算法和計算資源,數(shù)據(jù)是現(xiàn)在唯一缺失的部分,二、。開放數(shù)據(jù)從某種方面來說,并不是很好的解決方案。最好的數(shù)據(jù)源,要么根本不存在,要么掌握在私人公司手里無法獲取。
“領(lǐng)域細分”。多數(shù)情況下,你需要的數(shù)據(jù)的量與你希望解決問題的寬度是正相關(guān)的。所以在你真正著手收集數(shù)據(jù)之前,你需要先弄清楚你的目標(biāo)領(lǐng)域。與其計劃做一個嘗試解決所有問題的機器人,不如專心完成一個能夠幫助人們安排會議的智能系統(tǒng)。與其做一個嘗試預(yù)測所有未來的云端系統(tǒng),不如完成一個能夠預(yù)測欺詐交易的系統(tǒng)。
“繼續(xù)領(lǐng)域細分”。當(dāng)你已經(jīng)明確細分的領(lǐng)域之后,你要做的就是繼續(xù)不斷往深度上挖。假設(shè)你想做的產(chǎn)品是X,那么你要做的不是直接開發(fā)產(chǎn)品X,而是先開發(fā)基于X的最小產(chǎn)品原型。我的建議是,不斷細分深挖你想做的產(chǎn)品,直到不能再細分為止。與其開發(fā)出最后沒有人需要的產(chǎn)品,不如在前期多花一點一時間。擴張的事情,都可以在后面慢慢再做。
“那么具體如何獲取數(shù)據(jù)呢?” 大體上也有兩種獲取途徑。1、自己手動獲取,2、通過眾包的方式獲取。一個典型的案例就是Google地圖與Waze。Google派遣上千人每天開車去獲取道路、建筑和交通的數(shù)據(jù)信息。而Waze則鼓勵他們的百萬用戶自動幫助Waze收集數(shù)據(jù)。如果遵循Google的方式開發(fā)產(chǎn)品,那么你在啟動產(chǎn)品之前就需要一筆至少上億美金的融資支持。
所以作為一家創(chuàng)業(yè)公司,剩下的數(shù)據(jù)獲取途徑只剩兩種,1、從公開渠道獲取,2、眾包。
從公開渠道獲取的典型案例就是:[Wikipedia](www.wikipedia.org
[)。當(dāng)然你可以狡辯說,這就像Google早期時候從各種渠道通過爬蟲去爬網(wǎng)頁鏈接,用來優(yōu)化它的搜索算法。不過據(jù)我了解,有很多的創(chuàng)業(yè)公司都嘗試從Wikipedia上爬取大量數(shù)據(jù),但是沒有幾家公司真正做出什么成績。
最后剩下的切實可行的辦法就是:“眾包”。這種方式的關(guān)鍵是,如何設(shè)計一套有效的機制,能夠鼓勵普通用戶收集數(shù)據(jù),最后反饋到產(chǎn)品,幫助進行優(yōu)化。接下來我將以去年我們投資的一家公司Wit.ai舉例,Wit想要提供的服務(wù)是,幫助開發(fā)人員解決語音轉(zhuǎn)化文字的功能,以及自然語言處理的問題。1.0版本推出以后達到了部分效果,但是并不很理想。之后,公司推出了一套儀表界面和開放API,使得開發(fā)人員可以自己糾錯來優(yōu)化結(jié)果。所有的用戶(開發(fā)人員)可以免費使用這套云端服務(wù),同時用戶會自動幫助整套系統(tǒng)來修復(fù)一些算法和數(shù)據(jù)上的問題。Facebook之后收購了Wit。但是他們采取的整套做法值得其他AI創(chuàng)業(yè)公司借鑒。
上圖是我對AI領(lǐng)域的一些理解。以下是一些忠告:1、我在上文中提到的一些想法不完全是正確的,初衷是促進交流,而不是為了給大家洗腦,2、就像Balaji所說的,我們相信新的AI開發(fā)技術(shù)在未來將會給人們的生活領(lǐng)域帶來非常多革命性的變革。