大數(shù)據(jù)人工智能詞匯索引S
S
流處理(Stream processing):流處理被設(shè)計(jì)來用于持續(xù)地進(jìn)行流數(shù)據(jù)的處理。與流分析技術(shù)(指的是能夠持續(xù)地計(jì)算數(shù)值和統(tǒng)計(jì)分析的能力)結(jié)合起來,流處理方法特別能夠針對大規(guī)模數(shù)據(jù)的實(shí)時(shí)處理。
社交分析(Social analytics):指基于信息學(xué)、數(shù)學(xué)、社會(huì)學(xué)、管理學(xué)、心理學(xué)等多學(xué)科的融合理論和方法,為理解人類各種社交關(guān)系的形成、行為特點(diǎn)分析以及信息傳播的規(guī)律提供的一種可計(jì)算的分析方法。
結(jié)構(gòu)化 vs 非結(jié)構(gòu)化數(shù)據(jù)(Structured v Unstructured Data):這是大數(shù)據(jù)中的對比之一。結(jié)構(gòu)化數(shù)據(jù)基本上是那些能夠被放在關(guān)系型數(shù)據(jù)庫中的任何數(shù)據(jù),以這種方式組織的數(shù)據(jù)可以與其他數(shù)據(jù)通過表格來關(guān)聯(lián)。非結(jié)構(gòu)化數(shù)據(jù)是指任何不能夠被放在關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),例如郵件信息、社交媒體上的狀態(tài),以及人類語音等等。
軟件即服務(wù)(SaaS):軟件即服務(wù)讓服務(wù)提供商把應(yīng)用托管在互聯(lián)網(wǎng)上。SaaS 提供商在云端提供服務(wù)。
半結(jié)構(gòu)化數(shù)據(jù)(Semi-structured data):半結(jié)構(gòu)化數(shù)據(jù)指的是那些沒有以傳統(tǒng)的方法進(jìn)行格式化的數(shù)據(jù),例如那些與傳統(tǒng)數(shù)據(jù)庫相關(guān)的數(shù)據(jù)域或者常用的數(shù)據(jù)模型。半結(jié)構(gòu)化數(shù)據(jù)也不是完全原始的數(shù)據(jù)或者完全非結(jié)構(gòu)化的數(shù)據(jù),它可能會(huì)包含一些數(shù)據(jù)表、標(biāo)簽或者其他的結(jié)構(gòu)元素。半結(jié)構(gòu)化數(shù)據(jù)的例子有圖、表、XML 文檔以及電子郵件。半結(jié)構(gòu)化數(shù)據(jù)在萬維網(wǎng)上十分流行,在面向?qū)ο髷?shù)據(jù)庫中經(jīng)常能夠被找到。
存儲(chǔ)(Storage):一方面它是數(shù)據(jù)臨時(shí)或長期駐留的物理媒介;另一方面,它是保證數(shù)據(jù)完整安全存放的方式或行為。存儲(chǔ)就是把這兩個(gè)方面結(jié)合起來,向客戶提供一套數(shù)據(jù)存放解決方案。
內(nèi)存數(shù)據(jù)流(Streaming/in memory):是一種數(shù)據(jù)傳送技術(shù),它把客戶機(jī)收到的數(shù)據(jù)變成一個(gè)穩(wěn)定連續(xù)的流,源源不斷地送出,使用戶聽到的聲音或看到的圖象十分平穩(wěn),而且用戶在整個(gè)文件送完之前就可以開始在屏幕上瀏覽文件。這在目前大多數(shù)用戶因接入瓶頸而不具備快速下載大型多媒體文件的情況下尤為重要。
情感分析(Sentiment Analysis):情感分析涉及到了對消費(fèi)者在社交媒體、顧客代表電話訪談和調(diào)查中存在的多種類型的交互和文檔中所表達(dá)的情感、情緒和意見的捕捉、追蹤和分析。文本分析和自然語言處理是情感分析過程中的典型技術(shù)。情感分析的目標(biāo)就是要辨別或評價(jià)針對一個(gè)公司、產(chǎn)品、服務(wù)、人或者時(shí)間所持有的態(tài)度或者情感。
網(wǎng)絡(luò)安全(Security):是指網(wǎng)絡(luò)系統(tǒng)的硬件、軟件及其系統(tǒng)中的數(shù)據(jù)受到保護(hù),不因偶然的或者惡意的原因而遭受到破壞、更改、泄露,系統(tǒng)連續(xù)可靠正常地運(yùn)行,網(wǎng)絡(luò)服務(wù)不中斷。
銷售量(Sales):是指企業(yè)在一定時(shí)期內(nèi)實(shí)際促銷出去的產(chǎn)品數(shù)量。
空間分析(Spatial analysis):空間分析指的是對空間數(shù)據(jù)作出分析,以識別或者理解分布在幾何空間中的數(shù)據(jù)的模式和規(guī)律,這類數(shù)據(jù)有幾何數(shù)據(jù)和拓?fù)鋽?shù)據(jù)。
智能數(shù)據(jù)(Smart Data):是經(jīng)過一些算法處理之后有用并且可操作的數(shù)據(jù)。
Terabyte:這是一個(gè)相對大的數(shù)字?jǐn)?shù)據(jù)單位,1TB 等于 1000GB。據(jù)估計(jì),10TB 能夠容納美國國會(huì)圖書館的所有印刷品,而 1TB 則能夠容納整個(gè)百科全書 Encyclopedia Brittanica。
Spark(Apache Spark):Apache Spark 是一個(gè)快速的內(nèi)存數(shù)據(jù)處理引擎,它能夠有效地執(zhí)行那些需要迭代訪問數(shù)據(jù)庫的流處理、機(jī)器學(xué)習(xí)以及 SQL 負(fù)載。Spark 通常會(huì)比我們前面討論過的 MapReduce 快好多。
半結(jié)構(gòu)化數(shù)據(jù)(Semi-structured data):半結(jié)構(gòu)化數(shù)據(jù)并不具有結(jié)構(gòu)化數(shù)據(jù)嚴(yán)格的存儲(chǔ)結(jié)構(gòu),但它可以使用標(biāo)簽或其他形式的標(biāo)記方式以保證數(shù)據(jù)的層次結(jié)構(gòu)
信號分析(Signal analysis):指通過度量隨時(shí)間或空間變化的物理量來分析產(chǎn)品的性能。特別是使用傳感器數(shù)據(jù)。
相似性搜索(Similarity searches):在數(shù)據(jù)庫中查詢最相似的對象,這里所說的數(shù)據(jù)對象可以是任意類型的數(shù)據(jù)
仿真分析(Simulation analysis):仿真是指模擬真實(shí)環(huán)境中進(jìn)程或系統(tǒng)的操作。仿真分析可以在仿真時(shí)考慮多種不同的變量,確保產(chǎn)品性能達(dá)到最優(yōu)
智能網(wǎng)格(Smart grid):是指在能源網(wǎng)中使用傳感器實(shí)時(shí)監(jiān)控其運(yùn)行狀態(tài),有助于提高效率
SQL :在關(guān)系型數(shù)據(jù)庫中,用于檢索數(shù)據(jù)的一種編程語言
結(jié)構(gòu)化數(shù)據(jù)(Structured data):可以組織成行列結(jié)構(gòu),可識別的數(shù)據(jù)。這類數(shù)據(jù)通常是一條記錄,或者一個(gè)文件,或者是被正確標(biāo)記過的數(shù)據(jù)中的某一個(gè)字段,并且可以被精確地定位到。
搜索(Search Engines):它包括信息搜集、信息整理和用戶查詢?nèi)糠?。搜索引擎是一個(gè)為你提供信息“檢索”服務(wù)的網(wǎng)站,它使用某些程序把因特網(wǎng)上的所有信息歸類以幫助人們在茫茫網(wǎng)海中搜尋到所需要的信息,它包括信息搜集、信息整理和用戶查詢?nèi)糠?。目前常用的網(wǎng)絡(luò)搜索引擎有百度,Google,我愛讀,搜狐,雅虎,必應(yīng),好書搜索,有道,中搜,搜搜,搜客等。