說了一頓都是些簡單的錯誤,也是把官網(wǎng)的例子講了一遍,實(shí)際工程中輸入數(shù)據(jù)都是RDD或者dataframe分布式數(shù)據(jù),而不是簡單的List。
Pyspark實(shí)現(xiàn)KMeans機(jī)器學(xué)習(xí)聚類算法(一)Pyspark實(shí)現(xiàn)KMeans機(jī)器學(xué)習(xí)聚類算法(一) 環(huán)境配置:spark 2.1.1python 3.5.2IPython 5.1.0 這里配置了pyspark默認(rèn)以ipy...