在MySQL 5.7.6之前,全文索引只支持英文全文索引,不支持中文全文索引,需要利用分詞器把中文段落預(yù)處理拆分成單詞,然后存入數(shù)據(jù)庫。從MySQL 5.7.6開始,MySQ...
在MySQL 5.7.6之前,全文索引只支持英文全文索引,不支持中文全文索引,需要利用分詞器把中文段落預(yù)處理拆分成單詞,然后存入數(shù)據(jù)庫。從MySQL 5.7.6開始,MySQ...
前言 es是什么?es是基于Apache Lucene的開源分布式(全文)搜索引擎,,提供簡單的RESTful API來隱藏Lucene的復(fù)雜性。es除了全文搜索引擎之外,還...
函數(shù)說明 語法:unnest(anyarray)返回值:setof anyelement(可以理解為一個(gè)(臨時(shí))表)說明:unnest函數(shù)將輸入的數(shù)組轉(zhuǎn)換成一個(gè)表,這個(gè)表的每...
百度的廣告和無效信息超多,每次使用百度都要從一堆垃圾中挑出自己想要的結(jié)果。大部分時(shí)候也搜索不出自己想要的結(jié)果。 無意中發(fā)現(xiàn)了“多吉搜索”,使用起來非常的舒適,界面簡潔,搜中文...
數(shù)據(jù)指標(biāo)體系是建立用戶畫像的基礎(chǔ),也是在進(jìn)入開發(fā)前的關(guān)鍵環(huán)節(jié),是需要結(jié)合業(yè)務(wù)場景制定的數(shù)據(jù)指標(biāo)。建立用戶畫像一般從2個(gè)維度: ①用戶維度(userid):基于當(dāng)前用戶賬號相關(guān)...
Pandas.DataFrame操作表連接有三種方式:merge, join, concat。下面就來說一說這三種方式的特性和用法。 先看兩張表: merge。相當(dāng)于SQL中...
回歸,最初是遺傳學(xué)中的一個(gè)名詞,是由生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓首先提出來的。他在研究人類的身高時(shí),發(fā)現(xiàn)高個(gè)子回歸于人口的平均身高,而矮個(gè)子則從另一個(gè)方向回歸于人口的平均身高。 ...
轉(zhuǎn)眼一年就要過去了,最近在工作和生活中都有一些感悟,記錄一下。 關(guān)于讀書 其實(shí)這一年我讀的書并不多,技術(shù)書籍還好,文學(xué)類的幾乎就沒有讀過。上學(xué)的時(shí)候讀了很多文學(xué)類書籍,可是最...
通過閱讀比較多的 Hive 調(diào)優(yōu)材料,并根據(jù)自己的實(shí)踐,總結(jié) Hive 調(diào)優(yōu)如下,讓 Hive 調(diào)優(yōu)想法不再凌亂、碎片化,而是形成結(jié)構(gòu)。 部分參考鏈接說明 本文參考的部分鏈接...
Hive分析函數(shù)和窗口函數(shù) 在Hive 0.11之后支持的,掃描多個(gè)輸入的行計(jì)算每行的結(jié)果。通常和OVER,PARTITION BY, ORDER BY, WINDOWING...
前言 Apache Kudu是由Cloudera開源的存儲(chǔ)引擎,可以同時(shí)提供低延遲的隨機(jī)讀寫和高效的數(shù)據(jù)分析能力。Kudu支持水平擴(kuò)展,使用Raft協(xié)議進(jìn)行一致性保證,并且與...
Presto實(shí)現(xiàn)原理和美團(tuán)的使用實(shí)踐 -http://tech.meituan.com/presto.html Presto執(zhí)行查詢過程簡介既然Presto是一個(gè)交互式的查詢...
argparse模塊是命令行參數(shù)解決包,可以很方便的接收從命令行傳過來參數(shù),也可以對傳過來的參數(shù)進(jìn)行定制化處理。原有的optparse已經(jīng)慢慢的被棄用了,所以現(xiàn)在開始對arg...
好久沒碰數(shù)據(jù)庫了,只是想起自己當(dāng)時(shí)在搞數(shù)據(jù)庫的時(shí)候在事務(wù)隔離級別這塊老是卡,似懂非懂的。現(xiàn)在想把這塊整理出來,盡量用最簡潔的語言描述出來,供新人參考。 首先創(chuàng)建一個(gè)表acco...
鎖在平時(shí)的工作中接觸的比較少(InnDB幫我們做了不少事),所以這里在Java3y 的文章上加上了自己的理解。本文講解了鎖的分類、使用場景,當(dāng)工作中碰到鎖的問題能夠有一個(gè)清楚...