針對結(jié)巴分詞Memory Error的兩種解決方式 一、背景 ? 最近,在使用Gensim Word2vec根據(jù)特定語料訓練近義詞模型,模型訓練輸入語料要求是分詞之后的文...
針對結(jié)巴分詞Memory Error的兩種解決方式 一、背景 ? 最近,在使用Gensim Word2vec根據(jù)特定語料訓練近義詞模型,模型訓練輸入語料要求是分詞之后的文...
背景 公司需要根據(jù)過去一段時間內(nèi)每天網(wǎng)站的流量數(shù)據(jù),預測未來一段時間每日流量,這樣,在流量高峰到來前,可以提前警示相關的運營、運維提前準備。 這是個典型的“時序預測問題”,關...
背景 線上服務報大量的Redis,相關依賴這個服務的其他產(chǎn)品線服務也報出同樣的日志。 截圖線上日志 為什么要寫這篇文章 在我的上篇文章中 《記錄Redis事故影響API性能-...
背景 線上服務報大量的Redis,相關依賴這個服務的其他產(chǎn)品線服務也報出同樣的日志。 截圖線上日志image 解決方法: 沒有上線/相關請求的服務的流量和QPS都沒有增加,故...
1 概述 在歷時2個月的不斷優(yōu)化過程中,將數(shù)據(jù)采集系統(tǒng)的處理能力(kafka一個topic)從2.5萬提升到了10萬,基本符合對下一次峰值的要求了。 所有日志中,其中廣告日志...
我們經(jīng)常困惑在數(shù)據(jù)挖掘和報表分析場景中sql不會寫,或者因為sql太長以至于可讀性降低; 今天我為大家總結(jié)了一些Spark SQL中的高階函數(shù),它們將會對你的業(yè)務形成助力,百...
問答系統(tǒng):通過用戶給出的一段描述性文本,通過相似度計算查找與用戶輸入接近的問題相似推薦:用戶在瀏覽當前文章時,基于內(nèi)容相似性推薦與本篇文章相似的文章 more_like_th...
搜索是很多內(nèi)容類app必不可少的功能,而搜索框提示則為用戶關鍵詞輸入提供了一種引導,一個友好的搜索框提示不僅能提升用戶體驗,還能幫助用戶節(jié)省觸達商品的時間提升搜索效率。 搜索...
大家應該知道廣告有一種計算收益的方式叫CPM,簡單講就是通過不斷擴大曝光量來提升廣告收益的計算方式;同樣這種方式也適用于推薦系統(tǒng);業(yè)務在不斷提升,而商品的展示位相對又是比較固...
當論及可觀察性時,不同的人往往會給予不同的反應。 更多的人會反問:什么是可觀察性? 如何定義可觀察性? 如果說服務的可觀察性不容易定義,那么我們可以換個詞來類比: 可視化, ...
Flink是一款非常適合做流批處理的計算框架,F(xiàn)link1.10.0 更是完美整合了阿里的BLink、支持了yarn模式下的跨Task資源共享,并強化了對hive的支持,下面...
前言 在開發(fā)skywalking nginx探針過程中重點分析了“Skywalking跨進程鏈路信息傳遞協(xié)議”和“Skywalking鏈路數(shù)據(jù)采集協(xié)議”。skywalking...
介紹 這是一個基于Netty框架二次封裝的高性能Http接口服務,增加了對http請求路由的功能,并簡化了操作,目的是將接收到的日志經(jīng)過簡單處理后快速推送到kafka ,服務...