用PU學習算法做文本挖掘
正例和無標記樣本學習(Learning from Positive and Unlabeled examples)一般稱為LPU或PU學習。PU學習是一種常用的半監督的二元分類模型,它的目的是通過已標注的正例數據和大量的未標注數據訓練出一個用于區分正反分類的分類器。
用PU學習算法做文本挖掘
這個方向國內也有類似,甚至可能更前瞻的基于社交化數據挖掘, 提煉出個性化推薦。火花無線, 一家O2O的無線新秀所推出的美食推薦應用, 麻花, 就是一個典型案例。作為一部分基礎數據, 該應用挖掘了新浪微博上有關餐廳的微博分享, 并匯集成熱門餐廳。我們來看一下麻花是怎樣在新浪微博等SNS上做數據挖掘的。
圖12-3麻花界面示意圖
為了給用戶最個性化和最高價值的過程中, 該應用進一步通過互粉關系, 把互粉用戶所推薦的內容提高權重,推薦給用戶, 從而提高推薦餐館的相關度和增加搜索結果的可信度。 說起來很簡單,但是在這里比較關鍵的是如何從用戶的某條微博中發現地點和判斷用戶是對該地點做出評論。不是每條包含地點的微博都是對地點的推薦。比如
“我在貝塔咖啡吃午飯”
或者
“今天去福地聽講座”
這些微博雖然提到了地點,但只能算是一個“check-in”,并不是對這些地點的評價。
你可能喜歡
- 電子商務數據分析
- 電子商務運營
- 電子商務數據挖掘
- 數據技術
- 電商數據
- 碎片化時代
- 美國大學排名
- 電子商務課件
- 2011Q1中國電子商務市場核心數據以及市場分析40頁
- 電子商務廣告數據分析及投放策略17頁
- B2C電子商務網站數據分析的流程2頁
- 電子商務數據分析指標體系6頁
- 直通車提升轉化率 淘寶數據分析 電子商務必備50頁
- 第七講:電子商務的用戶體驗與數據分析69頁
- Btoc電子商務對企業運營成本的節約14頁
- 企業的電子商務運營管理創新發展之路82頁
- B2C電子商務運營研究(轉)14頁
- 淘寶大學_網店運營專才_1.1電子商務與網絡零售概述35頁
- 淘寶天貓運營必備:電子商務員工績效評分表(美工篇)1頁
- 基于電子商務的冉冉愛網店運營模式研究11163頁
- 企業電子商務中的客戶數據挖掘2頁
- Web數據挖掘技術在電子商務中的應用研究3頁
- 第9講 電子商務與數據挖掘49頁
- 數據挖掘在電子商務中應用問題研究_張冬青7頁
- Web數據挖掘技術在電子商務中的應用6頁
- Clementine在電子商務環境中的數據挖掘應用4頁
- 2 數據采集技術77頁
- 數據壓縮技術42頁
- 第三章 數據資源管理技術188頁
- 數據庫訪問技術8頁
- 傳感器數據融合技術研究現狀分析30頁
- 第2章 數據通信技術138頁
- 電商數據分析.ppt25頁
- 電商網站數據分析名詞定義與解析11頁
- 電商銷售數據分析33頁
- 電商數據之戰背后利益糾葛:觸動最敏感神經5頁
- 電商數據挖掘 第1章33頁
- 淘寶電商數據創新的案例2頁
- 信息碎片化時代紙媒的競爭優勢5頁
- 碎片化時代8頁
- 碎片化時代的營銷思考9頁
- 碎片化時代的營銷4頁
- 媒體碎片化時代的營銷出路3頁
- 信息碎片化時代下的司法和民意12頁
- 電子商務技術全套課件:第4章34頁
- 電子商務技術全套課件:第7章48頁
- 電子商務技術全套課件:第5章70頁
- 電子商務技術全套課件:第3章43頁
- 電子商務技術全套課件:第2章45頁
- 電子商務技術全套課件:第1章30頁