北大公開課-人工智能基礎 58 機器學習的任務之排名

機器學習中的排名任務是指給定一個查詢,根據(jù)相關性對文檔進行排序。
例如,搜索引擎中的搜索結果排序就是一個排名任務的例子。在這個例子中,查詢是用戶輸入的搜索詞,文檔是搜索引擎索引的網(wǎng)頁。排名任務的目標是將與查詢相關性最高的文檔排在前面。



將兩個節(jié)點互相按一定的規(guī)則互相比較,得到的無非三種結果,
-1 低于排名
0 排名相同
+1 高于排名
具體節(jié)點的互相排名計算,對于整體數(shù)據(jù)進行排名


機器學習中的排名算法有很多,其中一些典型的算法包括:排序向量機(SVM)1、AdaRank?2、LambdaMART?3、RankBoost 、RankNet 、ListNet 、和LambdaRank 。
基于分值函數(shù)的排序算法是指使用分值函數(shù)來對數(shù)據(jù)進行排序的算法。常用的排序算法包括:冒泡排序,選擇排序,插入排序,希爾排序,歸并排序,快速排序等等1。例如,快速排序是一種常用的基于分治思想的排序算法,它的基本思想是通過一趟排序?qū)⒋庞涗浄指畛瑟毩⒌膬刹糠?strong>2。
基于偏好函數(shù)的排序算法是指使用偏好函數(shù)來對數(shù)據(jù)進行排序的算法。常用的排序算法包括:冒泡排序,選擇排序,插入排序,希爾排序,歸并排序,快速排序等等1。例如,基于偏好函數(shù)的排序算法可以是基于用戶評分的推薦系統(tǒng)中的協(xié)同過濾算法2。

【機器算法】
機器翻譯中的一些算法可以使用排序算法來實現(xiàn)。例如,機器翻譯中的短語表可以使用基于偏好函數(shù)的排序算法來生成1。這些算法可以根據(jù)不同的偏好函數(shù)對短語進行排序,以便在翻譯過程中選擇最佳的短語。
【情感分析】
情感分析是一種自然語言處理(NLP)方法的應用,它是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理,利用一些情感得分指標來量化定性數(shù)據(jù)的方法。在自然語言處理中,情感分析屬于典型的文本分類問題,即把需要進行情感分析的文本劃分為其所屬類別。
排序算法在情感分析中的應用主要是用于特征選擇和特征提取。例如,可以使用基于信息增益的排序算法來選擇最具代表性的特征,以便在情感分析中使用。此外,還可以使用排序算法來提取情感詞匯,以便在情感分析中使用。

谷歌的網(wǎng)頁排名算法
用各個網(wǎng)頁的互相關聯(lián)性,確定這個網(wǎng)頁的重要性。
排名算法是指各大搜索引擎用來對其索引中的結果列表進行評估和排名的規(guī)則。例如,PageRank算法是一種由Google公司創(chuàng)始人之一發(fā)明的算法,用于對網(wǎng)頁進行排名。PersonalRank算法是一種在推薦場景中使用的算法,用于計算item節(jié)點影響力排名,即為用戶感興趣的item。
