1、隨著在線社交媒體的快速發(fā)展,在線社會網(wǎng)絡(luò)的研究成為了當(dāng)前數(shù)據(jù)科學(xué)的一個重要研究方向。復(fù)雜網(wǎng)絡(luò)可以看作是這些真實網(wǎng)絡(luò)的一種抽象,而發(fā)現(xiàn)這些復(fù)雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)是理解這些復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)和功能的重要途徑。但是,經(jīng)典的社區(qū)發(fā)現(xiàn)算法基本是基于單一關(guān)系的網(wǎng)絡(luò),而真實的網(wǎng)絡(luò)絕大多數(shù)都是多關(guān)系的。由于在多關(guān)系網(wǎng)絡(luò)中,每種關(guān)系所反應(yīng)的只是片面的信息,因此,要深刻理解復(fù)雜的社會網(wǎng)絡(luò)就需要全面地、綜合地去分析所有關(guān)系。這樣的多關(guān)系網(wǎng)絡(luò)可以純天然地表示成一個三階張
2、量的形式,而張量分解方法又可以從張量中學(xué)習(xí)到隱含的模式,因此,本文采用基于張量方法去分析多關(guān)系網(wǎng)絡(luò)。
本文提出了一種簡單高效的隱因子先驗法則-隱因子余弦相似度先驗去提升社區(qū)發(fā)現(xiàn)算法在多關(guān)系網(wǎng)絡(luò)中的性能。這個先驗法則是基于良好定義的虛擬多關(guān)系社會網(wǎng)絡(luò)的大量觀測統(tǒng)計:同一社區(qū)的成員所對應(yīng)的隱因子間具有很高的余弦相似度。將這一先驗知識融入到RESCAL張量分解模型中,可以使我們得到更加合理的隱因子,而這些隱因子將作為聚類算法的輸入,
3、從而發(fā)現(xiàn)不同的社區(qū)結(jié)構(gòu)。為了簡化模型及移除余弦相似度的限制,本文提出了一種RESCAL分解模型的變體N-RESCAL分解模型,并給出了求解此模型的高效迭代算法N-RESCAL-ALS。此外,由于閉環(huán)三角關(guān)系能夠提升社區(qū)發(fā)現(xiàn)算法的性能,本文提出了一種同時對普通關(guān)系與閉環(huán)三角關(guān)系進(jìn)行建模的方式。在本文中,我們所使用的聚類算法為凝聚層次聚類算法,而這樣社區(qū)發(fā)現(xiàn)算法的架構(gòu)我們稱之為TNRA。我們在構(gòu)造數(shù)據(jù)集和真實數(shù)據(jù)集下的實驗都取得了非常好的效