2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩115頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、在這個(gè)信息爆炸的的時(shí)代,以關(guān)系數(shù)據(jù)和XML形式存儲(chǔ)、交換和發(fā)布的數(shù)字?jǐn)?shù)據(jù)顯著地增加,特別是在互聯(lián)網(wǎng)上,這種呈指數(shù)的增長(zhǎng)是前所未有的。當(dāng)然,這兩種形式的數(shù)據(jù)不僅可以讓使用者能方便快捷地訪問(wèn)和交換數(shù)據(jù),并且能極大地便利數(shù)據(jù)擁有者維護(hù)和分發(fā)他們的數(shù)據(jù)。然而,與其他類型的數(shù)字內(nèi)容一樣,關(guān)系數(shù)據(jù)和XML數(shù)據(jù)也面臨著與安全相關(guān)的威脅,特別是當(dāng)數(shù)據(jù)資源是外包的。在這方面的其他挑戰(zhàn)中,兩個(gè)重要的問(wèn)題是關(guān)于版權(quán)保護(hù)和內(nèi)容認(rèn)證。數(shù)字水印技術(shù)已被作為一項(xiàng)關(guān)鍵

2、技術(shù)來(lái)保護(hù)擁有者的權(quán)利和驗(yàn)證外包數(shù)字?jǐn)?shù)據(jù)的完整性。
   多年來(lái)數(shù)字水印已成功用于防止盜版和驗(yàn)證多媒體數(shù)據(jù)內(nèi)容的完整性。隨后開(kāi)始展開(kāi)針對(duì)其他類型的數(shù)字?jǐn)?shù)據(jù)的數(shù)字水印研究,同時(shí)也證明了對(duì)于多媒體數(shù)據(jù)也是一種有效的工具,因此研究者利用這種水印技術(shù)用于解決關(guān)系和XML數(shù)據(jù)中的安全問(wèn)題。本文的研究工作解決了關(guān)于關(guān)系、XML數(shù)據(jù)的數(shù)字水印問(wèn)題以及其在數(shù)據(jù)庫(kù)安全中的應(yīng)用,特別是關(guān)于版權(quán)的保護(hù)和完整性驗(yàn)證。
   水印是一個(gè)隱藏在宿主

3、數(shù)字?jǐn)?shù)據(jù)中的消息,該消息可有效地用于數(shù)字內(nèi)容的版權(quán)保護(hù)和完整性驗(yàn)證。雖然使用數(shù)字水印用于多媒體內(nèi)容中的研究已有已有很長(zhǎng)的時(shí)間,但它在應(yīng)用于關(guān)系或XML數(shù)據(jù)時(shí)仍面臨著各種嚴(yán)峻的挑戰(zhàn)。這兩種形式的數(shù)據(jù)可用于嵌入水印的空間非常有限,更進(jìn)一步的是,在多數(shù)情況下,這些數(shù)據(jù)的可用性需求并不允許嵌入水印甚至只是改變?cè)瓉?lái)數(shù)字內(nèi)容的單比特信息。
   嵌入的水印類型是用于數(shù)字水印技術(shù)分類的標(biāo)準(zhǔn)之一。按照水印的特性,數(shù)字水印技術(shù)可以分為三類,即魯棒

4、水印、脆弱水印和半脆弱水印。在致力于移除水印的攻擊中仍具有魯棒性的水印稱之為魯棒水印。相反的,脆弱水印則是非常脆弱的,在對(duì)宿主數(shù)據(jù)進(jìn)行任何篡改的操作時(shí)都將引起嵌入的脆弱水印的改變,使水印無(wú)法成功提取。半脆弱水印則是一種特殊的脆弱水印,能承受部分合理的對(duì)宿主數(shù)據(jù)進(jìn)行的正常修改操作,但會(huì)被惡意篡改損壞水印,從而檢測(cè)到篡改操作,也就是說(shuō)如果一些授權(quán)的用戶或數(shù)據(jù)擁有者對(duì)宿主數(shù)據(jù)進(jìn)行了一些合理的修改,脆弱水印仍將保持不變。
   水印的嵌

5、入對(duì)數(shù)據(jù)的使用性造成的影響不大,且水印是以惡意用戶在不嚴(yán)重破壞數(shù)據(jù)使用的情況下不能被破壞的方式進(jìn)行嵌入的。因此,盡管水印技術(shù)不能防止非法拷貝,但它為重分發(fā)的拷貝提供了一種原始版權(quán)關(guān)系認(rèn)證的手段來(lái)防止拷貝。
   1.基于關(guān)系和XML數(shù)據(jù)的數(shù)字水印
   以關(guān)系數(shù)據(jù)為載體的數(shù)字水印技術(shù)的研究起步較晚。最早的關(guān)系數(shù)據(jù)數(shù)字水印技術(shù)出現(xiàn)在2002年,由Agrawal和Kiernan展開(kāi)的研究。如多媒體數(shù)字水印技術(shù)一樣,研究者最初

6、利用關(guān)系數(shù)據(jù)的最低有效位的修改來(lái)嵌入水印。大多數(shù)已有的工作都是基于數(shù)值數(shù)字域的,通過(guò)假設(shè)數(shù)值數(shù)據(jù)能夠容忍少量的修改來(lái)嵌入水印。當(dāng)然還存在一些其他針對(duì)分類數(shù)據(jù)的水印方案。由于有限的甚至是零可用于嵌入水印信息的帶寬,關(guān)系和XML數(shù)據(jù)的自然特性造成數(shù)字水印技術(shù)的使用受到了一定的限制。
   動(dòng)機(jī):本文的研究集中在關(guān)系和XML數(shù)據(jù)擁有者面臨的兩個(gè)基本問(wèn)題,即版權(quán)認(rèn)證和內(nèi)容完整性的驗(yàn)證或篡改檢測(cè)。這兩個(gè)問(wèn)題的性質(zhì)不同,需要分開(kāi)探索使用相同

7、的技術(shù)即水印技術(shù)來(lái)設(shè)計(jì)對(duì)應(yīng)的解決方案,因此,本文提出了不同的方案來(lái)解決這些問(wèn)題。
   除了這兩個(gè)基本問(wèn)題,本文涉及了兩種相似但不同類型的宿主數(shù)據(jù)即:關(guān)系數(shù)據(jù)庫(kù)和XML文檔。單一的方法可能不是一種最佳的選擇,如果我們能夠獲得這兩類數(shù)據(jù)的結(jié)構(gòu)、格式以及整體特性。通過(guò)大量相關(guān)的文獻(xiàn)閱讀可知,目前關(guān)系和XML數(shù)據(jù)水印技術(shù)的研究還停留在早期階段,仍存在一些問(wèn)題有待解決,下面列出了其中一些主要的問(wèn)題。
   無(wú)失真嵌入:當(dāng)一些數(shù)據(jù)

8、作為水印添加后將改變了載體數(shù)據(jù)的實(shí)際意義。數(shù)據(jù)庫(kù)中數(shù)據(jù)的語(yǔ)義值是非常重要的。幾乎所有的現(xiàn)有方法都將在實(shí)際內(nèi)容中引入一些錯(cuò)誤(少數(shù)除外)從而可能會(huì)影響數(shù)據(jù)的可用性。我們分析了各類水印方法中水印嵌入對(duì)數(shù)據(jù)可用性的影響,并提出了替代的解決方案。
   基于非數(shù)值數(shù)據(jù)的水印嵌入:大部分關(guān)系和XML數(shù)據(jù)水印方案使用數(shù)值數(shù)據(jù)來(lái)嵌入水印,在水印的嵌入過(guò)程中將引入一些失真,從而破壞數(shù)據(jù)的語(yǔ)義值。當(dāng)沒(méi)有數(shù)值數(shù)據(jù)或者數(shù)值數(shù)據(jù)不能提供足夠空間用于水印

9、嵌入時(shí),我們同樣發(fā)現(xiàn)了一個(gè)非數(shù)值編碼域來(lái)設(shè)計(jì)水印嵌入。
   查詢保存:如果水印的嵌入將改變關(guān)系數(shù)據(jù)的內(nèi)容,它也將影響常見(jiàn)的檢索查詢的結(jié)果。通過(guò)這項(xiàng)研究工作所取得的目標(biāo)之一是提出查詢保存的水印方案。
   魯棒的攻擊分析:對(duì)關(guān)系數(shù)據(jù)庫(kù)的攻擊的性質(zhì)是不同于那些針對(duì)多媒體水印的攻擊的特性。現(xiàn)有的水印方案對(duì)于一種或其它類型攻擊是魯棒的。我們還分析了常見(jiàn)的數(shù)據(jù)庫(kù)攻擊,并研究這些攻擊對(duì)水印的有效性和數(shù)據(jù)庫(kù)可用性的影響。
  

10、 靈活的篡改檢測(cè):針對(duì)關(guān)系數(shù)據(jù)和XML文檔的大部分安全工作主要集中在版權(quán)的保護(hù)。目前還很難找到關(guān)于關(guān)系和XML數(shù)據(jù)的認(rèn)證和完整性驗(yàn)證的論文,因此,我們嘗試探索一些可選用的脆弱水印方案用于關(guān)系和XML數(shù)據(jù)認(rèn)證。
   在本文,我們通過(guò)全面的深入研究現(xiàn)有工作以及他們的缺點(diǎn),分析上述這些問(wèn)題。作為本文研究的結(jié)果,針對(duì)關(guān)系和XML數(shù)據(jù)的認(rèn)證和版權(quán)保護(hù)的相關(guān)問(wèn)題,我們提出了新的解決方案。我們特別以那些之前沒(méi)有得到充分解決的問(wèn)題為目標(biāo)來(lái)展

11、開(kāi)本文的研究。
   本文的各種方案均利用數(shù)字水印技術(shù)來(lái)解決這些問(wèn)題。本文的研究成果表明無(wú)失真和查詢保存的水印方法可分別用于關(guān)系數(shù)據(jù)和XML數(shù)據(jù)的版權(quán)保護(hù)和完整性驗(yàn)證。下面我們將簡(jiǎn)要地討論本文研究的主要貢獻(xiàn)。
   本文的主要貢獻(xiàn):
   2.查詢保存的數(shù)字水印用于關(guān)系數(shù)據(jù)的版權(quán)保護(hù)
   大量用于設(shè)計(jì)多媒體水印的技術(shù)被證明是有效的,但不能直接應(yīng)用到數(shù)據(jù)庫(kù)中設(shè)計(jì)水印算法。對(duì)于多媒體,由于擁有大量的冗余比特

12、位,從而存在很多可用于嵌入額外信息的空間。只要修改操作是隱蔽的,這些比特位可以被任意修改來(lái)嵌入信息。而對(duì)于多媒體,最重要的要求是需要避免視覺(jué)失真而對(duì)于關(guān)系數(shù)據(jù)最基本的要求是需要保存數(shù)據(jù)的語(yǔ)義值。有時(shí)甚至是一個(gè)單比特位的變化也將改變數(shù)據(jù)的意義從而影響查詢結(jié)果。如,改變姓名,地址,年齡,戶口號(hào)碼等數(shù)據(jù)的一個(gè)單比特也將改變數(shù)據(jù)的具體值從而改變查詢結(jié)果。
   在關(guān)系數(shù)據(jù)中嵌入水印與多媒體中水印的嵌入具有很大不同。在關(guān)系數(shù)據(jù)庫(kù)中,為通過(guò)

13、保持查詢結(jié)果不變來(lái)維護(hù)數(shù)據(jù)的可用性,數(shù)據(jù)的語(yǔ)義值比視覺(jué)的隱蔽性更重要。存在以下的基本差異阻礙了多媒體數(shù)字水印方案直接應(yīng)用于關(guān)系數(shù)據(jù)或XML文檔中。
   1)多媒體數(shù)據(jù)具有相當(dāng)大的冗余空間,而數(shù)據(jù)庫(kù)具有很少甚至沒(méi)有冗余。
   2)對(duì)于多媒體數(shù)據(jù),視覺(jué)隱蔽性是非常重要的,而數(shù)據(jù)庫(kù)中數(shù)據(jù)的語(yǔ)義值最重要。
   3)各類數(shù)據(jù)片段在相對(duì)空間/時(shí)間的定位是固定的,而在一個(gè)關(guān)系的元組中沒(méi)有暗含的順序。刪除或替換一個(gè)多媒體對(duì)

14、象的部分?jǐn)?shù)據(jù)將引起對(duì)象的感知變化。然而,一個(gè)關(guān)系的盜版可以簡(jiǎn)單地刪除或利用其他關(guān)系元組來(lái)替代一些元組。
   另一個(gè)仍然需要注意的重要挑戰(zhàn)是,要是沒(méi)有數(shù)值數(shù)據(jù)或不存在不足夠空間用于水印嵌入該如何辦。此外,上述討論的包括針對(duì)分類數(shù)據(jù)的方案通過(guò)關(guān)系關(guān)系數(shù)據(jù)庫(kù)中屬性值意義的改變,且這些屬性值往往是不可取時(shí)來(lái)嵌入水印時(shí)將引起關(guān)系數(shù)據(jù)庫(kù)內(nèi)容的失真。
   所有這些因素導(dǎo)致水印方案不僅需要保留數(shù)據(jù)的語(yǔ)義值,而且還需保持水印嵌入前后查

15、詢結(jié)果的一致性。在本文中,我們提出了一種基于非數(shù)值數(shù)據(jù)的水印方案,在嵌入過(guò)程中通過(guò)引入對(duì)數(shù)據(jù)語(yǔ)義值幾乎是零失真的操作保持查詢結(jié)果。
   為了保持水印嵌入后關(guān)系數(shù)據(jù)的查詢結(jié)果,在水印嵌入過(guò)程中有必要保持完好無(wú)損的數(shù)據(jù)的語(yǔ)義值。目前大部分的相關(guān)工作集中使用數(shù)值數(shù)據(jù)為載體。但有一些基于非數(shù)值數(shù)據(jù)的水印方案,但存在一定的局限性。
   我們提出了一種魯棒的查詢保持的關(guān)系數(shù)據(jù)水印方案,該方案不依賴于關(guān)系中數(shù)值屬性的存在。通過(guò)在非

16、數(shù)值數(shù)據(jù)或更精確的字母數(shù)字?jǐn)?shù)據(jù)屬性中嵌入水印,我們引入一種新的嵌入信道。由于在數(shù)據(jù)庫(kù)中,查詢是不區(qū)分大小寫的,所以將數(shù)據(jù)從小寫改為大寫不會(huì)影響數(shù)據(jù)的語(yǔ)義,反之亦然。利用這類數(shù)據(jù)屬性的內(nèi)在特性,我們提出了一種水印方案,不僅在嵌入水印后保持了數(shù)據(jù)的語(yǔ)義并且具有無(wú)失真、查詢保持的特性。對(duì)于存在非數(shù)值屬性或?qū)λ∏度胍鸬母淖儫o(wú)法適應(yīng)的數(shù)據(jù)庫(kù),我們的方案提供更好的關(guān)系數(shù)據(jù)庫(kù)水印。此外,在水印提取時(shí)無(wú)需原始數(shù)據(jù),因此該方案是一個(gè)完全的盲水印方法。

17、
   水印嵌入:給定具有主鍵P的關(guān)系R(P,A1,A2……Av-1),第一步是使用主鍵哈希值分別確定被標(biāo)記的元組和屬性。兩者的選擇取決于對(duì)數(shù)據(jù)擁有者已知的密鑰K,只有擁有者能夠識(shí)別出標(biāo)記的元組和屬性。攻擊者只能通過(guò)猜測(cè)可能的元組以及遠(yuǎn)足中的屬性來(lái)破壞水印。然后通過(guò)檢查所選數(shù)據(jù)文本的大小寫狀態(tài)提取已有比特序列Eb。提取比特位0或1遵循的規(guī)則見(jiàn)本文的第3章。然后,生成長(zhǎng)度為L(zhǎng)的候選水印序列Cj,Cj中的每個(gè)比特位對(duì)應(yīng)于已有比特模式

18、Eb。用來(lái)產(chǎn)生這些候選水印信息的密鑰可通過(guò)以密鑰K和水印索引j為種子G來(lái)獲得。最后,選定與Eb的漢明距離最小的最小的比特序列來(lái)嵌入水印W,并記錄此時(shí)的密鑰為Kw用于隨后的水印提取。為嵌入水印比特,選定屬性值的大小寫狀態(tài)是根據(jù)表3.3中所列的條件來(lái)進(jìn)行調(diào)整的。大小寫狀態(tài)的改變時(shí)遵循大多數(shù)常見(jiàn)的操作如:如果水印比特為1,則狀態(tài)調(diào)整為標(biāo)題狀態(tài),當(dāng)嵌入0時(shí),調(diào)整為句子狀態(tài)。有時(shí)候數(shù)據(jù)庫(kù)包含空值的情況,此時(shí)將不能應(yīng)用大小寫狀態(tài)的改變。此外,當(dāng)出現(xiàn)

19、縮寫等類型文本時(shí),只有一種標(biāo)準(zhǔn)而不會(huì)有改變將存在。
   水印提?。涸O(shè)Alice為數(shù)據(jù)庫(kù)的擁有者,Mallory擁有Alice數(shù)據(jù)的一份復(fù)制盜版。由于主鍵的丟失將造成重要數(shù)據(jù)的遺失,因此假設(shè)主鍵是完整。對(duì)于水印的提取,首先選擇可能被用于嵌入水印的元組,然后識(shí)別出標(biāo)記的屬性,這兩種選擇均使用與嵌入過(guò)程相同的密鑰K,最后利用預(yù)定義的條件提取水印比特信息。
   當(dāng)屬性值由單個(gè)單詞組成時(shí),如果其為標(biāo)題狀態(tài),則提取水印比特值1,

20、否則提取0。對(duì)于有多個(gè)單詞的屬性,如果整個(gè)文本具有標(biāo)題狀態(tài)則水印比特值為1,如果為句子狀態(tài)則為0。對(duì)于水印的驗(yàn)證,采用相同的密鑰生成原始水印與提取的水印相比來(lái)判斷。對(duì)于正確的驗(yàn)證,我們保持等于70%的最低比特匹配要求。
   3.關(guān)系數(shù)據(jù)的完整性驗(yàn)證
   近年來(lái)利用互聯(lián)網(wǎng)服務(wù)器提供的在線數(shù)據(jù)顯著增加。由于高的硬件和管理成本,數(shù)據(jù)的擁有者寧愿外包他們的數(shù)據(jù),這種數(shù)據(jù)存儲(chǔ)和管理需要第三方服務(wù)器。這些服務(wù)器的使用相對(duì)地使多種

21、多樣擁有者數(shù)據(jù)的成本非常低。這種方法解決了成本問(wèn)題,但也引起了數(shù)據(jù)庫(kù)完整性的問(wèn)題。這些第三方服務(wù)器可能會(huì)損害客戶端的數(shù)據(jù),是不可信任的。因此,需要建立一種機(jī)制來(lái)驗(yàn)證托管在不可信服務(wù)器上數(shù)據(jù)的完整性。
   目前,已有少量脆弱水印方案用于關(guān)系數(shù)據(jù)的篡改檢測(cè)和完整性驗(yàn)證。據(jù)我們所知,Gou等人的工作是這個(gè)領(lǐng)域最優(yōu)的,因此本文重點(diǎn)關(guān)注他們的工作并進(jìn)行對(duì)比。
   經(jīng)過(guò)徹底全面的研究,我們發(fā)現(xiàn)已有脆弱水印方案中存在一定的問(wèn)題。所

22、有這些方案中最重要的缺陷是他們的完全脆弱性,即甚至一個(gè)單比特信息的修改都將被檢測(cè)為篡改。如果有人想更新自己的已嵌入水印的關(guān)系數(shù)據(jù),也將被視為篡改。每次數(shù)據(jù)更新后都需要重新嵌入水印。在實(shí)際應(yīng)用中,關(guān)系數(shù)據(jù)不僅需要定期更新且需要驗(yàn)證完整性。此外Guo的方法還有另外的兩個(gè)缺陷:
   首先,該方法只適用于數(shù)值數(shù)據(jù)。盡管Guo等人提出了一個(gè)替代的在分類數(shù)據(jù)中嵌入水印的方法,這個(gè)方法利用元組順序的調(diào)整來(lái)嵌入水印,但也容易遭遇排序攻擊而破壞

23、水印。
   其次,使用了兩個(gè)最低有效位來(lái)嵌入水印將向適應(yīng)力不強(qiáng)的數(shù)據(jù)中引入較大的失真。數(shù)據(jù)庫(kù)中數(shù)據(jù)的語(yǔ)義值比多媒體數(shù)據(jù)的語(yǔ)義值更重要,有時(shí)單比特值的變化可能會(huì)導(dǎo)致數(shù)據(jù)的不可用。例如姓名、電話、帳戶號(hào)碼、年齡、價(jià)格等數(shù)據(jù)。
   考慮到所有上述這些問(wèn)題,我們提出了一種半脆弱水印方案,該方案具有如下的貢獻(xiàn):
   1)該方案使數(shù)據(jù)擁有者能通過(guò)檢測(cè)數(shù)據(jù)庫(kù)遭受的惡意修改來(lái)驗(yàn)證數(shù)據(jù)庫(kù)的完整性,且允許擁有者一些必要的數(shù)據(jù)更

24、新操作。
   2)利用選定文本的大小寫狀態(tài)來(lái)嵌入水印,不會(huì)改變數(shù)據(jù)的意義,因此可以說(shuō)我們的水印方案是無(wú)失真且查詢結(jié)果保持的。
   3)該方案可擴(kuò)展應(yīng)用到非數(shù)值數(shù)據(jù),特別是字母數(shù)字?jǐn)?shù)據(jù)中。
   當(dāng)前,大多數(shù)互聯(lián)網(wǎng)上的數(shù)據(jù)均托管在不可完全信任的第三方外包服務(wù)器上。這些服務(wù)器上的數(shù)據(jù)很容易被篡改,因此需要建立某些機(jī)制來(lái)驗(yàn)證數(shù)據(jù)庫(kù)的完整性。此外,在認(rèn)證過(guò)程中應(yīng)能區(qū)分正常的數(shù)據(jù)更新和惡意修改操作。在我們的關(guān)系數(shù)據(jù)完整

25、性驗(yàn)證中,我們提出了一種新穎的針對(duì)關(guān)系數(shù)據(jù)庫(kù)的半脆弱水印方法,該方法不僅可以檢測(cè)篡改且允許授權(quán)用戶修改自己的數(shù)據(jù),從而使需要頻繁更新數(shù)據(jù)時(shí)不需要同步重嵌入水印。我們的完整性驗(yàn)證方案的核心思想是構(gòu)造一個(gè)半脆弱水印,在這種方式下允許數(shù)據(jù)庫(kù)進(jìn)行一些常規(guī)的更新操作,而同時(shí)可以檢測(cè)到惡意的篡改操作。水印是使用任何特定組中所有元組的元組哈希值計(jì)算得到的。而這個(gè)元組哈希值則通過(guò)使用哈希后的消息認(rèn)證碼(HMAC)來(lái)計(jì)算獲得。HMAC是基于單向哈希函數(shù)的

26、,其輸入為密鑰K以及選定元組的所有屬性值。HMAC最重要的一個(gè)特性是輸入的任何微小變化都將使輸出隨機(jī)化。我們通過(guò)定義屬性選擇以及用于元組哈希計(jì)算的特定標(biāo)準(zhǔn)來(lái)得到一個(gè)半脆弱水印。
   為了達(dá)到這個(gè)目的,我們首先定義三類屬性,即敏感屬性(S)、非敏感屬性(NS)和半敏感屬性(SS)。敏感屬性指一旦錄入將不需要更新的屬性。在完整性驗(yàn)證過(guò)程中對(duì)這些屬性的任何修改都必須能夠檢測(cè)到,比如姓名、出生日期,SSN等個(gè)人資料,以及產(chǎn)品ID,生產(chǎn)

27、日期等一些產(chǎn)品信息。非敏感屬性指可能需要頻繁更新的屬性,如庫(kù)存清單系統(tǒng),現(xiàn)貨條目等。半敏感屬性指允許進(jìn)行受限更新的屬性。這些半敏感屬性的值可以在一定范圍內(nèi)進(jìn)行修改,如個(gè)人地址更改時(shí)通常不改變國(guó)籍而允許修改具體的地址。
   設(shè)關(guān)系R{Pk,A1,A2…An)的主鍵為Pk,以及其他屬性為Ai(i=1…n),定義R的三類屬性子集S(包含Pk),NS和SS滿足:
   S∩ NS∩ SS=φ
   S∪NS∪SS=R<

28、br>   下一步為半敏感屬性定義一些約束條件。對(duì)屬性分類并定義好約束條件后,使用元組哈希的計(jì)算可獲得一個(gè)半脆弱水印。元組哈希計(jì)算采用的是基于HMAC的SHA算法,并以密鑰K、敏感屬性集合S,和廣義的半敏感屬性集SS(利用約束條件得到的)為種子。在元組哈希的計(jì)算中不包括非敏感屬性。因此,元組哈希采用如下公式計(jì)算:
   TH=HMAC(K∣∣S∣∣SS(Generalized)
   水印嵌入:水印嵌入主要分為三個(gè)步驟

29、,即預(yù)處理,水印生成和水印嵌入。在預(yù)處理中,首先定義屬性的子集,然后將所有元組分成g組,采用與一些早期方案相同的分組算法使每個(gè)分組中包含幾乎等數(shù)量的元組。在水印生成步驟中,為每個(gè)分組分別生成一個(gè)水印。為了保持?jǐn)?shù)據(jù)的同步性,各分組內(nèi)的元組都將進(jìn)行安全的排序,然后采用HMAC計(jì)算元組的哈希值。通過(guò)這些元組哈希值計(jì)算分組的哈希值從而獲得候選的水印。水印的大小/長(zhǎng)度取決于選定用于水印嵌入的屬性數(shù)量。值得注意的事情是SHA1算法返回了160比特的

30、HMAC輸出值。如果所需的水印比特?cái)?shù)小于160比特,那么算法將提取所需數(shù)量的MSB(最重要的有效位),否則從HMAC(從MSB開(kāi)始)提取比特位循環(huán)追加到水印生成序列中,直到水印長(zhǎng)度達(dá)到需要的長(zhǎng)度。在水印嵌入步驟中,利用選定屬性的大小寫狀態(tài)來(lái)嵌入水印。此嵌入方式不會(huì)改變數(shù)據(jù)庫(kù)的內(nèi)容從而使嵌入過(guò)程無(wú)失真。
   在計(jì)算元組哈希值之前,文本狀態(tài)會(huì)統(tǒng)一轉(zhuǎn)換成全部大寫或者小寫狀態(tài)。在水印提取過(guò)程中,以同樣的方式歸一化文本狀態(tài)來(lái)計(jì)算元組哈希

31、值。從而保證不是任何的大小寫狀態(tài)的改變都將被檢測(cè)為篡改操作。水印嵌入是無(wú)失真的從而可以幫助維持?jǐn)?shù)據(jù)的語(yǔ)義含義。此外,基于分組的嵌入確保了篡改的定位。
   數(shù)據(jù)庫(kù)篡改檢測(cè):含水印的數(shù)據(jù)可能會(huì)受到修改數(shù)據(jù)庫(kù)內(nèi)容的有意攻擊。為了驗(yàn)證含水印數(shù)據(jù)庫(kù)的完整性,首先需要對(duì)其進(jìn)行認(rèn)證。為此,我們必須知道密鑰K和分組數(shù)g。對(duì)于篡改檢測(cè),每個(gè)分組都將單獨(dú)進(jìn)行認(rèn)證。使用參數(shù)K,g,構(gòu)建用來(lái)嵌入的水印W,然后提取數(shù)據(jù)庫(kù)中實(shí)際的水印W',最后比較構(gòu)造的

32、水印W(原始嵌入的水印)和提取的水印W'。如果這兩個(gè)水印都能互相匹配,能說(shuō)明數(shù)據(jù)未被篡改。
   4.XML文檔完整性和私隱性問(wèn)題的解決方案
   XML是一種信息/數(shù)據(jù)交換的工業(yè)標(biāo)準(zhǔn)。XML是一種允許用戶生成和格式化自己文檔標(biāo)記的源語(yǔ)言,提供了一種能夠把結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在文本文件中的方法。這類文件易于閱讀,清晰可擴(kuò)展,且與閱讀平臺(tái)無(wú)關(guān)。到目前為止,它已經(jīng)被廣泛的用于在因特網(wǎng)上進(jìn)行數(shù)據(jù)交換。與其他通過(guò)因特網(wǎng)進(jìn)行的數(shù)據(jù)交換一

33、樣,通過(guò)XML文檔進(jìn)行數(shù)據(jù)交換容易受到版權(quán)侵犯和內(nèi)容篡改等。作為一種常用的數(shù)據(jù)交換方式,XML文件需要一些技術(shù),使數(shù)據(jù)擁有者能夠?qū)挂恍﹪L試篡改數(shù)據(jù)或者侵犯版權(quán)的惡意攻擊。
   XML文檔的問(wèn)題1:我們都知道魯棒水印是指能抵抗各類攻擊且不能輕易被惡意使用者摧毀的一類水印。這類水印常用于身份認(rèn)證和版權(quán)保護(hù)。
   在XML數(shù)據(jù)的身份認(rèn)證方面,魯棒水印方法是很少的,且大多數(shù)都是從關(guān)系數(shù)據(jù)或純文本文檔中延伸出來(lái)的水印方案。由

34、于XML數(shù)據(jù)的性質(zhì)和格式跟純文本文件或關(guān)系數(shù)據(jù)存在很大的不同,因此這些水印方案直接應(yīng)用于XML數(shù)據(jù)中時(shí)不是十分有效的。此外,這些方案還受到一些限制,我們將會(huì)在第二章進(jìn)行討論。因此,設(shè)計(jì)一種好的用于XML文檔的魯棒水印方法是非常有必要的。
   XML,文檔的問(wèn)題2:在互聯(lián)網(wǎng)上多數(shù)使用XML文檔形式進(jìn)行數(shù)據(jù)交換,由于沒(méi)有足夠的安全保障,這些信息交互是不可信的。類似地,由于這些數(shù)據(jù)能對(duì)多用戶數(shù)據(jù)進(jìn)行有效的成本控制,因此使用第三方服務(wù)

35、器來(lái)托管數(shù)據(jù)以提供公共訪問(wèn)服務(wù)的方式在過(guò)去幾年中增長(zhǎng)很快。但是,這些服務(wù)器可能會(huì)受到一些對(duì)XML數(shù)據(jù)惡意操作的危害破壞XML數(shù)據(jù)的完整性。不幸的是,盡管檢測(cè)XML文檔的篡改操作是很重要的,但是這些問(wèn)題卻一直未完善解決。W3C給出了一種基于簽名的方法來(lái)解決XML,完整性認(rèn)證的問(wèn)題,但是這種方法卻不是一種有效的方法。這種簽名添加在原始XML文檔中,不僅增加了文檔的大小,而且不能抵抗任何去除攻擊。在這種情況下,脆弱水印能有效地保證XML數(shù)據(jù)的

36、完整性認(rèn)證。當(dāng)前有不少這類水印方法,但是性能都不夠好。此外,一個(gè)常見(jiàn)的問(wèn)題是這些在XML數(shù)據(jù)中嵌入脆弱水印的方法將使XML數(shù)據(jù)產(chǎn)生非常多的錯(cuò)誤。XML文檔中的數(shù)據(jù)通常不具有足夠的健壯性來(lái)適應(yīng)水印的嵌入而不會(huì)影響數(shù)據(jù)的可用性。特別地,這些方法只適用于數(shù)值型數(shù)據(jù),這將限制它們的使用領(lǐng)域。
   已有的所有方案要么是針對(duì)XML文檔版權(quán)保護(hù)(使用魯棒水印),要么是針對(duì)完整性驗(yàn)證(使用脆弱水印)。就我們所知,還沒(méi)有一種單獨(dú)的方案能同時(shí)解決

37、XML文檔版權(quán)保護(hù)和完整性驗(yàn)證這兩個(gè)問(wèn)題。因此,在我們的研究中,提出了一種聯(lián)合水印方法,能夠同時(shí)解決上述兩個(gè)問(wèn)題。此外,水印嵌入是無(wú)失真的,能保證數(shù)據(jù)的可用性。
   魯棒水印嵌入:魯棒水印是以密鑰K為種子采用基于HMAC的SHA算法生成的。隨后將十六進(jìn)制的水印串轉(zhuǎn)換成二進(jìn)制字符串,根據(jù)該水印串選擇水印嵌入位置。對(duì)于每個(gè)元素計(jì)算一個(gè)唯一的哈希值,因此根據(jù)哈希值對(duì)所有的元素進(jìn)行排序。用參數(shù)γ來(lái)限定標(biāo)記元素所占比例。對(duì)于多于N個(gè)元素

38、時(shí),將選擇N/γ個(gè)元素用于標(biāo)記。用γ和元素哈希值,選擇用于嵌入水印的元素,然后改變選定元素的文本的大小寫狀態(tài)來(lái)嵌入水印。設(shè)計(jì)的文本大小寫狀態(tài)的改變規(guī)則與常規(guī)的實(shí)際操作類似。
   脆弱水印嵌入:脆弱水印能夠檢測(cè)到篡改并定位篡改位置,因此水印被嵌入到分組的元素中。通過(guò)元素哈希值,所有的元素被安全地分成g組。分組后,每組中元素按照哈希值進(jìn)行排序,為每個(gè)分組分別計(jì)算出一個(gè)脆弱水印。為此,首先,根據(jù)組內(nèi)所有元素的哈希值計(jì)算該分組的組哈希

39、值,然后從該組哈希中提取出水印比特串。由于SHA的特性,組哈希值為我們提供了一個(gè)脆弱水印。對(duì)XML文檔任意部件的小小改動(dòng)都將導(dǎo)致元素哈希值的修改,從而導(dǎo)致組哈希值以及水印的改變。
   XML文檔的身份認(rèn)證:為了阻止盜版,對(duì)含水印的XML文檔進(jìn)行身份認(rèn)證,我們提取出事先嵌入的魯棒水印,并與計(jì)算得出的原始水印進(jìn)行對(duì)比。原始水印的計(jì)算過(guò)程其初始步驟與水印嵌入步驟類似,并采用相同的密鑰和參數(shù)計(jì)算出所有元素的哈希值,然后定位標(biāo)記的元素,

40、計(jì)算出計(jì)劃被嵌入的原始水印。通過(guò)密鑰K和擁有者的信息計(jì)算出待認(rèn)證文檔中實(shí)際存在的水印,然后將原始水印與提取的實(shí)際水印進(jìn)行比較。只有當(dāng)比特串的匹配數(shù)量超過(guò)70%才認(rèn)為是成功的身份認(rèn)證。
   XML文檔的篡改檢測(cè):利用我們的算法生成的含水印文檔,通過(guò)脆弱水印認(rèn)證過(guò)程可以檢測(cè)到篡改并進(jìn)行定位。對(duì)于一個(gè)待檢測(cè)的文檔,首先提取嵌入的水印W'F,然后將W'F與原始水印WF進(jìn)行對(duì)比。由于對(duì)文檔的任何篡改都將會(huì)使引起W'F隨機(jī)化,因此比較提取

41、的實(shí)際水印和原始水印之間的差異就能判斷該文檔是否被篡改過(guò)。由于每個(gè)分組是單獨(dú)驗(yàn)證的,所以我們能在分組級(jí)別上定位出篡改的位置。跟嵌入過(guò)程類似,這里首先需要采用同一個(gè)密鑰K計(jì)算出元素的哈希值,然后將這些元素按其哈希值大小分成不同的組。為了保持提取的實(shí)際水印和原始嵌入水印的同步性,分組中元素根據(jù)其哈希值進(jìn)行排序的。然后以相同的方式為每個(gè)分組計(jì)算一個(gè)組哈希值。組哈希值被用于計(jì)算原始水印WF。
   XML文檔的聯(lián)合水印的特點(diǎn)
  

42、 雙重用途水?。罕疚奶岢龅慕鉀Q方法不僅能為XML文檔的擁有者提供版權(quán)認(rèn)證,同時(shí)能檢測(cè)篡改。魯棒水印提供版權(quán)/所有者的認(rèn)證的能力,而脆弱水印提供了完整性驗(yàn)證的能力。通過(guò)在魯棒水印后面嵌入脆弱水印,進(jìn)一步保障了擁有者身份認(rèn)證的水印的魯棒性要求。
   提高的魯棒水印保護(hù)能力:由于魯棒水印在脆弱水印之前嵌入,因此脆弱水印也提供了一種驗(yàn)證魯棒水印的身份驗(yàn)證功能。如果一些惡意攻擊者嘗試摧毀或改變魯棒水印,那么就會(huì)被脆弱水印驗(yàn)證/檢測(cè)算法

43、檢測(cè)并定位出來(lái)。其他一些嘗試以此插入假冒水印的手段也會(huì)被檢測(cè)出來(lái)。
   盲水印檢測(cè):脆弱和魯棒水印的提取均不需要原始XML文檔,因此我們的方法是盲水印方法。在驗(yàn)證過(guò)程中也只需要少量伴隨水印文檔傳輸?shù)拿孛軈?shù)。
   無(wú)失真的嵌入:水印的嵌入其最重要的要求嵌入操作是隱蔽的且不會(huì)使真實(shí)數(shù)據(jù)產(chǎn)生大的失真。除了隱蔽性,另一個(gè)重要的要求就是原始數(shù)據(jù)的可用性,在水印嵌入后原始數(shù)據(jù)必須仍然是可用的。我們的水印嵌入算法是無(wú)失真的,它能

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論