版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、孤立點(diǎn)數(shù)據(jù)挖掘技術(shù)在審計(jì)信息化中的應(yīng)用研究孤立點(diǎn)數(shù)據(jù)挖掘技術(shù)在審計(jì)信息化中的應(yīng)用研究ApplicationofauditingInfmationizationwiththeOutlierDataMingTechnology周喜曾麗(湖南商學(xué)院,會(huì)計(jì)學(xué)院,湖南長(zhǎng)沙410205)摘要:孤立點(diǎn)分析技術(shù)是數(shù)據(jù)挖掘的重要內(nèi)容之一,可廣泛應(yīng)用到電信、信用卡欺騙檢測(cè)、貸款審批、客戶分類、氣象預(yù)報(bào)和網(wǎng)絡(luò)入侵檢測(cè)等領(lǐng)域。在審計(jì)工作中,也可采用孤立點(diǎn)檢測(cè)算
2、法對(duì)審計(jì)數(shù)據(jù)進(jìn)行判斷和檢測(cè)是否存在異常,幫助審計(jì)人員及時(shí)發(fā)現(xiàn)隱藏的審計(jì)線索,提高審計(jì)效率,孤立點(diǎn)數(shù)據(jù)挖掘技術(shù)比發(fā)現(xiàn)規(guī)律性的其他挖掘技術(shù)具有更好的現(xiàn)實(shí)應(yīng)用價(jià)值。關(guān)鍵詞:審計(jì)信息化;孤立點(diǎn)分析;數(shù)據(jù)挖掘一、引言:一、引言:隨著信息技術(shù)的不斷發(fā)展及企業(yè)數(shù)據(jù)庫(kù)管理信息系統(tǒng)的數(shù)據(jù)海量增加,傳統(tǒng)以查賬為主審計(jì)方法將遇到計(jì)算機(jī)技術(shù)的挑戰(zhàn),讓審計(jì)人員不得不重新調(diào)整作業(yè)方法,選擇計(jì)算機(jī)審計(jì)方式檢查被審計(jì)單位的經(jīng)濟(jì)活動(dòng),發(fā)揮現(xiàn)代審計(jì)監(jiān)督的作用[1]。目前,
3、雖然有許多通用軟件公司開發(fā)了相關(guān)的審計(jì)人員,也加快了我國(guó)審計(jì)信息化的步伐,但也由于這些軟件的功能較局限,讓企業(yè)審計(jì)信息化的內(nèi)容基本是傳統(tǒng)審計(jì)方法及流程計(jì)算機(jī)化而已。如審計(jì)人員依據(jù)統(tǒng)計(jì)方法、法律規(guī)則以及審計(jì)經(jīng)驗(yàn)建立查詢分析模型,然后對(duì)被審計(jì)單位的業(yè)務(wù)上可能違規(guī)的現(xiàn)象做一個(gè)假設(shè),再通過(guò)電子數(shù)據(jù)來(lái)檢驗(yàn)假設(shè),這都要求審計(jì)人員有非常豐富的工作經(jīng)驗(yàn),而違規(guī)假設(shè)方法也大大增加了審計(jì)人員的工作量。這種方法先進(jìn)的信息技術(shù)含量較少,也嚴(yán)重影響了我國(guó)審計(jì)信息
4、化的發(fā)展深度,如何充分利用先進(jìn)信息化技術(shù),如孤立點(diǎn)分析技術(shù)去發(fā)現(xiàn)海量數(shù)據(jù)中隱藏或未知的信息,讓“智能”的數(shù)據(jù)處理方法幫助審計(jì)人員迅速發(fā)現(xiàn)異常交易或事項(xiàng),快速確定審計(jì)事項(xiàng)及重點(diǎn),提高審計(jì)效率,降低審計(jì)成本及風(fēng)險(xiǎn),是未來(lái)審計(jì)信息化研究的重點(diǎn)和難點(diǎn)[2]。目前,國(guó)內(nèi)研究審計(jì)軟件、審計(jì)信息化和數(shù)據(jù)挖掘在審計(jì)中的應(yīng)用的學(xué)者并不多,其中,著名的學(xué)者有南京審計(jì)學(xué)院陳偉副教授對(duì)審計(jì)軟件現(xiàn)狀及發(fā)展趨勢(shì)、基于數(shù)據(jù)匹配技術(shù)的審計(jì)證據(jù)獲取方法和信息系統(tǒng)審計(jì)新的
5、安全服務(wù)模式都進(jìn)行了較深的研究;呂新民教授對(duì)信息化環(huán)境下審計(jì)項(xiàng)目管理及數(shù)據(jù)挖掘在審計(jì)數(shù)據(jù)分析中的應(yīng)用方面都出了研究水平較高的學(xué)術(shù)論文;陳丹萍教授和杭州電子科技大學(xué)辛金國(guó)等人對(duì)基于數(shù)據(jù)挖掘技術(shù)的聯(lián)網(wǎng)審計(jì)進(jìn)行了較深入的研究;華南理工大學(xué)的張炳才等人對(duì)基于歐式距離孤立點(diǎn)挖掘方法在審計(jì)中的應(yīng)用進(jìn)行了相關(guān)的研究等。二、數(shù)據(jù)挖掘技術(shù)二、數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘是從大量的、不完全的、隨機(jī)的、模糊的和在噪聲的實(shí)際應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)趨勢(shì)、規(guī)則和模式的過(guò)程,他融合
6、了現(xiàn)代統(tǒng)計(jì)、決策理論、數(shù)據(jù)庫(kù)管理和機(jī)器學(xué)習(xí)等多學(xué)科的知識(shí),這門廣義的交叉學(xué)科徽劇了不同領(lǐng)域的研究者,的局部孤立點(diǎn),也不會(huì)遺漏周圍的孤立點(diǎn)數(shù)據(jù),這種檢測(cè)方法放棄了以前絕對(duì)孤立點(diǎn)觀點(diǎn),并納入局部孤立點(diǎn)的內(nèi)容,也更貼近Hawkins的孤立點(diǎn)定義。34基于聚類的孤立點(diǎn)檢測(cè)方法傳統(tǒng)的大部分聚類算法如Sting、Dbscan、Clarans等都具有異常數(shù)據(jù)的處理能力,這些聚類數(shù)據(jù)挖掘算法主要目標(biāo)是在相似的基礎(chǔ)上收集數(shù)據(jù)來(lái)分類,產(chǎn)生對(duì)人們有意義的聚類
7、信息,孤立點(diǎn)的產(chǎn)生只是副產(chǎn)品而已。在聚類數(shù)據(jù)挖掘處理過(guò)程中,這些算法將數(shù)據(jù)集中異常的事項(xiàng)作為噪音而忽略或容忍,雖然不利于異常信息的檢測(cè),但其最大的優(yōu)點(diǎn)就是掃描數(shù)據(jù)集的效率較高,適應(yīng)于大規(guī)模數(shù)據(jù)集。35基于偏離的孤立點(diǎn)檢測(cè)方法基于偏離的孤立點(diǎn)檢測(cè)不采用統(tǒng)計(jì)(分布)和基于距離的度量值來(lái)發(fā)現(xiàn)和確定異常數(shù)據(jù),它是通過(guò)對(duì)檢測(cè)數(shù)據(jù)集的主要特征來(lái)確定孤立點(diǎn)的,所有與給出的主要特征描述“偏離”的數(shù)據(jù)集都被認(rèn)為是孤立點(diǎn)。基于偏離的方法主要檢測(cè)技術(shù)有序列異
8、常技術(shù)和OLAP數(shù)據(jù)立方體技術(shù)。36基于深度的孤立點(diǎn)檢測(cè)方法基于深度的孤立點(diǎn)檢測(cè)方法中,數(shù)據(jù)集中的每一個(gè)數(shù)據(jù)都被映射為維空間中的一個(gè)點(diǎn),同時(shí)也定義了其深度,根據(jù)不同的深度將這些數(shù)據(jù)劃分成不同的層次。整個(gè)劃分過(guò)程中,異常數(shù)據(jù)一般都是被劃分到較淺層次的數(shù)據(jù),這些數(shù)據(jù)是孤立點(diǎn)的可能性較大。此方法存在的缺陷是對(duì)四維及四維以上的數(shù)據(jù)處理效率較低,只適合對(duì)二維和三維空間上的數(shù)據(jù)檢測(cè)。四、孤立點(diǎn)技術(shù)在審計(jì)信息化中的應(yīng)用四、孤立點(diǎn)技術(shù)在審計(jì)信息化中的應(yīng)
9、用41基于孤立點(diǎn)分析的審計(jì)數(shù)據(jù)挖掘模型基于孤立點(diǎn)分析的審計(jì)數(shù)據(jù)挖掘模型主要包括:數(shù)據(jù)預(yù)處理模塊、孤立點(diǎn)檢測(cè)模塊、孤立點(diǎn)算法庫(kù)、孤立點(diǎn)規(guī)則庫(kù)等?;诠铝Ⅻc(diǎn)分析的審計(jì)數(shù)據(jù)挖掘模型原理可簡(jiǎn)述如下,首先將采集到的原始審計(jì)數(shù)據(jù)進(jìn)行預(yù)處理,目的是過(guò)濾無(wú)用的數(shù)據(jù)和將原始數(shù)據(jù)轉(zhuǎn)換為孤立點(diǎn)數(shù)據(jù)挖掘算法能識(shí)別的格式;然后從孤立點(diǎn)算法庫(kù)中選擇相應(yīng)的算法對(duì)轉(zhuǎn)換后的數(shù)據(jù)執(zhí)行孤立點(diǎn)數(shù)據(jù)挖掘,并得到隱含孤立點(diǎn);再將這些隱含孤立點(diǎn)與孤立點(diǎn)規(guī)則庫(kù)中的模式進(jìn)行比較,把數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 孤立點(diǎn)數(shù)據(jù)挖掘技術(shù)研究及應(yīng)用.pdf
- 數(shù)據(jù)挖掘技術(shù)及其聚類方法在審計(jì)中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘在審計(jì)數(shù)據(jù)分析中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘技術(shù)在審計(jì)過(guò)程中的應(yīng)用研究.pdf
- 數(shù)據(jù)挖掘技術(shù)在信息化建設(shè)中的應(yīng)用
- 數(shù)據(jù)挖掘技術(shù)在教育信息化中的應(yīng)用研究.pdf
- 數(shù)據(jù)挖掘在國(guó)稅信息化中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘在電信信息化系統(tǒng)中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘研究在信息化中的應(yīng)用研究
- 大數(shù)據(jù)技術(shù)在審計(jì)實(shí)務(wù)中的應(yīng)用研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院信息化建設(shè)應(yīng)用研究.pdf
- 利用數(shù)據(jù)挖掘技術(shù)淺析校園信息化服務(wù)推廣
- 數(shù)據(jù)挖掘技術(shù)在金融審計(jì)中的應(yīng)用
- 元數(shù)據(jù)及其在審計(jì)系統(tǒng)中的應(yīng)用.pdf
- 醫(yī)院信息化改造工程——多維數(shù)據(jù)技術(shù)在醫(yī)院信息化中的應(yīng)用.pdf
- 多維數(shù)據(jù)分析在審計(jì)實(shí)踐中的應(yīng)用
- 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘及其在稅務(wù)信息化中的應(yīng)用研究.pdf
- 南都電源公司信息化系統(tǒng)中數(shù)據(jù)挖掘的研究和應(yīng)用.pdf
- 審計(jì)信息化建設(shè)的應(yīng)用分析
- “敏感分析”在審計(jì)中的應(yīng)用
評(píng)論
0/150
提交評(píng)論