版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、最新 精品 Word 歡迎下載 可修改改變科學(xué)研究思路的十個知識創(chuàng)新點——探索漢語理論建設(shè)及中文信息處理的新路鄒曉輝qhkjy@yahoo.com.cn 519125 廣東珠海井岸橋東恒美花園 15-2 棟 201 號摘要 本文介紹《字本位與中文信息處理的基礎(chǔ)》1貢獻的十個知識創(chuàng)新點,即:漢語及中文的基本原理,信息和智的本質(zhì)定義及基本分類,認知心理學(xué)雙語協(xié)同存儲原理,形式理論的受限原理,序位邏輯原理及工具,語言和知識的通用計算方法
2、和量具,生產(chǎn)式教學(xué)及協(xié)同智能訓(xùn)練體系,(產(chǎn)、學(xué)、研、教、用、算)一體化(知識信息數(shù)據(jù))管理。其重要性不僅在于指出自然語言與機器語言的互換路徑,除直接形式化之外還有間接形式化道路,對漢語形式理論建設(shè)和中文信息處理及基于中文的知識處理而言,后者更便捷而高效,而且還在于改變科學(xué)研究思路的十個知識創(chuàng)新點具有的整體功用。關(guān)鍵詞 漢語形式理論、中文信息處理、基于中文的知識處理、融智學(xué)的十個知識創(chuàng)新點1.引言在過去幾年,基于語言學(xué)和信息學(xué)的融智學(xué)(如
3、字本位與中文信息處理的基礎(chǔ))研究取得 了長足進展[1 義項語匯典例(SVDE)的總量控制模型 ( CLSW-5 論文集)[1],重構(gòu)“概念分類體系”的新思路與新方法( CLSW-6 論文集) [2],優(yōu)化“語義信息處理”的新方法與實施例( CLSW-6 論文集) [3],字本 位與中文信息處理[4];2 理性的標準的協(xié)同智能模型(CAAI-11 錄用)[5],融智學(xué)的觀點和方法(CAAI-11 錄用)[6],信息學(xué)基礎(chǔ)研究(信息科學(xué)交叉
4、研究學(xué)術(shù)研討會 2022 北京)[7]和 Intelligence Means Information Processing(智意味著信息處理)Zou XiaoHui (VII International Ontology Congress: Real or Virtual: from Plato’s Cave to Internet 2022,10,Spain) [8] ]。然而也還有很多重要的問題沒有得到滿意的解決[如:3 不同
5、的信息觀的分歧依然較大,信息本質(zhì)的理論探討仍在進行[9],漢語理論的本位問題仍未徹底解決[10],中文信息處理現(xiàn)有的三大流派[11]各自預(yù)期都是至少還需要幾代人的努力才可望有所突破) ;4 國際范圍內(nèi)語言與知識的計量問題仍然存在;5 人類智力以及人工智能所涉及的智的概念的本質(zhì)似乎仍未搞清()AI©2000 - 2022]。有鑒于此,本文系統(tǒng)地介紹了《字本位與中文信息處理的基礎(chǔ)》提出的十個知識創(chuàng)新點,希望有助于改變漢語理論及中文
6、信息處理的研究思路。它們體現(xiàn)的協(xié)同智能的觀點、原理和方法至少可在“強人工智能”與“弱人工智能”之間形成必要張力。人腦與電腦的雙腦結(jié)合及其相應(yīng)的一整套“軟件和數(shù)據(jù)庫”系統(tǒng)實質(zhì)上是(k + 1)雙文雙語協(xié)同智能計算系統(tǒng) 2。2.正文2.1 領(lǐng)域字本位與中文信息處理,涉及語言學(xué)與信息學(xué)的一系列難題。這些問題中,最基礎(chǔ)的是可否判斷(如字詞含義的消歧)與可否計算(如真實文本處理)兩類問題。解答前者是人腦的擅長,解答后者是電腦的擅長。由于存在不可
7、判斷(ε)與不可計算(∞)這兩類超出人腦與電腦處理范圍的問題,因此筆者引入了(k + 1)雙文雙語協(xié)同智能計算系統(tǒng),把問題轉(zhuǎn)化限制在可判斷{0,1}與可計算{0,1}+{00,01,10,11}+ … +{000…0,…,1…111}范圍以內(nèi)。于是,《字本位與中文信息處理的基礎(chǔ)》實際上就是《融智學(xué)導(dǎo)論》3。1 廣東省優(yōu)秀科技專著出版基金會 2022 專家論證通過正式資助將于 2022 年底/2022 年初出版發(fā)行。2 涉及拓廣的
8、(包容大、小字符集的)形式語言、形式文法、形式體系、形式理論和形式科學(xué)。3 專門研究(狹義的)協(xié)同智能的概念、原理和方法及其典型實例的新型科學(xué)理論,涉及微觀語言學(xué)與最新 精品 Word 歡迎下載 可修改假設(shè) 3:如果任何符號形式都可轉(zhuǎn)化為數(shù)字形式,那么,語言形式也可轉(zhuǎn)化為數(shù)字形式。假設(shè) 4:所謂理解,其實是在全局中對局部的準確把握或認知,如在參照系中確定序位。2.6(根本上具有創(chuàng)新意義的知識)貢獻貢獻 1:發(fā)現(xiàn)并清楚地論述了漢
9、語及中文的基本原理——字的迭交原理。圖 1 是“字的迭交原理” (字組的“粗分”與“細分”是其派生原理)示意圖。由圖 1 可直觀“字”這個概念的八個基本屬性,分別揭示了微觀語言學(xué)的文字、語音、語義、語法、語用、字典、釋義元語和對象語言八個分支學(xué)科的研究對象。可用解析法把“形字”和“音字”從“迭交”的“復(fù)合字”中分離出來 9從而明確漢語及中文的“字”的形式特點:字(對象語言)具有一語雙文(大、小字符集兼容)的特征。在傳統(tǒng)的“實字”與“虛字
10、”的基礎(chǔ)上引入“用字”和“ 解字” ,不僅可形成“字組方陣” ,而且還可提煉出“組字公式” ,從而揭示出“字與字組的關(guān)系”,如“意+義=意義”,在形式上只是一個簡單的字符串公式,在內(nèi)容上卻是一個非常復(fù)雜而又十分重要的“組字公式” ,其中前字限制后字。于是,現(xiàn)在的問題也就集中到了什么是意義這個問題上面來了。西方哲學(xué)“語言轉(zhuǎn)向”以來,所有的科學(xué)預(yù)言和哲學(xué)反思幾乎全都止步于這個被稱為人文、社會和哲學(xué)等諸學(xué)科共同的核心問題或意義難題,竟然可用“
11、意義=意+義”這樣的一個十分簡單的字符串公式直接地破題。這不能不說是漢語及中文一個非常獨特的功能 10。這些發(fā)現(xiàn)是以往的漢語研究未曾注意更未曾上升到理論高度并形成體系的知識創(chuàng)新點。其中區(qū)分“對象語言的字”和“釋義元語的字(作為構(gòu)造字組的基本結(jié)構(gòu)單位) ”甚至就是漢語“字本位”理論 11也未曾注意且更未曾上升到理論高度并形成體系的知識創(chuàng)新點。圖 1(漢語及中文的基本原理)“字的迭交原理”示意圖貢獻 2:給出了信息的一般科學(xué)定義(即“信息本
12、體”)及其最基本的分類:?(信息)= ?(義)+ ?(文)+ ?(意) ,其中,?(文)含 ?(物)的外觀。?(義)= 可序位化的基本關(guān)系及其所構(gòu)成的結(jié)構(gòu)體系,?(文)= 可數(shù)字化的基本符號及其所構(gòu)成的形式體系,?(意)= 可屬性化的基本概念及其所構(gòu)成的學(xué)問體系,(普遍的)信息是內(nèi)容上可概念化、形式上可數(shù)字化、本質(zhì)上可序位化的范疇,可劃分為概念、符號、關(guān)系三個基本范疇 12,其特例(如具體的信息)就是各種各樣特殊的信息。貢獻 3:給出了
13、智以及智力或智能的本質(zhì)定義(即:智就是信息處理)及其基本分類。9 類似于“做(虛擬的)分體手術(shù)” ,首先分離“形字”和“音字” ,進而分離大、小字符集的“音 字” 。10 至少在此超級難題的解釋上,英文不具備中文的這個優(yōu)點。中文有自己獨特的(區(qū)別于小字符集 的)形式化途徑。鄒曉輝:重構(gòu)“概念分類體系”的新思路與新方法( CLSW-6 論文集) ISBM981-05-5217- 3 11 本該但是沒有(注意且上升到理論高度并
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論