2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、為什么搜索引擎喜歡Blog,http://chedong.com/blog/車東,搜索引擎做為互聯(lián)網(wǎng)的“路由器”,搜索引擎是網(wǎng)民的上網(wǎng)主要入口之一;搜索引擎每天給其他網(wǎng)站帶去4-6億流量(相當(dāng)于搜索引擎自身流量的1-2倍);在內(nèi)容網(wǎng)站的外網(wǎng)來源流量中:搜索引擎占80%-90%;超過傳統(tǒng)的友情鏈接等推介方式一個(gè)數(shù)量級(jí)以上;,從搜索獲益最多網(wǎng)站之一維基百科,維基百科每天從Google獲得數(shù)百萬用戶流量;,內(nèi)容管理系統(tǒng)(CMS)比較

2、,同樣是:標(biāo)題,時(shí)間,作者,內(nèi)容這幾個(gè)因素的組合,為什么blog/wiki/新聞組歸檔往往比BBS更容易被搜索引擎搜到?為什么同樣的內(nèi)容:大網(wǎng)站的轉(zhuǎn)載往往比原文出處排名更靠前?什么樣的網(wǎng)站對(duì)蜘蛛比較友好?(Spider Friendly),比較成功的幾個(gè)Blog發(fā)布系統(tǒng):,幾年前第一次找Blog發(fā)布系統(tǒng):WordPress (php) 便于架設(shè),插件豐富,管理簡單MovableType(活字印刷的系統(tǒng)) 性能較好;比較流行的B

3、SP發(fā)布商:LiveJournal;Blogger;,這些Blog發(fā)布系統(tǒng)的特點(diǎn),鏈接穩(wěn)定;蜘蛛抓取方便;按時(shí)間歸檔;RSS輸出;Trackback ping/留言反饋機(jī)制;分類歸檔;,搜索引擎的職能: 重現(xiàn),點(diǎn)擊搜索結(jié)果鏈接地址,卻無法返回期望的結(jié)果,用戶會(huì)很失望;服務(wù)器無法訪問;頁面不存在;內(nèi)容已經(jīng)變更;,搜索引擎的重要職能:重現(xiàn),Blog內(nèi)容: 單條目永久鏈接:PermaLink 每個(gè)條目都是永久鏈接個(gè)

4、人按月歸檔:條目數(shù)量仍然控制在幾十條之內(nèi),不用分頁;按類目歸檔:即使有內(nèi)容更新,舊內(nèi)容仍然保留,BBS/論壇的內(nèi)容:由于內(nèi)容量過多,舊內(nèi)容往往會(huì)被刪除;index.php?page=12 這樣的鏈接幾天后內(nèi)容全部變化;&PHPSESSION=l85skdj23w4qq2sw3w42每個(gè)蜘蛛識(shí)別為不同鏈接;,網(wǎng)頁快照可以解決一部分問題,但是用戶得到的內(nèi)容可能是過時(shí)的;原網(wǎng)站丟失了原本可以獲得的用戶;,搜索引擎的負(fù)

5、擔(dān):除重,Blog內(nèi)容:內(nèi)容頁相對(duì)穩(wěn)定;歸檔鏈接規(guī)則穩(wěn)定;類似的:郵件列表歸檔也是搜索引擎比較容易收錄的內(nèi)容;,BBS內(nèi)容:Foo.php?a=1&b=2與foo.php?b=2&a=1內(nèi)容是一樣的index.html?from=foo與index.html?from=bar內(nèi)容是一樣的,不同地址標(biāo)記相同內(nèi)容的危害,會(huì)損失其他地址帶來的鏈接;大量使用轉(zhuǎn)向進(jìn)行統(tǒng)計(jì)也為搜索引擎識(shí)別鏈接的別名帶來負(fù)擔(dān);訪

6、問日志中的referer可以代替標(biāo)記跟蹤來源;,幀結(jié)構(gòu): frame不利于蜘蛛抓取,BLOG大部分為平板式頁面瀏覽;,BBS的左導(dǎo)航/右側(cè)內(nèi)容模式,不利于蜘蛛抓取,也不利于重現(xiàn);,性能因素:緩存機(jī)制,靜態(tài)歸檔更容易緩存性能更高M(jìn)T的靜態(tài)頁面歸檔;LJ的memcache動(dòng)態(tài)緩存模式;,動(dòng)態(tài)頁面生成:過大壓力下容易造成服務(wù)器宕機(jī);結(jié)構(gòu)化數(shù)據(jù)庫往往是瓶頸;,Tips:Cache Friendly ~= SEO,使用穩(wěn)定的連接:避免經(jīng)常

7、變化;避免使用動(dòng)態(tài)參數(shù)來進(jìn)行點(diǎn)擊來源跟蹤index.html?source=fooIndex.html?source=bar有更簡單的方法:基于referer進(jìn)行來源識(shí)別;增加Last-Modify/Expires等緩存控制Header;鏈接/域名更換:要保留原地址可訪問,設(shè)置301轉(zhuǎn)向;,Blog內(nèi)容的特點(diǎn),作者對(duì)內(nèi)容/回復(fù)完全控制;個(gè)人版權(quán)聲明: CC;時(shí)效性;歸檔機(jī)制;,主貼和回復(fù)是天生不平等的,文章發(fā)布者是

8、文章條目的所有人;可以控制回復(fù)的數(shù)量和質(zhì)量、排序等因素;可以控制文章;,主貼作者甚至無法控制低質(zhì)量的回復(fù);回復(fù)內(nèi)容展現(xiàn)大量的噪音:回復(fù)者的信息,排名,簽名等噪音回復(fù)和主貼存儲(chǔ)在同一空間中,嚴(yán)重降低效率;,私有內(nèi)容:利于內(nèi)容長期維護(hù),Blog內(nèi)容是私有的;面向歸檔,備忘的;內(nèi)容可重用度較高;是個(gè)人的在線虛擬資產(chǎn);原創(chuàng)內(nèi)容相對(duì)多;不同搜索引擎對(duì)于新發(fā)現(xiàn)內(nèi)容有一定的加權(quán),一般2周后,或者1個(gè)月后內(nèi)容會(huì)回到同其他內(nèi)容一樣的權(quán)

9、重;,BBS內(nèi)容則無法承諾長期保存;內(nèi)容實(shí)效性較強(qiáng);缺乏搜索引擎來源的反饋,影響面有限;轉(zhuǎn)載多,原創(chuàng)少;,引用發(fā)現(xiàn)和用戶交互,可視化編輯器在blog發(fā)布系統(tǒng)中廣泛使用:內(nèi)容來源鏈接地址:內(nèi)部/外部都較多;BBS為防止XSS,往往禁用可視化編輯器或使用BBCODE;如何方便轉(zhuǎn)載者主動(dòng)標(biāo)記原文出處:再次推銷一下[chedong copyright模板]便于用戶Copy/Paster并能有效鏈接的模板為用戶做正確的事情提供方

10、便;,RSS: 低成本新內(nèi)容發(fā)現(xiàn)機(jī)制,節(jié)省帶寬: 不遍歷網(wǎng)站內(nèi)容而發(fā)現(xiàn)最新內(nèi)容;Ping機(jī)制可以進(jìn)一步提高發(fā)現(xiàn)新條目的效率;部分自動(dòng)鏡像產(chǎn)生反向鏈接;,結(jié)論:良好結(jié)構(gòu),良好引用,良好導(dǎo)航,學(xué)習(xí)一下MovableType和WordPress Wiki內(nèi)容發(fā)布的優(yōu)點(diǎn);對(duì)原有BBS/FAQ等發(fā)布系統(tǒng)規(guī)劃注意以下事項(xiàng):搜索引擎蜘蛛抓取friendly:新內(nèi)容發(fā)現(xiàn):對(duì)RSS/Sitemaps協(xié)議的支持;舊內(nèi)容遍歷:3跳之內(nèi)遍歷完網(wǎng)站所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論