老Y文章管理系統(tǒng)采集自動(dòng)偽原創(chuàng)詳解 |
發(fā)布時(shí)間: 2012/7/10 17:42:38 |
做垃圾站的站長(zhǎng)們,最希望的事就是網(wǎng)站可以自動(dòng)采集、自動(dòng)完成偽原創(chuàng)、然后自動(dòng)收錢(qián),這實(shí)在是天底下最幸福的事,呵呵。自動(dòng)采集和自動(dòng)收錢(qián)就不討論了,我今天介紹一下如何利用老Y文章管理系統(tǒng)采集時(shí)自動(dòng)完成偽原創(chuàng)的方法。 老Y文章管理系統(tǒng)使用簡(jiǎn)單、方便,雖然功能不如DEDE之類(lèi)的強(qiáng)大到幾乎變態(tài)的程度(當(dāng)然,老Y文章管理系統(tǒng)是asp語(yǔ)言寫(xiě)的,似乎也沒(méi)有可比性),但是該有的都有,且相當(dāng)簡(jiǎn)單,所以也受到了不少站長(zhǎng)們的歡迎。老Y文章管理系統(tǒng)采集時(shí)自動(dòng)完成偽原創(chuàng)的具體方法還很少有人探討,在老Y的論壇上,甚至有人在賣(mài)這個(gè)方法,小小的鄙視一下。 關(guān)于采集,我就不多說(shuō)了,相信大家都可以搞定,我要介紹的是老Y文章管理系統(tǒng)如何在采集的同時(shí)自動(dòng)完成偽原創(chuàng)工作的具體方法,大體的思路就是利用老Y 文章管理系統(tǒng)自帶的過(guò)濾功能實(shí)現(xiàn)近義詞的自動(dòng)替換,從而達(dá)到偽原創(chuàng)的目的。比如我想將被采集文章中的所有“網(wǎng)賺博客”字樣替換為“網(wǎng)賺日記”。詳細(xì)步驟如下: 第一步,進(jìn)入后臺(tái)。找到“采集管理”-“過(guò)濾管理”,添加一個(gè)新的過(guò)濾項(xiàng)目。 我可以建立一個(gè)名為“網(wǎng)賺博客”的項(xiàng)目,具體設(shè)置請(qǐng)看圖:
![]()
“過(guò)濾名稱(chēng)”:填入“網(wǎng)賺博客”即可,也可以隨意寫(xiě),但是為了方便查看,建議與被替換的詞語(yǔ)一致。 “所屬項(xiàng)目”:請(qǐng)根據(jù)自己的網(wǎng)站進(jìn)行選擇一個(gè)網(wǎng)站欄目(必須選擇一個(gè)欄目,否則過(guò)濾項(xiàng)目無(wú)法保存)。 “過(guò)濾對(duì)象”:可選項(xiàng)有“標(biāo)題過(guò)濾”和“正文過(guò)濾”,一般選“正文過(guò)濾”即可,如果你連標(biāo)題都想偽原創(chuàng)一下,可以選擇“標(biāo)題過(guò)濾”。 “過(guò)濾類(lèi)型”:可選項(xiàng)有“簡(jiǎn)單替換”和“高級(jí)過(guò)濾”,一般選“簡(jiǎn)單替換”,如果選擇了“高級(jí)過(guò)濾”,需要指定“開(kāi)始標(biāo)記”和“結(jié)束標(biāo)記”,這樣可對(duì)采集來(lái)的內(nèi)容進(jìn)行代碼級(jí)的替換。 “使用狀態(tài)”:可選項(xiàng)有“啟用”和“禁用”,不用解釋。 “使用范圍”:可選項(xiàng)有“公有”和“私有”。選擇“私有”,該過(guò)濾僅對(duì)當(dāng)前網(wǎng)站欄目有效;選擇“公有”,對(duì)所有欄目都有效,不管采集任何欄目的任何內(nèi)容,該過(guò)濾均有效。一般選“私有”即可。 “內(nèi)容”:填入“網(wǎng)賺博客”,將要被替換的詞語(yǔ)。 “替換”:填入“網(wǎng)賺日記”,這樣只要被采集的文章中含有“網(wǎng)賺博客”字樣,就會(huì)被自動(dòng)替換為“網(wǎng)賺日記”。 第二步,重復(fù)第一步的工作,直到添加完所有的近義詞。 有網(wǎng)友要問(wèn)了:我有30000多條近義詞,難道要一條一條手動(dòng)添加?那要到添加什么時(shí)候!?不能批量添加嗎? 這個(gè)問(wèn)題問(wèn)得好!手動(dòng)添加的確幾乎是個(gè)不可能完成的任務(wù),除非你有超常的毅力,可以手工把這30000多條近義詞添加進(jìn)去。遺憾的是,老Y文章管理系統(tǒng)并沒(méi)有提供批量導(dǎo)入的功能。但是,作為真正的、資深的、有思想的懶人,我們要有懶人的覺(jué)悟。 要知道,我們剛才輸入的內(nèi)容,是存儲(chǔ)在數(shù)據(jù)庫(kù)中的,而老Y文章管理系統(tǒng)是用asp+Access寫(xiě)的,mdb數(shù)據(jù)庫(kù)可以很方便的編輯!于是乎,我可以通過(guò)直接修改數(shù)據(jù)庫(kù)的方法來(lái)批量導(dǎo)入偽原創(chuàng)替換規(guī)則! 改進(jìn)的第二步:修改數(shù)據(jù)庫(kù),批量導(dǎo)入規(guī)則。 經(jīng)過(guò)查找,我發(fā)現(xiàn)這個(gè)數(shù)據(jù)庫(kù)位于“你的管理目錄\cai\Database”下。用Access打開(kāi)這個(gè)數(shù)據(jù)庫(kù),找到“Filters”表,你會(huì)發(fā)現(xiàn)我們剛才添加的替換規(guī)則就在這兒存著呢,根據(jù)你的需要,批量添加吧!接下來(lái)的工作涉及到Access的操作了,我就不羅嗦了,大家自己可以搞定。 解釋一下“Filters”表中的幾個(gè)字段的含義: FilterID:自動(dòng)生成,無(wú)需輸入。 ItemID:欄目ID,就是我們手動(dòng)輸入時(shí)“所屬項(xiàng)目”的內(nèi)容,不過(guò)這里是個(gè)數(shù)字ID,注意跟欄目的采集ID做好對(duì)應(yīng),如果不知道ID,可以重復(fù)第一步,測(cè)試一下。 FilterName:即“過(guò)濾名稱(chēng)”。 FilterObjece:即“過(guò)濾對(duì)象”,填1為“標(biāo)題過(guò)濾”,填2則是“正文過(guò)濾”。 FilterType:即“過(guò)濾類(lèi)型”,填1為“簡(jiǎn)單替換”,填2為“高級(jí)過(guò)濾”。 FilterContent:即“內(nèi)容”。 FisString:即“開(kāi)始標(biāo)記”,僅在設(shè)置了“高級(jí)過(guò)濾”時(shí)有效,如果設(shè)置了“簡(jiǎn)單過(guò)濾”請(qǐng)留空。 FioString:即“結(jié)束標(biāo)記”,僅在設(shè)置了“高級(jí)過(guò)濾”時(shí)有效,如果設(shè)置了“簡(jiǎn)單過(guò)濾”請(qǐng)留空。 FilterRep:即“替換”。 Flag:即“使用狀態(tài)”,TRUE為“啟用”,F(xiàn)ALSE為“禁用”。 PublicTf:即“使用范圍”。TRUE為“公有”,F(xiàn)ALSE為“私有”。 最后說(shuō)一點(diǎn)利用過(guò)濾功能實(shí)現(xiàn)偽原創(chuàng)的使用感受: 老Y文章管理系統(tǒng)的這個(gè)功能可以實(shí)現(xiàn)采集時(shí)自動(dòng)偽原創(chuàng),但是功能還不夠強(qiáng)大。比如我站上有“欄目一”、“欄目二”、“欄目三”共三個(gè)欄目。我希望“欄目一”對(duì)標(biāo)題和正文都進(jìn)行偽原創(chuàng),“欄目二”只對(duì)正文進(jìn)行偽原創(chuàng),“欄目三”只對(duì)標(biāo)題進(jìn)行偽原創(chuàng)。 于是,我只能做如下設(shè)置(假設(shè)我有30000的近義詞規(guī)則): 為“欄目一”的標(biāo)題偽原創(chuàng)創(chuàng)建30000條替換規(guī)則; 為“欄目一”的正文偽原創(chuàng)創(chuàng)建30000條替換規(guī)則; 為“欄目二”的正文偽原創(chuàng)創(chuàng)建30000條替換規(guī)則; 為“欄目三”的標(biāo)題偽原創(chuàng)創(chuàng)建30000條替換規(guī)則。 這樣就造成了極大的數(shù)據(jù)庫(kù)浪費(fèi),如果我的站有幾十個(gè)欄目,每個(gè)欄目的要求都不一樣,這個(gè)數(shù)據(jù)庫(kù)的尺寸將會(huì)十分恐怖。 所以建議老Y文章管理系統(tǒng)下一版本將這個(gè)功能做一下改進(jìn): 首先添加批量導(dǎo)入功能,畢竟修改數(shù)據(jù)庫(kù)有一定的危險(xiǎn)性。 其次,過(guò)濾規(guī)則不再依附于某個(gè)網(wǎng)站欄目,而是將過(guò)濾規(guī)則獨(dú)立出來(lái),而在建立新的采集項(xiàng)目的時(shí)候,加入一條是否使用過(guò)濾規(guī)則的判斷。 相信,這樣修改之后可以極大地節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間,同時(shí)邏輯結(jié)構(gòu)也顯得更加清晰。 本文出自:億恩科技【www.cmtents.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |