主頁(yè) > 知識(shí)庫(kù) > asp中利用CSW中文分詞組件來實(shí)現(xiàn)自己網(wǎng)站的內(nèi)容關(guān)鍵詞自動(dòng)提取

asp中利用CSW中文分詞組件來實(shí)現(xiàn)自己網(wǎng)站的內(nèi)容關(guān)鍵詞自動(dòng)提取

熱門標(biāo)簽:辦理400電話一年多少錢 為什么外呼系統(tǒng)需要預(yù)存話費(fèi)呢 蘭州智能語(yǔ)音電銷機(jī)器人功能 常用地圖標(biāo)注范圍點(diǎn) 寧夏怎么申請(qǐng)400電話 咸陽(yáng)銷售外呼系統(tǒng) 離線電子地圖標(biāo)注軟件注冊(cè) 企數(shù)外呼系統(tǒng)能用多久 外呼回?fù)芟到y(tǒng)圖片
比如標(biāo)題是:騰訊QQ 2006 珊瑚蟲集成版 v4.5b
分詞后:[此資源關(guān)鍵詞:騰訊 QQ 珊瑚蟲 集成 ]
并且把關(guān)鍵詞做成專題,可以為每個(gè)內(nèi)容頁(yè)面生成相關(guān)連接了
用CSW中文分詞組件
下載:http://www.vgoogle.net/Product_CSW.asp
下面是我的ASP代碼,比較粗淺,但實(shí)用

codecsw 得到輸出的所有分詞結(jié)果,用它的組建里面有個(gè)ASP文件,你一看就知道怎么得到分詞結(jié)果了,這個(gè)不詳細(xì)說了。
復(fù)制代碼 代碼如下:

fcon=split(htm," ")
fcs=ubound(fcon)
for fci=0 to fcs
if fci mod 2=0 then
fcn=fcnfcon(fci)"$fc^#$"  '我這里用$fc^#$來分割每個(gè)分詞
else
fcw=fcwfcon(fci)"$fc^#$"
end if

next
fcn=left(fcn,len(fcn)-12) '去掉最前面的$fc^#$
fcw=left(fcw,len(fcw)-6) 去掉最后面的$fc^#$
don=split(fcn,"$fc^#$")
donn=split(fcw,"$fc^#$")
dos=ubound(don)
for doi=0 to dos
fcname=don(doi)  '得到分詞
fcsx=donn(doi)   '得到分詞屬性
'下面是判斷分詞符合我所提出的屬性,比如名詞、名動(dòng)詞、動(dòng)詞等,排除了數(shù)詞、狀詞和連接詞等。
if fcsx="/b" or fcsx="/nz" or fcsx="/n" or fcsx="/an" or fcsx="/nx" or fcsx="/f" or fcsx="/i" or fcsx="/l" or fcsx="/ng" or fcsx="/nr" or fcsx="/ns" or fcsx="/nt" or fcsx="/nz" or fcsx="/v" or fcsx="/vn" or fcsx="/s" or fcsx="/g" then
if len(fcname)>1 then
if instr(fcname1,fcname"$") then
else
if fcname>" " and fcname>"" then
fcname=replace(replace(replace(trim(fcname),chr(10),""),chr(13),""),chr(10)chr(13),"") '去除分詞的換行和回車鍵
if len(fcname)>1 then
'這里是分詞入庫(kù),我的分詞庫(kù)只有三個(gè)字段,自動(dòng)ID、分詞名稱和分詞所屬的內(nèi)容ID
Set Rs = CreateObject("ADODB.Recordset")
sql="select top 1 * from fc where fcname='"fcname"'"
rs.open sql,conn,1,3
if rs.eof then
rs.addnew
end if
rs("fcname")=fcname
if instr(rs("mid"),","id",") then
else
rs("mid")=rs("mid")","id","
end if
rs.update
rs.close
set rs=nothing
'分詞入庫(kù)結(jié)束
end if
end if
response.write fcname"("fcsx")br>"
mfc=mfcfcname","
end if
fcname1=fcname1fcname"$"
end if
end if
next
'這里是將分詞添加到內(nèi)容表,在內(nèi)容表我只多加了一個(gè)分詞字段mfc
if right(mfc,1)="$" then mfc=left(mfc,len(mfc)-1)
Set Rs = CreateObject("ADODB.Recordset")
sql="select top 1 mfc from m where mid="id
rs.open sql,conn,1,3
rs("mfc")=mfc
rs.update
rs.close
set rs=nothing
end if

就這樣實(shí)現(xiàn)了,呵呵,在分詞表的內(nèi)容ID都是用,來分割的,讀取的時(shí)候自己研究下就可以

標(biāo)簽:家電維修 昆明 溫州 麗江 泰州 昌都 咸陽(yáng) 鐵嶺

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《asp中利用CSW中文分詞組件來實(shí)現(xiàn)自己網(wǎng)站的內(nèi)容關(guān)鍵詞自動(dòng)提取》,本文關(guān)鍵詞  asp,中,利用,CSW,中文,分詞,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《asp中利用CSW中文分詞組件來實(shí)現(xiàn)自己網(wǎng)站的內(nèi)容關(guān)鍵詞自動(dòng)提取》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于asp中利用CSW中文分詞組件來實(shí)現(xiàn)自己網(wǎng)站的內(nèi)容關(guān)鍵詞自動(dòng)提取的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章