服務(wù)咨詢電話
發(fā)表于:2019-06-21
作者:科翔信息
瀏覽 105 次
專利申請(qǐng)?zhí)?/span>:
CN200710175751.7
專利類型:
發(fā)明
IPC 分類號(hào):
G06F17/30
應(yīng)用領(lǐng)域:
用于關(guān)鍵詞快速匹配。
現(xiàn)有技術(shù)缺點(diǎn):
以往技術(shù)采用并行處理,不僅會(huì)增加硬件成本,而且系統(tǒng)的可實(shí)現(xiàn)性也是個(gè)大問(wèn)題,不適合處理大規(guī)模關(guān)鍵詞。
技術(shù)優(yōu)勢(shì):
1、過(guò)濾散列表采用比特位的方式存儲(chǔ),可以有效節(jié)約存儲(chǔ)空間。較好的利用了 Cache 局部性,從而有效提高了關(guān)鍵詞匹配速度;
2、另外本發(fā)明結(jié)合基于位運(yùn)算的散列值遞推計(jì)算,可以在常數(shù)時(shí)間內(nèi)進(jìn)行散列值的計(jì)算,從而實(shí)現(xiàn)較快速度的大規(guī)模關(guān)鍵詞匹配。
摘要:
本發(fā)明公開(kāi)了一種關(guān)鍵詞匹配方法和系統(tǒng)。首先讀入關(guān)鍵詞文件, 統(tǒng)計(jì)關(guān)鍵詞個(gè)數(shù),設(shè)置多個(gè)過(guò)濾散列表和一個(gè)校驗(yàn)散列表的掩碼或大??;根據(jù)關(guān)鍵詞和上述散列表掩碼或大小構(gòu)造該過(guò)濾散列表和該校驗(yàn)散列表;根據(jù)過(guò)濾散列表和校驗(yàn)散列表對(duì)輸入的文本進(jìn)行掃描匹配,將匹配結(jié)果存儲(chǔ)在指定的內(nèi)存結(jié)構(gòu)或者外部文件中。本發(fā)明的方法和系統(tǒng)不僅有效提高關(guān)鍵詞匹配的速度,還非常節(jié)約內(nèi)存,并可以實(shí)現(xiàn)大規(guī)模關(guān)鍵詞匹配。
(以上資訊來(lái)源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系管理員刪除。)
上一篇:人工智能項(xiàng)目推介——64、確定自動(dòng)機(jī)狀態(tài)轉(zhuǎn)換表的空間壓縮方法
下一篇:人工智能項(xiàng)目推介——55、一種色情圖像檢測(cè)方法
合肥科翔信息技術(shù)服務(wù)有限責(zé)任公司 版權(quán)所有 免責(zé)聲明
地址:安徽省合肥市高新區(qū)天元路軟件園1號(hào)樓210-212室
電話:180-1954-5300 QQ:2501649871
COPYRIGHT ? 合肥科翔信息技術(shù)服務(wù)有限責(zé)任公司 ALL RIGHTS RESERVED. 皖I(lǐng)CP備2023003016號(hào)-1
技術(shù)支持:明圖網(wǎng)絡(luò)