服務(wù)咨詢電話
發(fā)表于:2019-06-12
作者:科翔信息
瀏覽 80 次
專利申請?zhí)?/span>:
CN200910091375.2
專利類型:
發(fā)明
IPC 分類號:
G06F17/30
應(yīng)用領(lǐng)域:
用于 Web 視頻頁面中準確有效的提取文本信息。
現(xiàn)有技術(shù)缺點:
現(xiàn)有技術(shù)的算法無法直接應(yīng)用到復雜命名識別抽取中;同時算法也沒有對命名實體做精細的類別劃分。
技術(shù)優(yōu)勢:
1、精確提取 Web 視頻頁面中的文本信息;
2、能夠抽取出各個類別中的復雜命名實體,為用戶推薦最新最熱門的各類信息;
3、頻頁面的變化發(fā)現(xiàn)新的復雜命名實體,具有及時、快速、準確的技術(shù)效果;
4、通過從候選特征詞中選擇出在類別內(nèi)均勻分布在類別間集中分布的詞為特征詞,去除存在干擾的特征詞,提高抽取準確性。
摘要:
本發(fā)明涉及 Web 視頻頁面的復雜命名實體的抽取方法及系統(tǒng),方法包括:步驟 1,對于 Web 視頻頁面集合中的每個 Web 視頻頁面,從Web 視頻頁面中抽取有效文本信息,有效文本信息組成視頻文本, 所有視頻文本組成訓練集合;步驟 2,對 Web 視頻頁面進行歸類, 選擇類別,對于每個被選的類別設(shè)置引導詞,從訓練集合中選擇同引導詞相關(guān)并且在類別內(nèi)均勻分布在類別間集中分布的詞為特征詞;步驟 3,從訓練集合中提取出同特征詞相關(guān)的詞為候選復雜命名實體,按候選命名實體相關(guān)的特征詞同類別的關(guān)聯(lián)度,為各個被選類別從候選命名實體中選擇對應(yīng)的復雜命名實體。本發(fā)明能夠不需要經(jīng)過長時間的模型訓練而從 Web 視頻頁面中提取復雜命名實體。
(以上資訊來源于網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系管理員刪除。)
上一篇:人工智能項目推介——46、基于小波子帶交織最優(yōu)量化的高速圖像壓縮方法及裝置
下一篇:人工智能項目推介——47、一種將矢量圖形轉(zhuǎn)化成位圖并進行自適應(yīng)分割的方法
合肥科翔信息技術(shù)服務(wù)有限責任公司 版權(quán)所有 免責聲明
地址:安徽省合肥市高新區(qū)天元路軟件園1號樓210-212室
電話:180-1954-5300 QQ:2501649871
COPYRIGHT ? 合肥科翔信息技術(shù)服務(wù)有限責任公司 ALL RIGHTS RESERVED. 皖I(lǐng)CP備2023003016號-1
技術(shù)支持:明圖網(wǎng)絡(luò)