靈玖Lingjoin(www.lingjoin.com)采用基于語義的統(tǒng)計(jì)語言模型,所處理的文檔不受行業(yè)領(lǐng)域限制,能夠有效地挖掘出新出現(xiàn)的特征詞匯,所輸出的詞匯可以配以權(quán)重。
靈玖特征詞發(fā)現(xiàn)組件的主要特色在于:
1、速度快:可以處理海量規(guī)模的網(wǎng)絡(luò)文本數(shù)據(jù),平均每小時(shí)處理至少60萬篇文檔; 2、處理精準(zhǔn):Top N的分析結(jié)果往往能反映出當(dāng)時(shí)的時(shí)事流行語和熱點(diǎn)實(shí)體,適合于輿情熱點(diǎn)計(jì)算;與國(guó)際上著名廠商的技術(shù)相比,靈玖的各項(xiàng)指標(biāo)遠(yuǎn)遠(yuǎn)領(lǐng)先,或許是靈玖更懂中文吧; 3、精準(zhǔn)排序:特征詞匯按照影響權(quán)重排序,可以輸出權(quán)重值; 5、開放式接口:靈玖特征詞發(fā)現(xiàn)組件作為L(zhǎng)JParser的一部分,采用靈活的開發(fā)接口,可以方便地融入到用戶的業(yè)務(wù)系統(tǒng)中,可以支持各種操作系統(tǒng),各類調(diào)用語言。
靈玖特征詞發(fā)現(xiàn)組件可以應(yīng)用于文本挖掘、知識(shí)管理、詞典編輯、輿情監(jiān)測(cè)等多種應(yīng)用中。