軟件介紹

文本聚類是基于相似性算法的自動聚類技術(shù),自動對大量無類別的文檔進(jìn)行歸類,把內(nèi)容相近的文檔歸為一類,并自動為該類生成特征主題詞。適用于自動生成熱點輿論專題、重大新聞事件追蹤、情報的可視化分析等諸多應(yīng)用。相似軟件版本說明軟件地址wpe綠色版查看斯沃?jǐn)?shù)控仿真大全6.5查看grid6.5.0.0 官方版查看 靈玖Lingjoin基于核心特征發(fā)現(xiàn)技術(shù),突破了傳統(tǒng)聚類方法空間消耗大,處理時間長的瓶頸;不僅聚類速度快,而且準(zhǔn)確率高,內(nèi)存消耗小,特別適合于超大規(guī)模的語料聚類和短文本的語料聚類。 靈玖文檔聚類組件的主要特色在于: 1、速度快:可以處理海量規(guī)模的網(wǎng)絡(luò)文本數(shù)據(jù),平均每小時處理至少50萬篇文檔; 2、聚類精準(zhǔn):Top N的聚類中心往往能反映出當(dāng)時的時事熱點,適合于輿情熱點計算;與國際上以聚類見長的Autonomy公司技術(shù)相比,靈玖的各項指標(biāo)遠(yuǎn)遠(yuǎn)領(lǐng)先,或許是靈玖更懂中文吧 3、精準(zhǔn)排序:各個類別按照影響權(quán)重排序,每個類中的文檔按照重要性排序; 4、可定制:可以定制類別數(shù)、類別中心。 5、開放式接口:靈玖文檔聚類組件作為LJParser的一部分,采用靈活的開發(fā)接口,可以方便地融入到用戶的業(yè)務(wù)系統(tǒng)中,可以支持各種操作系統(tǒng),各類調(diào)用語言。 靈玖文檔聚類可以應(yīng)用于文本挖掘、知識管理、搜索聚類、輿情監(jiān)測等多種應(yīng)用中。