詞條
詞條說明
Nlpir Parser智能平臺靈玖軟件新推出的文本挖掘系統(tǒng)
文本挖掘已經(jīng)成為數(shù)據(jù)挖掘中一個日益流行而重要的研究領域。與一般數(shù)據(jù)挖掘以關系、事務和數(shù)據(jù)倉庫中的結(jié)構(gòu)數(shù)據(jù)為研究目標所不同的是,文本挖掘所研究的文本數(shù)據(jù)庫, 由來自各種數(shù)據(jù)源的大量文檔組成。這些文檔可能包含標題、作者、出版日期、長度等結(jié)構(gòu)化數(shù)據(jù), 也可能包含摘要和內(nèi)容等非結(jié)構(gòu)化的文本成分,而且這些文檔的內(nèi)容是人類所使用的自然語言,計算機很難處理其語義。因此傳統(tǒng)的信息檢索技術已不適應日益增加的大量文
12月28日,從國家新聞出版廣電總局官網(wǎng)獲悉,靈玖軟件成功獲得由國家新聞出版廣電總局審核的《社會科學研究領域知識挖掘與服務實驗室》建設單位,是首批全國大數(shù)據(jù)知識服務六家單位之一。該實驗室是由靈玖軟件與社會科學文獻出版社聯(lián)合申報的。 《社會科學研究領域知識挖掘與服務實驗室》主要圍繞“社會科學研究領域知識挖掘與服務”展開研究。主要研究方向及內(nèi)容包括以下幾個方面。 (1)社會科學研究領域知識服務標準研
大數(shù)據(jù)挖掘是伴隨者互聯(lián)網(wǎng)的普及應用和傳統(tǒng)信息檢索技術的不足提出并發(fā)展起來的。大數(shù)據(jù)挖掘是從大數(shù)據(jù)中發(fā)現(xiàn)有用的模式(其中的數(shù)據(jù)可以存放在數(shù)據(jù)庫、數(shù)據(jù)倉庫或其他信息庫中),它旨在解決數(shù)據(jù)挖掘、信息檢索、知識抽取以及較廣泛的商業(yè)問題。 作為大數(shù)據(jù)挖掘領域中的一個重要研究分支,文本挖掘與處理主要研究從非結(jié)構(gòu)化及半結(jié)構(gòu)化的海量Web文本信息中挖掘有**的信息,處理其中可能隱藏著的概念及其聯(lián)系,并完成可能的
NLPIR語義技術助力解決文本數(shù)據(jù)挖掘難題
近年來,隨著Internet?的迅猛發(fā)展以及人們利用信息技術生產(chǎn)和搜集數(shù)據(jù)能力的大幅度提高,大規(guī)模的網(wǎng)絡文本庫不斷涌現(xiàn)。為了便于在海量文本庫中搜尋、過濾、管理這些文本,基于人工智能技術的文本大數(shù)據(jù)挖掘成為人們研究的焦點。 數(shù)據(jù)挖掘(KD)是從數(shù)據(jù)中自動抽取模型。數(shù)據(jù)挖掘包括許多步驟:從大規(guī)模數(shù)據(jù)庫中(或從其他來源)**數(shù)據(jù);選擇合適的特征屬性;挑選合適的樣本策略;剔除數(shù)據(jù)中不正常的數(shù)據(jù)并補足不夠
公司名: 靈玖中科軟件(北京)有限公司
聯(lián)系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區(qū)蘇州街49-3號盈智大廈5層
郵 編:
網(wǎng) 址: ljrj123.cn.b2b168.com
公司名: 靈玖中科軟件(北京)有限公司
聯(lián)系人: 張寶
手 機: 13681251543
電 話: 010-62648216
地 址: 北京海淀北京市海淀區(qū)蘇州街49-3號盈智大廈5層
郵 編:
網(wǎng) 址: ljrj123.cn.b2b168.com