詞條
詞條說明
靈玖軟件:NLPIR-Parser語義挖掘技術挖掘商業“石油”
面對信息社會中數據和數據庫的爆炸式增長,人們分析數據和從中提取有用信息的能力,遠遠不能滿足實際需要。但目前所能做到的只是對數據庫中已有的數據進行存儲、查詢、統計等功能,但它卻無法發現這些數據中存在的關系和規則,較不能根據現有的數據預測未來的發展趨勢。這種現象產生的主要原因就是缺乏挖掘數據背后隱藏的知識的有力手段,從而導致“數據爆炸但知識貧乏”的現象。數據挖掘就是為迎合這種要求而產生并*發展起來
數據挖掘(Data Mining),又稱為數據庫中的知識發現(Knowledge Discovery in Database, KDD),就是從大量數據中獲取有效的、新穎的、潛在有用的、較終可理解的模式的非平凡過程,簡單的說,數據挖掘就是從大量數據中提取或“挖掘”知識。 NLPIR數據挖掘技術的任務主要是關聯分析、聚類分析、分類、預測、時序模式和偏差分析等。 ⑴關聯分析(association
Nlpir Parser智能平臺靈玖軟件新推出的文本挖掘系統
文本挖掘已經成為數據挖掘中一個日益流行而重要的研究領域。與一般數據挖掘以關系、事務和數據倉庫中的結構數據為研究目標所不同的是,文本挖掘所研究的文本數據庫, 由來自各種數據源的大量文檔組成。這些文檔可能包含標題、作者、出版日期、長度等結構化數據, 也可能包含摘要和內容等非結構化的文本成分,而且這些文檔的內容是人類所使用的自然語言,計算機很難處理其語義。因此傳統的信息檢索技術已不適應日益增加的大量文
自然語言通常是指一種自然地隨文化演化的語言。英語、漢語、日語為自然語言的例子,而世界語則為人造語言,即是一種為某些特定目的而創造的語言。 自然語言具備兩個屬性:語言屬性與自然屬性。“語言”屬性表現為公認的某些約定俗成的內在規律性;“自然”屬性是說并不存在某個人為制造的、嚴格的語法規則體系來約定人們的語言表達方式,這是和程序設計語言大相徑庭的。自然語言需要遵循一定的內在規律,但較大程度上是“存在即
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: