詞條
詞條說明
隨著互聯網的飛速發展,網絡已經成為人們日常獲取信息和知識的重要媒介。互聯網包含了龐大的信息量,具有開放性、動態性、匿名信、互動性等特點,它不僅給人們帶來了豐富的信息,也成為人們自由交互信息的平臺。與此同時,互聯網固有的分散性等特點也給網絡資源統一管理造成了困難。許多敏感的、不健康的、甚至是惡意的信息摻雜其中。對社會穩定和人們身心健康造成了較大的危害,特別是影響青少年的健康成長。為此,我國乃至世界
近年來,隨著Internet?的迅猛發展以及人們利用信息技術生產和搜集數據能力的大幅度提高,大規模的網絡文本庫不斷涌現。為了便于在海量文本庫中搜尋、過濾、管理這些文本,基于人工智能技術的文本大數據挖掘成為人們研究的焦點。 數據挖掘(KD)是從數據中自動抽取模型。數據挖掘包括許多步驟:從大規模數據庫中(或從其他來源)**數據;選擇合適的特征屬性;挑選合適的樣本策略;剔除數據中不正常的數據并補足不夠
大數據挖掘是伴隨者互聯網的普及應用和傳統信息檢索技術的不足提出并發展起來的。大數據挖掘是從大數據中發現有用的模式(其中的數據可以存放在數據庫、數據倉庫或其他信息庫中),它旨在解決數據挖掘、信息檢索、知識抽取以及較廣泛的商業問題。 作為大數據挖掘領域中的一個重要研究分支,文本挖掘與處理主要研究從非結構化及半結構化的海量Web文本信息中挖掘有**的信息,處理其中可能隱藏著的概念及其聯系,并完成可能的
隨著計算機技術和網絡技術的*發展,互聯網上共享的文本呈海量趨勢增長,包括各種環境下的大文本和社交媒體文本等。如何有效存儲、管理、檢索和使用這些文本數據,是擺在人們面前巨大的挑戰和亟待解決的研究問題。文本語義分析與挖掘是解決上述問題的基礎。 互聯網大環境下的共享文本具備特殊的屬性:1)半結構化;2)多尺度;3)海量;4)復雜關聯;5)多樣化。LJParser文本語義分析系統結合人工智能、統計分析
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: