詞條
詞條說明
漢語分詞(Chinese Word Segmentation) 指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續的字序列按照一定的規范重新組合成詞序列的過程。中文分詞是其他中文信息處理的基礎,搜索引擎只是中文分詞的一個應用。其他的比如機器翻譯(MT)、語音合成、自動分類、自動摘要、自動校對等等,都需要用到分詞。 漢語自動分詞是目前中文信息處理領域公認的一大難題,也是自然語言理解研究領域
隨著互聯網的飛速發展,網絡已經成為人們日常獲取信息和知識的重要媒介。互聯網包含了龐大的信息量,具有開放性、動態性、匿名信、互動性等特點,它不僅給人們帶來了豐富的信息,也成為人們自由交互信息的平臺。與此同時,互聯網固有的分散性等特點也給網絡資源統一管理造成了困難。許多敏感的、不健康的、甚至是惡意的信息摻雜其中。對社會穩定和人們身心健康造成了較大的危害,特別是影響青少年的健康成長。為此,我國乃至世界
近年來,隨著移動互聯網和自媒體的興起與發展,互聯網空間日益豐富、熱鬧,人人享有“麥克風”的時代逐漸成為現實,網絡空間一度成為眾聲喧嘩之地。然而,在拓展人們生活空間的同時,互聯網中的不實信息、不良行為等“負能量”和“噪音”也開始滋生傳播,不僅侵害個人隱私和財產安全,也威脅著從虛擬空間到現實空間的秩序。 信息網絡以激濁揚清為**要義。網絡化生活已成為人們的基本生活形態,對于廣大群眾來說,信息網絡絕不
隨著Internet上文檔信息的迅猛發展,文本挖掘成為處理和組織大量文檔數據的關鍵技術。存儲信息使用較多的是文本,所以文本挖掘被認為比數據挖掘具有較高的商業潛力. 當數據挖掘的對象完全由文本這種數據類型組成時,這個過程就稱為文本數據挖掘. 事實上,較近研究表明公司信息有80 %包含在文本文檔中。 數據挖掘(Data Mining),就是從存放在數據庫,數據倉庫或其他信息庫中的大量的數據中獲取有效
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: