|
|
|
|
|
|
|
|
ISBN: |
9787111588559 |
定价: |
RMB59.00 |
售价: |
RM64.90 |
优惠价:
|
RM45.43 * (-30%)
|
库存量:
|
海外库存 下单时可选择“空运”或“海运”(空运和海运需独立下单)。空运费每本书/CD是RM15.00。 空运需时9-12个工作天,海运需时约30个工作天。 (以上预计时间不包括出版社调货的时间以及尚未出版的预购商品) |
|
我要订购 |
|
放入下次购买清单 |
|
|
作者:
|
(美)茱莉亞·斯拉格,(美)戴維·羅賓遜
|
出版社: |
機械工業出版社
|
出版日期:
|
2018-03-01 |
装订:
|
無. 無. 161 页. 16. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
全書共9章,主要介紹如何使用基於R的整潔工具來進行文本分析。首先介紹了整潔文本的格式,以及如何獲取整潔文本數據集;並通過tidytext中的情感數據集來進行情緒分析;接着介紹了如何根據tf-idf統計量來識別特定文檔中的重要單詞,以及如何利用n-gram來分析文本中的文字網絡;之后介紹了如何將整潔文本轉換為文檔詞項矩陣和Corpus對象格式,並給出了主題建模的概念;最后通過整合多種已知的整潔文本挖掘方法,給出了一些研究案例,這些案例涉及Twitter歸檔文件、NASA數據集以及來自新聞組的即時通信信息。總的來說,本書側重於分析文學、新聞和社交媒體方面的文本,非常適合從事相關文本挖掘的工作人員和自然語言的初學者閱讀。與此同時,使用書中提供的大量針對性編程例子,不但可以提高工程實戰能力,而且可以在本書提到的整潔框架上建立自己的分析任務。
|
|
|
|
|
|
|
|
|
|
|
|
購買中國簡體書籍請注意:
1. 因裝幀品質及貨運條件未臻完善,中國簡體書可能有出現磨痕、凹痕、折痕等問題,故簡體字館除封面破損、內頁脫落、缺頁等較嚴重的狀態外,其餘所有商品將正常出貨。
|
|
|
|
|
|