|
|
|
|
|
|
|
|
ISBN |
9787302645368 |
定价 |
RMB118.00 |
售价 |
RM129.80 |
优惠价 |
RM97.35 * (-25%)
|
作者 |
(加)喬納森·里烏
|
译者 |
殷海英 |
出版社 |
清華大學出版社
|
出版日期 |
2023-10-01 |
装订 |
平裝. 無. 402 页. |
库存量 |
購買後立即進貨 此中国简体书,船运需时约30个工作天(不含调货时间)。抱歉!目前无开放空运服务。 库存有限或需要调货,订购时间可能延长。如无法订购则将通知进行退款。 |
|
我要订购 有现货时通知我 |
|
放入下次购买清单 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Spark數據處理引擎是一個驚人的分析工廠:輸入原始數據,輸出洞察。PySpark用基於Python的API封裝了Spark的核心引擎。它有助於簡化Spark陡峭的學習曲線,並使這個強大的工具可供任何在Python數據生態系統中工作的人使用。《Python和PySpark數據分析》幫助你使用PySpark解決數據科學的日常挑戰。你將學習如何跨多台機器擴展處理能力,同時從任何來源(無論是Hadoop集群、雲數據存儲還是本地數據文件)獲取數據。一旦掌握了基礎知識,就可以通過構建機器學習管道,並配合Python、pandas和PySpark代碼,探索PySpark的全面多功能特性。
主要內容:組織PySpark代碼;管理任何規模的數據;充滿信心地擴展你的數據項目;解決常見的數據管道問題;創建可靠的長時間運行的任務。
[加]喬納森·里烏(Jonathan Rioux),作為一家數據驅動軟件公司的ML總監,Jonathan Rioux每天都在使用PySpark。他向數據科學家、數據工程師和精通數據的業務分析師講授PySpark的用法。
|
|
|
|
|
|
|
|
|
|
|
|
購買中國簡體書籍請注意:
1. 因裝幀品質及貨運條件未臻完善,中國簡體書可能有出現磨痕、凹痕、折痕等問題,故簡體字館除封面破損、內頁脫落、缺頁等較嚴重的狀態外,其餘所有商品將正常出貨。
|
|
|
|
|
|