利用Python進行數據分析大量實踐案例教會你如何利用Python庫高效解決各式各樣的數據分析問題,本書重點介紹了用于高效解決各種數據分析問題的Python語言和庫。《利用Python進行數據分析》沒有闡述如何利用Python實現具體的分析方法。
利用Python進行數據分析目錄
第1章 準備工作
本書主要內容
為什么要使用Python進行數據分析
重要的Python庫
安裝和設置
社區和研討會
使用本書
致謝
第2章 引言
來自bit.ly的1.usa.gov數據
MovieLens 1M數據集
1880-2010年間全美嬰兒姓名
小結及展望
第3章 IPython:一種交互式計算和開發環境
IPython基礎
內省
使用命令歷史
與操作系統交互
軟件開發工具
IPython HTML Notebook
利用IPython提高代碼開發效率的幾點提示
高級IPython功能
致謝
第4章 NumPy基礎:數組和矢量計算
NumPy的ndarray:一種多維數組對象
通用函數:快速的元素級數組函數
利用數組進行數據處理
用于數組的文件輸入輸出
線性代數
隨機數生成
范例:隨機漫步
第5章 pandas入門
pandas的數據結構介紹
基本功能
匯總和計算描述統計
處理缺失數據
層次化索引
其他有關pandas的話題
第6章 數據加載、存儲與文件格式
讀寫文本格式的數據
二進制數據格式
使用HTML和Web API
使用數據庫
第7章 數據規整化:清理、轉換、合并、重塑
合并數據集
重塑和軸向旋轉
數據轉換
字符串操作
示例:USDA食品數據庫
第8章 繪圖和可視化
matplotlib API入門
pandas中的繪圖函數
繪制地圖:圖形化顯示海地地震危機數據
Python圖形化工具生態系統
第9章 數據聚合與分組運算
GroupBy技術
數據聚合
分組級運算和轉換
透視表和交叉表
示例:2012聯邦選舉委員會數據庫
第10章 時間序列
日期和時間數據類型及工具
時間序列基礎
日期的范圍、頻率以及移動
時區處理
時期及其算術運算
重采樣及頻率轉換
時間序列繪圖
移動窗口函數
性能和內存使用方面的注意事項
第11章 金融和經濟數據應用
數據規整化方面的話題
分組變換和分析
更多示例應用
第12章 NumPy高級應用
ndarray對象的內部機理
高級數組操作
廣播
ufunc高級應用
結構化和記錄式數組
更多有關排序的話題
NumPy的matrix類
高級數組輸入輸出
性能建議
附錄A Python語言精要