資料科學的統計實務──探索資料本質、扎實解讀數據，才是機器學習成功建模的第一步

作者：江崎貴裕

譯者：温政堯

出版社：旗標出版股份有限公司

出版日期：2021年11月01日

ISBN：9789863126829

$ 200.00

簡介

新書上市即攻佔日本亞馬遜統計類書籍第一名

很多資料科學、機器學習的書，內容充滿各種建模的技術展示、完美的案例分析，卻忘記了更重要的「資料」。唯有掌握好手中的資料，才是機器學習成功建模的第一步。

無法了解資料，深度學習也救不了你；相反的，正確蒐集資料，輕鬆建模沒煩惱。

如何了解資料？當然要從統計觀念開始。學習統計一定都要看抽象複雜的數學嗎？並不是！本書所使用的範例，會告訴大家「為什麼統計學要如此定義」、「為什麼技巧要那樣使用」。當讀者了解統計背後的觀念時，才不會迷失在複雜的數學。此外，有別於一般市售書籍總是用漂亮案例展示程式運行結果，此書用相當多的範例都是「專家也會犯的錯誤」，相信讀者同時學習成功以及失敗的案例後，可以更全面地了解資料科學的分析流程觀念。

本書會介紹資料分析中的許多技術的基本觀念，如變異數分析、偏相關係數、自相關函數、Bonferroni校正、Holm校正、隨機對照試驗、斷點迴歸分析、傾向評分匹配、T檢定、F檢定、分層多階段抽樣法等，介紹的過程中會直擊分析技術的思維，而非僅展示漂亮的數學。

本書亦會說明身為資料科學家該有的素養，來避免確認偏誤、倖存者偏誤、選擇偏誤、發表偏誤、自願者偏誤、可得性偏誤、樂觀偏誤、常態偏誤、後此謬論、賭徒謬誤、辛普森謬論、p-hacking、HARKing、單方論證、霍桑效應、畢馬龍效應等資料分析中可能踩到的陷阱。

如果讀者曾經有以下問題，那這本書將是你的最佳解方。

● 我想知道怎麼蒐集高品質資料來加速機器學習建模

● 我想知道什麼樣的資料適合什麼分析技術

● 我想知道分析過程中是否參雜不自覺的偏見

● 我想知道分析完的結果代表什麼意思

● 我想知道為什麼資料分析可以解決問題

此外，中文版還提供免費Python程式下載，讓讀者可以實際演練書中的範例，加深對知識的理解。

本書貫通從資料蒐集、資料分析、資料解讀每一個環節的觀念，讓你走上資料科學家的康莊大道！

查看完整簡介

書評