2021年3月30日 星期二

Annalyn Ng & Kenneth Soo - 文科生也看得懂得資料科學

小弟對機器學習以及AI很有興趣。唸書時也一度想將它作為研究的方向。不過最後還是沒有勇氣選擇它,因為那時候的學術風氣感覺AI陷入瓶頸了。不過事實上也確實是陷入了瓶頸。或許這幾年其實也沒什麼進步,只是處理器算的比較快罷了(這是一位在機器學習的領域有所成就的教授所分享的感言)。或許,從學術上或許真是沒什麼進步。因為老演算法在大數據下的表現不輸給新演算法。甚至還可能有更好表現。然而在應用上有著非常明顯的進步,這點相信你我都有看到。

我看了許多機器學習的書。也上了一些線上課程。但仍對這個領域一知半解。或許是時候退後一步,重新審視這門科學了。《文》這本書標榜文科生都能看。我翻了幾頁,確實是沒有數學公式在裡面,也沒有什麼表示式。作者是用更為生動的方式機器學習的原理介紹給讀者。

本書第一個章節介紹完最最基本的機器學習名詞解釋後,接下來的各個章節就分別介紹一種演算法的原理、適用場景、使用限制與注意事項。每個介紹的內容都很連貫,讓讀者更能理解其中的原故。或許書中沒有公式會讓人感覺浮雲一般。但其實不用太執著這點。不過可能我的想法不準確,因為我本身是看過公式再回過頭讀這本的,所以比較不會有『感覺不到』的情況吧?

這本書沒有死板的公式。而是更多演算法設計的奧妙。比如在社群網路分析時使用的PageRank中,能在如下的網路圖依照彼此的關連度交互運算,找出最關鍵的結點。

 

而k-nearest neighbors演算法就是對某結點分類時,會參考臨近結點的類型。書中的翻譯不錯,說這就「物以類聚」概念的實現。

本書介紹的演算法雖然多,但是說明簡單清晰。對於初學者或只是想稍微了解機器學習的大眾們來說是絕佳的讀物。除了教學外,更能當成一部科普的書籍。可以推薦給任何有興趣的讀者。




沒有留言: