前一篇文章 當中,我摘要了 Coursera 上【 ML Study Jam 機器學習進階培訓計劃 】訓練課程當中的前兩部課程的重點,而另外三部課程的重點彙整,就集結在這篇文章當中! 1. How Google does Machine Learning 2. Launching into Machine Learning 3. Intro to TensorFlow 4. Feature Engineering 5. Art and Science of Machine Learning 【Intro to TensorFlow】 如題,該部課程介紹近幾年來最火紅的開源 ML 開發工具:TensorFlow。內容不外乎是 TensorFlow 在資料科學模型建構上的優勢、再來介紹其變數、語法,以及非常重要的 Estimator API,這項 Estimator API 是 TensorFlow 1.3 版本之後才有的功能,它能讓使用者可以更快速、方便的建構的模型。我個人認為 TensorFlow 它最強的優勢在於,它的語法和 Python 有 87% 像,這讓許多對於 Python 有一定水準的使用者們能夠快速上手。 TensorFlow Core Tensorflow Estimator API 筆記 – 10yung 開始使用 | TensorFlow 適用的 AI Platform | Google Cloud 除了上述內容之外,該課程也示範如何使用 BigQuery 來進行分散式訓練(Distributed Training),這對於要建構較大規模的 ML 模型、或者有龐大訓練資料的訓練過程,非常有幫助。 分散式深度學習(I):分散式訓練神經網路模型的概述 【Feature Engineering】 接著,可以說是這一系列課程當中,我最喜歡的一項。我的資料科學啟蒙之路,是從資料分析這個領域發跡的,特徵工程(Feature Engineering)這個主題,可以說是資料科學和資料分析這兩個領域當中,交集最大的一個項目之一。該課程主要回答了以下的問題: 何謂特徵? 何謂特徵工程? 何謂組合特徵? 所謂特徵(Feature),如其名,就是資料當中具有代表性、能夠挖掘出更多潛在價值的資料欄位、或者特