跳到主要內容

發表文章

目前顯示的是 10月, 2019的文章

ML |【ML Study Jam 機器學習培訓計劃】課程心得 其二

前一篇文章 當中,我摘要了 Coursera 上【 ML Study Jam 機器學習進階培訓計劃 】訓練課程當中的前兩部課程的重點,而另外三部課程的重點彙整,就集結在這篇文章當中! 1. How Google does Machine Learning 2. Launching into Machine Learning 3. Intro to TensorFlow 4. Feature Engineering 5. Art and Science of Machine Learning 【Intro to TensorFlow】 如題,該部課程介紹近幾年來最火紅的開源 ML 開發工具:TensorFlow。內容不外乎是 TensorFlow 在資料科學模型建構上的優勢、再來介紹其變數、語法,以及非常重要的 Estimator API,這項 Estimator API 是 TensorFlow 1.3 版本之後才有的功能,它能讓使用者可以更快速、方便的建構的模型。我個人認為 TensorFlow 它最強的優勢在於,它的語法和 Python 有 87% 像,這讓許多對於 Python 有一定水準的使用者們能夠快速上手。 TensorFlow Core Tensorflow Estimator API 筆記 – 10yung 開始使用  |  TensorFlow 適用的 AI Platform  |  Google Cloud 除了上述內容之外,該課程也示範如何使用 BigQuery 來進行分散式訓練(Distributed Training),這對於要建構較大規模的 ML 模型、或者有龐大訓練資料的訓練過程,非常有幫助。 分散式深度學習(I):分散式訓練神經網路模型的概述 【Feature Engineering】 接著,可以說是這一系列課程當中,我最喜歡的一項。我的資料科學啟蒙之路,是從資料分析這個領域發跡的,特徵工程(Feature Engineering)這個主題,可以說是資料科學和資料分析這兩個領域當中,交集最大的一個項目之一。該課程主要回答了以下的問題: 何謂特徵? 何謂特徵工程? 何謂組合特徵? 所謂特徵(Feature),如其名,就是資料當中具有代表性、能夠挖掘出更多潛在價值的資料欄位、或者特

ML |【ML Study Jam 機器學習培訓計劃】課程心得 其一

前一個月,我完成了在 Coursera 上【 ML Study Jam 機器學習進階培訓計劃 】訓練課程,趁著印象還深刻,來彙整一下這套線上課程的重點。同時我也將該系列課程的結業證書,放到 我的 LinkedIn 頁面 上面。 ML Study Jam 是 Google 的開發人員所設計的免費機器學習培訓計劃。又分成「初級」和「進階」兩個不同級別。初級的課程幾乎都是直接透過案例教學,來示範如何使用 BigQuery 及 Google Cloud APIs 來實作機器學習。進階課程則是包含了更多深入淺出的概念解說,我上是進階版的課程。雖然說是進階級別的課程,但是對於ML稍有概念的學員而言,進階級別的課程的難度應該都不構成問題。 我相信對於許多想要學習 ML 的新手而言,都會迫不及待想快點撰寫出自己的第一個 ML 模型。一來在建模的過程當中就能夠練習到諸多語法還有相關軟體工具,二來也能夠快速帶來成就感,在學習初期建立起信心。從上述觀點而言,以理論跟實作的比例來劃分「初級」和「進階」的課程設計,或許是個不錯的做法。但我們都曉得,要能夠靠 ML 在業界當中混飯吃,沒有足夠的理論 support 是不夠的,故我想這也是在進階課程當中,會有更多概念解說原因! 回到本文的重點,【ML Study Jam 機器學習進階培訓計劃】的實質課程內容其實是【 Machine Learning with TensorFlow on Google Cloud Platform 】其包含了下列五項子課程: 1. How Google does Machine Learning 2. Launching into Machine Learning 3. Intro to TensorFlow 4. Feature Engineering 5. Art and Science of Machine Learning 以下先介紹前兩部課程的概要內容! 而考量到著作權問題,以下將不會 show 出任何課程影片或測驗題目的畫面,但筆者整理了許多協助對應章節學習的網址供參考! 【How Google does Machine Learning】 作為該系列課程的第一部課程,當然是要先替自家公司打個廣告啦~~~ Google 作為全球的 AI 技