跳到主要內容

雜談|邁向資料科學家之路 其三

在這個部落格剛成立沒多久,我曾整理過〈邁向資料科學家之路〉其一其二兩篇文章,分別針對進入資料科學工作的「入門」、「觀念」、「技術」、與「職場」等面相進行探討。時隔一年,我留意到坊間不少資料科學同好的相關經驗談,十分值得參考,於是決定整理再一篇文章,來記錄一下這些前輩及同業們的寶貴分享,尤其是我在前兩篇文章當中未提及的部分。
由於這些文章的內容多已十分言簡意賅,故以下僅依照文章的內容來概略分類,分別是「工作最前線」、「業界定位」、「跨域合作」、「R 語言使用者的困境」

【工作最前線】

這個類別主要收錄已經在業界打滾多年的資料科學家、分析師、機器學習工程師的日常工作概覽。其中,第一篇的〈數據化運營中玩過的分析項目〉更是有完整的系列文章,可供新進同好參考。
  1. 數據化運營中玩過的分析項目 - 邱國欣(Andy Chiu) - Medium
  2. 在業界做資料科學家是怎麼樣的一種體驗?–David's Perspective
  3. 那些做 Data Science 的心酸血淚分享 - Ben Chen - Medium
  4. 【12 點真心建議】這位機器學習工程師在入職一年後,寫了這封信給初學者 | TechOrange

【職場定位】

這個類別的主要是收錄「科科寫寫」這個部落格的文章精華。該部落格板主針對資料科學相關工作在目前業界當中的定位,做了十分詳細的分類及說明。以下的收錄文章將從資料科學的工作角色分類,到公司定位、以及產業的需求,依序排列,能夠讓業界新手更理解自己未來的職場發展方向。
  1. 資料科學的職稱分類演進
  2. 資料科學角色光譜圖
  3. 從資料科學人力配置,看公司的資料工程複雜度
  4. 2019 我的資料科學轉職歷程:產業職缺觀察
  5. 想要轉行數據分析領域,看完這篇再做決定 - 數據分析那些事 - Medium

【跨域合作】

這個類別則收錄了從 PM(產品經理 or 專案經理)以及領域專家的觀點,如何和資料科學領域的專家(包含資料分析師、工程師)合作來進行專案。事實上,任何一個資料科學專案,都是屬於專案管理的範疇,但資料科學家、分析師、工程師等等,卻不一定擅長整個專案的溝通、規劃、及整合工作,尤其是在大規模資料科學專案。此時,PM 就扮演著協調及整合的關鍵角色。而一個好的資料科學專案,也少不了優秀的領域專家參與。
  1. 【PM 夥伴攻略】如何跟資料分析師合作?- 3PM LAB - Medium
  2. 【PM夥伴攻略】如何跟資料科學家合作?- 3PM LAB - Medium
  3. 領域專家?利用管理顧問的技巧做特徵工程(上)- Finformation當資料科學遇上財務金融 - Medium
  4. 領域專家?利用管理顧問的技巧做特徵工程(下)- Finformation當資料科學遇上財務金融 - Medium


【R 語言使用者的困境】
最後一個要分享類別,就來談談以 R 語言為主要工具的資料科學家、分析師們,在業界進行專案開發時的困境。R 語言雖然先天在資料科學、數據分析領域具有得天獨厚的優勢,但受限於各種現實上的因素,使得 R 語言在商業應用的普及率較低。
該系列的作者分析了造成該結果的原因,並分享自己如何將 R 語言實際推廣到商業應用當中,也解說了許多工程師對於 R 語言的一些偏見及誤解,同時給了有相關境遇的同業們建議,尤其在模型部屬實作的部分。由於我自己就是以 R 語言作為資料科學的啟蒙工具,這樣的經驗分享對我而言尤其珍貴!