前 一篇的 Theta 模型(以下通稱「Theta」為該模型的方法論本身)介紹文章當中,筆者主要提到的是 Python 程式語言的統計分析工具 statsmodels 當中所呈現的 ThetaModel (以下通稱「ThetaModel」為 statsmodels 當中實作 Theta 模型的程式物件)。而在本系列的第二篇文章,將提到 Theta 的相關軼事,以及另外一個基於 Python 程式語言的時間序列預測整合工具 Darts當中所呈現的 FourTheta (以下通稱「FourTheta」為 Darts 當中實作 Theta 的模型程式物件)。 # Theta 的應用與事蹟 綜觀上一篇文章的內容,Theta 模型設計看似簡單且沒什麼高深的數學理論,但正因為其設計概念簡單且具預測結果具有高度可解釋性,也因此,在一些十分重視 input 與 output 因果關聯的時間序列預測應用當中(例如: 製造業的產銷計劃 ),相較於一些廣義的機器學習、深度學習的時間序列預測演算法,還要更加可靠。實際上,Theta 模型最早被提出的時候,就已在現今知名的時間序列預測建模競賽「 MOFC - M Competition 」的第三屆競賽,也就是在 M3 Competition 當中,有非常優異的表現。 這系列的競賽會讓參賽者(即各方高手提出來的時間序列預測模型)使用多條不同領域、不同類型、不同時間顆粒度的序列資料來進行預測建模,並以多種預測準確度評鑑指標,綜合比較參賽方法的預測成效。也由於在 M3 Competition 大放異彩,包含之後的 M4 Competition ,也將 Theta 作為 benchmark 的模型之一,與 ARIMA 、 ETS 等經典模型具有等同的份量。雖然其在M4 Competition 的預測準確表現不再獨占鰲頭,但是在各種自動化、智慧型預測演算法蓬勃發展的現代,也獲得不俗的表現。尤其,若把運算的時間與軟硬體資源成本納入綜合評鑑指標的話,會發現 Theta 模型根本就是個高 CP 值的選擇。 上表為 M4 Competition 當中各模型的預測成效比較的整理表格之一 # Theta 的改良與拓展 作為曾經風光一時的預測模型標竿,有一些相關的改良、拓展模型,也都是很正常的。實際上,ThetaModel 所呈現的 Theta ...