從機器學習建模角度看,時間序列數據集(time series dataset)與普通數據集存在一個重要區別:樣本之間具有時間順序(temporal order)。數據不僅包含數值本身,還包含這些數值發生的時間信息。
在普通監督學習數據集中,樣本通常可以看作相互獨立;而在時間序列數據中,相鄰樣本之間往往存在時間依賴關系(temporal dependency)。
從結構上看,一個典型的時間序列數據集通常包括以下幾部分:
? 時間索引(time index)
? 特征矩陣(feature matrix)
? 目標值或預測變量(target values,可選)
? 特征名稱(feature names,可選)
? 數據說明(dataset description,可選)
下面分別介紹這些概念,并使用一個簡單的時間序列示例進行說明。
一、時間索引
1、基本概念
時間序列數據的核心特征是:每個觀測值都對應一個時間點。
這些時間點通常由時間索引(time index)表示,例如:
t1, t2, t3, ..., tn時間索引可以表示為:
? 日期(date)
? 時間戳(timestamp)
? 連續時間編號
例如:
2026-01-03時間索引用于確定數據發生的先后順序。
在機器學習建模時,時間索引通常用于:
? 排序數據
? 構建時間窗口
? 進行時間序列預測
2、簡單示例
假設我們記錄某城市每天的溫度:
2026-01-03 13其中:
2026-01-03就是時間索引。
二、特征矩陣
1、基本概念
在時間序列數據集中,每個時間點通常對應一個或多個觀測特征。
如果一個時間序列包含 n 個時間點,每個時間點有 m 個特征,這些特征就可以組成一個特征矩陣:
]其中:
? 每一行表示一個時間點
? 每一列表示一個特征
矩陣維度為:
(n_time_steps, n_features)即:
(時間點數量, 特征數量)特征矩陣通常記為 X。
在實際應用中,時間序列特征可能來自:
? 傳感器數據
? 股票價格
? 銷售記錄
? 網絡流量
2、簡單示例
假設記錄每天的三個指標:
? 溫度
? 濕度
? 風速
特征矩陣可以表示為:
]矩陣形狀 (3, 3) 表示有 3(行)個時間點,每個時間點有 3 個特征。
三、目標值(預測變量)
1、基本概念
在時間序列預測任務中,通常需要預測未來的數值。因此數據集中往往會包含目標值(target)。
例如:
y = [12, 14, 13, ...]目標數組通常記為 y,其結構通常為:
(n_time_steps,)在建模時,時間序列數據常常通過時間窗口(sliding window)轉換為監督學習形式:
y = x4即,使用過去若干時間點預測未來值。
2、簡單示例
假設我們使用過去三天溫度預測第四天溫度:
[12,14,13] → 15這種轉換可以使時間序列數據用于普通機器學習模型,例如:
? 線性回歸
? 隨機森林
? 梯度提升樹
四、特征名稱
1、基本概念
如果時間序列數據包含多個指標,數據集通常會提供特征名稱(feature names)。其結構通常是一個字符串列表:
['temperature', 'humidity', 'wind_speed']特征名稱用于說明每一列數據的含義。
2、示例
在天氣數據中:
data[:,2] → wind_speed這些名稱可以幫助理解數據的實際意義。
五、數據說明
1、基本概念
很多數據集還會提供背景說明信息,例如:
? 數據來源
? 數據采集方式
? 觀測周期
? 數據規模
這些信息有助于理解數據背景。
2、示例
例如:
? 數據來源:國家氣象局
? 觀測頻率:每日記錄
? 數據范圍:2018–2025
這些信息通常會出現在數據集說明文本中。
六、時間序列數據集結構關系
一個典型的時間序列數據集可以表示為:
└── 數據說明在實際機器學習任務中,時間序列數據通常需要經過時間窗口轉換,再用于訓練模型。
小結
時間序列數據集的核心特點是樣本具有明確的時間順序。數據通常由時間索引、特征矩陣以及可選的目標變量構成。在時間序列預測任務中,數據常通過滑動時間窗口轉換為監督學習形式,從而可以使用常見的機器學習模型進行訓練。理解時間序列數據的結構,是進行時間序列建模與預測的重要基礎。
![]()
“點贊有美意,贊賞是鼓勵”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.