数据集笔记:SINPA 新加坡停车场数量数据集
GitHub - yoshall/SINPA
- 从Data.gov.sg抓取了来自新加坡1,921个停车场的三年实时PA数据,每5分钟一次
- 为了减轻缺失值的影响,我们将原始数据集重新采样为15分钟间隔,并选择PA缺失率低于30%的停车场
- 此外,由于时间分布的变化,仅使用了一年的数据(2020年7月1日至2021年6月30日)
- 训练集、验证集和测试集的比例设置为10:1:1
- 去除了具有明显分布偏移的停车场(即高KL散度)
- ——>经过样本筛选后,剩余1,687个停车场具有稳定的数据分布
- 还为这些停车场抓取了外部属性数据,包括来自Data.gov.sg、城市重建局(URA)和陆路交通管理局(LTA)的气象数据(即温度、湿度和风速)、规划区域、使用类型和道路网络数据