XGB、LGB在datacamp(学习网站)

data fountain与国家电投系列赛,光伏发电预测

题目:给一组特征,预测瞬时发电量,训练集9000个点,测试集8000个点,特征包含光伏板的属性和外部环境等。

数据字段:ID、光伏电池板背侧温度、光伏电站现场温度、计算得到的平均转换效率、数据采集点A处光伏板转换效率、数据采集点B处光伏板转换效率、数据采集点C处光伏板转换效率、数据采集点D处光伏板转换效率、数据采集点A处汇流箱电压值、数据采集点B处汇流箱电压值、数据采集点C处汇流箱电压值、数据采集点D处汇流箱电压值、数据采集点A处汇流箱电流值、数据采集点B处汇流箱电流值、数据采集点C处汇流箱电流值、数据采集点D处汇流箱电流值、采集点A处的功率、采集点B处的功率、采集点C处的功率、采集点D处的功率、采集点A、B、C三点功率的平均值、光伏电厂现场风速测量值、光伏电厂现场风向、辐照度、湿度

数据探索性分析与异常值处理

探索性分析:

作图训练集发电量的散点图,可以发现发电量是有周期性的,在一天中,发电量随着光照强度变