有效
数据获取方法、装置、设备、可读存储介质和程序产品
王昱、冯旭宁、郭东旭、张强、欧阳明高
清华大学
王
王昱机构 暂无
技术领域 暂无
冯
冯旭宁机构 暂无
技术领域 暂无
郭
郭东旭机构 暂无
技术领域 暂无
张
张强机构 暂无
技术领域 暂无
欧
欧阳明高机构 暂无
技术领域 暂无
摘要
本申请涉及一种数据获取方法、装置、设备、可读存储介质和程序产品。所述方法包括:通过获取多个初始样本数据,可以针对一个初始样本数据,按照预设的样本扩充倍数分别对第一温度区间和第二温度区间进行温度区间提取,得到第一温度区间对应的多个第一温度子区间以及第二温度区间对应的多个第二温度子区间,再根据多个第一温度子区间对输入数据序列进行样本扩充处理,并根据多个第二温度子区间对标签数据序列进行样本扩充处理,以得到多个目标样本数据,其中,初始样本数据包括输入数据序列以及输入数据序列对应的标签数据序列,输入数据序列与第一温度区间对应,标签数据序列与第二温度区间对应。采用本方法能够降低样本数据获取成本。
1.一种数据获取方法,其特征在于,所述方法包括:获取多个初始样本数据,所述初始样本数据包括输入数据序列以及所述输入数据序列对应的标签数据序列,所述输入数据序列与第一温度区间对应,所述标签数据序列与第二温度区间对应;所述初始样本数据包括电池的初始样本数据,所述初始样本数据为用户通过外部输入设备输入的;针对一个所述初始样本数据,按照预设的样本扩充倍数分别对所述第一温度区间和所述第二温度区间进行温度区间提取,得到所述第一温度区间对应的多个第一温度子区间以及所述第二温度区间对应的多个第二温度子区间;根据各所述第一温度子区间对所述输入数据序列进行分割,得到与各所述第一温度子区间对应的多个输入数据序列片段,并根据各所述第二温度子区间对所述标签数据序列进行分割,得到与各所述第二温度子区间对应的多个标签数据序列片段;根据所述多个第一温度子区间对各所述输入数据序列片段进行样本扩充处理,并根据所述多个第二温度子区间对各所述标签数据序列片段进行样本扩充处理,以得到多个目标样本数据;所述目标样本数据用于模型训练。
2.根据权利要求1所述的方法,其特征在于,所述按照预设的样本扩充倍数分别对所述第一温度区间和所述第二温度区间进行温度区间提取,得到所述第一温度区间对应的多个第一温度子区间以及所述第二温度区间对应的多个第二温度子区间,包括:根据所述样本扩充倍数以及第一区间转换条件,确定多个第一温度点;根据所述样本扩充倍数以及第二区间转换条件,确定多个第二温度点;根据各所述第一温度点对所述第一温度区间进行温度区间提取,得到多个第一温度子区间,并根据各所述第二温度点对所述第二温度区间进行温度区间提取,得到多个第二温度子区间。
3.根据权利要求2所述的方法,其特征在于,所述根据各所述第一温度点对所述第一温度区间进行温度区间提取,得到多个第一温度子区间,并根据各所述第二温度点对所述第二温度区间进行温度区间提取,得到多个第二温度子区间,包括:获取所述第一温度区间对应的第一起始点以及所述第二温度区间对应的第二起始点;针对一个所述第一温度点,确定所述第一起始点至一个所述第一温度点之间的温度区间为一个所述第一温度子区间;针对一个所述第二温度点,确定所述第二起始点至一个所述第二温度点之间的温度区间为一个所述第二温度子区间。
4.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一温度子区间对各所述输入数据序列片段进行样本扩充处理,并根据所述多个第二温度子区间对各所述标签数据序列片段进行样本扩充处理,以得到多个目标样本数据,包括:针对一个所述第一温度子区间,根据第一采样点数量以及第一采样转换条件,确定多个第一采样温度点,各所述第一采样温度点处于所述第一温度子区间内;针对所述第一温度子区间对应的第二温度子区间,根据第二采样点数量以及第二采样转换条件,确定多个第二采样温度点,各所述第二采样温度点处于所述第二温度子区间内;根据各所述第一采样温度点、各所述第二采样温度点、所述第一温度子区间对应的所述输入数据序列片段以及所述第二温度子区间对应的所述标签数据序列片段确定所述第一温度子区间以及所述第一温度子区间对应的第二温度子区间内的目标样本数据。
5.根据权利要求4所述的方法,其特征在于,所述根据各所述第一采样温度点、各所述第二采样温度点、所述第一温度子区间对应的所述输入数据序列片段以及所述第二温度子区间对应的所述标签数据序列片段确定所述第一温度子区间内的目标样本数据,包括:根据所述第一温度子区间对应的输入数据序列片段以及第一插值条件,确定各所述第一采样温度点对应的采样输入数据;根据所述第二温度子区间对应的标签数据序列片段以及第二预设插值条件,确定各所述第二采样温度点对应的采样标签数据;根据各所述采样输入数据以及各所述采样标签数据确定所述第一温度子区间对应的所述目标样本数据。
6.根据权利要求5所述的方法,其特征在于,所述根据各所述采样输入数据以及各所述采样标签数据确定所述第一温度子区间对应的所述目标样本数据,包括:将各所述采样标签数据中的目标采样标签数据作为目标标签数据,所述目标采样标签数据对应的第二采样温度点在所述第二温度子区间中的顺序满足预设条件;将各所述采样输入数据作为目标输入数据;将所述目标输入数据以及所述目标标签数据作为所述目标样本数据。
7.一种模型训练方法,其特征在于,所述方法包括:利用权利要求1-6任一项数据获取方法获取多个目标样本数据;根据所述多个目标样本数据对初始模型进行迭代训练,得到目标模型,所述目标模型用于根据输入数据确定所述输入数据对应的标签数据。
8.一种数据获取装置,其特征在于,所述装置包括:获取模块,用于获取多个初始样本数据,所述初始样本数据包括输入数据序列以及所述输入数据序列对应的标签数据序列,所述输入数据序列与第一温度区间对应,所述标签数据序列与第二温度区间对应;所述初始样本数据包括电池的初始样本数据,所述初始样本数据为用户通过外部输入设备输入的;温度区间提取模块,用于针对一个所述初始样本数据,按照预设的样本扩充倍数分别对所述第一温度区间和所述第二温度区间进行温度区间提取,得到所述第一温度区间对应的多个第一温度子区间以及所述第二温度区间对应的多个第二温度子区间;根据各所述第一温度子区间对所述输入数据序列进行分割,得到与各所述第一温度子区间对应的多个输入数据序列片段,并根据各所述第二温度子区间对所述标签数据序列进行分割,得到与各所述第二温度子区间对应的多个标签数据序列片段;目标模块,用于根据所述多个第一温度子区间对各所述输入数据序列片段进行样本扩充处理,并根据所述多个第二温度子区间对各所述标签数据序列片段进行样本扩充处理,以得到多个目标样本数据;所述目标样本数据用于模型训练。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。



