php小编新一为您介绍如何在时间范围内标准化数组的元素。在开发中,我们经常需要处理时间序列数据,而这些数据可能会出现时间跳跃或者缺失的情况。为了保证数据的准确性和完整性,我们需要对数组中的元素进行标准化。标准化可以使数组的元素按照时间顺序排列,并填充缺失的时间点。下面,我们将详细介绍如何实现这一功能。
问题内容
我正在尝试标准化一个时间范围内的元素数组。假设您有 20 笔银行交易发生在 2022 年 1 月 1 日
transaction 1 - 2022/01/01transaction 2 - 2022/01/01...transaction 20 - 2022/01/01
登录后复制
除了它们发生的日期之外,我们没有其他数据,但我们仍然希望为它们分配一天中的一个小时,因此它们结束为:
transaction 1 - 2022/01/01 00:00transaction 2 - 2022/01/01 ??:??...transaction 20 - 2022/01/01 23:59
登录后复制
在 go 中,我有一个函数尝试计算元素数组中索引的一天中某个时间的标准化:
func normal(start, end time.time, arraysize, index float64) time.time { delta := end.sub(start) minutes := delta.minutes() duration := minutes * ((index+1) / arraysize) return start.add(time.duration(duration) * time.minute)}
登录后复制
但是,我在 2022/1/1 00:00 到 2022/1/1 23:59 的时间范围内意外计算出 4 个元素数组中索引 0 的 2022/1/1 05:59 ,相反,我希望看到 2022/1/1 00:00。在这些条件下唯一能正常工作的是索引 3。
那么,我的标准化做错了什么?
编辑:
这是由 @icza 修复的函数
func timeindex(min, max time.time, entries, position float64) time.time { delta := max.sub(min) minutes := delta.minutes() if position有一个例子:假设我们的开始和结束日期是 2022/01/01 00:00 - 2022/01/01 00:03,我们的银行交易数组中有 3 个条目,我们希望获取第 3 号交易的标准化时间(数组中的 2):
result := timeindex(time.date(2022, time.january, 1, 0, 0, 0, 0, time.utc), time.date(2022, time.january, 1, 0, 3, 0, 0, time.utc), 3, 2)登录后复制
由于开始时间和结束时间之间只有 4 分钟(从 00:00 到 00:03),并且想要查找数组(大小 3)中最后一个条目(索引 2)的标准化时间,结果应该是:
fmt.Printf("%t", result.Equal(time.Date(2022, time.January, 1, 0, 3, 0, 0, time.UTC))// prints "true"登录后复制
或范围内的最后一分钟,即 00:03。
这是一个可重现的示例:https://go.dev/play/p/ezwkqanv1at
解决方法
在 n 点之间有 n-1 段。这意味着,如果您想在插值中包含 start 和 end,则时间段数(即 delta)为 arraysize - 1。
此外,如果将 1 添加到 index,则结果不可能是 start (您将跳过 00:00)。
所以正确的算法是这样的:
func normal(start, end time.time, arraysize, index float64) time.time { minutes := end.sub(start).minutes() duration := minutes * (index / (arraysize - 1)) return start.add(time.duration(duration) * time.minute)}登录后复制
在 go playground 上尝试一下。
另请注意,如果您有很多交易(按照一天中的分钟数排列,大约一千次),您可能很容易最终会出现多个具有相同时间戳(相同小时和分钟)的交易。如果您想避免这种情况,请使用比分钟更小的精度,例如秒或毫秒:
func normal(start, end time.time, arraysize, index float64) time.time { sec := end.sub(start).seconds() duration := sec * (index / (arraysize - 1)) return start.add(time.duration(duration) * time.second)}登录后复制
是的,这将导致时间戳的秒数也不一定为零,但将确保更高的交易数量具有不同的、唯一的时间戳。
如果您的交易数量级接近一天的秒数(即 86400),那么您可以完全删除此“单位”并使用 time.duration 本身(即纳秒)。即使对于最大数量的事务,这也将保证时间戳的唯一性:
func normal(start, end time.time, arraysize, index float64) time.time { delta := float64(end.sub(start)) duration := delta * (index / (arraysize - 1)) return start.add(time.duration(duration))}登录后复制
用 100 万笔交易对此进行测试,以下是前 15 个时间部分(它们仅在亚秒部分延迟):
0 - 00:00:00.000001 - 00:00:00.086342 - 00:00:00.172683 - 00:00:00.259024 - 00:00:00.345365 - 00:00:00.431706 - 00:00:00.518047 - 00:00:00.604388 - 00:00:00.690729 - 00:00:00.7770610 - 00:00:00.8634011 - 00:00:00.9497412 - 00:00:01.0360813 - 00:00:01.1224214 - 00:00:01.2087615 - 00:00:01.2951016 - 00:00:01.3814417 - 00:00:01.4677818 - 00:00:01.5541219 - 00:00:01.64046登录后复制
在 go playground 上尝试一下这个。
以上就是如何标准化时间范围内数组的元素?的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2359051.html