Python|Python 基于datetime库的日期时间数据处理

背景 在数据处理过程中,多多少少都会和日期时间打交道,比如在分析数据时,一般需要求各年、各季度、各月、各周的销量等,这些基本都会涉及到日期时间,处理日期时间变量是躲不过的
在这里用的名词术语:日期时间,是一个整体
datetime库介绍 官方文档:https://docs.python.org/zh-cn/3/library/datetime.html
datetime包含的类:

  • class datetime.date
    日期
  • class datetime.time
    时间
  • class datetime.datetime
    日期和时间的结合
  • class datetime.timedelta
    两个时间之间的间隔
  • class datetime.tzinfo
    时区
  • class datetime.timezone
    tzinfo 的子类


这里主要介绍在工作中经常使用的:
  • class datetime.datetime--------日期时间
  • class datetime.timedelta--------时间间隔
常用函数、方法、属性
  • class datetime.datetime
  1. 获取当前时间,结果为:年、月、日、时、分、秒、微秒
    1 秒 = 1000毫秒(millisecond)
    1毫秒 = 1000微秒(microsecond)
In [1]: import datetimeIn [2]: datetime.datetime.now() Out[2]: datetime.datetime(2021, 1, 25, 16, 56, 56, 992611)In [3]: type(datetime.datetime.now()) Out[3]: datetime.datetime

  1. 用指定日期时间创建datetime
In [4]: datetime.datetime(2021,1,1,12,30,00) Out[4]: datetime.datetime(2021, 1, 1, 12, 30)In [5]: print(datetime.datetime(2021,1,1,12,30,00)) 2021-01-01 12:30:00

  1. 一般日志文件使用的格式
In [6]: dt=datetime.datetime.now().strftime('%Y%m%d%H%M%S')In [7]: dt Out[7]: '20210125171518'

一般创建日志文件代码:
import logging import datetime#日志记录 def get_logger(): dt=datetime.datetime.now().strftime('%Y%m%d%H%M%S') logger = logging.getLogger('model_main.py') logger.setLevel(level = logging.INFO) if not os.path.exists('./logs'): os.mkdir('./logs') handler = logging.FileHandler(f'./logs/{dt}_model_main.txt',encoding='utf-8') handler.setLevel(logging.INFO) formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s') handler.setFormatter(formatter) logger.addHandler(handler)return logger, handler

  1. 获取年、月、日等
In [8]: dt = datetime.datetime.now()In [9]: dt.year Out[9]: 2021In [11]: dt.month Out[11]: 1In [12]: dt.day Out[12]: 25In [13]: dt.hour Out[13]: 17In [14]: dt.minute Out[14]: 20In [15]: dt.microsecond Out[15]: 728805

  1. 解析字符串为日期
    strptime:string parse time
    官方的符号代表意义:
    https://docs.python.org/zh-cn/3/library/datetime.html#strftime-strptime-behavior
In [16]: datetime.datetime.strptime("1/25/2021 17:27:30","%m/%d/%Y %H:%M:%S") Out[16]: datetime.datetime(2021, 1, 25, 17, 27, 30)

  1. 把日期格式化为字符串
    strftime:string format time
    官方的符号代表意义(同上)
In [17]: dt = datetime.datetime.now()In [18]: dt Out[18]: datetime.datetime(2021, 1, 25, 17, 33, 25, 952250)In [19]: datetime.datetime.strftime(dt,"%Y-%m-%d %H:%M:%S") Out[19]: '2021-01-25 17:33:25'

  • class datetime.timedelta
    timedelta:time delta
    如果学过高等数学的话,那么对delta应该比较熟悉,代表间隔、增量
Delta是第四个希腊字母的读音,其大写为 Δ,小写为 δ。在数学或者物理学中大写的 Δ 用来表示增量符号。 而小写 δ 通常在高等数学中用于表示变量或者符号。

datetime.timedelta 只有 days, seconds 和 microseconds 会保留,其他的单位全部相应会转换为这三个,并且 days, seconds, microseconds 会经标准化处理以保证表达方式的唯一性:
0 <= microseconds < 1000000
0 <= seconds < 360024 (一天的秒数)*
-999999999 <= days <= 999999999
  1. 两个时间相减生成timedelta
In [20]: dt1 = datetime.datetime(2020,12,5,11,12,13)In [21]: dt2 = datetime.datetime(2021,1,15,12,30,31)In [22]: dt2 - dt1 Out[22]: datetime.timedelta(days=41, seconds=4698)

  1. 两个时间相隔的天数
    在数据分析中,有时业务要求前后半年时间内都算正常这样的需求,那么就可以用这种方式来解决
In [20]: dt1 = datetime.datetime(2020,12,5,11,12,13)In [21]: dt2 = datetime.datetime(2021,1,15,12,30,31)In [23]: dt_delta = dt1 - dt2In [24]: dt_delta Out[24]: datetime.timedelta(days=-42, seconds=81702)In [25]: dt_delta.days Out[25]: -42In [26]: abs(dt_delta.days) Out[26]: 42

  1. 用timedelta类来创建
In [27]: datetime.timedelta(days=50,seconds=27,microseconds=10,milliseconds=29000,minutes=5,hours=8,weeks=2) Out[27]: datetime.timedelta(days=64, seconds=29156, microseconds=10)In [28]: datetime.timedelta(10,10,10) Out[28]: datetime.timedelta(days=10, seconds=10, microseconds=10)

  1. 一个日期加上或减去timedelta增量
    一个时间点加上或减去一个timedelta增量结果还是一个时间点
In [29]: dt = datetime.datetime.now()In [30]: dt_delta = datetime.timedelta(days = 1)In [31]: dt + dt_delta Out[31]: datetime.datetime(2021, 1, 26, 18, 21, 30, 27141)In [32]: dt - dt_delta Out[32]: datetime.datetime(2021, 1, 24, 18, 21, 30, 27141)

历史相关文章
  • Python 字符串格式化方法总结
  • Python pandas 数据无法正常分列
【Python|Python 基于datetime库的日期时间数据处理】以上是自己实践中遇到的一些问题,分享出来供大家参考学习,欢迎关注微信公众号:DataShare ,不定期分享干货

    推荐阅读