爬虫笔记(九)|爬虫笔记(九) - 编码问题的总结

当你看到这个标题,你首先要搞清楚2件事:

  1. 你是用的是什么操作系统:Linux?Windows?
  2. 你是用的是哪个Python的版本:Python2? Python3?
【爬虫笔记(九)|爬虫笔记(九) - 编码问题的总结】除了这两个,你还要看下你使用的IDE Pycharm。好了直接进入正题,首选看一下各种查编码的方法
编码查询 Windows
Microsoft Windows [版本 6.1.7601] 版权所有 (c) 2009 Microsoft Corporation。保留所有权利。C:\Users\administrator>CHCP 活动代码页: 936

在CMD下面直接执行CHCP即可,也可以通过CMD属性栏查询,如下图

爬虫笔记(九)|爬虫笔记(九) - 编码问题的总结
文章图片
image.png Linux
root@debian symctltest # cat /etc/locale.gen | grep en_US # en_US ISO-8859-1 # en_US.ISO-8859-15 ISO-8859-15 en_US.UTF-8 UTF-8 # en_US.UTF-8 UTF-8root@debian symctltest # echo $LANG en_US.UTF-8

目前我所使用的是一台debian 8 的Linux系统。默认的语言编码在/etc/locale.gen,可以通过echo $LANG来查询,如下图

爬虫笔记(九)|爬虫笔记(九) - 编码问题的总结
文章图片
image.png IDE Python2
>>> import sys >>> sys.getdefaultencoding() 'ascii'

爬虫笔记(九)|爬虫笔记(九) - 编码问题的总结
文章图片
image.png IDE Python3
>>> import sys >>> sys.getdefaultencoding() 'utf-8'

爬虫笔记(九)|爬虫笔记(九) - 编码问题的总结
文章图片
image.png

    推荐阅读