python身份验证函数 python身份验证程序

python中输入身份证用-将日期连接起来首先要输入年月日python身份验证函数,输入数据python身份验证函数,一般用input函数Python中有datetimepython身份验证函数的模块 。
._份证号第17位对应性别python身份验证函数,偶数—_奇数----男 。
18位身份证号码python身份验证函数:第7、8、9、10位为出生年份(四位数),第11、第12位为出生月份,第13、14位代表出生日期 。
python身份证号换成***最近工作中刚好要清洗一批客户数据,涉及到身份证号码15位和18位的转换,特意研究了下,在这里分享下 。
身份证号码的构成
既然谈到了身份证转换,那就需要先了解下证件号码的构成 。
公民身份号码是特征组合码 , 由 十七位数字本体码 和 一位数字校验码 组成;
排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码 。
六位数字地址码:表示编码对象常住户口所在县(市、旗、区)的行政区划代码,按GB/T 2260 的规定执行 。
八位数字出生日期码:表示编码对象出生的年、月、日,按 GB/T 7408 的规定执行 。年、月、日代码之间不用分隔符 。某人出生日期为 1995年08月12日,其出生日期码为 19950812 。
三位顺序码:表示在同一地址码所标识的区域范围内,对同年、同月、同日出生的人编定的顺序号,顺序码的奇数分配给男性,偶数分配给女性 。
一位校验码:校验码按照 ISO 7064:1983.MOD 11-2校验码计算出来的检验码 。
校验码计算方法
1、将前面的身份证号码17位数分别乘以不同的系数 。从第一位到第十七位的系数分别为: 7 9 10 5 8 4 2 1 6 3 7 9 10 5 8 4 2 ;
2、将这17位数字和系数相乘的结果相加;
3、用加出来和除以11,看余数是多少;
4、余数只可能有0 1 2 3 4 5 6 7 8 9 10这11个数字 。其分别对应的最后一位身份证的号码为 1 0 X 9 8 7 6 5 4 3 2 ;
5、通过上面得知如果余数是2,就会在身份证的第18位数字上出现罗马数字的X 。
解决思路
15位转18位:即身份证号码的前六位数字'19'身份证第六位以后的数字校验码
(不要问我为什么加19这种白痴(′⊙ω⊙`) @?¥?的问题,当然是因为只有19世纪的人才可能拥有15位的身份证号啦)
校验码计算方法就更简单了 , 将这17位数字和系数相乘的结果相加除以11匹配余数对应的号码即可 。
注意:代码中我用了几个变量,在这里拆解讲解下 。
Ai: 表示第i位置上的身份证号码数字值 Wi: 表示第i位置上的加权因子 Wi: 7 9 10 5 8 4 2 1 6 3 7 9 10 5 8 4 2
十七位数字本体码加权求和公式: S = Sum(AiWi), i = 0, … , 16 ,先对前17位数字的权求和
计算模 Y = mod(S, 11)
通过模得到对应的校验码
Y: 0 1 2 3 4 5 6 7 8 9 10
校验码: 1 0 X 9 8 7 6 5 4 3 2
OK,分析的差不多了 , 直接看代码 。
怎么用代码实现?
# encoding: utf-8
"""
CREATED ON 19-11-05
@AUTHOR: XUSL
"""
WI = [7, 9, 10, 5, 8, 4, 2, 1, 6, 3, 7, 9, 10, 5, 8, 4, 2, 1, ]
VI = [1, 0, 'X', 9, 8, 7, 6, 5, 4, 3, 2, ]
DEF GET_VERITY(EIGHTEEN_CARD):
"""
:PARAM EIGHTEEN_CARD:
:RETURN:
"""
AI = []
REMAINING = ''
IF LEN(EIGHTEEN_CARD) == 18:
EIGHTEEN_CARD = EIGHTEEN_CARD[0:-1]
IF LEN(EIGHTEEN_CARD) == 17:
S = 0
FOR I IN EIGHTEEN_CARD:
AI.APPEND(INT(I))
FOR I IN RANGE(17):
S = SWI[I] * AI[I]
REMAINING = S % 11
RETURN 'X' IF REMAINING == 2 ELSE STR(VI[REMAINING])
DEF UP_TO_EIGHTEEN(FIFTEEN_CARD):
"""
15位转18位
:PARAM FIFTEEN_CARD:
:RETURN:
"""
EIGHTEEN_CARD = FIFTEEN_CARD[0:6]'19'FIFTEEN_CARD[6:15]
RETURN EIGHTEEN_CARDGET_VERITY(EIGHTEEN_CARD)
DEF DOWN_TO_FIFTEEN(EIGHTEEN_CARD):
"""
18位转15位
:PARAM EIGHTEEN_CARD:
:RETURN:
"""
RETURN EIGHTEEN_CARD[0:6]EIGHTEEN_CARD[8:17]
IF __NAME__ == '__MAIN__':
# 15位转18位
CARD_1 = UP_TO_EIGHTEEN('632123820927051')
PRINT(CARD_1)
# 18位转15位
CARD_2 = DOWN_TO_FIFTEEN('410125199908222000')
PRINT(CARD_2)
当然,这只是个小功能,主要还是想分享下代码 , 如果有同样的处理可以直接用 。
总结
以上所述是小编给大家介绍的使用Python完成15位18位身份证的互转功能 , 希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的 。在此也非常感谢大家对脚本之家网站的支持!
如何利用Python做简单的验证码识别1摘要
验证码是目前互联网上非常常见也是非常重要的一个事物,充当着很多系统的 防火墙 功能 , 但是随时OCR技术的发展 , 验证码暴露出来的安全问题也越来越严峻 。本文介绍了一套字符验证码识别的完整流程,对于验证码安全和OCR识别技术都有一定的借鉴意义 。
然后经过了一年的时间,笔者又研究和get到了一种更强大的基于CNN卷积神经网络的直接端到端的验证识别技术(文章不是我的,然后我把源码整理了下,介绍和源码在这里面):
基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)
2关键词
关键词:安全,字符图片,验证码识别,OCR,Python,SVM,PIL
3免责声明
本文研究所用素材来自于某旧Web框架的网站 完全对外公开 的公共图片资源 。
本文只做了该网站对外公开的公共图片资源进行了爬取,并未越权 做任何多余操作 。
本文在书写相关报告的时候已经 隐去 漏洞网站的身份信息 。
本文作者 已经通知 网站相关人员此系统漏洞,并积极向新系统转移 。
本报告的主要目的也仅是用于 OCR交流学习 和引起大家对 验证安全的警觉。
4引言
关于验证码的非技术部分的介绍,可以参考以前写的一篇科普类的文章:
互联网安全防火墙(1)--网络验证码的科普
里面对验证码的种类,使用场景,作用,主要的识别技术等等进行了讲解,然而并没有涉及到任何技术内容 。本章内容则作为它的 技术补充 来给出相应的识别的解决方案,让读者对验证码的功能及安全性问题有更深刻的认识 。
5基本工具
要达到本文的目的 , 只需要简单的编程知识即可 , 因为现在的机器学习领域的蓬勃发展 , 已经有很多封装好的开源解决方案来进行机器学习 。普通程序员已经不需要了解复杂的数学原理,即可以实现对这些工具的应用了 。
主要开发环境:
python3.5
python SDK版本
PIL
图片处理库
libsvm
开源的svm机器学习库
关于环境的安装,不是本文的重点,故略去 。
6基本流程
一般情况下,对于字符型验证码的识别流程如下:
准备原始图片素材
图片预处理
图片字符切割
图片尺寸归一化
图片字符标记
字符图片特征提取
生成特征和标记对应的训练数据集
训练特征标记数据生成识别模型
使用识别模型预测新的未知图片集
达到根据“图片”就能返回识别正确的字符集的目标
7素材准备
7.1素材选择
由于本文是以初级的学习研究目的为主,要求 “有代表性,但又不会太难” ,所以就直接在网上找个比较有代表性的简单的字符型验证码(感觉像在找漏洞一样) 。
最后在一个比较旧的网站(估计是几十年前的网站框架)找到了这个验证码图片 。
原始图:
放大清晰图:
此图片能满足要求,仔细观察其具有如下特点 。
有利识别的特点 :
由纯阿拉伯数字组成
字数为4位
字符排列有规律
字体是用的统一字体
以上就是本文所说的此验证码简单的重要原因,后续代码实现中会用到
不利识别的特点 :
图片背景有干扰噪点
这虽然是不利特点,但是这个干扰门槛太低,只需要简单的方法就可以除去
7.2素材获取
由于在做训练的时候 , 需要大量的素材,所以不可能用手工的方式一张张在浏览器中保存 , 故建议写个自动化下载的程序 。
主要步骤如下:
通过浏览器的抓包功能获取随机图片验证码生成接口
批量请求接口以获取图片
将图片保存到本地磁盘目录中
这些都是一些IT基本技能,本文就不再详细展开了 。
关于网络请求和文件保存的代码,如下:
def downloads_pic(**kwargs):
pic_name = kwargs.get('pic_name', None)
url = 'httand_code_captcha/'
res = requests.get(url, stream=True)
with open(pic_pathpic_name '.bmp', 'wb') as f:for chunk in res.iter_content(chunk_size=1024):if chunk:# filter out keep-alive new chunksf.write(chunk)
f.flush()
f.close()
循环执行N次,即可保存N张验证素材了 。
下面是收集的几十张素材库保存到本地文件的效果图:
8图片预处理
虽然目前的机器学习算法已经相当先进了,但是为了减少后面训练时的复杂度,同时增加识别率 , 很有必要对图片进行预处理,使其对机器识别更友好 。
针对以上原始素材的处理步骤如下:
读取原始图片素材
将彩色图片二值化为黑白图片
去除背景噪点
8.1二值化图片
主要步骤如下:
将RGB彩图转为灰度图
将灰度图按照设定阈值转化为二值图
image = Image.open(img_path)
imgry = image.convert('L')# 转化为灰度图table = get_bin_table()
out = imgry.point(table, '1')
上面引用到的二值函数的定义如下:
1234567891011121314def get_bin_table(threshold=140):"""获取灰度转二值的映射table:param threshold::return:"""table = []for i in range(256):if ithreshold:table.append(0)else:table.append(1)return table
由PIL转化后变成二值图片:0表示黑色,1表示白色 。二值化后带噪点的 6937 的像素点输出后如下图:
1111000111111000111111100001111100000011
1110111011110111011111011110111100110111
1001110011110111101011011010101101110111
1101111111110110101111110101111111101111
1101000111110111001111110011111111101111
1100111011111000001111111001011111011111
1101110001111111101011010110111111011111
1101111011111111101111011110111111011111
1101111011110111001111011110111111011100
1110000111111000011101100001110111011111
如果你是近视眼,然后离屏幕远一点,可以隐约看到 6937 的骨架了 。
8.2去除噪点
在转化为二值图片后,就需要清除噪点 。本文选择的素材比较简单,大部分噪点也是最简单的那种 孤立点,所以可以通过检测这些孤立点就能移除大量的噪点 。
关于如何去除更复杂的噪点甚至干扰线和色块,有比较成熟的算法: 洪水填充法 Flood Fill ,后面有兴趣的时间可以继续研究一下 。
本文为了问题简单化,干脆就用一种简单的自己想的 简单办法 来解决掉这个问题:
对某个 黑点 周边的九宫格里面的黑色点计数
如果黑色点少于2个则证明此点为孤立点,然后得到所有的孤立点
对所有孤立点一次批量移除 。
下面将详细介绍关于具体的算法原理 。
将所有的像素点如下图分成三大类
顶点A
非顶点的边界点B
内部点C
种类点示意图如下:
其中:
A类点计算周边相邻的3个点(如上图红框所示)
B类点计算周边相邻的5个点(如上图红框所示)
C类点计算周边相邻的8个点(如上图红框所示)
当然,由于基准点在计算区域的方向不同 , A类点和B类点还会有细分:
A类点继续细分为:左上,左下 , 右上,右下
B类点继续细分为:上,下,左,右
C类点不用细分
然后这些细分点将成为后续坐标获取的准则 。
主要算法的python实现如下:
def sum_9_region(img, x, y):"""
9邻域框,以当前点为中心的田字框,黑点个数
:param x:
:param y:
:return:"""
# todo 判断图片的长宽度下限
cur_pixel = img.getpixel((x, y))# 当前像素点的值
width = img.width
height = img.heightif cur_pixel == 1:# 如果当前点为白色区域,则不统计邻域值
return 0if y == 0:# 第一行
if x == 0:# 左上顶点,4邻域
# 中心点旁边3个点
sum = cur_pixel \img.getpixel((x, y1)) \img.getpixel((x1, y)) \img.getpixel((x1, y1))return 4 - sumelif x == width - 1:# 右上顶点
sum = cur_pixel \img.getpixel((x, y1)) \img.getpixel((x - 1, y)) \img.getpixel((x - 1, y1))return 4 - sumelse:# 最上非顶点,6邻域
sum = img.getpixel((x - 1, y)) \img.getpixel((x - 1, y1)) \cur_pixel \img.getpixel((x, y1)) \img.getpixel((x1, y)) \img.getpixel((x1, y1))return 6 - sumelif y == height - 1:# 最下面一行
if x == 0:# 左下顶点
# 中心点旁边3个点
sum = cur_pixel \img.getpixel((x1, y)) \img.getpixel((x1, y - 1)) \img.getpixel((x, y - 1))return 4 - sumelif x == width - 1:# 右下顶点
sum = cur_pixel \img.getpixel((x, y - 1)) \img.getpixel((x - 1, y)) \img.getpixel((x - 1, y - 1))return 4 - sumelse:# 最下非顶点,6邻域
sum = cur_pixel \img.getpixel((x - 1, y)) \img.getpixel((x1, y)) \img.getpixel((x, y - 1)) \img.getpixel((x - 1, y - 1)) \img.getpixel((x1, y - 1))return 6 - sumelse:# y不在边界
if x == 0:# 左边非顶点
sum = img.getpixel((x, y - 1)) \cur_pixel \img.getpixel((x, y1)) \img.getpixel((x1, y - 1)) \img.getpixel((x1, y)) \img.getpixel((x1, y1))return 6 - sumelif x == width - 1:# 右边非顶点
# print('%s,%s' % (x, y))
sum = img.getpixel((x, y - 1)) \cur_pixel \img.getpixel((x, y1)) \img.getpixel((x - 1, y - 1)) \img.getpixel((x - 1, y)) \img.getpixel((x - 1, y1))return 6 - sumelse:# 具备9领域条件的
sum = img.getpixel((x - 1, y - 1)) \img.getpixel((x - 1, y)) \img.getpixel((x - 1, y1)) \img.getpixel((x, y - 1)) \cur_pixel \img.getpixel((x, y1)) \img.getpixel((x1, y - 1)) \img.getpixel((x1, y)) \img.getpixel((x1, y1))return 9 - sum
Tips:这个地方是相当考验人的细心和耐心程度了,这个地方的工作量还是蛮大的,花了半个晚上的时间才完成的 。
计算好每个像素点的周边像素黑点(注意:PIL转化的图片黑点的值为0)个数后 , 只需要筛选出个数为 1或者2 的点的坐标即为 孤立点。这个判断方法可能不太准确 , 但是基本上能够满足本文的需求了 。
【python身份验证函数 python身份验证程序】经过预处理后的图片如下所示:
对比文章开头的原始图片,那些 孤立点 都被移除掉 , 相对比较 干净 的验证码图片已经生成 。
9图片字符切割
由于字符型 验证码图片 本质就可以看着是由一系列的 单个字符图片 拼接而成,为了简化研究对象,我们也可以将这些图片分解到 原子级 ,即: 只包含单个字符的图片 。
于是 , 我们的研究对象由 “N种字串的组合对象” 变成 “10种阿拉伯数字” 的处理,极大的简化和减少了处理对象 。
9.1分割算法
现实生活中的字符验证码的产生千奇百怪,有各种扭曲和变形 。关于字符分割的算法,也没有很通用的方式 。这个算法也是需要开发人员仔细研究所要识别的字符图片的特点来制定的 。
当然,本文所选的研究对象尽量简化了这个步骤的难度,下文将慢慢进行介绍 。
使用图像编辑软件(PhoneShop或者其它)打开验证码图片,放大到像素级别,观察其它一些参数特点:
可以得到如下参数:
整个图片尺寸是 40*10
单个字符尺寸是 6*10
左右字符和左右边缘相距2个像素
字符上下紧挨边缘(即相距0个像素)
这样就可以很容易就定位到每个字符在整个图片中占据的像素区域 , 然后就可以进行分割了,具体代码如下:
def get_crop_imgs(img):"""
按照图片的特点,进行切割,这个要根据具体的验证码来进行工作. # 见原理图
:param img:
:return:"""
child_img_list = []for i in range(4):
x = 2i * (64)# 见原理图
y = 0
child_img = img.crop((x, y, x6, y10))
child_img_list.append(child_img)return child_img_list
然后就能得到被切割的 原子级 的图片元素了:
9.2内容小结
基于本部分的内容的讨论,相信大家已经了解到了,如果验证码的干扰(扭曲 , 噪点,干扰色块,干扰线……)做得不够强的话,可以得到如下两个结论:
4位字符和40000位字符的验证码区别不大
纯字母
不区分大小写 。分类数为26
区分大小写 。分类数为52
纯数字 。分类数为10
数字和区分大小写的字母组合 。分类数为62
纯数字 和 数字及字母组合 的验证码区别不大
在没有形成 指数级或者几何级 的难度增加,而只是 线性有限级 增加计算量时 , 意义不太大 。
10尺寸归一
本文所选择的研究对象本身尺寸就是统一状态:6*10的规格,所以此部分不需要额外处理 。但是一些进行了扭曲和缩放的验证码,则此部分也会是一个图像处理的难点 。
11模型训练步骤
在前面的环节,已经完成了对单个图片的处理和分割了 。后面就开始进行 识别模型 的训练了 。
整个训练过程如下:
大量完成预处理并切割到原子级的图片素材准备
对素材图片进行人为分类 , 即:打标签
定义单张图片的识别特征
使用SVM训练模型对打了标签的特征文件进行训练,得到模型文件
12素材准备
本文在训练阶段重新下载了同一模式的4数字的验证图片总计:3000张 。然后对这3000张图片进行处理和切割,得到12000张原子级图片 。
在这12000张图片中删除一些会影响训练和识别的强干扰的干扰素材,切割后的效果图如下:
13素材标记
由于本文使用的这种识别方法中,机器在最开始是不具备任何 数字的观念的 。所以需要人为的对素材进行标识,告诉 机器什么样的图片的内容是 1…… 。
这个过程叫做 “标记” 。
具体打标签的方法是:
为0~9每个数字建立一个目录 , 目录名称为相应数字(相当于标签)
人为判定 图片内容 , 并将图片拖到指定数字目录中
每个目录中存放100张左右的素材
一般情况下 , 标记的素材越多 , 那么训练出的模型的分辨能力和预测能力越强 。例如本文中 , 标记素材为十多张的时候,对新的测试图片识别率基本为零,但是到达100张时,则可以达到近乎100%的识别率
14特征选择
对于切割后的单个字符图片,像素级放大图如下:
从宏观上看,不同的数字图片的本质就是将黑色按照一定规则填充在相应的像素点上,所以这些特征都是最后围绕像素点进行 。
字符图片 宽6个像素,高10个像素,理论上可以最简单粗暴地可以定义出60个特征:60个像素点上面的像素值 。但是显然这样高维度必然会造成过大的计算量 , 可以适当的降维 。
通过查阅相应的文献 [2] , 给出另外一种简单粗暴的特征定义:
每行上黑色像素的个数 , 可以得到10个特征
每列上黑色像素的个数,可以得到6个特征
最后得到16维的一组特征,实现代码如下:
def get_feature(img):"""
获取指定图片的特征值,
1. 按照每排的像素点,高度为10,则有10个维度,然后为6列,总共16个维度
:param img_path:
:return:一个维度为10(高度)的列表"""
width, height = img.size
pixel_cnt_list = []
height = 10for y in range(height):
pix_cnt_x = 0for x in range(width):if img.getpixel((x, y)) == 0:# 黑色点
pix_cnt_x= 1
pixel_cnt_list.append(pix_cnt_x)for x in range(width):
pix_cnt_y = 0for y in range(height):if img.getpixel((x, y)) == 0:# 黑色点
pix_cnt_y= 1
pixel_cnt_list.append(pix_cnt_y)return pixel_cnt_list
然后就将图片素材特征化 , 按照 libSVM 指定的格式生成一组带特征值和标记值的向量文
用Python校验身份证号码真伪#这个算法都给了,应该比较简单吧 。我也很菜,随意写了一个 。异常没做,你可以自##己加一下 。做一些验证过滤 。不知道随机是不是真是随意随机,我没有按照身份证规##则做随机 。是真的随机了18位 。。。如果你有规则,也可以自己写一个 。
import random
yushu=[x for x in range(0,11)]
ma=['1','0','X','9','8','7','6','5','4','3','2','1']
def yanzheng(nid):
dicma=dict(zip(yushu,ma))
sum=0
for x,y in enumerate(nid[:-1]):
sum =((2**(18-x-1)))*int(y) #17位对应系数相乘的和
if nid[-1]==dicma[sum]: #校验码对照
return '%s True'%nid
else:
return '%s False'%nid
def readfile(fname):
f=open(fname,'rb')
for line in f.readlines():
printyanzheng(line.strip())
f.close()
def randnum():
idstr=''
for i in range(17): #前17位随机
idstr =str(random.randint(0,9))
idstr =random.choice(ma) #最后一位从列表种随意一个,因为有X
return idstr
if __name__=="__main__":
nid=raw_input('Please enter your ID: ') #用户输入ID,没做任何验证
print yanzheng(nid)#验证身份证
readfile('id.txt')#从文件读出来 再验证
print yanzheng(randnum())#随机一个 在验证
Python数据验证库(一) validators 很多时候我们的程序会接收来自外部的数据python身份验证函数,但是我们不能确保接收的数据是我们期待的数据,这时可能需要对数据进行一些验证 。比如,在做接口测试时,我们发送http请求,会受到服务器的应答信息,这时需要对接收的数据进行检查,判断是否符合预期 。
这里介绍一个简单的数据验证库 validators ,后续还会介绍其他的数据验证库 。
python有很多数据验证工具,但是其他的数据验证工具都需要自己定义模式 。validators是一个简单的数据验证库,当验证一个简单的值时,不需要定义一个表单或模式 。
目前 validators 支持python版本2.7, 3.3, 3.4, 3.5 和PyPy
在validators中每一个validator是一个简单的函数,函数参数为要验证的值,一些函数可能有额外的关键字参数 。对于每一个函数,如果验证成功,则返回 True ;若验证失败,则返回一个 ValidationFailure 对象 。
验证一个数字 value 是否在最小值 min 和最大值 max 之间,value 不仅仅可以是整数,也可以是其它数据类型,例如floats, decimals 和 dates.
Parameters:
? min – The minimum required value of the number. If not provided, minimum value will not be checked.
? max – The maximum value of the number. If not provided, maximum value will not be checked.
验证 value 是否是一个有效域 。如果 value 是一个有效域名,函数返回 True , 否则返回ValidationFailure .
也支持国际化域名(IDN domain),例如python身份验证函数:
验证是否是合法的邮件地址,如果是 , 函数返回 True , 否则返回ValidationFailure .
验证是否是合法的国际银行账户号码,如果是,函数返回 True , 否则返回ValidationFailure .
验证是否是合法的ipv4地址,如果是,函数返回 True , 否则返回ValidationFailure .
验证是否是合法的ipv6地址,如果是 , 函数返回 True , 否则返回ValidationFailure .
验证给定的字符串长度是否在指定范围内 。
验证是否是合法的mac地址,如果是,函数返回 True , 否则返回ValidationFailure .
验证是否是合法的slug , 如果是,函数返回 True , 否则返回ValidationFailure .
验证是否是合法的url , 如果是,函数返回 True , 否则返回ValidationFailure .
Parameters:
? value – 要验证的url
? public – (default=False) Set True to only allow a public IP address
验证Finnish Business ID.
验证Finnish Social Security Number.
class validators.utils.ValidationFailure(func, args)
validators.utils.validator(func, *args, **kwargs)
例python身份验证函数:
控制台输出结果:
下一篇:Python数据验证库(二)validator
关于python身份验证函数和python身份验证程序的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站 。

    推荐阅读