python|Python 数据处理

一、文件读写:
open():打开文件,第一个参数是打开文件的名称,第二个参数是读取的文件类型。
根据我们的读写需求的不同,第二参数主要分为:
’r':read,读
'w':write,写
close():关闭文件
write():写入文件

w.write('%s\t%s\n'%(a,b))


二、数据切割
split():str.split(str="",num=string.count(str))[n]
str:表示为分隔符,默认为空格,但是不能为空('')。若字符串中没有分隔符,则把整个字符串作为列表的一个元素
num:表示分割次数。如果存在参数num,则仅分隔成 num+1 个子字符串,并且每一个子字符串可以赋给新的变量
[n]:表示选取第n个分片
注意:当使用空格作为分隔符时,对于中间为空的项会自动忽略

三、计数查重
在对数据进行分隔处理之后,我们可以通过 字典 来对数据中指定字段出现的次数进行查重。例:
data=https://www.it610.com/article/['a','b','c','d']dict={}for i in data if i in dict dict[i]+=1 else: dict[i]=1

可以通过以下方式对字典的key和value值进行遍历
for key in dict print(key+' '+dict[key])


四、字符串拼接
字符串可以直接通过 + 号进行拼接
【python|Python 数据处理】https://github.com/Eilene/HMM-python

    推荐阅读