一、文件读写:
open():打开文件,第一个参数是打开文件的名称,第二个参数是读取的文件类型。
根据我们的读写需求的不同,第二参数主要分为:
’r':read,读
'w':write,写
close():关闭文件
write():写入文件
w.write('%s\t%s\n'%(a,b))
二、数据切割
split():str.split(str="",num=string.count(str))[n]
str:表示为分隔符,默认为空格,但是不能为空('')。若字符串中没有分隔符,则把整个字符串作为列表的一个元素
num:表示分割次数。如果存在参数num,则仅分隔成 num+1 个子字符串,并且每一个子字符串可以赋给新的变量
[n]:表示选取第n个分片
注意:当使用空格作为分隔符时,对于中间为空的项会自动忽略
三、计数查重
在对数据进行分隔处理之后,我们可以通过 字典 来对数据中指定字段出现的次数进行查重。例:
data=https://www.it610.com/article/['a','b','c','d']dict={}for i in data
if i in dict
dict[i]+=1
else:
dict[i]=1
可以通过以下方式对字典的key和value值进行遍历
for key in dict
print(key+' '+dict[key])
四、字符串拼接
字符串可以直接通过 + 号进行拼接
【python|Python 数据处理】https://github.com/Eilene/HMM-python
推荐阅读
- 推荐系统论文进阶|CTR预估 论文精读(十一)--Deep Interest Evolution Network(DIEN)
- Python专栏|数据分析的常规流程
- Python|Win10下 Python开发环境搭建(PyCharm + Anaconda) && 环境变量配置 && 常用工具安装配置
- Python绘制小红花
- Pytorch学习|sklearn-SVM 模型保存、交叉验证与网格搜索
- OpenCV|OpenCV-Python实战(18)——深度学习简介与入门示例
- python|8. 文件系统——文件的删除、移动、复制过程以及链接文件
- 爬虫|若想拿下爬虫大单,怎能不会逆向爬虫,价值过万的逆向爬虫教程限时分享
- 分布式|《Python3网络爬虫开发实战(第二版)》内容介绍
- java|微软认真聆听了开源 .NET 开发社区的炮轰( 通过CLI 支持 Hot Reload 功能)