使用python对数据进行计算分析,数据文件一般需要进行导入并处理为可直接使用的格式。
打开: 使用python的内置函数open(),会创建一个file对象。使用该对象的方法可以对文件进行操作。
file_object = open(file_name)
例如 file_object = open('E:\pythonProject\datingTestSet.txt')
对数据处理常使用的方法
读取: file.readlines(),无参数输入 功能:读取所有行并返回列表 该列表使用for...in...结构处理;
推荐学习《》
字符串处理:
移除:strip()方法,用于移除字符串头尾指定的字符;
语法:str.strip([chars]),chars为指定的字符,
返回新字符串。
分割:split()方法,根据指定分隔符对字符串进行分割。 语法:str.split(),默认为所有的空字符。包括空格,换行(\n),制表符(\t)
返回字符串的分割列表。
访问列表:列表索引从0开始,使用 方括号+索引 直接访问
例如 ...index = 0
for line in file_object.readlines(): # 依次读取每一行 line = line.strip() #去掉每行的头尾空白 list_from_line = line.split('\t') return_matrix[index,:] = lis_from_line[0:3] index +=1 file_object.close()