MCPcopy
hub / github.com/apachecn/ailearning / loadDataSet

Function loadDataSet

src/python/9.RegTrees/regTrees.py:16–36  ·  view source on GitHub ↗

loadDataSet(解析每一行,并转化为float类型) Desc:该函数读取一个以 tab 键为分隔符的文件,然后将每行的内容保存成一组浮点数 Args: fileName 文件名 Returns: dataMat 每一行的数据集array类型 Raises:

(fileName)

Source from the content-addressed store, hash-verified

14# 默认解析的数据是用tab分隔,并且是数值类型
15# general function to parse tab -delimited floats
16def loadDataSet(fileName):
17 """loadDataSet(解析每一行,并转化为float类型)
18 Desc:该函数读取一个以 tab 键为分隔符的文件,然后将每行的内容保存成一组浮点数
19 Args:
20 fileName 文件名
21 Returns:
22 dataMat 每一行的数据集array类型
23 Raises:
24 """
25 # 假定最后一列是结果值
26 # assume last column is target value
27 dataMat = []
28 fr = open(fileName)
29 for line in fr.readlines():
30 curLine = line.strip().split('\t')
31 # 将所有的元素转化为float类型
32 # map all elements to float()
33 # map() 函数具体的含义,可见 https://my.oschina.net/zyzzy/blog/115096
34 fltLine = map(float, curLine)
35 dataMat.append(fltLine)
36 return dataMat
37
38
39def binSplitDataSet(dataSet, feature, value):

Callers 1

regTrees.pyFile · 0.70

Calls 1

mapFunction · 0.85

Tested by

no test coverage detected