Function loadDataSet

src/python/9.RegTrees/regTrees.py:16–36 · view source on GitHub ↗

loadDataSet(解析每一行，并转化为float类型) Desc：该函数读取一个以 tab 键为分隔符的文件，然后将每行的内容保存成一组浮点数 Args: fileName 文件名 Returns: dataMat 每一行的数据集array类型 Raises:

(fileName)

Source from the content-addressed store, hash-verified

14	# 默认解析的数据是用tab分隔，并且是数值类型
15	# general function to parse tab -delimited floats
16	def loadDataSet(fileName):
17	"""loadDataSet(解析每一行，并转化为float类型)
18	Desc：该函数读取一个以 tab 键为分隔符的文件，然后将每行的内容保存成一组浮点数
19	Args:
20	fileName 文件名
21	Returns:
22	dataMat 每一行的数据集array类型
23	Raises:
24	"""
25	# 假定最后一列是结果值
26	# assume last column is target value
27	dataMat = []
28	fr = open(fileName)
29	for line in fr.readlines():
30	curLine = line.strip().split('\t')
31	# 将所有的元素转化为float类型
32	# map all elements to float()
33	# map() 函数具体的含义，可见 https://my.oschina.net/zyzzy/blog/115096
34	fltLine = map(float, curLine)
35	dataMat.append(fltLine)
36	return dataMat
37
38
39	def binSplitDataSet(dataSet, feature, value):

regTrees.pyFile · 0.70

mapFunction · 0.85

no test coverage detected