loadDataSet(解析每一行,并转化为float类型) Desc:该函数读取一个以 tab 键为分隔符的文件,然后将每行的内容保存成一组浮点数 Args: fileName 文件名 Returns: dataMat 每一行的数据集array类型 Raises:
(fileName)
| 14 | # 默认解析的数据是用tab分隔,并且是数值类型 |
| 15 | # general function to parse tab -delimited floats |
| 16 | def loadDataSet(fileName): |
| 17 | """loadDataSet(解析每一行,并转化为float类型) |
| 18 | Desc:该函数读取一个以 tab 键为分隔符的文件,然后将每行的内容保存成一组浮点数 |
| 19 | Args: |
| 20 | fileName 文件名 |
| 21 | Returns: |
| 22 | dataMat 每一行的数据集array类型 |
| 23 | Raises: |
| 24 | """ |
| 25 | # 假定最后一列是结果值 |
| 26 | # assume last column is target value |
| 27 | dataMat = [] |
| 28 | fr = open(fileName) |
| 29 | for line in fr.readlines(): |
| 30 | curLine = line.strip().split('\t') |
| 31 | # 将所有的元素转化为float类型 |
| 32 | # map all elements to float() |
| 33 | # map() 函数具体的含义,可见 https://my.oschina.net/zyzzy/blog/115096 |
| 34 | fltLine = map(float, curLine) |
| 35 | dataMat.append(fltLine) |
| 36 | return dataMat |
| 37 | |
| 38 | |
| 39 | def binSplitDataSet(dataSet, feature, value): |