MCPcopy Index your code
hub / github.com/Dod-o/Statistical-Learning-Method_Code / loadData

Function loadData

AdaBoost/AdaBoost.py:20–50  ·  view source on GitHub ↗

加载文件 :param fileName:要加载的文件路径 :return: 数据集和标签集

(fileName)

Source from the content-addressed store, hash-verified

18import numpy as np
19
20def loadData(fileName):
21 '''
22 加载文件
23 :param fileName:要加载的文件路径
24 :return: 数据集和标签集
25 '''
26 #存放数据及标记
27 dataArr = []; labelArr = []
28 #读取文件
29 fr = open(fileName)
30 #遍历文件中的每一行
31 for line in fr.readlines():
32 #获取当前行,并按“,”切割成字段放入列表中
33 #strip:去掉每行字符串首尾指定的字符(默认空格或换行符)
34 #split:按照指定的字符将字符串切割成每个字段,返回列表形式
35 curLine = line.strip().split(',')
36 #将每行中除标记外的数据放入数据集中(curLine[0]为标记信息)
37 #在放入的同时将原先字符串形式的数据转换为整型
38 #此外将数据进行了二值化处理,大于128的转换成1,小于的转换成0,方便后续计算
39 dataArr.append([int(int(num) > 128) for num in curLine[1:]])
40 #将标记信息放入标记集中
41 #放入的同时将标记转换为整型
42
43 #转换成二分类任务
44 #标签0设置为1,反之为-1
45 if int(curLine[0]) == 0:
46 labelArr.append(1)
47 else:
48 labelArr.append(-1)
49 #返回数据集和标记
50 return dataArr, labelArr
51
52def calc_e_Gx(trainDataArr, trainLabelArr, n, div, rule, D):
53 '''

Callers 1

AdaBoost.pyFile · 0.70

Calls

no outgoing calls

Tested by

no test coverage detected