数据挖掘-数据预处理 发表于 2018-11-08 | 分类于 数据挖掘 | 阅读次数: 字数统计: 3,613 | 阅读时长 ≈ 14 数据预处理的主要步骤包括数据清理、数据集成、数据归约和数据变换。数据清理可以用来清除数据中的噪声,纠正不一致。数据集成将数据由多个数据源合并成一个一致的数据存储,如数据仓库。数据归约可以通过如聚集、删除冗余特征或聚类来降低数据的规模。数据变换(如规范化)可以用来把数据压缩到较小的区间,如0.0到1. ... 阅读全文 »
Data mining chap 1 发表于 2018-11-08 | 阅读次数: 字数统计: 339 | 阅读时长 ≈ 2 Knowledge discovery (KDD) ProcessA view from database system Data cleaning 数据清洗:去除噪声和不一致数据 Data integration 数据集成:合并多数据源 Data selection 数据选择:选择与任务相关的数据 ... 阅读全文 »
决策树 发表于 2018-10-30 | 分类于 统计机器学习 | 阅读次数: 字数统计: 2,838 | 阅读时长 ≈ 13 理论什么是决策树?决策树内部节点表示一个特征或属性,叶节点表示一个类,进行分类时,从根节点开始,对实例的某一特征进行测试,根据测试结果,将实例分配到其子节点,这时每一个子节点对应着该特征的一个取值,如此递归地对实例进行测试并分配,直至到达叶节点,最后将实例分到叶节点地类中。可以将决策树看成一个if- ... 阅读全文 »
4-3 Keras Tutorial 发表于 2018-10-25 | 分类于 深度学习习题 | 阅读次数: 字数统计: 65 | 阅读时长 ≈ 1 np.expand_dims:用于扩展数组的形状1234567891011121314>>> x = np.array([1,2])>>> x.shape(2,)>>> y = np.expand_dims(x, axis=0)>>& ... 阅读全文 »
幸福之路 发表于 2018-10-19 | 阅读次数: 字数统计: 1,853 | 阅读时长 ≈ 6 一、什么使人不快乐对自己和自己的缺陷不再耿耿于怀,而对外界的事物一天天的集中自己的注意。对外界的关切也会有个别的烦恼带给你,但这一类的痛苦,不像憎恨自己而发生的痛苦那样,会破坏人生的主要品质。再则,每种对外的兴趣,都有多少活动分配给你;而兴趣活泼地存在多久,这活动就能把苦闷阻遏到多久。相反地,对自己 ... 阅读全文 »
CSAP Charpter 1 发表于 2018-10-15 | 阅读次数: 字数统计: 125 | 阅读时长 ≈ 1 系统中的所有信息,包括文件、程序、数据等本质上都是由一串位(比特)序列表示的。其中,8个比特称为一个字节,每个字节可以表示某个文本字符,如ASCII码一共有$2^8$个(标准码0-127,扩展码128-255),用一个单字节大小的整数来表示每个字符。只由ASCII字符构成的文件称为文本文件,而其他文 ... 阅读全文 »
4-1 Convolutional Neural Networks: Step by Step 发表于 2018-10-12 | 分类于 深度学习习题 | 阅读次数: 字数统计: 2,428 | 阅读时长 ≈ 14 numpy.pad() 填充数组。123456789101112>>> a = [1, 2, 3, 4, 5]>>> np.pad(a, (2,3), 'constant', constant_values=(4, 6))array([4, 4 ... 阅读全文 »
公共经济学之三 发表于 2018-10-11 | 分类于 公共经济学课程感悟 | 阅读次数: 字数统计: 644 | 阅读时长 ≈ 2 课上老师讲区分一个产品是否为公共产品的关键在于其是否具有非竞争性和非排他性,如道路在拥堵前,一个人对道路的消费不妨碍他人同时享用,也不减少他人的消费数量,具有非竞争性,并且道路是不收费的,具有非排他性,这时候属于公共产品,但是拥堵之后,就有了竞争性,并且由于有的路口就会限制出行,有了竞争性,就变成了 ... 阅读全文 »
公共经济学之二 发表于 2018-10-09 | 分类于 公共经济学课程感悟 | 阅读次数: 字数统计: 612 | 阅读时长 ≈ 2 这节课里有一句话说,产权明晰是效率提升的关键。这让我感受颇深,我认为效率提高地根本原因在于产权明晰之后更能带动人们的积极性,从而为自己谋利益的同时也在为企业谋利益,实现个人与集体的共赢。凡是一个有效率的企业甚至国家政策,都应该做到产权明晰。像我们国家的农业以前实行人民公社,实行一大二公、大锅饭,人们 ... 阅读全文 »
数据挖掘-认识数据 发表于 2018-09-28 | 分类于 数据挖掘 | 阅读次数: 字数统计: 2,773 | 阅读时长 ≈ 11 数据对象与属性类型数据集由数据对象组成。一个数据对象代表一个实体。例如销售数据库中,对象可以是顾客、商品。属性是一个数据字段,表示数据对象的一个特征。 属性类型 标称属性(nominal attribute):一些事物的名称,每个值代表某种类别、编码或者状态。不具有有意义的序,不是定量的,其均值和中 ... 阅读全文 »