数据科学导论复习与考试总结
数据科学概述 机器学习 机器学习是一门人工智能的科学,该领域的主要研 究对象是如何在经验学习中改善具体算法的性能。 机器学习是对能通过经验自动改进计算机算法的研 究。 有监督学习:基于输入数据及目标值建立模型 无监督学习:无监督学习不指定目标值或预先无法知道目标值 深度学习解决的核心问题之一就是自动地将简单的特征组合成更加复杂的特征,并利用这些组合特征解决问题,深度学习是机器学习的一个分支。 数据挖掘算法概述 分类 回归 一元线性回归 多元线性回归 SVM支持向量机 KNN 近邻 决策树 朴素贝叶斯 聚类 K-Means K均值 层次聚类 谱聚类 DBSCAN(基于密度) 集成算法 Bagging Boosting Stacking 模型评价 分类模型:混淆矩阵、正确率、召回率 回归模型:平方绝对差、均方误差、决定系数 聚类模型:内部指标、外部指标、轮廓系数 数据预处理 描述性数据汇总 分布式度量 代数度量 整体度量 度量中心趋势 经验公式计算众数mean−mode=3*(mean − median) 方差和标准差(standa...
使用朴素贝叶斯进行个人信用风险评估
朴素贝叶斯 朴素贝叶斯方法是基于贝叶斯定理的一组有监督学习算法,即“简单”地假设每对特征之间相互独立。 给定一个类别yyy和一个从x1x_1x1到xnx_nxn的相关的特征向量,贝叶斯定理阐述了一下关系: P(y∣x1,…,xn)=P(y)P(x1,…,xn∣y)P(x1,…,xn)P(y \mid x_1, \dots, x_n) = \frac{P(y) P(x_1, \dots, x_n \mid y)}{P(x_1, \dots, x_n)} P(y∣x1,…,xn)=P(x1,…,xn)P(y)P(x1,…,xn∣y) 使用简单(naive)的假设-每对特征之间都相互独立: P(xi∣y,x1,…,xi−1,xi+1,…,xn)=P(xi∣y)P(x_i | y, x_1, \dots, x_{i-1}, x_{i+1}, \dots, x_n) = P(x_i | y) P(xi∣y,x1,…,xi−1,xi+1,…,xn)=P(xi∣y) 对于所有的iii都成立,这个关系式可以简化为: P(y∣x1,…,xn)=P(y)∏i=1nP...
2021-Spring
Chemtrails Over The Country Club的鼓点让我想到小学时升国旗时护旗队敲的鼓 游离在“觉得自己又行了”与“觉得自己好菜”的想法之间是常态 seven的间奏也太好听了啊,那是啥乐器?我直接升天 温柔和力量真是两个好词,这两个词同时出现在一个人身上时,他就会在我心中被神化。看似互相矛盾,但是相得益彰。 想忙起来,有许多要做的事 计算机等级考试三级 软件质量与测试 测试用例与需求文档 数据科学导论 信号与系统作业 3.27 summer summer’s almost gone 明明夏天马上就要来了,脑海里却在重复着Lana的这首。white dress,新专里为数不多的我非常喜欢的歌。 想知道性瘾是会慢慢练成的吗。我现在对感情没有丝毫的意愿愿望,明明有(或者也是还没有)值得(或者不值得)的现成的人在,但是就是没有丝毫的欲望。但是会有想要水乳交融的欲望。 今天华科复试,lfy考来国家光电实验室,非常成功了可以说。到了我也是考研的时候了,唉啥都是个考,原以为从此就摆脱了考考考的做题机器时期,没想到又要来一遍高三,不过也或许这种机械的刷题求取功利才是...





