当时考完之后心灰意冷,回忆了几道题之后太痛苦了实在回忆不下去就没写完,结果今年好像真的没有人写回忆版,就想着把残缺版的回忆版也发出来共学弟学妹参考下。今年潘老师第一年尝试机考,考试用机房的电脑线上做题,一开始给的例题的答题框可以插入表格,但是真实考试的时候那个是插不了的(潘老师也以为能插hhh),所以最后画表格全靠疯狂空格,不过机试的好处是打字快可以节约不少时间(但由于题量大最后还是卡点交卷)

我们这级软工选这门课的同学比较少,还不到多核的一半,每次上课夸张的时候更是只来十几个人,但是潘老师人很好从来不点名。实验分为平台实验和大实验,都不算很难,而且实验老师给分也很大方。虽然复习的时候内容实在有点多,但是感觉给分很值得。

一、简答题

1.数据仓库的特征?简述每个特征

2.数据归一化和标准化的作用,写出常见的标准化的公式

3.数据规约是什么?都有哪些方法?每种方法有哪些技术?

4.

二、综合题

考了一道DBscan,考了一道决策树,考了一道gsp数据挖掘,考了一道离群点挖掘

题型还比较常规,每个大题里面有大概3-4个小问。

印象比较深刻的几个题是
(1)有一个问给出的数据里是否存在密度可达和密度相连的点,这里要对概念足够清晰

(2)在决策树那个题,以ppt的例子举例,如果首先按收入分类,然后再分青年中年老年,但是数据里高收入分类只有青年和中年,但是没有老年,这个时候输入高收入和老年,决策树输出的结果应该是什么?

这门课确实学到了不少东西,复习的时候感觉对照老师的提纲把ppt吃透就足够了,老师出的题基本也没有超出提纲(不过这已经很多了,建议早点开始复习),虽然感觉答得不是很好,但是老师给分还不错。时间过去太长啦,回忆会有偏差也不完整,希望学弟学妹谅解。祝学弟学妹们A+!

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐