山东大学软件学院2025数据仓库与数据挖掘期末考试(残缺版)
今年潘老师第一年尝试机考,考试用机房的电脑线上做题,一开始给的例题的答题框可以插入表格,但是真实考试的时候那个是插不了的(潘老师也以为能插hhh),所以最后画表格全靠疯狂空格,不过机试的好处是打字快可以节约不少时间(但由于题量大最后还是卡点交卷)(2)在决策树那个题,以ppt的例子举例,如果首先按收入分类,然后再分青年中年老年,但是数据里高收入分类只有青年和中年,但是没有老年,这个时候输入高收入和
当时考完之后心灰意冷,回忆了几道题之后太痛苦了实在回忆不下去就没写完,结果今年好像真的没有人写回忆版,就想着把残缺版的回忆版也发出来共学弟学妹参考下。今年潘老师第一年尝试机考,考试用机房的电脑线上做题,一开始给的例题的答题框可以插入表格,但是真实考试的时候那个是插不了的(潘老师也以为能插hhh),所以最后画表格全靠疯狂空格,不过机试的好处是打字快可以节约不少时间(但由于题量大最后还是卡点交卷)
我们这级软工选这门课的同学比较少,还不到多核的一半,每次上课夸张的时候更是只来十几个人,但是潘老师人很好从来不点名。实验分为平台实验和大实验,都不算很难,而且实验老师给分也很大方。虽然复习的时候内容实在有点多,但是感觉给分很值得。
一、简答题
1.数据仓库的特征?简述每个特征
2.数据归一化和标准化的作用,写出常见的标准化的公式
3.数据规约是什么?都有哪些方法?每种方法有哪些技术?
4.
二、综合题
考了一道DBscan,考了一道决策树,考了一道gsp数据挖掘,考了一道离群点挖掘
题型还比较常规,每个大题里面有大概3-4个小问。
印象比较深刻的几个题是
(1)有一个问给出的数据里是否存在密度可达和密度相连的点,这里要对概念足够清晰
(2)在决策树那个题,以ppt的例子举例,如果首先按收入分类,然后再分青年中年老年,但是数据里高收入分类只有青年和中年,但是没有老年,这个时候输入高收入和老年,决策树输出的结果应该是什么?
这门课确实学到了不少东西,复习的时候感觉对照老师的提纲把ppt吃透就足够了,老师出的题基本也没有超出提纲(不过这已经很多了,建议早点开始复习),虽然感觉答得不是很好,但是老师给分还不错。时间过去太长啦,回忆会有偏差也不完整,希望学弟学妹谅解。祝学弟学妹们A+!
更多推荐
所有评论(0)