東財《大數據——概念、方法與應用》單元作業(yè)2
試卷總分:100 得分:100
一、單選題 (共 10 道試題,共 50 分)
1.( )是一些管理方面的最佳實踐。
A.數據挖掘
B.可視化分析
C.數據質量和管理
D.預測性分析
2.K-Means算法不適合處理( )屬性。
A.連續(xù)型
B.離散型
C.穩(wěn)定型
D.隨機型
3.在企業(yè)危機管理及其預警中,管理者更感興趣的是( )。
A.關聯規(guī)則
B.意外規(guī)則
C.依賴規(guī)則
D.相關規(guī)則
4.( )是數據分析工具最基本的要求。
A.數據挖掘
B.可視化分析
C.數據質量和管理
D.預測性分析
5.兩個或多個變量的( )之間存在某種規(guī)律性,就稱為關聯。
A.范圍
B.特點
C.取值
D.字段
6.回歸分析發(fā)現變量或屬性間的( )關系。
A.泛化
B.實現
C.局部
D.依賴
7.數據挖掘的分類方法是找出數據庫中一組數據對象的( )并按照分類模式將其劃分為不同的類。
A.共同點
B.不同點
C.屬性
D.值
8.偏差檢測的基本方法是尋找( )之間有意義的差別。
A.期望值與參照值
B.觀測值與參照值
C.預測值與參照值
D.期望值與預測值
9.( )需要被設計成能夠從“文檔”中智能提取信息。
A.可視化分析
B.數據挖掘
C.預測性分析
D.語音引擎
10.半結構化的數據分析需求可以使用( )。
A.GreenPlum
B.Exadata
C.Infobright
D.Hadoop
二、多選題 (共 5 道試題,共 25 分)
11.從商業(yè)層面上看,數據挖掘的主要特點有( )。
A.對商業(yè)數據庫中的大量業(yè)務數據進行抽取、轉換
B.對商業(yè)數據庫中的大量業(yè)務數據進行分析
C.對商業(yè)數據庫中的大量業(yè)務數據進行其他模型化處理
D.從商業(yè)數據庫中提取輔助商業(yè)決策的關鍵性數據
12.聚類技術主要包括( )。
A.傳統(tǒng)的模式識別方法
B.數據分類法
C.特征分類法
D.屬性分類法
13.統(tǒng)計與分析的主要特點和挑戰(zhàn)有( )。
A.分析設計的數據量大
B.對系統(tǒng)資源有極大的占用
C.對I/O有極大的占用
D.分析的效率低
14.回歸分析主要研究問題包括( )。
A.數據序列的趨勢特征
B.數據序列的預測
C.數據序列的統(tǒng)計
D.數據間的相關關系
15.概念描述分析( )。
A.特征性描述
B.區(qū)別性描述
C.共同性描述
D.關聯性描述
三、判斷題 (共 5 道試題,共 25 分)
16.統(tǒng)計分析主要利用分布式數據庫對存儲于其內的海量數據進行分析和分類匯總。( )
17.電商會使用傳統(tǒng)的關系型數據庫存儲每一筆事務數據。( )
18.對于大數據分析需求,一些實時性需求會用到EMC的GreenPlum。( )
19.分類的目的是通過分類模型,將數據庫中的數據項映射到某個給定的類別。( )
20.數據挖掘發(fā)現的是用戶感興趣的知識。( )
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學習
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

