23春學期(高起本:1709-2103、專升本/高起專:1903-2103)《大數(shù)據(jù)導論》在線作業(yè)-00002
試卷總分:100 得分:100
一、單選題 (共 15 道試題,共 30 分)
1.DAS代表的意思是()
A.兩個異步存儲
B.數(shù)據(jù)歸檔軟件
C.連接一個可選的存儲
D.直連存儲
2.下列不屬于Google云計算平臺技術架構的是()
A.并行數(shù)據(jù)處理MapReduce
B.分布式鎖Chubby
C.結構化數(shù)據(jù)表BigTable
D.彈性云計算EC2
3.大數(shù)據(jù)的特點不包含
A.數(shù)據(jù)體量大
B.價值密度高
C.處理速度快
D.數(shù)據(jù)不統(tǒng)一
4.購物籃問題是##的典型案例
A.數(shù)據(jù)變換
B.關聯(lián)規(guī)則挖掘
C.數(shù)據(jù)分類
5.GFS中的文件切分成()的塊進行存儲
A.32MB
B.64MB
C.128MB
D.1G
6.數(shù)據(jù)產生方式變革中數(shù)據(jù)產生方式是主動的主要是來自哪個階段( )。
A.運營式系統(tǒng)階段
B.用戶原創(chuàng)內容階段
C.感知式系統(tǒng)階段
7.下列不屬于商業(yè)大數(shù)據(jù)類型的是
A.傳統(tǒng)企業(yè)數(shù)據(jù)
B.機器和傳感器數(shù)據(jù)
C.社交數(shù)據(jù)
D.電子商務數(shù)據(jù)
8.數(shù)據(jù)倉庫是隨著時間變化的,下列不正確的是()
A.數(shù)據(jù)倉庫隨時間變化不斷增加新內容
B.捕捉到的新數(shù)據(jù)會覆蓋原來的快照
C.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內容
D.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨時間的變化不斷進行重新綜合
9.用于描述數(shù)據(jù)分散情況的是()
A.分布圖
B.箱式圖
C.餅圖
D.折線圖
10.哪個選項不屬于大數(shù)據(jù)4V特點?
A.Volume
B.Valid
C.Variety
D.Value
11.MapReduce中的Map和Reduce函數(shù)使用()進行輸入輸出
A.key/value對
B.隨機數(shù)值
C.其他計算結果
12.數(shù)據(jù)產生方式變革中數(shù)據(jù)產生方式是被動的主要是來自哪個階段( )。
A.運營式系統(tǒng)階段
B.用戶原創(chuàng)內容階段
C.感知式系統(tǒng)階段
13.下列哪個工具常用來開發(fā)移動友好地交互地圖()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
14.下列哪個R語言擴展包可以創(chuàng)建帶有點和邊的網(wǎng)絡圖()
A.ggplot2
B.network
C.ggmaps
D.animation
15.SAN是一種()
A.存儲設備
B.專為數(shù)據(jù)存儲而設計構建的網(wǎng)絡
C.光纖交換機
D.HBA
二、多選題 (共 15 道試題,共 30 分)
16.開放云()
A.價值呈現(xiàn):大數(shù)據(jù)應用價值呈現(xiàn)和創(chuàng)新不足
B.應用建設:周期長、門檻高、多冗余、體驗差
C.組織流程:應用跨部門,缺乏流程貫串和使能業(yè)務生產
D.生態(tài)建設:無法有效構建和融入新的數(shù)字生態(tài)圈
17.互連網(wǎng)上出現(xiàn)的海量信息可以劃分為三種,分別為( )
A.結構化信息
B.非結構化信息
C.半結構化信息
D.特殊化信息
18.下列正確的是()
A.D3是數(shù)據(jù)驅動文件的縮寫,是最流行的可視化庫之一,它被很多其他的表格插件所使用
B.D3也可以通過一些自定義模塊來根據(jù)需求增添需要的(非DOM)特性,并在WebWorker上運行
C.D3采用的是Selectors API的第一級標準
D.基礎R已經包含支撐包括協(xié)同圖(Coplot)、拼接圖(Mosaic Plot)和雙標圖等多類圖形的功能。
19.大數(shù)據(jù)在教育中的應用
A.網(wǎng)上公開課
B.慕課
C.智慧校園
D.翻轉課堂
20.大數(shù)據(jù)時代預測人類移動行為的數(shù)據(jù)來源有
A.志愿者定位數(shù)據(jù)
B.裝有導航設備的出租車軌跡數(shù)據(jù)
C.手機終端定位于通訊記錄
D.社會網(wǎng)絡簽到數(shù)據(jù)
21.下列屬于傳統(tǒng)統(tǒng)計學展示方法的是()
A.柱狀圖
B.餅狀圖
C.曲線圖
D.網(wǎng)絡圖
22.##和##,它們把原數(shù)據(jù)變換或投影到較小的空間。
A.小波變換
B.中心化變換
C.主成分分析
D.對數(shù)變換
23.大數(shù)據(jù)四大特征包括( )
A.數(shù)據(jù)量大
B.數(shù)據(jù)類型繁多
C.數(shù)據(jù)價值密度相對較低
D.處理速度快,時效性要求高
24.按照數(shù)據(jù)量的大小,可將數(shù)據(jù)分析分為()
A.內存級數(shù)據(jù)分析
B.Bl級數(shù)據(jù)分析
C.海量級數(shù)據(jù)分析
D.巨量級數(shù)據(jù)分析
25.主流分布式計算平臺有()
A.google
B.IBM
C.baidu
D.Amazon
26.KNIME(Konstanz Information Miner)是一個對用戶友好的、智能、開源的平臺。該平臺包括了##、##、##、##。
A.數(shù)據(jù)集成
B.數(shù)據(jù)處理
C.數(shù)據(jù)分析
D.數(shù)據(jù)挖掘
27.離群點檢測的應用包括()等。
A.欺詐檢測
B.入侵檢測
C.故障檢測
D.疾病的不尋常模式
28.數(shù)據(jù)變換的常用方法有##,##,##,##
A.中心化變換
B.極差規(guī)格化變換
C.標準化變換
D.對數(shù)變換
29.大數(shù)據(jù)時代預測人類移動行為的數(shù)據(jù)特點是
A.多樣化
B.數(shù)據(jù)量大
C.維數(shù)高
D.變化快
30.大數(shù)據(jù)帶來的挑戰(zhàn)有哪些( )。
A.會導致數(shù)據(jù)盲點
B.危及個人隱私
C.造成群體歧視
D.產生龐大能耗
三、判斷題 (共 20 道試題,共 40 分)
31.箱式圖用于描述數(shù)據(jù)的分散情況,主要數(shù)據(jù)節(jié)點包括:均值、中值、等中心值的度 量,標準偏差、方差等可變性度量。
32.交通數(shù)據(jù)涉及到交通車輛或者道路兩旁安裝的傳感器生成和手機的數(shù)據(jù)集。
33.關聯(lián)分析是從有噪聲的、模糊的、隨機的海量數(shù)據(jù)中,挖掘出隱藏的、事先不知道、但是有潛在關聯(lián)的信息或知識的過程。
34.NAS代表的意思是網(wǎng)絡附加存儲
35.數(shù)據(jù)倉庫是一個面向主題的(subject oriented)、集成的(integrate),相對穩(wěn)定的(non-volatile)、反映歷史變化(time variant)的數(shù)據(jù)集合,以用于支持管理決策過程。
36.Spark的亮點是充分利用內存承載工作集,而且能保證容錯。
37.寧家駿委員指出,大數(shù)據(jù)要與“互聯(lián)網(wǎng)+”醫(yī)療健康緊密結合起來,國家明確支持“互聯(lián)網(wǎng)+”醫(yī)療、“互聯(lián)網(wǎng)+”健康。
38.利用虛擬化方法減少物理存儲空間的分配,最大限度提升存儲空間利用率。
39.內存分析數(shù)據(jù)量比BI分析數(shù)據(jù)量大
40.數(shù)據(jù)可視化。將大型數(shù)據(jù)集中的數(shù)據(jù)通過圖形圖像方式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息。
41.交通數(shù)據(jù)的來源包括車輛GPS數(shù)據(jù),人類移動的GPS位置信息或者單位站點記錄,和監(jiān)視設備的視頻圖像技術記錄。
42.線性回歸涉及找出擬合兩個屬性(或變量)的“最佳”直線,使一個屬性可以用來預測另一個。
43.聚類分析(Cluster analysis)簡稱聚類(Clustering),是把數(shù)據(jù)對象劃分成子集(類)的過程,每個子集稱為一個簇(Cluster)
44.用戶可以感知不同屬性之間的相關性,過濾掉噪聲和不相關的軌跡,用于進一步調查有趣的案例。分析人員可以交互式地逐步優(yōu)化設置以改進結果。
45.大數(shù)據(jù)技術也能幫助政府進行支出管理,透明合理的財政支出將有利于提高公信力和監(jiān)督財政支出。
46.累加器只有驅動程序才能讀取
47.數(shù)據(jù)挖掘方法側重于從數(shù)據(jù)驅動的角度出發(fā)獲取模式或規(guī)律。因此,針對海量人類移動數(shù)據(jù),數(shù)據(jù)挖掘方法可以發(fā)揮其挖掘模式或規(guī)律的長處。
48.基于QQ用戶位置變化軌跡,建立模型測算遷徙規(guī)模,分析人口遷徙方向及其影響因素。
49.利用云存儲中的多租戶技術,滿足了海量信息爆炸式增長趨勢,一定程度上節(jié)約企業(yè)存儲成本,提高效率。
50.不同類型的大數(shù)據(jù)可以揭示一個區(qū)域或城市的活動以及人口分布狀態(tài)( )
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學習
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

